Algorithmik Formate, Codes & Algorithmen. (Datei-) Formate

Click here to load reader

  • date post

    06-Apr-2015
  • Category

    Documents

  • view

    117
  • download

    0

Embed Size (px)

Transcript of Algorithmik Formate, Codes & Algorithmen. (Datei-) Formate

  • Folie 1
  • Algorithmik Formate, Codes & Algorithmen
  • Folie 2
  • (Datei-) Formate
  • Folie 3
  • Digitale Information = Bitsequenzen Ein Bit ist eine atomare Information Einen Informationsgehalt bekommt ein Bit, wenn es etwas reprsentiert z. B. schwanger / nicht schwanger Mehrere Bits knnen komplexere Informationen reprsentieren z.B. Zahlen, Farben,... (oft Datentypen) Dazu muss man wissen, wofr eine bestimmte Bitsequenz (=Zeichen) steht... und das wird komplizierter, wenn es nicht nur um eine Farbe, einen Buchstaben geht, sondern bspw. um ein ganzes Dokument Information existiert nicht in reiner Form eine Formulierung von Information kann fr vieles stehen (reprsentieren) 1 oder 0 Sein oder nicht Sein true oder false
  • Folie 4
  • Definition (Daten-/Datei-) Format: Ein Format ist eine spezifische Anordnung von Daten (Bits) fr Speicherung, Weiterverarbeitung, Ausgabe, etc. Ein Format definiert so etwas wie eine Erwartungshaltung, in welcher Form (digitale) Information vorliegt. Das betrifft 1. die Anordnung (wie teilt man die Sequenz in Zeichen auf?) 2. die Codierung (fr was steht ein Zeichen/Bitsequenz?) Diese grsstenteils impliziten (also nicht in der Sequenz enthaltenen) Informationen mssen allen Beteiligten bekannt sein nur so kann man herausfinden, wofr die expliziten Informationen (Bitsequenz) stehen
  • Folie 5
  • Universalitt vs. Speicherplatzbedarf Ein Format macht nur Sinn, wenn es (fr einen gewissen Bereich) universell ist, also bspw. alle Fotos speichern kann, nicht nur die grnen Andererseits bentigt diese Universalitt Speicherplatz und ist nicht immer einfach festzulegen: macht es beispielsweise Sinn, in.DOC Unicode zu benutzen, nur damit die Chinesen dasselbe Format haben?... oder sollte man Meta-Informationen einbauen, so dass z.B. die Codierung ausgetauscht oder explizit mitgeschickt werden kann?
  • Folie 6
  • Digitale Reprsentation von Schach Was ist wichtig? nur die Information, die einen Spielstande eindeutig definiert Was ist mglich? alle Spielstnde mssen reprsentiert werden knnen Welche Informationen codiert man (explizit) als Zeichen, welche (implizit) in der Anordnung? es geht nicht um maximale Effizienz, man muss aber trotzdem keinen Speicherplatz verschwenden Vorschlge? Wie viele Bits brauchen Sie? oder: ein universeller digitale Koffer fr Schach
  • Folie 7
  • Ein Schach Format (.sch), 257 BIT Das erste Bit gibt an, wer am Zug ist (1=schwarz, 0=weiss) Die folgenden 256 Bit reprsentieren die Belegung der 64 Felder, mit jeweils 4 Bit pro Feld (nummeriert zeilenweise von links nach rechts, dann spaltenweise von oben nach unten). Das erste Bit pro Feld steht fr die Farbe der Figur: Die letzten 3 Bit pro Feld stehen fr die Figur, die hier steht: 1 = schwarz 000 = leer 001 = Bauer 010 = Turm 011 = Springer 0 = weiss 100 = Pferd 101 = Dame 110 = Knig 111 = steht fr nichts
  • Folie 8
  • Ein Format fr Schieber-Jass Das Spiel: 4 Spieler haben zu Beginn je 9 Karten, spielen sie reihum aus, und nach jeder Runde wandern 4 Karten auf den einen oder anderen Stapel von gespielten Karten. Aufgabe: erfinden Sie ein Format, mit dem jeder mgliche Zustand des Spiels binr reprsentiert werden kann. Formulieren Sie die von Ihnen erfundene Codierung so, dass ein anderer Schler eine entsprechende Bitsequenz in den Spielzustand zurckbersetzen knnte Geben Sie an, wie viele Bits fr die Speicherung eines Spielzustands bentigt werden
  • Folie 9
  • Und woher weiss der Computer, welches Format eine Datei hat? Die meisten Datei-Formate haben einen header, in dem 1. sie sich vorstellen und 2. zustzliche Angaben zur Formatierung machen, z.B. Version/Variation des Formats Parameter allgemeine Zusatzinformationen 1. Endung 2. Header Diese Informationen sagen dem Computer, welche Brille er anziehen muss
  • Folie 10
  • Beispiel.rtf { \rtf1\ansi\ansicpg1252\cocoartf1038\cocoasubrtf250 {\fonttbl\f0\fnil\fcharset0 GoudyOldStyleT-Regular;} {\colortbl;\red255\green255\blue255;\red6\green10\blue58;} \paperw11900\paperh16840\margl1440\margr1440\vieww9000\viewh8 400\viewkind0 \pard\tx566\tx1133\tx1700\tx2267\tx2834\tx3401\tx3968\tx4535\tx5102\t x5669\tx6236\tx6803\ql\qnatural\pardirnatural \f0\fs36 \cf2 Lirum \b larum \b0 L\ f6ffelstiel } ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/ ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/
  • Folie 11
  • RTF (Rich Text Format) Entwickelt von Microsoft, aber frei verfgbar Basierend auf Standard-Codetabellen (ASCII, UNICODE) Lesbar von allen gngigen Texteditoren, wobei u.U. Teile der Layout-Information ignoriert werden
  • Folie 12
  • RTF Spezifikationen Syntax: { } Der header beinhalten Kontrollwrter, die mit Backslash anfangen und mit Leerzeichen getrennt werden Im header wird zustzliche Layoutinformation reprsentiert, z.B. Schriftfarbe oder Schrifttyp RTF kann mit verschiedenen Versionen von ASCII oder UNICODE Zeichen umgehen (Meta-Information im header) Bei RTF wird implizit angenommen, dass die entsprechenden Codetabellen verfgbar sind, und dass die Blcke innerhalb der Bitsequenz in der richtigen Reihenfolge vorliegen
  • Folie 13
  • Zusammenfassung RTF kann mehr als TXT und weniger als DOC, das ist seine digitale Nische RTF ermglicht die Reprsentation von allgemeinen Layoutinformation durch standardisierte Kontrollwrter im header Das Layout fr Textteile geschieht durch Auszeichnung des Dokuments mit Kontrollwrtern im Text (wie HTML)
  • Folie 14
  • Bildinformation in einem etwas speziellen Format Die Brille implementiert die Decodierung Das Format gibt an, welche Brille man braucht Eine Analogie zur Zusammenfassung
  • Folie 15
  • Konzepte Beispiele Format Header Endung Zeichen explizite & implizite Bestandteile Universalitt Eigene Formate fr Spiele.rtf
  • Folie 16 ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/ ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/">
  • Datei: Raetsel ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/ ffnen mit Hex-Editor, z.B. http://www.onlinehexeditor.com/
  • Folie 17
  • Grafikformate und verlustbehaftete Komprimierung
  • Folie 18
  • Wie viel Information ist ntig? Anfangs- und Endpunkt definieren die Linie eindeutig Mittelpunkt und Radius definieren den Kreis eindeutig Die Eckpunkte definieren das Polygon eindeutig
  • Folie 19
  • Vektorgrafik Mit allgemeinen Kurven (z.B. Bezier Kurven) und noch mehr Parametern kann man jede beliebige Form berechen kann zu extrem geringen Dateigrssen fhren Vektorgrafiken sind beliebig skalierbar 26 Kb
  • Folie 20
  • Folie 21
  • Reine Vektorgrafikformate Sind nicht weit verbreitet, meist proprietr, in Verbindung mit einem Editor z.B. Adobe Illustrator (.ai) Ausnahme: SVG (scalable vector graphics) Benutzt werden Vektorgrafiken aber oft in Kombination, z.B. einzelne Ebenen in Photoshop Vektor-Fonts Zeichnungen in Word oder Powerpoint in Druckformaten (PDF, EPS) Interessant:.pptx hacken
  • Folie 22
  • Folie 23
  • Folie 24
  • Folie 25
  • Folie 26
  • Konzepte Beispiele Vektor- vs. Raster Farbtiefe indizierte Farben Farbraum RGB(A), CMYK, LAB Pixel zusammenfassen Farbverlauf Lauflnge.svg.bmp.jpg.gif.png,.tiff, RAW,.psd, eps
  • Folie 27
  • Reine Rastergrafikformate Produzieren sehr grosse Dateien (aber verlustfrei) Beispiele.bmp nur Windows, veraltet.pict nur MAC, veraltet.tiff (wenn ohne Komprimierung) Bestes Format fr sehr hohe Qualitt, blich beim Drucken RAW reine Sensordaten, fr jede Kamera anders
  • Folie 28
  • RAW ist abhngig von Kamerasensor bzw. Hersteller DNG ist Adobes Versuch fr ein herstellerbergreifendes Standard- RAW-Format RAW-Dateien haben eine hhere Farbtiefe (10 16 Bit) RAW-Dateien richten sich nach dem geomet- rischen Layout des Sensors, meist Bayer-Matrix Arbeitsschritte wie Demosaicing, Rauschunterdrckung, Weissabgleich, oder Tonwertkorrekturen knnen mit RAW- Daten in der Nachbearbeitung festgelegt werdenDemosaicing Verschieden Algorithmen fhren zu leicht unterschiedlichen Ergebnissen Bei starken Manipulationen verhilft die Farbtiefe zu besseren Ergebnissen
  • Folie 29
  • Die blichsten Grafikformate (.jpg &.gif) Komprimieren die Information reiner Rastergrafiken Nehmen ggf. Informationsverlust in Kauf (meist variabel) Anstze zum (verlustbehafteten) Komprimieren: 1. mehrere Pixel zusammenfassen 2. Speicherplatz sparen bei der Reprsentation von Farben Dabei geht es immer darum, mglichst die Informationen zu verlieren, die (optisch) keinen grossen Unterschied machen
  • Folie 30
  • JPG & GIF Pixel zusammenfassen Farben reprsentieren Besonderheiten Anwendungsgebiet
  • Folie 31
  • JPG in Bildern
  • Folie 32
  • GIF in Bildern
  • Folie 33
  • Probleme & Spezialitten
  • Folie 34
  • Formatentscheidungen Sie wollen mit ihrer Digitalkamera ein Photo aufnehmen, um dann Sie dann im Internet einen Abzug in Postergrsse zu bestellen. Wie gehen Sie optimalerweise vor? Ein Freund von ihnen hat gehrt, dass Vektorgraphiken wenig Speicherplatz brauchen und trotzdem skalierbar sind. Er hat ein Logo fr seine Webseite gezeichnet (von Hand) und fragt Sie, wie er es in ein Vektorformat umwandelt. Was raten Sie ihm? Sie wollen ihren