Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in...

37
07.10.2015 Jan Vonde, intranda GmbH 1 Mehr als nur scharfe Aufnahmen: Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen Goobi Tag, 13.09.2016

Transcript of Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in...

Page 1: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

1

Mehr als nur scharfe Aufnahmen:Bildformate verstehen und für die richtige Verwendung inDigitalisierungsprojekten auswählenGoobi Tag, 13.09.2016

Page 2: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

2

Einleitung

Page 3: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

3

Fagestellungen

● Welche Bildformate werden im Digitalisierungsworkflow erzeugt, und zu welchem Zweck?

● Gibt es sinnvolle Alternativen?● Was ist Jpeg2000 und welche Rolle kann es in der

Digitalisierung spielen?● Wie biete ich effektiv Bildinhalte in einer

Präsentationsoberfläche an?

Page 4: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

4

Übersicht● Übersicht über die wichtigsten Bildformate

– TIFF– PNG– JPEG– JPEG2000

● Das Bild im Digitalisierungsworkflow– Archvierung– Texterkennung– Präsentation

● Bildformate im Vergleich– Datenkompression– Zugriffsgeschwindigkeit

Page 5: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

5

Übersicht über die wichtigsten Bildformate

Page 6: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

6

TIFF (Tagged Image File Format) - Baseline● Verbreitetes, bewährtes Format● Spezifikation unter Adobe-Copyright, aber viele quelloffene Implementierungen

● Schneller Zugriff● Der TIFF-Standard ist komplex (erlaubt z.B. verschiedene Kompressionsmethoden)

● Keine oder nur minimale Kompression in der Baseline-Spezifikation

● Nicht für die Anzeige in Web-Browsern geeignet● Unterstützt viele Farbräume und Farbprofile

Page 7: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

7

TIFF (Tagged Image File Format) – LZW-Kompression● LZW ist die in GIF verwendete Kompression (ehemals patentgeschützt)

● Verlustfreite Kompression● Geringe Kompressionsrate● Langsamer Zugriff

Page 8: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

8

TIFF (Tagged Image File Format) JPEG-Kompression

● Bilddaten sind mit der Jpeg-Kompression (DCT) komprimiert

● Gute, aber verlustbehaftete Kompression● Kein Jpeg!

– Teilt nicht die Einschränkungen des Jpeg-Formates, z.B Alpha-Kanal erlaubt

– Etwas größer als ein vergleichbares Jpeg– Andere Ladezeiten als ein Jpeg– Tiff Metadaten-Format

Page 9: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

9

PNG (Portable Networks Graphics)

● Offenes, einfaches Format● Verlustfreie Kompression● Geringe Kompressionsrate bei typischen Scans

– Gute Kompression bei bitonalen Bildern● Kann direkt im Browser angezeigt werden● Sehr langsamer Zugriff● Eigenes Metadatenformat (nicht Exif oder IPTC)● Unterstützt nicht alle Farbräume (kein CMYK)

Page 10: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

10

JPEG/JFIF (JPEG File Interchange Format)

● Sehr verbreitetes, inzwischen patentfreies Format● Der JPEG-Standard definiert verschiedene

Kompressionsmethoden, auch verlustfreie. Unterstützt wird jedoch in der Regel die verlustbehaftete DCT-Kompression

● Gute Kompressionsrate für typische Fotos oder Scans

● Kann direkt im Browser angezeigt werden● Schneller Zugriff● Unterstützt keinen Alpha-Kanal (Transparenz)● Begrenzte Farbtiefe

Page 11: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

11

JPEG2000 – Part 1 (JP2)

● JPEG2000 ist ein Coding-Standard, der verschiedene Bild- und Viedoformate unterstützt.– JP2: Basis-Bildformat: Sollte keine

gebührenpflichtigen Patente beinhalten– JPX: Erweitertes Bildformat– MJ2: Videoformat– JP3D: 3D-Bildformat– JPM: Format für Bildgruppen

Page 12: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

12

JPEG2000 – Part 1(JP2)

Vorteile● Hohe Kompressionsrate bei geringen

optischen Verlusten● Möglichkeit für verlustfreie

Kompression● Mehrere Qualitäts- und

Auflösungsebenen für schnellen Zugriff

● Bessere Fehlerbeständigkeit als JPEG oder TIFF

● Große Farbtiefe● Keine Größenbeschränkung● Erweiterte Kodierungsoptionen, z.B.

– Höherauflösende Regionen– Verschiedene Kompressionsmodi

für optimierten Zugriff oder bessere Bildqualität

Nachteile● Künftige Patentansprüche

können nicht ausgeschlossen werden

● Aufwändige Komprimierung und Dekomprimierung

● Geringe Softwareunterstützung

● Feine Unterschiede in der Implementierung des Standards

● Limitierte Unterstützung für Farbprofile

Page 13: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

13

Das Bild im Digitalisierungsworkflow

Page 14: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

14

Das Bild im Digitalisierungsworkflow

Physisches Objekt

Rohbild aus Scanner

Archivierung OCR Präsentation

Nachbearbeitung

Kompression

Kompression?

Page 15: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

15

Archivierung: Was brauchen wir?

● Geringer Speicherbedarf– Kompression

● Originalgetreue Wiedergabe des Objektes– Unkomprimiertes Scannerbild– Oder komprimiertes Bild ohne optische Verluste

● Langlebigkeit– Verbreitetes und offenes Datenformat– Fehlerbeständigkeit (Resistenz gegen

Pixelfehler)

Page 16: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

16

Archivierung: Lossless oder ‚visually lossless‘?Datenverlust im Digitalisierungsvorgang

Physisches Objekt

Internes Scannerbild

Ausgeliefertes Bild

Kompression?

Speicherung

Da

ten

verlu

st Spezielles, proprietäres Format des Scannerherstellers

Raw-TIFF

JP2?

Page 17: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

17

Archivierung: Lossless oder ‚visually lossless‘?Optischer Qualitätsverlust bei Kompression

Original: TIFF – unkomprimiert

JPEG: Qualität 80% (1:8.6) Qualität 30% (1:14.7)

JP2: 1:8 1:15

Page 18: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

18

Archivierung: Lossless oder ‚visually lossless‘?Auf welche Information kann ich verzichten?● JPEG und JPEG2000 werden im Frequenzraum komprimiert● Es werden also keine Bildpunkte ausgelassen sondern

Frequenzbereiche● Aber: Höhere Kompression können Artefakte erzeugen

Quelle: [7]

Page 19: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

19

OCR: Was brauchen wir?

● Geringes Datenvolumen– Daten werden mehrfach über Internetverbindungen

verschickt und auf externen Servern zwischengespeichert

– Komprimierte Bilder● Korrekte Angabe der Bildauflösung (dpi)

– Zu geringe Auflösung führt zu mehrfach berechneten OCR-Seiten

– Zu große Auflösung kann zu schlechter Schrifterkennung führen

Page 20: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

20

Presentation: Was brauchen wir?

● Hinreichend gute Qualität für die Browserdarstellung– Bilder dürfen komprimiert sein. Die benötigte Qualität richtet

sich nach der Darstellung im Browser– Browser unterstützen nur bestimmte Bildformate: Bitmap, Png,

Jpeg, Gif● Schnelle Auslieferung der Daten

– Schnell lesbares Dateiformat – keine Aufwändige Dekomprimierung

– Geringes Datenvolumen– Caching

● Geringer Speicherverbrauch– Komprimierung– Geringere Auflösung

Page 21: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

21

Präsentation: Wie kommt das Bild zum Betrachter?

Auslieferung eines Bildes an einen Internet-Browser

●als Bildpyramide●als Originalbild●als gekacheltes Bild

Page 22: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

22

Ausliefern einer Bildpyramide

Dateisystem

Verkleinern

Browser

WWW

Format-Konvertierung

Content-Server

TIFF

JPEG

Page 23: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

23

Ausliefern des originalen Datenstroms

Dateisystem

Browser

WWW

Content-Server

PNG

PNG

Page 24: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

24

Ausliefern eines gekachelten Bildes

Dateisystem

Verkleinern

Browser

WWW

Format-Konvertierung

Content-Server

TIFF

Ausschneiden

JPEG

Page 25: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

25

Bildformate im Vergleich

Page 26: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

26

Größenverhältnisse der Formate

TIFF-Raw TIFF-LZW PNG JP2 (lossless) TIFF-JPEG (92%) JPEG (92%) JP2 (1:20)0

10

20

30

40

50

60

RGB

Grayscale

Bitonal

Page 27: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

27

Auslieferungszeit von Bildern:Vollständige Farbbilder – niedrige Auflösung

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

1

2

3

4

5

6

7

8

9

10

Karte/w=500px

Karte/w=500px/Subsampling

Lad

ezei

t [s]

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Buch/w=500px

Buch/w=500px/Subsampling

Lad

ezei

t [s]

Page 28: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

28

Auslieferungszeit von Bildern:Vollständige Farbbilder – hohe Auflösung

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Buch/w=3000px

Buch/w=3000px/SubsamplingLad

ezei

t [s]

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

2

4

6

8

10

12

14

16

18

20

Karte/w=3000px

Karte/w=3000px/Subsampling

Lad

ezei

t [s]

Page 29: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

29

Auslieferungszeit von Bildern:Vollständige schwarz/weiß Bilder

TIFF-raw TIFF-LZW PNG JPEG0

0.05

0.1

0.15

0.2

0.25

0.3

Buch/w=3000px

Buch/w=3000px/Subsampling

Lad

ezei

t [s]

TIFF-raw TIFF-LZW PNG JPEG0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Buch/w=500px

Buch/w=500px/Subsampling

Lad

ezei

t [s]

Page 30: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

30

Auslieferungszeit von Bildern:Farbbilder – Kacheln

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

512x512px/1:1

4096x4096px/1:8

Lad

ezei

t [s]

Page 31: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

31

SubsamplingZum schnelleren Lesen einer Datei werden in regelmäßigen Abständen Pixel übersprungen→ erhebliche Zeitersparnis beim Einlesen und Skalieren→ Erzeugt deutliche Artefakte

Quelle: Die digitale Landesbibliothek Oberösterreich, http://digi.landesbibliothek.at/viewer/

Page 32: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

32

Fazit

Page 33: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

33

Archivierung: Perspektiven für Jpeg2000 und mögliche Alternativen

● TIFF bleibt das verlässlichste Archivierungsformat, wenn Speicherbeschränkung keine wesentliche Rolle spielt

● Jpeg2000 bietet effektive Möglichkeiten– Zur Datenkompression– Zum Datenzugriff

● Jpeg2000 hat wesentliche Einschränkungen– Mangel an verlässlichen offenen Implementierungen– Komplexität des Standards und der Implementierung

● Ist verlustbehaftete Kompression eine Alternative bei teurem Speicherplatz in der Langzeitarchivierung?

● PNG bietet ein offenes und verbreitetes Format mit verlustfreier Kompression. Ist dies eine Alternative zum unkomprimierten TIFF?

Page 34: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

34

Präsentation: Die Inhalte bestimmen das geeignete Format

● TIFF/JPEG bietet insgesamt den besten Zugriff auf Inhalte● JPEG oder PNG können als schnelle Darstellungsformate für

bestimmte Inhalte dienen– Bitonale Bilder: PNG– Thumbnails: JPEG

● Techniken wie Kachelung und Subsampling können die Zugriff auf Inhalte beschleunigen

● Jpeg2000 bietet großes Potential für– Datenkompression– Zugriffsgeschwindigkeit– Bildqualität

● Aktuelle offene Implementierungen können dieses Potential noch nicht effektiv nutzen

Page 35: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

35

Fragen/Bemerkungen?

Page 36: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

36

Danke :)

Page 37: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

37

Quellen1) Adobe: Developer/TIFF

http://partners.adobe.com/public/developer/tiff/index.html2) Aware Systems: TIFF, Tag Image File Format, FAQ

http://www.awaresystems.be/imaging/tiff/faq.html3) Aleks Jakulin: Baseline JPEG and JPEG2000 Artifacts Illustrated

http://www.stat.columbia.edu/~jakulin/jpeg/artifacts.htm4) Johan van der Knijff: Ensuring the suitability of JPEG 2000 for preservation, 2010

http://blog.wellcomelibrary.org/2010/12/guest-post-ensuring-the-suitability-of-jpeg-2000-for-preservation/5) Johan van der Knijff: ICC profiles and resolution in JP2: update on 2011 D-Lib paper, 2013

http://openpreservation.org/blog/2013/07/01/icc-profiles-and-resolution-jp2-update-2011-d-lib-paper/6) Joint Photographic Experts Group: Overview of JPEG 2000

https://jpeg.org/jpeg2000/index.html7) Paolo Buonora/Franco Liberati: A Format for Digital Preservation of Images - A Study on JPEG 2000

File Robustnesshttp://www.dlib.org/dlib/july08/buonora/07buonora.html

8) Joint Photographic Experts Group: Overview of JPEGhttp://jpeg.org/jpeg/

9) Eric Hamilton: JPEG File Interchange Format, 1992http://www.w3.org/Graphics/JPEG/jfif3.pdf

10)Wikipedia: Portable Network Graphicshttp://en.wikipedia.org/wiki/Portable_Network_Graphics