PDF/A-2, Was ist neu, was ist wichtig?

28
Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center www.pdfa.org Dietrich von Seggern www.callassoftware.com PDF/A-2: Was ist neu, was ist wichtig? Dietrich von Seggern Business Development Manager, callas software GmbH Gründungsmitglied PDF/A Competence Center DMS Expo 2010

Transcript of PDF/A-2, Was ist neu, was ist wichtig?

Page 1: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

PDF/A-2: Was ist neu, was ist wichtig?

Dietrich von SeggernBusiness Development Manager, callas software GmbHGründungsmitglied PDF/A Competence Center

DMS Expo 2010

Page 2: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Über callas software

!PDF-Technologie seit 1997

!Beteiligt an PDF/ISO-Normierung seit 1999

!Produkte! „Preflight“ in Adobe Acrobat Professional! pdfaPilot 2! pdfToolbox 4

!Verfügbar als! Desktop (Plug-In und Standalone)! Server! Kommandozeilen-Modul (CLI)! Programmierbibliothek (SDK)!C/C++, .NET, Java

! Für Windows, Linux, Sun, AIX, Mac OS X

Page 3: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

In diesem Vortrag:

!PDF/A-2 und/oder PDF/A-1?

!Neu in PDF/A-2:!Neuer Konformitätslevel zwischen a und b: u!Neue PDF features!Einige Erleichterungen!Wenige neue Anforderungen

!Statistik: Häufige Problem in PDF/A-1 und Ausblick auf PDF/A-2

!Wichtige Programmfeatures für PDF/A-2

Page 4: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

PDF/A-2 vs PDF/A-1

!PDF/A-2 ist noch nicht veröffentlicht! Zu erwarten Frühjahr 2011

!PDF/A-1 wird weiter bestehen! PDF/A-2 ist ein weiterer Teil (“Part”) in ISO 19005 ! Es gibt nur wenige Gründe für den Umstieg

!PDF/A-2 basiert auf ISO 32000-1 (PDF 1.7)! Neuere Grundlage mit neuen Features!Weniger “Downfeature” Korrekturen notwendig

! PDF/A-2 basiert auf einem ISO Standard

Page 5: PDF/A-2, Was ist neu, was ist wichtig?

!Konformitätslevel b “Basic”: Visuelle Integrität! PDF/A-1b und PDF/A-2b

!Konformitätslevel a “Advanced”: Struktur und Semantik (Bedeutung)! PDF/A-1a und PDF/A-2a! Barrierefreiheit! Unicode! Problem: Struktur ist mitunter schwierig zu erzeugen

!Neu: Konformitätslevel u: Unicode! PDF/A-2u! Zwischen PDF/A-2a und PDF/A-2b! Semantik (Unicode) für Copy&Paste, Text Indizierung, Text

Suche etc.

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Neuer Konformitätslevel: PDF/A-2u

Page 6: PDF/A-2, Was ist neu, was ist wichtig?

!Glyphen in PDF ohne Unicode:! Ausreichend für Wiedergabe! Keine Semantik (Bedeutung)

!Glyphen in PDF mit Unicode:! Semantik und Glyphen

entsprechend dem Unicode Standard! Die Abbildung nach Unicode

kann implizit erfolgen, z.B. durchein Standardencoding wie MacRomanEncoding

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Unicode

Page 7: PDF/A-2, Was ist neu, was ist wichtig?

!Schließt eine Lücke zwischen Konformitätslevel a und b

!Text lässt sich als Text verwenden:! Indizierung! Durchsuchbarkeit! Copy und paste! Automatisierte Übersetzungen! etc.

!Geeignet wenn Konformitätslevel a nicht erreicht werden kann aber Wert auf vollständige Textfeatures gelegt wird.

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

PDF/A-2u

Page 8: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Überblick:Neue Features in PDF/A-2

!Ebenen

! JPEG2000

!Eingebettete Dateien

!Transparenz

!Größere Seiten

!und mehr...

Page 9: PDF/A-2, Was ist neu, was ist wichtig?

!Ebenen in PDF “Optional Content” ! Sichtbarkeit von Seitenobjekten kann ein- und

ausgeschaltet werden

!Anwendungsbereiche! Mehrsprachige Inhalte (eine Ebene je Sprache)! Engineering

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Neue Features in PDF/A-2:Ebenen

Page 10: PDF/A-2, Was ist neu, was ist wichtig?
Page 11: PDF/A-2, Was ist neu, was ist wichtig?
Page 12: PDF/A-2, Was ist neu, was ist wichtig?
Page 13: PDF/A-2, Was ist neu, was ist wichtig?

!Höhere Kompression

!Bessere Qualität durch höhere Bildauflösung bei gescannten PDFs

!Bessere Performance durch Dekompression in Abhängigkeit von der Vergrößerungsstufe (Zoom) oder vom Ausschnitt

!Wichtig zum Beispiel für Bibliotheken oder bei ähnlich hohen Qualitätsanforderungen für gescannte PDFs.

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

JPEG2000

Page 14: PDF/A-2, Was ist neu, was ist wichtig?

! In PDF/A-2 erlaubt, wenn die Anhänge PDF/A konform sind (PDF/A-1 oder PDF/A-2)

!Andere Dateiformate dürfen NICHT eingebettet werden

!Ermöglicht Verlinkungen zwischen PDFs

!Nützlich beispielsweise für Emails mit Anhängen oder E-Akten

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Eingebettete Dateien, Anhänge, Dateipakete, Collections

Page 17: PDF/A-2, Was ist neu, was ist wichtig?

!Quelle: “Gestaltete” PDFs aber auch Präsentationen

!Transparenzreduzierung für PDF/A-1 ist aufwändig! Komplex und Fehleranfälig! In der Regel größere Dateien! Seiteninhalte werde komplett verändert! Text kann in Bild konvertiert werden

(Durchsuchbarkeit geht verloren)

!Mehr PDFs können mit weniger Aufwand nach PDF/A konvertiert werden

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Transparenz

Page 18: PDF/A-2, Was ist neu, was ist wichtig?

!Publishing

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Transparenz Beispiel (1)

Page 20: PDF/A-2, Was ist neu, was ist wichtig?

!Größere Seiten! PDF/A-1 und PDF 1.4: Maximum ca. 5 x 5 m ! PDF/A-2 und ISO 32000-1: Maximum 381 x 381 km

(“User Units”)! zum Beispiel für Geo-Daten

!Kommentare! Polygon, Polyline, Caret, FileAttachment, Watermark,

Redact

!ICC Profile!Neuere Versionen (4.0)

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Wichtige neue Features in ISO 32000-1 (1)

Page 21: PDF/A-2, Was ist neu, was ist wichtig?

!Größere “Implementation Limits”! Interne Begrenzungen für größte und kleinste

Werte, Anzahl von Einträgen etc. wurden erweitert!Kein häufiges Problem aber schwierig zu lösen

!Objektkomprimierung: Kleinere Dateien

!OpenType Schriften!Einfachere Textänderungen in PDFs

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Wichtige neue Features in ISO 32000-1 (2)

Page 22: PDF/A-2, Was ist neu, was ist wichtig?

!XMP Metadata und Document Information Metadata müssen nicht mehr synchron sein

! Einige Details beim Schriftencoding vereinfacht

!Weniger Anforderungen an die formale Syntax

!Weniger Anforderungen in Bezug auf Struktur

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Reduzierte Anforderungen in PDF/A-2

Page 23: PDF/A-2, Was ist neu, was ist wichtig?

!Statistik basiert auf knapp 50000 Problemen in zufällig ausgewählten PDFs (ca. 10 GB aus dem Internet)

!PDF/A-1b: Anteil der Anforderungen, die in PDF/A-2 vereinfacht oder entfernt wurden! Dokument Information: 10%! Schriftencoding: 11%! PDF 1.4: 4%! Eingebettete Dateien, Ebenen: 4%! Implementation limits: 3%! Transparenz: 7%!Summe: 39%

!Die Konvertierung wird einfacher

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Etwas Statistik: PDF/A-1b vs PDF/A-2b

Page 24: PDF/A-2, Was ist neu, was ist wichtig?

!PDF/A-1a: Anteil der mit Unicode zusammen hängenden Probleme: 1%!Unicode ist kein häufiges Problem!PDF/A-2u ist eine bedenkenswerte Alternative

!PDF/A-1a: Anteil der mit Struktur zusammen hängenden Probleme, die es in PDF/A-2a nicht mehr gibt: 56%!Die Konvertierung nach PDF/A-2a wird einfacher

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Noch mehr Statistik:PDF/A-2u, PDF/A-2a

Page 25: PDF/A-2, Was ist neu, was ist wichtig?

!Alle spezifischen Metadaten müssen in PDF/A in einem eingebetteten Extension Schema definiert sein! In PDF/A-1 nur auf Dokumentebene! In PDF/A-2 auch auf Objektebene

!Bilder können Metadaten mit Copyright Informationen oder technischen Daten (EXIF) besitzen

!Kontrolliertes Arbeiten mit Metadaten auch auf Objektebene - vor allem wenn die Daten das Unternehmen verlassen...

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Zusätzliche Anforderungen: XMP Metadaten für Seitenobjekte

Page 26: PDF/A-2, Was ist neu, was ist wichtig?

!Validierung! PDF/A-2b! PDF/A-2u! PDF/A-2a! Insbesondere Validierung von Collections

!Konvertierung! Erzeugung von Collections! Management von Ebenen

!Viewer! Ebenen! Transparenz ! Collections! JPEG2000! XMP Objektmetadaten

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Wichtige Kriterien für PDF/A-2 kompatible Progamme

Page 27: PDF/A-2, Was ist neu, was ist wichtig?

!PDF/A-2 basiert auf ISO 32000 und unterstützt zusätzliche PDF Features.

!Basierend auf den Erfahrungen mit PDF/A-1 wurden einige Vorschriften erleichtert.

!PDF/A-2 ersetzt PDF/A-1 NICHT.

! In den meisten existierenden PDF/A Prozessen gibt es keinen Grund von PDF/A-1 auf PDF/A-2 umzustellen.

!Bei neuen PDF/A Prozessen wird in Zukunft PDF/A-2 verwendet werden.

!Wenn PDF/A-2 verwendet wird, sollte untersucht werden, ob PDF/A-2u besser als PDF/A-2b geeignet ist.

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Zusammenfassung

Page 28: PDF/A-2, Was ist neu, was ist wichtig?

Oktober 2010 PDF/A-2 – Was ist neu, was ist wichtig? – 26. Oktober 2010 – © 2010 PDF/A Competence Center

www.pdfa.org

Dietrich von Seggernwww.callassoftware.com

Danke für’s Zuhören!

Wir freuen uns auf Ihren Besuch

Dietrich von Seggerncallas software [email protected]