slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt...

24
/slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C 3 Archivierung von Multimedia- Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg D-91052 Erlangen

Transcript of slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt...

Page 1: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Archivierung von Multimedia-Daten

W. D. IhlenfeldtComputer-Chemie-Centrum

Universität Erlangen-NürnbergD-91052 Erlangen

Page 2: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Digitale Dissertationen und Archive

• Gewinn durch Originalaufzeichnungen (Audio, Video) Originaldaten Visualisierungen Dynamic Content Erschließung über Multimedia-Content

• Relevanzspanne u.U. Jahrzehnte und mehr

Page 3: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Zukünftiger Zugriff auf Multimedia-Daten

Zukunftssicherheit erfordert

• Verwendung von zukunftsfesten Formaten

und/oder

• Nachkonvertierung der Daten

Page 4: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Standard Multimedia-Typen

• Bilder• Audio• Video

• Interaktive Texte• Dynamic Content• Anbindung von Software

Page 5: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Wissenschaftliche Multimedia-Typen

• Vektorzeichnungen• Animationen• 3D Szenen

• 2D Tabellen und Zeitreihen• Multidimensionale Messdaten• Chemie-spezifische Sonderformen (Strukturen, Reaktionen, Spektren)

Page 6: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Anforderungen

• Nutzbar nach Jahrzehnten

• Voll dokumentiert• Verbreitet• Plattformunabhängig• Theoretisch und praktisch konvertierbar• Unlimitierter Vollzugriff• Nutzbar ohne Lizenz- und Patentfragen

Page 7: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Erstrebtes Eigenschaftsprofil

• Verbreitete Formate• Standardisierung (International mit breiter Unterstützung)• Multiple Source – Unterstützung durch mehrere Hersteller• Format und Varianten automatisch erkennbar• ASCII/Unicode mit Mark-Up bevorzugt• Integration in Datensysteme (XML)

Page 8: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Konvertierbarkeit

• Voll dokumentiertes Format• Eindeutig erkennbares Format• Verlustlose Datenkompression• Möglichst keine Verschlüsselung, Watermarks• Gutes Zeichen: Open-Source-Format

• JPEG, MPEG, Quicktime, MP3: etc.: Kompression verlustbehaftet!

Page 9: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Überformate

• Kein einfaches Format, sondern Hülle

• Multiple CODECs

• Nicht nutzbar ohne spezifischen CODEC

• Beispiele: AVI, Quicktime

Page 10: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Regeln zur Aufnahme von Multimedia-Content

• Einfachste Formate, die noch den Zweck erfüllen und alle notwendigen Informationen enthalten

• Keine undokumentierten, programmspezifischen Dateien

• Keine ausführbare Software

• Lieber mehr Speicherplatz als Lossy Compression

Page 11: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Die IRIS Showcase Story

• Powerpoint-ähnliches Format auf SGI• Bis vor einigen Jahren in der Chemie recht beliebt• Support von SGI eingestellt• Läuft nicht mehr auf neueren IRIX-Versionen• Proprietäres, undokumentiertes, binäres Format• Kein Support durch Konkurrenzprodukte• Keine Freigabe des Formats wg. Rechtsstreitigkeiten

Page 12: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Bilder

• GIF: Patentfragen, Farbtiefe, Maximalgröße• JPEG: Verlustbehaftete Kompression• XBM, BMP, XPM: Schlechter Support, groß• TIFF: Überformat, Gefahr unüblicher CODECS• EPS: Riesige Dateien

• PNG: Derzeit wohl bester Kompromiss

Page 13: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Audio

• Samplingraten variabel, evtl. SW-Probleme• Verlustbehaftete Kompression• Multikanal-Problematik

• AIFF, WAV, AU: Nur leicht reversibel komprimiertes Signal• MP3, OV, RAM: Hoch und verlustbehaftet komprimiert• MIDI: Im Prinzip Noten

Page 14: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Video

• Datenvolumen erfordert verlustbehaftete Kompression• Evtl. Animation statt Video zu empfehlen• Zahlreiche proprietäre CODECs

• MPEG: Standardformat• QT, AVI: Überformate• Motion-JPEG für Spezialanwendungen

Page 15: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Vektorzeichnungen

• CGM: Standard, aber mit Variationen• DXF: Komplex, mit zahlreichen Erweiterungen• WMF: Proprietär, undokumentiert• EPS: Groß, schwierig zurückzulesen

• In Zukunft: SVG, XML-basiert

Page 16: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: 2D Animationen

• Animated GIF: Groß, begrenzt, Patentfrage• VRML, X3D, Video: Overkill• Macromedia Flash/Shockwave: Jetzt offengelegt, wohl aktueller Standard

• In Zukunft: SVG

Page 17: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: 3D Szenen

• Standard: VRML 1.0 und VRML 97• Animationen in 3D möglich• Guter Export-Support, Import über Java3D• VRML Weiterentwicklung eingestellt• Nachfolger X3D noch nicht einsatzreif

Page 18: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Tabellen

• Proprietäre Spreadsheet-Formate indiskutabel• TSV, CSV: Verlust von Meta-Information• SYLK, DIF: Standardformate• Mangelnde Codierung von Formeln• MathML evtl. Lösung in der Zukunft

Page 19: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Multidimensionale Daten

• Tabellenformate ungeeignet für Volumendaten, hierarchische Daten etc.• Proprietäre Formate generell nicht akzeptabel• HDF, netCDF sind Standards

Page 20: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Chemiedaten

• Strukturen, Spektren, Reaktionen, Sequenzen• Dutzende von proprietären Formaten• Missbrauch von Standardformaten (PDB)• Komplexe Überformate (CXF, CIF)• Empfehlung: SDF, JCAMP, RXN• In der Entwicklung: CML, XML-basiert

Page 21: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia:Präsentationen

• Verknüpfung von Text, Audio, Video zu interaktiven Präsentationen• Zahlreiche proprietäre, undokumentierte Formate• SMIL als Standard, aber noch mit Akzeptanzproblemen

Page 22: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Anwendungsprogramme

• Hinterlegung von Quellcode unproblematisch• Wartung von compilierter Software i.A. kaum zu realisieren• Denkbare Möglichkeit: Java-Bytecode• Noch keine Langzeiterfahrungen

Page 23: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Multimedia: Indexierung

• Erschließung des Textkorpus über nicht-textuelle Suchverfahren auf Multimedia-Content• Daneben klassische Metadaten von MM-Objekten• Etabliert in der Chemie für Strukturen, Spektren, Reaktionen, Sequenzen• Sonstige Anwendungen Forschungsfelder (Bildinhalt, Musikphrasen, Szenenanalyse, Formelanalyse)

Page 24: slides/cactvs/hdt.ppt © Ihlenfeldt 1999 C3C3 Archivierung von Multimedia-Daten W. D. Ihlenfeldt Computer-Chemie-Centrum Universität Erlangen-Nürnberg.

/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3

Weitere Informationen

W. D. [email protected]

http://www2.ccc.uni-erlangen.de/wdi/