IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

16
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAI WS 08/09

Transcript of IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Page 1: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

IT-Zertifikat der Phil.Fak

Kurs 4: Daten- und Metadatenstandards

Patrick Sahle DC / OAI WS 08/09

Page 2: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Hausaufgaben der letzten Stunde

• Probleme und Lösungen

• Meine Lösung

Page 3: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core (DC)

• Einstieg:• http://de.wikipedia.org/wiki/Dublin_Core

• http://en.wikipedia.org/wiki/Dublin_Core (besser!)

• http://dublincore.org/

• Organisatorischer, historischer und konzeptioneller Hintergrund

Page 4: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core

• einfacher Satz an Elementen/Begriffen zur Beschreibung von Objekten auf der Metadatenebene

• core elements, version 1.1, ISO 15836 (2003):• http://dublincore.org/documents/dces/

• identifier

• format, type, language

• title, subject, coverage, description

• creator, publisher, contributor, rights, provenance

• relation, source

• date

Page 5: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core

• "Dublin Core Simple" (15 Elemente) vs.

• "Dublin Core Qualified" (element refinements)

• "Begriffe im Namensraum DCTerms" (55 Elemente):

http://dublincore.org/documents/dcmi-terms/

Page 6: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core• … definiert Begriffe / Konzepte, keine Syntax

• … kann ausgedrückt werden z.B. mittels HTML oder XML

<head>

<meta name="DC.title" content="DC Einführung"/>

<meta name="DC.creator" content="Patrick Sahle"/>

<meta name="DCTERMS,created" content="2009-01-20" />

<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" />

<dc:title>DC Einführung</dc:title>

<dc:creator>Patrick Sahle</dc:creator>

<dcterms:created>2009-01-20</dcterms:created>

Page 7: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core• Anwendungsbeispiel: OPAL

• http://www.opal-niedersachsen.de/

Page 8: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core - Anwendungsbeispiel: OPAL - Präsentationssicht

Page 9: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core - Anwendungsbeispiel: OPAL – Interne Datensicht (gekürzt)

<?xml version="1.0" encoding="UTF-8" standalone="no"?><!DOCTYPE opalcollection PUBLIC "opal.dtd" "http://opal-niedersachsen.de/opal.dtd"><opalcollection> <record> <dc.identifier.opal>kunsdeung_niedge_94</dc.identifier.opal> <dc.identifier type="cat-no">112</dc.identifier> <dc.creator>Vliegher, Simon de (um 1600-1653)</dc.creator> <dc.creator type="alternative">De Vliegher, Simon</dc.creator> <dc.creator type="alternative"></dc.creator> <dc.title>Vliegher, Simon de (um 1600-1653): Christus und die Jünger im Seesturm</dc.title> <dc.format.extent>84,5 x 101 cm</dc.format.extent> <dc.format.extent type="size">84,5 x 101 cm</dc.format.extent> <dc.format.material>Holz</dc.format.material> <dc.type.opal>Gemälde</dc.type.opal> <dc.type type="MIME">image/jpeg</dc.type> <dc.description label="Beschreibung" type="abstract">Holz, 84,5 x 101 cm. - Bezeichnet links unten auf einer schwimmenden Tonne: S/DE/VLIEGER/1637. Auf der Rückseite eine Brandmarke: /£ […]</dc.description> <dc.description label="Kommentar">Dieses frühe Werk de Vlieghers zählt zu seinen seltenen biblischen Historien. […] </dc.description> <dc.relation.isReferencedBy type="bibliographic">G. Hoet, Catalogus of Naamlijst van Schilderijen, met derzelven Prijzen. 's-Gravenhage 1752, Bd. 2, S. 390, Nr. 24. […]</dc.relation.isReferencedBy> <dc.relation.image url="http://www.opal-niedersachsen.de/content/kunsdeung_niedge_94/000001.jpg" download="yes" use="hide">Foto</dc.relation.image> <dc.publisher.digital>Kunstsammlung der Universität Göttingen</dc.publisher.digital> <dc.date.digital>2005</dc.date.digital> <dc.identifier.collection>kunsdeung_niedge</dc.identifier.collection> <dc.relation.isPartOfCollection>Niederländische Gemälde aus der Kunstsammlung der Universität Göttingen</dc.relation.isPartOfCollection> <opal.isLocatedAt>Göttingen</opal.isLocatedAt> <dc.rights type="image">Kunstsammlung der Universität Göttingen</dc.rights> <dc.rights type="metadata">Texte: Dr. Gerd Unverfehrt, Fotos: Kunstsammlung der Universität Göttingen</dc.rights> </record>

Page 10: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

Dublin Core• Anwendungsbeispiel: OPAL

• myOpal xmlDownload ein Beispiel

• Was ist hier los? Ist das noch Dublin Core?

• Lokale Anwendung! Dokumentation über "Application Profile"

• Bei Bedarf leicht übersetzbar auf Standard-"Dublin Core" (simple oder qualified)

Page 11: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

OAI = Open Archives Initiative(eigentlich: OAI-PMH = Protocol for Metadata Harvesting)

Page 12: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

OAI

• Einstieg: • http://de.wikipedia.org/wiki/Open_Archives_Initiative

• http://en.wikipedia.org/wiki/Open_Archives_Initiative

• http://www.openarchives.org/

• http://www.openarchives.org/OAI/openarchivesprotocol.html

• Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet

• Wichtige Begriffe / Konzepte: Data-Provider, Service-Provider

Page 13: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

OAI

• Datenkommunikation über http-Request• Basisadresse + Script + Verb (+ Argument)?

• Sechs "Verben" zur Kommunikation• Identify [wer bist du?]

• ListMetadataFormats [was sprichst du?]

• ListSets [was hast du für Sammlungen?]

• ListIdentifiers [gib mir deine Identifier]

• ListRecords [gib mir Datensätze]

• GetRecords [gib mir Datensätze]

• Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken

Page 14: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

OAI

• Beispielanwendungen• OAISTER (Service Provider): http://www.oaister.org/

• ZVDD (Data Provider): http://www.digitalisiertedrucke.de/• http://www.digitalisiertedrucke.de/oai2d.py?verb=ListSets

• BSB (Data Provider): http://www.bsb-muenchen.de/• http://mdz1.bib-bvb.de/~db/OAI/oai2.php?verb=Identify

• CEEC (Data Provider): http://www.ceec.uni-koeln.de/• http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=Identify

• Spielen Sie mit diesen Schnittstellen! Teilweise können Sie einfach die Links benutzen (und dann die Adressen studieren). Bei CEEC müssten Sie selbst den Request formulieren (die URL zusammenbauen)

Page 15: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

OAI

• Beispielanwendung CEEC• Handschrift Dom 213

• Bild: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/pagesma/%22kn28-0213_001.jpg%22/segment/%22body%22

• Beschreibung: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/katl/%22kn28-0213%22

• XML (TEI-like): http://www.ceec.uni-koeln.de/projekte/CEEC/database/descriptions/kn28-0213.xml

• OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn28-0213

Page 16: IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAIWS 08/09.

DC revisited

• Vor und Nachteile?

• Lob der Einfachheit! Fluch der Einfachheit!

• Informationsreduktion? (Strategien dagegen?)

• Gebunden an Perspektiven und Wissensbereiche

• Was ist das Objekt?• Granularität, Seitenbezug

• Typ, Ontologischer Status

•[Beispiel: was ist das "Datum" eines digitalisierten Objekts? Ist das digitale Bild eines Textes ein Bild oder ein Text? Ist Kermit ein Frosch oder eine Puppe?]