Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE:...

23
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03

Transcript of Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE:...

Page 1: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

Dublin Core Metadata

Thea Spiridonidou

Institut für Informatik

Humboldt Universität zu Berlin

SE: Grundlegende Aspekte des Semantic Web

WS 02/03

Page 2: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 2

Gliederung

1. Einführung

2. Die Dublin Core Initiative

3. Elemente und Qualifier

4. Ausblick

5. Literatur

Page 3: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 3

Einführung

• Zunahme der angebotenen Informationdurch Entwicklung des WWW

• Suchmaschinen helfen an relevante Informationen ran zu kommen; aber sie liefern auch unpräzise Ergebnisse

• Bedarf an Metadaten

• Was sind Metadaten?

Page 4: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 4

Einführung

• Def. (Tim Burners-Lee): „Metadaten sind maschinenlesbare Informationen über elektronische Ressourcen und andere Dinge“

• Daten über Daten• Von wem und wie sollen Metadaten

über die Informationsquellen erstellt werden?

Page 5: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 5

Die Dublin Core Initiative

• März 1995: Metadaten Workshop veranstaltet vom Online Computer Library Center (OCLC) und National Center for Supercomputing (NCSA)

• Entstehung der Dublin Core Initiative

Page 6: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 6

Die Dublin Core Initiative Ziele:• Einfachheit • Interoperabilität (Austauschbarkeit) von Metadaten • Erreichung größerer Recherchepräzision als bei der

gewohnten Volltextsuche • Lieferung der Metadaten durch den Autor der Ressource • Standardset von Dublin Core Bezeichnern • Entwicklung maschinell verarbeitbarer Semantiken • „Eins-zu-eins-Prinzip“ der Metadaten, d.h. ein DC-Metasatz

pro Objekt/Seite

Page 7: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 7

Die Dublin Core Initiative

• Basiert auf internationale Zusammenarbeit

• Mitglieder aus verschieden Fachbereichen

Page 8: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 8

Elemente und Qualifier

• Dublin Core Metadata Element Set in verschiedene Syntaxformate darstellbar (z.B. RDF)

• 15 Dublin Core Kernelemente mit RDFS definiert

• Dublin Core Namensraum mit dc: dargestellt, URL http://purl.org/dc/elements/1.0

Page 9: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 9

Elemente und Qualifier

• Bsp.:<rdf:Description ID="creator„>

<rdf:type rdf:resource="http://www.w3.org/TR/REC-rdf-syntax#Property"/>

<rdfs:label>Author/Creator</rdfs:label>

<rdfs:comment>The person or organization primarly responsible for creating the intellectual content of the resource. For example, authors in the case of written documents, artists, photographers, or illustrators in the case of visual resources.</rdfs:comment>

<rdfs:isDefinedBy=""/>

</rdf:Description>

Page 10: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 10

Elemente und Qualifier

Page 11: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 11

Elemente und Qualifier

Überführung von RDF in DC, Beispiel in RDF:

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-

rdf-syntax-ns#" >

<rdf:Description rdf:about="http://doc">

<author>Joe Smith</author>

</rdf:Description>

</rdf:RDF

Page 12: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 12

Elemente und Qualifier

Mit DC:

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-

rdf-syntax-ns#"

xmlns:dc="http://purl/dc/elements/1.0/">

<rdf:Description rdf:about="http://doc">

<dc:creator>Joe Smith</dc:creator>

</rdf:Description>

</rdf:RDF>

Page 13: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 13

Elemente und Qualifier• Wiederholtes Auftretten eines Elements und xml:lang

<rdf:RDF xmlns:rdf = "http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:rdfs = "http://www.w3.org/2000/01/rdf- schema#" xmlns:dc = "http://purl.org/dc/elements/1.1/"><rdf:Description rdf:about> <dc:title> <rdf:Alt> <rdf:li xml:lang = "en">Healthy Food</rdf:li> <rdf:li xml:lang = "de">Gesunde Nahrung</rdf:li> </rdf:Alt> </dc:title></rdf:Description></rdf:RDF>

Page 14: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 14

Element und Qualifier

• Qualifier zur genaueren Spezifikation der Werte

• Verfeinerung der Elemente zur Eindeutigkeit des Suchverfahrens

• Qualifier sollen ignorierbar sein und das unqualifizirte Element gebrauchfähig (Dump-Down-Prinzip)

Page 15: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 15

Elemente und Qualifier

Page 16: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 16

Elemente und Qualifier

• Element Refinement Qualifier: Element wird genauer spezifiziert• Bsp.: date - Created: Datum der Erstellung der Ressource       -Valid: Datum der Gültigkeit einer Ressource         -Available: Datum, an dem die Ressource zugänglich

sein wird oder zugänglich gemacht wurde        - Issued: Datum der formalen Veröffentlichung der

Ressource       -Modified: Datum, an dem die Ressource geändert wurde 

Page 17: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 17

Elemente und Qualifier

• Encoding Scheme Qualifier: bestimmen Schemata, die bei Interpretation des Elementinhalts helfen

• Bsp.: date

   - DCMI Period: Angaben über die Grenzen eines Zeitintervalls

- W3C-DTF: W3C-Kodierungsregeln für Daten und Zeiten – basierend auf ISO 8601

Page 18: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 18

Elemente und Qualifier

Definition der Qualifier in RDFS:

<rdfs:Class rdf:about="http://purl.org/dc/terms/MESH">

<rdfs:label>MeSH</rdfs:label>

<rdfs:comment>Instances of this class are Medical Subject Headings and must provide an rdf:value (with content the code) and should provide an rdfs:label arc (with content the caption).

</rdfs:comment>

<rdfs:comment>Medical Subject Headings </rdfs:comment>

<rdf:type rdf:resource = "http://purl.org/dc/terms/SubjectScheme"/>

<rdfs:isDefinedBy rdf:resource="http://purl.org/dc/terms/" />

</rdfs:Class>

Page 19: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 19

Elemente und Qualifier

Encoding Scheme Deklaration für das Subject-Element

<rdfs:Class rdf:about="http://purl.org/dc/terms/SubjectScheme">

<rdfs:label>Subject Encoding Schemes</rdfs:label>

<rdfs:comment>A set of subject encoding schemes and/or formats </rdfs:comment>

<rdfs:isDefinedBy rdf:resource="http://purl.org/dc/terms/" />

</rdfs:Class>

Page 20: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 20

Elemente und Qualifier

Page 21: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 21

Elemente und Qualifier• Dazugehörige Code:

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns# "

xmlns:dc ="http://purl/dc/elements/1.0/"

xmlns:dcq = http://purl.org/dc/qualifiers/1.0/">

<rdf:Description rdf:about = "http://doc">

<dc:creator>

<rdf:Description>

<rdf:value>Joe Smith</rdf:value>

<dcq:creatorType>Illustrator</dcq:creatorType>

</rdf:Description>

</rdf:creator>

</rdf:Description>

</rdf:RDF>

Page 22: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

27.01.2003 Dublin Core Metadata 22

Ausblick

• Nur wenige Suchmaschinen arbeiten mit Metadateninformationen

• Wenn ja, nur bestimmte Elemente in bestimmte Dokumenttypen (Alta Vista und Infoseek z.B. Elemente Description und Keywords in HTML-Dokumente)

• Anfang einer wichtigen Entwicklung

Page 23: Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.

23Dublin Core Metadata27.01.2003

LiteraturStefan Kokkelink, Roland Schwänzl – „Expressing Qualified Dublin

Core in RDF / XML“, 14.04.2002http://dublincore.org/documents/2002/04/14/dcq-rdf-xml/Dave Beckett, Eric Miller, Dan Brickley – „Expressing Simple Dublin

Core in RDF / XML“, 28.11.2001http://dublincore.org/documents/2001/11/28/dcmes-xml/Eric Miller, Paul Miller, Dan Brickley – “Guidance on expressing the

Dublin Core within the Resource Description Framework (RDF)”, 01.07.1999

http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf/Dublin Core Metadata Initiativehttp://purl.org/dc/