Linked Open Data in Bibliotheken

Post on 11-Jun-2015

116 views 2 download

description

Dies ist eine Präsentation, welche für den Unterricht von Bachelor-Studenten (2. Sem.) in Informationswissenschaften gegeben wurde.

Transcript of Linked Open Data in Bibliotheken

Linked Open Data in Bibliotheken

Jasmin Hügi

Haute école de gestion, Genève, Suisse Information documentaire Semestre 2 – Cours «Thesauri, Taxonomien, Ontologien» 21.05.2013

Problem

• Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?

• Mühsam:

– Roman + Rom,

– Roman + Bern,

– Roman + Paris, etc.

Cours 722-11n : Analyse documentaire – Juin 2012 - C. Bezençon

2

Nutzen für Bibliotheken

• Idealerweise: Computer weiss, was eine europäische Hauptstadt ist.

Ontologien geben dem Computer dieses Wissen.

Was sind Ontologien?

Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?

Roman

Bern

Lissabon

London

Hogwarts Film

Spielt in

Spielt in

Ist

Ist

Nachtzug nach Lissabon / Pascal Mercier

Harry Potter / J. K. Rowling

Shadows on the Hudson / I. Bashevis Singer

5

New York

Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?

Hauptstadt

Fiktiver Ort

Ist

6

Stadt

Ist

Roman

Bern

Lissabon

London

Hogwarts Film

Spielt in

Spielt in

Ist

Ist

Nachtzug nach Lissabon / Pascal Mercier

Harry Potter / J. K. Rowling

Shadows on the Hudson / I. Bashevis Singer

New York

Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?

Schweiz

Portugal

7

USA

Eng-land

Europa

Ist eine Stadt in

Ist eine Stadt in

Befindet sich in

Roman

Bern

Lissabon

London

Hogwarts Film

Spielt in

Spielt in

Ist

Ist

Nachtzug nach Lissabon / Pascal Mercier

Harry Potter / J. K. Rowling

Shadows on the Hudson / I. Bashevis Singer

New York

Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?

Roman

Bern

Lissabon

London

Hogwarts

Hauptstadt

Fiktiver Ort Film

Ist

Nachtzug nach Lissabon / Pascal Mercier

Harry Potter / J. K. Rowling

Shadows on the Hudson / I. Bashevis Singer

8

New York

Stadt

Ist

Europa

Spielt in

Spielt in

Ist

Ist

Die Sprache der Tripel

Beispiel

Subjekt – Prädikat – Objekt

= Tripel

Tripel - Beispiel

Linked Open Data in Bibliotheken

Jasmin Hügi

lehrt

Hat Lehrperson

Graph

Spezifisch

Folksonomies Eliane Blumer

lehrt

hat Lehrperson

Linked Open Data in Bibliotheken

Jasmin Hügi

lehrt

hat Lehrperson

Graph

Allgemein

Unterrichtseinheit Lehrperson

lehrt

hat Lehrperson

Graph

Allgemein

Unterrichtseinheit Lehrperson

wird besucht von

besucht

Student

behandelt das Thema

wird unterrichtet

im Kurs

Kurs

lehrt

hat Lehrperson

Aufgabe

Erstellt einen RDF-Graph für Bücher in einem Bibliothekskatalog.

• Buchtitel

• Buchautor

• ISBN

• Thema

• Sprache

• Publikationsjahr

• Herausgeber

• Publikationsort

• Etc.

Beispiellösung

Linked Data

Linked Data

• Informationen werden als Paare mit einer Beziehung dargestellt.

• Alles hat eine URI (http://...).

• Informationen werden in einem Standardformat kodiert.

Ein Paar mit Beziehung

Linked Open Data in Bibliotheken

Jasmin Hügi

lehrt

Hat Lehrperson

URI

URI (http://...) URI (http://...) URI (http://...)

Linked Open Data in Bibliotheken

Jasmin Hügi

lehrt

Hat Lehrperson

Standardformat

RDF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bil="http://www. bilingue.fake/unterricht#"> <rdf:Description rdf:about="http://www.bilingue.fake/ unterricht/einheit/lod_biblio"> <bil:lehrperson>Jasmin Hügi</bil:lehrperson> <bil:kurs>Thesauri, Taxonomien, und Ontologien </bil:kurs> </rdf:Description> </rdf:RDF>

Beispiel

<http://www.bilingue.fake/unterricht/lod_biblio>

<http://www.bilingue.fake/unterricht/hat_Lehrperson>

<http://www.linkedin.fake/Jasmin_Hügi>

Subjekt Prädikat

Objekt

Linked Open Data in Bibliotheken

Jasmin Hügi

lehrt

hat Lehrperson

Beispiel

<http://www.bilingue.fake/unterricht/lod_biblio> <http://www.biling ue.fake/unterricht/hat_Lehrperson> <http://www.linkedin.fake/Jasmin_Hügi>

= Tripel

Alternative

<http://www.bilingue.fake/unterricht/lod_biblio> <http://www.biling ue.fake/unterricht/hat_Lehrperson> «Jasmin Hügi»

= Tripel

Wieso URI?

Eindeutige Identifikation

<http://www.bilingue.fake/unterricht/lod_biblio>

<http://www.htwchur.fake/unterricht/lod_biblio>

Wieso URI?

Zusätzliche Informationen

http://www.linkedin.fake/Jasmin_Hügi

Dublin Core

• Metadaten-Schema für die Beschreibung von digitalen Resourcen

• Websites, Online-Dokumente, etc.

• Einfachere Auffindbarkeit mit Suchmaschinen

• 15 Kernelemente

Dublin Core

Dublin Core

15 Kernelemente • Title • Creator • Subject • Description • Publisher • Contributor • Date • Type

• Format • Identifier • Source • Language • Relation • Coverage • Rights

Beispiel-Lösung

dcterms:title

dcterms:creator

dcterms:date

dcterms:publisher

dcterms:identifier dcterms:subject

dcterms:type

dcterms:description

dcterms:description

Linked Open Data

5 Star deployment scheme by Tim Berners-Lee

http://5stardata.info/

5 Star LOD von Tim Berners-Lee

★ make your stuff available on the Web (whatever format) under an open license

= Bild

5 Star LOD von Tim Berners-Lee

★★ make it available as structured data (e.g., Excel instead of image scan of a table)

gtd-2.xls

5 Star LOD von Tim Berners-Lee

★★★ use non-proprietary formats (e.g., CSV instead of Excel)

gtd-3.csv

5 Star LOD von Tim Berners-Lee

★★★★ use URIs to denote things, so that people can point at your stuff

http://5stardata.info/gtd-4.html

5 Star LOD von Tim Berners-Lee

★★★★★ link your data to other data to provide context

http://5stardata.info/gtd-5.html

Ontologien

• Ontologien (Vokabulare) werden benötigt, um ein Subjekt mit einem Objekt zu verbinden.

• Eine einzige Ontologie genügt selten, um alle Beziehungen darzustellen.

Buch Autor

dcterms:creator

Übung Vokabular auswählen und recherchieren. • BIO Vocabulary • Event Ontology • FOAF • Core FRBR Ontology • Musical Ontology • PRISM (Namespae)

Vokabular präsentieren und am Beispiel des Buchgraphs seine Nützlichkeit erklären. Zusatzaufgabe: Herausfinden, was eine Klasse ist.

Turtle (Terse RDF Triple Language)

Turtle : Regel 1

Jedes Tripel beginnt auf einer neuen Linie

Jedes Tripel endet mit einem Punkt (.)

Turtle : Regel 1 Beispiel

Der Verdacht wurde geschrieben von Friedrich Dürrenmatt .

Matto regiert wurde geschrieben von Friedrich Glauser .

Turtle : Regel 1 Beispiel

<http://www.rero.fake/000005214_Verdacht> <http://purl.org/dc/elements/1.1/creator>

«Friedrich Dürrenmatt».

<http://www.rero.fake/00004314_Matto> <http://purl.org/dc/elements/1.1/creator>

«Friedrich Glauser».

Turtle : Regel 2

Subjekt, Prädikat und Objekt werden mit einem Leerschlag (Whitespace) voneinander getrennt.

Turtle : Regel 2 Beispiel

<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».

<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».

Turtle : Regel 3

Wörter ohne URI werden in Anführungszeichen gesetzt.

Bsp: «Friedrich Dürrenmatt»

Turtle : Regel 3 Beispiel

<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».

<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».

Turtle : Regel 4

URIs werden in spitze Klammern gesetzt.

Bsp:

<http://www.bilingue.fake/unterricht/lod_biblio>

Turtle : Regel 4 Beispiel

<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».

<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».

Turtle : Regel 5

URIs können mit Präfixen (Namespace) abgekürzt werden.

Turtle : Regel 5 Beispiel

<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».

<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».

Wiederholung: <http://purl.org/dc/elements/1.1/>

<http://www.rero.fake/>

Turtle : Regel 5 Beispiel

@prefix dc: <http://purl.org/dc/elements/1.1/> @prefix rero: <http://www.rero.fake/> rero:000005214_Verdacht dc:creator «Friedrich Dürrenmatt». rero:000004314_Matto dc:creator «Friedrich Glauser». = <http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt». <http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».

Turtle : Regel 6

Es dürfen Kommentare in den Code geschrieben werden. Dafür muss das Zeichen # an den Anfang einer Linie geschrieben werden.

Turtle: Regel 6 Beispiel

@prefix dc: <http://purl.org/dc/elements/1.1/>

@prefix rero: <http://www.rero.fake/>

# Es geht um Schweizer Autoren.

rero:000005214_Verdacht dc:creator «Friedrich Dürrenmatt».

rero:000004314_Matto dc:creator «Friedrich Glauser».

Turtle : Regel 7

Wenn mehrere Objekte immer dasselbe Subjekt betreffen, können diese Beziehungen durch ein Strichpunkt (;) miteinander verbunden werden.

Turtle : Regel 7 Beispiel

@prefix dc: <http://purl.org/dc/elements/1.1/>

@prefix rero: <http://www.rero.fake/>

# Es geht um Schweizer Autoren.

rero:000005214_Verdacht

dc:creator «Friedrich Dürrenmatt» ;

dc:title «Der Verdacht» ;

dc:language «Deutsch» .

Turtle : Regel 8

Wenn ein Objekt mehrere Eigenschaften hat, dann kann das Objekt in eckigen Klammern [] beschrieben werden.

@prefix dc: <http://purl.org/dc/elements/1.1/>

@prefix rero: <http://www.rero.fake/>

@prefix bio: <http://purl.org/vocab/bio/0.1/>

rero:000005214_Verdacht

dc:creator [rdf:type foaf:person ;

foaf:name «Friedrich Dürrenmatt» ;

bio:event bio:birth [bio:date «05.01.1921»] ] ;

dc:title «Der Verdacht».

Übung

Findet Fehler im Code, den Ihr erhalten habt.

Datei mit Fehlern: http://campus.hesge.ch/id_bilingue/doc/turtle_beispielmitfehler.pdf

Lösung http://campus.hesge.ch/id_bilingue/doc/turtle_beispiel.pdf