Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim

Post on 01-Dec-2014

1.175 views 1 download

description

Invited Talk an der Staatsbibliothek zu Berlin - Preussischer Kulturbesitz 30. Juni 2011

Transcript of Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim

Bibliotheken und Linked Open Data –Erfahrungen und Ideen aus der UB Mannheim

Invited Talk an der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz

30. Juni 2011

Kai EckertUniversitätsbibliothek Mannheim

NEU!Jetzt mit nochweniger Technik!

Übersicht

1. Lokales: Was machen wir in Mannheim und warum eigentlich?

2. Rechtliches: Wie offen ist Open Data , wer darf was und mit welchen Lizenzen?

3. Technisches: Wie verknüpft man Daten? Und warum wollen alle „Linked Data“?

4. Historisches: Historie und Linked Open Data Projekte in Deutschland

LOD an der UB Mannheim

• Juli 2010: Start des Linked Data Dienstes unter http://data.bib.uni-mannheim.de.

– Titeldaten von SWB und HeBIS, hauptsächlich unter Verwendung von Dblin Core (22 Millionen)

– Verknüpfungen zwischen Titeln des gleichen Werkes (ubma:equalsForClassification)

– Rudimentäre Umsetzung der RVK– Links zu DNB und FU Berlin

• März 2011: Freigabe des eigenen Katalogs (CC0).

Warum denn Linked Data?

• Technisch: Weil wir es wollen (und können)!– Begeisterung der beteiligten Personen für das

Semantic Web.– Entsprechender technischer Hintergrund.– „Ernsthafte“ Visionen:

• Erleichterung der Entwicklung neuer Anwendungen,• bessere/leichtere Integration mit Webdiensten (Tagging,

Wikipedia, …),• Ideale Plattform, um Projektergebnisse (wie die

Verknüpfung von Titeldaten oder Ergebnisse einer automatischen Erschließung) zur Verfügung zu stellen (Linked Open Projects).

Ja aber… warum freigeben?

• Rechtlich : Warum nicht?

– Freigabe von Daten ist kein großer Aufwand.

– Beim BSZ: gar kein Aufwand!

– Gibt es Gegenargumente?• Geschäftsmodell? Was, wenn ich dann Pleite gehe?

• Angst? Was, wenn jemand meine Fehler sieht?

• Neid? Was, wenn jemand damit Geld verdient?

• Rechtliche Bedenken? Was, wenn ich das gar nicht darf?

– Kein Grund, der dagegen spricht.

Aber…

… viele Gründe, die dafür sprechen…

Open Data

Open Bibliographic Data

Offene bibliographische Daten sind:

• “Offen”, d.h. die Daten können frei genutzt, wiederverwendet und weiterverbreitet werden, allenfalls unter der Einschränkung, dass der Urheber genannt werden muss (attribution) und veränderte Daten unter gleicher Lizenz veröffentlicht werden (sharealike).

• Daten oder Metadaten, die im Bibliotheksumfeld erzeugt werden, insbesondere Daten zur Erschließung und Katalogisierung.

http://www.opendefinition.org/bibliographic/

Wie gibt man Daten frei?

1. Rechtliche Voraussetzungenklären.

2. Daten von Drittanbieternidentifizieren.

3. Lizenzen und Verträgeprüfen.

4. Daten ggf. bereinigen.5. Daten unter Hinweis auf die gew ünschte

Lizenz zur Verfügung stellen (Download).6. Datenformat angeben, ggf. dokumentieren.

Welche Lizenz?

Das Urheberrecht kann „hinderlich“ sein im digitalen Zeitalter:

„Alle Rechte vorbehalten”

Einschränkungen des Urheberrechts

• Uneinheitlich, z.B.:– Persönlicher Gebrauch– (Nicht-kommerzieller Einsatz in der) Forschung,

Lehre– Zitate– Vervielfältigung teilweise gestattet und über

Verwertungsgesellschaften ausgeglichen (Kopien, Aufzeichnungen, …)

– Kritiken, Kommentare, Parodien– Nachrichten

Digitale Werke im Internet

• Urheber wollen eigentlich eine Nutzung.• Dazu muss jedem Nutzer das Recht zur

Nutzung eingeräumt werden: Lizenz.• Eine Lizenz zu verfassen ist nicht einfach und

für einen normalen Anwender bzw. Werkersteller kaum zu leisten.

• Im Internet kommt noch das Problem dazu, dass die Lizenz weltweit gelten muss.

• Trotzdem möchten Werkersteller ihre Rechte wahrnehmen und nicht alles erlauben.

Gibt es einen Mittelweg?

no rights reserved

all rights reserved

Die „Creative Commons“Idee

• 2001 in den USA von einer Gruppe um Lawrence Lessig gegründet.

• Befürchtung, dass das US Copyright (und andere Urheberrechtsgesetze) die Kreativität im Internet behindern.

• Ziel: Mehr „kreatives“ Material unter offenen, standardisierten Lizenzen verfügbar machen.

• Die Lizenzen sollen flexibel , leicht verständlich , leicht zu nutzen und weltweit gültig sein.

Die Creative CommonsLizenzen

• BY: Attribution

– Namensnennung

• SA: Sharealike

– Weitergabe untergleichen Bedingungen

• ND: No derivatives

– Keine Veränderungen

• NC: Non-commercial

– Kein kommerzieller Einsatz

Mehr Rechte vorbehalten

Weniger Rechte vorbehalten

Lizenzen für Open Data?

• BY: Attribuion

– Namensnennung

• SA: Sharealike

– Weitergabe untergleichen Bedingungen

• ND: No derivatives

– Keine Veränderungen

• NC: Non-commercial

– Kein kommerzieller Einsatz

Mehr Rechte vorbehalten

Weniger Rechte vorbehalten

about

about

metadata

Open Data Commons

• Creative Commons ist ausgelegt auf „kreative“Werke.

• Für Daten nicht optimal, da die Übertragung der Lizenzen auf Daten unter Umständen Probleme mit sich bringt.

• Open Data Commons orientiert sich an CreativeCommons und ist für Daten besser geeignet:

– ODC-BY: Attribution

– ODC-ODbL : Attribution-Share-Alike

No rights reserved: CC0 und PDDL

• Eigentlich keine Lizenzen, sondern sogenannte Waiver: Der Urheber erklärt öffentlich, von seinen Urheberrechten keinen Gebrauch zu machen.

• Ziel ist es, abhängig vom Rechtsraum zu erreichen, dass ein Werk faktisch „Public Domain“, also Allgemeingut wird.

• Denn z.B. in Deutschland kann das Urheberrecht weder aufgegeben, noch veräußert werden.

Warum nicht erst mal Non-Commercial?

• Jede Einschränkung der Rechte an Daten erschwert oder verhindert Interoperabilität:

– Non-commercial: Rechtliche Grauzone, Daten können nicht mit offenen Daten kombiniert werden.

– No-derivatives: Daten können nicht angereichert, sondern faktisch nur noch angezeigt werden.

• Beide Einschränkungen führen gemäß der Open Bibliographic Data Definition zu nicht offenen Daten!

Warum ist selbst CC-BY nicht genug?

• Die Namensnennung ist gut gemeint, aber bei einer Nutzung von Daten, Anreicherung, Wiederveröffentlichung usw. ist die vollständige Nennung aller Urheber technisch schwierig bis hin zu nahezu unmöglich.

• Beispiel: Ergebnis einer Datenbankabfrage aus einer Datenbank, die auf verschiedenen Quellen basiert. Wie identifiziert man, was genau woher kam?

Zusammenfassungfür Bibliotheksdaten

Denn nur Public Domain sichert die rechtliche Interoperabilität der Daten.

Public Domain!(CC0 oder PDDL)

Warum also Open Bibliographic Data?

• Open Access auch für Bibliotheksdaten, die mit Steuermitteln erstellt werden.

• Höhere Sichtbarkeit und Zugänglichkeit, wenn die Daten in Systemen außerhalb der Bibliothekswelt zum Einsatz kommen können.

• Rechtliche Kompatibilität für verteilte Daten.

• Gibt es ein Geschäftsmodell der Bibliotheken für Daten? Wenn ja, ist es durch Open Data gefährdet? Oder gibt es gar neue Chancen?

Die Zukunft von Bibliotheksdaten

• Ein möglichst stark vernetzter Knoten in der LOD-Cloud (Backbone des Semantic Web).

• Nicht mehr an eine Art oder einen Ort der Präsentation gebunden.

• Nicht mehr an einen alleinigen Zweck gebunden.

• Im Web auffindbar.

Linked Data

NEU!Jetzt mit nochweniger Technik!

Wir generieren Aussagen aus Daten

Wir generieren Aussagen aus Daten

Ich bin ein Leopard-Drückerfisch.

Wir generieren Aussagen aus Daten

Ich bin ein Leopard-Drückerfisch.

Ich gehöre zu den Drückerfischen.

Wir generieren Aussagen aus Daten

Ich bin ein Leopard-Drückerfisch.

Ich gehöre zu den Drückerfischen.

Ich bin 50 cm lang.

http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.

Wir generieren Aussagen aus Daten

Ich gehöre zu den Drückerfischen.

Ich bin 50 cm lang.

http://example.org/species/90020 http://example.org/length_cm 50.

http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.

Wir generieren Aussagen aus Daten

Ich gehöre zu den Drückerfischen.

http://example.org/species/90020 http://example.org/length_cm 50.

http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.

http://example.org/species/90020 http://example.org/category http://example.org/triggerfish.http://example.org/triggerfish http://example.org/name „Drückerfisch“.http://example.org/triggerfish http://example.org/name „Triggerfish“.

Wir generieren Aussagen aus Daten

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

Drückerfisch

http://example.org/name

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator

Drückerfisch

http://example.org/name

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator

Drückerfisch

http://example.org/name

dc:subject

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator

dc:subject

http://lobid.org/14233

owl:sameAs

Drückerfisch

http://example.org/name

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator

http://lobid.org/14233

owl:sameAs

http://dbpedia.org/resource/Triggerfish

owl:sameAs

Drückerfisch

http://example.org/name

dc:subject

http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category

Triggerfish

http://example.org/name

http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator

http://lobid.org/14233

owl:sameAs

http://dbpedia.org/resource/Triggerfish

owl:sameAs

DBPediaDBPedia

Example.orgExample.org

UBMannheim

UBMannheim

Lobid.orgLobid.org

Drückerfisch

http://example.org/name

dc:subject

Bildnachweis: linkeddata.org

08.10.2007

20072007

Bildnachweis: linkeddata.org

07.11.2007

20072007

Bildnachweis: linkeddata.org

10.11.2007

20072007

Bildnachweis: linkeddata.org

28.02.2008

20082008

Bildnachweis: linkeddata.org

31.03.2008

20082008

Bildnachweis: linkeddata.org

18.09.2008

20082008

Bildnachweis: linkeddata.org

05.03.2009

20092009

Bildnachweis: linkeddata.org

27.03.2009

20092009

Bildnachweis: linkeddata.org

14.07.2009

20092009

Bildnachweis: linkeddata.org

22.09.2010

20102010

20102010

Die Schönheit von URIs

� Aussagen über Ressourcen können unabhängig von den Ressourcen selbst getätigt werden:

http://purl.org/dc/elements/1.1/creator

http://kaiec.org/me

http://doi.acm.org/10.1145/1298406.1298426

doi:10.1145/1298406.1298426 dc:creator http://kaiec.org/me

Verschiedene Orte!Verschiedene Besitzer!

Die Eindeutigkeit von URIs

� Eine URI beschreibt eindeutig und (hoffentlich) dauerhaft eine ganz bestimmte Ressource.

� http://kaiec.org/me

Aber: Eine Ressource kann durch verschiedene URIsbeschrieben werden

� urn:4321-12345

� http://gnd.dnb.de/data/person/12345

� http://ki.informatik.uni-mannheim.de/people/kai_eckert.html/#it

� …

� Keine Eineindeutigkeit!

Ist das ein Problem?

� Die Äquivalenz von URIs lässt sich jederzeit und von jedem als RDF Statement ausdrücken:

� urn:4321-12345 owl:sameAs ↵http://gnd.dnb.de/data/12345

� Dadurch lassen sich insbesondere auch Prädikate (Vokabular) gleichsetzen.

� So lassen sich transparent Datenbestände mit anderen Datenbeständen verknüpfen.

� → Linked Data

Exkurs: URI Syntax� <schema>:<Schema-spezifischer Teil>

� Beispiele

� http://www.bib.uni-mannheim.de/

� mailto:eckert@bib.uni-mannheim.de

� http://purl.org/dc/elements/1.1/creator

� http://dublincore.org/2008/01/14/dcelements.rdf#creator

� info:lc/vocabulary/countries/af

� urn:nbn:de:gbv:089-3321752945

� urn:isbn:0345391802

� http://doi.acm.org/10.1145/1298406.1298426

� http://dx.doi.org/10.1145/1298406.129842

Exkurs: Verschiedene Schemata� http://...

� Lediglich eine registrierte Domain notwendig, um Eindeutigkeit zu sichern.

� Möglichkeit, URIs mit beliebigen Inhalten zu dereferenzieren (RDF!)

� PURL

� Dienst von OCLC mit dem Vorteil, dass URIs dereferenzierbar bleiben, selbst wenn man die eigene Domain wieder aufgibt.

� URN

� Eingeschränkt dereferenzierbar über Resolver-Dienste

� Aufwändige Registrierung über IANA

� info:

� Nicht dereferenzierbar, aber leichter zu registrieren als URN Namespaces.

Projekte

Projekte

• International: LCSH der Library of Congress, LIBRIS der schwedischen Nationalbibliothek (beide 2008).

• DNB: Gemeinsame Normdatei als Linked Data (März 2010)

• HBZ, BSZ: Open Data für Katalogdaten. (März 2010)

• UB Mannheim: Verknüpfungen zwischen HeBIS und SWB, Linked Data Aufbereitung. (Juli 2010)

• lobid.org (September 2010):

– Titeldaten als Linked Open Data

– Identifikatoren für Organisationen

• CultureGraph: Zentrale Identifier und Verknüpfung von Datensätzen.

• GESIS: Thesaurus für Sozialwissenschaften

• ZBW: Standardthesaurus Wirtschaft

• Europeana (Open Data als Voraussetzung, RDF-basiertes Datenmodell)

• …

10 Jahre Semantic Web

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Linked Data Tutorial (Bizer et al.)

Tim Berners-Lee publiziert Prinzipien für Linked Data

Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web

LOD Cloud, Linking Open Data Projekt

LIBRIS, LCSH.info

HBZ, DNB, UB Mannheim, …

LoC LCSH (Offiziell)

W3C LLD XG

DINI AG KIM

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Linked Data Tutorial (Bizer et al.)

Tim Berners-Lee publiziert Prinzipien für Linked Data

Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web

LOD Cloud, Linking Open Data Projekt

LIBRIS, LCSH.info

HBZ, DNB, UB Mannheim, …

LoC LCSH (Offiziell)

W3C LLD XG

DINI AG KIM

5 Jahre Linked Data

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Linked Data Tutorial (Bizer et al.)

Tim Berners-Lee publiziert Prinzipien für Linked Data

Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web

LOD Cloud, Linking Open Data Projekt

LIBRIS, LCSH.info

HBZ, DNB, UB Mannheim, …

LoC LCSH (Offiziell)

W3C LLD XG

DINI AG KIM

3 Jahre Linked Data in Bibliotheken

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Linked Data Tutorial (Bizer et al.)

Tim Berners-Lee publiziert Prinzipien für Linked Data

Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web

LOD Cloud, Linking Open Data Projekt

LIBRIS, LCSH.info

HBZ, DNB, UB Mannheim, …

LoC LCSH (Offiziell)

W3C LLD XG

DINI AG KIM

1 Jahr Linked Data in Deutschland

Es fängt gerade erst an!

Exkurs: Referenzen zu URIs

� URI Schemes

� http://www.iana.org/assignments/uri-schemes.html

� Info URIs (info:<NID>/<NSS>)

� http://info-uri.info/registry/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc

� info:lc

− http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:lc/

� Uniform Resource Names (urn:<NID>:<NSS>)

� http://www.iana.org/assignments/urn-namespaces/

Credits und Lizenz

� Silo-Foto von Robert Linder, linder6580 (sxc.hu)

� Piratenflagge von Roger Kirby, theswedish (sxc.hu)

� Folien zu Open Data basieren auf einem Vortrag von Adrian Pohl:� http://www.slideshare.net/acka47/linked-open-data-in-der-

bibliothekswelt

� Folien zu Creative Commons basieren auf einer Vorlesung von Catharina Maracke.

� Diese Präsentation steht unter der Creative-Commons-Attribution-Share-Alike Lizenz:http://creativecommons.org/licenses/by-sa/3.0