Resource Discovery neu definiert

24
Die multilinguale, semantische Katalogsuche der SLUB Dresden 24. Oktober 2013 Dr. Jens Mittelbach, SLUB Dresden Resource Discovery neu definiert

description

Presentation at MPDL Pubman Days 2013 SLUB Dresden and Avantgarde Labs have developed a multilingual semantic catalogue search SLUBsemantics. Taking this development a step further, they are now implementig a LOD-based data management platform for the integration, deduplication, normalization, FRBRization and semantic enrichment of library data. This provides the infrastructure for upcoming library services focused on all stages of the research process.

Transcript of Resource Discovery neu definiert

Page 1: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.de

Die multilinguale, semantische Katalogsuche der SLUB Dresden

24. Oktober 2013Dr. Jens Mittelbach, SLUB Dresden

Resource Discovery neu definiert

Page 2: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.de

Resource Discovery neu definiert

24. Oktober 2013 | Seite 2

Die multilinguale, semantische Katalogsuche der SLUB Dresden

1. Das Konzept “Resource Discovery” in Bibliotheken

2. SLUBsemantics: Ein erster Schritt zu einer neuen Form von Discovery

3. EFRE-Projekt Datenmanagement-Plattform: Ein zweiter Schritt

4. Discovery und die Rolle von Bibliotheken im Digitalen Zeitalter

Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Page 3: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

“Resource Discovery” in Bibliotheken

24. Oktober 2013 | Seite 3

Discovery als neues Paradigma

• Konzept Resource Discovery seit Anfang des Jahrzehnts: Summons, EBSCO Discovery Service, Primo …

• „One Stop Shop“-Idee, integrierte Suche und integrierter Zugang zu in getrennten Datensilos verteilten Ressourcen

• Normalisierung/Homogenisierung heterogener Daten aus unterschiedlichen Quellsystemen

• Suchmaschinentechnologie statt feldbasierte Datenbanksuche

• Normdaten aus unterschiedlichen Systemen als Strings indexiert und damit für Suche und Facettierung nutzbar

Page 4: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

“Resource Discovery” in Bibliotheken

24. Oktober 2013 | Seite 4

Herausforderungen für Discovery-Systeme

Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten

Volltextindizes und denken nicht in Metadaten

Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-

Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt

Page 5: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

“Resource Discovery” in Bibliotheken

24. Oktober 2013 | Seite 5

Herausforderungen für Discovery-Systeme

Lösung I: Benutze keine Bibliothekskataloge – oder benutze sie nur für “known item searches”

Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes

und denken nicht in Metadaten

Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-Algorithmus;

unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt

Page 6: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 6

Erster Schritt zu neuartiger Discovery

Lösung II: SLUBsemantics – Multilinguale und semantische Suche automatisch angereicherter Katalogdaten

Mögliche Abfragen:

Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes

und denken nicht in Metadaten

Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-Algorithmus;

unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt

Page 7: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 7

Wie funktioniert es?

Wikipedia: die größte Wissensbasis der Welt, die “nach dem Prinzip des kollaborativen Schreibens fortwährend gemeinschaftlich korrigiert, erweitert und aktualisiert” wird

Page 8: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 8

Phase 1: Anreicherung der Katalogdaten

• (Stapelweise) Verarbeitung bibliografischer Daten auf der Grundlage von Data- und Text-Mining-Algorithmen sowie Wikipedia-Dumps

• Katalog-Sätze werden mit Wikipedia-Konzepten durch stabile URIs aus dbpedia verbunden

• Speicherung angereicherter Indexdaten in einem Search Server

Page 9: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.de

SLUBsemantics

24. Oktober 2013 | Seite 9 Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Phase 1: Anreicherung der Katalogdaten

Page 10: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 10

Phase 2a: Retrieval-Prozess

1. Suchanfrage wird an einen lokalen vorprozessierten Wikipedia-Korpus gesendet

2. Ursprüngliche Suchanfrage wird erweitert durch IDs der für diese Anfrage als relevant eingeschätzten Wikipedia-Artikel

3. Erweiterte Suchanfrage wird gegen den in Phase 1 angereicherten Katalogindex gesendet (Metadaten & mehrsprachige Wikipedia-Konzepte)

Page 11: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 11

Phase 2b: Facetten-ErzeugungDisambiguierung des Begriffes „chicken game“ mithilfe des Facettenbaumes, der on the fly aus dem Wikipedia-Kategoriensystem generiert wird:

Page 12: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

SLUBsemantics

24. Oktober 2013 | Seite 12

Demonstration

• Search demonstrator für die British Library:http://sem.avantgarde-labs.de/

• Suche im SLUB-Katalog:http://www.slub-dresden.de:

− Multilingualität: Suche nach „steamboat paddlewheel“− Disambiguierung: Suche nach „python“− Semantik: Suche nach „gra w cykora“ (i.e. chicken game)

Page 13: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Projekt Datenmanagement-Plattform

24. Oktober 2013 | Seite 13

Zweiter Schritt zu neuartiger Discovery

• Datenmanagement-Plattform als Middleware-Lösung

• Verarbeitung sämtlicher bibliothekarischer Daten

• Existierender technologische Infrastrukturen einer Bibliothek können beibehalten werden

• Alle internen und extern relevanten Datenquellen werden in kontinuierlich laufenden Datenverarbeitungsprozess integriert

• Daten werden zusammengeführt, dedupliziert, semantisiert, FRBRisiert und normalisiert

• Bereitstellung einer Single Version of the Truth (SVOT)

• SVOT wird in einem RDF-Format im Sinne von Linked Open Data publiziert

• SVOT ist Basis für verschiedene Datenpräsentationsanwendungen der Bibliothek

Page 14: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Frontend: …

Frontend: …

Mid

dle

war

e-S

chic

ht

Projekt Datenmanagement-Plattform: Architekturkonzept

24. Oktober 2013 | Seite 14

   

 

 

 

   

App: Resource Management

Datenhaltung Ereignisgesteuerte Verarbeitung

Parallelisierte Massendatenverarbeitung

Datenintegrationstools

Zentrales Job Repository

Datenquellen (interne und externe Datenbestände)

   

    

 

Frontend: Web-Katalog

 

Page 15: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Projekt Datenmanagement-Plattform: Web-Applikation

24. Oktober 2013 | Seite 15

Zweiter Schritt zu neuartiger Discovery

Page 16: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Projekt Datenmanagement-Plattform: Agiles Entwicklen

24. Oktober 2013 | Seite 16

Zweiter Schritt zu neuartiger Discovery

Page 17: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Projekt Datenmanagement-Plattform

24. Oktober 2013 | Seite 17

Entwicklung und Finanzierung

Aus Mitteln des Europäischen Fonds für Regionale Entwicklung (EFRE) Gemeinschaftsprojekt der SLUB Dresden (Plattform Datenmanagement) und

der UB Leipzig (Frontend-Applikation Electronic Resource Management-System)

Zusammenarbeit mit Avantgarde Labs und der Research Group Agile Knowledge Engineering and Semantic Web (AKSW) (Softwareentwicklung, Marketing)

Kollaboration mit der Community Bevorzugung von quelloffenen Werkzeugen Agile Softwareentwicklung (möglichst wenig bürokratischer Aufwand, klare

Rollenverteilung, iteratives Vorgehen) Begleitendes Marketingkonzept Ausführliche Projektbeschreibung erhältlich

Page 18: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 18

The British Library

Page 19: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 19

„Knowledge is of two kinds: We know a subject ourselves, or we know where we can find information on it.“ Samuel Johnson

Das ist nicht unser Ansatz:

Page 20: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 20

Das digitale Zeitalter

• Bereitsteller von Convenient Services statt bloßem Zugang zu Ressourcen

• Beförderer von Wissenschaft und Forschung statt Wächter des Wissens

• Technological Stewards statt Skeptiker des Kulturwandels

Erwerbung

Verarbeitung

Verwertung Lebe

nsw

isse

nsch

afte

n

Nat

urw

isse

nsch

afte

n

Gei

stes

wis

sens

chaf

ten

Erzeugung, Selektion, Verarbeitung, Speicherung

Management, Wissensextraktion,

Metadaten, Ontologien

Analyse, Publikation, Portale, ARchivierung

Page 21: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 21

Semantic Resource Discovery als Service

• Überwindung traditioneller Konzepte von Discovery

• Zusammenführen von Informationen statt Reduzierung auf kleinste gemeinsame Nenner

• Big Data statt sorgfältiger Auswahl und partieller Genauigkeit bei der Behandlung von Bibliotheksdaten

• Automatische Anreicherung, Crowd sourcing und Games with a Purpose statt exklusive Sacherschließung durch Experten

• Semantisches, graph-basiertes Retrieval statt String-Suche

• Möglichkeit zur intuitiven Entdeckung und Exploration von Wissen statt Vermittlung von Suchexpertenwissen

• Wissen statt Information

Wissensexploration und neuartiges Resource Discovery als Service

Page 22: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 22

Weitere Services in Bibliotheken

• Digitalisierung und Digitalisierungs-Support (s. www.goobi.org)

• Digitale Forschung: Text-Mining-Plattformen und Virtuelle Forschungsumgebungen

• Informations-Services: Wissenschaftskartografie und Alerting Aervices

• Akademisches Community Building: Profilseiten für Wissenschaftler (FIS), Campus-Community-Plattformen, Experten-Informationssysteme

• Wissenschaftliches Schreiben und Publizieren: Bibliometrie, Publikations-Support, Open Access (s. Wissensbar der SLUB Dresden)

• Konzept der “blended library”, die physische und digitale Dienstleistungen wieder integriert (s. Gebäudeinformationssystem der SLUB und mapongo)

Die Perspektive:Digitale Services in einer digitalen Kultur für eine digitale Community

Page 23: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information

Discovery und die neue Rolle von Bibliotheken

24. Oktober 2013 | Seite 23

Weitere Services in Bibliotheken

Page 24: Resource Discovery neu definiert

Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden

slub-dresden.de

Danke für Ihre Aufmerksamkeit!

24.10.2013Dr. Jens Mittelbach, SLUB Dresden

Resource Discovery neu definiert