OA-Netzwerk – Semantische Anreicherung und Vernetzung von wissenschaftlichen OA-Inhalten

Post on 26-Jun-2015

354 views 6 download

Transcript of OA-Netzwerk – Semantische Anreicherung und Vernetzung von wissenschaftlichen OA-Inhalten

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

OA-Netzwerk - semantische Anreicherung undVernetzung von wissenschaftlichen OA-Inhalten

Initiiert durch Gefördert durch

Projektpartner

Ziele

Förderung der Sichtbarkeit deutscher Repositorieninhalte (textbasierte)

Nationaler Aggregationsknoten (Infrastrukturaufbau)

Förderung des „DINI-Zertifikat für Dokumenten- und Publikationsservices“

Stärkung des Kooperationsnetzes aus OA-Projekten

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Herausforderungen

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Steigerung der Anzahl DINI-zertifizierter Repositorien

Heterogenität der Metadaten (teilweise trotz DINI-Zertifikats)

Trainingsdaten für DDC-Klassifikation

flaches Metadatenformat Dublin Core

Aktueller Schwerpunkt

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

semantische Anreicherung der Metadaten

Vernetzung mit externen Datenquellen im Sinne des Linked Data

Aggregation von Enhanced Publications

Beispiel: Vernetzung mit der DNB ohne Personenidentifikator

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

1. Erzeugung eines RDF-Dumps mithilfe des D2R-Servers

2. Verwendung des DNB RDF-Dumps als externe Datenquelle

3. Einsatz des Kontextualisierungstools „SILK“

4. Nutzung des Vor- und Nachnamens als Matching-Kriterium

→ Erzeugung von 80.000 owl:sameAs Links von OAN zur DNB

Beispiel: Vernetzung mit der DNB ohne Personenidentifikator

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Ergebnis: Personennamen-Matching nicht ausreichend

5. zusätzliches Titeldaten-Matching (2nd Level Comparison)

→ knapp 18.000 verifizierte Links jedoch auch jetzt keine 100% Bestätigung

Optional: weitere Felder in die Verifizierung einbeziehen

Ergebnisse

Ausführliche Informationen und Ratgeber für angehende Repositorienbetreiber

Infrastruktur für Aggregationsknoten (Open Source)

Mehrwertdienste für Wissenschaftler (Rechercheplattform)

Mehrwertdienste für OA-Institutionen (Validator)

Offener Datenpool für Entwickler/OA-Projekte (REST-API, LOD)

Technische Dienste für spezifische Problemfelder (Metadatenanreicherung, Metadatengenerierung, semantische Vernetzung)

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Zahlen, bitte!

OAN-Datenraum

41 DINI-zertifizierte Repositorien

268.000 Datensätze

Volltextsuche über 160.000 OA-Publikationen

~ 35% des nationalen Datenraums (OAI-PMH) (basierend auf „2012 Census of Open Access Repositories in Germany“)

voraussichtliche Verdopplung des Datenraums bis zum Jahresende

Ausblick

Ausweitung des Datenraums

Sammeln von Kontextdaten zu Compound Objects

Identifikatoren für Autoren

Anbindung an höhere Datenquellen (Europeana, DDB, Bibliotheksverbünde)

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Vielen Dank für die Aufmerksamkeit!

WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David