Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

Post on 05-Apr-2015

105 views 0 download

Transcript of Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

Sebastian PetersTIB-Workshop zur DOI-Registrierung

3. November 2011

DataCite Technik

2

Zentrale Infrastruktur

DataCite braucht eine zentrale Infrastruktur

1. DOI-Registrierung

2. Metadatenmanagement

3. Zusätzliche Services

• Suche

• Metadatenexport

• Content Negotiation (Linked Data)

• Integration in Drittsysteme

3

DOI-Registrierungs-Infrastruktur 2010Überblick

4

DOI-Registrierungs-Infrastruktur 2010

• Webservice nicht standardkonform

• Nicht wartbar

• Keine zentrale Speicherung von Metadaten

• Keine Benutzerverwaltung:

• Fehlende Benutzerrechte z.B. auf Präfixlevel

• Auflistung aller DOIs pro Datenzentrum nicht möglich

• Viele verschiedene Lieferwege (Soap, Web, Ftp, Handle, E-

Mail)

Probleme

5

DataCite Developer Core Group

• Developer Core Group wurde gebildet im September 2010

• Ziel: Aufbau einer zentralen Infrastruktur für DataCite

• Entwickler von BL, CDL, CISTI, TIB

• Alle Projekte sind Open Source

• Benutzung von GitHub (Quellcode, Tickets, Wiki)

https://github.com/datacite

6

DataCite Services

Produktivstadium:

• Metadata Store (MDS, DOI/Metadaten-Management)

Betastadium:

• Metadaten Export (OAI)

• Suche

Alphastadium:

• Content Service(Content Negotiation)

7

Metadata Store (MDS)

MDS ist DataCites zentrale Infrastruktur für DOI-Management:

• Registrieren/Aktualisieren von DOIs

• Speichern/Verwalten von Metadaten

Veröffentlichungen:

• Dezember 2010 (öffentliche Betaversion)

• 1. Juni 2011 (Version 2, Produktionsstadium)

https://mds.datacite.org

Überblick

8

Metadata Store (MDS)Infrastruktur

9

Auswirkungen für TIB-Datenzentren

• TIB verwendet die zentrale DataCite Infrastruktur und betreibt keine

eigene DOI-Infrastruktur mehr

• TIB bleibt erster Ansprechpartner in allen technischen Fragen

• Keine Auswirkungen für die Auflösbarkeit vorhandener DOIs

• Jedes Datenzentrum bekommt einen Account im MDS

• Migration vorhandener Metadaten

• Neuimport durch das Datenzentrum (bevorzugt)

• oder sukzessive Konvertierung durch die TIB

• Alle alternativen Registrierungsmöglichkeiten entfallen

10

Metadatenhandhabung

• Wir akzeptieren nur XML

• Metadaten müssen gegen ein DataCite Schema validieren(http://schema.datacite.org)

• Metadaten werden mit einer Versionsnummer abgelegt.

• Alte Metadaten werden nicht gelöscht.

• XML wird 1:1 gespeichert (keine Transformationen)

• Automatische Konvertierung im Fall von obsoleten Schemata (sofern möglich)

11

Einschränkungen und Qualitätsicherung

• Registrieren von DOIs nur in zugeteilten DOI-Präfixen

• Update nur von eigenen Datensätzen

• Liste von erlaubten Hostnamen für Landing Pages

• [ DOI-Kontingent (Quota) ]

• Metadaten müssen valide sein

• Regelmäßiges Überprüfen, ob die Landing Page existiert

12

Ausprobieren

Für Testzwecke bitte unser spezielles Testpräfix nutzen:

10.5072

• Gemeinsames Präfix aller Datenzentrum

• Achtung: Ihre gewünschte DOI könnte schon vergeben sein

• „echtes“ Präfix

• Metadaten sind nicht öffentlich (keine Suche, kein OAI)

Das Testen der API ist mit einem speziellen testMode möglich.

13

Schnittstellen

Browserschnittstelle

• Verwalten von DOIs und Metadaten mittels einfacher Formulare

• “Für die schnelle DOI zwischendurch…”

• Liste aller DOIs, Liste aller Metadatenversionen

• Anzeige der Accountinformationen (Kontaktdaten, Berechtigungen, …)

Programmierschnittstelle (API)

• Ideal für Registrierung vieler DOIs

• Kann einfach in bestehende Systeme integriert werden

14

BrowserschnittstelleBenutzerinformation

15

BrowserschnittstelleDOI registrieren

16

BrowserschnittstelleAlle Datensätze anzeigen

17

BrowserschnittstelleDatensatz anzeigen

18

BrowserschnittstelleMetadaten hochladen

19

BrowserschnittstelleMetadaten anzeigen

20

Metadata Search

• Offener Service zum Durchsuchen der Metadaten des MDS

• Basiert auf Lucene Solr

• Benutzerschnittstelle und API

• Beta version available at

http://search.datacite.org

Überblick

21

Metadata SearchErgebnisliste

22

Metadata SearchDrilldown

23

Metadata Search

• Formular für erweiterte Suche

• komplexe Lucene-Query-Syntax ebenfalls möglich, z.B.

• title:laser OR subject:laser

• publicationYear:[1990 TO 1995]

Erweiterte Suche

24

Metadatenexport (OAI-PMH)

• Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH).

• Offener Service für Dritte, um die Metadaten des MDS zu harvesten

• Angebotene Metadatenformate: Dublin Core, DataCite Metadata Schema

• Sets für jeden Allocator (z.B. TIB) und jedes Datenzentrum

• Betaversion verfügbar:

http://oai.datacite.org

25

Metadata Export (OAI)Beispiel

26

DataCite Content Service

• Service zum Anzeigen der DOI-Metadataen

• Verschiedene Metadatenformate (BibTeX, RIS, RDF, etc.)

• Content Negotation (mittels MIME-Typ)

• Zugriff mittels DOI proxy (http://dx.doi.org)

• Zuerst umgesetzt von CNRI und CrossRef:

• Geplant:

• Weitere Metadatenformate bereitgestellt von Datenzentren

• (optionaler) Zugriff auf Rohdaten

• Alphaversion ist verfügbar:

http://data.datacite.org

Überblick

27

DataCite Content ServiceBeispiel

28

DOI-Registrierungs-Infrastruktur 2012

29

Zukunftspläne

• Import „alter“ DOIs und Metadaten in den MDS

• Bulk-Operationen (DOI&Metadaten) im Browserinterface

• OAI-PMH zum Import in den MDS

• Formular zum Bearbeiten der Metadaten

• DOI-Auflösungsstatistik

• Linkchecker für Landing Pages

Vielen Dank für Ihre Aufmerksamkeit!