Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

30
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik

Transcript of Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

Page 1: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

Sebastian PetersTIB-Workshop zur DOI-Registrierung

3. November 2011

DataCite Technik

Page 2: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

2

Zentrale Infrastruktur

DataCite braucht eine zentrale Infrastruktur

1. DOI-Registrierung

2. Metadatenmanagement

3. Zusätzliche Services

• Suche

• Metadatenexport

• Content Negotiation (Linked Data)

• Integration in Drittsysteme

Page 3: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

3

DOI-Registrierungs-Infrastruktur 2010Überblick

Page 4: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

4

DOI-Registrierungs-Infrastruktur 2010

• Webservice nicht standardkonform

• Nicht wartbar

• Keine zentrale Speicherung von Metadaten

• Keine Benutzerverwaltung:

• Fehlende Benutzerrechte z.B. auf Präfixlevel

• Auflistung aller DOIs pro Datenzentrum nicht möglich

• Viele verschiedene Lieferwege (Soap, Web, Ftp, Handle, E-

Mail)

Probleme

Page 5: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

5

DataCite Developer Core Group

• Developer Core Group wurde gebildet im September 2010

• Ziel: Aufbau einer zentralen Infrastruktur für DataCite

• Entwickler von BL, CDL, CISTI, TIB

• Alle Projekte sind Open Source

• Benutzung von GitHub (Quellcode, Tickets, Wiki)

https://github.com/datacite

Page 6: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

6

DataCite Services

Produktivstadium:

• Metadata Store (MDS, DOI/Metadaten-Management)

Betastadium:

• Metadaten Export (OAI)

• Suche

Alphastadium:

• Content Service(Content Negotiation)

Page 7: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

7

Metadata Store (MDS)

MDS ist DataCites zentrale Infrastruktur für DOI-Management:

• Registrieren/Aktualisieren von DOIs

• Speichern/Verwalten von Metadaten

Veröffentlichungen:

• Dezember 2010 (öffentliche Betaversion)

• 1. Juni 2011 (Version 2, Produktionsstadium)

https://mds.datacite.org

Überblick

Page 8: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

8

Metadata Store (MDS)Infrastruktur

Page 9: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

9

Auswirkungen für TIB-Datenzentren

• TIB verwendet die zentrale DataCite Infrastruktur und betreibt keine

eigene DOI-Infrastruktur mehr

• TIB bleibt erster Ansprechpartner in allen technischen Fragen

• Keine Auswirkungen für die Auflösbarkeit vorhandener DOIs

• Jedes Datenzentrum bekommt einen Account im MDS

• Migration vorhandener Metadaten

• Neuimport durch das Datenzentrum (bevorzugt)

• oder sukzessive Konvertierung durch die TIB

• Alle alternativen Registrierungsmöglichkeiten entfallen

Page 10: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

10

Metadatenhandhabung

• Wir akzeptieren nur XML

• Metadaten müssen gegen ein DataCite Schema validieren(http://schema.datacite.org)

• Metadaten werden mit einer Versionsnummer abgelegt.

• Alte Metadaten werden nicht gelöscht.

• XML wird 1:1 gespeichert (keine Transformationen)

• Automatische Konvertierung im Fall von obsoleten Schemata (sofern möglich)

Page 11: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

11

Einschränkungen und Qualitätsicherung

• Registrieren von DOIs nur in zugeteilten DOI-Präfixen

• Update nur von eigenen Datensätzen

• Liste von erlaubten Hostnamen für Landing Pages

• [ DOI-Kontingent (Quota) ]

• Metadaten müssen valide sein

• Regelmäßiges Überprüfen, ob die Landing Page existiert

Page 12: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

12

Ausprobieren

Für Testzwecke bitte unser spezielles Testpräfix nutzen:

10.5072

• Gemeinsames Präfix aller Datenzentrum

• Achtung: Ihre gewünschte DOI könnte schon vergeben sein

• „echtes“ Präfix

• Metadaten sind nicht öffentlich (keine Suche, kein OAI)

Das Testen der API ist mit einem speziellen testMode möglich.

Page 13: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

13

Schnittstellen

Browserschnittstelle

• Verwalten von DOIs und Metadaten mittels einfacher Formulare

• “Für die schnelle DOI zwischendurch…”

• Liste aller DOIs, Liste aller Metadatenversionen

• Anzeige der Accountinformationen (Kontaktdaten, Berechtigungen, …)

Programmierschnittstelle (API)

• Ideal für Registrierung vieler DOIs

• Kann einfach in bestehende Systeme integriert werden

Page 14: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

14

BrowserschnittstelleBenutzerinformation

Page 15: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

15

BrowserschnittstelleDOI registrieren

Page 16: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

16

BrowserschnittstelleAlle Datensätze anzeigen

Page 17: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

17

BrowserschnittstelleDatensatz anzeigen

Page 18: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

18

BrowserschnittstelleMetadaten hochladen

Page 19: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

19

BrowserschnittstelleMetadaten anzeigen

Page 20: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

20

Metadata Search

• Offener Service zum Durchsuchen der Metadaten des MDS

• Basiert auf Lucene Solr

• Benutzerschnittstelle und API

• Beta version available at

http://search.datacite.org

Überblick

Page 21: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

21

Metadata SearchErgebnisliste

Page 22: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

22

Metadata SearchDrilldown

Page 23: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

23

Metadata Search

• Formular für erweiterte Suche

• komplexe Lucene-Query-Syntax ebenfalls möglich, z.B.

• title:laser OR subject:laser

• publicationYear:[1990 TO 1995]

Erweiterte Suche

Page 24: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

24

Metadatenexport (OAI-PMH)

• Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH).

• Offener Service für Dritte, um die Metadaten des MDS zu harvesten

• Angebotene Metadatenformate: Dublin Core, DataCite Metadata Schema

• Sets für jeden Allocator (z.B. TIB) und jedes Datenzentrum

• Betaversion verfügbar:

http://oai.datacite.org

Page 25: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

25

Metadata Export (OAI)Beispiel

Page 26: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

26

DataCite Content Service

• Service zum Anzeigen der DOI-Metadataen

• Verschiedene Metadatenformate (BibTeX, RIS, RDF, etc.)

• Content Negotation (mittels MIME-Typ)

• Zugriff mittels DOI proxy (http://dx.doi.org)

• Zuerst umgesetzt von CNRI und CrossRef:

• Geplant:

• Weitere Metadatenformate bereitgestellt von Datenzentren

• (optionaler) Zugriff auf Rohdaten

• Alphaversion ist verfügbar:

http://data.datacite.org

Überblick

Page 27: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

27

DataCite Content ServiceBeispiel

Page 28: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

28

DOI-Registrierungs-Infrastruktur 2012

Page 29: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

29

Zukunftspläne

• Import „alter“ DOIs und Metadaten in den MDS

• Bulk-Operationen (DOI&Metadaten) im Browserinterface

• OAI-PMH zum Import in den MDS

• Formular zum Bearbeiten der Metadaten

• DOI-Auflösungsstatistik

• Linkchecker für Landing Pages

Page 30: Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik.

Vielen Dank für Ihre Aufmerksamkeit!