Post on 06-Apr-2016
Matthias Schulze Bernhard Tempel
RusDMLEin digitales Archiv russischer mathematischer Zeitschriften
DMV-Jahrestagung 2006Minisymposium 29 – Information, Kommunikation
und Bibliotheken für die Mathematik
Matthias Schulze Bernhard Tempel
Gliederung
• Die Idee von RusDML– Relevanz der russischen mathematischen Zeitschriften– Lizenzen– Inhaltliche Erschließung
• Die Umsetzung von RusDML – RusDML-Application Profile– RusDML-Workflow– RusDML-Tool– Transliteration– RusDML-Archiv– Zugänge zum RusDML-Archiv
• Fazit
Matthias Schulze Bernhard Tempel
RusDML – Die Idee
• Relevanz der russischen Mathematik (Indiz: Übersetzungszeitschriften)
• Aufbau eines digitalen Archivs bedeutender russischer Mathematikzeitschriften
• Vorbereitung des russischen Teils der World Digital Mathematics Library (WDML)
• Erschließung durch Metadaten aus dem Zentralblatt MATH
• Zusätzlich Verbesserung der Metadaten des Zentralblatt MATH und Verlinkung auf Artikel in RusDML
Matthias Schulze Bernhard Tempel
Ein russisch-deutsches Projekt
• Partner:– TU Berlin (Projektleitung)– SUB Göttingen– TIB Hannover– GPNTB Moskau
• Förderung durch DFG (09/2004-07/2007) und RFBR• Partner außerhalb der Projektförderung:
– Russische Akademie der Wissenschaften, Moskau– Steklov Institut für Mathematik, Moskau
RusDML im Internet: www.rusdml.de
Matthias Schulze Bernhard Tempel
Lizenzen (1)
• Ursprüngliche Planung:– Digitalisierung aller mathematischer Publikationen aus
Russland und Staaten früheren Sowjetunion– Kernarchiv mit ca. 70 Zeitschriften– Später Erweiterung auf Monographien, Sammelwerke und
bei VINITI deponierte Artikel • Aktueller Stand:
– Lizenzen für 10 Zeitschriften, darunter:• Algebra i logika (1962-2004)• Sibirskij matematiceskij zurnal (1960-1999)• Matematiceskij sbornik (1866-1992)
– Das Steklov Institut hat Lizenzen für Matematiceskie zametki und Trudy matematiceskogo instituta steklova
Matthias Schulze Bernhard Tempel
Lizenzen (2)
• Gegenstand der Lizenzvereinbarung (Beispiel Sibirskij matematiceskij zurnal):– Digitalisierung und elektronische Wiederveröffentlichung
(freier Zugang über das RusDML-Archiv)– Lizenzgeber erhält eine voll funktionsfähige Kopie der
digitalisierten Version seiner Zeitschrift zur eigenen Verwendung (Integration in das Archiv der bereits elektronisch erzeugten neueren Jahrgänge)
– Lizenzgeber erhält das Recht, die digitalisierte Fassung z.B. auf CD-ROM zum Verkauf anzubieten (der freie Zugang über das RusDML-Archiv bleibt davon unberührt)
Matthias Schulze Bernhard Tempel
Lizenzen (3)
• Einwerbung weiterer Lizenzen schwierig:– Verlage/Herausgeber wollen jetzt doch selbst digitalisieren– Rechte für freien Zugriff würden kostenpflichtige
Vermarktung behindern • Konsequenz für RusDML:
– Technische Infrastruktur für Import extern erstellter Digitalisate gewinnt an Bedeutung
Matthias Schulze Bernhard Tempel
Inhaltliche Erschließung
• Erfolgt nicht im Rahmen des Projekts, sondern durch– Übernahme der Klassifikation nach MSC vom Zentralblatt
MATH– Eintragung der Notationen nach UDK (Universale Dezimal-
Klassifikation) in die Metadaten (durch GPNTB)– Übertragung vorhandener englischer oder russischer
Schlagwörter• Durch Verlinkung auf den Eintrag im Zentralblatt MATH
ist ggf. auch das Abstract verfügbar
Matthias Schulze Bernhard Tempel
RusDML – Die Umsetzung
• RusDML-Application Profile• RusDML-Workflow• RusDML-Tool• Transliteration• RusDML-Archiv• Zugänge zum RusDML-Archiv
Matthias Schulze Bernhard Tempel
RusDML-Application Profile (1)
• Application Profile (AP): Dokumentation / Definition des für eine lokale Anwendung benötigten Sets an Metadatenelementen
• Verständigung unter den RusDML-Projektpartnern auf ein Kernset von Metadatenelementen = RusDML AP
• Kategorien der RusDML-Metadatenelemente sind:– Identifier: Article– Journal (identifier, journal title, publisher ...)– Volume– Issue– Article: Structure (author, pages ...)– Article: Content (article title, abstract, classifications ...)
Matthias Schulze Bernhard Tempel
RusDML-Application Profile (2)
Matthias Schulze Bernhard Tempel
RusDML-Application Profile (3)
Die aktuelle Version des RusDML-AP ist online abrufbar:http://arbeit.hilses.de/rusdml/
Matthias Schulze Bernhard Tempel
RusDML-Workflow (1): Allgemeine Übersicht
Lizenz: Einwerben und Verwalten (1)
Projektleitung/-partner
Bestandsaufnahmegedruckte Version (2)
SUB
ZDB-Aufnahme (3)
SUB
Bibl. Aufnahme in lokalen OPAC (4)
SUB
Normierung der Zeitschriftentitel (5)
TIB/UB
Anlegen eines Prozesses im Workflowtool, für je-den Band (6)
SUB
TIFF-Header erstellen(7)
SUBScannen der Images (8)
SUB / GDZ
Qualitätskontrolle (9)
SUB / GDZImagenachbearbeitung(10)
SUB / GDZ
Imaging
Vollständigkeitsprü-fung Artikelebene (11)
TUBAufbereitung / Import Zentralblattdaten (12)
TUBPrüfung / Korrekturbibliogr. Daten (13)
TUB
Import kyrillischeMetadaten (14)
GPNTB
Endkontrolle einesBandes (18)
TIB/UB
MetadatenTransliterieren (15)
TIB/UBErfassung der Strukturdaten (16)
SUB
Korrektur des Zen-tralblattimports (17)
TUBGenerierung der SICI (für Artikel) (19)
SUB
Metadatenproduktion
Datenexport in METSmit Images (20)
SUBImport in lokale Re-positories/DMS (21)
EigenleistungRückmeldung der PURLs (22)
SUB + TUB + TIB/UBImport in Repositories
Application Profileerstellen
Projektpartner
Workflowverwaltung programmieren
SUB
Importfilter für Importformate
SUB
Erfassungtools für Metadaten
SUB
Exportschnittstellen
SUB
PURL-Generierung
SUB
Imagehandlingim Workflow
SUB
Pflege der Erfassungstools
SUB
Administration
Ablaufplan des kooperativen Workflows im Projekt RusDML (in Klammern die Nummer des Arbeitsschrittes)
Produktion Entwicklung
1
Matthias Schulze Bernhard Tempel
Der kooperative Der kooperative RusDML-WorkflowRusDML-Workflow
SUB Göttingen
• Tool-Entwicklung
• Scannen (GDZ)
• Erstellung der Strukturmetadaten
• Online-Präsentation (Suchmaschine)
TU Berlin (Zentralblatt)
• Projektmanagement
• Erstellung der bibliographischen Metadaten (Zentralblatt MATH)
TIB/UB Hannover
• Metadaten-Bearbeitung
• Transliteration
GPNTB Moskau
• Erstellung der russischen (kyrillischen) Metadaten
Matthias Schulze Bernhard Tempel
RusDML-Workflow (3): Arbeitsschritte 1-10
I) Vorbereitende Tätigkeiten (verschiedene Partner)1) Lizenzeinwerbung (TU Berlin, GPNTB Moskau)2) Bestandsaufnahme der gedruckten Version (jeweiliger Standort,
Koordination SUB Göttingen, GPNTB)3) ZDB-Aufnahme (TIB Hannover)4) Bibliothekarische Aufnahme für den lokalen OPAC (SUB, GPNTB)5) Normierung der Zeitschriftentitel (TIB)
II) Anlegen eines Prozesses und Digitalisierung (SUB)6) Anlegen eines Prozesses auf Bandebene7) TIFF-Header erstellen8) Scannen der Images9) Qualitätskontrolle10) Imagenachbearbeitung
Matthias Schulze Bernhard Tempel
RusDML-Workflow (4): Arbeitsschritte 11-22
III) Import von Metadaten in das Tool (TUB und GPNTB)11) Prüfung der Vollständigkeit auf Artikelebene der Zentralblattdaten (TUB)12) Import / Lieferung der Zentralblattdaten (TUB)13) Prüfung und Korrektur der bibliographischen Daten im Tool (TUB)14) Import / Lieferung der russischen Metadaten (GPNTB)IV) Metadatenbearbeitung und -ergänzung (SUB, TIB, TUB)15) Metadaten transliterieren (TIB)16) Erfassung der Strukturmetadaten (SUB)17) Korrektur des Zentralblattimports (TUB)18) Bandweise Endkontrolle und Freigabe aller Metadaten (TIB)V) Abschluss und Onlinestellung (SUB, bzw. lokal alle Partner)19) Automatische Generierung der SICI (SUB)20) Export der Daten in XML/METS-Format inklusive der Images (SUB)21) Import in die lokalen DMS bzw. Repositories (GPNTB, SUB, TIB)22) Rückmeldung der neu hinzugekommenen PURLs
Matthias Schulze Bernhard Tempel
RusDML-Tool (1)
• Organisation des komplexen Workflows mit Hilfe des im Rahmen des Projektes entwickelten Softwarepakets (RusDML-Tool)
• Im Folgenden eine kurze Skizze des Tools– Anforderungen an das Softwarepaket und– Aufgaben, die mit Hilfe des Tools erledigt werden
Matthias Schulze Bernhard Tempel
RusDML-Tool (2): Anforderungen
• Plattform-Unabhängigkeit, da Partner weltweit auf das Tool zugreifen müssen
• Einsatz von Java-Technologie stellt die Plattformunabhängigkeit sicher und auch, dass mittels der Unicode-Kodierung sowohl west- als auch osteuropäische Zeichensätze (inklusive Kyrillisch) innerhalb des Tools Verwendung finden können
• Zentrale Metadatenverwaltung, d.h. Katalogisieren und Vervollständigung der Metadaten von verschiedenen Standorten aus (z.B. Erstellung der russischen Metadaten in Moskau, Transliterationen in Hannover)
Matthias Schulze Bernhard Tempel
RusDML-Tool (3): Aufgaben
• Zentrale Verwaltung der Digitalisate (Images)• Import- und Exportschnittstellen für Metadaten (z.B.
aus dem Zentralblatt MATH) und für den Import externer Digitalisate
• Controlling-Mechanismen: welcher Partner ist wie weit mit seinen Arbeiten, welche Zeitschrift ist in welchem Bearbeitungsstadium etc.
• Integration von Komponenten eines verteilten Workflowmanagements zur Gewährleistung der Verwaltung einer verteilten Produktion und zur Kommunikation zwischen den Partnern: Ablauf der Prozeßschritte, Abbildung von Korrekturschleifen
Matthias Schulze Bernhard Tempel
RusDML-Tool (4): Aufgaben
• Komfortable Erfassung und Bearbeitung der Informationen zu den einzelnen Werken: allgemeine Metadaten, hierarchische Strukturdaten der Bände (Jahrgang, Hefte, Artikel) sowie das Matching von logischen (aufgedruckten) und physikalischen (tatsächlichen) Seitenzahlen.
• Metadatenimport aus unterschiedlichen Quellen auf der Basis des Dateiformates XML z.B. aus dem „Zentralblatt MATH“ sowie dem „Jahrbuch über die Fortschritte der Mathematik (JFM)“
• Abspeicherung der erfassten bzw. bearbeiteten Daten - im Hinblick auf eine optimale Archivierbarkeit - im Metadata Encoding and Transmission Standard (METS)-Format (standardisierte Exportmöglichkeiten sind zudem die Formate PICA und UNIMARC)
Matthias Schulze Bernhard Tempel
RusDML-Tool (5)
Der Workflow abgebildet im Tool: Die 22 Arbeitsschritte
Matthias Schulze Bernhard Tempel
RusDML-Tool (6): Weiterentwicklung
• Zusammenführung der Entwicklungen im Bereich “Digitale Bibliothek” zu einer modularen Software-Suite
• Nachnutzung aus folgenden DFG-Projekten:– RusDML (Workflowtool, Metadatentool)– Rise of modern Constitutionalism (Access-Tool,
Benutzerstatistik-Tool, Volltextsuche)– DigiZeitschriften (Typo3-Integration)– zvdd (Schnittstellen zum GBV)
• Sowie– kopal (Langzeitarchivierung- BMBF)– ProPrint (Print on Demand - BMBF)– DigiWunschbuch (Digitization on Demand – SUB)
Matthias Schulze Bernhard Tempel
TOOLS SERVICESCORE ARCHITECTURE
PRO
DU
CTIO
NU
SAG
E
Goobi.METAMETS-EDITOR / LOGICAL-STRUCTURE / OCR
Goobi.COUNTERPROJECTCOUNTER.ORG / LOGGING / SFX
Goobi.ACCESSIP-RANGES / USER-MANAGEMENT / SHIBBOLETH
Goobi.SEARCHBROWSING / FULLTEXT / HIGHLIGHTING
Goobi.FLOWWORKGROUP-MANAGEMENT / CONTROLLING
Goobi.VISUALTYPO3 / PDF / CSS / ACCESSIBILITY
Goobi.ARCHIVEMETS / TEI / XML
Göttingen online-objects binaries
Goobi.PRESERVATIONKOPAL / EROMM / EDL
Goobi.PRINTPROPRINT / PRINT ON DEMAND
Goobi.COLLABORATEWEB 2.0 / WIKIPEDIA / DIGITAZATION ON DEMAND
Goobi.PRODUCERSCANNING / IMPORT / WEBDAV
Matthias Schulze Bernhard Tempel
RusDML-Tool (8): Perspektiven
• Zielsetzung: eine nutzerfreundliche und alltagstaugliche Softwareumgebung für wesentliche Bereiche der (Massen-)Digitalisierung und der „Digitalen Bibliothek“– Automatische Importmöglichkeit in die European Digital
Library (EDL, TEL)– Zertifizierungsmöglichkeiten des Workflows der
Digitalisierung und der digitalen Objekte (Qualität der Scans, der Metadaten etc.)
– Open Source (Möglichkeit, eine verteilte Entwickler-community aufzubauen)
• Derzeitiger Einsatz der Module:– Johannes a Lasco Bibliothek Emden– Universitätsbibliothek Mannheim– Sächsische Landesbibliothek - Staats- und
Universitätsbibliothek (SLUB) Dresden
Matthias Schulze Bernhard Tempel
Transliteration (1)
• Aufgabe des Partners TIB• Im Original in kyrillischer Schrift vorliegende Titel werden
transliteriert (Zuordnung Buchstabe zu Buchstabe)• Im Zentralblatt MATH wurde immer auch transliteriert,
aber nach wechselnden Transliterationstabellen• Für RusDML Ergänzung durch Transliteration nach DIN
1460 und ISO 9, so dass im RusDML-Archiv über bis zu drei verschiedene Transliterationsvarianten gesucht werden kann
Matthias Schulze Bernhard Tempel
Transliteration (2)
• Verfahren:– anfangs manuell– später mit Transliterationstool als Standalone-Anwendung:
Matthias Schulze Bernhard Tempel
Transliteration (3)
– Inzwischen Integration in das RusDML-Tool; für entsprechende Felder Transliteration auf Knopfdruck:
Matthias Schulze Bernhard Tempel
Transliteration (4)
• Warum keine vollautomatische Transliteration?– Teil der Qualitätskontrolle für die erstmals erfassten
kyrillischen Metadaten• Warum nicht Transliteration erst bei Suche im RusDML-
Archiv?– Transliteration kyrillischer Schrift ist keine bijektive
Abbildung– Indexierung der bereits transliterierten Daten beschleunigt
Suche
Matthias Schulze Bernhard Tempel
RusDML-Archiv
• Prototyp beim GDZ: http://demo.rusdml.de– Einfache Suche (auch nach Klassifikation möglich)– Erweiterte Suche– Browsing– Volltextsuche (OCR-generiert)
Matthias Schulze Bernhard Tempel
Zugänge zum RusDML-Archiv
• Jeder Projektpartner und Lizenzgeber erhält eine Kopie des RusDML-Archivs und kann eine eigene Suche implementieren.
• Geplant: Die in RusDML verbesserten Metadaten werden ins Zentralblatt MATH zurückgeliefert und aus dem Zentralblatt MATH für jeden Artikel auf das RusDML-Archiv verlinkt. Somit kann für die fachlich anspruchsvollste Suche weiterhin das Zentralblatt MATH genutzt werden.
Matthias Schulze Bernhard Tempel
Kritisches Fazit (1)
• Quantitativ bleibt RusDML im Förderzeitraum hinter den gesteckten Zielen zurück:– Geplant 1,5 Mio. Seiten zu digitalisierende Seiten, je
750.000 durch die deutschen Partner und den russischen Partner
– Lizenzen liegen momentan vor für ca. 283.000 Seiten– Problematik der Einwerbung von Lizenzen– Digitalisierung nur durch den deutschen Partner SUB
Göttingen – GPNTB erhält von RFBR erheblich geringere Förderung als
erwartet und beteiligt sich nur an Anreicherung der Metadaten
Matthias Schulze Bernhard Tempel
Kritisches Fazit (2)
• Qualitativ erreicht RusDML die gesteckten Ziele:– Kooperative, dezentrale Anreicherung von Metadaten durch
alle Partner– Die im Projekt entwickelte technische Infrastruktur zu
Workflowverwaltung und verteilter Metadatenbearbeitung (RusDML-Tool) wird für weitere Digitalisierungsprojekte nachgenutzt.
– Die Ergebnisse aus dem Projekt RusDML werden als Teil der WDML und des europäischen Kulturerbes Bestand haben.
• Abschied vom Ideal des weltweit freien Zugangs zu sämtlicher mathematischer Literatur im Rahmen der WDML? Inzwischen wird auch das kostenpflichtige JSTOR auf der Internetpräsentation der WDML aufgeführt: http://www.ceic.math.ca/WDML/dml/index.shtml
Matthias Schulze Bernhard Tempel
Vielen Dank für Ihre Aufmerksamkeit!
Haben Sie Fragen, Anmerkungen ...?
http://www.rusdml.de/
Matthias Schulzeschulze@sub.uni-goettingen.de
Bernhard TempelBernhard.Tempel@tib.uni-hannover.de