Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

27
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library www.sub.uni-goettingen.de/GDZ

Transcript of Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Page 1: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Praxis derMetadatenerfassung

Markus EndersGoettingen State and University Library

www.sub.uni-goettingen.de/GDZ

Page 2: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Retrieval

Anzeige

Navigation

Page 3: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis:

im PDF

Page 4: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web:

Page 5: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web:

Links zuden Seiten

Page 6: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Datenformat

RDF/XML

Logische Strukturen

pro Seite nur ein Image

eine Start- / Endseite pro log. Struktureinheit

Optional: Volltext

Page 7: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Datenformat

RDF/XML

Logische Strukturen

pro Seite nur ein Image

eine Start- / Endseite pro log. Struktureinheit

Zukünftig METS:

technische Metadaten

Physische Struktur

Derivate von Images

Page 8: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Metadatenerfassung

Aufnahme in den Katalog

Anschliessend detailliertere Erfassung

Identifier wird während des Workflows zur eindeutigen Benennung von Ordnern / Dateien genutzt.

Page 9: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Erfassung vor dem Scannen

Anhand des gedruckten Buches

Erfassung in ein Excel_Sheet

Konvertierung in RDF/XML-Datei

Page 10: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Logische Seitennummern

Aufgedruckt Paginierung;

Physische Seitennummern

Paginierungssequenzen:

Eindeutige Benennung der Seiten

Page 11: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenPaginierungssequenzen:

Spalten A and C:

Gezählte Start/Endseiten logische Seitennummern

Spalten D and E:

Ungezählte Start- und Endseiten

Spalten M and N:

Physische Seitennummer (errechnet)

Page 12: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenStrukturdaten:

Spalte B:

Typ d. Strukturelements

Spalten C und D:

Startseite des Strukturelements

Spalten H und I:

Autor und Titel des Strukturelements

Page 13: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenStrukturdaten:

Metadata:

TitleAuthor

Erfassen der Metadaten

Page 14: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenStrukturdaten:

Metadata:

TitleAuthor

Erfassen der Metadaten (Autor und Titelinformation)

Page 15: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenStrukturdaten:

Metadata:

Erfassen der Metadaten (Autor und Titelinformation)

OCR der Inhaltsverzeichnisse

Funktioniert nicht bei schlechter Druckqualität oder Frakturschrift

Page 16: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenMetadatenübernahme

Katalogmetadaten

Übernahme der Metadaten aus dem OPAC

Download mit WiniBW

Java-Programm zum mergen der Katalogdaten mit den XML-Daten

Page 17: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und Strukturdaten

Erfassung nach dem Scannen

Images werden zur Metadatenerfassung genutzt

AGORA XML-Editor

Keine Konvertierung notwendig

Page 18: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatenAGORAEditor

Page 19: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Meta- und StrukturdatendocWorks

Software des METAe-projekts

derzeit im Testeinsatz

automatische Generierung der Struktur- und Metadaten...

Page 20: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Volltext

Im TEI/XML Format (mit Wortkoordinaten möglich)

Manuelle Erfassung (Dienstleister)

Automatische Generierung mit AGORA Konverter (unkorrigierter OCR-Text)

mit docWorks (während Meta- und Strukturdatenerfassung; derzeit noch kein TEI/XML)

Page 21: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Management

Dokumentenmanagement System

Ein System für alle Projekte

Erweiterung/Updates stehen für alle Projekte zur Verfügung

Einfache Pflege und Administration

Import

Batch-Import der Meta- und Strukturdaten mit den Images

Volltexte (TEI/XML) können separat importiert werden

Page 22: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Dokumenten-Management

AGORA

Java-Servlet

Meta-, Strukturdaten und Volltexte in relationaler Datenbank

Imagedaten im Dateisystem

Verity-Engine zur Volltextindexierung

Kooperation mit „Satz-Rechen-Zentrum“

Page 23: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Dokumenten-ManagementAdministration

Page 24: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Dokumenten-ManagementAdministration

Derzeit Windows basiert

Web-basierte Administrationsoberfläche in Entwicklung

Page 25: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Dokumenten-ManagementWeb-Präsentation

WebMacro Templates

Auch XML-Ausgabe realisierbar

Cache-Verwaltung (von HTML-Seiten)

Als JAVA-Servlet realisiert

Page 26: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Dokumenten-ManagementWeb-Präsentation

Page 27: Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

http://gdz.sub.uni-goettingen.de