Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Post on 05-Apr-2015

110 views 4 download

Transcript of Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library .

Praxis derMetadatenerfassung

Markus EndersGoettingen State and University Library

www.sub.uni-goettingen.de/GDZ

Meta- und Strukturdaten

Retrieval

Anzeige

Navigation

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis:

im PDF

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web:

Meta- und Strukturdaten

Elektronisches Inhaltsverzeichnis im Web:

Links zuden Seiten

Datenformat

RDF/XML

Logische Strukturen

pro Seite nur ein Image

eine Start- / Endseite pro log. Struktureinheit

Optional: Volltext

Datenformat

RDF/XML

Logische Strukturen

pro Seite nur ein Image

eine Start- / Endseite pro log. Struktureinheit

Zukünftig METS:

technische Metadaten

Physische Struktur

Derivate von Images

Meta- und Strukturdaten

Metadatenerfassung

Aufnahme in den Katalog

Anschliessend detailliertere Erfassung

Identifier wird während des Workflows zur eindeutigen Benennung von Ordnern / Dateien genutzt.

Meta- und Strukturdaten

Erfassung vor dem Scannen

Anhand des gedruckten Buches

Erfassung in ein Excel_Sheet

Konvertierung in RDF/XML-Datei

Meta- und Strukturdaten

Logische Seitennummern

Aufgedruckt Paginierung;

Physische Seitennummern

Paginierungssequenzen:

Eindeutige Benennung der Seiten

Meta- und StrukturdatenPaginierungssequenzen:

Spalten A and C:

Gezählte Start/Endseiten logische Seitennummern

Spalten D and E:

Ungezählte Start- und Endseiten

Spalten M and N:

Physische Seitennummer (errechnet)

Meta- und StrukturdatenStrukturdaten:

Spalte B:

Typ d. Strukturelements

Spalten C und D:

Startseite des Strukturelements

Spalten H und I:

Autor und Titel des Strukturelements

Meta- und StrukturdatenStrukturdaten:

Metadata:

TitleAuthor

Erfassen der Metadaten

Meta- und StrukturdatenStrukturdaten:

Metadata:

TitleAuthor

Erfassen der Metadaten (Autor und Titelinformation)

Meta- und StrukturdatenStrukturdaten:

Metadata:

Erfassen der Metadaten (Autor und Titelinformation)

OCR der Inhaltsverzeichnisse

Funktioniert nicht bei schlechter Druckqualität oder Frakturschrift

Meta- und StrukturdatenMetadatenübernahme

Katalogmetadaten

Übernahme der Metadaten aus dem OPAC

Download mit WiniBW

Java-Programm zum mergen der Katalogdaten mit den XML-Daten

Meta- und Strukturdaten

Erfassung nach dem Scannen

Images werden zur Metadatenerfassung genutzt

AGORA XML-Editor

Keine Konvertierung notwendig

Meta- und StrukturdatenAGORAEditor

Meta- und StrukturdatendocWorks

Software des METAe-projekts

derzeit im Testeinsatz

automatische Generierung der Struktur- und Metadaten...

Volltext

Im TEI/XML Format (mit Wortkoordinaten möglich)

Manuelle Erfassung (Dienstleister)

Automatische Generierung mit AGORA Konverter (unkorrigierter OCR-Text)

mit docWorks (während Meta- und Strukturdatenerfassung; derzeit noch kein TEI/XML)

Management

Dokumentenmanagement System

Ein System für alle Projekte

Erweiterung/Updates stehen für alle Projekte zur Verfügung

Einfache Pflege und Administration

Import

Batch-Import der Meta- und Strukturdaten mit den Images

Volltexte (TEI/XML) können separat importiert werden

Dokumenten-Management

AGORA

Java-Servlet

Meta-, Strukturdaten und Volltexte in relationaler Datenbank

Imagedaten im Dateisystem

Verity-Engine zur Volltextindexierung

Kooperation mit „Satz-Rechen-Zentrum“

Dokumenten-ManagementAdministration

Dokumenten-ManagementAdministration

Derzeit Windows basiert

Web-basierte Administrationsoberfläche in Entwicklung

Dokumenten-ManagementWeb-Präsentation

WebMacro Templates

Auch XML-Ausgabe realisierbar

Cache-Verwaltung (von HTML-Seiten)

Als JAVA-Servlet realisiert

Dokumenten-ManagementWeb-Präsentation

http://gdz.sub.uni-goettingen.de