Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung...

21
Datenmodellierung für die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital – Probleme und Perspektiven der Archivie- rung und Magazinierung archäologischer Quellen

Transcript of Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung...

Page 1: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung für die

digitale Dokumentenverwaltung

Wissenschaftliches Kolloquium am 27. Mai 2008 in SankelmarkAnalog und digital – Probleme und Perspektiven der Archivie-rung und Magazinierung archäologischer Quellen

Page 2: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 227. Mai 2008

...oder: Wie baue ich mein

Document Management System

! Was soll ein DMS für die Archäologie leisten?

! Was ist ein Dokument?

! Was wurde und wird dokumentiert?

! Beschreibungen von Dokumenten - Metadaten

! Systembausteine

! Umsetzungsmöglichkeiten und Risiken

! Der folgende Vortrag skizziert die Erfahrungen bei derKonzeption des Dokumentenmanagements für das NLDin Hannover

Page 3: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 327. Mai 2008

Wofür brauche ich ein DMS?

! Ich möchte Dokumente (wieder)finden!

! Ich möchte Zugriff auf die dokumentierten Objekte undVorgänge haben!

! Ich möchte zusammengehörige Dokumente verknüpfen!

! Ich möchte den Verbleib von Dokumenten verfolgen!

! Ich möchte die Bearbeitung von Dokumenten erleichternund eventuell verfolgen!

Page 4: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 427. Mai 2008

Was ist für mich ein Dokument?

! Text

! Zeichnungen, Bilder undFilme

! Tonträger

! Anschauungsmodelle

! Merke: Für alle dieseKategorien gibt essowohl analoge als auchdigitale Formen!

Page 5: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 527. Mai 2008

Wo befinden sich die Dokumente?

Standort und Aufbewahrungsform

! Archive

! Bibliotheken

! Server

! Internet

! Einzeldokument

! Buch

! Akte

! Kartei, Datenbank

Page 6: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 627. Mai 2008

Wie werden die Dokumente identifiziert?

Signaturen

! Pro Standort anders

! Signaturschema = Struktur der Kennzeichnung

! Medium: lesbarer Text, Barcode, RFID

! Digitale Adressen

! Pfadnamen

! URLs

! Merke: In einem DMS brauchen die Dokumentestabile, nicht änderbare Identifier, damit beiVerlagerungen und Reorganisationen die Dokumenteauffindbar bleiben.

Page 7: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 727. Mai 2008

Was wurde und wird dokumentiert?

Eine Auswahl

! Objekte, z.B.

! Fundstellen

! Funde

! Vorgänge, z.B.

! Archäologische Aktivitäten (z.B.Prospektion, Grabung)

! Administrative Vorgänge (z.B.Denkmalschutz)

! Veranstaltungen (z.B. Ausstellung)

Page 8: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 827. Mai 2008

Wie möchte ich meine Dokumente

beschreiben?

! Metadaten, Metadaten, Metadaten...

! Beispiele (außer den schon behandelten):

! Wer ist der Autor?

! Wann wurde das Dokument erschaffen?

! Wo wurde das Dokument erschaffen?

! Welche Zeit beschreibt es?

! Auf welchem Medium ist es gespeichert?

! In welcher Sprache ist es verfasst?

! Zu welchem Zweck dient(e) es?

Page 9: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 927. Mai 2008

Was sind Metadaten?

! Metadaten beschreiben Daten, in unserem Fallalso Dokumente

! Sie sollen das Auffinden von Dokumenten ermöglichen.

! Sie sollen die Weiterverabeitung von Dokumentenerleichtern.

! Metadaten können bei den Dokumenten geführtwerden. Das ist für die Weiterverarbeitbarkeit gut, fürdie Auffindbarkeit aber nicht.

! Oder sie können in separaten Datenbanken gehaltenwerden. Und hier ist es umgekehrt.

Page 10: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1027. Mai 2008

Was sind Metadaten?

! Beispiele:

! Das Datenformat einer digitalen Fotografie ist alsSuchkriterium praktisch nur sehr selten von Interesse.Für die Auswahl einer Bildverarbeitungsmethode ist sieaber schon bedeutsam.

! Der Titel eines Aufsatzes ist als Suchkriteriumunerlässlich. Für die digitale Reproduktion ist er nichtrelevant.

! Folgerung:

! Das Metadatenschema ergibt sich aus den zuunterstützenden Such- und Verarbeitungsaufgaben

Page 11: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1127. Mai 2008

Einige Probleme mit Metadaten

! Begriffe sorgfältig trennen, z.B. Medium, Format und Größe

! Ein Bild kann auf CD in vielen verschiedenen digitalenFormaten abgespeichert werden. Es kann im selben Format inverschiedenen Größen vorliegen.

! Es gibt verschiedene Orts-, Zeit- und Personenrollen.

! Person z.B. als Autor, Unterzeichner, beschriebenes Subjekt.Die verschiedenen Rollen müssen identifiziert werden.

! Es gibt selten normierte Wertekataloge

! Zweck ist z.B. Gutachten, wissenschaftliche Beschreibung oderPressemitteilung. Den Katalog der relevanten Zwecke mussjeder DMS-Betreiber selbst festlegen.

Page 12: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1227. Mai 2008

Gibt es Hilfen für die

Metadatenarchitektur?

! Metadatenstandards

! Dublin Core: Der Metadatenstandard der DCMI

! ISO 19115: Metadaten für Geoinformation

! Zahlreiche weitere im Bibliothekswesen

! Diese Standards beschreiben einen überschaubarenSatz von Metadatenelementen, mit denen die meistenStandardaufgaben der Recherche von Dokumenten undihrer Verarbeitung gelöst werden können.

Page 13: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1327. Mai 2008

Gibt es Hilfen für die

Metadatenarchitektur?

! Metadatenstandards

! Neben den genannten Standards gibt es weitere, diees gestatten, eine eigene Metadatenarchitektur zukonfigurieren, d.h. die benötigten Metadatenartenselbst festzulegen:

! RDF = Resource Description Framework

! RDF beschreibt Dokumente durch Sätze, die ausSubjekt, Prädikat und Objekt gebildet sind. Beispiel:„Le Petit Prince“ „ist verfasst in der Sprache“„Französisch“. Die möglichen Werte für die dreiElementarten sind beliebig wählbar.

! Für solche Sätze können Schemata angelegtwerden, die es gestatten, ihre Gültigkeit zu prüfen.

Page 14: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1427. Mai 2008

Wie stehen Dokumente in Beziehung?

! Dokumente können ineinander geschachtelt sein, z.B. kann einBuch als Sammelband mehrere Aufsätze enthalten.

! Weitere typische Fälle sind:

! Akten

! Fotoalben

! Ordner in Dateisystemen

! Ein DMS sollte also solche Schachtelstrukturen abbilden können.

! Für die verschiedenen Dokumentenarten ist zu klären, welcheSchachtelungsebenen existieren und welche davon für dieRechercheaufgaben relevant sind.

Page 15: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1527. Mai 2008

Wie stehen Dokumente in Beziehung?

! Dokumente können voneinander abgeleitet sein.

! Keine leichte Fragestellung – Abgrenzungen sind schwierig

! Beispiele (aus Analyse beim NLD gewonnen):

! KLON. Nur eine Quelle zulässig, Identität in Inhalt, Medium,Format und Sprache.

! KOPIE. Ein oder mehrere Quellen zulässig, deren Inhaltevollständig und identisch wiedergegeben sein müssen.Wandlung von Medium und Format sind zulässig. Kopiendürfen eine rein deskriptive Beschriftung auf der Grundlagevon Metadaten (Betitelung, Herkunftsnachweis usw.), jedochkeine inhaltliche Annotation enthalten.

Page 16: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1627. Mai 2008

Wie stehen Dokumente in Beziehung?

! Dokumente können voneinander abgeleitet sein.

! Keine leichte Fragestellung – Abgrenzungen sind schwierig

! Beispiele (aus Analyse beim NLD gewonnen):

! KLON. Nur eine Quelle zulässig, Identität in Inhalt, Medium,Format und Sprache.

! KOPIE. Ein oder mehrere Quellen zulässig, deren Inhaltevollständig und identisch wiedergegeben sein müssen.Wandlung von Medium und Format sind zulässig. Kopiendürfen eine rein deskriptive Beschriftung auf der Grundlagevon Metadaten (Betitelung, Herkunftsnachweis usw.), jedochkeine inhaltliche Annotation enthalten.

Page 17: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1727. Mai 2008

Wie stehen Dokumente in Beziehung?

! ABBILD. Ein oder mehrere Quellen zulässig. Die Inhalte vonQuelle(n) und Abbild werden als „einander ähnlich"empfunden.Verfahrensbedingt können Teile des Inhalts fehlen,z.B. bei der Fotografie eines Museumsmodells, oder beimZusammenkleben eines Bildmosaiks. Ein Wechsel derSprache ist möglich (Übersetzungen!) Es dürfen nebendeskriptiven auch kurze inhaltliche Annotationen beschränkterLänge (Erläuterungen, Bewertungen, A.d.Ü.) hinzugefügtwerden.

! AUSZUG. Ein oder mehrere Quellen zulässig. Es werden Teileder Inhalte der Quellen identisch wiedergegeben. Ein Wechselder Sprache ist möglich (Übersetzungen!) Es dürfen nebendeskriptiven auch kurze inhaltliche Annotationen beschränkterLänge (Erläuterungen, Bewertungen, A.d.Ü.) hinzugefügtwerden.

Page 18: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1827. Mai 2008

Wie stehen Dokumente in Beziehung?

! ÜBERARBEITUNG. Ein oder mehrere Quellenzulässig, deren Inhalte beliebig ergänzt, verändertoder gekürzt wiedergeben werden. Dazu zählensowohl rein technische (Bildverarbeitung!) als auchkreative Prozesse.

! ORIGINAL. Weitgehende Neuschöpfung vonInhalten unter mgl. Verwendung von Sinngehalt(Begriffe, Aussagen, Meinungen, Deutungen...) auseiner oder mehreren Quellen.

Page 19: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 1927. Mai 2008

Welche Systembausteine brauche ich

zusätzlich?

! Eine Lebensdauerverwaltung ist immer dann erforderlich, wennDokumente ungültig werden können: Ab wann soll/darf der Inhaltdes Dokumentes nicht mehr verwendet werden?

! Eine Versionsverwaltung ist immer dann erforderlich, wenn dieBearbeitung eines Dokuments nachverfolgt werden muss: Wer hatwann welche Änderungen vorgenommen?

! Falls Dokumente ausgeliehen werden, wird eine Verbleibkontrollenotwendig: Wo ist das Dokument jetzt?

! Für die Langzeitarchivierung ist eine Kopienverwaltung nötig:Wann muss das Dokument auf ein neues Medium (in ein neuesFormat) kopiert werden?

Page 20: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 2027. Mai 2008

Wie setze ich das DMS-Konzept um?

! Ein DMS besteht aus der Metadaten-Datenbank sowie aus einemeventuell verteilten Dokumenten-Repositorium für die digitalenDokumente.

! Die Metadaten-Datenbank kann, muss aber nicht in diearchäologische Datenbank integriert werden.

! Alternativ können auch Verzeichnisdienste (z.B. LDAP) verwendetwerden, wenn das Metadatenschema klein ist und keine derzusätzlichen Systembausteine notwendig sind.

! Soll das DMS über das Intranet erreichbar sein, so empfiehlt sichdie Nutzung standardisierter Informationsmodelle, z.B. das schongenannte RDF oder Registries (Standard ebRIM der OASIS).

Page 21: Datenmodellierung f r die digitale … · Datenmodellierung f r die digitale Dokumentenverwaltung Wissenschaftliches Kolloquium am 27. Mai 2008 in Sankelmark Analog und digital Ð

Datenmodellierung Folie 2127. Mai 2008

Wie setze ich das DMS-Konzept um?

Besonders zu beachten:

! Die Migration von Altbeständen (z.B. aus Karteien) istnicht immer trivial und kann sehr zeitraubend werden,da sie kaum automatisierbar ist.

! Falls das Metadatenschema zu umfangreich ist, wirddie Erfassung zu einer ebenfalls zeitraubenden Sache,oder aber es fehlen viele Metadaten.

! Digitale Dokumentenbestände wachsen heutzutageimmer schneller, also genügend Reservekapazitäten anSpeicherplatz einplanen.