Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte...

17
Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories? Wintersemester 2008 / 2009 Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Transcript of Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte...

Page 1: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Page 2: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 1

Was ist Fedora Repository?

Was ist Fedora?Was ist Fedora?

Flexible Extensible Digital Object and Repository Architecture

Entwickelt von der Cornell University und der University of Virginia mit der finanziellen Unterstützung der Andrew W. Mellon Foundation und Gordon and Betty Moore Foundation

2008 Gründung der non-profit-corp Fedora Commons

Einer der Chefdesiger, Carl Lagoze, ist übrigens zu Zeit im Executive Commitee der OAI.

Fedora liegt inzwischen in der Version 3.1 vor.

Die erste Version wurde im Mai 2003 veröffentlicht.

Apache-Lizenz 2.0

Page 3: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 1

Was ist Fedora Repository?

Was ist Fedora?Was ist Fedora?

Eine digitale Bibliothek, die auch alle Funktionalitäten eines Open-Source-Content- Management-System beinhaltet

Zugang und Verwaltung von digitalen Inhalt in Archiven

Einsatzorte: Bibliotheken, Universitäten und anderen Forschungs- und akademischen Einrichtungen als Dokumentenserver

Fedora ist kompatibel zu den Anforderungen von OAI (Open Archives Initiative)

Vergleichbare Programme zur Verwaltung von Dokumentenservern sind unter anderem: DSpace, MyCoRe, OPUS, EPrints und CDSware

Page 4: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 1

Was ist Fedora Repository? Was ist Fedora?Was ist Fedora?

Flexibel einsetzbares Modell für digitale Objekte

Verwaltung von digitalen Objekten jeglicher Art (Textdateien, Bilder, Videos, Webseiten…)

Verwaltung von Metadaten

Verwaltung von Referenzen auf die Objekte (Trennung von local und distributed content)

Darstellung von Objektbeziehungen

Page 5: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2 Motivation

Das Problem mit digitalen InhaltenDas Problem mit digitalen Inhalten

Was sind digitale Inhalte?

Konventionelle Objekte: Bücher, textbasierte Objekte, Bilder, maps…

Komplexe, assoziative, dynamische Objekte: Video-, Audiodateien, numerische Datensätze…

Immenser Anstieg digitaler Erfassung bedeutet einen komplexen Weg der Archivierung und Konservierung der Daten

Komplexität der Inhalte bedarf einer Darstellung der Objektbeziehungen mittels Metadaten

Page 6: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2

Motivation FragestellungFragestellung

1. Wie können user auf einfache Art und Weise mit einer heterogenen Sammlung komplexer Objekte umgehen?

2. Wie können komplexe Objekte gestaltet werden, dass sie gleichzeitig allgemein als auch spezifisch deklariert werden können?

3. Wie können services und tools mit Objekten koordiniertwerden, dass sie verschiedene Darstellungen und Umwandlungen vom Inhalt des Objekts bereitstellen können?

4. Wie können spezifizierte Verfahrensweisen für die Zugriffskontrolle mit spezifischen Objekten oder mit Gruppen von Objekten verbunden werden?

5. Wie kann man ein Langzeitmanagement und eine langfristige Bestandserhaltung von Objekten ermöglichen?

Page 7: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2

Motivation Die Ziele von FedoraDie Ziele von Fedora

• Identifiers: Bestimmung von persistenten Identifikatoren, eindeutige Namen für alle Ressourcen

• Relationships: Support für Objektbeziehungen (Triple, parent/child)

• Tame Content: Vereinheitlichung der heterogenen Inhalte und Metadaten auf der Grundlage eines erweiterbaren Objekt-Modell

• Integrated Management: effizientes Verwaltung von Repository Administratoren nicht nur von Daten und Metadaten in einem Repository, sondern auch für supporting Programme, services und tools, die eine Präsentation von diesen Daten und Metadaten möglich machen.

• Interoperable Access: Bereitstellung eines Zugangs zu Informationen über Objekte und Inhalte dieser Objekte mittels eines Standard Protocols

Page 8: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2

Motivation Die Ziele von FedoraDie Ziele von Fedora

• Scalability: Bereitstellung eines Supports für >10 Millionen Objekte

• Security: Bereitstellung einer flexiblen Authentifizierung

• Preservation: Bereitstellung von features zur Unterstützung von Langlebigkeit und Archivierung, einschließlich XML Serialisierung (FOXML) von Objekten und Versionierung des Inhalts

• Content Recon: Folgenutzung von Objekten einschließlich deren Inhalte; Wiederverwendung von Objekten, um dynamische Inhaltstransformationen in neue Präsentationsanforderungen zu passen

• Self-Actualizing Objects: Möglichkeit der digitalen Objekte zur Verbreitung von Start-Pads oder Werkzeuge für die End-Benutzer-Interaktion mit Inhalten

Page 9: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2

Motivation Fedora’s Digital Object ModelFedora’s Digital Object Model

• Abstraction: Das Objektmodel ist für Fedora immer gleich, ganz gleich, ob es sich um einen Text, ein Bild, Audiodateien etc. handelt.

• Flexibility: Fedora kann jeglichen institutionsspezifischen Anforderungen angepasst werden.

• Generic: Metadaten und Inhalt sind eng verknüpft mit dem digitalen Objekt.

• Aggregation: Fedora Objekte können sich auf Daten beziehen, die lokal gelagert sind oder die außerhalb auf einem Webserver liegen.

• Extensibility: Fedora´s Schnittstellen sind erweiterbar, da

Dienste in unmittelbarem Zusammenhang mit den Daten innerhalb eines Fedora-Objekts stehen. Wenn sich die Dienste ändern, ändern sich die Objekte mit ihnen.

Page 10: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 2

Motivation

Darstellung des Aufbaus eines Fedora SystemsDarstellung des Aufbaus eines Fedora Systems

Page 11: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 3

- „compound digital object“ = Zusammenfassung mehrerer Contents in einem Objekt

- Zusammenfassung der Inhalte zu einem Objekt unabhängig vom Format

- Zusammenfassung der Inhalte zum einem Objekt auch unabhängig vom Lagerort

- Contents können dabei extern oder intern, oder auch lediglich als Referenz vorliegen

Page 12: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 3

- Fedora soll dabei flexibel, einfach und verallgemeinernd sein

- sodass verschiedene Arten von Objekten erstellt und gemanaged werden können

- das Objekt-Modell ist dabei definiert in einem XML- Schema namens FOXML (Fedora-Object XML)

- Besonderheit: Objekte können dabei Daten, Metadaten und Eigenschaften und mögliche Dienste der Contents beschreiben

Page 13: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 3

- Digital Object Identifier – einmalig und für immer an dieses Objekt gebundene Identifikationskürzel

- systemdefinierte Sammlung von Eigenschaften um mit dem Objekt innerhalb des Repository zu arbeiten

- Datastreams sind Contents

- es gibt beliebig viele

- und diese können Contents verschiedenster Arten beinhalten

Page 14: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 3

- Digital Object Identifier – einmalig und für immer an dieses Objekt gebundene Identifikationskürzel

- systemdefinierte Sammlung von Eigenschaften um mit dem Objekt innerhalb des Repository zu arbeiten

- Datastreams selbst werden wieder mit Identifikationskürzeln versehen

- es gibt beliebig viele IDs, 3 IDs werden immer für bestimmte Contents reserviert

- die reservierten enthalten Angaben über DC-Metadaten, Veränderungen des Streams, und über mögliche Relationen zu anderen digitalen Objekten

Page 15: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 3

- sonstige die Datastreams definierende Eigenschaften lauten wie folgt:

Datastream Identifier, State, Created Date, Modified Date, Versionable, Label, MIME Type, Format Identifier, Alternate Identifiers, Checksum, Bytestream Content,

- und Control Group die dabei in 4 Typen unterschieden wird:

Internal XML MetadataManaged ContentExternal Referenced ContentRedirect Referenced Content

Page 16: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 4

- Fedora biete also innerhalb der Datastreams eine Vielzahl von bekannten und zum Standard gewordenen Auszeichnungs- oder Schnittstellentechnologien wie XML, DC, OAI, RDF an

- dies schafft Beziehungen zwischen den Objekten über die Grenzen der lokalen Repositories hinaus

- Ein Netzwerk aus digitalen Objekten über die Grenzen der Repositories hinaus ensteht

Page 17: Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A. Vom Contentmanagementsystem zur.

Universität zu KölnIT – Zertifikat der Philosophischen Fakultät / Blockseminar Dedizierte Systeme mit Susanne Kurz M. A.Vom Contentmanagementsystem zur Digitalen Bibliothek. Was leisten digitale Repositories?Wintersemester 2008 / 2009Referat von Elena Karatsoli und Tibor Toth zur Flexible Extensible Digital Object and Repository Architecture

Tutorial – Section 4