Pilotprojekt Digitale Langzeitarchivierung

25
1 © ETH- Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008 Februar 2008 Pilotprojekt Digitale Langzeitarchivierung

description

Pilotprojekt Digitale Langzeitarchivierung. Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008. Projektorganisation. Kooperation zwischen drei Partnern Informatikdienste der ETH Zürich ETH-Bibliothek - PowerPoint PPT Presentation

Transcript of Pilotprojekt Digitale Langzeitarchivierung

Page 1: Pilotprojekt  Digitale Langzeitarchivierung

1© ETH-Bibliothek 2008

Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek

ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008

Pilotprojekt Digitale Langzeitarchivierung

Page 2: Pilotprojekt  Digitale Langzeitarchivierung

2© ETH-Bibliothek 2008

ProjektorganisationProjektorganisation

Kooperation zwischen drei Partnern

Informatikdienste der ETH Zürich

ETH-Bibliothek

Konsortium der Schweizer Hochschulbibliotheken

Phase 1: 01.09.2006 – 31.05.2007

Phase 2: 01.06.2007 – ca. Ende 2008

Page 3: Pilotprojekt  Digitale Langzeitarchivierung

3© ETH-Bibliothek 2008

Ausgangslage (1)Ausgangslage (1)

Digitale Informationen an der ETH Zürich

Aus der Forschung

Primärdaten: digitale Messdaten

Sekundärdaten: elektronische Auswertungen / Ergebnisse

Aus der Verwaltung

digitale Dokumente: Geschäftsdaten

Page 4: Pilotprojekt  Digitale Langzeitarchivierung

4© ETH-Bibliothek 2008

Ausgangslage (2)Ausgangslage (2)

ETH-Bibliothek

verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc.

traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form)

An der ETH Zürich fehlt:

ein umfassender Ansatz für die langfristige ein umfassender Ansatz für die langfristige Archivierung und Verfügbarkeit von Archivierung und Verfügbarkeit von digitalen Primär- und Sekundärdatendigitalen Primär- und Sekundärdaten

Page 5: Pilotprojekt  Digitale Langzeitarchivierung

5© ETH-Bibliothek 2008

OAIS-Referenzmodell als BasisOAIS-Referenzmodell als Basis

ISO-Standard 14721 seit 2001 Consultative Committee for Space Data Systems (CCSD) –

NASA, ESA, DLR

Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig

Übernahme von Modulen in Projektorganisation und Strukturplan

Page 6: Pilotprojekt  Digitale Langzeitarchivierung

6© ETH-Bibliothek 2008

Nutzung von Erfahrungen und Kompetenzen Nutzung von Erfahrungen und Kompetenzen

Austausch international E-Helvetica kopal KB – Koninklijke

Bibliotheek der Niederlande

Kooperation mit nestor Gemeinsame Umfrage

2007 Nachnutzung:

„Kriterienkatalog vertrauenswürdige digitale

Langzeitarchive“

Page 7: Pilotprojekt  Digitale Langzeitarchivierung

7© ETH-Bibliothek 2008

Testdaten (1)Testdaten (1)

Primärdaten

Departement Erdwissenschaften der ETH Zürich

Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes

Projekt Replay – Multimedia-Portal System der ETH Zürich

Video-Dateien (Vorlesungen)

Page 8: Pilotprojekt  Digitale Langzeitarchivierung

8© ETH-Bibliothek 2008

Testdaten (2)Testdaten (2)

Sekundärdaten

ETH-Bibliothek und Konsortium

E-Journals Elsevier

E-Books (Springer)

E-Pics (Bildarchiv)

E-Collection (Dissertationen und elektronische Publikationen der ETH-Angehörigen

Page 9: Pilotprojekt  Digitale Langzeitarchivierung

9© ETH-Bibliothek 2008

Metadatenanalyse (1)Metadatenanalyse (1)

Standards

Möglichst bestehende Standards und offene Formate verwenden

Für möglichst viele Objekttypen ohne Anpassungen

Metadatengewinnung

Möglichst automatisierter Ablauf

Page 10: Pilotprojekt  Digitale Langzeitarchivierung

10© ETH-Bibliothek 2008

MetadatentypMetadatentyp KategorieKategorie

Dublin Core reine Beschreibung der Metadaten

LMER / PREMIS administrative u. technische Metadaten

METS Packaging

XML Codierung

Metadatenanalyse (2)Metadatenanalyse (2)

MetadatenstandardsGeeignet für die Langzeitarchivierung

Page 11: Pilotprojekt  Digitale Langzeitarchivierung

11© ETH-Bibliothek 2008

PreservationLevel A

PreservationLevel B

PreservationLevel C

Se

rvic

ele

vel

Aufbewahrungsdauer

Kurzeitige Datenhaltung

mit minimaler Serviceleistung

Mittelfristige Datenhaltung

mit geringer Serviceleistung

Dauerhafte Datenhaltung

mit umfassender Serviceleistung

Definition von Preservation Levels (1)Definition von Preservation Levels (1)

Definition für die ETH ZürichDrei Stufen und

Kriterien für die Langzeitarchivierung

Page 12: Pilotprojekt  Digitale Langzeitarchivierung

12© ETH-Bibliothek 2008

Kriterien – Preservation Levels (2)Kriterien – Preservation Levels (2)

Kriterien für die Archivierung nach den Preservation Levels

Kriterien für die Speicherung gemäss Preservation Level A

A.1 Ein Objekt stellt kein Sicherheitsrisiko für das Archiv oder für archivierte Objekte dar.

A.2 Es ist eine Übergabevereinbarung mit der Archiveinrichtung zu schliessen.

A.3 Es ist erkennbar, wer das Objekt abliefert.

Kriterien für die Speicherung gemäss Preservation Level B

B.1 Metadaten müssen so aufbereitet werden können, dass die Objekte für 5 bis 10 Jahre nutzbar bleiben.

B.2 Das Dateiformat entspricht einer Positivliste von Formaten.

Kriterien für die Langzeitarchivierung gemäss Preservation Level C

C.1Umfassende inhaltliche, technische und administrative Metadaten sind vorhanden.Ein Mindeststandard der Metadaten muss definiert werden.

C.2 Der Objekttyp entspricht einer Positivliste von Typen.

C.3 Das Dateiformat entspricht einer Positivliste von Formaten (z.B. PDF/A, XML, etc.).

Page 13: Pilotprojekt  Digitale Langzeitarchivierung

13© ETH-Bibliothek 2008

Page 14: Pilotprojekt  Digitale Langzeitarchivierung

14© ETH-Bibliothek 2008

ÜbergabevereinbarungÜbergabevereinbarung

Datenlieferant

Art und Umfang der Lieferung Inhaltliche Umschreibung Umfang, Dateiformate, Übergabeverfahren IT-Umgebung, Metadaten etc.

Verpflichtung des digitalen LZA Preservation Levels Dauer der Archivierung u. Dienstleistungsumfang

Nutzungsbedingungen Zielgruppen, Nutzungsrechte

Schutzfristen, Kosten

etc.

Page 15: Pilotprojekt  Digitale Langzeitarchivierung

15© ETH-Bibliothek 2008

Online-Umfrage (1)Online-Umfrage (1)

Bedarfsanalyse April 2007Klärung des Bedarfs an LZA digitaler Objekte

an der ETH Zürich

Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen)

AdressatenAlle 15 Departemente der ETH Zürich

Zentrale Dienste

Rücklauf: 20%

Page 16: Pilotprojekt  Digitale Langzeitarchivierung

16© ETH-Bibliothek 2008

Online-Umfrage (2)Online-Umfrage (2)

Allgemeine Aussagen Über 80 % haben Interesse an einer zentralen Dienstleistung

„digitale Langzeitarchivierung“

Page 17: Pilotprojekt  Digitale Langzeitarchivierung

17© ETH-Bibliothek 2008

Online-Umfrage (3)Online-Umfrage (3)

Vereinbarungen und Vorschriften ca. 80 % geben an, dass es in ihrer Organisationseinheit

keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.

Page 18: Pilotprojekt  Digitale Langzeitarchivierung

18© ETH-Bibliothek 2008

Online-Umfrage (4)Online-Umfrage (4)

Formate der zu archivierenden Daten und Objekte ASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB,

NETCDF, PDF, TIF, TXT, WORD, XML

Teilweise proprietäre Formate

17 (18%)keine Antwort

29 (31%)Nein

48 (51%)Ja

Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist?

Page 19: Pilotprojekt  Digitale Langzeitarchivierung

19© ETH-Bibliothek 2008

Online-Umfrage (5)Online-Umfrage (5)

Gibt es in Ihrem Bereich Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?

<5 Jahre: 5-10 Jahre: dauerhaft:

Einzeldateien (Textdateien, Bilder,

PDFs etc.)

Komplexe Objekte (z.B. Multimedia)

Datenbanken Fachspezifische Formate (GIS, CAD etc.)

Websites Ausführbare Objekte (Programme)

Aufbewahrungsdauer

Page 20: Pilotprojekt  Digitale Langzeitarchivierung

20© ETH-Bibliothek 2008

Enthalten die betreffenden Daten eine standardisierte Beschreibung ihrer technischen Eigenschaften?

Ja 27 (29%)

Nein 48 (51%)

keine Antwort 19 (20%)

Online-Umfrage (6)Online-Umfrage (6)

Technische Metadaten Daten und Objekte verfügen überwiegend über keine

standardisierten Metadaten

Page 21: Pilotprojekt  Digitale Langzeitarchivierung

21© ETH-Bibliothek 2008

Enthalten die betreffenden Daten aussagekräftige deskriptive und administrative Beschreibungen, die es erlauben, diese zu einem anderen Zeitpunkt sachlich korrekt zu interpretieren?

Ja 50 (53%)

Nein 24 (26%)

keine Antwort 20 (21%)

Inhaltliche Metadaten Rund die Hälfte der Antworten bejaht das Vorhandensein von

inhaltlichen (deskriptiven und administrativen) Metadaten.

Online-Umfrage (7)Online-Umfrage (7)

Page 22: Pilotprojekt  Digitale Langzeitarchivierung

22© ETH-Bibliothek 2008

Entsprechen die technischen und inhaltlichen Beschreibungen einem Standard, der in Ihrem Fach oder allgemein anerkannt und dokumentiert ist?

Ja 39 (41%)

Nein 31 (33%)

keine Antwort 23 (26%)

Online-Umfrage (8)Online-Umfrage (8)

Format der technischen u. inhaltlichen Metadaten 41 % antworten mit ja, aber nennen kein konkretes Format.

Page 23: Pilotprojekt  Digitale Langzeitarchivierung

23© ETH-Bibliothek 2008

Online-Umfrage (9)Online-Umfrage (9)Aktuelle Massnahmen

eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum.

Durch welche Massnahme stellen Sie bzw. Ihre Mitarbeiter die Verfügbarkeit Ihrer Daten heute sicher? (Mehrfachnennungen erlaubt)

Die Mitarbeiter sind dafür selber verantwortlich:

56(60%)

Beim Weggang von Mitarbeitenden müssen diese angeben, an welchem Ort und in welcher Form ihre Daten abgelegt sind:

49(52%)

Es gibt klare Richtlinien zur Aufbewahrung der Daten:

19(20%)

Wir haben dafür eine verantwortliche Person benannt, die sich um die Aufbewahrung langfristig relevanter Daten kümmert:

24 (26%)

Ergänzungen und sonstige Vorgehensweisen:

18(19%)

Page 24: Pilotprojekt  Digitale Langzeitarchivierung

24© ETH-Bibliothek 2008

Auswahl der Software und PilotAuswahl der Software und Pilot

Schritt 1

Anforderungs-katalog

Schritt 2

Präsentationen

Lieferanten

Schritt 3

WorkshopsLieferanten

Schritt 4

Test-Installationen

Ziel: Vergleichende Pilotinstallation Vergleich zweier unterschiedlicher Ansätze

Page 25: Pilotprojekt  Digitale Langzeitarchivierung

25© ETH-Bibliothek 2008

Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung:

E-Mail: [email protected] / Telefon: +41 44 632 84 26