3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB

Post on 17-Feb-2017

490 views 1 download

Transcript of 3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB

Thomas Bähr3. intranda Viewer Tag

07.10.2015, intranda, Göttingen

Digitale Langzeitarchivierung an der TIB

Lösungen für die digitale LZA sehen von Außen oft attraktiv aus…

2

www.kreuzfahrt-sonne.de/Kreuzfahrten/Seetours/Aida_Aura/aida_aura_bilder.htm

3

… sind „unter Deck“ aber meist harte Arbeit!

www.hg-klug.de/kjk/philip/ban0.jpg

DigitaleDaten

(borndigital)

Printzu

Digital(Retro-

digitalisierung)

Printzu

Print(Bestands-erhaltung)

Unterschiedliche Archivierungsstrategien

Verfügbarkeit

Archiv für textuelle / nicht-textuelle Medien

Kla

ssis

che

Bes

tand

serh

altu

ng

Dig

itale

Lan

gzei

tarc

hivi

erun

g

Was bedeutet Langzeitarchivierung?

5

„klassische“ Bestandserhaltung / Retrodigitalisierung

Bestandserhaltungsmaßnahmen• Buchpflege• Entsäuerung• Restaurierung

hausinterne Retrodigitalisierung• 180°Scanner, V-Wippe, Großformat-Scanner• Digitalisierung, Strukturdatenerfassung, OCR, LZA• In Verbindung mit:

• DDB• Europeana

6

Mikroformen

Digitalisierung und Archivierung der Bestände aus dem Regionalreferat Osteuropa• Material hat hohe inhaltliche Bedeutung, insbesondere aus den Bereichen Luft-

und Raumfahrt (Russian Academy of Science)• TIB vermutlich im Alleinbesitz außerhalb Osteuropas

Film(Kapsel)

Film(Spule)

Mikrofiche Mikrokarten Summe

Reports /Reihen

110.000 105.000 2.380.000 210.000 2.805.000

Disserta-tionen - 30.000 450.000 - 480.000

Osteuropa 10.000 5.000 60.000 - 75.000

7

CD-Archivierung

• Bis ca. 2010 stellte die CD im alltäglichen Gebrauch wie auch im bibliothekarischen Umfeld die größte Verbreitung bei tragbaren digitalen Datenträger dar.

• Ca. 40.000 CDs im Bestand

• Allein die Beilagen-CDs zu Monographien wurden 2013 1.500 mal angefragt.

• Wichtigste Aufgabe Trennen der Daten vom Datenträger

IWF-Bestand

• November 2012 - Medienbestand der IWF Wissen und Medien gGmbH auf die TIB übertragen

• Sammlungsschwerpunkte: technisch-naturwissenschaftlichen Fächer, Biologie, Ethnologie

• Besondere Sammlungen wie Encyclopaedia Cinematographica

• Ca. 10.000 Filme (digital und analog)

8

Quelle: Leyhausen, Paul: Elephas maximus (L.) - Schritt, CC BY-NC-ND 3.0 DE

9Graphic based on Thibodeau [2002], Ludwig [2010] und Rauber [2012]

Ebenen der Langzeitarchivierung

10

Digitales Langzeitarchiv

Pilot Projekt zur Digitalen Langzeitarchivierung 2009-2011• Evaluierung technologischer, organisatorischer und institutioneller Anforderungen an

ein kooperativ betriebenes Langzeitarchivierungssystem• Vergleichende Analyse verschiedener Systeme: DuraSpace, DIAS, LOCKSS, Portico,

Tessella SDB, Ex Libris Rosetta• Testimplementierung eines Systems basierend auf Ex Libris Rosetta

Seit 2012 Produktivbetrieb• Rosetta als Systemkern des Goportis Langzeitarchivs• System wird von TIB gehostet• Archivierung von ca. 20 Millionen Dateien mit 74 TB

Was bedeutet kooperative Langzeitarchivierung?

kooperativ bedeutet

• Betrieb eines LZA-Systems im Verbund der 3 Zentralen Fachbibliotheken• gemeinsame Strategie zur digitalen Langzeitarchivierung• TIB stellt Hardware, Software und Infrastruktur• Dienstleistung als Partnerschaftsmodell• Teilen personeller Ressourcen• Entwicklung einer gemeinsamen Policy• gemeinsame Zertifizierung

http://svog-mooswiese-neumarkt.de/archiv/index.html

Rosetta

IngestTechnicalValidation (autom.)

SearchTool

Technical Analyst

Enrichment (autom.)

Archival Storage

[dark archive]

ContentManager AssessorSIP

AIP

SystemAdministrator

ContentValidationProducer

Preservation Analyst

Preservation Action

Preservation Plans

Risk Management

eDocServer

Access-Copy

GBV

OriginalFile

Anreicherung mit deskriptiven Metadaten

(Dublin Core)

Bereitstellung im Bedarfsfall

Beispiel manueller Workflow Dissertationen

Konsortium• unterschiedlicher Zugang auf institutioneller / konsortialer Ebene• detailliertes User Management• weitere Entwicklung des Konsortialmodells

Open interfaces• Submission Application zu DSpace war leicht zu realisieren• Anbindung des Katalogsystems über SRU (Search/Retrieve via URL) war

problematischer

Konfiguration• Rosetta unterstützt vollen “end-to-end” Workflow• sehr detaillierte Konfigurationsmöglichkeiten für alle Aspekte im Workflowprozess• tägliche Arbeit: “system in constant development”

www.lifecyclestep.com/browse/463.2.4CreateSimpleModels.htm

Erfahrungen – System

http://www.nordschwarzwald.ihk24.de/existenzgruendung/Unternehmensentwicklung/fachbeitraege/strategie/548146/Swot_Analyse.html

Die SWOT-Analyse ist ein Instrument der Strategischen Planung. Sie dient der Positions-bestimmung und der Strategieentwicklung von Organisationen.

SWOT-Analyse

Chancen• offizielles Mandat für die digitale Erhaltung• wachsende politische Unterstützung für digitalen Langzeitarchivierung• bewegen zur Zentralisierung von digitale Bewahrung, Verantwortung und Aktivitäten• Entwicklungen der digitalen Erhaltungsgemeinde (beispielsweise PRONOM)

Gefahren• mangelnde Vergleichbarkeit und Interoperabilität von Strategien• ändern internen Strategien• mangelnde Kontrolle über die Daten• keine ausreichende Transparenz• veränderte Rahmenbedingungen (beispielsweise Formate, Hardware)• Abhängigkeit von externer Finanzierung• rechtliche Einschränkungen• Fokussierung auf bestimmte Materialtypen• Umgang mit vertraulichen Inhalten

SWOT-Analyse – externe Faktoren

Stärken• gemeinsamen Personalressourcen• gemeinsame Hard- und Software Ressourcen• gemeinsame Entwicklungsaktivitäten• Erweiterung des Anwendungsbereiches (beispielsweise auf nicht-textuelle

Materialien)

Schwächen• Abhängigkeit von beteiligten Partnern (technisch, organisatorisch, finanziell)• Abhängigkeit vom gewählten System• Abhängigkeit vom persönlichen Know-how• unterschiedliche Archivierungsstandards und Archivierungsstrategien unter den

Partnern• hohe Anzahl von Integrationspunkten• keine individuelle Skalierbarkeit und Veränderbarkeit des Systems• unklar Grenzen des Systems• unklare Verantwortlichkeiten und Zuständigkeiten• keine strukturierten Entscheidungsprozesse

SWOT-Analyse – interne Faktoren

Dienstleistungsumfang• Bereitstellung von Infrastruktur und Hardware inkl. Konfiguration, Monitoring

und Backup• Bereitstellung von Software inkl. kundenspezifischer Konfiguration und

Qualitätskontrollen• Beratung• Pre-Ingest• Ingest• Archivierung• Preservation Management • Access• DOI-Vergabe

Materialien in den entsprechenden Standardformaten• Textuelle Materialien• Nicht-textuelle Materialien (Bild, AV, 3-D)• derzeit keine Forschungsdaten

17

Dienstleistungsangebot

Service-Level

1. Level• Beratung und Konzeptentwicklung zur Erstellung von SIP• Pre-Ingest (Analyse und Strukturierung der Objektpakete und Metadaten)• Ingest und Erstellung eines AIP gemäß Konzept• Bitstream-Preservation• Erstellung von Berichten und Statistiken• Auslieferung von AIP an den Kunden (Trigger Event)

2. LevelWie Level 1 plus:

• Technology Watch• Preservation Management (ohne Erhaltungsmaßnahmen berechnet)

3. LevelWie Level 2 plus:

• Access (permanenter Zugriff auf DIP)

18

19

Wissenschaftliche Aktivitäten / Zertifizierung / Netzwerke

EU-Projekt DURAARK – developing long-term preservation tools that will be especially tailored to the domain of architectural 3D content

Netzwerkarbeit

Zertifizierung„Data Seal of Approval“

20

Beginnen, bevor es zu spät ist!!!

http://worldmaritimenews.com/wp-content/uploads/2015/06/Ardent-Ardentia-Marine-to-Remove-Oil-from-Oleg-Naydenov-622x468.jpg

thomas.baehr@tib.uni-hannover.de