Thomas Triebsees [email protected] Neubiberg, 25. Oktober 2007

14
1 Thomas Triebsees [email protected] Neubiberg, 25. Oktober 2007 Migration Digitaler Objekte Ein Rahmenwerk zur automatisierten Unterstützung "Kontrollierter Migrationen" Treffen Arbeitskreis Digitale Langzeitarchivierung München an der Universität der Bundeswehr München 25.10.2007

description

Migration Digitaler Objekte. Ein Rahmenwerk zur automatisierten Unterstützung "Kontrollierter Migrationen" Treffen Arbeitskreis Digitale Langzeitarchivierung München an der Universität der Bundeswehr München 25.10.2007. Thomas Triebsees [email protected] Neubiberg, 25. Oktober 2007. - PowerPoint PPT Presentation

Transcript of Thomas Triebsees [email protected] Neubiberg, 25. Oktober 2007

Page 1: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

1

Thomas [email protected]

Neubiberg, 25. Oktober 2007

Migration Digitaler Objekte

Ein Rahmenwerk zur automatisierten Unterstützung "Kontrollierter Migrationen"

TreffenArbeitskreis Digitale Langzeitarchivierung Münchenan der Universität der Bundeswehr München

25.10.2007

Page 2: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

2

Agenda

I. Zieldefinition & Einordnung in Gesamtkontext

II. Ein Rahmenwerk zur automatisier-ten Unterstützung "Kontrollierter Migrationen"

III. Wesentliche Konzepte

IV. Fallstudie – Formattransformation

V. Zusammenfassung

Page 3: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

3

Migrationsprozesse in digitalen Archiven

heute 21?? (deutlich später als morgen)

sehr viele

also vor-zugsweiseautomati-siert

Page 4: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

4

Ziele

- aufbauend auf einem geeigneten Erhaltungsbegriff einen Beitrag - zur verbesserten Automatisierung von

Migrationsprozessen in digitalen Archiven - bei gleichzeitiger Berücksichtigung eines hohen Grades

an Vertrauenswürdigkeit leisten.

Organisation Unterstützung bei Formulierung der Anforderungen

Prozesse Integration und Verifikation der Anforderungen über Objekthistorien hinweg

relevante EigenschaftenObjekt-Versionen

Software-Unterstützung

Formalisierung

Page 5: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

5

Transformation von Web-Dokumenten, Erhaltung der Linkkonsistenz

Web-Dokument

Ziel: höhere Portierbarkeit

Quellrepräsentation Quellkontext

Zielrepräsentation Zielkontext

137.193.60.99

Calculation

html index.html

calc05

resources

calc.pdf

calc05

Virtuelles HTTP-Verzeichnis

source

calc05

calc.pdf

start.html

137.193.60.82

Webseite "Calculation"

<html> <head> <title>Calculation</title> </head> <body> <a ref=“137.193.60.82/calc05/calc.pdf/"> documents </a> </body></html>

<html> <head> <title>Calculation</title> </head> <body> <a href=“./resources/calc05/calc.pdf/"> documents </a> </body></html>

style.css

style.css

Webseite "Calculation"

Page 6: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

6

Bisherige Ergebnisse

Konzepte

Migrationsprozesse

Quellobjekte Zielobjekte

Relevante Objekt-eigenschaften

Anforderungen an "Erhaltung"

RahmenwerkRahmenwerk

Objektverfolgung

Matching Matching

Automatisierte Überprüfung

Server

Benachrichtigung

Server

Rahmenwerk für den Ablauf einer "kontrollierten" Migration

Spezifikation für

Spezifikation für

Web-Dokumentein Quell-Reprä-sentation

Web-Dokumente in Ziel-Repräsen-tation

im Quell- und Zielkon-text

Constraints

Page 7: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

7

(1) Spezifikation vonKonzepten

LinksTo

<html> <head> <title>Calculation</title> </head> <body> <a ref=“137.193.60.82/calc05/calc.pdf/"> documents </a> </body></html>

Linkquelle

Linkanker

Linkziel

Konzept + Interface

Kontext LinkAbs Kontext LinkRel

<html> <head> <title>Calculation</title> </head> <body> <a href=“./resources/calc05/calc.pdf/"> documents </a> </body></html>

137.193.60.99

Calculation

html index.html

calc05

resources

calc.pdf

calc05

Virtuelles HTTP-Verzeichnis

style.css

source

calc05

calc.pdf

start.html

137.193.60.82

Webseite "Calculation"

style.css

Rollennamen definieren Objekten Rollennamen zuweisen

Webseite "Calculation"

Page 8: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

8

presK( {q → Linkquelle, a → Linkanker, z → Linkziel}, LinksTo (q, a, z), {LinkAbs}, {LinkRel})

Semiformale Sprechweise mit Konzepten und Kontexten:

Erhalte bei der Transformation von Linkquelle, Linkanker und Linkziel zu einer neuen Repräsentation das Konzept LinksTo für diese Objekte im Zielkontext LinkRel, sofern die Objekte im Kontext LinkAbs vorlagen.

(2) Spezifikation zu erhaltender Eigenschaften - Constraints

Anforderung:

Bei der Transformation von Web-Dokumenten soll die Linkkonsistenz erhalten werden.

Formal ausgedrückt als Constraint:

Maschinenverarbeitbar & abstrakt (ohne Bezug zu

konkreter Implementierung)

Page 9: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

9

Erhaltung im Modell der Repräsentationsebenen

Konzept

Quellkontext Zielkontext

137.193.60.99

Calculation

html index.html

calc05

resources

calc.pdf

calc05

Virtuelles HTTP-Verzeichnis

calc.pdf

start.html

Webseite "Calculation"

<html> <head> <title>Calculation</title> </head> <body> <a ref=“137.193.60.82/calc05/calc.pdf/"> documents </a> </body></html>

<html> <head> <title>Calculation</title> </head> <body> <a href=“./resources/calc05/calc.pdf/"> documents </a> </body></html>

style.css

Webseite "Calculation"

source

calc05 style.css

LinksToLinkquelleLinkankerLinkziel

Page 10: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

10

Fallstudie - Formattransformation

Im Rahmen einer Diplomarbeit durchgeführt

AufgabeTransformation XHTML nach ODF und zurück mit CSS-Formatierung

Ziel(1) Evaluierung der konzeptionellen Vorgehensweise(2) Bewertung der Anwendbarkeit der theor. Konzepte(3) Implementierung der Formattransformation(4) Laufzeitmessungen bzgl. Overhead durch formale Verifikation der Erhaltungs-Constraints

Besondere Herausforderungen(1) Layout / Rendering Zieldokument im Browser (Erhaltung des Layouts)(2) Linkkonsistenz bei mehreren Dokumenten(3) Zieldokument valide gemäß Formatspezifikation

Page 11: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

11

Transformation XHTML-ODF: Überblick

Transformation

......

Quell-Repräsen-tation (Referenzdok.)

Ziel-Repräsentation(Referenzdok.)

Quellformat ZielformatQuellmodell Zielmodell

Matching Matching

Constraints

(in JAVA implementiert)

Formale Verifikation

Page 12: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

12

Ergebnisse

Güte der Transformationsresultate:Hin- und Rückrichtung entsprechen den Anforderungen (Erhaltung Linkkonsistenz,Inhalte, optisches Erscheinungsbild) mit kleinen Abstrichen bei eingebetteten Bildern

Allgemeine Erfahrungen: (1) - Ansatz über Konzept- und Rollenidentifikation eingängig und praktikabel

- Ansatz hilft bei Implementierung (Fehler bei Layout-Transformation konnten behoben werden)

(2) Dokumentinhalte und Anforderungen an Erhaltung konnten vollständig formal spezifiziert werden

Anzahl Konzepte: 10 (je Richtung)Anzahl Constraints: 27 (je Richtung)

(3) Implementierungstechnische Einbettung in das formale Framework mit entsprechendem Einarbeitungsaufwand gut möglich

(4) - vertretbares Laufzeitverhalten der Implementierung- mit etwas formalem Aufwand sind Linkkonsistenz und Transformation der Style-Informationen sogar vollautomatisiert handhabbar (Laufzeitverhalten grenzwertig (Optimierungspotential))

Page 13: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

13

Zusammenfassung

- Auf Erhaltung fokussierte Spezifiktionssprache (Constraints) - Einbettung in zustandsbasierte Umgebung - Gruppierung semantischer Eigenschaften unterschdl. Impl. - Verfolgung (Tracing) anhand klar definierter Interfaces

Vollständige Abstraktion von konkreter Implementierung

Einbettung in Prozesse

"Nur was schon da ist" - Tracing Beschränkung auf "signifikante" Eigenschaften

DiversizitätAufzeigen von Ursachen für

Constraint-Verletzung; Nachverfolgungüber Objekthistorie hinweg

Grundidee: Erhaltung definiert über Vorher-Nachher Vergleich undAbstraktion (Kernkonzept der Informatik)

Merkmale und Bestandteile des entwickelten Systems:

Page 14: Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg,  25. Oktober 2007

14

Thomas TriebseesUniversität der Bundeswehr München

Fakultät für Informatik

[email protected]

Vielen Dank für Ihre Aufmerksamkeit...