LEHRGEBIET RECHNERARCHITEKTUR Prof. Dr.-Ing. Wolfram Schiffmann Stand der Expertise Workshop am...
Transcript of LEHRGEBIET RECHNERARCHITEKTUR Prof. Dr.-Ing. Wolfram Schiffmann Stand der Expertise Workshop am...
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Stand der Expertise
Workshop am 17.4.07
SUB Göttingen
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Ziele und Vorgehen
Langzeitarchivierung bedeutet:
Digitale Information (Daten, Texte, Multimedia, Software) langfristig speichern, wiederfinden und für die menschlichen Sinne zugänglich machen.
Im Rahmen der Expertise sollen Ansatzpunkte für die Nutzung von Synergien zwischen existierenden F&E-Aktivitäten identifiziert, technische Integrationsmodelle abgeleitet und mögliche Kooperationsinfrastrukturen aufbereitet werden.
Phasen:
-Potentialanalyse
-Varianten für zukünftige Integration
-Organisatorische Kooperationsinfrastrukturen
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
GRID-Computing
Als GRID-Computing bezeichnet man die gemeinsame Nutzung geographisch verteilter, heterogener Ressourcen, die nicht unter derselben Administration stehen. Bei den Ressourcen kann es sich um Computer, Speicher oder aber auch andere fernsteuerbare Geräte (z.B. Messgeräte) handeln.
Der Zugriff auf die GRID-Ressourcen erfolgt über standardisierte Dienste (grid services), die mittels einer Middleware bereitgestellt werden.
Im Wesentlichen können Compute- und Data-Grids unterschieden werden.
Weitere benötigte Funktionalitäten:
• Workflows und Scheduling
• RMS mit Advance Reservation
• Service Level Agreements (SLA)
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
eScience
John Taylor‘s Definition:
eScience is about global collaboration in key areas of science and the next generation of infrastructure that will enable it.
Wie kann globale Zusammenarbeit unterstützt werden?
• Experimente oder Simulationen erzeugen Rohdaten
• Kollaborative Interpretation von Ergebnissen
• Wissensmanagement und –vernetzung
• Prozess- und Kontextmanagement
• Visualiserung
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Langzeitarchivierung
OAIS-Referenzmodell (Open Archival Information System) klärt grundlegende Begriffe der Archivierung:
• Informationsmodell: Daten und deren Interpretation
• Prozessmodell: Erzeuger, Verbraucher, Management (DSEP=Deposit System for Electronic Publications)
Drei Kernprobleme:
1. Persistente Speicherung der Bitfolgen
2. Charakterisierung der gespeicherten Inhalte
3.Wiedergabe der digital codierten Information
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
1. Persistente Speicherung der Bitfolgen
Wahl der Codierung: Verhältnis Dokumentinhalt : Dokumentbeschreibung
• binäre vs. textuelle Formate (z.B. pdf vs. XML)
• Lesbarkeit vs. Overhead
• Auffrischung in regelmäßigen Abständen
Synergiepotentiale:
Data-GRID-Dienste können eingesetzt werden, um die Daten verteilt zu speichern.
Durch Repliken erreicht man Fehlertoleranz.
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
2. Charakterisierung der gespeicherten Inhalte
Charakterisierung mit Hilfe von Metadaten = Daten über Daten
Semantische Beschreibung verbessert den Suchprozess
• eingebettetes vs. externes Markup
• manuelle vs. maschinelle Erstellung
• URI (Uniform Resource Identifier): URN+URL (PURL, Resolutionsdienste)
Synergiepotentiale:
eScience kann Ontologien bereitstellen, die den Annotationsprozess unterstützen
Compute-GRIDs unterstützen rechenintensive Operationen wie Datamining
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
3. Wiedergabe der digital codierten Information
Bei Wechsel der Hardware-/Software-Plattform ist entweder Migration der gespeicherten Inhalte oder Emulation der alten Plattform notwendig.
Migration: Authentizität ist eventuell gefährdet – Aktuelle Plattformen optimal nutzbar
Emulation: Erheblicher Aufwand zur Bereitstellung sämtlicher „antiquierter“ Plattformen – Originale werden gespeichert.
Synergiepotentiale:
Migration bedeutet hohen Rechenaufwand zur Transformation großer Datenbestände. Hier bieten sich Compute-GRIDs an.
Emulation mit Hochleistungsrechnern des GRIDs. Remote Desktops bieten Zugang zu virtuellen „Lesesälen“
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Analyse von F&E-Projekten
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Fragen
Was soll archiviert werden? Nur die Originale?
Wie viele Repliken sollen erstellt werden?
Welche Archive sollen auf GRIDs portiert werden?
Zugangskontrolle:
- Wie werden Zugangsberechtigungen überprüft?
- Single Sign On?
Wer garantiert die Verfügbarkeit der zur LZA genutzten eScience- und GRID-Dienste?
....
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung
LEHRGEBIET RECHNERARCHITEKTURProf. Dr.-Ing. Wolfram Schiffmann
Vielen Dank für Ihre Aufmerksamkeit.
Univ.-Prof. Dr.-Ing. Wolfram Schiffmann
Fernuniversität HagenFakultät für Mathematik und InformatikLehrgebiet RechnerarchitekturUniversitätsstrasse 1D-58087 Hagen
email: [email protected]: +49-2231-987-325Telefax: +49-2331-987-332