Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch...

12
Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch [email protected] Hauptstudiums-Orientierungseinheit 3. Juli 2007

Transcript of Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch...

Page 1: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

Vorstellung der Arbeitsgruppe

Heterogene Informationssysteme

Prof. Dr. Stefan Deß[email protected]

Hauptstudiums-Orientierungseinheit3. Juli 2007

Page 2: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 2

Was sind heterogene Informationssysteme?

• Heterogene Informationssysteme/-landschaften

1

– Menge von Informationssystemen einer Organisation

– die sich in ihren Merkmalen unterscheiden, bzgl.• zugrundeliegender Technologie

OS/390

ESA/390

Cobol

Windows

IA-32

CLinux

AMD64

C++

JavaJava VM

Page 3: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 3

• zugrundeliegender Technologie

• DBMS/Datenmodell

Was sind heterogene Informationssysteme?

IMS DB2 ONTOS XTC

hierarchisch(objekt-)relational

objekt-orientiert

XMLFoo

xy: int...

doFoo()...

1

<foo> <bar a="x"> ... </bar></foo>

• Heterogene Informationssysteme/-landschaften– Menge von Informationssystemen einer Organisation

– die sich in ihren Merkmalen unterscheiden, bzgl.

Page 4: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 4

• zugrundeliegender Technologie

• DBMS/Datenmodell

• Strukturierung

Was sind heterogene Informationssysteme?

1

• Heterogene Informationssysteme/-landschaften– Menge von Informationssystemen einer Organisation

– die sich in ihren Merkmalen unterscheiden, bzgl.

Page 5: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 5

• zugrundeliegender Technologie

• DBMS/Datenmodell

• Strukturierung

• Semantik

Was sind heterogene Informationssysteme?

"Auto""KFZ"

"PKW"

1

"Fahrzeug"

• Heterogene Informationssysteme/-landschaften– Menge von Informationssystemen einer Organisation

– die sich in ihren Merkmalen unterscheiden, bzgl.

Page 6: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 6

– Unabhängige Entwicklung der Systeme– Organisches Wachstum mit dem Unternehmen

Was sind heterogene Informationssysteme?

• zugrundeliegender Technologie

• DBMS/Datenmodell

• Strukturierung

• Semantik

Was sind heterogene Informationssysteme?

• Wie kommt es zu Heterogenität?

Controlling Personal Produktion

1

Lager

• Heterogene Informationssysteme/-landschaften– Menge von Informationssystemen einer Organisation

– die sich in ihren Merkmalen unterscheiden, bzgl.

Page 7: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 7

Heterogenität als Problem

• Verbindung von Daten aus verschiedenen Systemen

2

• Wichtiges Problem in Industrie und Wirtschaft

• Enorme Komplexität

– Reorganisation im Unternehmen, Unternehmensfusionen

– neue Anwendungen

Page 8: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 8

Informationsintegration

AG Heterogene Informationssysteme 3

• Problem: Integration ist extrem schwierig

• Verbergen der Heterogenität der Quellen

Integrationssystem

integriertesZielschema

föderierte DatenbanksystemeData Warehouses

• Bereitstellen einer konsistenten, integrierten Sicht

auch heute noch weitgehend manuell langsam und teuer

Page 9: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 9

PALADIN

• Dynamische Informationsintegration– neue Szenarien, z.B. Ad-hoc-Integration in Data Grids– schnell wechselnde Anforderungen, autonome Quellen, ...

manuelle Integration nicht praktikabel• Ziel: Erhöhung des Automatisierungsgrades • Schwerpunkte:

– Datenmodell-unabhängige Modellierung und Verwaltung von Metadaten und Daten

PALADIN Metamodel Stack– Erkennung semantischer Zusammenhänge (Schema Matching)

Schema Matching Framework (ScheMaF)– Erstellung von Abbildungen zwischen Quellen und Ziel

Integrationsmuster– Auffinden geeigneter Datenquellen (Discovery)

4

Page 10: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 10

Caro

• Wartung komplexer Informationslandschaften:– Vielzahl an Abhängigkeiten zwischen beteiligten Systemen,

z.B. durch Integrationslösungen– Gesamtsystem kaum kontrollierbar– Gefährdung des Gesamtsystems durch Modifikationen

• Change Impact Analysis– Präventiv ("What if"-Analyse)

• simulierte Durchführung von Änderungen

• Beurteilung der Auswirkungen

– Reaktiv• Erkennen von lokalen Änderungen

• Erkennen der Auswirkungen

• Reaktion: Benachrichtigung, sicherer Shutdown, Anpassung

• Umgang mit unvollständigen Informationen

5

Page 11: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 11

Entwicklung von Integrationslösungen

• Mögliche Transformationsinfrastrukturen zur Informationsintegration (oft kombiniert eingesetzt)– (Föderierte) DBMS, ETL-Werkzeuge, XML-Transformationssysteme

– Message-oriented Middleware, Dienste

Verarbeitungs- und Datenmodelle unterscheiden sich dramatisch!

Keine plattformunabhängige Betrachtung möglich

Systementwicklung, Modifikation, Migration, Optimierung komplex

• Ansatz: Integriertes, plattformunabhängiges Daten- und Verarbeitungsmodell– Integrationsplan (logische Operatoren)

– Integriertes Datenmodell

• Top-Down-Entwicklung• Optimierung

– Logische Optimierung

– Wahl der „besten“ Deploymentplattform

– Physische Optimierung

• Flexible Wahl der Integrationsstrategie6

Page 12: Vorstellung der Arbeitsgruppe Heterogene Informationssysteme Prof. Dr. Stefan Deßloch dessloch@informatik.uni-kl.de Hauptstudiums-Orientierungseinheit.

AG Heterogene Informationssysteme 12

Webangebot der Arbeitsgruppe

• Informationen zu – Mitarbeitern– Projekten– Offenen Arbeiten

(Projekt-/Diplom-/Bachelor-/Master-Arbeiten)

7

http://lgis.informatik.uni-kl.de/aghis/