Integrationsansätze: Überblick und Potentiale semantischer Technologien
-
Upload
andreas-schmidt -
Category
Business
-
view
2.549 -
download
2
Embed Size (px)
description
Transcript of Integrationsansätze: Überblick und Potentiale semantischer Technologien

1 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe
Integrationsansätze: Überblick und Potentiale semantischer Technologien
Andreas Schmidt
Abteilungsleiter im Forschungsbereich Information Process
EngineeringFZI Forschungszentrum Informatik, Karlsruhe
[email protected]://www.fzi.de/ipe

2Business Integration Forum 2007
Agenda
Strukturierung der Integrationsproblematik• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene
Potentiale semantischer Technologien• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene
Fazit

3Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
InformationsquellenDatenmodell, Schema, semantische Heterogenität
Präsentationsfragmenteclient-seitige Integration
Netzwerkprotokolle, RPCDarstellungssyntax
DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

4Business Integration Forum 2007
Informationsperspektive
Einzubindende „Quellen“ sind Informationsquellen
Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma
Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen
Hauptproblem: • Überwindung der semantischen Heterogenität
(Datenmodell, Schema, Instanzdaten)• Architekturen zur konsistenten Datenhaltung
(Aktualisierung!)

5Business Integration Forum 2007
Arten von Integrationskonflikten
Datenmodell
Logische Ebene:Schema
DatenInstanzen
Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
klassische »Schemaintegration«
Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)
Widersprüchlichkeit, Inkonsistenzen, Subjektivität

6Business Integration Forum 2007
Arten von Integrationskonflikten
Datenmodell
Schema
DatenInstanzen
Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
klassische »Schemaintegration«
Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)
Widersprüchlichkeit, Inkonsistenzen, Subjektivität

7Business Integration Forum 2007
Arten von Integrationskonflikten
Datenmodell
Schema
DatenInstanzen
Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
klassische »Schemaintegration«
Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)
Widersprüchlichkeit, Inkonsistenzen, Subjektivität

8Business Integration Forum 2007
Arten von Integrationskonflikten
Datenmodell
Schema
DatenInstanzen
Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen
Relational, Objektorientiert, XML, Semistrukturiert
Freiheitsgrade in der Modellierung der realen Welt
klassische »Schemaintegration«
Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)
Widersprüchlichkeit, Inkonsistenzen, Subjektivität

9Business Integration Forum 2007
Ebenen der semantischen Integration
Schemaintegration (bzw. Integration auf Schemaebene)• Zusammenführen und semantische Vereinheitlichung allein auf
der Basis von Schemainformationeno Typen, Klassen, Attribute, Vererbungsrelation etc.o Abbildung wird auf alle Instanzen angewendet
• Mapping-Tools
Instanzintegration (bzw. Integration auf Instanzebene)• Zusammenführen von Informationen über einzelne Instanzen
(oder Objekte)o auf der Basis von Werteno typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität,
wertabhängige Abbildungsregelno Schemainformation reicht als Information nicht aus!

10Business Integration Forum 2007
Konflikte auf Instanzebene
Probleme• Duplikate • Veraltete Daten• falsche Daten
WBeschreibung WPreis hergestelltVonWaren
Name Strasse Stadt PlzAbnehmer
Land
HName HStrasse HStadt HPlzHersteller
Kunde Ware BestMengebestellt
Datum PreisProduzentversorgt
Abnehmer Ware MengeDatum
VBrancheVerband
PName PStrasse PStadt PPlzProduzent
PLand betreutVon
KName KStrasse KStadt KPlzKunden
Blau AG Domstr. 3 Köln 50033... ... ... ...
Blau AG Zement 10020.05.01... ... ......
BLAU... ... ... ... ...
Neuestr. 8, Heidelberg, 69115, Deutschland
System 1 System 2

11Business Integration Forum 2007
Aufbau einer zentralen Datenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar
materialisierter Ansatza priori Integration (eager)
Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt:
virtueller AnsatzIntegration bei Bedarf (lazy)
Architektur : Virtuell vs. materialisiert

12Business Integration Forum 2007
Materialisierter Ansatz
Zentrale Datenbasis
(periodischer) Import in diezentrale Datenbasis
Quellen
Anwendung
für Anfragen wird nur die zentrale Datenbasis genutzt

13Business Integration Forum 2007
Virtuelle Integration
WrapperWrapper Wrapper
Mediator
Facilitator
Mediator
Quellenauswahl
Schema- undInstanzintegrati
on
Datenmodell-integration

14Business Integration Forum 2007
Materialisierter Ansatz – Vorteile
Einfach zu realisieren• Anwendungsentwicklung unterscheidet sich durch
zentrale Datenbasis kaum vom Ein-Quellen-Fall• Mehr Informationen über vorhandene Daten
Performant • Direkte Datenbankzugriffe für Anfrageauswertung• Entkopplung von (evtl. langsamen, nur teilweise
verfügbaren) externen Systemen• gezielte Optimierungen möglich
Nachbearbeitungsoperationen möglich• Von den Fremdanbietern gelieferte Daten können
(auch aufwendig) geprüft und bereinigt werden• Aggregation von Daten ebenfalls leicht möglich

15Business Integration Forum 2007
Materialisierter Ansatz: Nachteile
(redundante) Speicherung evtl. großer Datenmengen• leistungsfähige Infrastruktur erforderlich
Aktualität der Daten ist nicht gewährleistet• klassisches Caching-Problem
Aktualisierung • auf Initiative der Datenquellen
o organisatorische Maßnahmen erforderlicho Insbesondere: wir brauchen ein Austauschformat!
• Aktualisierung auf Initiative des Portalso bei großen Datenmengen häufig unpraktikabelo keine Information, was geändert wurde
Keine Kontrolle des Urhebers mehr über die Daten!

16Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
InformationsquellenDatenmodell, Schema, semantische Heterogenität
Präsentationsfragmenteclient-seitige Integration
Netzwerkprotokolle, RPCDarstellungssyntax
DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

17Business Integration Forum 2007
Dienstperspektive
Einzubindende Systeme sind Dienste• klar definierte Schnittstelle und zu erbringende
Funktionalität• deutlich spezifischer als Anfrageschnittstellen
Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden=> Dienstorientierte Architekturen
Hauptprobleme• Wie mache ich Dienste interoperabel?• Wie finde ich benötigte Dienste?• Wie beschreibe ich Dienste?

18Business Integration Forum 2007
Kernprobleme für dienstorientierte Architekturen
Kommunikationsprotokoll (technische Ebene)• Kodierung von Methodenaufruf und Parameterübergabe• Authentifizierung, Sicherheit etc.
Dienstbeschreibung• Konkrete Adresse (wie erreiche ich den Dienst)• Dienstschnittstelle (wie rufe ich ihn auf)• Semantik des Dienstes (was tut der Dienst)• Organisatorisches (was kostet der Dienst o.ä.)
Verzeichnisdienste
Möglichkeiten zur Aggregierung von Diensten

19Business Integration Forum 2007
Dienstorientierte Architekturen – Lose Kopplung
Dienst-nehmer
(service requestor)
Dienst-nehmer
(service requestor)
nutzen
Dienst-nehmer
(service requestor)
Dienst-nehmer
(service requestor)
nutzen
Dienst-nehmer
(service requestor)
Dienst-nehmer
(service requestor)
nutzen
Implementie-rungen werden
austauschbar
Mehrere Dienstehinter derselben
Fassade
mehrschrittigeVerarbeitung

20Business Integration Forum 2007
Prozessperspektive
Auf der Abstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge.• hier ist auch die wichtige Brücke zwischen der IT-Sicht
und der Geschäfts-Sicht
Dementsprechend spielt auch die Prozessintegration eine große Rolle.• viele Versuche, Prozess- und Dienstebene voneinander
zu trennen• allerdings: klare und eindeutige Trennung ist nicht so
einfach möglich

21Business Integration Forum 2007
Die Web-Service-Welt
NachrichtenMetadaten
RessourcenTransaktionenZuverlässigkeitSicherheit
Geschäftsprozesse Management
WSDLWS-Discovery
UDDI
WS-PolicyWS-Metadata-Exchange
SOAP WS-Notification WS-Adressing
Web ServicesResources Framework
WS-Business ActivityWS-Atomic Transact.WS-Coordination
WS-ReliabilityWS-Reliable Messag.
WS-SecurityWS-TrustWS-Security PolicyWS-FederationWS-Secure Conversat.
BPELWS-ChoreographyWS-Choreography Description Language
BPMLWSMFWS-ManagementMUWS
WS-EventsMOWSWSMF-WSM

22Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
InformationsquellenDatenmodell, Schema, semantische Heterogenität
Präsentationsfragmenteclient-seitige Integration
Netzwerkprotokolle, RPCDarstellungssyntax
DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

23Business Integration Forum 2007
Präsentationsebene
Grundidee ist hier: einheitliche Darstellung von unterschiedlichen Inhalten
Ansätze• Einbindung gerenderter Inhalte, also HTML-Fragmente
(=> Portlets)• reine Overlay-Techniken• Einbindung von GUI-Steuerelementen

24Business Integration Forum 2007
Google Maps Mashups

25 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe
Potentiale semantischer Technologien

26Business Integration Forum 2007
Motivation
Hauptherausforderung bei der Informationsintegration ist die Überwindung der semantischen Heterogenität
Dabei steht die prinzipielle Machbarkeit außer Frage.
Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff?• kann nur durch einen höheren Grad der Automatisierung
erreicht werden• und durch Spezifikationen auf höherer Abstraktionsebene

27Business Integration Forum 2007
Semantische Technologien...
... sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren.
Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik.
Prominenteste Vision dieser Technologieansätze ist das Semantic Web.

28Business Integration Forum 2007
Arten von Semantik
[Uschold (2002), “Where are the Semantics in the Semantic Web?”]

29Business Integration Forum 2007
Ontologien in der Informatik
Eine Ontologie [in der Informatik] ist eine
• explizite Spezifikation einer Konzeptualisierung [explicit specification of a conceptualization] (Gruber 1993)
• ein gemeinsames Verständnis einer bestimmten Domäne [shared understanding of a domain of interest] (Uschold & Grüninger 1996)
Formalitätsgrad kann variieren:• von kontrollierten Vokabularen bis hin zu
schwergewichtigen Ontologien mit logischer Axiomatisierung

30Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren
PräsentationsfragmenteMicroformats
DiensteDienstsemantikDienstfindung, -orchestrierung

31Business Integration Forum 2007
Grundidee
Modellierung von Konzepten und Relationen der Anwendungswelt als Ontologie (= konzeptuelle Modellierung)
Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen
Zur Laufzeit: Ausführung dieser Abbildungsregeln
Fortgeschritten:• semiautomatische Entdeckung diese Abbildungsregeln

32Business Integration Forum 2007
Anwendungen: Datenaustausch
RDBMS 1RDBMS 1 RDBMS 2RDBMS 2XMLXML XMLXML
OntologieOntologie
XSL-TXSL-T
Export-Werkzeugedes RDBMS
Import-Werkzeugedes RDBMS
BezugXML-Struktur Ontologie
BezugXML-Struktur Ontologie
XSL-TWerkzeug
automatisierter Vorgangmanueller Vorgang

33Business Integration Forum 2007
Bewertung
Ontologien sind wohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn• viel Domänenwissen benötigt wird• mit unvollständigen Informationen umgegangen wird
Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen

34Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren
PräsentationsfragmenteMicroformats
DiensteDienstsemantikDienstfindung, -orchestrierung

35Business Integration Forum 2007
Motivation
Bislang hat sich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt• Überprüfung, ob syntaktisch korrekter Aufruf• Generierung von sprachspezifischen Bindings
Aber:• keine Suche nach Diensten, die etwas Bestimmtes tun• keine automatisierte Kopplung• keine Prüfung von Qualitätsbeschreibungen
Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht.

36Business Integration Forum 2007
Dienste: Was wollen wir semantisch beschreiben?
Semantik der übertragenen Parameter • Mittel: semantische Annotation der Nachrichtenschemata• Zweck: Interoperabilität/Mediation
Semantik der Dienstfunktionalität• Mittel: Annotation, ggf. mit Vor-/Nachbedingungen• Zweck: Dienstfindung und -komposition
Semantik der Dienstgüte • Mittel: formale Beschreibung der Dienstgüte / SLAs• Zweck: Dienstfindung und Überprüfbarkeit
Ausführungssemantik • Mittel: formale Modellierung der Abläufe• Zweck: Validierung, Verifikation

37Business Integration Forum 2007
Beispiel: SemanticUDDI
Grundidee:• UDDI-Dienstverzeichnisse sind derzeit für Fachexperten
nur schwer zu benutzen• deshalb: Annotation um Fachsemantik• dies kann allerdings nur durch die Fachexperten selbst
erfolgen
Lösung• Kopplung eines UDDI-Verzeichnisses an ein
SemanticWiki-System
Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg

38Business Integration Forum 2007
Ontologiezentrierter Architekturstil

39Business Integration Forum 2007
Ontologie für die Lernunterstützungh
ttp://p
rofe
ssion
al-
learn
ing
.eu

40Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren
PräsentationsfragmenteMicroformats
ProzesseTraceability, Compliance

41Business Integration Forum 2007
Semantik für die Geschäftsprozessmodellierung
Traceability• Explizite semantische Zusammenhänge zwischen
Prozessmodellen und technischen Diensten• dadurch leichteres Change Management• erste Anwendungen im eGovernment
Überprüfung der Compliance• Beschreibung von Ausführungsbedingungen• damit z.B. Risikomanagement automatisierbar

42Business Integration Forum 2007
Integrationsebenen
Technische Ebene
Informationsebene
Anwendungslogikebene
Prozeßebene
Präsentationsebene
gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren
PräsentationsfragmenteMicroformats
ProzesseTraceability, Compliance

43Business Integration Forum 2007
Fazit: Semantische Technologien
Ontologiegestützte semantische Technologien sind mächtige Werkzeuge• standardisierte Technologien (Sprachen, Werkzeuge) für die
breite Anwendung vorhanden• erste Implementierungserfahrungen• bieten Vorteile in Richtung modellgetriebener Entwicklung• bessere Beherrschbarkeit komplexer Systeme durch höhere
Abstraktionsebene
Allerdings sollte ihr Einsatz wohldosiert erfolgen• Berücksichtigung von Skalierbarkeit• Aufwendige Entwicklung von Ontologien• Nutzen von Ontologien liegt vor allem im Umgang mit
o unvollständigen Informationeno hohem Maß an Hintergrundwissen

44Business Integration Forum 2007
Kontakt
Andreas SchmidtAbleitungsleiter Forschungsbereich Information Process EngineeringFZI Forschungszentrum Informatik, [email protected]://www.fzi.de/ipe