Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf...

Post on 05-Apr-2015

110 views 4 download

Transcript of Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf...

Wissenstechnologienam Beispiel “Goethe-Tour”

Dr.-Ing. Katja Hose <hose@mpi-inf.mpg.de>Steffen Metzger <smetzger@mpi-inf.mpg.de>PD Dr.-Ing. Ralf Schenkel <schenkel@mpi-inf.mpg.de>

Max-Planck-Institut für Informatik

Tourismus-Projekt „Goethe-Tour“

Use-Case unter Einbeziehung von Umwelt-Community und Text-Grid

Ziel: Wirkungsstätten Goethes in Sachsen zu einer Reiseroute zusammenstellen

Erste Teilaufgabe: alle relevanten Orte finden

Später weitere Informationen über Orte sammeln

Aufwendige Suche

Problematische Aspekte:

Verschiedene Quellen mit verschiedenen Such-Interfaces

Diverse Schreibweisen z.B. „Goethe“, „Johann Wolfgang von Goethe“

Eingrenzung der Suche schwierig

zusätzliches Schlüsselwort „Aufenthalt“, „Reise“ ,… ?

Relevante Ergebnisse könnten ausgeschlossen werden

Dokumente müssen alle gelesen werden zur Extraktion des interessanten Wissens:

Orte, an denen Goethe war

Weitere Informationen zu den Orten, z.B.Befindet sich der Ort in Sachsen?

Gibt es dort interessante Sehenswürdigkeiten?

Föderierte Suche: WisNetGrid als Vermittler

?

?

?

?

?

?

- Keywordsuche (z.B. „Goethe Dresden“)- Metadatensuche (z.B. nach „Autor=Goethe“)

Automatische Anfrageerweiterung:„Goethe“→ „Johann Wolfgang von Goethe“

Öffentliche Daten

Community Grids

WWW

Anbindung neuer Quellen

Einheitliche Schnittstelle für Datenzugriff

Siehe Vortrag zur Datenanbindung

Kenntnis über lokale Metadatenschemata zur Umwandlung bei Metadatensuche

z.B. Autor → owner; Erstellungsdatum → date

2 Möglichkeiten:

1. Sicherstellung der Kompatibilität lokaler Suchkomponenten (in Kooperation mit Community)

2. Installation von WisNetGrid bereit gestellter Komponenten

→ Einfache Anbindung

Manuelle Textanalyse

Durch die Suche erhaltene Daten müssen manuell verarbeitet werden

→ Zeit- und damit kostenintensiv

• Weite Teile des Textes für eigentliche Suche uninteressant

• Lässt sich manuelle Textanalyse beschleunigen?

→ Querlesen!

Ist das Auffinden wichtiger Passagen automatisch unterstützbar?

→ Hervorherbung wichtiger Entitäten

Beispiel Entitätserkennung

= Goethe

= Orte = Daten

= Personen

Im April 1770 setzte Goethe sein Studium in Straßburg fort. Diesmal widmete er sich zielstrebiger den juristischen Studien, fand aber auch Zeit, eine ganze Reihe persönlicher Bekanntschaften anzuknüpfen. Die wichtigste davon war die mit dem Theologen, Kunst- und Literaturtheoretiker Johann Gottfried Herder. Der Ältere öffnete ihm die Augen für die ursprüngliche Sprachgewalt von Autoren wie Homer, Shakespeare und Ossion sowie der Volkspoesie und gab so entscheidende Impulse für Goethes dichterische Entwicklung. Später sollte er auf Goethes Fürsprache hin in weimarische Dienste berufen werden.Auf einem Ausritt in die Umgebung lernte Goethe in Sesenheim die Pfarrerstochter Friederike Brion kennen und lieben. Bei seiner Abreise aus Straßburg beendete der bindungsscheue junge Goethe die Beziehung; die an Friederike gerichteten Gedichte, waren in ihrer Ausdruckskraft „der revolutionäre Beginn einer neuen lyrischen Epoche“.

Redundanz und Heterogenität

Anschließend reiste Goethe nach Dresden

…am 25. war Goethe wieder in Dresden…

Goethe besuchte Dresden mehrmals…

Bei einem Besuch in Dresden…

Goethe verließ Dresden…

Faktensuche

Suche nach abstrakten Fakten

Anschließend reiste Goethe nach Dresden

…am 25. war Goethe wieder in Dresden…

Goethe besuchte Dresden mehrmals…

Bei einem Besuch in Dresden…Goethe verließ Dresden…

„Goethe war_in Dresden“Abstrakter Fakt:

Suche auf Fakten

Anfrage: „Goethe war_in X“

Ergebnisliste:

„Goethe war_in Frankfurt“

„Goethe war_in Dresden“

„Goethe war_in Straßburg“

50 Dokumente

46 Dokumente

42 Dokumente

„Goethe war_in Sesenheim“22 Dokumente

„Goethe war_in Dresden“

Quelldokumente

Wissensextraktion

Im April 1770 verließ Goethe Frankfurt, um dem Wunsch seines Vaters entsprechend

sein Studium zu beenden.

„Goethe war_in Frankfurt“

Wissensverwaltung(Ontologie)

Hinzulernen

Fakt extrahieren

Textmustererkennung

verließ X Y „X war_in Y“Musterbedeutung

erkennen

Bekannte Muster

Wissensextraktion

1771 kehrte Goethe nach Frankfurt zurück, um dort eine kleine Anwaltskanzlei zu eröffnen. „Goethe war_in Frankfurt“

Wissensverwaltung(Ontologie)

Bekannter Fakt

kehrte X nach Y zurück

„X war_in Y“

Musterbedeutungableiten

Hinzulernen

Ontologien

Ontologien sind eine Repräsentationsform von Wissen

Unterteilung in Konzepte, Instanzen von Konzepten und Beziehungen zwischen diesen

Modellierung als Tripel der Form

(Goethe,war_in,Dresden)

Person Stadt

Goethe Dresdenwar_in

ist_Instanz_vonist_Instanz_von

Ontologien

Ontologie

Landschafts-ontologie

vonCommunity 1

Historische Reiserouten-

ontologievon

Community 2

Ontologievermittlung

Stellt Mappings zur gemeinsamen Nutzung zur Verfügung

Ontologieverwaltung

Erlaubt Verwaltung und Anpassung von Ontologien

Welche Ontologie? Woher Basiswissen nehmen?

Basis-Ontologie(Musterverwaltung ...)

Ontologiesuche

Schlussfolgerungen

Ontologie

„Goethe war_in Dresden“

„Dresden gehört_zu Sachsen“

Anfrage: „Goethe war_in Sachsen“?

Antwort: nein

Ontologieschlussfolgerung

„Goethe war_in Sachsen“

Antwort: ja

Community-spezifische Lösungen

Sehr heterogene Daten in Communitys

→ Extraktionskomponenten modular und generisch → Anpassbarkeit über Parameter → Austausch einzelner Komponenten möglich → u.U. Vorverarbeitung von Daten sinnvoll

Wiederverwendung von Anpassungen

Ontologiesuche, um existente Ontologien mit Themenwissen einzubinden

Dienstesuche siehe Vortrag zu Diensten

Existierende Dienste suchen/verwalten/koppeln

z.B. zur Vorverarbeitung der Daten

WisNetGrid-Dienste zur Wissenssuche

Föderierte Suche über angebundenen Quellen

Automatische semantische Anpassung bzw. Erweiterung von Suchanfragen

Entitätenerkennung (Named-Entity-Recognition)

Ontologieverwaltung und -suche sowie automatische Ontologieerweiterung

Wissensextraktion, um in Daten enthaltenes Wissen abstrakt zusammengefasst in Ontologien abzulegen

Suche auf den extrahierten Fakten