Lernen von ALC -Konzepten in Beschreibungslogiken und...

23
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick Lernen von ALC -Konzepten in Beschreibungslogiken und Ontologien Jens Lehmann Institut für Künstliche Intelligenz Fakultät Informatik Technische Universität Dresden 21. Juni 2006

Transcript of Lernen von ALC -Konzepten in Beschreibungslogiken und...

Page 1: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Lernen von ALC-Konzepten inBeschreibungslogiken und Ontologien

Jens Lehmann

Institut für Künstliche IntelligenzFakultät Informatik

Technische Universität Dresden

21. Juni 2006

Page 2: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Gliederung:Einführung in Beschreibungslogiken, insbesondere ALCOntologiesprache OWL-DLErklärung des Lernproblems für Konzepte inBeschreibungslogikenAnwendungsszenarienAnsätze zur Lösung des LernproblemsAusblick

Page 3: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Beschreibungslogik

Beschreibungslogiken (engl. Description Logics) ist der Namefür eine Familie von Sprachen zur WissensrepräsentationFragmente Prädikatenlogik erster Ordnungweniger mächtig als Prädikatenlogik, aber dafür entscheidbareInferenzproblemeintuitive variablenfreie Syntax

Page 4: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Wissensmodellierung

Repräsentation von Wissen mit Rollen, Konzepten undObjekten/IndividuenObjekt:

KonstanteBeispiele: Mary, John

Konzept:einstelliges PrädikatMenge von ObjektenBeispiele: Vater, Student

Rolle:zweistelliges Prädikatbeschreibt Verbindung zwischen ObjektenBeispiele: ist-Schwester-von, ist-Kind-von

Page 5: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Wissensbasen

Wissen über eine Domain wird in Wissensbasis mit folgenderStruktur gespeichert:

Wissensbasis

TBox („terminology“), z.B.Woman ≡ Human u FemaleMother ≡ Female u ∃hasChild.>HappyFather v Father u ∀hasChild.Female

ABox („assertions“), z.B.Mother(MONICA)hasChild(MONICA, JESSICA)

Page 6: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Syntax von ALC-Konzepten

es sei NR eine Menge von Rollennamen und NC eine Mengevon Konzeptnamen (NR ∩ NC = ∅)Konzepte sind dann induktiv wie folgt definiert:

1 Jeder Konzeptname ist ein Konzept (atomares Konzept).2 Falls C und D ALC-Konzepte sind und r ∈ NR eine Rolle,

dann sind folgende Ausdrücke auch ALC-Konzepte:> (Top), ⊥ (Bottom)C t D (Disjunktion), C u D (Konjunktion), ¬C (Negation)∀r .C (universelle Restriktion), ∃r .C (existentielle Restriktion)

Page 7: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Syntax von Wissensbasen

Axiome (TBox):Äquivalenz (C , D Konzepte): C ≡ DBeispiel: Mother ≡ Female u ∃hasChild.>Ungleichheit (C , D Konzepte): C v DBeispiel: HappyFather v Father u ∀hasChild.Female

Zusicherungen (ABox):Konzeptzusicherung (C Konzept, a Objekt): C (a)Beispiel: Mother(MONICA)Rollenzusicherung (r Rolle, a, b Objekte): r(a, b)Beispiel: hasChild(MONICA, JESSICA)

neben Syntax muss natürlich auch Semantik definiert werden(wird hier weggelassen)

Page 8: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Reasoning

TBox:Subsumption zwischen Konzepten: C vT D bedeutet, dass Dallgemeiner als C bzgl. T ist, z.B. Mother vT WomanErfüllbarkeit von Konzepten: z.B. ist Male u Femaleunerfüllbar, wenn die zugehörige TBox das AxiomMale ≡ ¬Female enthält

ABox (und TBox):Konsistenz: ABox ist konsistent, falls sie widerspruchsfrei istInstanzproblem: es wird getestet, ob ein Objekt zu einemKonzept gehören mussRetrievalproblem: zu einem Konzept werden alle Instanzengefunden

Page 9: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

OWL

Ontologie = formales System zur Wissensrepräsentation mitKonzepten und RelationenOWL ist Akronym für Web Ontology Language3 Varianten: OWL-Lite, OWL-DL, OWL-FullOWL-DL basiert auf Beschreibungssprache SHOIN (D)(mächtiger als ALC)weit verbreiteter Standard im Semantic Webviele Ontologie-Editoren (z.B. Protégé) und Reasoner (z.B.KAON2, Pellet, Racer, FACT) existieren für OWL-DL

Page 10: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

OWL

Darstellung von Mother ≡ Female u ∃hasChild.>:

<owl:Class rdf:ID="mother"><owl:equivalentClass><owl:Class><owl:intersectionOf rdf:parseType="Collection"><owl:Class rdf:ID="female"/><owl:Restriction><owl:onProperty><owl:ObjectProperty rdf:ID="hasChild"/>

</owl:onProperty><owl:someValuesFrom rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>

</owl:Restriction></owl:intersectionOf>

</owl:Class></owl:equivalentClass>

</owl:Class>

Page 11: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Lernproblem

Zielkonzept (Target) wird aus gegebener Wissensbasis K alsHintergrundwissen, sowie positiven und negativen BeispielengelerntBeispiele haben die Form Target(a) (a ist ein Objekt)es sei E+ die Menge der positiven Beispiele, E− die Menge dernegativen BeispieleZiel: finden einer Definition Def der Form Target ≡ C , sodass sich K′ |= E+ und K′ 6|= E− für K′ = K ∪ {Def } ergibt,d.h. die positiven Beispiele folgen aus K′ und die negativenBeispiele folgen nicht aus K′

Page 12: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Mögliche Anwendungen

ähnliche Anwendungsgebiete wie in der InduktivenLogikprogrammierung (ILP), bei der Logikprogramme ausBeispielen und Hintergrundwissen gelernt werdenILP wird z.B. in Biologie, Medizin und Sprachverarbeitungangewandtinkrementelles Lernen von OWL-Ontologien im Semantic WebVorteile gegenüber manuellem Definieren von Konzepten:

Definition ist konsistent mit dem bereits in der Wissensbasisgespeicherten WissenBearbeiter der Wissensbasis kennt manchmal genaue Definitionnicht oder ist sich unsicher, ob er alle relevanten Details erfassthat

Page 13: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Beispiel 1 - Vater

Male ≡ ¬Female Male(MARC)Male(STEPHEN)

hasChild(STEPHEN,MARC) Male(JASON)hasChild(MARC,ANNA) Male(JOHN)hasChild(JOHN,MARIA) Female(ANNA)hasChild(ANNA,JASON) Female(MARIA)

Female(MICHELLE)

positiv:{STEPHEN, MARC, JOHN}negativ:{JASON, ANNA, MARIA, MICHELLE}

gelerntes Konzept: Male u ∃hasChild.>

Page 14: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Beispiel 2 - Weinontologie

es sei eine Ontologie über Weine gegebenBearbeiter der Wissensbasis möchte neuesKonzept für Weine mit Chardonnay-Geschmackhinzufügendazu wählt er einige positive Beispiele aus: MountAdam Chardonnay, Corton Montrachet WhiteBurgundy, Chateau De Merseault, . . .andere Weine wählt er als negative Beispiele aus: LongridgeMerlot, Marietta Zinfandel, Chianti Classico, . . .Lernsystem schlägt Definition vor, z.B.:

∃hasColor.White u ∃hasBody.(Full t Medium)

u ∃hasFlavor.(Strong t Moderate)

Page 15: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Framework zum Lernen

Hintergrundwissen(OWL-DL, DL-KB)

positive und negativeBeispiele

(vorverarbeitetes)Hintergrundwissen

Qualitätsmessung

Retrieval- oderInstanz-Algorithmus

Konzeptgenerator z.B.brute force, zufällig,GP, RO-basierend

optionale Vorverarbeitung

Anfrage

Resultat

e Test Bewertungbenutzt

benutzt

Page 16: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Genetische Programmierung

Funktionsweise:ALC-Konzepte werden als Bäume betrachtetes wird zufällig eine Menge von Bäumen erzeugt (Population)die Population wird fortlaufend verändert, indem gute Bäumeausgewählt (entspricht natürlicher Auslese nach Darwin) undvon genetischen Operatoren verändert werdenBeispiel für Baumdarstellung von Male u ∃hasChild.Female:

u

Male ∃hasChild

Female

Page 17: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Genetische Programmierung - Eigenschaften

kann mit verrauschten Beispieldaten umgehen (d.h. Beispielekönnen fehlerhaft oder widersprüchlich sein)besonders geeignet, wenn Näherungslösungen akzeptabel sindgesamter Algorithmus ist stochastisch (verschiedeneDurchläufe können verschiedene Resultate ergeben)benötigt schnelle Algorithmen zur Abschätzung/Berechnungder Qualität einer LösungErfolg hängt wesentlich von den eingesetzten genetischenOperatoren ab

Page 18: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Refinement-Operatoren

In einem geordneten Raum (S ,�) ist ein downward (upward)Refinement-Operator ρ eine Abbildung von S auf 2S , so dass fürjedes C ∈ S gilt: C ′ ∈ ρ(C ) impliziert C ′ � C (C � C ′). C ′ isteine Spezialisierung (Generalisierung) von C .

ALC-Refinement-Operatoren kann man definieren, indem manALC-Konzepte geordnet nach Subsumption betrachtetBeispiele für Subsumption zwischen ALC-Konzepten:

Male u ∀hasChild.Female v MaleMale 6vT FemaleFemale 6vT Male

Page 19: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Refinement-Operatoren

Warum ist Subsumption eine geeignete Ordnung?Alle Beispiele, die aus einem Konzept folgen, folgen auch auseinem allgemeineren Konzept.

Wie löst man das Lernproblem mit z.B. einem downwardRefinement-Operator?

man beginnt die Suche beim allgemeinsten Konzept (>), ausdem alle positiven und negativen Beispiele folgendurch Anwendung des Operators gelangt man zu speziellerenKonzeptendies wird solange durchgeführt bis man ein Konzept findet, ausdem alle positiven, aber keine negativen Beispiele folgeneinfaches Suchverfahren (z.B. Breitensuche, Tiefensuche) istdabei nicht ausreichend; es muss eine geeignete Heuristikeingesetzt werden

Page 20: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Refinement-Operatoren - Eigenschaften

Refinement-Operatoren und geeignete Heuristiken sind relativkomplex (deshalb wird hier kein konkreter Operator vorgestellt)es gibt eine Reihe von Eigenschaften vonRefinement-Operatoren, die bestimmen wie gut sie zum Lernengeeignet sindin einem Teil der Diplomarbeit wurden bzw. werden dieseEigenschaften untersucht (Fragestellung: WelcheKombinationen von Eigenschaften sind möglich bzw. schließensich aus?)

Page 21: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Refinement-Operatoren - Suchprozess

Warum ist die Suche schwierig?unendlicher Suchraumum „sinnvolle“ Operatoren zu definieren ist es günstiger, dassKonzepte auf eine unendliche Menge von anderen Konzeptenabgebildet werden (= unendliche Breite des Suchbaums)ALC ist “relativ ausdrucksstark“, da aussagenlogischabgeschlossen (über Konstruktoren ¬, u und t)

Page 22: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Refinement-Operatoren - charakteristische Eigenschaften

Refinement-Operatoren mit geeigneten Heuristikenermöglichen intelligente und effiziente Suchedeterministischer Algorithmustheoretische Garantien im Sinne von „Falls das Lernproblemeine Lösung hat, dann wird diese gefunden.“ sind möglichVerwendung von Refinement-Operatoren ist Methode der Wahlfür das Lernen in Ontologien (da dort keine verrauschten Datenvorliegen und ein deterministischer Algorithmus benötigt wird)

Page 23: Lernen von ALC -Konzepten in Beschreibungslogiken und ...jens-lehmann.org/files/2006/alc_konzepte_lernen_praesentation.pdf · man beginnt die Suche beim allgemeinsten Konzept (>),

Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick

Ausblick und Ziele

Theorie zur Lösung des Lernproblems weiterentwickeln (wirdwährend Diplomarbeit gemacht)vollständige Implementierung (momentan funktionsfähigerPrototyp für genetische Programmierung vorhanden)Einbettung in einen OntologieeditorErweiterung der erlaubten Konzeptkonstruktoren um weitereFeatures von OWL:

Zahlenrestriktionen (≥ n r .C , ≤ n r .C , = n r .C )abgeschlossene Mengen von Objekten inKonzeptbeschreibungen (z.B. {ITALY, FRANCE, SPAIN})