Lernen von ALC -Konzepten in Beschreibungslogiken und...
-
Upload
nguyencong -
Category
Documents
-
view
215 -
download
0
Transcript of Lernen von ALC -Konzepten in Beschreibungslogiken und...
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Lernen von ALC-Konzepten inBeschreibungslogiken und Ontologien
Jens Lehmann
Institut für Künstliche IntelligenzFakultät Informatik
Technische Universität Dresden
21. Juni 2006
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Gliederung:Einführung in Beschreibungslogiken, insbesondere ALCOntologiesprache OWL-DLErklärung des Lernproblems für Konzepte inBeschreibungslogikenAnwendungsszenarienAnsätze zur Lösung des LernproblemsAusblick
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Beschreibungslogik
Beschreibungslogiken (engl. Description Logics) ist der Namefür eine Familie von Sprachen zur WissensrepräsentationFragmente Prädikatenlogik erster Ordnungweniger mächtig als Prädikatenlogik, aber dafür entscheidbareInferenzproblemeintuitive variablenfreie Syntax
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Wissensmodellierung
Repräsentation von Wissen mit Rollen, Konzepten undObjekten/IndividuenObjekt:
KonstanteBeispiele: Mary, John
Konzept:einstelliges PrädikatMenge von ObjektenBeispiele: Vater, Student
Rolle:zweistelliges Prädikatbeschreibt Verbindung zwischen ObjektenBeispiele: ist-Schwester-von, ist-Kind-von
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Wissensbasen
Wissen über eine Domain wird in Wissensbasis mit folgenderStruktur gespeichert:
Wissensbasis
TBox („terminology“), z.B.Woman ≡ Human u FemaleMother ≡ Female u ∃hasChild.>HappyFather v Father u ∀hasChild.Female
ABox („assertions“), z.B.Mother(MONICA)hasChild(MONICA, JESSICA)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Syntax von ALC-Konzepten
es sei NR eine Menge von Rollennamen und NC eine Mengevon Konzeptnamen (NR ∩ NC = ∅)Konzepte sind dann induktiv wie folgt definiert:
1 Jeder Konzeptname ist ein Konzept (atomares Konzept).2 Falls C und D ALC-Konzepte sind und r ∈ NR eine Rolle,
dann sind folgende Ausdrücke auch ALC-Konzepte:> (Top), ⊥ (Bottom)C t D (Disjunktion), C u D (Konjunktion), ¬C (Negation)∀r .C (universelle Restriktion), ∃r .C (existentielle Restriktion)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Syntax von Wissensbasen
Axiome (TBox):Äquivalenz (C , D Konzepte): C ≡ DBeispiel: Mother ≡ Female u ∃hasChild.>Ungleichheit (C , D Konzepte): C v DBeispiel: HappyFather v Father u ∀hasChild.Female
Zusicherungen (ABox):Konzeptzusicherung (C Konzept, a Objekt): C (a)Beispiel: Mother(MONICA)Rollenzusicherung (r Rolle, a, b Objekte): r(a, b)Beispiel: hasChild(MONICA, JESSICA)
neben Syntax muss natürlich auch Semantik definiert werden(wird hier weggelassen)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Reasoning
TBox:Subsumption zwischen Konzepten: C vT D bedeutet, dass Dallgemeiner als C bzgl. T ist, z.B. Mother vT WomanErfüllbarkeit von Konzepten: z.B. ist Male u Femaleunerfüllbar, wenn die zugehörige TBox das AxiomMale ≡ ¬Female enthält
ABox (und TBox):Konsistenz: ABox ist konsistent, falls sie widerspruchsfrei istInstanzproblem: es wird getestet, ob ein Objekt zu einemKonzept gehören mussRetrievalproblem: zu einem Konzept werden alle Instanzengefunden
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
OWL
Ontologie = formales System zur Wissensrepräsentation mitKonzepten und RelationenOWL ist Akronym für Web Ontology Language3 Varianten: OWL-Lite, OWL-DL, OWL-FullOWL-DL basiert auf Beschreibungssprache SHOIN (D)(mächtiger als ALC)weit verbreiteter Standard im Semantic Webviele Ontologie-Editoren (z.B. Protégé) und Reasoner (z.B.KAON2, Pellet, Racer, FACT) existieren für OWL-DL
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
OWL
Darstellung von Mother ≡ Female u ∃hasChild.>:
<owl:Class rdf:ID="mother"><owl:equivalentClass><owl:Class><owl:intersectionOf rdf:parseType="Collection"><owl:Class rdf:ID="female"/><owl:Restriction><owl:onProperty><owl:ObjectProperty rdf:ID="hasChild"/>
</owl:onProperty><owl:someValuesFrom rdf:resource="http://www.w3.org/2002/07/owl#Thing"/>
</owl:Restriction></owl:intersectionOf>
</owl:Class></owl:equivalentClass>
</owl:Class>
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Lernproblem
Zielkonzept (Target) wird aus gegebener Wissensbasis K alsHintergrundwissen, sowie positiven und negativen BeispielengelerntBeispiele haben die Form Target(a) (a ist ein Objekt)es sei E+ die Menge der positiven Beispiele, E− die Menge dernegativen BeispieleZiel: finden einer Definition Def der Form Target ≡ C , sodass sich K′ |= E+ und K′ 6|= E− für K′ = K ∪ {Def } ergibt,d.h. die positiven Beispiele folgen aus K′ und die negativenBeispiele folgen nicht aus K′
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Mögliche Anwendungen
ähnliche Anwendungsgebiete wie in der InduktivenLogikprogrammierung (ILP), bei der Logikprogramme ausBeispielen und Hintergrundwissen gelernt werdenILP wird z.B. in Biologie, Medizin und Sprachverarbeitungangewandtinkrementelles Lernen von OWL-Ontologien im Semantic WebVorteile gegenüber manuellem Definieren von Konzepten:
Definition ist konsistent mit dem bereits in der Wissensbasisgespeicherten WissenBearbeiter der Wissensbasis kennt manchmal genaue Definitionnicht oder ist sich unsicher, ob er alle relevanten Details erfassthat
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Beispiel 1 - Vater
Male ≡ ¬Female Male(MARC)Male(STEPHEN)
hasChild(STEPHEN,MARC) Male(JASON)hasChild(MARC,ANNA) Male(JOHN)hasChild(JOHN,MARIA) Female(ANNA)hasChild(ANNA,JASON) Female(MARIA)
Female(MICHELLE)
positiv:{STEPHEN, MARC, JOHN}negativ:{JASON, ANNA, MARIA, MICHELLE}
gelerntes Konzept: Male u ∃hasChild.>
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Beispiel 2 - Weinontologie
es sei eine Ontologie über Weine gegebenBearbeiter der Wissensbasis möchte neuesKonzept für Weine mit Chardonnay-Geschmackhinzufügendazu wählt er einige positive Beispiele aus: MountAdam Chardonnay, Corton Montrachet WhiteBurgundy, Chateau De Merseault, . . .andere Weine wählt er als negative Beispiele aus: LongridgeMerlot, Marietta Zinfandel, Chianti Classico, . . .Lernsystem schlägt Definition vor, z.B.:
∃hasColor.White u ∃hasBody.(Full t Medium)
u ∃hasFlavor.(Strong t Moderate)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Framework zum Lernen
Hintergrundwissen(OWL-DL, DL-KB)
positive und negativeBeispiele
(vorverarbeitetes)Hintergrundwissen
Qualitätsmessung
Retrieval- oderInstanz-Algorithmus
Konzeptgenerator z.B.brute force, zufällig,GP, RO-basierend
optionale Vorverarbeitung
Anfrage
Resultat
e Test Bewertungbenutzt
benutzt
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Genetische Programmierung
Funktionsweise:ALC-Konzepte werden als Bäume betrachtetes wird zufällig eine Menge von Bäumen erzeugt (Population)die Population wird fortlaufend verändert, indem gute Bäumeausgewählt (entspricht natürlicher Auslese nach Darwin) undvon genetischen Operatoren verändert werdenBeispiel für Baumdarstellung von Male u ∃hasChild.Female:
u
Male ∃hasChild
Female
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Genetische Programmierung - Eigenschaften
kann mit verrauschten Beispieldaten umgehen (d.h. Beispielekönnen fehlerhaft oder widersprüchlich sein)besonders geeignet, wenn Näherungslösungen akzeptabel sindgesamter Algorithmus ist stochastisch (verschiedeneDurchläufe können verschiedene Resultate ergeben)benötigt schnelle Algorithmen zur Abschätzung/Berechnungder Qualität einer LösungErfolg hängt wesentlich von den eingesetzten genetischenOperatoren ab
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Refinement-Operatoren
In einem geordneten Raum (S ,�) ist ein downward (upward)Refinement-Operator ρ eine Abbildung von S auf 2S , so dass fürjedes C ∈ S gilt: C ′ ∈ ρ(C ) impliziert C ′ � C (C � C ′). C ′ isteine Spezialisierung (Generalisierung) von C .
ALC-Refinement-Operatoren kann man definieren, indem manALC-Konzepte geordnet nach Subsumption betrachtetBeispiele für Subsumption zwischen ALC-Konzepten:
Male u ∀hasChild.Female v MaleMale 6vT FemaleFemale 6vT Male
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Refinement-Operatoren
Warum ist Subsumption eine geeignete Ordnung?Alle Beispiele, die aus einem Konzept folgen, folgen auch auseinem allgemeineren Konzept.
Wie löst man das Lernproblem mit z.B. einem downwardRefinement-Operator?
man beginnt die Suche beim allgemeinsten Konzept (>), ausdem alle positiven und negativen Beispiele folgendurch Anwendung des Operators gelangt man zu speziellerenKonzeptendies wird solange durchgeführt bis man ein Konzept findet, ausdem alle positiven, aber keine negativen Beispiele folgeneinfaches Suchverfahren (z.B. Breitensuche, Tiefensuche) istdabei nicht ausreichend; es muss eine geeignete Heuristikeingesetzt werden
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Refinement-Operatoren - Eigenschaften
Refinement-Operatoren und geeignete Heuristiken sind relativkomplex (deshalb wird hier kein konkreter Operator vorgestellt)es gibt eine Reihe von Eigenschaften vonRefinement-Operatoren, die bestimmen wie gut sie zum Lernengeeignet sindin einem Teil der Diplomarbeit wurden bzw. werden dieseEigenschaften untersucht (Fragestellung: WelcheKombinationen von Eigenschaften sind möglich bzw. schließensich aus?)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Refinement-Operatoren - Suchprozess
Warum ist die Suche schwierig?unendlicher Suchraumum „sinnvolle“ Operatoren zu definieren ist es günstiger, dassKonzepte auf eine unendliche Menge von anderen Konzeptenabgebildet werden (= unendliche Breite des Suchbaums)ALC ist “relativ ausdrucksstark“, da aussagenlogischabgeschlossen (über Konstruktoren ¬, u und t)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Refinement-Operatoren - charakteristische Eigenschaften
Refinement-Operatoren mit geeigneten Heuristikenermöglichen intelligente und effiziente Suchedeterministischer Algorithmustheoretische Garantien im Sinne von „Falls das Lernproblemeine Lösung hat, dann wird diese gefunden.“ sind möglichVerwendung von Refinement-Operatoren ist Methode der Wahlfür das Lernen in Ontologien (da dort keine verrauschten Datenvorliegen und ein deterministischer Algorithmus benötigt wird)
Beschreibungslogiken ALC OWL-DL Lernproblem Lösen des Lernproblems Ausblick
Ausblick und Ziele
Theorie zur Lösung des Lernproblems weiterentwickeln (wirdwährend Diplomarbeit gemacht)vollständige Implementierung (momentan funktionsfähigerPrototyp für genetische Programmierung vorhanden)Einbettung in einen OntologieeditorErweiterung der erlaubten Konzeptkonstruktoren um weitereFeatures von OWL:
Zahlenrestriktionen (≥ n r .C , ≤ n r .C , = n r .C )abgeschlossene Mengen von Objekten inKonzeptbeschreibungen (z.B. {ITALY, FRANCE, SPAIN})