I f ii f i Ontologie für Informationssysteme Heinrich Herre Universität Leipzig.

Post on 06-Apr-2015

102 views 0 download

Transcript of I f ii f i Ontologie für Informationssysteme Heinrich Herre Universität Leipzig.

i f i

Ontologie fürInformationssysteme

Heinrich HerreUniversität Leipzig

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Inhalt

Ontologien Forschungsgruppe Onto-Med GFO (General Formal Ontology) Qualitätskriterien für Ontologien Funktionen Ausblick

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 1

Ontologie als Wissenschaft

Formale Ontologie: Ziel: formalen Beschreibung von Dingen, Modi,

Strukturen und Prozessen der Welt auf der Grundlage von Kategoriensystemen

Methoden aus: Fachwissenschaft, Logik, Künstliche Intelligenz, Philosophie, Kognitionspsychologie

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 2 Ontologie als Wissenschaft

Allgemeine formale Ontologie: Ziel: formale und axiomatische Beschreibung der allgemeinsten Kategorien der Welt

Methoden aus: Logik, Linguistik, Philosophie, Künstliche

Intelligenz Kooperation mit Fachwissenschaftlern

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 3

Kategorie:

durch einen sprachlichen Ausdruck F repräsentiertes System inhaltlicher Bedingungen und Bestimmungen, die a) von Entitäten ausgesagt (prädiziert) werden

können oder b) die von Entitäten erfüllt werden können.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 4

Kategorien Grundbeziehungen zwischen Kategorien und

Entitäten C(Expr) sei die durch den Ausdruck Expr

repräsentierte Kategorie, E eine Entität.

a) C(Expr) wird von E ausgesagt, b) E erfüllt C(Expr) c) E ist Instanz von C(Expr)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 5

Klassifikation von Kategorien

Kategorie

Immanentes Universal

KonzeptSymbol-struktur

TranszendentaleKategorie ?

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 6

Ontologie als Informationsystem

Eine Ontologie ist eine Spezifikation einer Konzeptualisierung (T. Gruber, 1993)

Repräsentationsformen: a) Sprachbasierte Systeme b) Graphbasierte Systeme

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 7

Sprachbasierte Repräsentation: Ont = (L, V, Ax, Sem) L eine formale Repräsentationssprache V ein Vokabular (Symbole für Prädikate,

Relationen, und Konstanten, entspricht der Konzeptualisiersung)

Ax: Menge von Axiomen über V (entspricht

der Spezifikation) Sem : modelltheoretische Semantik

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 8

Beispiele: DL (Description Logic) FOL (First Order Logic) CL (Common Logic)

D: Domäne

Mod(Axiome)

Spec: Axiome

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 9

Graphbasierte Repräsentation

Ont = (Tm, C, Rel, Def, G) Tm := Menge von TermenC := Menge von KonzeptenG:= Gerichteter Graph, dessen Knoten mit Konzepten und dessen Kanten mit Relationen bewertet sind.Def: C Rel L (Sprache)Def(d) ist eine Definition von d, formuliert in L

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 10

Beispiele: Semantische Netze Konzeptuelle Graphen Entity Relationship Model (ER-Modell)

D: Domäne Spec:Graph

Mod(Graph)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 11

Abstraktionsstufen von Ontologien

Top-Level Ontologie TLODomänenontologien (DO)Domänenkernontologien (DKO)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ontologie 12

Ebenen

TLO

BiologyKernontologie

Genetics Cytology Physiologie Ethology Ecology

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Onto-Med

Grundlagen der Formalen Ontologie Formale Werkzeuge für die Entwicklung

von Ontologien Domänenontologien Computer-basierte Anwendungen

Contact Heinrich Herre, Markus Löffler www.onto-med.de

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Onto-Med

Formale Ontologie und Axiomatik Sprachentwurf, Metalogik, Semantik Ontologien in verschiedenen Domänen

Theories

Concepts

Applications

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Onto-Med

Integrated Framework for the Development and Application of Ontologies (IFDAO)

Integrated System of Foundational Ontologies (ISFO)

Ontology Languages (OL) Development Tools (DT)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Onto-Med

Architektur

IFDAO

ISFO OL DT

GFO DOLCE ? Onto-Builder

Onto-Wiki ?

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Onto-Med

General Formal Ontology (GFO)

Reports on GFO: - Part I (Basic Principles) - Part II (Axiomatics and Ontology

Languages) - Part III (Applications) - Part IV (GFO Problem Book)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO

Meta-Architecture

Abstract top levelSet / Item

Abstract Core Level

Basic Level

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO

Abstract Top Level

Entity

Set Item

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO

Abstract Top Level (partial)

Item

Category Individual

Concept UniversalSymbol

Structure Concrete abstract

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Selected GFO Categories (Basic)concrete individual

space-timeentity

occurrentpresential

quality

timeentity

spatialentity

spatialboundary

spaceregion

timeregion

timeboundary

topoid chronoid

materialstructure

configur-ation

process change

materialboundary

materialobject

situation situoid

relatorrole functioncomplexindividual

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO Basic Relations 1 (selection)

Arität > 1

membership [entity, set] e S instantiation [entity, category] e :: C has-quality [bearer, quality] hqual(B,q) inherence [bearer, accidential] inh(a,B)

Part-of spatial-part-of [space entity, space entity] spart(a,b)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO Basic Relations (2) (selection)

Part-ofspace spatial-part-of [space-entity, space-entity] spart(a,b)

time temporal-part-of [time-entity, time entity] tpart(a,b)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO Basic Relations (3) (selection)

part-of

material structure material-part-of [material struct, material struct] matpart(a,b)

process processual-part-of [process., process] procpart(a,b)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

GFO Basic Relations (4) (selection)

part of

configurations/configuroid constituent-part-of [conf, conf] cpart(a,b)

relativized part ofpart(x,y,C) := x ist Teil von y relativ zu der

Kategorie C

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 1

Wie lässt sich die Qualität einer Ontologie abschätzen und bewerten?

Kritik an existierenden Ontologien in: L. N. Soldatova, R. D. King„Are the current ontologies in biology good

ontologies?

Nature Biotechnology, vol. 23, N. 9, September 2005S. 1095-1098Weitere Diskussion zu diesem Artikel inNature Biotechnology , vol. 24, N. 1. 2006, S.21-23

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 2

Die meisten der Ontologien, wie z.B. UMLS und GO, FMA u.a. sind nicht sprachbasierter Form

gegeben, sondern graph-basiert.

Analyse einer eine graph-basierte Ontologie (z.B. UMLS):

Ont = (Tm, C, Rel, Def, G)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 3

Folgende Kriterien werden zu Grunde gelegt:

- Korrektheit- Konsistenz- Vollständigkeit- Natürlichsprachliche Definitionen- Formale Definitionen- Ausdrucksfähigkeit- Einfachheit- Stabilität- Ontologische Fundiertheit

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 4

Die Kritik an bestehenden Ontologien behauptet, dassverschiedene der genannten Bedingungen, insbesondereKorrektheit und Konsistenz, nicht (immer) erfüllt sind.

These: Die Kritik ist nicht immer begründet, da sie auf einem unzureichenden Verständnis der Begriffe „Konsistenz“, „Korrektheit“ u.s.w. beruht.

Analyse von Konsistenz, Korrektheit und Vollständigkeit.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 5

Tax(Ont) sei das taxonomische Gerüst einer Ontologie.

Der Ausdruck C is-a D hat die Bedeutung: tr(C is-a D) = x (x :: C x :: D) und Ax(Tax(Ont)) = { tr(C is-a D) | C is-a D ist ein Link in Ont}. Tax(Ont) ist logisch konsistent genau dann, wenn

Ax(Tax(Ont)) logisch konsistent ist.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 6

Satz. Ax(Tax(Ont)) ist logisch konsistent.Beweis.Ax(Tax(Ont)) enthält nur definite Formeln. Eine Menge von definiten Formeln ist stets logisch konsistent. Es gilt

x (x :: C x :: D) x ( (x::C) (x::D)).Für Formeln dieser Art lässt sich stets ein Modell

finden.Korollar: Eine Taxonomie ist stets logisch konsistent.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 7

Beispiel: Tax(Ont) enthalte:

1) C1: apoptosis is-a cellular component x (x :: apoptosis x :: cellular component)

2) C2: apoptosis is-a biological process. x (x :: apoptosis x:: biological process)

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 8

{C1, C2} ist logisch konsistent. Jedoch gilt, dassC3: x ( x :: biological process x :: cellular

component)C4: x (x :: apoptosis).

Die Theorie {C1,C2,C3,C4} ist logisch inkonsistent!

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 9

Analyse

C3, C4 gehören zur biologischen Theorie Th(Bio), sind

aber nicht aus Ax(Tax(Ont)) ableitbar. Wenn Ax(Tax(Ont)) konsistent aber Ax(Tax(Ont)) Th(Bio) logisch inkonsistent ist,

dann heißt Ax(Tax(Ont)) relativ inkonsistent zu Th(Bio), Wenn Ax(Tax(Ont)) Th(Bio), dann heißt Ax(Tax(Ont)) relativ konsistent zu Th(Bio).

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 10

Korrektheit (am Beispiel einer Taxonomie)

Eine Taxonomie Tax(Ont) ist korrekt für die Domäne D, wenn D |= Ax(Tax(Ont)), d.h. wenn für alle is-a(C,D)-Links gilt D |= Ax(C,D).

D |= F bedeutet: „F ist wahr in D.“ Da stets vorausgesetzt wird, dass Th(Bio)

korrekt für D ist, so folgt aus der Korrektheit von Tax(Ont) die relative Konsistenz von Tax(Ont) für Th(Bio).

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 11

Weitere Probleme mit Konsistenz und Korrektheit

a) Dynamik von Theorien Folgende Fall ist zu beachten: Ax(Tax(Ont)) ist relativ konsistent zu T zum Zeitpunkt t. T ändert sich auf Grund neuer

Erkenntisse zu einer Theorie S zum Zeitpunkt s. Dann kann

Ax(Tax(Ont)) S inkonsistent werden. Jede Ontologie muss daher als ein evolutionäres System angesehen werden.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 12

b) Nicht-monotones Schließen Beispiel: T enthalte den Satz: x (Vogel(x) fliegt(x)). Dann lässt sich aus T1 = T {Vogel (d)} logisch ableiten: T1 |- fliegt(d). Wenn T1 zu T2 = T1 {Pinguin(d)} erweitert wird, dann gilt nicht mehr T2 |- fliegt(d). Der Bestand der bereits bewiesenen Sätze bleibt also bei Erweiterung der Theorie nicht erhalten, das Schließen wird nicht- monoton.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 13

Der Satz x (Vogel(x) fliegt(x)) darf daher nicht im strikt logischen Sinne verstanden, sondern als Regel über den Normalfall („Default-Regel“).

Neue Interpretation: x (Vogel(x) Cons:fliegt(x)) fliegt(x))

(Wenn x ein Vogel ist und kein Fakt über x bekannt ist, der der Flugfähigkeit von x widerspricht (d.h. wenn die Flugfähigkeit als konsistent zum aktuellen Wissen angenommen werden kann), dann kann x fliegen).

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 14

Eine empirische Theorie T hat dann mehrere Bestandteile:

T = ( T(0), D, E), wobei: - T(0) ist eine Theorie im klassischen Sinne - D ist eine Menge von Default-Regeln der

Gestalt: x (A(x) Cons:B(x)) B(x)) - E ist eine Menge von Ausnahmen: {C1(x), ..., Cn(x)}.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 15

Die Defaultregel x (A(x) Cons:B(x)) B(x)) ist wie folgt zu handhaben. Um B(d) zu zeigen wird zunächst A(d) gezeigt,

und dann wird geprüft, ob die Bedingungen C1(d),..., Cm(d) erfüllt sind (d.h. es wird

gezeigt, dass nach dem aktuellen Wissen E die Entität d keine

Ausnahme darstellt). Dann kann auf B(d) geschlossen werden.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 16

Die Theorie T = ( T(0), D, E) kann nicht in eine klassische Theorie überführt werden, da die Menge E der Ausnahmen nicht als abgeschlossen angesehen werden kann.

Wie können die Qualitätskriterien der Konsistenz

und Korrektheit gesichert werden? Eine absolute Sicherheit gibt es nicht, da

Konsistenz und Korrektheit wesentlich auf dem z.Z. anerkannten Stand des Wissens eines Fachgebiets aufbaut. Konsistenz und Korrektheit werden daher durch Experten eines Fachgebiets bestimmt.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 17

Einige Methoden zur Verbesserung der Konsistenz und Korrektheit von Ontologien.

Technische Methoden: a) Werkzeuge für die ontologische und formal-

logische Analyse. Verwendung von Methoden aus der Linguistik und Kognitionspsychologie b) Werkzeuge aus der Künstlichen Intelligenz, z.B. Nicht-monotones Schließen, unscharfes

Schließen, Prototyptheorie u.s.w.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 18

Soziale Methoden und Prinzipien:

a) Rationale Prinzipien der wissenschaftlichen Diskussion, Offenheit des Review-Prozesses.

b) Technische Hilfsmittel, die die Teilnahme der Mitglieder eines Fachgebiets an dem

Konsensus- Prozess unterstützen.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 19

Qualitätskriterium der Vollständigkeit

Der Vollständigkeitsgrad einer Ontologie Ont bezüglich

einer Domäne D gemessen. Eine für D korrekte Ontologie Ont = ( L, V, Ax) ist (logisch) vollständig für D, wenn für jede Aussage F aus L die Beziehung gilt:

Wenn D |= F, dann Ax |= F. Insbesondere gilt dann für jeden Satz F der Sprache

L: Ax |= F oder Ax |= F.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 20

Kategoriale (begriffliche) Vollständigkeit. Eine Ontologie Ont = ( L, V, Ax) heißt kategorial

vollständig, wenn jeder für D relevanter Begriff (Konzept oder Relation), in dem Vokabular V enthalten ist oder sich mittels des Vokabulars V durch Definitionen ableiten lässt.

Ausdrucksvollständigkeit Eine Ontologie Ont = ( L, V, Ax) heißt

ausdrucksvollständig, wenn sich jeder Wissensinhalt über das Vokabular V in der Sprache L ausdrücken läßt.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 21

Ontologien können bezüglich ihres Grades der logischen, und kategorialen Vollständigkeit sowie

der Ausdrucksvollständigkeit verglichen werden. Beispiel. Ont(1), Ont(2) können durch folgende Beziehungen

bezüglich ihres Vollständigkeitsgrades verglichen werden:

<(L) : Vergleich des logischen Vollständigkeitsgrades <(K): Vergleich des kategorialen

Vollständigkeitsgrades <(A) : Vergleich der Ausdrucksvollständigkeit

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 22

Ont(1) <(L) Ont(2), wenn

Ded(Ax(Ont(1)) Ded(Ax(Ont(2))

Ded(Ax(Ont(1)) = { F : Ax(Ont(1) |= F }

Ont(1) =(L) Ont(2), wenn

Ded(Ax(Ont(1)) = Ded(Ax(Ont(2))

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Qualitätskriterien 23

Beispiel (fortgesetzt)Ont(1) <(K) Ont(2) , wenn V(Ont(1))

Def(V(Ont(2))).

Ont(1) <(A) Ont(2) , wenn für jeden Satz F aus L(Ont(1))

ein Satz tr(F) aus L(Ont(2)) existiert, so dass gilt:Ax(Ont(1)) |= F gdw. Ax(Ont(2)) |= tr(F).

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Ausblick 1

Grundlagen der formalen Ontologie

Mereologische Systeme von Domänen Ontologische Analyse und Axiomatisierung von Relationen (insbesondere 54 Relationen von

UMLS). Nicht-monotones Schließen in Ontologien Top-Level Ontologie für Prozesse

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Mereologische Systeme 1

Mereologsiche Systeme: Sei D eine Domäne; für die Mereologie von D, Mer(D) sind zu unterscheiden: die Basisobjekte von D, notiert durch BObj(D), die relevanten Teile der Basisobjekte,

Parts(Bobj(D)), die Teil-Ganzes-Beziehung <. Dann heißt Mer(D) = (BObj(D), Parts(Bobj(D)), {MStr(O)| BObj(D)}, <) ein mereologisches System für die Domäne D.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Mereologische Systeme 2

Für ein Basis-Objekt O sei MStr(O) die mereologische Struktur von O, definiert durch:

MStr(O) = (O, Parts(O), <). MStr(O) ist eine partielle Ordnung mit größten Element O.

Die mereologische Theorie von D, notiert durch MT(D) ist definiert durch

MT(D) = Th({MStr(O)| BObj(D)}), das ist die Menge der mereologischen Sätze, die in jeder der Strukturen

MStr(O) wahr sind.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Mereologische Systeme 3

MStr(O) liefert einen Bauplan, d.h. liefert Informationen darüber, wie O aus seinen Teilen zusammengesetzt ist.

Gedankenexperiment: Seien U1, U2 zwei gleiche Uhren, und A, B zwei

Personen. An A und B werden die Uhr U1 und die Menge Parts(U2) übergeben.

Aufgabe: A und B sollen aus Parts(U2) eine Uhr U2 zusammensetzen, die mit U1 gleich (isomorph) ist.

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Mereologische Systeme 4

A erhält nun neben U1, und Parts(U2), noch die Struktur (MStr(U2), <), der Person B wird diese Information vorenthalten.

Wer hat die größeren Chancen, nach einiger Zeit U2 zusammenzusetzen, zu konstruieren?

A verfügt über einen „Bauplan“, der die mereologische Struktur aufweist. Würde man ihm alle möglichen mereologischen Summen der Teile übergeben, d.h. die Menge Pow(Parts(U2)), so ist ihm das keine Hilfe, er muss die mereologische Struktur von U2 kennen, und diese verschwindet in der Menge Pow(Parts(U2)).

<<Thema / Veranstaltung>> <<Datum>><<Vortragender>>

Mereologische Systeme 5

Bei Artefakten, wie der Uhr, lässt sich der mereologische

Bauplan noch durch einen Algorithmus Alg(U2) ergänzen, der angibt, in welcher zeitlichen

Reihenfolge dieTeile zu einem Ganzen zusammensetzen sind.

Dann entsteht eine Montageplan:

Mont (U2) = (Parts(U2), MStr(U2), <, Alg(U2)).