Eine (sehr) kurze Einführung in formale Ontologien

31

description

Folien zu einer Präsentation über Formale Ontologien und deren Einsatzmöglichkeiten in der Linguistik, gehalten im Semantikkolloqium im April 2008. Bei den Folien handelt es sich nicht um die finale Version, daher ist die Literaturliste unvollständig und es fehlen Quellennachweise für die Bilder (u.a. von Wikipedia, einem Vortrag von Douglas Lenat und aus einem Paper zur dbpedia). Wie man sehen kann, kommt slideshare scheinbar nicht so gut mit den Folien zurecht (pdflatex + beamer-Paket -> pdf), sobald ich die tex-Dateien in einem alten Backup wiederfinden sollte, werde ich mal an den Einstellungen schrauben und die Datei neu hochladen, bis dahin enpfiehlt sich der Download der PDF.

Transcript of Eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

kurzer historischer Überblick

eine (sehr) kurze Einführung in formale Ontologien

Denis Brumann<[email protected]>

5. April 2008

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

kurzer historischer Überblick

Ontologien in der Philosophie

Beschreibung der Grundstrukturen der Realität undfundamentaler Typen von Entitäten

realistischer Ansatz nimmt an, dass sich Grundstrukturendurch Erfahrung zeigen und in sprachlicher Form angemessenwiderspiegeln (z.B. Aristoteles)

konstruktivistischer Ansatz lehrt, dass die Grundstrukturendes Seienden nur Projektionen des Denkens über die Sprachein die Welt sind

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

kurzer historischer Überblick

Ontologien in der Informatik

1984: Beginn des CYC-Projekts unter Douglas Lenat

der Versuch eine umfassende Ontologie zur Modellierung vonalltäglichem �common-sense�-Wissen zu entwickelnhttp://video.google.com/videoplay?docid=770438861504949(Vortrag: Computers vs. Common Sense)

bereits seit den 1960er Jahren Forschung anExpertensystemen, seit den 1980ern Forschung an Ontologienals �Knowledge Base�

seit den 90ern Verwendung von Ontologien insbesondere fürmedizinische Expertensysteme (ULMS, SNOMED, etc.)

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

semiotisches Dreieck

formale Ontologien

Ontologien bilden die �Mittler�-Schicht zwischen Symbol und Ding

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

wesentliche Struktur

es können Taxonomien und Meronymien aus Klassen(Konzepten) gebildet werden

mittels Relationen können Aussagen über Konzepte gemachtwerden: is-a, has-a, . . .

Konzepte sind über Relationen miteinander verbunden

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

De�nition

Eine Ontologie ist ein formal de�niertes System aus Relationen undKonzepten, welches zusätzlich Regeln zur Wahrung der Integritätund für Inferenz bereitstellt. Dabei sind Relationen Aussagen(Fakten), welche zwei oder mehrere Konzepte miteinanderverbinden. Eine Inferenz ist eine Schlussfolgerung, die aus Aussageneine neue Aussage herleitet.

nach: Uschold, M. (1996), Ontologies: Principles, Methods and Applications

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Wofür braucht man formale Ontologien?

Formalisierung und Systematisierung von Wissen über eineDomäne

Scha�ung eines De�nitionskonsens für eine bestimmte Domäne

semantische Suche auf Daten (�Common-Sense-Reasoning�)

maschinenverständliche Wissensbasis

weitere positive Eigenschaften formaler Ontologien

Wiederverwendbarkeit und Erweiterbarkeit

interoperables und o�enes Verteilen von Daten möglich

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

W3C und die Idee des Semantic Web

�Erweiterung� des Internets durch semantische Verknüpfungder enthaltenen Daten

formale Ontologien und o�ene Formate als wesentlicherBestandteil

Unterschied zwischen Internet und Semantic Web

Internet dient lediglich dem Austausch von Daten (InformationInterchange)

Im Semantic Web werden Daten verknüpft (web of data)

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

eXtensible Markup Language (XML)

Metasprache zur Auszeichnung hierarchisch gegliederterDaten. (W3C-Spezi�kation)

rein syntaktische Darstellung → muss gegen ein Schemageneigt interpretiert werden

Resource Description Framework (RDF)

Zerlegung von Aussagen in Bestandteile (Subjekt, Prädikatund Objekt)

ordnet Aussagen in eine Ontologie ein

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Web Ontology Language (OWL)

Ontologiebeschreibungssprache (kompatibel zu RDF-Schema)

ermöglichen Inferenz (logisches Reasoning) über Daten aufBasis von Beschreibungslogik

verschiedene Version mit unterschiedlicher Mätchtigkeit desReasoners (OWL-Full, OWL-DL und OWL-Lite)

Protégé

Ontologie-Editor entwickelt an der Universität Stanford

http://protege.stanford.edu/

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Inferenz auf formale Ontologien

durch Vernetzung der Daten ist eine Inferenz (deduktivesSchliessen) auf Ergebnisse möglich

auch relevant für Natural Language Processing (NLP)

Query-Sprachen (z.B. SPAQRL), vergleichabr mit klassischenDatenbankanfragen (SQL-92)

Beispiel

das folgende Beispiel stammt aus einem Vortrag derCYC-Foundataion

Anfragen über eigene Query-Sprachen (z.B. SPAQRL),vergleichabr mit klassischen Datenbankanfragen

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

DBpedia

erweiterte Suche nach Daten aus der Wikipedia, komplexeQueries über SPAQRL-Anfragen möglich

http://wikipedia.3ba.se/index.php?qid=8

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Fussballspieler mit der Trikotnr. 11 der für einen Verein spielt(e) deren Stadionmindestens 40.000 Platz Sitzkapazität und dessen Geburtsort mehr als 1 Mio.Einwohner hat . . .

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

AufbauDe�nitionformale Ontologien für das Semantic WebInferenz oder �sophisticated querying�

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

http://www.linguistics-ontology.org/

technische Grundlagen

verwendet SUMO als Top-Level-Ontologiea

aktuelle Version 0.45 enthält hauptsächlich Konzepte fürmorphosyntaktische Eigenschaften

erweiterbar durch sogenannte COPEs (Community Project

Extension)

dient der Beschreibung von Daten wie z.B.interlinearglossierter Texte

aOWL-Variante, also eingeschränkte Inferenzmöglichkeiten

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

Hauptkategorien:

data constructs

metaconcepts

expressions

grammar

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

data constructs

beinhaltet Konstrukte zur Analyse linguistischer Daten, z.B.Paradigmen, Lexika und �feature�-Strukturen

wird benötigt für die Relation zwischen versch. Konzepten,z.B. Beziehung zwischen Lexeme und Stem

metaconcepts

grundlegende Konzepte für linguistische Analyse

beinhaltet z.B. das Konzept �Sprache� [2]:

set of data associated with a common grammatical

pattern

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

expressions

Beschreibung von LinguisticExpression, also von Morphemen,Phonemen, Wörtern, Phrasen, etc.

aufgeteilt in zwei Subklassen WrittenLinguisticExpression undWrittenLinguisticExpression

grammar

abstrakte Eigenschaften und Relationen einer Sprache

enthält keine Grammatiktheorie, sondern ist vielmehr einFramework für individuelle grammatische Phänomene

ermöglicht das Vergleichen und Finden von gemeinsamenBeziehungen versch. Grammatiktheorien

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

aktuelle Anwendungen: ODIN

Verwendung in ODIN (Datenbank für interlinearglossierteTexte)

http://www.csufresno.edu/odin/

aktuelle Anwendungen: OntoELAN

OntoELAN (linguistische Annotation von Multimediadaten

http://database.cs.wayne.edu/proj/ontoelan/

http://database.cs.wayne.edu/proj/ontoelan/demo2.swf

Erweiterungen

Ethnologue-COPE: Metadaten zu Sprachen in GOLD

WALS-COPE: Versuch die über 140 Datenbanken aus WALSgegen eine Ontologie zu mappen

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Aufbau der OntologieAnwendung und Erweiterung

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Probleme mit formalen Ontologien

(formalsemantische) Beschreibung �grundlegendet� Entitäten:

Allen, Hayes (1989). Moments and points in an interval-based

temporal logic

Haslanger (2003). Persistence through Time

Vielzahl verschiedener Ontologien → Konsistenz derBeschreibungen

Mehraufwand durch zusätzliche Annotation von Daten

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

mögliche Einsatzgebiete in der Linguistik

(automatische) Sprachverarbeitung natürlicher Sprache (keinereine Syntaxanalyse, sondern Bezug auf Semantik)

Sprachdokumentation (kollaboratives Wissensmanagement)und Suche nach Sprachdaten über das Internet

Annotation von Multimediadaten (siehe OntoELAN)

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien

Einführungformale Ontologien

General Ontology for Linguistic Description (GOLD)Fazit

Cysouw, Michael A., Good, Je�, Albu, Mihai and Bibiko,Hans-Jörg (2005). Can GOLD �cope� with WALS? Retro�tting

an ontology onto the World Atlas of Language Structures.Proceeding of EMELD 2005. proceedings

Farrar, Scott and Langendoen, Terry (2003). A Linguistic

Ontology for the Semantic Web. GLOT International. 7 (3),pp.97-100.

Scott Farrar and William D. Lewis (2007) The GOLD

Community of Practice: An Infrastructure for Linguistic Data

on the Web. Language Resources and Evaluation.

Fox, Chris (2000). The Ontology of Language: properties,

individuals and discourse. Cambridge University Press

Uschold, M. and Gruninger, M. (1996). Ontologies: Principles,Methods and Applications. Knowledge Engineering Review Vol.11

Denis Brumann <[email protected]> eine (sehr) kurze Einführung in formale Ontologien