Wissensrepräsentation in kontrolliertem Englisch

14
Wissensrepräsentation in kontrolliertem Englisch Tobias Kuhn Institut für Informatik & Institut für Computerlinguistik Universität Zürich Mercator-Preis 22. September 2009 ? ? ? ? ? ? ? ? ?

description

See doctoral thesis for details: http://attempto.ifi.uzh.ch/site/pubs/papers/doctoral_thesis_kuhn.pdf

Transcript of Wissensrepräsentation in kontrolliertem Englisch

Page 1: Wissensrepräsentation in kontrolliertem Englisch

Wissensrepräsentation in kontrolliertem Englisch

Tobias KuhnInstitut für Informatik & Institut für Computerlinguistik

Universität Zürich

Mercator-Preis22. September 2009

???? ??

???

Page 2: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2

Problem

Das World Wide Web enthält Unmengen von Informationen, wovon der Grossteil in natürlicher Sprache verfasst ist

Automatisches Verstehen natürlicher Sprache durch Computer ist ein ungelöstes Problem trotz jahrzehntelanger Forschung

Folgen:

Nur Stichwort-basierte Suche

Keine automatische Beantwortung von Fragen

Keine “intelligenten” Programme, die das Wissen aus dem Web anwenden

Page 3: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3

Problem: Beispiel

Die Frage kann nicht automatisch beantwortet werden, obwohl die nötige Information vorhanden ist

“Welche Städte in einem Binnenland haben mindestens zwei Universitäten?”

Page 4: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4

Mögliche Lösung: formale Wissensrepräsentation

Idee: die Information wird nicht in natürlicher Sprache sondern in einer formalen, Logik-basierten Sprache repräsentiert:

Sogenannte “Reasoner” können dann verschiedene Probleme automatisch lösen:

Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?

Antworten zu einer Frage fnden

Beweise führen

Problem: Die Logiknotationen sind schwierig zu verstehen ohne spezifsche Ausbildung

∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))

Page 5: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5

Natürliche und formale Sprachen

Countries that border no sea are landlocked countries.

∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X))

Page 6: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6

Kontrollierte natürliche Sprachen

Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen Sprachen

Formale Sprachen, die natürlich aussehen

Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit der Exaktheit formaler Sprachen

Sollen die Kommunikation zwischen Mensch und Computer verbessern

Direkte Verbindung zu formaler Logik

Beispiel: Attempto Controlled English (ACE)

∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))

Every country that borders no sea is a landlocked country.

Page 7: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 7

Kontrollierte natürliche Sprache

Every country that borders no sea is a landlocked country.

∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X))

Page 8: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 8

AceWiki

AceWiki ist ein Wiki (wie z.B. Wikipedia)

Artikel in AceWiki sind in ACE geschrieben, wodurch deren Inhalt automatisch in Logik übersetzt werden kann

Ein “Reasoner” ist integriert:

Konsistenzprüfung

Beantwortung von Fragen (formuliert in ACE)

Extraktion von Wort-Hierarchien

Spezieller Editor um syntaktisch korrekte ACE Sätze zu erstellen

Page 9: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 9

AceWiki

Page 10: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 10

Beispielfrage in AceWiki

Page 11: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 11

Vorausschauender Editor

Page 12: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 12

Evaluation

Experimentelle Verständlichkeits-Evaluation von ACE und einer anderen Logik-Sprache

Aufgabe: Klassifkation von Aussagen als wahr/falsch

Resultat: ACE wurde besser verstanden, benötigte weniger Lernzeit und wurde von den Subjekten bevorzugt!

Zwei kleine Experimente zur Benutzbarkeit von AceWiki

Aufgabe: Erstellung einer Wissensbasis mit AceWiki

Resultat:

Ca. 80% der Aussagen waren korrekt und sinnvoll Die Subjekte fügten alle 5–6 Minuten eine korrekte und

sinnvolle Aussage hinzu

Page 13: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 13

Fazit

Kontrollierte natürliche Sprache …

… kann die Kluft überbrücken zwischen Menschen, die in natürlicher Sprache kommunizieren, und Computern, die nur formale Sprachen verstehen.

... ermöglicht den einfachen und intuitiven Umgang mit formalen Wissensrepräsentationen.

Page 14: Wissensrepräsentation in kontrolliertem Englisch

Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 14

Vielen Dank für Ihre Aufmerksamkeit!

❤❤❤❤ ❤❤ ❤❤ ❤