Automatische Übersetzung in einem multilingualen, semantischen Wiki

15

Click here to load reader

Transcript of Automatische Übersetzung in einem multilingualen, semantischen Wiki

Page 1: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Automatische Ubersetzung in einemmultilingualen, semantischen Wiki

Tobias Kuhn

Professur fur Soziologie, insbesondere Modellierung und Simulation, ETH Zurich

Institut fur Computerlinguistik, Universitat Zurich27. November 2013

Page 2: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Man stelle sich vor, ...

... dass Wikipedia die Konsistenz des enthaltenenWissens uberprufen und Fragen dazu beantworten

konnte, und

... dass der gesamte Inhalt sofort in allen Sprachenverfugbar ware!

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 2 / 15

Page 3: Automatische Übersetzung in einem multilingualen, semantischen Wiki

• AceWiki ist ein semantisches Wiki

• Artikel sind in einer kontrollierten naturlichen Sprachegeschrieben: Attempto Controlled English (ACE)

• Im Hintergrund werden die Satze in die Semantic-Web-SpracheOWL ubersetzt

• Der eingebaute OWL-Reasoner kann Fragen beantworten undWiderspruche entdecken

• Spezieller Editor fur das Schreiben on ACE-Satzen

• Wurde um Multilingualitat erweitert

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 3 / 15

Page 4: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Multilinguales AceWiki: AceWiki-GF

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 4 / 15

Page 5: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Konsistenzprufung

AceWiki uberpruft jeden neuen Satz auf Konsistenz:

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 5 / 15

Page 6: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Beantwortung von Fragen

AceWiki kann auch Fragen beantworten:

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 6 / 15

Page 7: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Grammatical Framework (GF)

GF ist ein Framework fur die Erstellung multilingualer Grammatiken:

• Regelbasiert

• Funktionale Programmiersprache (basierend auf Haskell)optimiert fur die Beschreibung naturlicher Sprachen

• “Resource Grammar Library”, die allgemeine morphologischeund syntaktische Strukturen implementiert

• “Mildly context-sensitive”

• Bidirectionale Ubersetzungen: konkrete Sprache ⇔ AbstrakteSyntaxbaume

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 7 / 15

Page 8: Automatische Übersetzung in einem multilingualen, semantischen Wiki

GF-Grammatiken und -Ubersetzungen

GF-Grammatiken bestehen aus:

• Einer sprachunabhangigen abstrakten Syntax

• Mehreren konkreten Sprachdefinitionen (“concrete syntax”), dieWorter, Wortstellung, etc. definieren durch die Implementierungder gegebenen abstrakten Kategorien und Funktionen

Beispiel

border : Country -> Country -> Relation

Englisch: border x y = x!Nom + "borders" + y!Acc

Estnisch: border x y = x!Gen + "naaber on" + y!Nom

GF-Ubersetzungen bestehen aus:

• Zunachst wird ein Text in der Originalsprache in einen Baum(oder mehrere Baume) in der abstrakten Syntax abgebildet

• Dann werden diese Baume als Texte in der Zielsprache“linearisiert”

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 8 / 15

Page 9: Automatische Übersetzung in einem multilingualen, semantischen Wiki

GF Resource Grammar Library (RGL)

• Morphologie und Syntax fur ∼30 Sprachen mit einersprachunabhangigen API

• Entwickler brauchen kein detailliertes Wissen der Sprachen, diesie in ihren Anwendungen verwenden wollen

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 9 / 15

Page 10: Automatische Übersetzung in einem multilingualen, semantischen Wiki

ACE-in-GF

• Kontrollierte Versionen mehrerer naturlicher Sprachen, die aufACE (und aufeinander) abgebildet werden konnen

• Dadurch konnen sie in die verschiedenen formalen Sprachenubersetzt werden, die ACE schon unterstutzt

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 10 / 15

Page 11: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Auflosung von Mehrdeutigkeiten

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 11 / 15

Page 12: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Die Zukunft...?

Konnen wir eine wirklich multilinguale Wikipedia erstellen?

• Inhalt in einer semantischen Reprasentation

• Verbalisierung in verschiedenen Sprachen

• Der ganze Inhalt ware sofort in allen Sprachen verfugbar (wenndas benotigte Vokabular schon definiert ist)

• Wurde die momentane Englisch-Dominanz brechen und demAusschliessen von Benutzern weniger verbreiteten oderunterreprasentierter Sprachen ein Ende setzen

• Wurde auch zur Vision des Semantic Webs beitragen.

Andere ahnliche Ansatze:

• http://www.wikidata.org

• http://meta.wikimedia.org/wiki/A_proposal_towards_a_

multilingual_Wikipedia

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 12 / 15

Page 13: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Publikationen

Die folgenden Publikationen enthalten detailliertere Infos zu unseremAnsatz:

Kaarel Kaljurand and Tobias Kuhn. A Multilingual Semantic WikiBased on Attempto Controlled English and Grammatical Framework.In Proceedings of the 10th Extended Semantic Web Conference(ESWC). 2013.http://purl.org/tkuhn/eswc2013acewikigf

Kaarel Kaljurand, Tobias Kuhn, and Laura Canedo. Collaborativemultilingual knowledge management based on controlled naturallanguage. Under review.http://www.semantic-web-journal.net/system/files/swj524.pdf

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 13 / 15

Page 14: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Vielen Dank fur die Aufmerksamkeit!

Fragen?

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 14 / 15

Page 15: Automatische Übersetzung in einem multilingualen, semantischen Wiki

Links

ACE parser (APE) Code: https://github.com/Attempto/APE

ACE-in-GF Code: http://github.com/Attempto/ACE-in-GF

AceWiki und AceWikiGF

• Code: http://github.com/AceWiki/AceWiki

• Demos (non-GF): http://attempto.ifi.uzh.ch/acewiki/

• Demos (GF): http://attempto.ifi.uzh.ch/acewiki-gf/

MOLTO Projekt Web-Seite: http://www.molto-project.eu

Attempto Web-Seite: http://attempto.ifi.uzh.ch

GF: http://www.grammaticalframework.org

Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 15 / 15