SICHERUNG VON WISSEN DURCH IMPLEMENTIERUNG EINER SEMANTISCHEN WISSENSMANAGEMENT LÖSUNG
Automatische Übersetzung in einem multilingualen, semantischen Wiki
Click here to load reader
-
Upload
tobias-kuhn -
Category
Technology
-
view
132 -
download
1
Transcript of Automatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Ubersetzung in einemmultilingualen, semantischen Wiki
Tobias Kuhn
Professur fur Soziologie, insbesondere Modellierung und Simulation, ETH Zurich
Institut fur Computerlinguistik, Universitat Zurich27. November 2013
Man stelle sich vor, ...
... dass Wikipedia die Konsistenz des enthaltenenWissens uberprufen und Fragen dazu beantworten
konnte, und
... dass der gesamte Inhalt sofort in allen Sprachenverfugbar ware!
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 2 / 15
• AceWiki ist ein semantisches Wiki
• Artikel sind in einer kontrollierten naturlichen Sprachegeschrieben: Attempto Controlled English (ACE)
• Im Hintergrund werden die Satze in die Semantic-Web-SpracheOWL ubersetzt
• Der eingebaute OWL-Reasoner kann Fragen beantworten undWiderspruche entdecken
• Spezieller Editor fur das Schreiben on ACE-Satzen
• Wurde um Multilingualitat erweitert
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 3 / 15
Multilinguales AceWiki: AceWiki-GF
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 4 / 15
Konsistenzprufung
AceWiki uberpruft jeden neuen Satz auf Konsistenz:
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 5 / 15
Beantwortung von Fragen
AceWiki kann auch Fragen beantworten:
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 6 / 15
Grammatical Framework (GF)
GF ist ein Framework fur die Erstellung multilingualer Grammatiken:
• Regelbasiert
• Funktionale Programmiersprache (basierend auf Haskell)optimiert fur die Beschreibung naturlicher Sprachen
• “Resource Grammar Library”, die allgemeine morphologischeund syntaktische Strukturen implementiert
• “Mildly context-sensitive”
• Bidirectionale Ubersetzungen: konkrete Sprache ⇔ AbstrakteSyntaxbaume
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 7 / 15
GF-Grammatiken und -Ubersetzungen
GF-Grammatiken bestehen aus:
• Einer sprachunabhangigen abstrakten Syntax
• Mehreren konkreten Sprachdefinitionen (“concrete syntax”), dieWorter, Wortstellung, etc. definieren durch die Implementierungder gegebenen abstrakten Kategorien und Funktionen
Beispiel
border : Country -> Country -> Relation
Englisch: border x y = x!Nom + "borders" + y!Acc
Estnisch: border x y = x!Gen + "naaber on" + y!Nom
GF-Ubersetzungen bestehen aus:
• Zunachst wird ein Text in der Originalsprache in einen Baum(oder mehrere Baume) in der abstrakten Syntax abgebildet
• Dann werden diese Baume als Texte in der Zielsprache“linearisiert”
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 8 / 15
GF Resource Grammar Library (RGL)
• Morphologie und Syntax fur ∼30 Sprachen mit einersprachunabhangigen API
• Entwickler brauchen kein detailliertes Wissen der Sprachen, diesie in ihren Anwendungen verwenden wollen
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 9 / 15
ACE-in-GF
• Kontrollierte Versionen mehrerer naturlicher Sprachen, die aufACE (und aufeinander) abgebildet werden konnen
• Dadurch konnen sie in die verschiedenen formalen Sprachenubersetzt werden, die ACE schon unterstutzt
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 10 / 15
Auflosung von Mehrdeutigkeiten
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 11 / 15
Die Zukunft...?
Konnen wir eine wirklich multilinguale Wikipedia erstellen?
• Inhalt in einer semantischen Reprasentation
• Verbalisierung in verschiedenen Sprachen
• Der ganze Inhalt ware sofort in allen Sprachen verfugbar (wenndas benotigte Vokabular schon definiert ist)
• Wurde die momentane Englisch-Dominanz brechen und demAusschliessen von Benutzern weniger verbreiteten oderunterreprasentierter Sprachen ein Ende setzen
• Wurde auch zur Vision des Semantic Webs beitragen.
Andere ahnliche Ansatze:
• http://www.wikidata.org
• http://meta.wikimedia.org/wiki/A_proposal_towards_a_
multilingual_Wikipedia
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 12 / 15
Publikationen
Die folgenden Publikationen enthalten detailliertere Infos zu unseremAnsatz:
Kaarel Kaljurand and Tobias Kuhn. A Multilingual Semantic WikiBased on Attempto Controlled English and Grammatical Framework.In Proceedings of the 10th Extended Semantic Web Conference(ESWC). 2013.http://purl.org/tkuhn/eswc2013acewikigf
Kaarel Kaljurand, Tobias Kuhn, and Laura Canedo. Collaborativemultilingual knowledge management based on controlled naturallanguage. Under review.http://www.semantic-web-journal.net/system/files/swj524.pdf
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 13 / 15
Vielen Dank fur die Aufmerksamkeit!
Fragen?
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 14 / 15
Links
ACE parser (APE) Code: https://github.com/Attempto/APE
ACE-in-GF Code: http://github.com/Attempto/ACE-in-GF
AceWiki und AceWikiGF
• Code: http://github.com/AceWiki/AceWiki
• Demos (non-GF): http://attempto.ifi.uzh.ch/acewiki/
• Demos (GF): http://attempto.ifi.uzh.ch/acewiki-gf/
MOLTO Projekt Web-Seite: http://www.molto-project.eu
Attempto Web-Seite: http://attempto.ifi.uzh.ch
GF: http://www.grammaticalframework.org
Tobias Kuhn, ETH Zurich Automatische Ubersetzung in einem multilingualen, semantischen Wiki 15 / 15