LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

Post on 06-Apr-2016

216 views 3 download

Transcript of LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

LFG als Interlingua in der maschinellen Übersetzung

Referat von Zuzana Pesselováam Mittwoch, den 05.02.2003

Interlingua• Ziel

Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen.

• gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig

von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes).

• NachteileAnalyse und Generierung müssen streng getrennt

seinWährend der Generierung ist es nicht möglich, auf

den Originaltext zurückzugreifen.

strukturelle Repräsentation in den Interlingua-Systemen

• Propositionale Logik• Any government is dependent on its supporters.

– All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T)

• Wertung– Problemlose Analyse, Generierung beinahe unmöglich, da

keine syntaktische Information vorhanden.• Lösungen: „multilingual paraphrasing“

– Every governmet has supporters which it depends on.– People who support all governments are depended on by

them.– All governments depend on people who support them.

strukturelle Repräsentation in den Interlingua-Systemen

• LFG• Zusammenfassung mehrerer Sprachen beim

gleichzeitigen Ausgleich deren Unterschiede.

lexikalische Repräsentation in den Interlingua-Systemen

• Konzepte

• sprachunabhängige lexikalische Einheiten

• „meanings derived from the process of understanding of texts“

• Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)

Definition von Interlingua

• Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur).

• Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.

Die Interlingua-Grammatiken• Generative Transformationsgrammatik

(Chomsky, seit 1955)– 50.-90. Jahre– Oberflächenstruktur vs. Tiefenstruktur– Transformationen, die eine TS in eine OS

überführen– Die Annahme, dass es sich um eine sprach-

unabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.

Die Interlingua-Grammatiken• 2. Kasusgrammatik

(Fillmore, 1968)– Vermutung, dass die Repräsentationen der

Kasusstruktur die Syntaxuniversalien abbilden

– oft benutzt worden in bilingualen transfer-basierten Systemen (z.B. Japanisch)

– Problem: Kasusrollen nicht standardisiert(„no widely agreed set of case relations“)

Maschinelle Übersetzung mit LFG

• 70. Jahre (Bresnan, Kaplan)• als Kritik an GTG• zwei Ebenen der syntaktischen Repräsentation

– C-Struktur (constituent-structure)– F-Struktur (functional-structure)

• werden erzeugt über die Phrasenstrukturregeln• zusätzlich

– Funktionen (als Grundbegriffe)– Lexikoneinträge (mit lexikalischen Regeln)

C-Struktur und F-Struktur• Beispiel

C-Struktur und F-Struktur• C-Struktur

– Phrasenstrukturbaum– geordnete Aufstellung der Wörter und Phrasen des

Satzes– kontextfreie Notation

• F-Struktur– hierarchische Funktion– enspricht den grammatischen Funktionen (S, O,

etc.)– umfaßt auch morphosyntaktische Merkmale (Case,

Num, Tense)

Transfer mit F-Strukturen• Einlesen des Quellsprachensatzes (Parser)• Ergebnis ist/sind F-Struktur(en) der

Quellsprache• Übersetzung der F-Struktur(en) mithilfe von

– Transfer-Lexikon (inkl. Subkategorisierung)– Top-Down-Verfahren

• Ergebnis ist/sind F-Struktur(en) der Zielsprache

• Generieren der Oberfläche (Generator)

Top down beim Transfer mit F-Strukturen

• Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED)

• Überfprüfung der Valenz in der vorliegenden F-Struktur

• Suche vom Eintrag mit der gleichen Valenz• Eintrag = Grundlage für die F-Struktur der

Zeilsprache• anschl. PRED der nächste niedrigen Stufe wird

gesucht

Transfer mit F-Strukturen• Beispiel

Funktionen in der LFG• Description-by-analysis

– Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde.

• Codescription– Diese Beschreibungen lassen zu, dass die

endgültige Struktur Eigenschaften hat, die in der F-Struktur nicht vorhanden sein können.

Funktionen in der LFG• Funktionen signalisieren das Überführen der

Strukturen in andere Strukturen (z.B. von C-Strukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).

Vorgehensweise bei der MÜ mit LFG (Stufe 2)

• Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet.

• Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht.

• Dies dient als Input für die Generierung der zielsprachigen Version.

Beispiel für die Leistungsfähigkeit

• The student is likely to work.• Il est probable que l´etudiant travaillera.

Beispiel für die Leistungsfähigkeit

• Berücksichtigung der Tempuskonkordanz

Fazit des Ansatzes von Kaplan • „an approach to machine translation that

exploits the potential of simultaneous correspondences between different levels of linguistic representation“

• it allows „partial specification“ and „multi-level-transfer“

Kommerzielle Nutzung• XLE (Xerox Linguistic Environment)

– Xerox Palo Alto Research Center in California

– Xerox Research Center in Europe (Grenoble)– Institut für maschinelle Sprachverarbeitung

(Stuttgart)• FUJITSU (Japan)• NEC (Japan)