LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

21
LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003

Transcript of LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

Page 1: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

LFG als Interlingua in der maschinellen Übersetzung

Referat von Zuzana Pesselováam Mittwoch, den 05.02.2003

Page 2: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Interlingua• Ziel

Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen.

• gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig

von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes).

• NachteileAnalyse und Generierung müssen streng getrennt

seinWährend der Generierung ist es nicht möglich, auf

den Originaltext zurückzugreifen.

Page 3: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

strukturelle Repräsentation in den Interlingua-Systemen

• Propositionale Logik• Any government is dependent on its supporters.

– All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T)

• Wertung– Problemlose Analyse, Generierung beinahe unmöglich, da

keine syntaktische Information vorhanden.• Lösungen: „multilingual paraphrasing“

– Every governmet has supporters which it depends on.– People who support all governments are depended on by

them.– All governments depend on people who support them.

Page 4: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

strukturelle Repräsentation in den Interlingua-Systemen

• LFG• Zusammenfassung mehrerer Sprachen beim

gleichzeitigen Ausgleich deren Unterschiede.

Page 5: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

lexikalische Repräsentation in den Interlingua-Systemen

• Konzepte

• sprachunabhängige lexikalische Einheiten

• „meanings derived from the process of understanding of texts“

• Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)

Page 6: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Definition von Interlingua

• Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur).

• Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.

Page 7: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Die Interlingua-Grammatiken• Generative Transformationsgrammatik

(Chomsky, seit 1955)– 50.-90. Jahre– Oberflächenstruktur vs. Tiefenstruktur– Transformationen, die eine TS in eine OS

überführen– Die Annahme, dass es sich um eine sprach-

unabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.

Page 8: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Die Interlingua-Grammatiken• 2. Kasusgrammatik

(Fillmore, 1968)– Vermutung, dass die Repräsentationen der

Kasusstruktur die Syntaxuniversalien abbilden

– oft benutzt worden in bilingualen transfer-basierten Systemen (z.B. Japanisch)

– Problem: Kasusrollen nicht standardisiert(„no widely agreed set of case relations“)

Page 9: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Maschinelle Übersetzung mit LFG

• 70. Jahre (Bresnan, Kaplan)• als Kritik an GTG• zwei Ebenen der syntaktischen Repräsentation

– C-Struktur (constituent-structure)– F-Struktur (functional-structure)

• werden erzeugt über die Phrasenstrukturregeln• zusätzlich

– Funktionen (als Grundbegriffe)– Lexikoneinträge (mit lexikalischen Regeln)

Page 10: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

C-Struktur und F-Struktur• Beispiel

Page 11: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

C-Struktur und F-Struktur• C-Struktur

– Phrasenstrukturbaum– geordnete Aufstellung der Wörter und Phrasen des

Satzes– kontextfreie Notation

• F-Struktur– hierarchische Funktion– enspricht den grammatischen Funktionen (S, O,

etc.)– umfaßt auch morphosyntaktische Merkmale (Case,

Num, Tense)

Page 12: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Transfer mit F-Strukturen• Einlesen des Quellsprachensatzes (Parser)• Ergebnis ist/sind F-Struktur(en) der

Quellsprache• Übersetzung der F-Struktur(en) mithilfe von

– Transfer-Lexikon (inkl. Subkategorisierung)– Top-Down-Verfahren

• Ergebnis ist/sind F-Struktur(en) der Zielsprache

• Generieren der Oberfläche (Generator)

Page 13: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Top down beim Transfer mit F-Strukturen

• Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED)

• Überfprüfung der Valenz in der vorliegenden F-Struktur

• Suche vom Eintrag mit der gleichen Valenz• Eintrag = Grundlage für die F-Struktur der

Zeilsprache• anschl. PRED der nächste niedrigen Stufe wird

gesucht

Page 14: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Transfer mit F-Strukturen• Beispiel

Page 15: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Funktionen in der LFG• Description-by-analysis

– Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde.

• Codescription– Diese Beschreibungen lassen zu, dass die

endgültige Struktur Eigenschaften hat, die in der F-Struktur nicht vorhanden sein können.

Page 16: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Funktionen in der LFG• Funktionen signalisieren das Überführen der

Strukturen in andere Strukturen (z.B. von C-Strukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).

Page 17: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Vorgehensweise bei der MÜ mit LFG (Stufe 2)

• Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet.

• Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht.

• Dies dient als Input für die Generierung der zielsprachigen Version.

Page 18: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Beispiel für die Leistungsfähigkeit

• The student is likely to work.• Il est probable que l´etudiant travaillera.

Page 19: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Beispiel für die Leistungsfähigkeit

• Berücksichtigung der Tempuskonkordanz

Page 20: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Fazit des Ansatzes von Kaplan • „an approach to machine translation that

exploits the potential of simultaneous correspondences between different levels of linguistic representation“

• it allows „partial specification“ and „multi-level-transfer“

Page 21: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Kommerzielle Nutzung• XLE (Xerox Linguistic Environment)

– Xerox Palo Alto Research Center in California

– Xerox Research Center in Europe (Grenoble)– Institut für maschinelle Sprachverarbeitung

(Stuttgart)• FUJITSU (Japan)• NEC (Japan)