Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

26
Geschichte der Maschinellen Übersetzung Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Transcript of Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Page 1: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Geschichte der Maschinellen ÜbersetzungGeschichte der Maschinellen Übersetzung

Einleitung Entwicklungsgeschichte der MÜ

Page 2: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

EinleitungEinleitung

MÜ als Modellierung des ÜbersetzungsprozesseMÜ als Modellierung des Übersetzungsprozesse MÜ als Mechanisierung menschlicher TätigkeitMÜ als Mechanisierung menschlicher Tätigkeit

Hochqualitative vollautomatische ÜbersetzungHochqualitative vollautomatische Übersetzung Maschinelle Übersetzung mit menschlicher InterventionMaschinelle Übersetzung mit menschlicher Intervention Maschinengestützte konventionelle ÜbersetzungMaschinengestützte konventionelle Übersetzung Konventionelle Übersetzung durch MenschenKonventionelle Übersetzung durch Menschen

Page 3: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Übersetzen durch Mensch und MaschineÜbersetzen durch Mensch und Maschine

fully automaticfully automatichigh qualityhigh qualitytranslationtranslation(FAHQT)(FAHQT)

human-aidedhuman-aidedmachine translationmachine translation

(HAMT)(HAMT)

machine -aidedmachine -aided human translation human translation

(MAHT)(MAHT)

traditionaltraditionalhumanhuman

translationtranslation

human involvementhuman involvement

mechanizationmechanization

Computer-Assisted Translation (CAT)Computer-Assisted Translation (CAT)

Page 4: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Entwicklungsgeschichte der MÜEntwicklungsgeschichte der MÜ

AhnenAhnen Descartes, Leibniz (Wörterbücher auf der Grundlage eines universellen Descartes, Leibniz (Wörterbücher auf der Grundlage eines universellen

Zahlenkodes)Zahlenkodes) Joh. J. Becher 1661Joh. J. Becher 1661 John Wilkins 1668 (John Wilkins 1668 (Essay towards a Real Character and a Philosophical Essay towards a Real Character and a Philosophical

LanguageLanguage))

VorläuferVorläufer George Artstruni 1933George Artstruni 1933 Petr P. Smirnov-Trojanskij 1933Petr P. Smirnov-Trojanskij 1933

PionierePioniere Warren Weaver, Mathematiker, Warren Weaver, Mathematiker, TranslationTranslation (1949) (1949) Yehoshua Bar-Hillel, LogikerYehoshua Bar-Hillel, Logiker

Page 5: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Ahnen: Johannes BecherAhnen: Johannes Becher

Page 6: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Ahnen. Johannes Becher KodierungAhnen. Johannes Becher Kodierung

Page 7: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Ahnen: Johannes Becher LexikonAhnen: Johannes Becher Lexikon

Page 8: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Georges Artsouni (1933)Georges Artsouni (1933)

Der Franco-Armenier Georges Artstruni entwarf 1933 eine Der Franco-Armenier Georges Artstruni entwarf 1933 eine Speichervorrichtung auf Papierband, mit der für ein beliebiges Speichervorrichtung auf Papierband, mit der für ein beliebiges Wort die Entsprechung in einer anderen Sprache aufgefunden Wort die Entsprechung in einer anderen Sprache aufgefunden werden sollte. Sie wurde als Patent angemeldet und anscheinend werden sollte. Sie wurde als Patent angemeldet und anscheinend wurde 1937 ein Prototyp dieser Vorrichtung vorgeführt. wurde 1937 ein Prototyp dieser Vorrichtung vorgeführt.

Page 9: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Petr Smirnov-TroyanskiiPetr Smirnov-Troyanskii

Die Vorschläge von Smirnov‑Troyanskij, ebenfalls als Patent Die Vorschläge von Smirnov‑Troyanskij, ebenfalls als Patent angemeldet, waren aus heutiger Sicht weit bedeutsamer. Er sah drei angemeldet, waren aus heutiger Sicht weit bedeutsamer. Er sah drei Stadien der mechanischen Übersetzung vorStadien der mechanischen Übersetzung vor

1.1. Ein Editor, der nur die Ausgangssprache (AS) beherrschte sollte die Ein Editor, der nur die Ausgangssprache (AS) beherrschte sollte die 'logische' Analyse der Wörter im Ausgangstext (AT) in ihre Grundformen 'logische' Analyse der Wörter im Ausgangstext (AT) in ihre Grundformen und syntaktischen Funktionen vornehmen.und syntaktischen Funktionen vornehmen.

2.2. Die Maschine sollte Folgen von Grundformen und deren Funktionen in Die Maschine sollte Folgen von Grundformen und deren Funktionen in äquivalente Folgen in der Zielsprache (ZS) transformieren.äquivalente Folgen in der Zielsprache (ZS) transformieren.

3.3. Ein weiterer Editor, der nur die Zielsprache kannte sollte dann diesen Ein weiterer Editor, der nur die Zielsprache kannte sollte dann diesen Output in entsprechende normale Wortformen seiner eignen Sprache Output in entsprechende normale Wortformen seiner eignen Sprache konvertieren. konvertieren.

Troyanskij sah sowohl eine bilinguale als auch eine multilinguale Troyanskij sah sowohl eine bilinguale als auch eine multilinguale Übersetzung vor. Obwohl sein Patent sich nur auf die Maschine bezog, Übersetzung vor. Obwohl sein Patent sich nur auf die Maschine bezog, die das zweite Stadium ausführte, glaubte Troyanskii, dass der Prozess die das zweite Stadium ausführte, glaubte Troyanskii, dass der Prozess der logischen Analyse selbst ebenfalls mechanisiert werden könne.der logischen Analyse selbst ebenfalls mechanisiert werden könne.

Troyanskij war seiner Zeit weit voraus und war außerhalb Russlands Troyanskij war seiner Zeit weit voraus und war außerhalb Russlands unbekannt.unbekannt.

Page 10: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Im Prinzip ebenfalls mechanisierbarIm Prinzip ebenfalls mechanisierbar MaschineMaschine

Petr Smirnov-TroyanskijPetr Smirnov-Troyanskij

Text Text in ASin AS

Text Text in ASin AS

Text als Folge von Text als Folge von Grundformen der Grundformen der

AS mit Funktionen AS mit Funktionen

Text Text in ZSin ZS

Text Text in ZSin ZS

Text als Folge von Text als Folge von Grundformen der Grundformen der ZS mit Funktionen ZS mit Funktionen

Editor der ASEditor der ASEditor der ASEditor der AS

Editor der ZSEditor der ZSEditor der ZSEditor der ZS

Page 11: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

PionierePioniere

Nur wenige Jahre nach der Erfindung des Computers, wurde Nur wenige Jahre nach der Erfindung des Computers, wurde die Möglichkeit diskutiert, Computer für die automatische die Möglichkeit diskutiert, Computer für die automatische Übersetzung einzusetzen, und zwar zuerst 1947 von Warren Übersetzung einzusetzen, und zwar zuerst 1947 von Warren Weaver von der Rockefeller Foundation und von Andrew D. Weaver von der Rockefeller Foundation und von Andrew D. Booth, einem britischen Kristallographen. Booth, einem britischen Kristallographen.

Nach seiner Rückkehr an das Birkbeck College (London), Nach seiner Rückkehr an das Birkbeck College (London), erforschte Booth die Mechanisierung eines zweisprachigen erforschte Booth die Mechanisierung eines zweisprachigen Wörterbuchs und initiierte eine Zusammenarbeit mit Richard H. Wörterbuchs und initiierte eine Zusammenarbeit mit Richard H. Richens (Cambridge), der unabhängig davon Lochkarten für die Richens (Cambridge), der unabhängig davon Lochkarten für die Erstellung von groben Wort-für-Wort-Übersetzungen von Erstellung von groben Wort-für-Wort-Übersetzungen von wissenschaftlichen Texten verwendet hatte. wissenschaftlichen Texten verwendet hatte.

Page 12: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Pioniere: Warren Weaver und Andrew Booth Pioniere: Warren Weaver und Andrew Booth

Page 13: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Pioniere: Andrew Booth mit FrauPioniere: Andrew Booth mit Frau

Page 14: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Weaver MemorandumWeaver Memorandum

Es war jedoch ein Memorandum von Warren Weaver vom Juli 1949, Es war jedoch ein Memorandum von Warren Weaver vom Juli 1949, das die Idee einer MÜ allgemein bekannt machte (Weaver 1949). Er das die Idee einer MÜ allgemein bekannt machte (Weaver 1949). Er skizzierte die Erfolgsaussichten und schlug verschiedene Methoden skizzierte die Erfolgsaussichten und schlug verschiedene Methoden vor: die Verwendung von im Krieg entwickelten Dechiffrier-Techniken, vor: die Verwendung von im Krieg entwickelten Dechiffrier-Techniken, statistische Methoden, Shannons Informationstheorie, und die statistische Methoden, Shannons Informationstheorie, und die Erforschung der der Sprache zugrunde liegenden Logik und ihrer Erforschung der der Sprache zugrunde liegenden Logik und ihrer universellen Eigenschaften, 'the common base of human universellen Eigenschaften, 'the common base of human communication.‘communication.‘

Page 15: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Weaver MemorandumWeaver Memorandum

Innerhalb weniger Jahre hatten an der Washington University (Seattle), der Innerhalb weniger Jahre hatten an der Washington University (Seattle), der University of California (Los Angeles) und am Massachusetts Institute of University of California (Los Angeles) und am Massachusetts Institute of Technology Forschungsarbeiten zur MÜ begonnen. Technology Forschungsarbeiten zur MÜ begonnen.

Am MIT wurde auch im Jahre 1951 der erste Forscher ernannt, der sich Am MIT wurde auch im Jahre 1951 der erste Forscher ernannt, der sich hauptamtlich mit MÜ beschäftigte: Yehoshua Bar‑Hillel. hauptamtlich mit MÜ beschäftigte: Yehoshua Bar‑Hillel.

Ein Jahr später rief er die erste MÜ-Konferenz zusammen, wo die Grundzüge Ein Jahr später rief er die erste MÜ-Konferenz zusammen, wo die Grundzüge der zukünftigen Forschungsaktivitäten herauskristallisierten. Es gab Vorschläge der zukünftigen Forschungsaktivitäten herauskristallisierten. Es gab Vorschläge zur Behandlung der Syntax von Oswald und Bar Hillel (seine zur Behandlung der Syntax von Oswald und Bar Hillel (seine Kategorialgrammatik), Vorschläge, den Ausgangstext in einer MÜ‑orientierten Kategorialgrammatik), Vorschläge, den Ausgangstext in einer MÜ‑orientierten restringierten Sprache abzufassen bzw. zu bearbeiten, und Argumente für die restringierten Sprache abzufassen bzw. zu bearbeiten, und Argumente für die Konstruktion von Subsprachensystemen. Konstruktion von Subsprachensystemen.

Es war offensichtlich, dass eine vollautomatische Übersetzung ohne langfristig Es war offensichtlich, dass eine vollautomatische Übersetzung ohne langfristig angelegte Grundlagenforschung nicht möglich ist, und dass man in der angelegte Grundlagenforschung nicht möglich ist, und dass man in der Zwischenzeit ohne menschliche Intervention nicht auskommen konnte. Der Zwischenzeit ohne menschliche Intervention nicht auskommen konnte. Der Einsatz von Menschen war erforderlich, um entweder die Ausgangstexte für die Einsatz von Menschen war erforderlich, um entweder die Ausgangstexte für die Übersetzung aufzubereiten oder um den Output zu redigieren (damals schon Übersetzung aufzubereiten oder um den Output zu redigieren (damals schon bekannt als pre‑ und postediting). bekannt als pre‑ und postediting).

Page 16: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

MÜ und die Achterbahn der GeschichteMÜ und die Achterbahn der Geschichte

Page 17: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Entwicklungsgeschichte der MÜEntwicklungsgeschichte der MÜ

Schneller Aufstieg und ErnüchterungSchneller Aufstieg und Ernüchterung Erste Konferenz über MÜ 1952 am MITErste Konferenz über MÜ 1952 am MIT Georgetown University Experiment 1954Georgetown University Experiment 1954 Übersetzungssysteme der ersten GenerationÜbersetzungssysteme der ersten Generation

ALPAC und seine FolgenALPAC und seine Folgen Automatic Language Processing Advisory Committee (ALPAC) Bericht Automatic Language Processing Advisory Committee (ALPAC) Bericht

19661966

KonsolidierungKonsolidierung Übersetzungssysteme der 2. GenerationÜbersetzungssysteme der 2. Generation

Page 18: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Princeton 1960Princeton 1960

Machine Translation Conference, Princeton Inn, July 1960Machine Translation Conference, Princeton Inn, July 1960

Page 19: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Association for Machine Translation and Computational Linguistics,Association for Machine Translation and Computational Linguistics,Denver, Colorado, August 1963Denver, Colorado, August 1963

Page 20: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Pioniere: Victor H. Yngve und Anthony G. OettingerPioniere: Victor H. Yngve und Anthony G. Oettinger

Page 21: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Peter Toma: Erster Entwickler von SystranPeter Toma: Erster Entwickler von Systran

Page 22: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

EntwicklungsphasenEntwicklungsphasen

ComputerwissenschaftComputerwissenschaft

ComputerlinguistikComputerlinguistik

Künstliche IntelligenzKünstliche Intelligenz

CorpuslinguistikCorpuslinguistik

Page 23: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Entwicklungsphasen: ComputerwissenschaftEntwicklungsphasen: Computerwissenschaft

MÜ als ingenieurwissenschaftliches ProblemMÜ als ingenieurwissenschaftliches Problem lokal begrenzter empirischer Ansatzlokal begrenzter empirischer Ansatz linguistische Naivität verknüpft mit trickreicher Programmierunglinguistische Naivität verknüpft mit trickreicher Programmierung fehlende Modularitätfehlende Modularität keine Trennung zwischen linguistischen Daten (Lexikon & keine Trennung zwischen linguistischen Daten (Lexikon &

Grammatik) und VerarbeitungsalgorithmenGrammatik) und Verarbeitungsalgorithmen

Page 24: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Entwicklungsphasen: ComputerlinguistikEntwicklungsphasen: Computerlinguistik

Zunehmende "Linguistisierung"Zunehmende "Linguistisierung" MÜ primär als computerlinguistisches ProblemMÜ primär als computerlinguistisches Problem Maximale Unabhängigkeit von Analyse und Synthese Maximale Unabhängigkeit von Analyse und Synthese

(Modularität)(Modularität) Maximale Trennung von linguistischen Daten und AlgorithmenMaximale Trennung von linguistischen Daten und Algorithmen Indirekte Übersetzungsverfahren durch Stratifizierung und Indirekte Übersetzungsverfahren durch Stratifizierung und

Transfer, evtl. InterlinguaTransfer, evtl. Interlingua

Page 25: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Entwicklungsphasen: Künstliche IntelligenzEntwicklungsphasen: Künstliche Intelligenz

Berücksichtigung von HintergrundwissenBerücksichtigung von Hintergrundwissen KontextKontext kognitive Schematakognitive Schemata WeltwissenWeltwissen

Page 26: Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Typische Architekturen von MÜ SystemenTypische Architekturen von MÜ Systemen

Direkte ÜbersetzungDirekte Übersetzung Transfer-basierte ÜbersetzungTransfer-basierte Übersetzung Interlingua-basierte ÜbersetzungInterlingua-basierte Übersetzung