Praktischer Einsatz maschineller Übersetzung

Post on 18-Nov-2014

253 views 1 download

description

Sehen Sie die Präsentation von Ulrike Mibs zum praktischen Einsatz maschineller Übersetzung vom Informationstag "Best Practices erfahren, Best Food genießen" am 26.11.2013 in München an.

Transcript of Praktischer Einsatz maschineller Übersetzung

Vertraulich zu behandelndes und urheberrechtlich geschütztes Eigentum von SDL

Wahnsinnig Innovativ oder innovativer Wahnsinn?

Praktischer Einsatz Maschineller Übersetzung

Ulrike Mibs, SDL Language Solutions

E-Mail: umibs@sdl.com

• Exponentielle Zunahme digitaler Inhalte

• Ressourcenknappheit und Kostendruck

• Markteinführungszeiten

• Optimale Nutzung

vorhandener Budgets

• Kundendienst,

Kundenzufriedenheit,

Kundenanforderungen

• Permanenter Wandel

Warum maschinelle Übersetzung (MÜ)?

Die SDL BeGlobal-Plattform

Mehrere Zugriffspunkte auf die MÜ-Engines

WorldServer

SDL Trados Studio

Passolo

LivePerson

Oracle RightNow

Kunden-spezifische

Integrationen

Echtzeit-API-Konfiguration

via TouchPoints

Web-UI mit Benutzer-steuerung

MÜ-Engines

Trainierte Sprachpaare Allgemeine

Sprachpaare (Baselines)

Skalierbar

Echtzeit-Zugriff Tausender Nutzer

Vertraulich

Alle Systemanfragen sind nutzerspezifisch und werden vertraulich behandelt

Sicher

Zugang nur für Nutzer mit entsprechenden Berechtigungen

Hierarchie

Nur Nutzer mit entsprechenden Berechtigungen können bestimmte Abläufe durchführen

Standortunabhängige Aktivierung

Webbasiert, kann sofort, in der „Cloud”, freigeschalten werden

Integriert

Ihr IT-Team kann die Plattform in andere Anwendungen einbinden

Infrastruktur der Plattform

Verfügbare Sprachpaare

5

Westeuropa Osteuropa Naher Osten &

Afrika

Asien

Deutsch <> Englisch,

Französisch, Spanisch

Dänisch <> Englisch

Finnisch <> Englisch

Französisch <> Englisch,

Arabisch, Spanisch, Deutsch

Griechisch <> Englisch

Italienisch <> Englisch,

Spanisch

Niederländisch <> Englisch

Norwegisch <> Englisch

Portugiesisch <> Englisch

Schwedisch <> Englisch

Spanisch <> Englisch,

Arabisch, Französisch,

Deutsch, Italienisch

Albanisch <> Englisch

Bulgarisch <> Englisch

Estnisch <> Englisch

Litauisch <> Englisch

Polnisch <>

Englisch

Rumänisch <> Englisch

Russisch <> Englisch

Serbisch <> Englisch

Slowakisch <> Englisch

Tschechisch <> Englisch

Türkisch <> Englisch

Ukrainisch <> Englisch

(NEU)

Ungarisch <> Englisch

Arabisch <> Englisch,

Spanisch, Französisch

Dari <> Englisch

Hausa <> Englisch

Hebräisch <> Englisch

Pashtu <> Englisch

Persisch <> Englisch

Somali <> Englisch

Bengali <> Englisch

Chinesisch (traditionell) <>

Englisch

Chinesisch (vereinfacht) <>

Englisch

Hindi <> Englisch

Indonesisch <> Englisch

Japanisch <> Englisch

Koreanisch <> Englisch

Thai <> Englisch

Urdu <> Englisch

SDL arbeitet kontinuierlich an der Erweiterung der

der Baseline-Engines.

Integrationen Anwendungsbeispiele

Integrationen: SDL Trados Studio

7

SDL BeGlobal Enterprise auswählen

Einstellungen für Vorübersetzung festlegen

Integrationen: SDL BeGlobal Web Translator (für das Intranet)

8

Eine einfache Webanwendung zum Übersetzen von Texten und Dokumenten; anpassbar an die jeweilige Corporate Identity

Integrationen: SDL BeGlobal Desktop

9

Ein Desktop-Tool (Widget), das Texte und Dokumente übersetzen kann.

Integrationen: Microsoft Word

Mit dem Word-PlugIn kann der Benutzer das angezeigte Dokument übersetzen

Integrationen: LivePerson-Chat

11

Der Gesprächspartner chattet auf Englisch und alle eingehenden spanischen Nachrichten werden automatisch übersetzt

Der Benutzer chattet auf Spanisch und erhält die Nachrichten des Gesprächspartners ebenfalls auf Spanisch

SDL BeGlobal Trainer

Maßschneiderung und Fokussierung für bessere MÜ-Ergebnisse

• Eine „Software-as-a-Service“-Komponente (SaaS) von SDL BeGlobal, die die individuelle Anpassung (das „Trainieren“) der MÜ-Engines ermöglicht, und zwar anhand von bilingualen Inhalten im TMX-Format.

• Die Baseline-Engines können von den Nutzern mit kunden- oder sektorspezifischen Inhalten trainiert und ihre Qualität so deutlich verbessert werden.

• Das Software-Paket basiert auf bewährter Technologie, die seit Jahren bei Language Weaver/SDL im Einsatz ist = 15+ Jahre Branchenerfahrung.

• „Self-Service/DIY“-Modell: LSPs und Unternehmen können mit SDL BeGlobal Trainer selbstständig die Baseline-Engines trainieren

Was ist der SDL BeGlobal Trainer?

13

Der „Trainings“-Workflow

Cleaning

bilingualer

Inhalte

Bilinguale

Inhalte

identifizieren

Neues

Training

anlegen

TMX

hochladen

Training

der MÜ-

Engine

Bewertung

der

Engine

Aktivieren

der

Engine

Übersetzen BeGlobal Online,

API,

SDL Trados Studio,

OFFLINE

BeGlobal Trainer

BEGLOBAL SaaS

Kundenbeispiel Klingelnberg AG

Praktische Anwendung

Zuerst wollten wir sicher sein, dass die Technologie funktioniert

Sprachpaar Deutsch-Englisch

Unterschiedliche Versuche

Ohne Translation Memory und ohne Terminologie

Angelernte Maschine mittels Translation Memory

Brand-Management (Klingelnberg darf NIE übersetzt werden)

Plus Terminologie / einheitliche Begriffsverwendung

Erkenntnisse

• Die automatisierte Übersetzung von SDL (AT = Automated

Translation) hat anscheinend Probleme, Passivkonstruktionen zu

verarbeiten.

• Hierbei hilft es aktive Formulierungen zu bilden und zu nutzen.

Probleme mit Passiv-Konstruktionen

Name der Präsentation Folie 18

Datum

Name der Präsentation Folie 19

Datum

Erkenntnisse

• Hier weiss ich leider nicht warum, ich denke aber dass es daran liegt,

dass das Verb zum einen zerpflückt ist und sich das eigentliche

Bezugswort anschliesst. Die Satzstellung ist nicht so wie es das

System kennt „der Wechselteller löst sich“ SONDERN „, dann löst sich

der Wechselteller“

Name der Präsentation Folie 21

Datum

Erkenntnisse

• Hier liegt es vielleicht an Tags oder Ähnlichem, die sich im Translation

Memory befinden, so dass anstatt der Übersetzung einiger Wörter nur

eine Lücke angezeigt wird. Auch hier habe ich den Text

umgeschrieben. Hier kam dann zwar die Automated Translation zum

Einsatz, aber durch eine aktive Formulierung und Zerstückelung des

Satzes kam es dann schon wieder gut raus.

Name der Präsentation Folie 23

Datum

Name der Präsentation Folie 24

Datum

Erkenntnisse

• Auch hier schafft eine Umformulierung Abhilfe. Es muss in diesem Fall

ein Synonym gefunden werden, dass nur auf eine Art verstanden

werden kann. (z. B. starten besser als hochfahren [move up])

Wortbedeutungen werden nur im wortwörtlichen Sinne

verstanden

Name der Präsentation Folie 26

Datum

Name der Präsentation Folie 27

Datum

Auswirkung auf den Übersetzungsprozess

Die Übersetzungskosten werden sinken, wenn diese Technologie

konsequent eingesetzt wird

Ziel ist die Ausweitung unternehmensintern, damit jeder eine

Hilfestellung in einer anderen Sprache bekommt ( Start wird englisch

nach deutsch sein)

Workflow ohne Maschinelle Übersetzung

Workflow mit Maschineller Übersetzung

Aussichten

Diese neue Technologie wird erst mit eine paar ausgewählten

Übersetzern eingesetzt

Wir wollen noch mehr Erfahrungen sammeln

Unsere Datenqualität muss verbessert werden

Schreibregeln werden angepasst

Rollout auf alle Übersetzer

Zusätzliche Sprachpaare

Bei Klingelnberg sind wir erst am Anfang

Fazit

Standardisiert Texte sind dafür besser geeignet.

Der Quelltext sollte bereinigt sein.

Es müssen eine Terminologie und grosse Translation Memorys

bereitstehen (beide natürlich bereinigt und konstant optimiert).

Ein genug hohes Übersetzungsvolumen muss vorhanden sein.

Wer die Finger davon lassen sollte:

Firmen mit zu kleinen Übersetzungsvolumen

Wer keine dedizierten Ressourcen hat, um die Qualität sicherzustellen

Maschinelle Übersetzung kann funktionieren, aber...

Haben Sie Fragen? Ulrike Mibs, SDL Language Solutions E-Mail: umibs@sdl.com