Unterscheidendes syntaktisches Reranking für SMTkaeshammer/smt... · 2015. 2. 9. · 2006,...

Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic

Agenda

Problem: Ranking des SMT Systems

Lösung: Reranking-Modell

Nutzung Perzeptron-Algorithmus

Besonderheit: syntaktische Merkmale

Evaluation

Problemstellung Komponenten der SMT Systeme:

Übersetzungsmodell, Sprachmodell, Reordering Modell

Ziel: Verbesserung des Sprachmodells

Ausgangspunkt: SMT System liefert als Output eine Liste der besten n Übersetzungen

Problem: Ranking nicht immer das Beste

„Der Himmel wird morgen blau

sein“

The sky blue tomorrow

The sky will be blue tomorrow

Sky will be blue tomorrow

Lösung: Reranking

Beste Übersetzung

Reranking Algorithmus

SMT System

Reranking durch Klassifikation

Klassifizierte

Stichprobe Modell

Nicht klassifizierte

Datensätze

Lernen

(Training)

Anwenden

sätze

Merkmale

Klasse

Was wird klassifiziert?

Daten werden Klasse zugeordnet

Daten: übersetzte Sätze aus der Liste (bzw.

deren Merkmale)

Entspricht Referenzübersetzung (oracle best)

Klasse 1, sonst Klasse 0

Merkmale durch Merkmalsvektor repräsentiert

Anpassbare Gewichtungen für jedes Merkmal

(Gewichtungsvektor): Wie entscheidend ist

ein Merkmal für eine gute Übersetzung?

Beispiel Gegeben: Trainingsmenge

Gesucht: Gewichtsvektor, der die Trainingsmenge korrekt klassifiziert

Diskriminatives Sprachmodell

Input: Liste der n-besten Übersetzungen

Extraktion syntaktischer Merkmale jedes Satzes,

Kodierung in Merkmalsvektor

Perzeptron-Algorithmus

Ausgabe: Gewichtungsvektor

Reranking der Liste

Ausgabe des

SMT Systems

Parsbäume

oder POS-

Tagger

Auswahl der besten

Übersetzung

Vergleich der

Merkmale mit

Referenzsatz

Merkmalsvektoren

Beschreiben die syntaktischen

Eigenschaften der Sätze: enthält ein Verb,

Verb Agreement etc.

Trainingsdaten, mit denen Modell gelernt

Testdaten, die klassifiziert werden

Jeder Merkmalsvektor gehört

ausschließlich zu einer Klasse

Wie werden die

syntaktischen Merkmale

extrahiert?

Merkmalsextraktion

Vollständige Parsbäume

POS Sequenzen

Parsbäume

Drei Arten von syntaktischen

Informationen werden extrahiert

Informationen über Sequenzen

Head-Informationen (Head = Kern einer

Phrase)

Kontextfreie Grammatikregeln

(Informationen über NT-Folgen)

Beispiel Parsbaum

tomorrow

Unterscheidung von

Sequenzen

POS The/DT sky/NNP will/MD be/VB blue/JJ tomorrow/RB

SEQ-B: Teilstrukturen (chunks) The/NPb sky/NPc will/VPb be/VPb blue/ADVPb tomorrow/ADVPc

SEQ-C: Kombination der ersten beiden Strukturen The/DT-NPb …

POS Tagger

Zwei Tagging-Ansätze

Conditional Random Fields

Einfacher Unigramm-Tagger

Nutzt keinen Kontext

<UNK> als Tag für unbekannte Wörter

Beispiele für Merkmale

Abfolgen von POS-Tags

Häufigkeit von POS-Typen für eine

bestimmte Satzlänge:

length(x)/num(POS,x)

Fehlen gewisser POS-Typen (z.B. Verb)

Verb Agreement („George was shouting

and screaming“)

Merkmalsextraktion

erfolgreich – Was nun?

Künstliches neurales Netz mit anpassbaren Gewichtungen und Schwellwert

Bildet biologisches Nervensystem nach (ein Neuron)

Eingabe: Merkmalsvektor eines übersetzten Satzes

Aufgabe: Lernen des optimalen Gewichtungsvektors aus den Trainingsbeispielen

Zu Beginn Gewichtungsvektor 0

Bestimmung der besten Übersetzung (oracle

best) hinsichtlich BLEU

ausgewählter Satz aus der Liste: Skalarprodukt

aus Merkmalsvektor und Gewichtungsvektor

Wenn ausgewählter Satz mit oracle best Satz

übereinstimmt, fertig (Wert größer als

Schwellenwert)

Sonst: Gewichtungsvektor wird angepasst

yi: oracle best

zi: ausgewählter Satz der Liste

zi = ɸ(z) * ω

wenn zi ≠ yi Anpassung Gewichtsvektor

Merkmalsvektor Gewichtsvektor

Anpassung Gewichtsvektor

ω = ω + ɸ(yi) - ɸ(zi)

Gewichtung

Änderung:

gewünschte

Ausgabe –

tatsächliche

Ausgabe

Reranking

Jeder Satz der n-best Liste erhält einen

neuen Score, der sich folgendermaßen

ergibt:

Gewichteter Score des SMT-Systems für

den Satz + Gewichtsvektor *

Merkmalsvektor

Satz mit dem höchsten Score wird als

beste Übersetzung ausgewählt

Evaluation

Wie effektiv sind die verschiedenen

syntaktischen Merkmale?

Evaluierung von Arabisch-zu-Englisch

Übersetzungen

Testsets von NIST‘s MT-Eval von 2002 bis

2006, bezeichnet als MT02 bis MT06

Baseline SMT System: Moses

Evaluation - Genauigkeit der

POS Tagger

POS Accuracy

CM2 (für Development und Test

CRF (Conditional Random Fields) 97.0%

S-POS (simple tagger) 86.8%

Evaluation - Baseline

Ergebnisse (BLEU)

MT04 MT05 MT06

Moses 48.97 53.92 38.40

+ DLM n-gram 49.57 54.42 39.08

Oracle 61.06 66.34 50.11

Evaluation – nach Merkmalen

der Parsbäume

MT04 MT05 MT06

Moses 48.97 53.92 38.40

+ DLM n-gram 49.57 54.42 39.08

+ n-gram + POS 49.47 54.48 39.07

+ n-gram + SEQ-B 49.09 54.11 39.47

+ n-gram + SEQ-C 49.46 54.19 39.07

+ n-gram + CFG 49.53 54.44 39.58

+ n-gram + H 49.44 54.09 33.45

Evaluation - Anteil an Sätzen,

die einen Parse haben

# Sätze p.p.s%

MT0203 1282287 87.3%

MT04 1075563 81.9%

MT05 744049 82.6%

MT06 1526170 80.7%

Evaluation – Merkmale von

POS Taggern und POS-

Annotationen des Parsbaums

MT04 MT05 MT06

DLM n-gram 49.57 54.42 39.08

DLM n-gram + POS 49.47 54.48 39.07

Verbesserung -0.10 0.06 -0.01

DLM n-gram + CRF

49.74 54.51 39.45

Verbesserung 0.17 0.09 0.37

DLM n-gram + S-POS

49.59 54.60 39.48

Verbesserung 0.02 0.18 0.40

Evaluation – POS Tag

Häufigkeit, Fehlen von POS

Typen, Verb Agreement

MT04 MT05 MT06

+ DLM n-gram 49.57 54.42 39.08

+ S-POS+vn+dn 49.65 54.60 39.67

+ S-POS+allnum 49.65 54.60

+ S-POS+noall 49.70 54.46 39.69

+ S-POS+verbagr 49.44 54.56 39.55

Evaluation – n-Gramm

Precision

Task System n-gram Precision (%)

1 2 3 4

MT04 n-gram

+ Syntax

Verbesserung (%) -0.1% 0.2% 0.5% 0.5%

MT05 n-gram

+ Syntax

Verbesserung (%) -0.04% 0.3% 0.5% 0.6%

MT06 n-gram

+ Syntax

Verbesserung (%) -0.2% 0.2% 0.4% 0.4%

Nutzen syntaktischer Merkmale

Nutzen einfacher POS Tagger

Signifikante Verbesserungen

Zukünftig: mögliche Nutzung von partiellen Parsern weniger

Informationen als bei Fullparsern, aber

mehr als bei POS Taggern

Vielen Dank!

Quellen

Discriminative Syntactic Reranking for Statistical Machine Translation, S. Carter & C. Monz, AMTA 2010

http://www.cs.uni-paderborn.de/fileadmin/Informatik/AG-Kleine-Buening/files/ws11/ml11/folien-neuronale-netze.pdf

http://www.cs.jhu.edu/~zfli/pubs/discriminative_lm_for_smt_zhifei_amta_08.pdf

Unterscheidendes syntaktisches Reranking für SMTkaeshammer/smt... · 2015. 2. 9. · 2006,...

Documents

Transcript of Unterscheidendes syntaktisches Reranking für SMTkaeshammer/smt... · 2015. 2. 9. · 2006,...

Fertigung bei IK Elektronik · - 2 SMT-Bestückcenter (Pulse/Yamaha in flexiblem Linienkonzept - SMT-Bestückung aller gängigen Bauteile (BGA, QFN, QFP, SMT bis 01005) - Konventionelle

SMT. CHANDIBAI HIMATHMAL MANSUKHANI COLLEGE, …

Individual Competence Baseline · Impressum Das vorliegende Dokument „Individual Competence Baseline für Projektmanagement“ ist ein Teil der deutschen Fassung der IPMA ICB 4.0

Sauerstoff-Mehrschritt- Therapie nach von Ardenne (SMT) · Sauerstoff-Mehrschritt-Therapie nach von Ardenne (SMT) Zusammenfassender Bericht des Arbeitsausschusses "Ärztliche Behandlung"

REConf 2016 - hood-group.com · - Innovative Baseline SRL (Tiberius Opitz/Sitz Rumänien/2012 gegründet) - Bedingt durch die finanziellen Mittel, den Sitz der Innovative Baseline

A BASELINE ASSESSMENT FOR FUTURE IMPACT EVALUATION …

Objektprofil November 2019 - faz.mediaVideo-Einbettung MPEG-4 Video (Baseline profile 3.1) und QuickTime Movies im Format H.264 Video (Baseline profile 3.1) Anzeigengewicht Statische

Fortgeschrittene Themen der statistische maschinelle ...kaeshammer/smt...Fortgeschrittene Themen der statistische maschinelle Ubersetzung¨ (SMT II / Advanced SMT) Ubersicht und Einf¨

Maskiertes semantisches Priming - E-Thesesothes.univie.ac.at/33909/1/2014-08-19_0808167.pdf · V Zusammenfassung In dieser Studie wurde subliminales syntaktisches Priming untersucht.

rpp eko 10 smt genap.doc

Evaluation of Seguro Popular: Baseline Analysis - Gary King

Broschüre ACUSON P500 - SMT Ultraschall

ODU FLAKAFIX SMT-ausführungen€¦ · ODU FLAKAFIX Seite 31 SMT-Wannenleiste, Serie 511 Gerade, platzsparende Ausführung Merkmale – Rast er 2,54 × 2,54 mm – 2-reihig – geschlossene,

SMT 300 Leakfinder für die Dichtigkeitsdiagnose von nahezu ... · PDF fileSMT 300 Leakfinder für die Dichtigkeitsdiagnose von nahezu allen Fahrzeugkomponenten Der Bosch SMT 300 Leakfinder

SMT-100 - · PDF fileSMT-100 GSMFunkAlarmsystem Bedienungsanleitung. 2 Inhaltverzeichnis Kapitel1DieAlarmZentrale 1.1Besonderheiten 1.2TechnischeDaten 1.3Verpackungliste

Einführung in die Surface Mount Technology (SMT ... · Projekt zur finiten Elementmethode. TU Berlin, 0530 L 164, SS 2011 16 SMT solder joints: formation of interface cracks microstructural

Modul Smt 2 2011 News Item

Ökonomisches Planungsmodell eines Stiermastbetriebes mit ... · Tabelle 29 Sozialversicherungsbeitrag Investitionsvariante 1, Baseline 83 Tabelle 30 Schattenpreise, Baseline 83 Tabelle

CTVS - AIIMS RISHIKESH€¦ · 5 23448 ENT/76 ENT Smt Shivani Rathi Dr.Saurabh Varshney Phase-1, Tulsi Vihar Gumaniwala Rksh 18/Feb/14 20/Feb/14 6 21909 ENT/104 ENT Smt Sneha Dr.Manu

Swiss Organisational Competence Baseline - spm.ch · Titel Swiss Organisational Competence Baseline (Swiss OCB) Version 1.0 Herausgeber Swiss Project Management Association (spm)