1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

62
1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010

Transcript of 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Page 1: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

1

Transduktoren fuumlr die Sprachverarbeitung

Karin Haenelt

1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

2

Akzeptoren - Transduktoren

copy Karin Haenelt Transduktoren 1652010

3

Akzeptor Transduktor

0 1S

qt

2 3a

5

dt4

tt tt0 1

[ʃ]S

q[t]t

2 3[a]a dt

4[t]

Grundkonzept

regulaumlre Mengen Akzeptor

Erkenner

GrundkonzeptRelationen zwischenregulaumlren Mengen

Transduktor Erkenner Generator Uumlbersetzer

Transduktor Betrachtungsweisen

Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von

Zeichenketten akzeptiert werden oder nicht Generator

Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von

Zeichenketten Uumlbersetzer

Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten

welche zusammen mit den gelesenen Zeichenketten akzeptiert werden

4copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

5

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 2: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

2

Akzeptoren - Transduktoren

copy Karin Haenelt Transduktoren 1652010

3

Akzeptor Transduktor

0 1S

qt

2 3a

5

dt4

tt tt0 1

[ʃ]S

q[t]t

2 3[a]a dt

4[t]

Grundkonzept

regulaumlre Mengen Akzeptor

Erkenner

GrundkonzeptRelationen zwischenregulaumlren Mengen

Transduktor Erkenner Generator Uumlbersetzer

Transduktor Betrachtungsweisen

Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von

Zeichenketten akzeptiert werden oder nicht Generator

Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von

Zeichenketten Uumlbersetzer

Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten

welche zusammen mit den gelesenen Zeichenketten akzeptiert werden

4copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

5

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 3: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Akzeptoren - Transduktoren

copy Karin Haenelt Transduktoren 1652010

3

Akzeptor Transduktor

0 1S

qt

2 3a

5

dt4

tt tt0 1

[ʃ]S

q[t]t

2 3[a]a dt

4[t]

Grundkonzept

regulaumlre Mengen Akzeptor

Erkenner

GrundkonzeptRelationen zwischenregulaumlren Mengen

Transduktor Erkenner Generator Uumlbersetzer

Transduktor Betrachtungsweisen

Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von

Zeichenketten akzeptiert werden oder nicht Generator

Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von

Zeichenketten Uumlbersetzer

Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten

welche zusammen mit den gelesenen Zeichenketten akzeptiert werden

4copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

5

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 4: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor Betrachtungsweisen

Erkenner Betrachtung beide Baumlnder werden gelesen berechnete Information Entscheidung ob die Paare von

Zeichenketten akzeptiert werden oder nicht Generator

Betrachtung beide Baumlnder werden geschrieben berechnete Information Aufzaumlhlung der akzeptierten Paare von

Zeichenketten Uumlbersetzer

Betrachtung ein Band wird gelesen ein Band wird geschrieben berechnete Information Aufzaumlhlung aller moumlglichen Zeichenketten

welche zusammen mit den gelesenen Zeichenketten akzeptiert werden

4copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

5

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 5: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

5

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 6: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Akzeptoren ndash Transduktoren Aumlquivalenzen

copy Karin Haenelt Transduktoren 1652010

6

EndlicheTransduktoren

regulaumlre Relationen

-Regulaumlre

Sprachpaare

Regulaumlre Ausdruumlckeuumlber Symbolpaare

spezifizieren

akzeptieren

sindaumlquivalent

EndlicheAkzeptoren

regulaumlre Mengen

-RegulaumlreSprachen

Regulaumlre Ausdruumlckeuumlber Symbole

spezifizieren

akzeptieren

sindaumlquivalent

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 7: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor Aumlquivalenzen

Endliche Transduktoren sind aumlquivalent zu regulaumlren Relationen Zu jedem endlichen Transduktor laumlsst sich eine aumlquivalente

regulaumlre Relation konstruieren und umgekehrt

Ein Transduktor ist ein endlicher Automat der zwei regulaumlre Sprachen in Relation zueinander setzt und eine regulaumlre Relation repraumlsentiert

7copy Karin Haenelt Transduktoren 1652010

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 8: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Regulaumlre Relationen

Formulierung 1 Das Cartesische Produkt zweier regulaumlrer Mengen L1 und L2 heiszligt

regulaumlre Relation

Formulierung 2 Seien 1 2 Alphabete formaler Sprachen Dann ist die Menge der

regulaumlren Relationen folgendermaszligen bestimmt Die leere Menge ist eine regulaumlre Relation (xy) fuumlr alle xy 12 ist eine regulaumlre Relation Wenn R R1 und R2 regulaumlre Relationen sind dann sind

R1 R2 = (x1x2y1y2) | (x1y1) R1 (x2y2) R2 R1 R2 = (xy) | (xy) R1 (xy) R2 R = i=0 Ri

regulaumlre Relationen Nichts sonst ist eine regulaumlre Relation

copy Karin Haenelt Transduktoren 1652010

8

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 9: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Regulaumlre RelationenBeispiele

gemaumlszlig Formulierung 1 Cartesisches Produkt zweierregulaumlrer Mengen

(gabmiddotst) (gebmiddoten)

gemaumlszlig Formulierung 2 regulaumlre Relation

(gabgeb) middot (sten)

copy Karin Haenelt Transduktoren 1652010

9

stgab

engeb

st

en

gab

geb

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 10: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare

copy Karin Haenelt Transduktoren 1652010

10

gegeben zwei Relationen RS - elementare Ausdruumlcke Oslash (xy) - Vereinigung Summe R cup S = (ab) | (ab) ∊ R or (ab) ∊ S

- Konkatenation Produkt R middot S = (axby) | (ab) ∊ R and (xy) ∊ S

- Huumllle R

bb

aa

b

a

b

a

by

ax

y

x

b

a

sang

sing

saumlng

singsingsing

sangsaumlng

y

x

b

axa

yb

gibst

geben

st

en

gib

geb

haha

hihi

ha

hi

ha

hi

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 11: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Regulaumlre Ausdruumlcke uumlber Symbolpaare

Regulaumlre Ausdruumlcke uumlber Symbole (gab) (ε | st)

Regulaumlre Ausdruumlcke uumlber Symbolpaare (gabgeb) (εen) (sten) (gg middot ae middot bb) middot (εe middot εn) (se middot tn)

11

gabst

geben

gab

gebenen

st

en

gab

geb

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 12: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

12

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 13: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Notation

copy Karin Haenelt Transduktoren 252009

13

Q Zustandsmenge p q Zustaumlnde Σ Eingabe-Alphabet Σ Menge aller Worte uumlber dem Eingabe-Alphabet Δ Ausgabe-Alphabet Δ Menge aller Worte uumlber dem Ausgabe-Alphabet q0 Startzustand F Menge von Endzustaumlnden δ Uumlbergangsfunktion fuumlr Eingabesymbole δ Uumlbergangsfunktion fuumlr Eingabeketten σ Ausgabefunktion w Gewichtungsfunktion λ Praumlfix bzw Startgewicht ρ Suffix bzw Endgewicht a b und Ziffern Ein- bzw Ausgabezeichen xyz Ein- bzw Ausgabezeichenreihen ε leeres Wort (= Wort der Laumlnge 0)

T = ( Q Σ Δ q0 F δ σ wλ ρ)

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 14: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

allgemeine Form T = ( Q Σ Δ q0 F δ σ w) Mengen Q Menge der Zustaumlnde Σ Menge der Eingabezeichen Δ Menge der Ausgabezeichen ausgezeichnete Elemente q0 Q Startzustand

F Q Menge der Endzustaumlnde

RelationenFunktionen Angabe des Definitions- und Wertebereichs der Abbildung δ Q (Σ ε) rarr 2Q Zustandsuumlbergangsfunktion

σ Q (Σ ε) Q rarrΔ Ausgabefunktion

w Q (Σ ε) Q rarr R+

oder Q (Σ ε) Q Δ rarr R+

Gewichtungsfunktion

Transduktor Definition

14copy Karin Haenelt Transduktoren 1652010

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 15: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor Darstellung

die Kanten sind Elemente der Menge Q timesΣtimesΔtimes+timesQ haben die Form (piowq)

p Q Ausgangszustand i Σ Eingabe-Etikett (input label) o Δ Ausgabe-Etikett (output label) w + Gewicht (weight) q Q Zielzustand

graphische Darstellung

15

qwoi

p q

i

wo

p

oder

obere Sprache

untere Sprache

copy Karin Haenelt Transduktoren 1652010

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 16: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor zu Grunde liegender Automat

Zu Grunde liegender Automat Sei T = ( Q Σ Δ q0 F δT σ ) ein endlicher Transduktor

dann ist A = ( Q X q0 F δA) der zu Grunde liegende Automat wenn gilt (qi (xy) qj) δA und qi qj mit qj δ(qix) und y = σ(qi x qj)

X ist die Vereinigung aller solcher Paare (xy) in T

16

0 1 2 3 4s a n gs i n g

0 1 2 3 4(ss) (ai) (nn) (gg)

bull (q1 (ai) q2) δA und

bull q2 δ(q1a) und

bull i = σ(q1 a q2)

Zu Grunde liegender Automat ATransduktor T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 17: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor Identitaumltstransduktor

Identitaumltstransduktor Der Identitaumltstransduktor T = ID (A) eines endlichen Automaten

A = ( QΣ q0 F δ) ist wie folgt definiert

T = ( Q Σ Σ q0 F δ σ ) mit σ(qi x qj) = x fuumlr alle x Σ qiqj Q fuumlr die gilt qj δ(qix)

17

m a c h m a c h

m a c h

A = ( QΣ q0 F δ) T = ( Q Σ Σ q0 F δ σ )

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 18: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktor Projektionen

Erste und zweite Projektion Die erste Projektion π1(T) eines normalisierten Transduktors

T = ( Q Σ Δ q0 F δ σ ) ist der Automat A = ( Q Σ q0 F δ) Die zweite Projektion π2(T) eines normalisierten1 Transduktors

T = ( Q Σ Δ q0 F δT σ ) ist der Automat A = ( Q Δ q0 F δA) mit (qi y qj) δA wenn qi qj x mit y = σ(qi x qj) und qj δT(qix)

18

w i e gw o g ε

w o g ε

w i e g

π1(T) A = ( Q Σ q0 F δ)

π2(T) A = ( Q Δ q0 F δA)

T

(Def vgl Hanneforth (2002 3)

copy Karin Haenelt Transduktoren 1652010

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 19: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Durch Transduktoren berechenbare Relationen

R(T) = (ab) ΣΔ und (ab) ist das Etikett eines erfolgreichen Pfades in T

Transduktoren koumlnnen regulaumlre (auch rationale) Relationen berechnen

Eine rationale Relation die eine (partielle Funktion) darstellt heiszligt rationale Funktion

19copy Karin Haenelt Transduktoren 1652010

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 20: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sprache eines Transduktors

Die Sprache L(T) eines Transduktors T = (Q q0 F Σ Δ δ σ) ist die regulaumlre Relation (uv) (Σ Δ) | qf F so dass gilt qf δ(q0u) und σ(q0u) = v

δ ist die bekannte Erweiterung von δ auf Zeichenreihen uumlber Σ

σ ist die entsprechend erweiterte Ausgabefunktion

20

vgl (Hanneforth 2002 4)

copy Karin Haenelt Transduktoren 1652010

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 21: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktionsabbildung

Die Transduktionsabbildung T Σrarr2Δ eines Transduktors T ist wie folgt definiert

T (u) = v Δ | (uv) L(T)

21

w i e g

w o g ε

o go g

T (wog) = wieg wog

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 22: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Erweiterte Funktionen δ und σ

Grundfunktionen fuumlr Zeichen

erweiterte Funktionen fuumlr Zeichenreihen

22

paq )(baq )(

baQqp

awQq qq )(

))(()( awqwaq )( q

))(()()( awqwqwaq eine Zeichenreihe w wird von T akzeptiert gdw(q0w) Fdie Ausgabe ist dann (q0w)

copy Karin Haenelt Transduktoren 1652010

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 23: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Erweiterte Funktion σ Beispiel

erweiterte Funktionen σ fuumlr Zeichenreihen

23

σ ( q w a ) = σ ( q w ) σ ( δ ( q w ) a ) σ ( 0 ei n ) = σ ( 0 ei ) σ ( δ ( 0 ei ) n ) = σ ( 0 ei ) σ ( 2 n ) = au s

0 1 2 3e i na u s

))(()()( awqwqwaq

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 24: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

24

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 25: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Aspekt Auspraumlgung Benennung Ausgabestelle Zustand Moore-Automat

Kante Mealy-Automat Kantenetiketten Woumlrter (Zeichenreihen)

Zeichen ε Zeichen oder ε literal oder normalisiert

Endausgabe ohne Endausgabe mit Endausgabe

Typ der Relation Relation ambig relational

Funktion funktional Verhaumlltnis der EinAusgabekanten

(Zeichen | ε) ( Zeichen | ε) asynchron Zeichen Zeichen synchron

Eingabeseite nicht-deterministisch nicht-sequentiell deterministisch sequentiell

Transduktoren mit bestimmten Eigenschaften

25copy Karin Haenelt Transduktoren 1652010

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 26: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktoren Ausgabestelle

Zwei klassische Modelle Moore-Maschine (1956)

Ausgabe am Zustand Mealy-Maschine (1955)

Ausgabe bei Transition

26copy Karin Haenelt Transduktoren 1652010

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 27: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Moore-Maschine

27

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

q Ausgabefunktion Q

)( 0qQA

q0 q1 q2

0 1 2

HopcroftUllmann 198843

Q 0 1

q0 0 q0 q1 q1 1 q2 q0 q2 2 q1 q2

1

11

0

00

copy Karin Haenelt Transduktoren 1652010

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 28: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Mealy-Maschine

28

Q endliche Menge von N Zustaumlnden q0 q1 hellip qN-1 endliche Menge von Eingabesymbolen endliche Menge von Ausgabesymbolen q0 Startzustand iq Uumlbergangsfunktion QQ i

iq Ausgabefunktion Q

)( 0qQA

Q 0 1

q0 p0n p1n p0 p0y p1y p1 p0n p1y

HopcroftUllmann 198843

q0

p1

p0

1n 0n

0y

1y

0n

1n

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 29: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Aumlquivalenz von Mealy und Moore-Maschine

Beide Typen produzieren dieselben Abbildungen zwischen Eingabe und Ausgabe

Aumlquivalente Maschinen konstruierbar

29copy Karin Haenelt Transduktoren 1652010

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 30: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktoren mit literalen Kantenetiketten

literaler normalisierter Transduktor jede Eingabekante und jede Ausgabekante ist mit einem

Buchstaben etikettiert oder mit ε Definition Ein Transduktor T heiszligt literal oder normalisiert wenn

giltσ Q x (Σ ε) rarr Δ ε

Lemma Jeder Transduktor dessen Transduktion nicht ε enthaumllt kann normalisiert werden

30

0 1[ʃ]S

q[t]t

2 3[a]a

5

[t]dt

4

[t]tt

nicht normalisiert

0 1[ʃ]S

q[t]t

2 3[a]a

6

[t]d

4

t 7

5t

t

[t]

normalisiert

copy Karin Haenelt Transduktoren 1652010

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 31: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktoren als Funktion bzw Relation funktionaler Transduktor

Fuumlr jede Eingabezeichenreihe gibt es houmlchstens eine Ausgabezeichenreihe f(koumlnn)=kann

Definition Ein Transduktor T heiszligt funktional wenn gilt| T(x) | 1 fuumlr alle x

T heiszligt in diesem Fall auch rationale Funktion

ambiger relationaler Transduktor Fuumlr eine Eingabezeichenreihe gibt es mehr als eine

Ausgabezeichenreihe f(brach)= brech bring Definition Ein Transduktor T heiszligt relational wenn gilt

| T(x) | gt 1 fuumlr mindestens ein x T heiszligt in diesem Fall auch rationale Relation

31copy Karin Haenelt Transduktoren 1652010

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 32: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Transduktoren als Relation

einfach endlich ambiger Transduktor Definition Ein Transduktor T heiszligt einfach endlich ambig wenn gilt

T(x) ist endlich fuumlr alle x Beispiel ein Transduktor mit an rarr (b | c)n

unendlich ambiger Transduktor Definition Ein Transduktor T heiszligt unendlich ambig wenn er nicht

einfach endlich ambig ist Beispiel ein Transduktor mit a rarr b c

uniform endlich ambiger Transduktor Definition Ein Transduktor T heiszligt uniform endlich ambig wenn es

eine ganze Zahl N gibt so dass gilt | T(x) | N fuumlr alle x

Beispiel ein Transduktor mit a rarr (b | c)

32

vgl (Hanneforth 2002 5)

copy Karin Haenelt Transduktoren 1652010

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 33: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

synchroner Transduktor

Relation zwischen Eingabe und Ausgabe ist laumlngenerhaltend jede Eingabekante und jede Ausgabekante ist mit einem Buchstaben

etikettiert dh keine ε-Kante Definition Ein Transduktor T heiszligt synchron wenn gilt |T (x) | = |x|

33

w i e g

w o g εw o gw o g

synchroner Transduktor asynchroner Transduktor

| T (x) | = | x |

| T (wog) | = | wog |

| wog | = | wog | 3 = 3

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 34: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

34

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 35: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sequentielle Transduktoren

hellip betrachten wir etwas ausfuumlhrlicher da sie in der Verarbeitungspraxis eine bedeutende Rolle spielen

Eingabeseite deterministisch sequentieller Transduktor In jedem Zustand gibt es houmlchstens eine ausgehende Kante

mit einem gegebenen Element des Eingabealphabets Eingabe leere Kette nicht zulaumlssig Ausgabe leere Kette moumlglich EingabeAusgabe nicht notwendigerweise 1 Zeichen 1

Zeichen (nicht notwendigerweise laumlngenerhaltend) ein einziger Startzustand

35copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 36: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sequentielle Transduktoren

36

xa

yb

0

2

1 xa

xb

0

2

1xa

ya

0

2

1 xa

y

0

2

1

bidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

unidirektionalsequentiell

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 37: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sequentielle Transduktoren

37

p qi

ow

p qio1w

rio2w

p qi

aw o1w

o2w

p qi

ow x

sequentiell d QQ Q | + | +

d wie sequentiell wie sequentiell F

d wie sequentiell wie sequentiell F ()p p

nicht sequentiell Q(ε)2Q

subsequentielleine Endausgabe

endlich-subsequentiellendlich vieleEndausgaben

Q(ε) Q 2 | 2+ | 2+

copy Karin Haenelt Transduktoren 1652010

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 38: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Endlich-subsequentielle Transduktoren

Generalisierung sequentieller Transduktoren maximal endlich viele Ausgabeketten pro Endzustand 1-subsequentielle Transduktoren = subsequentielle

Transduktoren ermoumlglicht Behandlung einer ambigen Relation in einem nicht-

ambigen Automaten

38copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 39: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sequentielle Transduktoren Beispiel

39

0 1b

b2 3 4 5

e hr c

a hr c

6 7 8 9i gr n

a hr c

nicht-sequentiellerTransduktor

aumlltere Bezeichnung p-subsequentieller Transduktor

0 1b

b2 3 4 5

r

a hr c

ech

ing

endlich-subsequentieller Transduktor

copy Karin Haenelt Transduktoren 1652010

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 40: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Sequentielle Transduktoren Zeit-Komplexitaumlt

Berechnung fuumlr eine gegebene Eingabe haumlngt nur von der Laumlnge der Eingabe ab nicht von der Groumlszlige des Transduktors

Berechnung folgt dem Pfad der durch die Eingabezeichenreihe definiert

ist erzeugt die korrespondierende Ausgabe

40copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 41: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

41

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 42: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Operationen auf Transduktoren

rationale Operationen analog zu Akzeptoren Vereinigung Konkatenation Huumlllenbildung

Operationen fuumlr Transduktoren Projektion Komposition hellip

Optimierung Determinisierung (hier Sequentialisierung) hellip

42copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 43: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

43

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 44: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Abgeschlossenheit

endliche Transduktoren sind generell abgeschlossen unter Verkettung Vereinigung Huumlllenbildung Komposition Invertierung

endliche Transduktoren sind nicht generell abgeschlossen unter Differenz Komplementation 1) 2)

Intersektion 1) (anbcn) (abncn) ergibt (anbncn) abgeschlossen fuumlr

1) synchrone FSTs (kein ε Relation laumlngenerhaltend)2) endlich-subsequentielle FSTs

44copy Karin Haenelt Transduktoren 1652010

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 45: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Entscheidbarkeit

es ist entscheidbar ob ein Transduktor subsequentiell ist und ob er sequentiell ist eine rationale Funktion realisiert determinisiert werden kann

Seien 12 Alphabete mit mindestens zwei Buchstaben und RS 12 Es ist nicht entscheidbar ob R S = Oslash R S R = S (dh zwei Transduktoren aumlquivalent sind) R = 12

(12)R endlich ist R erkennbar ist

45

(Berstel 197990)

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 46: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

46

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 47: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Bidirektionalitaumlt

Transduktoren sind inhaumlrent bidirektional repraumlsentierte Relationen sind Abbildungen von oberer

Sprache zu unterer Sprache und umgekehrt Anwendungsinteressen

in einigen Faumlllen ist Abbildung nur in einer Richtung erwuumlnscht

in anderen Faumlllen ist Abbildung in beide Richtungen erwuumlnscht Morphologie Analyse und Generierung TextSpeech und SpeechText

47copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 48: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Bidirektionalitaumlt Beispiel

Lexikalischer Transduktor bildet flektierte Formen auf Lemmata ab erzeugt zu Lemmata flektierte Formen

48

httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtmlBeispiel aus

0 1 2

3 4 5

7 8 96

l ea v e +VBZs

vf eεaε

+VBε

+VBDt

Sigma aeflstv+VB+VBD+VBZVB VerbVBZ Verb ndashs-FormVBD Verb Praumlteritum

copy Karin Haenelt Transduktoren 1652010

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 49: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Bidirektionalitaumlt Linguistische Adaumlquatheit

Automaten repraumlsentieren Regelsysteme die eine Sprache generieren die nicht zu 100 einer menschlichen Sprache entspricht

es handelt sich um Annaumlherungen die Annaumlherungen werden der Analyse- und der

Generierungsseite zuweilen unterschiedlich gerecht Beispiel Kreativitaumlt

Analyse produktive Regeln sollen zugelassen werden bdquobeldquoNomnVerbendung bdquobesteuernldquo bdquobesendernldquo bdquobesaitenldquo bdquobewaldenldquo

Generierung Eigenkreationen des Systems moumlglicherweise unerwuumlnscht bdquobegeldenldquo bdquoberechnernldquo

49copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 50: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

50

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 51: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Relation Grundbegriffe

geordnetes Paar (a1 a2) zwei Elemente in festgelegter Reihenfolge

n-Tupel (a1 hellip an) n Elemente in festgelegter Reihenfolge

Projektionen eines geordneten Paares Sei X = (a b) ein geordnetes Paar

51

istPaar geordneteskein falls

falls)(1 Xtundefinier

(ab) XbaX Def

ist Paar geordneteskein falls

falls)(2 Xtundefinier

(ab) XabX Def

copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 52: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Relation Grundbegriffe

Cartesisches Produkt Seien A1 An Mengen Das Cartesische Produkt (direktes

Produkt Kreuzprodukt) von A1 An ist die Menge

A1 x A2 = (a1a2) | a1 A1 und a2 A2 bzw

A1 x x An = (a1an) | a1 A1 und an An

Jede Teilmenge des Cartesischen Produktes zweier Mengen A x B ist eine Korrespondenz Korrespondenzen Beziehungen zwischen Elemente verschiedener

Mengen Relationen Beziehungen zwischen Elementen einer Menge die Literatur zu endlichen Automaten vernachlaumlssigt den

Unterschied und spricht nur von Relationen

52copy Karin Haenelt Transduktoren 1652010

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 53: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Relation Grundbegriffe

53

Jede Teilmenge R des Cartesischen Produktes zweier Mengen A x B ist eine Relation

m a c hm a c h

s a n gs i n g

s i n gs i n g

w i e gw o g ε

w o gw o g

geordnetes Paar (saumlngsing)

Cartesisches Produkt (machmach) (machsing) (machwieg) (machwog) (saumlngmach) (saumlngsing) (saumlngwieg) (saumlngwog)hellip (wogmach) (wogsing) (wogwieg) (wogwog)

Relation R AB bdquohat den kanonischen Stammldquo (machmach) (saumlngsing) (sangsing) (singsing) (sungsing) (wogwieg) (wogwog)

machsaumlngsangsing

sungwog

mach

sing

wiegwog

A B

copy Karin Haenelt Transduktoren 1652010

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 54: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Themen

Einfuumlhrung Aumlquivalenzen Transduktoren und regulaumlre Relationen Transduktoren

Definitionen Transduktoren mit bestimmten Eigenschaften sequentielle Transduktoren

sequentiell subsequentiell endlich-subsequentiell Operationen auf Transduktoren Abgeschlossenheit Entscheidbarkeit Bidirektionalitaumlt Anhang Grundlagen Relationen Anhang Aumlquivalenz von Mealy- und Moore-Automaten

copy Karin Haenelt Transduktoren 1652010

54

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 55: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Aumlquivalenz vonMealy-Maschine und Moore-Maschine

55

MealyX )( 01 qQM Moore ])[( 002 bqQM 0b beliebiges Element aus (Ausgabealphabet) ][ bq Repraumlsentant eines Zustandes in 2M )]([ abq )]()([ aqaq ][ bq b

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y Vgl HopcroftUllmann 198843

Q Moore 0 1 [q0n] n [p0n] [p1n] [q0y] y [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 56: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Aumlquivalenz von Mealy- und Moore-Maschine

56

1n 0n

0y

1y

0n

1n

q0

p1

p0

y

q0n

p0y

p0n

q0y p1y

p1nn n n

y y

0

0

1

1

00

0

0

1

11

1

nichterreichbardh tilgbar

HopcroftUllmann 19884546copy Karin Haenelt Transduktoren 1652010

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 57: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Aumlquivalenz von Mealy- und Moore-Maschine

57

Moore )( 01 qQM MealyX )( 02 qQM ][ aq ))(( aq

Q MealyX 0 1 q0 n p0n p1n q0 y p0n p1n p0 n p0y p1y p0 y p0y p1y p1 n p0n p1y p1 y p0n p1y

Q Moore

0 1

[q0n] n [p0n] [p1n] [p0n] n [p0y] [p1n] [p0y] y [p0y] [p1n] [p1n] n [p0n] [p1y] [p1y] y [p0n] [p1y]

Q Mealy 0 1 q0 p0n p1n p0 p0y p1n p1 p0n p1y

copy Karin Haenelt Transduktoren 1652010

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 58: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Vielen Dank

fuumlr das Aufspuumlren von Fehlern in fruumlheren Versionen und fuumlr Verbesserungsvorschlaumlge danke ich

Simone Eberhard Katja Niemann Christian Roth Ineta Sejane

58copy Karin Haenelt Transduktoren 1652010

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 59: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Literatur

Jean Berstel (1979) Transductions and Context-Free Languages Stuttgart Teubner Jean Berstel und Dominique Perrin (2004) Algorithms on Words In MLothaire (ed)

(2004) Applied Combinatorics on Words httpwww-igmuniv-mlvfr~berstelLothaireLothaire3appcowC1ps (version 06042004)

Eberhard Simone Niemann Katja und Ineta Sejane (2004) Determinisierung von Transduktoren Seminarrreferat 28062004 httpkontextfraunhoferdehaeneltkursReferateEberhard_Niemann_Sejane_S2004AlgorithmusMohrippt bzw pdf

Jurafsky Daniel und James H Martin (2000) Speech and Language Processing An Introduction to Natural Language Processing Computational Linguistics and Speech Recognition New Jersey Prentice Hall S 21-56

Haenelt Karin (2004) Determinisierung von Transducern Eine Erlaumluterung des Algorithmus von Mohri httpkontextfraunhoferdehaeneltkursfolienFstDetermMohripdf

Haenelt Karin (2004) Operationen auf endlichen Automaten und Transduktoren Definitionen Algorithmen Erlaumluterungen und Beispiele ndash eine Uumlbersicht httpkontextfraunhoferdehaeneltkursfolienFSOperationenDefpdf

Hanneforth Thomas (2002 ) Finite-State Techniken Transduktoren Kursfolien Universitaumlt Potsdam httpwwwlinguni-potsdamdekurseEndlicheTechnikenTransduktorenpdf

59copy Karin Haenelt Transduktoren 1652010

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 60: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Literatur

Hopcroft John E Rajeev Motwani und Jeffrey D Ullman (2001) Introduction to Automata Theory Languages and Computation Addison-Wesley httpwww-dbstanfordedu~ullmanialchtml

Hopcroft John E und Jeffrey D Ullman Einfuumlhrung in die Automatentheorie formale Sprachen und Komplexitaumltstheorie Bonn u a Addison-Wesley 1988 (engl Original Introduction to automata theory languages and computation)

Karttunen Lauri (2003) Finite-State Technology In Ruslan Mitkov (Hg) The Oxford Handbook of Computational Linguistics Oxford University Press

Mohri Mehryar (1997) Finite State Transducers in Language and Speech Processing In Computational Linguistics 23 2 1997 S 269-311 httpciteseernjneccommohri97finitestatehtml

Mohri Mehryar (1996) On some Applications of finite-state automata theory to natural language processing In Journal of Natural Language Egineering 2 S 1-20

Mohri Mehryar und Michael Riley (2002) Weighted Finite-State Transducers in Speech Recognition (Tutorial) Teil 1 httpwwwresearchattcom~mohripostscripticslpps Teil 2 httpwwwresearchattcom~mohripostscripticslp-tut2ps

Starke Peter H (1969) Abstrakte Automaten VEB Deutscher Verlag der Wissenschaften Berlin

XEROX Finite State Compiler httpwwwxrcexeroxcomcompetenciescontent-analysisfsCompilerfsnetworkhtml

60copy Karin Haenelt Transduktoren 1652010

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 61: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Versionen

40 1652010 34 252009 33 15072008 32 18052008 31

17052007 30 12052007 20 27052006 13 05062005 31052005 30052005 29052005

25052005 12 24052004 17052004 28042004

1802200415022004 11 30052003 10 15012003

61copy Karin Haenelt Transduktoren 1652010

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright
Page 62: 1 Transduktoren für die Sprachverarbeitung Karin Haenelt 16.5.2010.

Copyright

copy Karin Haenelt 2003 2004 2005 2006 2007 200 2009All rights reserved The German Urheberrecht (esp sect 2 sect 13 sect 63 etc) shall be applied to these slides In accordance with these laws these slides are a publication which may be quoted and used for non-commercial purposes if the bibliographic data is included as described below

Please quote correctly If you use the presentation or parts of it for educational and scientific purposes please observe the laws (copyright Urheberrecht etc) Please include the bibliographic data (author title date page URL) in your publication (book paper course slides etc)

Deletion or omission of the footer (with name data and copyright sign) is not permitted

Bibliographic data Karin Haenelt Transduktoren fuumlr die Sprachverarbeitung Kursfolien 1652010 (1 15012003) httpkontextfraunhoferdehaeneltkursfolienHaenelt_FSTpdf

For commercial use No commercial use is allowed without written permission from the author In case you are interested in commercial use please contact the author

Court of Jurisdiction is Darmstadt Germany

62copy Karin Haenelt Transduktoren 1652010

  • Transduktoren fuumlr die Sprachverarbeitung
  • Themen
  • Akzeptoren - Transduktoren
  • Transduktor Betrachtungsweisen
  • Themen (2)
  • Akzeptoren ndash Transduktoren Aumlquivalenzen
  • Transduktor Aumlquivalenzen
  • Regulaumlre Relationen
  • Regulaumlre Relationen Beispiele
  • Regulaumlre Relationen Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Regulaumlre Ausdruumlcke uumlber Symbolpaare
  • Themen (3)
  • Notation
  • Transduktor Definition
  • Transduktor Darstellung
  • Transduktor zu Grunde liegender Automat
  • Transduktor Identitaumltstransduktor
  • Transduktor Projektionen
  • Durch Transduktoren berechenbare Relationen
  • Sprache eines Transduktors
  • Transduktionsabbildung
  • Erweiterte Funktionen δ und σ
  • Erweiterte Funktion σ Beispiel
  • Themen (4)
  • Transduktoren mit bestimmten Eigenschaften
  • Transduktoren Ausgabestelle
  • Moore-Maschine
  • Mealy-Maschine
  • Aumlquivalenz von Mealy und Moore-Maschine
  • Transduktoren mit literalen Kantenetiketten
  • Transduktoren als Funktion bzw Relation
  • Transduktoren als Relation
  • synchroner Transduktor
  • Themen (5)
  • Sequentielle Transduktoren
  • Sequentielle Transduktoren (2)
  • Sequentielle Transduktoren (3)
  • Endlich-subsequentielle Transduktoren
  • Sequentielle Transduktoren Beispiel
  • Sequentielle Transduktoren Zeit-Komplexitaumlt
  • Themen (6)
  • Operationen auf Transduktoren
  • Themen (7)
  • Abgeschlossenheit
  • Entscheidbarkeit
  • Themen (8)
  • Bidirektionalitaumlt
  • Bidirektionalitaumlt Beispiel
  • Bidirektionalitaumlt Linguistische Adaumlquatheit
  • Themen (9)
  • Relation Grundbegriffe
  • Relation Grundbegriffe (2)
  • Relation Grundbegriffe (3)
  • Themen (10)
  • Aumlquivalenz von Mealy-Maschine und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine
  • Aumlquivalenz von Mealy- und Moore-Maschine (2)
  • Vielen Dank
  • Literatur
  • Literatur (2)
  • Versionen
  • Copyright