HLSyn – eine Kurzeinführung Syntheseseminar Reichel/Reubold WS 2012/13.

Post on 05-Apr-2015

111 views 0 download

Transcript of HLSyn – eine Kurzeinführung Syntheseseminar Reichel/Reubold WS 2012/13.

HLSyn – eine Kurzeinführung

Syntheseseminar Reichel/Reubold WS 2012/13

...bei Klatt, 1990

Tatsächlich gibt es aber Beschränkungen durch den Vokaltrakt, da das Ansatzrohr nicht beliebig verformbar ist:

HLSyn:

Implementierung der Idee, Formantsynthese sinnvoll zu beschränken:

- Reduktion der Parameter

- Bezug zur Artikulation

- Vorgabe von (sinnvollen) Defaultwerten (teilweise „Sprecher“-spezifisch)

Aufgabe des Systems:

Berechnung der richtigen Eingabewerte für ein Klattsynthesesystem (lower level) anhand weniger, quasiartikulatorischer Parameter (higher level „HL“)

Higher-Level Parameter:

Scheinbar akustische Parameter: tatsächlich nur bei modaler Stimmgebung und ohne Konstriktion mit Klatt-Formanten und Grundfrequenz identisch, ansonsten in Abhängigkeit anderer Parameter variabel; Zungenposition über f1...f4 gesteuert

(andere ) quasi-artikulatorische Parameter

Seit Version 2.2 zusätzlich:ps(subglottaler Druck), dc (delta compliance) und ap (area of posterior glottal chink)

Einfachster Fall: Vokale

Default-Fall ist der Schwa: f1= 500 Hz =F1f2=1500 Hz =F2f3=2500 Hz =F3 ...

HL KL

Andere KL-Formantwerte und damit Vokalqualitäten z.B. über folgende HL-fn-Werte:

Erstes Beispiel von Regelanwendung:

F0 (KL) variiert mit Vokalhöhe (Intrinsic F0)!

Hohe (geschlossene) Vokale: F0 (KL) > f0 (HL)Tiefe (offene) Vokale: F0 (KL) < f0 (HL)

Ebenfalls einfach: /VhV/

Parameter: ag

(von 4 auf 30 mm2 anwachsen lassen)

Parameter ag bestimmt auch die Stimmqualität: <4 =gepresst; >4 =behaucht

Weitere Interaktion: Tracheale Formanten und Antiformanten beeinflussen die Bandbreite der Formanten und erhöhen die Frequenz des ersten Formanten

Konstriktionen:

(bi)labial: al

alveolar: ab

velar: f1 (!) (180 Hz entspricht Verschluss)

Querschnittsfläche an der Konstriktion wird direkt angegeben

Querschnittsfläche (acd) an der Konstriktion muss berechnet werden:

Helmholtz-Resonator als Approximation

-Jede Konstriktion beeinflusst F1 (KL) (siehe Formel), f2 und f3 müssen jedoch händisch angepasst werden-Die Volumenströme und Druckunterschiede führen ab kritischen Werten für die Konstriktion zu Friktionsrauschen (das durch die Kavitäten vor der Konstriktion gefiltert wird siehe später Einstellungen für f2 und f3)-ein solches Rauschen entsteht auch nach einer Verschlusslösung (Aspiration)

Einfluss auf Friktions- bzw. Aspirationsgeräusch:

Dieses Verhältnis ist in den relativen Levels der Amplituden der Klatt-Parameter AH (Amplitude des Friktionsgeräuschs an der Glottis) und AF (Amplitude des Friktionsgeräuschs an der Konstriktion) implementiert Timing der Gesten ist wichtig

Andererseits beeinflussen die Druckverhältnisse auch die Schwingfähigkeit der Glottis

-Bei Verschlüssen bricht die Stimmhaftigkeit schnell zusammen

-Einfluss von Konstriktionen auf Amplitude und Frequenz der Glottalschwingung

Beispiel: /ala/ (am einfachsten: ab für einige Zeit auf 10 mm2 setzen) Einfluss auf F1 und F0

Noch überzeugender durch setzen der f1, f2 und f3-Werte:

hauptsächlich f3-Absenkung

„Bei Verschlüssen bricht die Stimmhaftigkeit schnell zusammen“

Der schnelle Druckangleich zwischen subglottalem und intraoralem Druck lässt sich verlangsamen durch eine aktive Volumenvergrößerung des Raums, der durch die Konstriktion abgeschlossen wird (HL-Parameter ue) Stimmhaftigkeit bleibt erhalten

Ohne diese Manipulation: Glottis hört auf zu schwingen

Für einen stimmlosen, aspirierten Plosiv: ag erhöhen

FrikativeFrikative erzeugt man durch enge Konstriktionsbildung ohne Verschluss (al ab f1)z.B. al<5 für die Dauer des Frikativs (für /VfV/)

Bei nicht mit den Lippen gebildeten Konstriktionen filtert das Rohr vor der Konstriktion das Rauschen

... daher müssen für diese Frikative die HL-Parameter f2 und f3 in die hier angegebenen Bereiche verschoben werden

Parameter anDurch Ankopplung eines weiteren Resonators mit eigenen, vordefinierten Resonanzen, geht Energie an manchen Frequenzbereichen verloren (Antiformanten), teilweise kommen aber auch in bestimmten Frequenzbereichen Formanten hinzu

Beides lässt sich in Abhängigkeit von der Größe der Velumöffnung berechnen, z.B. der von an abgeleitete Wert fn (hiervon wiederum abgeleitet: FNZ (KL)):

Der Antiformant (FNZ) variiert also stark mit dem Volumen des Hohlraums im Mund