Die akustische Analyse von Sprachlauten 1. Schall, Zeitsignal, Periodizität, Spektrum Jonathan...

Post on 05-Apr-2015

107 views 0 download

Transcript of Die akustische Analyse von Sprachlauten 1. Schall, Zeitsignal, Periodizität, Spektrum Jonathan...

Die akustische Analyse von Sprachlauten1. Schall, Zeitsignal, Periodizität, Spektrum

Jonathan Harrington,Uwe Reichel

Inhalt• Schall: Definition, Entstehung,

Übertragung, Wahrnehmung• Schwingung (informell)• Kenngrößen des Schalls: Schalldruck• Zeitsignal in der Phonetik• Periodizität, Frequenz• Spektrale Zerlegung komplexer Signale

Was ist Schall?

• Ausbreitung von lokalen Druckschwankungen in einem elastischen Medium (z.B. Luft) als Welle

• Welle: Fortpflanzung von Schwingungen

Wie entsteht Schall?

1. Eine Schallquelle verursacht in ihrer unmittelbaren Umgebung Luftdruckschwankungen (=Schalldruck).

Stimmgabel

Luftmoleküle

Erhöhung desLuftdrucks(Verdichtungder Luftmoleküle)

Absenkung des Luftdrucks (Auseinanderbe-wegung der Luftmoleküle)

Wie entsteht Schall?

2. Dadurch dass die schwingenden Luftmoleküle mit den benachbarten Molekülen interagieren und diese somit ebenfalls in Schwingung versetzen, pflanzen sich die

lokalen Luftdruckschwankungen (= der

Schalldruck) fort.

Im Medium Luft schwingen die Teilchen in Ausbreitungsrichtung des Schalls. Die Schwingung pflanzt sich damit in Form einer sog. Longitudinalwelle mit Schallgeschwindigkeit (ca. 340 m/s) fort.

Die Wahrnehmung des Schalls

3. Der sich fortpflanzende Schalldruck erreicht das Ohr und führt dort zu einer entsprechenden Auslenkung des Trommelfells.

4. Weiterverarbeitung: siehe Einführung in die Perzeptive Phonetik

Schwingung• 1. Ein Teilchen wird durch eine auf es

einwirkende Kraft (die Schallquelle) aus seiner Ruhelage herausbewegt.

• 2. Elastische Rückstellkräfte ziehen es wieder Richtung Ruhelage zurück.

• 3. Aufgrund seiner Trägheit bewegt sich das Teilchen aber über die Ruhelage hinaus solange weiter, bis die erneut einsetzenden Rückstellkräfte größer sind als die Trägheit des Teilchens. Goto 2.

• Masse-Feder-Modell: Masse – Trägheit, Feder – Rückstellkräfte

• Die zeitabhängige Abweichung des Teilchens von seiner Ruhelage heißt Amplitude.

• Nimmt die Amplitude im Laufe der Schwingung (aufgrund von Reibung) ab, so wird die Schwingung als gedämpft bezeichnet.

Schalldruck P

• lokale Schwankung des Luftdrucks.• Einheit: Pascal (Pa) = Kraft/Fläche

(N/m^2)• Schalldruck ist gegenüber dem

atmosphärischen Luftdruck (10^5 Pa) sehr gering:

Hörschwelle – Schmerzgrenze: 10^(-5) Pa – 10 Pa

• Die Spanne zwischen Hörschwelle und Schmerzgrenze ist sehr groß

• Daher wird zur Angabe des Schalldrucks i.d.R. statt der linearen Pascal-Skala die „gestauchte“ logarithmische Dezibel (dB)-Skala verwendet. Man spricht nun vom Schalldruckpegel L.

• Hierbei wird der Schalldruck P stets im Verhältnis zu einem festgelegten Referenzschalldruck P0 angegeben:

L [dB] = 20 log P/P0, wobei P0 = 2*10^-5 Pa

• Allgemeiner formuliert: die Berechnung des Verhältnisses zweier beliebiger Schalldrucke P1 und P2 erfolgt mittels folgenden Ausdrucks:

20 log P2/P1 [dB]• +20 dB entspricht einer Verzehnfachung des

Schalldrucks• +6 dB entspricht in etwa einer Verdopplung• Beispiel: P1=1000 Pa, P2=10000 Pa, d.h. P2 ist 10x höher als P1 Schallpegelverhältnis = 20 log 10000/1000

= 20 log 10 = 20

Ein Zeitsignal

Der sich mit der Zeit ändernde Schalldruck wird mit einem Mikrophon in einem Raumpunkt gemessen – wir erhalten ein Zeitsignal, das eine Schwingung darstellt.

Zeit

Mikrophon

Ein Zeitsignal

Atmosphärischer Luftdruck

Hoher Luftdruck

Niedrigerer Luftdruck

Die Schalldruck-Amplitude oder einfachDie Amplitude

Zeitsignale und Lautstärke

Lautstärke ist vom Schalldruck abhängig

Sch

alld

ruck

-Am

plitu

de

Zeit

Laut

Leise

Definition einer Sinoidalschwingung

Ein Punkt bewegt sich auf einer Kreisbahn – die Höhe über der horizontalen Linie wird gemessen, und als Funktion der Zeit abgebildet

Die Frequenz = 1 Hertz (1 Hz)(weil der Punkt 1 Mal/Sekunde den Kreis umläuft)

Sinoidal

• Messung der zeitabhängigen Amplitude f(t) einer Sinusschwingung:

f(t) = A*sin(2*Pi*f*t+phi) wobei A: Maximalamplitude, Pi: Kreiszahl 3.1416, f: Frequenz, t: Zeit, phi: Phase, horizontale Verschiebung der

Schwingung• 2*Pi*f wird auch als Winkelgeschwindigkeit

bezeichnet. Sie gibt an, wie oft pro Sekunde die Kreisbahn umlaufen wird.

• Periodische Schwingung: Schwingungsdurchgänge (Perioden) finden in konstanten Zeitintervallen statt. Hierbei handelt es sich um Sinoidalschwingungen oder komplexe Schwingungen, deren Sinoidalkomponenten im ganzzahligen (harmonischen) Verhältnis zur Komponente mit der tiefsten Frequenz stehen.

• Im Sprachsignal treten bei stimmhaften Lauten quasi-periodische Schwingungen auf, d.h. benachbarte Perioden sind in etwa gleich lang.

Schallschwingungsarten:• Reine Töne: einzelne Sinoidalschwingungen• Klänge (~Vokale): aus

Sinoidalschwingungen zusammengesetzte komplexe Schwingungen;

im engeren Sinn stehen die Schwingungen im harmonischen Verhältnis zueinander (ganzzahlige Vielfache der Grundfrequenz f0)

• Geräusche (~Plosive, Frikative): komplexe Schwingung, deren Sinoidalkomponenten unendlich nah beieinander liegen

• Mischung aus Klang und Geräusch bei stimmhaften Konsonanten

Stimmhafte und stimmlose Laute

Stimmhafte Laute werden durch periodische Schwingungen der Stimmlippen erzeugt, die eine sich wiederholende Regelmäßigkeit, oder Periodizität im Sprachsignal verursachen.

Anmerkung: die Schwingung der Stimmlippen ist nicht unmittelbar für die akustische Schwingung verantwortlich (vs. Stimmgabel), sondern die durch den glottalen Verschluss bewirkte impulsartige Störung des Luftdrucks.

s t m pPeriodizität

Am

plitude

Dauer (ms)

stimmlos stimmhaft stimmlosDie Periodizität, die in stimmhaften Lauten vorkommt, verursacht eine regelmäßige Wiederholung im Zeitsignal.

Periodizität und Stimmhaftigkeit

Die Periodendauer T

Die Periodendauer ist die Dauer einer Vibration (also einer Schließung + Öffnung) der Stimmlippen

Führungsamplitude, Stimmlippen schließen sich

Tonhöhe, Periodendauer, Grundfrequenz

Je schneller die Stimmlippen vibrieren, desto mehr Schwingungen pro Sekunde und desto:• kleiner die Periodendauer• höher die Grundfrequenz (f0) und damit die Tonhöhe

Die Grundfrequenz ist die Anzahl der Stimmlippen-Schwingungen pro Sekunde und wird in Hertz (Hz) gemessen.

Die Grundfrequenz (f0) = 1 / T [Hz] oder auch [1/s]

Periodendauer = 9.79 ms = 0.00979 Sekundenf0 = 1/0.00979 = 102.2 Hz

Denkt man sich diesen Signalabschnitt periodisch fortgesetzt, so vibrieren (schließen und öffnen sich) die Stimmlippen 102.2 Mal pro Sekunde

Zeitsignal, Spektrum, Spektrogramm

Zeitsignal = zeitabhängige Amplitudenwerte

Spektrum = frequenzabhängige Amplitudenwerte

Spektrogramm = frequenz- und zeitabhängige Amplitudenwerte

Fourier-Analyse:= Die Zerlegung eines Zeitsignals in Sinoidalschwingungen (Pendelschwingung, sin, cos)

2

0

-20 1 0 1

Dauer (Sekunden)

Am

plitu

de

Amplitude =1Frequenz = 1 Hz

Amplitude =2Frequenz = 1 Hz

Doppelte Amplitude, selbe Frequenz

Selbe Amplitude, doppelte Frequenz

0

-2

2

0 1 0 1

Dauer (Sekunden)

Am

plitu

de

Amplitude =1Frequenz = 1 Hz

Amplitude = 1Frequenz = 2 Hz

• Sinus und Cosinus-Schwingung sind gegeneinander um Pi/2 phasenverschoben.

• Eine Cosinusschwingung weist zum Zeitpunkt 0 einen Schwingungsbauch auf

(maximaler Amplitudenwert).• Bei einer Sinusschwingung befindet sich

beim Zeitpunkt 0 ein Schwingungsknoten (Nulldurchgang).

Ein Spektrum

Ein Spektrum ist eine Abbildung der Frequenz (x-Achse) und Amplitude (y-Achse) von Sinusoidalschwingungen

0 1

0 2

0

1

2

1

0 1

0 2

0

1

2

1

Sinusoidale (Zeitbereich)

0

-2

2

0 1

Am

plitu

de

Dauer (s)

0 2

0

1

2

1

Am

plitu

de

Frequenz (Hz)

deren Spektra (Frequenzbereich)

Zeitsignal

2.5 Hz Sinusoid

5 Hz Sinusoid

7.5 Hz Sinusoid

Fourier-Analyse

1. Fourier-Analyse/Zerlegung

Die Zerlegung oder Fourier-Analyse bedeutet: das Signal wird auf eine solche Weise in Sinusoiden aufgeteilt, sodass das ursprüngliche Signal bei der Summierung der Sinusoiden genau rekonstruiert wird.

Summierung:

z.B. a = b + c + d

2.5 5 7.5Frequenz (Hz)

Am

plitu

de

Abbildung der Amplituden der aus der Fourier-Analyse entstehenden Sinusoiden als Funktion der Frequenz.

Zeitsignal

2.5 Hz Sinusoid

5 Hz Sinusoid

7.5 Hz Sinusoid

Fourier-Analyse

Spektrum

2. Spektrum