Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

15
Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington

Transcript of Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Page 1: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Grundlagen der Analyse von Sprachdatenbanken

Jonathan Harrington

Page 2: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Die LaborspracheFast alle Untersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum?

‘Competence/performance’ Trennung in Chomsky & Halle (1968). Nur die Laborsprache ist relevant für die phonologische Darstellung von Wörtern…daher kaum eine Befassung im ‘SPE’ mit Intonation, Prosodie, Spontansprache.

Synthese u. Perzeptionsexperimente (Haskins Labs.). Seit 1950 eine Beschäftigung mit den minimalen akustischen Unterschieden (perceptual cues) zwischen Phonemen.

Fortschritte in der Sprachsynthese: durch die Analyse von isolierten, laborgesprochenen Silben.

Page 3: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Warum Die Laborsprache?Technische Überlegungen. Bis mitte der 80er Jahre:

Kaum Möglichkeiten mehr als 15 Sekunden digitaler Sprache zu speichern •.

Festplatten meistens nicht größer als 500 mB für das gesamte Labor.•.

3 – 4 Minuten um einen Spektrogramm digital darzustellen.

•.

Page 4: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Der Bedarf an Sprachdatenbanken

Entsteht in den 80er Jahren wegen der Entwicklung von Systemen, die die gesprochene Sprache automatisch erkennen sollen

Um solche Systeme zu erstellen, muss die Variabilität der gesprochenen Sprache (Änderungen wegen der Sprechgeschwindigkeit, Sprecherunterschiede) modelliert werden.

Jedoch kann die Variabilität (wegen Sprecherunterschiede, Spontansprache usw.) nur in einem sehr umfangreichen Sprachdatenbank modelliert werden.

•.

•.

•.

Page 5: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Sprachdatenbanken

Was sind Sprachdatenbanken?

Sammlung von Sprechdaten

Hierzu können gehören:

Zeitsignale (digital): akustische, artikulatorische

Aus dem Zeitsignal abgeleitete Signale z.Bsp. spektrale Daten

Etikettierungen der Signale: Verknüpfung von Signalteilen an Symbole

Page 6: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Probleme in der Entwicklung von Sprachdatenbanken seit 1985

Was soll augenommen werden ? (sogar hier konnten die Phonetiker kaum helfen, wegen ihrer Beschäftigung mit der Laborsprache)

Keine Infrastruktur. Die Erstellung von Sprachdatenbanken ist arbeitsintensiv und verlangt Kooperationen zwischen Laboren. Aber es gab weder Software noch Hardware um umfangreiche S-Datenbanken miteinander zu entwickeln (und kein Internet!).

Keine Richtlinien für die Etikettierung. Was sollte man etiketterien und wie (welche Einheiten usw.)?

Theorie-neutral. Viele Phonetiker hielten sich davon fern, weil der Aufbau von Sprachdatenbanken als ein uninteressantes, theorie-neutrales Problem betrachetet wurde.

Page 7: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Sprachdatenbanken heutzutage

2. ‘Open-source’ Software für die Analyse von Sprachdatenbanken und für die digitale Sprachverarbeitung kann jetzt vom Netz heruntergeladen werden.

1. Mehrere Sprachdatenbanken sind heutzutage vorhanden, z.B.

Linguistic Data Consortium (LDC)•.Bavarian archive for speech signals•.Tones and Break Indices (für prosodische Etikettierung)

•.

IPDS Kiel corpus of spontaneous speech•.

Page 8: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Jedoch:

Sind nur die wenigsten Sprachdatenbanken etikettiert worden

Ist der größte Mehrteil von S-datenbanken für die englische Sprache

kaum allgemeine Richtlinien, wie Sprachdatenbanken etikettiert werden sollen (daher werden etikettierte S-Datenbanken zu wenig zwischen Laboren ausgetauscht).

•.

•.

•.

Page 9: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Aufbau & Funktion von SprachdatenbankenErstellung AnalyseAbfrage

Digitale Zeitsignaleakustisch, artikulatorisch

Etikettieren

Verknüpfung mit Symbolen

Signalverarbeitung

abgeleitete Signale (z.B. spektrale Daten) Eine Liste

ausgewählter Symbole mit Zeiten

Abfrage

Die Signale davon

Abfrage

Sig

nal

eE

tike

ttie

run

g

Graphik

Statistik

Weitere Signalverarbeitung

p << 0.001

Praat, EMU EMU EMU-R

Page 10: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

Aufbau einer Sprachdatenbank: Software

Praat: Doing Phonetics by Computer.Phonetik Institut, Amsterdam, 1998-

EMU: Ein System für die Analyse von Sprachdatenbanken 1988- Macquarie Universität, Sydney und IPDS, Kiel

R: Eine allgemeine Programmiersprache. Das ‘open-source’ Äquivalent von der ‘S’ (‘Splus’) Programmiersprache. 1988-

http://www.praat.org

http://emu.sourceforge.net/

http://www.r-project.org/

Page 11: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

1. Sprachdatenbank Erstellung

EMUPraat

Digitalisierung, Signalverarbeitung, Etikettieren.

Konvertierung

Der Etikettierungen

Page 12: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

1. Sprachdatenbank ErstellungEMU: Hierarchiches Etiketterien

Page 13: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

1. Sprachdatenbank Erstellung

Signalverarbeitung: tkassp (ASSP in EMU)

z.B. alle wav-Dateien einer Sprachdatenbank

Page 14: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

2. Sprachdatenbank AbfrageEMU

z.B. Alle Vokale in Wortinitialen Silben und deren ersten 2 Formanten zum zeitlichen Mittelpunkt finden

xx x

x xx

Page 15: Grundlagen der Analyse von Sprachdatenbanken Jonathan Harrington.

3. Sprachdatenbank Analyse

R Programmiersprache, und in R-EMU Funktionen

z.B. F1 x F2 Verteilung von [ a ] in einer Sprachendatenbank

I

I

I

I

I

I

II

I

I

I

I

II

II

II

II I

I

II

I I

I

I

II

I

I

I II

II

II

I I

II

I I

I

I

I

I

I

I

II

II

I

I

I

I

I

II

I

I

I

I

I

I

I

II

II

I

I

I

I

I

I II I

I

I

I

II I

I

I

I

I

I

I

I

I II

I

I

I

I

I

I

II

I

I

I

II

I

I

II

I

I

II

I

II

II

II

I

I

I

I

I

II

I

I

II

I I

I

II

I

I

I

I

III

I

I I

I

I

I

I

I

II

II

I

I I I

I

I

I

I

I

I

I

I

II

II I

I

I I

I

II

I

I II

I

I

I

I I

II

I

I

I

II

I

I

I

III

I

II I

I

I

I

I

II

I

I

I

II I

I

I

I

II

I

III

I

I

IIII

I I

I

I

I

III

I

II

I

III

I

IIIII

I II

II

I

II

III

I

I

III

II II

I

II

II

I

II

I

I

III

II

I I

I

I

I

I

I

I

I

II

II

I

I

I

I

III

I

I

I

I

II

II

II

II

I

I

I I

I

I

I

I

I

I

I

I

II

I

III

I

I

II

II I

I

A

AA

A

A

A

A

A

AA

A

A

A

A

A

A

A

AA

A

A

A

A

A

A

A

AA

A

A

A A

A

A

A

A

A

AA

A

A

A

AA

AA

AA

A

A

A

A

AA

AA

A

A

A

A A

A

A

A

A

AA

AA

A

A

A

AA A

A

A

A

A

A

A

A

A

A

AA

AA

A

A

A

A

A

A

A

A

AA

A

A

A

A

A

A

A AA

AA

AA

A

A

A A

A

A

A

A

AA

A

AA

A

AA

A

A

A

A

A

A

U

U

U

UUU

U

UU UUU

UU

U

U

U U

UU

UU

U UU

U

2500 2000 1500 1000

700

600

500

400

300

200

F2 (Hz)

F1

(Hz)