Entwicklung eines Systems zur Diskurstranskription auf dem Computer

32
Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg

description

Entwicklung eines Systems zur Diskurstranskription auf dem Computer. Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg. Grafik (umg. Partitur). syncWriter. syncWriter-Daten (binär). Segmentliste. Datentypen: Transkript. - PowerPoint PPT Presentation

Transcript of Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Page 1: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Entwicklung eines Systems zur Diskurstranskription auf

dem ComputerThomas Schmidt,

SFB ‚Mehrsprachigkeit‘, Hamburg

Page 2: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

Page 3: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Datentypen: Transkript

Page 4: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Datentypen: Transkript Äußerungsdatenbank

?

Page 5: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]

((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.

Darstellungstypen: vertikale Darstellung

Page 6: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]

((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.

Darstellungstypen: vertikale Darstellung Spaltendarstellung

?

MAX TOM MIA NNDu fällst mirimmerins Wort

gestiku-liert

Stimmt jawohl gar nicht

grinst

((1sec)) SiehstDu, Du hast esschonwieder getan

schlägt dieHände vorsGesicht

Er hat schonrecht, Tom

Telefonklingelt

Page 7: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Darstellungstypen: Spaltendarstellung Partiturdarstellung

MAX TOM MIA NNDu fällst mirimmerins Wort

gestiku-liert

Stimmt jawohl gar nicht

grinst

((1sec)) SiehstDu, Du hast esschonwieder getan

schlägt dieHände vorsGesicht

Er hat schonrecht, Tom

Telefonklingelt

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

?

Page 8: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Darstellungsformate: HTML

Page 9: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Darstellungsformate: HTML --> RTF

?

Page 10: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

Page 11: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge

Page 12: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate

Page 13: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate andere Betriebssysteme

Page 14: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate andere Betriebssysteme

?

Page 15: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

vertikale Eingabe

Spalten-Eingabe

Partitur-Eingabe

...

vertikale Darstellung: RTF

Spalten-Darstellung: HTML

Partitur-Darstellung: PDF

...

andere Transkriptionsformate Datenbank

andere Werkzeuge

(XML)-Datenformat

„Single Source, Multiple Targets“

Page 16: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

t0 t1 t2 t3

MAX / v / „Du fällst mir immer“ MAX / v / „ins Wort“

MAX / nv / „gestikuliert“

TOM / v / „Stimmt ja“ TOM / v / „wohl gar nicht.“

TOM / nv / „grinst.“

Bird / Liberman: ANNOTATION GRAPHS

Page 17: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Struktur einer Diskurstranskription:Zeitachse und Ereignisse

e t(e)Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikulierte4 Tom t1 t2 verbal Stimmt jae5 Tom t2 t3 verbal wohl gar nicht.e6 Tom t1 t3 non-verbal grinste7 Max t3 t4 verbal ((1 sec)) Siehst Du, Du hast es schone8 Max t4 t5 verbal wieder getan.e9 Max t3 t5 non-verbal Schlägt die Hände vors Gesichte10 Mia t4 t5 verbal Er hat schone11 Mia t5 t6 verbal recht, Tom.e12 NN t1 t6 non-verbal Telefon klingelt

t0 < t1 < t2 < t3 < t4 < t5 < t6

Page 18: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

Page 19: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Page 20: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

Page 21: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“

– sprachspezifische lateinische Zeichen:deutsch: Ä Ö Ü ß

französisch: ç è é ê ëschwedisch: å æ ø [...]

– nicht-lateinische Alphabetekyrillisch: Љ Ћ юgriechisch: α β γ θIPA [...]

– CJK-Schriftsysteme– ...

Page 22: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

Page 23: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“

Page 24: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

Page 25: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

• Problem: „Plattformabhängigkeit“

Page 26: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

• Problem: „Plattformabhängigkeit“ JAVA

Page 27: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Page 28: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Eingabe-Schnittstelle

Page 29: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

Page 30: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

Page 31: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

andere Anwendungen

Page 32: Entwicklung eines Systems zur Diskurstranskription auf dem Computer

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

andere Anwendungen

(Partitur-)Transkriptionseditor