Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Post on 01-Feb-2016

26 views 0 download

description

Entwicklung eines Systems zur Diskurstranskription auf dem Computer. Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg. Grafik (umg. Partitur). syncWriter. syncWriter-Daten (binär). Segmentliste. Datentypen: Transkript. - PowerPoint PPT Presentation

Transcript of Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Entwicklung eines Systems zur Diskurstranskription auf

dem ComputerThomas Schmidt,

SFB ‚Mehrsprachigkeit‘, Hamburg

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Datentypen: Transkript

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Datentypen: Transkript Äußerungsdatenbank

?

MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]

((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.

Darstellungstypen: vertikale Darstellung

MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]

((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.

Darstellungstypen: vertikale Darstellung Spaltendarstellung

?

MAX TOM MIA NNDu fällst mirimmerins Wort

gestiku-liert

Stimmt jawohl gar nicht

grinst

((1sec)) SiehstDu, Du hast esschonwieder getan

schlägt dieHände vorsGesicht

Er hat schonrecht, Tom

Telefonklingelt

Darstellungstypen: Spaltendarstellung Partiturdarstellung

MAX TOM MIA NNDu fällst mirimmerins Wort

gestiku-liert

Stimmt jawohl gar nicht

grinst

((1sec)) SiehstDu, Du hast esschonwieder getan

schlägt dieHände vorsGesicht

Er hat schonrecht, Tom

Telefonklingelt

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

?

Darstellungsformate: HTML

Darstellungsformate: HTML --> RTF

?

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate andere Betriebssysteme

syncWritersyncWriter-Daten(binär)

Grafik(umg. Partitur)

Segmentliste

andere Werkzeuge andere Datenformate andere Betriebssysteme

?

vertikale Eingabe

Spalten-Eingabe

Partitur-Eingabe

...

vertikale Darstellung: RTF

Spalten-Darstellung: HTML

Partitur-Darstellung: PDF

...

andere Transkriptionsformate Datenbank

andere Werkzeuge

(XML)-Datenformat

„Single Source, Multiple Targets“

t0 t1 t2 t3

MAX / v / „Du fällst mir immer“ MAX / v / „ins Wort“

MAX / nv / „gestikuliert“

TOM / v / „Stimmt ja“ TOM / v / „wohl gar nicht.“

TOM / nv / „grinst.“

Bird / Liberman: ANNOTATION GRAPHS

Struktur einer Diskurstranskription:Zeitachse und Ereignisse

e t(e)Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikulierte4 Tom t1 t2 verbal Stimmt jae5 Tom t2 t3 verbal wohl gar nicht.e6 Tom t1 t3 non-verbal grinste7 Max t3 t4 verbal ((1 sec)) Siehst Du, Du hast es schone8 Max t4 t5 verbal wieder getan.e9 Max t3 t5 non-verbal Schlägt die Hände vors Gesichte10 Mia t4 t5 verbal Er hat schone11 Mia t5 t6 verbal recht, Tom.e12 NN t1 t6 non-verbal Telefon klingelt

t0 < t1 < t2 < t3 < t4 < t5 < t6

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikuliert... ... ... ... ... ...

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“

– sprachspezifische lateinische Zeichen:deutsch: Ä Ö Ü ß

französisch: ç è é ê ëschwedisch: å æ ø [...]

– nicht-lateinische Alphabetekyrillisch: Љ Ћ юgriechisch: α β γ θIPA [...]

– CJK-Schriftsysteme– ...

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

• Problem: „Plattformabhängigkeit“

Technologien zur Implementierung

• Problem: „Sprachabhängigkeit“ UNICODE

• Problem: „Softwareabhängigkeit“ XML

• Problem: „Plattformabhängigkeit“ JAVA

XML-Datenformat

XML-Datenformat

Eingabe-Schnittstelle

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

andere Anwendungen

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

andere Anwendungen

(Partitur-)Transkriptionseditor