Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

35
Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538

Transcript of Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Page 1: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Entwicklung eines Systems zur

Diskurstranskription auf dem Computer

Thomas Schmidt, SFB 538

Page 2: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

„Single source, multiple targets“

Verschiedene• Datentypen• Dateiformate• Darstellungstypen• Darstellungsformate• Werkzeuge• Werkzeugtypen• Betriebssysteme• ...

Page 3: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Datentypen: „Transkript“

Page 4: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Datentypen: Äußerungsdatenbank

Page 5: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

3 du1 er1 es1 fällst1 gar1 getan1 hast1 hat1 immer1 ins1 ja1 mir1 nicht1 recht2 schon1 siehst1 stimmt1 Tom1 wieder1 wohl1 Wort

Datentypen: Wortliste

Page 6: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

MAX: [gestikuliert] Du fällst mir immer <ins Wort>1.TOM: [grinst] <Stimmt ja>1 wohl gar nicht.MAX: [schlägt die Hände vors Gesicht]

((1 sec)) Siehst Du, Du hast es schon <wieder getan>2.MIA: <Er hat schon>2 recht, Tom.

Darstellungstypen: Vertikale Darstellung

Page 7: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Darstellungstypen: Spalten-Darstellung

MAX TOM MIA NNDu fällst mirimmerins Wort

gestiku-liert

Stimmt jawohl gar nicht

grinst

((1sec)) SiehstDu, Du hast esschonwieder getan

schlägt dieHände vorsGesicht

Er hat schonrecht, Tom

Telefonklingelt

Page 8: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Darstellungstypen: Partitur-Darstellung

MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv): ------- gestikuliert -------- ---------- schlägt die Hände vors Gesicht ---------

TOM (v) : Stimmt ja wohl gar nicht. (nv): -------- grinst --------

MIA (v) : Er hat schon recht, Tom.

NN (nv): ---------------------------------- Telefon klingelt ------------------------------------

Page 9: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Werkzeuge:Eingabe-Editoren

Page 10: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Werkzeuge:Statistische Auswertung(Befehlszeilen)

Page 11: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Werkzeuge: Suche

Page 12: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Werkzeuge: Suche

Page 13: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

?

Ausgabe

Ausgabe

Eingabe

syncWritersyncWriter - Datenformat

Drucker

Äußerungsliste

Grafik

andere Datenformate

Page 14: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Transkriptions-Editoren

XML - Datenformat

Drucker

HTML

Grafik

andere Datenformate

XML - Editoren Web - Browser

Text - Editoren

XML -Datenbank-programme

andere Anwendungen

„Single Source, Multiple Target“

Page 15: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Ein formales Modell zur Beschreibung

von Diskurstranskriptionen

Bestandteile einer Diskurstranskription:

• Metainformation zum Diskurs / zur Transkription

• Metainformation zu den Sprechern

• Zeitachse• Klassifizierung, Zeit- und Sprecherzuordnung und symbolischen Beschreibung ausgewählter Ereignisse

Page 16: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Transkription

Attribut 1: Wert 1Attribut 2: Wert 2

Kopf

...

Sprecher 1Attribut 1: Wert 1Attribut 2: Wert 2...

Sprecher 2Attribut 1: Wert 1Attribut 2: Wert 2...

Sprechertabelle

.....

Zeitpunkt 1Zeitpunkt 2

Zeitachse

...

Ereignis 1Kategorie:Sprecher:Start:Ende:Beschreibung:

Ereignis 2Kategorie:Sprecher:Start:Ende:Beschreibung:

Ereignisse

.....

Struktur einer Diskurstranskription

Page 17: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Struktur einer Diskurstranskription:Beispiel: Kopf und Sprechertabelle

Transkription

Aufnahmedatum: 24-12-2000Transkriptionsdatum: 31-01-2001

Kopf

Konvention: HIAT 2

SprechertabelleSprecher 1

Name: MAXAlter: 29;02;01Nation: deutsch

Sprecher 2Name: TOMAlter: 25;04;01Nation: deutsch

Sprecher 2Name: MIAAlter: 21;11;12Nation: belgisch

Sprecher 2Name: NNAlter: -Nation: -

Page 18: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Struktur einer Diskurstranskription:Beispiel: Zeitachse und Ereignisse

e t(e)Ereignis Sprecher Start Ende Kategorie symbolische Beschreibunge1 Max t0 t1 verbal Du fällst mir immere2 Max t1 t2 verbal ins Wort.e3 Max t0 t2 non-verbal gestikulierte4 Tom t1 t2 verbal Stimmt jae5 Tom t2 t3 verbal wohl gar nicht.e6 Tom t1 t3 non-verbal grinste7 Max t3 t4 verbal ((1 sec)) Siehst Du, Du hast es schone8 Max t4 t5 verbal wieder getan.e9 Max t3 t5 non-verbal Schlägt die Hände vors Gesichte10 Mia t4 t5 verbal Er hat schone11 Mia t5 t6 verbal recht, Tom.e12 NN t1 t6 non-verbal Telefon klingelt

t0 < t1 < t2 < t3 < t4 < t5 < t6

Page 19: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung

• „Einzelsprachunabhängigkeit“: UNICODE

• „Softwareunabhängigkeit“: XML

• „Plattformunabhängigkeit“: JAVA

Page 20: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: UNICODE

Latin-Standard Cyrillic Greek-Standard ...65 A A A ...66 B B B ...... ... ... ... ...129 ü Ъ Γ ...145 æ Љ δ ...... ... ... ... ...255 ...

ASCII

65 A66 B... ...230 æ252 ü... ...915 Γ948 δ... ...1165 Ъ... ...65536

UNICODE

Page 21: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

<?xml version="1.0" encoding="UTF-8"?><!-- edited with XML Spy v3.5 NT beta 4 build Jan 12 2001 (http://www.xmlspy.com) by Thomas Schmidt (SFB 538) --><Text>

<Sentence><NounPhrase case="NOM">

<Determiner>Ein</Determiner><Adjectiv>junger</Adjectiv><Noun>Mann</Noun>

</NounPhrase><VerbPhrase>

<Verb tempus="PRET">baute</Verb><NounPhrase case="ACC">

<Determiner>ein</Determiner><Noun>Haus</Noun>

</NounPhrase></VerbPhrase>

</Sentence></Text>

Technologien zur Implementierung: XML

Page 22: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: XML

Page 23: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: XML

Page 24: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: JAVA

Page 25: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: JAVA

Page 26: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Technologien zur Implementierung: JAVA

Page 27: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

Transkriptions-Editoren

XML - Datenformat

Drucker

HTML

Grafik

andere Datenformate

XML - Editoren Web - Browser

Text - Editoren

XML -Datenbank-programme

andere Anwendungen

„Single Source, Multiple Target“

Page 28: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Page 29: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

Page 30: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

HTML

(Partitur)

RTF

(Partitur)

Page 31: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

HTML

(Partitur)

RTF

(Partitur)

Page 32: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

HTML

(Partitur)

RTF

(Partitur)

Äußerungsliste

(XML?)

Page 33: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

HTML

(Partitur)

RTF

(Partitur)

Äußerungsliste

(XML?)

Datenbank

Page 34: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

XML-Datenformat

Eingabe-Schnittstelle

(Partitur)

HTML

(Partitur)

RTF

(Partitur)

Äußerungsliste

(XML?)

Datenbank

Partitur - Transkriptionseditor

Page 35: Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB 538.

PAUSE ?