EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538...

16
EXMARaLDA – ein System zur Transkription gesprochener Sprache mas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hambur

Transcript of EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538...

Page 1: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDA – ein System zur Transkription

gesprochener Sprache

Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Page 2: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Datenbank „Mehrsprachigkeit“

• Über 2200 Transkriptionen gesprochener Sprache

• verschiedene Datentypen: Spracherwerbsdaten, gedolmetschte Diskurse, Expertendiskurse, Vortragsdiskurse, Radiosendungen, Interviews, „freie“ Diskurse etc.

• Über 14 verschiedene Sprachen (Deutsch, Französisch, Italienisch, Spanisch, Portugiesisch, Englisch, Schwedisch, Dänisch, Norwegisch, Japanisch, Chinesisch, Russisch, Türkisch, Luganda)

• verschiedene theoretische Hintergründe: generative Grammatik, funktionale Pragmatik, etc.

Page 3: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Datenbank „Mehrsprachigkeit“

Problem: „variety of tools and formats“

Daten werden in Formaten gespeichert und mit Werkzeugen bearbeitet, die speziell auf die Zielsetzung des jeweiligen Projektes ausgerichtet sind

es ist schwierig bis unmöglich, Daten zwischen Projekten auszutauschen, gemeinsam auszuwerten etc.

Page 4: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Datenbank „Mehrsprachigkeit“

syncWriter• interlinearer Text• nur auf Macintosh• binäre Daten

Page 5: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Datenbank „Mehrsprachigkeit“

LAPSUS• Satzdatenbanken• nur auf DOS• Tabellenstruktur, keine Simultaneität

Page 6: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Datenbank „Mehrsprachigkeit“

syncWriter Verbmobil

HIAT-DOS LAPSUS (dBase / ACCESS)

?

Page 7: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

Auswertung: mit Hilfe der Datenbank kann die Transkription quantitativ ausgewertet werden.

syncWriter(K1,K2,E5)

Verbmobil(K3)

dBase(E2)

...

EXMARaLDAEin-/ Ausgabe Analyse

Datenbank „Mehrsprachigkeit“

Page 8: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDA

Eingabemethode: Simple EXMARaLDA (Zeilennotation)

Page 9: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDA

Eingabemethode: Partitureditor (Partitur-Notation)

Page 10: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDAAusgabemethode: HTML mit Hyperlinks

Page 11: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDAAusgabemethode: RTF (Unicode)

Ich verstehe davon weder hinauf noch hinunter.

Ich schaue wie ein Schaf auf ein neues Tor.

Ich höre ein Buch aus dem Himmel.

Page 12: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

EXMARaLDA

Bisher:• Partitureingabe / -ausgabe, Zeileneingabe

Demnächst:• Segmentierung:

- in Äußerungen Zeilenausgabe- in Wörter Wortlisten, Index Suche, ...

• Austausch mit anderen Transkriptionstools- TASX-Annotator (Uni Bielefeld)- ELAN (MPI Nijmegen)- AG-Tools (LDC Philadelphia)- ANVIL (Uni Saarbrücken)

Page 13: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

TASX Annotator

Page 14: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

ELAN

Page 15: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

AG-Toolkit: TableTrans

Page 16: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg.

ANVIL