EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB...

48
EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg

Transcript of EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB...

Page 1: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

EXMARaLDA - ein System zur Diskurstranskription auf dem

ComputerThomas Schmidt,

SFB ‚Mehrsprachigkeit‘, Hamburg

Page 2: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Page 3: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

Page 4: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

G: <EA> und weißt du noch etwas der mir passiert .und es ist . Unmöglisch, . <EA> vielleicht ist es

gLEIch (e:h) . Gleich du sagt,J: hm‘G: isch (h)abe einmal getra/ isch war in bielefeld [<EA>]J: [hmm,] G: isch hab getraumtJ: jaG: von langeoog,

Page 5: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

J: hmm, jaG: isch (h)abe einmal getra/ isch war in bielefeld <EA> isch hab getraumt von langeoog

J: ja ja hmmG: das war im mai, und isch hab ge/ getraumt von die bahn‘hOF . Von langeOOg

Page 6: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

G J isch (h)abe einmal getr/ isch war in bielefeld<EA> hmm,isch hab getraumt

javon langeoog

jadas war im mai,

ja

Page 7: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

Page 8: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

HTML

Page 9: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung

HTML RTF

Page 10: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung

Page 11: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung

Corpus

Page 12: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung

Corpus Datenbank

Page 13: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Page 14: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Page 15: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Page 16: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Page 17: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Page 18: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter

Page 19: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter HIAT-DOS

Page 20: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter HIAT-DOS CHAT

Page 21: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Page 22: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

Page 23: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

Suche

Page 24: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

SucheStatistische Auswertung

Page 25: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

SucheStatistische Auswertung

(automatische)Annotation

Page 26: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses

Page 27: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses

Bird / Liberman: „Annotation Graphs“

t0 t1 t2 t3

G / v / „isch war in Bielfeld“ G / v / „<EA>“

J / v / „hmm,“

G / v / „isch hab getraumt“

Page 28: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

t0 < t1 < t2

e t(e) Ereignis Sprecher Start Ende Kategorie symbolische Beschreibung e1 G t0 t1 verbal isch war in Bielfeld e2 G t1 t2 verbal <EA> e3 G t2 t3 verbal isch hab getraumt e4 J t1 t2 verbal hmm,

Page 29: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

Page 30: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

Page 31: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

•Übersetzung Äußerungen, Wörter• POS-Tagging Wörter• morphologische Transliteration Wörter• Lemmatisierung Wörter• Wortlisten Wörter• MLU Wörter / Äußerungen

Page 32: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

ja isch hab getraumt/ von langeoog

Page 33: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

ja[[isch] [hab] [getraumt/] [von] [langeoog]]

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter

Page 34: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ]

Page 35: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ] [PRO ] [V ] [V ] [PRE] [N ]

Page 36: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ] [PRO ] [V ] [V ] [PRE] [N ] [NP ] [VP ]

Page 37: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

Ereignisse

Ereignisse / Äußerungen / Wörter

automatische Segmentierung

Basis-Transkription

segmentierte Transkription

Page 38: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

XML: SEGMENTED-TRANSCRIPTION

XML: LIST-TRANSCRIPTION

RTF: PARTITUR-DARSTELLUNG

XML: BASIC-TRANSCRIPTION

HTML: PARTITUR-DARSTELLUNG

RTF: SPALTEN-DARSTELLUNG

HTML: SPALTEN-DARSTELLUNG

RTF: VERTIKALE DARSTELLUNG

HTML: VERTIKALE DARSTELLUNG

“INHALT” DARSTELLUNG

AUSTAUSCH,COMPUTER

AUSGABE,MENSCH

primär zeit-orientiert,zwei-dimensionale Darstellung (eine

gemeinsame Zeitachse)

primär segment –orientiert,ein-dimensionale Darstellung (eine

gemeinsame Zeitachse)

segment- und zeit-orientiert,

keine Darstellung (mehrere, sich teilweise

überschneidende Zeitachsen)

XML

: TIE

RFO

RM

AT

XML

: T

IER

FOR

MA

T

Page 39: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

XML: SEGMENTED-TRANSCRIPTION

XML: LIST-TRANSCRIPTION

XML: BASIC-TRANSCRIPTION

HIAT-DOS data

syncWriter data

LAPSUS data

CHILDES data

AG data

MATE annotation

Partitur-Editor

List-Editor

Database / Corpus

Wordlist Statistic Evaluation

Tools

XXX Annotation

Annotation Tools

Page 40: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

Page 41: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Page 42: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

Page 43: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

Page 44: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

Annotation

Page 45: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

Page 46: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

XML: LIST-TRANSCRIPTION

Page 47: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

XML: LIST-TRANSCRIPTION

Ausgabe als Liste in HTML

Page 48: EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg.

BEISPIEL 2:

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in HTML

XML: SEGMENTED-TRANSCRIPTION

Archivierung in Datenbank

XML: LIST-TRANSCRIPTION

Ausgabe als Liste in RTF

Transkription in einem Texteditor