EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB...

Post on 06-Apr-2015

107 views 0 download

Transcript of EXMARaLDA - ein System zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB...

EXMARaLDA - ein System zur Diskurstranskription auf dem

ComputerThomas Schmidt,

SFB ‚Mehrsprachigkeit‘, Hamburg

Transkriptions-Daten

Transkriptions-Daten

Darstellung

Transkriptions-Daten

Darstellung

G: <EA> und weißt du noch etwas der mir passiert .und es ist . Unmöglisch, . <EA> vielleicht ist es

gLEIch (e:h) . Gleich du sagt,J: hm‘G: isch (h)abe einmal getra/ isch war in bielefeld [<EA>]J: [hmm,] G: isch hab getraumtJ: jaG: von langeoog,

Transkriptions-Daten

Darstellung

J: hmm, jaG: isch (h)abe einmal getra/ isch war in bielefeld <EA> isch hab getraumt von langeoog

J: ja ja hmmG: das war im mai, und isch hab ge/ getraumt von die bahn‘hOF . Von langeOOg

Transkriptions-Daten

Darstellung

G J isch (h)abe einmal getr/ isch war in bielefeld<EA> hmm,isch hab getraumt

javon langeoog

jadas war im mai,

ja

Transkriptions-Daten

Darstellung

Transkriptions-Daten

Darstellung

HTML

Transkriptions-Daten

Darstellung

HTML RTF

Transkriptions-Daten

Darstellung Archivierung

Transkriptions-Daten

Darstellung Archivierung

Corpus

Transkriptions-Daten

Darstellung Archivierung

Corpus Datenbank

Transkriptions-Daten

Darstellung Archivierung Eingabe

Transkriptions-Daten

Darstellung Archivierung Eingabe

Transkriptions-Daten

Darstellung Archivierung Eingabe

Transkriptions-Daten

Darstellung Archivierung Eingabe

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter HIAT-DOS

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

syncWriter HIAT-DOS CHAT

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

Suche

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

SucheStatistische Auswertung

Transkriptions-Daten

Darstellung Archivierung Eingabe

Import / Export

Verarbeitung / Auswertung

SucheStatistische Auswertung

(automatische)Annotation

Datenformat

1. Zeitliche Struktur des Diskurses

Datenformat

1. Zeitliche Struktur des Diskurses

Bird / Liberman: „Annotation Graphs“

t0 t1 t2 t3

G / v / „isch war in Bielfeld“ G / v / „<EA>“

J / v / „hmm,“

G / v / „isch hab getraumt“

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

t0 < t1 < t2

e t(e) Ereignis Sprecher Start Ende Kategorie symbolische Beschreibung e1 G t0 t1 verbal isch war in Bielfeld e2 G t1 t2 verbal <EA> e3 G t2 t3 verbal isch hab getraumt e4 J t1 t2 verbal hmm,

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

•Übersetzung Äußerungen, Wörter• POS-Tagging Wörter• morphologische Transliteration Wörter• Lemmatisierung Wörter• Wortlisten Wörter• MLU Wörter / Äußerungen

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses

ja isch hab getraumt/ von langeoog

Datenformat

ja[[isch] [hab] [getraumt/] [von] [langeoog]]

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ]

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ] [PRO ] [V ] [V ] [PRE] [N ]

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

ja[[isch] [hab] [getraumt/] [von] [langeoog]][I dreamed of Langeoog ] [PRO ] [V ] [V ] [PRE] [N ] [NP ] [VP ]

Datenformat

1. Zeitliche Struktur des Diskurses: Zeitachse / Ereignisse

2. Sprachliche Struktur des Diskurses:Äußerungen / Wörter Annotationen

Ereignisse

Ereignisse / Äußerungen / Wörter

automatische Segmentierung

Basis-Transkription

segmentierte Transkription

XML: SEGMENTED-TRANSCRIPTION

XML: LIST-TRANSCRIPTION

RTF: PARTITUR-DARSTELLUNG

XML: BASIC-TRANSCRIPTION

HTML: PARTITUR-DARSTELLUNG

RTF: SPALTEN-DARSTELLUNG

HTML: SPALTEN-DARSTELLUNG

RTF: VERTIKALE DARSTELLUNG

HTML: VERTIKALE DARSTELLUNG

“INHALT” DARSTELLUNG

AUSTAUSCH,COMPUTER

AUSGABE,MENSCH

primär zeit-orientiert,zwei-dimensionale Darstellung (eine

gemeinsame Zeitachse)

primär segment –orientiert,ein-dimensionale Darstellung (eine

gemeinsame Zeitachse)

segment- und zeit-orientiert,

keine Darstellung (mehrere, sich teilweise

überschneidende Zeitachsen)

XML

: TIE

RFO

RM

AT

XML

: T

IER

FOR

MA

T

XML: SEGMENTED-TRANSCRIPTION

XML: LIST-TRANSCRIPTION

XML: BASIC-TRANSCRIPTION

HIAT-DOS data

syncWriter data

LAPSUS data

CHILDES data

AG data

MATE annotation

Partitur-Editor

List-Editor

Database / Corpus

Wordlist Statistic Evaluation

Tools

XXX Annotation

Annotation Tools

BEISPIEL 1:

Transkription im PartiturEditor

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

Annotation

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

XML: LIST-TRANSCRIPTION

BEISPIEL 1:

Transkription im PartiturEditor

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in RTF

XML: SEGMENTED-TRANSCRIPTION

AnnotationArchivierung in

Datenbank

XML: LIST-TRANSCRIPTION

Ausgabe als Liste in HTML

BEISPIEL 2:

XML: BASIC-TRANSCRIPTION

Ausgabe als Partitur in HTML

XML: SEGMENTED-TRANSCRIPTION

Archivierung in Datenbank

XML: LIST-TRANSCRIPTION

Ausgabe als Liste in RTF

Transkription in einem Texteditor