Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem...

Post on 06-Apr-2015

108 views 2 download

Transcript of Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem...

Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen.

Dagmar Knorrdagmar.knorr@uni-hamburg.de Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Von einer Datensammlung zum Korpus

die Datenlage derSchreibwerkstatt Mehrsprachigkeit

Melanie Andresen undDagmar Knorr

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Überblick

Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer

Suchanfrage Auf dem Weg zu einem Korpus

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Peer Tutoren Schreibberatung

Aufgabe der Peer Tutoren Schreibberatung =durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Datensammlung – Überblick

DokumenttypDatei-Formate

Datensätze

Metadaten zu den Ratsuchenden .fm4 180

Texte von Ratsuchenden .doc(x), .pdf ca. 350

Texte von Ratsuchenden mit Kommentierungen von PT

.doc(x)ca. 200

Texte von Ratsuchenden mit Kommentierungen von Lehrenden

.pdfca. 10

Beratungsprotokolle .fm4 213

Beratungsgespräche.mp3, .mp4, .wav, .wma

ca. 35

Inhaltsübersichten zu den Beratungsgesprächen

.xls31

Transkriptionen der Beratungsgespräche .exb 2

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Beispiel – Datensatz Metadaten

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Beispiel – Datensatz Beratungsprotokoll

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Beispiel – Datenablage

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Suchanfrage stellen

Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Suchanfrage stellen

Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA

– Leserführung

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Dokumentauswahl als Ergebnis

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Frage

•Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen?

•Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

+ allgemeine Kommentare direkt im Text

Aufbereiten der Texte

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Mögliche Fragestellungen

qualitative FragenAn welchen Stellen werden Textkommentare

angebracht?Wie entwickeln sich Texte durch

Kommentierungen?

quantitative FragenVorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Annotation

• (halb)automatische Annotation

(Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?)

•manuelle Annotation

– Mikroebene (z. B. Kontaminationen/Verschränkungen)

– Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration)

– Makroebene (z. B. Textstruktur)

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Veröffentlichung des Korpus

•Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden?

•Welche der Daten sollen veröffentlicht werden?

•Wo kann das Korpus veröffentlicht werden?

Dagmar Knorrdagmar.knorr@uni-hamburg.de

Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de

UniversitätskollegSchreibwerkstatt Mehrsprachigkeit

Fragen und Antworten?