Post on 06-Apr-2015
Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen.
Dagmar Knorrdagmar.knorr@uni-hamburg.de Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Von einer Datensammlung zum Korpus
die Datenlage derSchreibwerkstatt Mehrsprachigkeit
Melanie Andresen undDagmar Knorr
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Überblick
Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer
Suchanfrage Auf dem Weg zu einem Korpus
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Peer Tutoren Schreibberatung
Aufgabe der Peer Tutoren Schreibberatung =durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Datensammlung – Überblick
DokumenttypDatei-Formate
Datensätze
Metadaten zu den Ratsuchenden .fm4 180
Texte von Ratsuchenden .doc(x), .pdf ca. 350
Texte von Ratsuchenden mit Kommentierungen von PT
.doc(x)ca. 200
Texte von Ratsuchenden mit Kommentierungen von Lehrenden
.pdfca. 10
Beratungsprotokolle .fm4 213
Beratungsgespräche.mp3, .mp4, .wav, .wma
ca. 35
Inhaltsübersichten zu den Beratungsgesprächen
.xls31
Transkriptionen der Beratungsgespräche .exb 2
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datensatz Metadaten
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datensatz Beratungsprotokoll
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datenablage
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Suchanfrage stellen
Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Suchanfrage stellen
Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA
– Leserführung
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dokumentauswahl als Ergebnis
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Frage
•Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen?
•Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
+ allgemeine Kommentare direkt im Text
Aufbereiten der Texte
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Mögliche Fragestellungen
qualitative FragenAn welchen Stellen werden Textkommentare
angebracht?Wie entwickeln sich Texte durch
Kommentierungen?
quantitative FragenVorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Annotation
• (halb)automatische Annotation
(Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?)
•manuelle Annotation
– Mikroebene (z. B. Kontaminationen/Verschränkungen)
– Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration)
– Makroebene (z. B. Textstruktur)
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Veröffentlichung des Korpus
•Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden?
•Welche der Daten sollen veröffentlicht werden?
•Wo kann das Korpus veröffentlicht werden?
Dagmar Knorrdagmar.knorr@uni-hamburg.de
Universitätskolleg M. Andresen, D. Knorrschreibwerkstatt.msp@uni-hamburg.de
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Fragen und Antworten?