Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem...
-
Upload
anneke-streng -
Category
Documents
-
view
108 -
download
2
Transcript of Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem...
Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01PL12033 gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen.
Dagmar [email protected] Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Von einer Datensammlung zum Korpus
die Datenlage derSchreibwerkstatt Mehrsprachigkeit
Melanie Andresen undDagmar Knorr
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Überblick
Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer
Suchanfrage Auf dem Weg zu einem Korpus
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Peer Tutoren Schreibberatung
Aufgabe der Peer Tutoren Schreibberatung =durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Datensammlung – Überblick
DokumenttypDatei-Formate
Datensätze
Metadaten zu den Ratsuchenden .fm4 180
Texte von Ratsuchenden .doc(x), .pdf ca. 350
Texte von Ratsuchenden mit Kommentierungen von PT
.doc(x)ca. 200
Texte von Ratsuchenden mit Kommentierungen von Lehrenden
.pdfca. 10
Beratungsprotokolle .fm4 213
Beratungsgespräche.mp3, .mp4, .wav, .wma
ca. 35
Inhaltsübersichten zu den Beratungsgesprächen
.xls31
Transkriptionen der Beratungsgespräche .exb 2
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datensatz Metadaten
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datensatz Beratungsprotokoll
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Beispiel – Datenablage
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Suchanfrage stellen
Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Suchanfrage stellen
Suche Texte von Studierenden– mit Migrationshintergrund– angestrebter Abschluss: LA
– Leserführung
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Dokumentauswahl als Ergebnis
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Frage
•Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen?
•Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
+ allgemeine Kommentare direkt im Text
Aufbereiten der Texte
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Mögliche Fragestellungen
qualitative FragenAn welchen Stellen werden Textkommentare
angebracht?Wie entwickeln sich Texte durch
Kommentierungen?
quantitative FragenVorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Annotation
• (halb)automatische Annotation
(Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?)
•manuelle Annotation
– Mikroebene (z. B. Kontaminationen/Verschränkungen)
– Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration)
– Makroebene (z. B. Textstruktur)
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Veröffentlichung des Korpus
•Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden?
•Welche der Daten sollen veröffentlicht werden?
•Wo kann das Korpus veröffentlicht werden?
Dagmar [email protected]
Universitätskolleg M. Andresen, D. [email protected]
UniversitätskollegSchreibwerkstatt Mehrsprachigkeit
Fragen und Antworten?