Korpusbasierte Ansätze zur historischen Soziolinguistik am ... · PDF...
date post
21-Aug-2019Category
Documents
view
212download
0
Embed Size (px)
Transcript of Korpusbasierte Ansätze zur historischen Soziolinguistik am ... · PDF...
Erkenntnisleitend für die Sprachbeschreibung ist die soziolinguistische Einsicht, dass die Vielfalt des regelhaften Sprechens in einer Kommunikations‐g f p gemeinschaft nicht durch die Intuition eines lingu‐ istischen Experten, sondern nur durch sorgfältig erhobene Korpora erfasst werden kann.
Norbert Dittmar 2004
Korpusbasierte Ansätze zur historischen SoziolinguistikKorpusbasierte Ansätze zur historischen Soziolinguistik am Beispiel von "ABaC:us – Austrian Baroque Corpus"
Dr. Claudia Resch Institut für Corpuslinguistik und Texttechnologie Österreichische Akademie der WissenschaftenÖsterreichische Akademie der Wissenschaften
Sonnenfelsgasse 19/8 1010 WienSonnenfelsgasse 19/8, 1010 Wien [email protected]
ABaC:us – Austrian Baroque Corpus
2009 Wissenschaftsstipendium der Stadt Wien 300. Todestag von Abraham a Sancta Clara (1644‐1709)
2012 Förderung durch die Österreichische Nationalbank „Texttechnologische Methoden zur Analyse öster‐ reichischer Barockliteratur” (Projekt Nr. 14738)
Historische Sprachdaten aus dem Zeitraum 1650‐1750
Älteres Neuhochdeutsch / mittelbairisch (Wien)
Theologisch‐erbauliche Volltexte in Prosa und Vers (Memento mori‐Schriften Predigten Liedtexte )(Memento mori Schriften, Predigten, Liedtexte, …)
Aufbereitung im XML‐Format gemäß TEI Version P5
ErstdruckprinzipErstdruckprinzip
Etwa 200.000 running words
Ebenen der Annotation (Markup)‐ Ebenen der Annotation (Markup)
Textstruktur wie: Kapitel, Überschriften Paragrafen VerszeilenParagrafen, Verszeilen typografische Details (z.B. Initialen)
Personennamen (historisch, mythologisch, biblisch) Ortsnamen
Bibelstellenangabeng
d it i K kt hl hwerden mit einem Korrekturvorschlag versehen
Linguistische Annotation: Tokenisierung, POS und Lemma
Bewahrung, Erschließung und Interpretation sprachlich‐kulturellen Erbes
Erprobung linguistischer Werkzeuge zur Annotation älterer SprachstadienErprobung linguistischer Werkzeuge zur Annotation älterer Sprachstadien
Entwicklung eines stabilen Methodeninventars für non‐standard varieties
Annotationsforschung / Weiterentwicklung der ICLTT‐ToolboxAnnotationsforschung / Weiterentwicklung der ICLTT Toolbox
Gewinnung digitaler sprachlicher Ressourcen, E‐Lexicography
Zielgruppen: Sprachwissenschaftlerinnen Lit t i h ftl ILiteraturwissenschaftlerInnen HistorikerInnen KunsthistorikerInnen TheologInnenTheologInnen Interessierte Öffentlichkeit