Korpusbasierte Ansätze zur historischen Soziolinguistik am ... · Erkenntnisleitend für die...

6
Erkenntnisleitend für die Sprachbeschreibung ist die soziolinguistische Einsicht, dass die Vielfalt des regelhaften Sprechens in einer Kommunikationsgemeinschaft nicht durch die Intuition eines linguistischen Experten, sondern nur durch sorgfältig erhobene Korpora erfasst werden kann. Norbert Dittmar 2004 Korpusbasierte Ansätze zur historischen Soziolinguistik Korpusbasierte Ansätze zur historischen Soziolinguistik am Beispiel von "ABaC:us Austrian Baroque Corpus" Dr. Claudia Resch Institut für Corpuslinguistik und Texttechnologie Österreichische Akademie der Wissenschaften Österreichische Akademie der Wissenschaften Sonnenfelsgasse 19/8 1010 Wien Sonnenfelsgasse 19/8, 1010 Wien [email protected]

Transcript of Korpusbasierte Ansätze zur historischen Soziolinguistik am ... · Erkenntnisleitend für die...

Erkenntnisleitend für die Sprachbeschreibung istdie soziolinguistische Einsicht, dass die Vielfalt desregelhaften Sprechens in einer Kommunikations‐g f pgemeinschaft nicht durch die Intuition eines lingu‐istischen Experten, sondern nur durch sorgfältigerhobene Korpora erfasst werden kann.

Norbert Dittmar 2004

Korpusbasierte Ansätze zur historischen SoziolinguistikKorpusbasierte Ansätze zur historischen Soziolinguistikam Beispiel von "ABaC:us – Austrian Baroque Corpus"

Dr. Claudia Resch Institut für Corpuslinguistik und TexttechnologieÖsterreichische Akademie der WissenschaftenÖsterreichische Akademie der Wissenschaften

Sonnenfelsgasse 19/8 1010 WienSonnenfelsgasse 19/8, 1010 [email protected]

ABaC:us – Austrian Baroque Corpus

2009 Wissenschaftsstipendium der Stadt Wien300. Todestag von Abraham a Sancta Clara (1644‐1709)

2012 Förderung durch die Österreichische Nationalbank„Texttechnologische Methoden zur Analyse  öster‐reichischer Barockliteratur”  (Projekt Nr. 14738)

Historische Sprachdaten aus dem Zeitraum 1650‐1750

Älteres Neuhochdeutsch / mittelbairisch (Wien)

Theologisch‐erbauliche Volltexte in Prosa und Vers(Memento mori‐Schriften Predigten Liedtexte )(Memento mori Schriften, Predigten, Liedtexte, …) 

Aufbereitung im XML‐Format gemäß TEI Version P5

ErstdruckprinzipErstdruckprinzip

Etwa 200.000 running words

Ebenen der Annotation (Markup)‐ Ebenen der Annotation (Markup)

Textstruktur wie: Kapitel, ÜberschriftenParagrafen VerszeilenParagrafen, Verszeilentypografische Details (z.B. Initialen)

Personennamen (historisch, mythologisch, biblisch)Ortsnamen

Bibelstellenangabeng

d it i K kt hl hwerden mit einem Korrekturvorschlag versehen

Linguistische Annotation: Tokenisierung, POS und Lemma

Bewahrung, Erschließung und Interpretation sprachlich‐kulturellen Erbes

Erprobung linguistischer Werkzeuge zur Annotation älterer SprachstadienErprobung linguistischer Werkzeuge zur Annotation älterer Sprachstadien

Entwicklung eines stabilen Methodeninventars für non‐standard varieties

Annotationsforschung / Weiterentwicklung der ICLTT‐ToolboxAnnotationsforschung / Weiterentwicklung der ICLTT Toolbox

Gewinnung digitaler sprachlicher Ressourcen, E‐Lexicography

Zielgruppen:  Sprachwissenschaftlerinnen Lit t i h ftl ILiteraturwissenschaftlerInnenHistorikerInnenKunsthistorikerInnenTheologInnenTheologInnenInteressierte Öffentlichkeit