Eine korpusbasierte Geschichte des deutschsprachigen Romans

28
Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

description

Fotis Jannidis. Eine korpusbasierte Geschichte des deutschsprachigen Romans. Göttingen, 15.8.2012. Ziel. Monographische Darstellung (vulgo: Buch) Theoriebaustelle 1: Kritik an der (Literatur-)Geschichte Theoriebaustelle 2: Modelle historiographischer Präsentation - PowerPoint PPT Presentation

Transcript of Eine korpusbasierte Geschichte des deutschsprachigen Romans

Page 1: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Eine korpusbasierte Geschichte des deutschsprachigen Romans

Göttingen, 15.8.2012

Fotis Jannidis

Page 2: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Ziel

• Monographische Darstellung (vulgo: Buch)• Theoriebaustelle 1:

Kritik an der (Literatur-)Geschichte• Theoriebaustelle 2:

Modelle historiographischer Präsentation• Zwischenstand:

Patchwork von Mikronarrativen; Hypertext?

Page 3: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Komponenten (Mikronarrative)

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 4: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Komponenten mit Korpusforschung

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 5: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Forschungsstand: Material

• USA: Bsp: ca. 3.000 Romane des 19. Jh.• D: 650 Romane (TextGridRep)

Page 6: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Forschungsstand: Methoden

• Ngram-Verlauf in der Zeit• Stylometrie• Regelbasierte Analyse• Machinelles Lernen• Topic Modeling

Page 7: Eine korpusbasierte Geschichte des deutschsprachigen Romans

The method

• John Burrows: Delta• Basis: most frequent words (mostly stopwords)• A measure for the relative stilistic distance

between texts• „the mean of the absolute differences between

the z-scores for a set of word-variables in a given text-group and the z-scores for the same set of word-variables in a target text“

Page 8: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Z-score

x is a raw score to be standardizedμ is the mean of the populationσ is the standard deviation of the population

Page 9: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Assigning authors of American novels (Hoover 2004)

Page 10: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Validity

• With texts longer than 2000 words Burrows‘ Delta is a good indicator for the correct author

• With shorter texts in 85% of all cases the correct author is one of the first five names

Page 11: Eine korpusbasierte Geschichte des deutschsprachigen Romans

The tool

• R Script by Maciej Eder, Jan Rybicki

Page 12: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 13: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Some ‚results‘

Page 14: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 15: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 16: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 17: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 18: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 19: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 20: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 21: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 22: Eine korpusbasierte Geschichte des deutschsprachigen Romans
Page 23: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Stand der Dinge: Eine Einschätzung

• Kalibrierung der Instrumente• Fruchtbare Verwendungsformen• Viel Platz zwischen Heilsversprechen und

Verteufelung

Page 24: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Probleme quantitativer Textanalyse

• Typische Probleme: Mangelndes historisches Wissen, unbrauchbare Texte, falsche Indikatoren, unzulänglich gehandhabte statistische Verfahren

• Wahrscheinlichkeitsaussagen in den Geisteswissenschaften

• Trivial?

Page 25: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Mapping Models

• Genre und Gender Konzepte

unddiederzusieicherindendassichmitnichtsoeindemvonesaufwaralswie

Narrative, descriptions of erotic actions and tableaux,

staging of bodies, language of seduction

Bag of Words

Mos

t fre

quen

t wor

ds

Page 26: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Quantitative Verfahren und die Literaturwissenschaft

• Ersatz oder Ergänzung?• Ein neues Paradigma?• Empirische Psychologie und korpusbasierte

Verfahren• Vs. oder Koop

Page 27: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Quantitative Ansätze basieren auf sehr diversen Kompetenzen. Das problem der Interdisziplinarität

Page 28: Eine korpusbasierte Geschichte des deutschsprachigen Romans

Literatur

• John Burrows: Delta: A Measure for Stylistic Difference and A Guide to Likely Authorship. In: LLC 17,3 (2002).

• TextGridRephttp://textgridrep.de/repository.html

• The R Script for Stylometric Analyseshttps://sites.google.com/site/computationalstylistics/

• Ryan Heuser, Long Le-Khac: A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method. Stanford LabReport May 2012. http://litlab.stanford.edu/LiteraryLabPamphlet4.pdf