Post on 06-Apr-2015
Peter Grzybek
http://www-uni-graz.at/staff/grzybek
http://www-gewi.uni-graz.at/quanta
Stilistik:
Qualitativ - Quantitativ
Tonhöhen
Satz- und WortlängenFarbsegment
e
Stildefinitionen:
Common Sense Agreements zur Definition von ‚Stil‘
a. Stil als Norm
b. Stil als Norm-Abweichung
c. Stil als Option
S-Text1 "N O R M"
SE1 SE2 SE3 … … SEn
S-Elemente
S-Text1 "N O R M"
Zwei Probleme
Welche Norm ?Ist ein einzelner Text stil-bildend ?
„Das Ganze einer gegebenen Sprache“
Das System einer gegebenen Sprache
Repräsentatives Korpus der Sprache
N-Korpus „spezifischer“ Texte (Gedichte, Sonaten, Skizzen, …)
N-Korpus der Texte von Produzent XY
„Kontextbezogene Relevanz“ eines N-Korpus
N-Korpus „spezifischer“ Texte von Autor XY
N-Korpus „spezifischer“ Texte von Autor XY aus
der Periode YZ
…Letzte Konsequenz: Text selbst !
„N O R M“Bezugs-Modelle
SE1 SE2 SE3 … … SEn
S-Text2
S-Elemente
S-Text1 ( KONTEXT1 )
( KONTEXT2 )
STEREOTYPISIERUNG
STILBILDUNG
Rekurrenz !
SE1 SE2 SE3 … … SEn
S-Text2
0-Text1
S-Text3
S-Elemente
S-Text1
INKLUSION(absolut/graduell)
optional
obligatorisch
EXKLUSION
DIFFERENTIELLER BEGRIFF
DUALE PERSPEKTIVIERTHEIT (Innen – Außen)
Nicht-Realisierung Option
SE1 SE2 SE3 … … SEn
…
…
S-Elemente
S-Text1
0-Text
S-Textn
0-Text2
S-Text2
0-Text1
S-Text3
Typologische Deskriptionen: Gattungstheorien Stiltheorien, usw.
BEZUGS-
MODELLE
STIL-MODELLE
„STIL“
Stilistik
Relation zw. Stil- und Bezugs-Modellen
Quantitative
Probabilistische
Katzen wuerden Whiskas kaufen.
Milch macht muede Maenner munter.
Mars macht mobil.
Stellen wir uns vor …
… als ein frisch vom Mars kommender Alien machen wir folgende erste Text-
Erfahrungen:
Stil-Frage
M-Stereotypie
Stil-Modell (I):
M-Alliteration
Es war schon immer etwas teurer, einen besonderen Geschmack zu haben.
Stil-Modell (II):
Alliteration
S1-T1
S1-T2
0-T1
S2-T1
Bezugs-Modell
Milch macht müde Männer munter.
beobachtete Frequenz Vorkommens-wahrscheinlichk
eit
5 M von 28 Buchstaben
p = 0.1786
P = 0.0323 (bzw. P < 0.0001)
1
0
1 , 1n x
j n j j n ji i i i i i
j x j
n nP X x p q p q q p
j j
Frequenz von M Bezugs-Modell 8.80% ( p = 0.0880 )
Modell: Binomial-wahrscheinlichkeit
Die Wahrscheinlichkeit , dass 5 von 28 Buchstaben ein M
sind, ist kleiner als 5%.
Frage (ohne Berücksichtigung positionaler Implikationen):
Ist das häufige Vorkommen von M signifikant?
Menzerath‘sches Gesetz
Sherman‘sches
Gesetz
Zipf‘sches Gesetz
STIL IST NICHT NUR VARIABILITÄT !
Frequenzen und Abhängigkeiten als synergetische System-
Stabilisatoren
SATZ
TEILSATZ
WORT / LEXEM
SILBE / MORPHEM
PHONEM / GRAPHEM
SATZ
TEILSATZ
Frequenz WORT / LEXEM
Frequenz SILBE / MORPHEM
Frequenz PHONEM / GRAPHEM
SATZ Länge↕
TEILSATZ Länge↕
Frequenz WORT / LEXEM Länge↕
Frequenz SILBE / MORPHEM Länge↕
Frequenz PHONEM / GRAPHEM Länge
SATZ Länge Frequenz
TEILSATZ Länge Frequenz
Frequenz WORT / LEXEM Länge Frequenz
Frequenz SILBE / MORPHEM Länge Frequenz
Frequenz PHONEM / GRAPHEM Länge Frequenz
1 11 21 31 41
Rang
0
100
200
300
400
500
600
Anz
ahl d
e r W
ort fo
rmen
beobachtet
theoretisch
1 5 10Wörter pro Satz
0
5
10
15
20
25
30
Häu
figke
it (%
)
Intervall (5)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 260
5
10
15
20
25
f (i)
NP (i)
n
nK
xn
xnMK
x
xM
Px 1
11
Chopin Étude op. 25 no. 11
1 2 3 4 5 6 7 8 9 1011 1213141516171819202122232425260
200
400
600
800
1000
1200f (i)
NP (i)
1 11 21 31 41 51 61 710
20
40
60
80
100
120
140
160f (i)
NP (i)
Low-level-Regulation von Frequenzen
Buchstaben-Häufigkeiten
Beispiel: Funktionalstilistik
(Individualstilistik – Interindividualstilistik )
Funktionalstile
Stil der Alltagsrede
(Umgangssprache)
wissen-schaftlicher
Stil
offiziell-amtlicherStil des öffentlichen
Verkehrs
journalistisch-publizistischer
Stilkünstlerischer
Stil
prosaisch poetisch dramatisch
• 400 Texte werden a priori einem der FS zugeordnet
[In quantitativen Untersuchungen ist diese Zuordnung tentativ !]
• Für jeden Text werden die Wortlängen und weitere daraus ableitbare Kenngrößen (Streuung, Entropie, usw.) berechnet
• Diskriminanz-Analysen:
Die einzelnen Fälle (Texte) werden auf der Basis von Prädiktorvariablen – hier: Wortlänge etc. – spezifischen (Text-)Gruppen zugeordnet
Ziel:
Optimale Diskrimination der Fälle (Prozentsatz korrekt diskriminierter Texte)
Beispiel: Funktionalstilistik und Wortlänge
Hypothese:
Wortlänge ist eine Variable, die für einen Funktionalstil (FS) charakteristisch ist
-5,0 -2,5 0,0 2,5 5,0 7,5
-4
-2
0
2
4
6
8
1
3
4
5
6
Nur 73% korrekte Diskriminierung
Wortlänge kein guter Indikator für FS bzw.
FS lassen sich mit Wortlänge (allein) als Stilkriterium nicht begründen
Diskriminanzanalyse
400 slowenische Texte (verschiedene Textsorten / Funktionalstile)
Prädiktorvariable:
Wortlänge und abgeleitete Kenngrößen
Wortlänge charakteristisch für drei Diskurstypen (93% korrekt):
1. privater / mündlicher Diskurs
2. öffentlicher / schriftlicher Diskurs
3. Vers
-6 -4 -2 0 2 4 6
Funktion 1
-4
-2
0
2
4
Fu
nkt
ion
2priv
pub
vers
oeffprivpriv
pub
vers
Gruppenmittelpunkte
Kanonische Diskriminanzfunktion
1-2 3-4 5-6 7-8 9-10 11-12 12-13
Worte pro Vers
0
20
40
60
80
100Anzahl der Verse
empir.: F[i]
theor.: NP[i]
Wie viele Verse mit x Wörtern kommen im Журавль vor
1-2 3-4 5-6 7-8 9-10 >101,50
1,70
1,90
2,10
2,30
2,50
2,70
2,90 beobachtet
1-2 3-4 5-6 7-8 9-10 >101,50
1,70
1,90
2,10
2,30
2,50
2,70
2,90 beobachtet
theoretisch
(Wie) Hängt die Wortlänge von der Verslänge ab ?(Chlebnikov: Žuravl‘)
x : Worte pro Vers (Verslänge)
y :Silben pro Wort
(Wort-länge)
y = 2.94 x-.28
Menzerath‘sches Gesetz
y = a xb
Quantitative Stilistik↓
Stilistik → Was ist Stil ?
XY ist Stil XY hat Stil
↓ ↓
Definitorisch
Evaluatorisch
qualitative Komponent
en
quantitative
Qualitative Aspekte
Quantitative Aspekte
Strukturelle Variablen:• Kategorien• Merkmale• Relationen• …
implizit quantitativ
explizit
quantitativ
Metrisierte Variablen: • Längen• Frequenzen • Distanzen• …
EinS-Text ... … weist ein
Mehr an XY auf… ist gekenn-zeichnet durch erhöhte XY…hat einen größeren Anteil an XY
Quantifizierung ist weder Selbstzweck noch Ersatz für
Theorie, sondern Werkzeug der Theoriekonstruktion
Was ist ‚Norm‘ ?
„S-Text als Norm“ und „S-Text als Norm-Abweichung“
S-Text
selbst ist (Bestandteil einer)
Norm
S-Text
Norm-Abweichung setzt die Existenz
einer Norm voraus, von der ein S-Text
abweicht
NORMEN
Präskriptive Deskriptive
inhaltlich-qualitativ strukturell-frequentiell
stilus modus scribendi
S-Texte
N-Texte
Abweichung von deskriptiver / präskriptiver Norm
Vergleich von S-Text mit Normformulierung!
Vergleich von S-Text mit N-Text1…n
1. Charakter: Soll / kann / darf / muss etwas sein ?2. Inhalt: Was soll / kann / darf / muss sein ?3. Anwendungsbedingungen, 4. Autorität, 5. Adressat, 6.
Situation
Keine Bestandteile der Norm: mit der Norm verbundene Sanktionen Formulierung/Bekanntmachung der Norm
(x) (Kx & Sx OAx)
["Für alle x gilt, wenn x Mitglied eines bestimmten Kollektivs ist
und wenn x sich in Situation S befindet, dann soll x den Akt A ausführen"].
Forschungslogischer Ablauf quantitativer Untersuchungen
0. Problem-Formulierung
Hat sich der Stil Goethes im Laufe seines Lebens geändert?
1. Hypothesen-Formulierung (textbezogenen, empirisch prüfbar)
Frühe und späte Texte Goethes weisen unterschiedliche Satzlängen auf
2. Übersetzung der Hypothese in die Sprache der Statistik • mathematisch-statistische Modellbildung
• Metrisierung von in der Hypothese enthaltenen qualitativen Begriffen
3. Datenerhebung und –analyse
4. Entscheidung über Annahme oder Ablehnung der Hypothese
5. Interpretation: Rückübersetzung der getroffenen Entscheidung in die Sprache der Ausgangshypothese
Einwand (I)
«Wir haben nicht mit Quantitäten, sondern mit Qualitäten zu tun.»-
Antwort I
Weder Qualitäten noch Quantitäten sind den Objekten selbst inhärent; vielmehr sind diese Teile unserer Konzepte, mit denen wir die Natur, Sprache u.a. interpretieren.
Einwand (II)
«Nicht alles in der Natur, in der Sprache usw. kann der Quantifizierung unterworfen werden.»
Es ist nicht die Natur, die Sprache, usw. die quantifiziert wird, sondern unsere Konzepte davon.
Milch macht müde Männer munter.
Erwartungswahrscheinlichkeit ändert sich:
a) in Abhängigkeit von der gewählten Norm,
b) in Abhängigkeit von Definition der Alliteration
• alle Buchstaben/Grapheme/Phoneme/Laute/Konsonanten, …
• in Initialposition, bei unmittelbar aufeinanderfolgenden Wörtern, bei tontragenden Silben, Stammsilben, …
Milch macht müde Männer munter.
beobachtete Frequenz Vorkommens-wahrscheinlichk
eit
5 M von 26 Buchstaben
p = 0.1923 P = 0.0000390228
ü -> ueä -> ae
5 M von 28 Buchstaben
p = 0.1786 P = 0.0000611427
5 [m] von 21 Phonemen
p = 0.2381 P = 0.0000102538
1
0
1 , 1n x
j n j j n ji i i i i i
j x j
n nP X x p q p q q p
j j
„Norm“-Frequenz von M: 2.53% (p = 0.0253)
Modell: Binomialwahrscheinlichkeit
Das erhöhte Vorkommen von M ist hoch signifikant !
Synergetik auf Sparflamme-Niveau –
Häufigkeiten und Abhängigkeiten
WARUM WORTLAENGE ?
SENTENCE
CLAUSE
WORD / LEXEME
SYLLABLE / MORPHEME
PHONEME / GRAPHEME
SENTENCE
CLAUSE
Frequency WORD / LEXEME
Frequency SYLLABLE / MORPHEME
Frequency PHONEME / GRAPHEME
SENTENCE Length↕
CLAUSE Length↕
Frequency WORD / LEXEME Length↕
Frequency SYLLABLE / MORPHEME Length↕
Frequency PHONEME / GRAPHEME Length
Wortlänge: Grapheme, Phoneme, Silben, Morpheme,…
SENTENCE Length Frequency
CLAUSE Length Frequency
Frequency WORD / LEXEME Length Frequency
Frequency SYLLABLE / MORPHEME Length Frequency
Frequency PHONEME / GRAPHEME Length Frequency