Peter Grzybek
description
Transcript of Peter Grzybek
Peter Grzybek
http://www-gewi.uni-graz.at/quanta
Austrian Research Fund
Project #15485
Von der Ökonomie der Sprache
zur Selbst-Regulation
kultureller Systeme
Zum Ökonomiebegriff
a) der Rhetorikb) der Sprachec) der Systeme
Ökonomie in der Rhetorik
Die rednerische Tätigkeit gliedert sich üblicherweise in fünf Haupttätigkeiten oder -phasen
(officia):
• Auffindung des Materials: inventio
• Gliederung des Stoffes: dispositio
• sprachliche Formulierung: elocutio
• Gedächtnisleistung: memoria
• Vortrag: pronuntiatio
Ökonomie in der Rhetorik
• Gliederung des Stoffes: dispositio táksis
(grch. ab 1. Jh.v.)
oíkonomía ordo
Quintilian: Lehrbuch der Rhetorik (3,3,9)
»[Oeconomia ... ist ein griechisches Wort und benannt nach der Sorge um die Führung eines Haushalts. Hier steht es in
uneigentlicher Bedeutung; ein lateinisches Wort dafür gibt es nicht.]«
Englisch ca. 1530:
Einführung von „yconomie“
im Sinne von „Howsolde keepyng“
1658 The New World of English Words
„Thus I have, in as brief a Method as I could device, run through the whole O e c o n o m y of our foreign words,
and I have arranged them all into their several orders and distinctions.“
(Edward Philips)
„‚Ökonomie‘ bezeichnet hier ein komplexes, aber doch erklärbares lexikalisches System. Das Wort könnte mit lat. ordo, engl. order, dt. Ordnung wiedergegeben werden.“
(Sperk 1985: 31)
DAS ZIPF‘sche GESETZ
"Der bisher umfassendste Versuch, die innersprachliche Ökonomie zu erklären und mit einer allgemeinen ökologischen Theorie des menschlichen Verhaltens in Beziehung zu setzen, ist Zipfs berühmtes, aber dennoch zu wenig beachtetes Buch Human Behavior and the Principle of Least Effort.“
(Coulmas 1992: 295)
Ökonomie in der Sprache
Zipf, George K. (1939): The Psycho-Biology of Language: An Introduction to Dynamic Philology
a b² = k
a = Anzahl von Wörtern einer
best. Vorkommenshäufigkeit (n)
b = Anzahl der Vorkommnisse (fn)
k = Konstante
b (fn) a (n) k=ab²
1 2976 29762 1079 43163 516 46444 294 47045 212 53006 151 54367 105 51458 84 53769 86 696610 45 4500
...
...
Das Produkt der
Vorkommenshäufigkeit eines bestimmten Wortes
und der Summe aller Vorkommenshäufigkeiten ist
konstant für alle Wörter
Die Konstante k = a·b² für amerikanisches Zeitungsenglisch nach Zipf (1939)
Anzahl d. Vorkommnisse
Wortanzahl
3,53,02,52,01,51,0,50,0
2,0
1,5
1,0
,5
0,0
Beobachtet (log)
Linear (log)
(Daten nach Elridge 1911, Graphik bilogaritmiert)
11
m
i
w mwm
i
1
1939:129 "tendency [...] to maintain a condition of equilibrium"
1949:21 speaker‘s economy auditor‘s economy
Unification Diversification
1 Wort für m distinktive
Bedeutungen
m verschiedene Wörter mit jeweils
genau 1 Bedeutung
"vocabulary balance between the theoretical Forces of Unification and Diversification"
„law of economy of effort “
Zipf, George K. (1949): Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology.
Zipf‘s Ranghäufigkeits-Alternative
r f = C
r = Rang des betreffendes Wortes auf der Häufigkeitsskala für den betreffenden Wortschatz
f = Vorkommenshäufigkeit eines Wortes
Rang (r) Frequenz (f) C = r x f
10 2653 2653020 1311 2622030 926 2778040 717 2868050 556 27800
100 265 26500200 133 26600300 84 25200400 62 24800500 50 250001000 26 260002000 12 240003000 8 240004000 6 240005000 5 25000
10000 2 2000020000 1 2000029899 1 29899
Ausgewählte Ranghäufigkeiten von Ulysses (nach Zipf 1949: 24)
Erweiterung des Zipf‘schen Gesetzes
durch B. Mandelbrot (1953, 1954)
Zipf-Mandelbrot‘sches Gesetz
( )r a
CP
b r
Zipf-Zeta-Verteilung:
Zipf-Mandelbrot-Verteilung:
Zipf als Spezialfall von Z/M, für den Fall wenn:
b = 0, a = 1
r a
CP
r
r f = C
fr = C / r
Verteilung, weil:
1p
Anzahl unterschiedlicher Wörter (tokens): n = 3989
Anzahl der Worttypen (types):
n = 1302
Rang f(i) 1 153
2 133 3 75 4 70 5 60 6 57 7 50 8 41 9 3610 3311 3012 2813 2714 2515 2516 2517 2418 2419 2420 23... ...
Frage:
Wie oft kommt das i -häufigste Wort im Text vor?
Wortranghäufigkeit in Puškins Царь Салтан
* * * * *
1 11 21 31 41 51 61 71 81 91 101 111 121 131
Rang
0
20
40
60
80
100
120
140
160f(i)
F[i]
a = 0,816b = 1,294r = 1302
816.0)1302294.1(
CPi
wobei: 1
na
i
C b r
( )r a
CP
b r
1 11 21 31 41 51 61 71 81 91 101 111 121 1310
20
40
60
80
100
120
140
160
F[i]
NP[i]
Wortranghäufigkeit in Puškins Царь Салтан
Px = g(x) Px-1
Von der Ökonomie zur Synergetik der Kultur
1 1
1 1
x x x
x x
P P P
P P
1 2
1 20 1
1 2
1 ...( ) ( )x xc c
a aP a P
b x b x
Wimmer/Altmann (2003a,b)
1 2
1 20 1
1 2
1 ...( ) ( )x xc c
a aP a P
b x b x
Zipf-Mandelbrot negativ hypergeometrisch
1
11
d
x xP Px b
1
( 1)( 1)x x
M x n xP P
K M n x
1 1
1x
M x K M n x
x n xP
K n
n
0
1
2
0,
2 ( 1)( 1) /( ),
( 1) /( 1) /( ),
a
a K M n K M n
a M n K M n
1 2, 0, 0, {0,1, }b K M n b K M n
0 2 1 1... 0, 1, ... 1a a a c
1 2
1 20 1
1 2
1 ...( ) ( )
d
x xc c
a aP a P
b x b x
Grzybek/Kelih/Altmann (2004)
1... 1, 1c d
Levitan: »Ewige Ruhe« (1893/94)
0 10 20 30 40 50 60 70
Rang
0
20
40
60
80
100
120
140
160f[i]
F[i]
NP[i]
Chopin Étude op. 25 no. 11
Vorkommenshäufigkeit der Tonhöhen
n
nK
xn
xnMK
x
xM
Px 1
11
negative hypergeometrische Verteilung
Mosaikausschnitt von Apostel Petrus aus dem Baptisterium der Kathedrale in Ravenna (5. Jhd.)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Rang
0
200
400
600
800
1000
1200f[i]
f[i]
np[i] - Pólya
np[i] - neg. hypergeom.
0
500
1000
1500
2000f [i]
F[i]
NP[i] - NH
NP[i] - Pólya
Rangverteilung der Graphemhäufigkeiten in Puškins Царь Салтан
Peter Grzybek
http://www-gewi.uni-graz.at/quanta
Austrian Research Fund
Project #15485
Von der Ökonomie der Sprache
zur Selbst-Regulation
kultureller Systeme