Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

19
Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Transcript of Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Page 1: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Peter Grzybek

Warum messen wir Wortlängen

nicht in der Anzahl

von Buchstaben pro Wort ?

Page 2: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

„Die Länge eines Lexems kann in der Anzahl der Grapheme, Phoneme, Phone, Morpheme

oder Silben gemessen werden.“

„ …, dass zwischen den einzelnen Metrisierungen eine numerische

Transformation vorgenommen werden kann.“

Hoffmann (2001: 84):

„Polylexie lexikalischer Einheiten in Texten“

Page 3: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Wortlänge und Bedeutungszahl

Slowakische Daten

nach Altmann/Schwibbe (1989: 68)

a = 3.68

b = -0.64

R² = 0.92

1 2 3 4 5 6

Wortlänge (in Silben)

0

1

2

3

4Bedeutungszahl

beobachtet

theoretisch (y=ax^b)

Page 4: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Wortlänge und Bedeutungszahl

Slowakische Daten

nach Altmann/Schwibbe (1989: 89)

a = 11.63

b = -0.84

R² = 0.90

1 2 3 4 5 6 7 8 9 10 11 12 13

Wortlänge (in Buchstaben)

0

2

4

6

8

10

12Bedeutungszahl

beobachtet

theoretisch (y=ax^b)

Page 5: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Darstellung der Worthäufigkeit als Funktion der Wortlänge. Der Spitzenwert der Wortlänge 3 (Buchstaben) kommt durch den häufigen Gebrauch von

Worten wie z. B. "ein", "der", "die" oder "das" zustande.

http://www.numberland.com/visual/wort.htm

Page 7: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

P.M. Alekseev (1998):

Graphemic and Syllabic Length of Words in Text and Vocabulary

Gesamtstichprobe: 25.000 „fortlaufende Wörter“

Fünf Teilstichproben à 5.000 Wörter:• Gesprochene Sprache

• Privatbriefe

• Drama

• Poesie

• Journalistik

Page 8: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?
Page 9: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?
Page 10: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?
Page 11: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?
Page 12: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Vergleich zweier Texte von Puškin

Домик в Коломне / Евгений Онегин (I)

Wortlänge in Silben

Wortlänge in

Buchstaben

Domik v Kolomne

2.01(s² = 0.88)

4.85(s² = 5.83)

Evgenij Onegin (I)

2.06(s² = 1.01)

5.09(s² = 6.79)

Mittelwert-vergleich

t3621 = 2.01

p < 0.05

t3648 = 3.19

p < 0.005

Page 13: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

 Silben pro Wort

Grapheme pro Wort

Schiefe 0.589 0.415

Kurtosis – 0.357 – 0.325

Kolmogorov-Smirnov

0.221 (p < 0.001)

0.115 (p < 0.001)

Shapiro-Wilk0.845

(p < 0.001)0.961

(p < 0.001)

 Korrelation: r = 0.871 (p < 0.001)

Домик в КоломнеWortlänge in Silben und Buchstaben

Page 14: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Grapheme und Silben pro Wort in Puškins

Domik v Kolomne

1 2 3 4 5 6 7 8 9 10 11 12 130

100

200

300

400

500

600

700

Si pro Wort

Gra pro Wort

Page 15: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

 Korrelation: r = 0.888 (p < 0.001)

Евгений Онегин (I)Wortlänge in Silben und Buchstaben

 Silben pro Wort

Grapheme pro Wort

Schiefe0.841 0.615

Kurtosis – 0.518  – 0.030

Kolmogorov-Smirnov

0.222 (p < 0.001)

0.104 (p < 0.001)

Shapiro-Wilk0.849

(p < 0.001)0.961

(p < 0.001)

Page 16: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Grapheme und Silben pro Wort in Puškins

Evgenij Onegin (I)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160

200

400

600

800

1000

1200

Si pro Wort

Gra pro Wort

Page 17: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Grapheme pro Silbe in Puškins

Evgenij Onegin (I) und Domik v Kolomne

1 2 3 4 5 6 72,00

2,20

2,40

2,60

2,80

3,00

Evgenij Onegin (I)

Domik v Kolomne

Page 18: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

2,01,81,61,41,21,0,8,6,4,20,0

2,5

2,0

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

-2,0

S2

I2

S1

I1

Ord‘sches Schema

20 russische Texte

Wortlängen in Silben und Graphemen

Page 19: Peter Grzybek Warum messen wir Wortlängen nicht in der Anzahl von Buchstaben pro Wort ?

Peter Grzybek

Warum wir Wortlängen

nicht in der Anzahl

von Buchstaben pro Wort messen…