Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil...

25
Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil als Charakteristikum slawischer Literatursprachen (Slowenisch, Mazedonisch, Tschechisch und Russisch) ? (Mit einem Ausblick auf synergetische Wechselbeziehungen) Institut für Slawistik, Universität Graz http://www-gewi.uni-graz.at/quanta/ [Graz Project on Quantitative Text-Analysis] http://www.uni-graz.at/emmerich.kelih/ [[email protected]]

Transcript of Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil...

Page 1: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Emmerich Kelih

(Graz)

Vokal- und Konsonanten-Anteil als

Charakteristikum slawischer Literatursprachen (Slowenisc h, Mazedonisch, Tschechisch und Russisch) ?

(Mit einem Ausblick auf synergetische Wechselbeziehung en)

• Institut für Slawistik, Universität Graz

• http://www-gewi.uni-graz.at/quanta/ [Graz Project on Quantitative Text-Analysis]

• http://www.uni-graz.at/emmerich.kelih/ [[email protected]]

Page 2: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

1. Anteil von Vokalen/Konsonanten am Phonem-Inventar

2. Studie von Isačenko (1939/1940): Probleme und Kritik

3. Erweiterungen: Synergetischer Regelkreis

4. Zusammenhänge: Inventarumfang – Silbenlänge – Wortlänge – Vokalhäufigkeit

5. Empirische Fallstudien (Parallelkorpus)

6. Abschließende Diskussion & Perspektiven

Welche sprachtypologische Bedeutung hat der Vokal- und

Konsonantenanteil?

Page 3: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Anteil von Vokalen (V) und Konsonanten (C) am Phoneminventar

Schleicher (1852); Budilovič (1883); Dikarev (1891/1892); Čistjakov/Kramarenko (1929),

Burlakova et al. (1962), Majewicz (1989), Gil (1990), Sawicka/Grzybowski (1999) u.v.m. …

� Anteil von V und C am Phoneminventar als sprachtypologisches Merkmal

� V/C als das „charakteristische“ einer Sprache

� Möglichkeit einer typologischen Gliederung von slawischen Sprachen

� keine systematischen Studien zu slawischen Sprachen

� z.T. Beschränkung auf Intuition („musikalischer“ Typus, sehr konsonantenreiche Sprache)

� methodologische Schwächen: keine Prozentangaben, kein relativer Anteil ...

� Studie von Isačenko (1939/1940) “Versuch einer Typologie der slavischen Sprachen”

Page 4: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Sprache Konsonanten Vokalesilbische

Konsonanten Summe% der

KonsonantenSerbokroatisch-

Štokavisch 24 20 448

50Slowenisch 21 18 3 42 50Kašubisch 27 26 0 53 50,9Slowakisch 27 14 4 45 60Čechisch 26 11 2 39 66,7

Ukrainisch 31 12 0 43 72,1Bulgarisch 34 9 0 43 79,1

Ober-Sorbisch 32 7 0 39 82,1Russisch 37 8 0 45 82,2

Nieder-Sorbisch 33 7 0 40 82,5Polnisch 35 5 0 40 87,5

RESULTAT nach Isa čenko (1939/1940):

I. ein radikal vokalischer Typus (Serbokroatisch, Slowenisch, Kaschubisch)II. ein radikal konsonantischer Typus (Ostslawische Sprachen, Bulgarisch)III. das „Schriftslowakische“, welches in der Mitte zwischen den beiden Extremtypen liegt

Isačenko (1939/1940): Berechnung des Prozentsatzes von V und C am Inventar:

Page 5: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Weitere Rezeption

� methodologische Weiterentwicklungen durch V. Skalička, J. Krámský, E. Stankiewicz

� allgemeine Akzeptanz von „vokalischen“ vs. „konsonantischen“ Sprachtypus in Andersen (1978), ähnlich Stadnik (1998)

� Erklärung: Kompensationsmechanismen

� ausführliche Kritik durch Kempgen (1991)

� es werden nur binäre Merkmale benutzt

�Mittelstellung des Slowakischen ?

� fehlende Zuordnung des Ukrainischen !

� fehlende Trennung von segmentalen und supra-segmentalen Eigenschaften !

�linguistische Kriterien für Bestimmung des Phoneminventars ist offen !

� keine Begründung über Festlegung der Grenzen

�nur der Anteil von V und C wird beachtet,

nicht aber Häufigkeit von einzelnen Phonemen !

Page 6: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Potentielle Merkmale einer Sprachtypologie (Altmann /Lehfeldt 1973 Kempgen 1991 u.a.)

1. Zahl der Vokale im Inventar

2. Zahl der Konsonanten im Inventar

3. Zahl von silbenbildenden Konsonanten

4. Zahl der Korrelationspaare hart/weich

5. Anzahl von Phonemverbindungen (zulässige, realisierte …)

6. Bindefähigkeit von Phonemen („Attraktivität“ „Aggressivität“)

7. positionelle Beschränkungen (initial, medial, final)

8. Silbenlänge und Silbenhäufigkeit

9. Anzahl von kanonischen Silbentypen

10. Morphemlänge – Morphem-Struktur

11. ... ... ...

Page 7: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Synergetische Sichtweise: Wechselbeziehungen

Inventar-Umfang(Laute, Grapheme, Phoneme)

� relativer Anteil von V und C

Länge von

Worten, Lemmata, Lexemen ...

� Wortlänge

Silbenstruktur� Silbenlänge

� kanonischen Silbentypen

Distribution (Laute, Grapheme, Phoneme)

� Anzahl von Bigrammen

Häufigkeit von Lauten, Graphemen, Phonemen im Text

� rel. Vokal-Häufigkeit

� rel. Konsonantenhäufigkeit

� Ranghäufigkeiten

Page 8: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Fallstudie: 4 ausgewählte Eigenschaften

WortlängeSilbenlänge

rel. V-Häufigkeit

Graphemhäufigkeit

im Text

Inventar-Umfang

rel. Anteil von V bzw. C

?

?

?

� keine Eigenschaft ist isoliert

� Aufdecken von Wechselbeziehungen (Korrelationen)

� Selektion von „informativen“ Eigenschaften

Page 9: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Zusammenhang von Wortlänge und Silbenlänge

Wirkung des Menzerath‘schen Gesetzes (MG)

� „The longer a language construct the shorter its components (constituents).“ (Altmann 1980)

� „Mit zunehmender Wortlänge, nimmt die Silbenlänge ab“. (Altmann/Schwibbe 1989)

Linguistische Spezifizierungen:

� Bestimmung der „Wortlänge“ auf unterschiedlichen Ebenen (Tpyes, Tokens, Lemma ...)

� Messung der Wortlänge: Anzahl von Silben, Phonemen, Lauten ...

� Silbenlänge: Anzahl von Phonemen/Segmenten/Graphemen/ Lauten

� Mathematische Ausformulierung: y = a*x -b

Page 10: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

0

0,5

1

1,5

2

2,5

3

3,5

4

0 1 2 3 4 5 6 7 8

Wortlänge/Silben

mitt

lere

Silb

enlä

nge

SIL = 3,3143*WOL-0,2782R² = 0,967

Wortlänge vs. mittlere Silbenlänge

Fallbeispiel: Serbokroatisch (nach Gajić 1950)

Worlänge in Anzahl von

Silben

mittlere Silbenlänge

1 3,462 2,673 2,324 2,25 2,116 2,067 2

� MG allgemein akzeptiert in quantitativer Linguistik

� wenige systematische Studien für slawische Sprachen (Lehfeldt/Altmann 2006, Grzybek 1999)

� nur ansatzweise Diskussion über die Rolle von MG für sprachtypologische Fragestellungen !

Page 11: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Untersuchte Sprachen: Russisch, Slowenisch, Tschechisch, Mazedonisch

� Texte: je 10 Kapitel von «Kak zakaljalas‘ stal‘» (1932-1934) von N.А. Ostrovskij

� Analyse von Wortformen-Types

� Bestimmung der Wortlänge in der Anzahl von Silben

� Silbenlänge in der Anzahl von Graphemen

� orthographische Kodierung der Texte

� „vokalische“ bzw. „konsonantische“ Grapheme als Basis

Fallstudie I: Slawisches Parallel-Korpus

Page 12: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Systemlinguistische Zusammenhänge: Wortlänge – Silb enlänge

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Slowenisch

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Makedonisch

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Russisch

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Tschechisch

Page 13: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Systemlinguistische Zusammenhänge: Wortlänge – Silb enlänge

1. unterschiedliche Silbenlänge der Sprachen

2. „ähnlicher“ Verlauf der Kurve

3. Individualität der Sprachen bleibt erhalten (Parameter)

Sprache a b R²Slowenisch 3,06 -0,20 0,95

Mazedonisch 2,82 -0,18 0,92Russisch 3,23 -0,24 0,98

Tschechisch 2,99 -0,21 0,97

� Interpretation eines Merkmals für sprachtypologische Belange ausreichend !

Page 14: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Auswirkungen des MG auf die relative Häufigkeit von Vokalen im Text?

� Je länger das Wort, desto höher der relative Vokalanteil ?

0,3000

0,3500

0,4000

0,4500

0,5000

1 3 5 7

Slowenisch

0,3000

0,3500

0,4000

0,4500

0,5000

1 3 5 7

Makedonisch

0,3000

0,3500

0,4000

0,4500

0,5000

1 3 5 7

Russisch

0,3000

0,3500

0,4000

0,4500

0,5000

1 3 5 7

Tschechisch

• unterschiedlicher relativer Anteil von Vokalen (siehe Parameter c)

• Regulation durch den gleichen Mechanismus wie bei Wortlänge - Silbenlänge

Sprache c d R²Slowenisch 0,33 0,19 0,95

Mazedonisch 0,35 0,18 0,92Russisch 0,31 0,23 0,98

Tschechisch 0,33 0,20 0,97

Page 15: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Fallstudie II: Slowenisch

Auswirkungen auf Graphemfrequenz?

24919Gesamtkorpus

561642 AkteDrama

797732Predigten

518230Privatbriefe

61445 Kap. Diplomarbeiten

Wordformen-Types

AnzahlTextsorten

GraphemhäufigkeitenGrapheme Frequenz (abs.)

a 15290b 2180c 1279č 2299d 4371e 14117f 362g 2374h 1545i 13776j 6394k 4284l 7251

m 4941n 10767o 13644p 5408r 8289s 6528š 1772t 7326u 3622v 6122z 3570ž 1051

148562

Freq. (rel.)0,100,010,010,020,030,100,000,020,010,090,040,030,050,030,070,090,040,060,040,010,050,020,040,020,01

Rang1

202319142

2518223

10158

1354

126

21217

16111724

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

0 5 10 15 20 25 30

Page 16: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 250,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 25

2-silbige Wörter

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 25

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 25

Rel. Graphemhäufigkeiten von 1, 2, 3, 4 … x silbigen Wörtern

1-silbige Wörter 3-silbige Wörter

5-silbige Wörter

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 25

4-silbige Wörter

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0 5 10 15 20 25

6-silbige Wörter

1. Anwachsen von p1 (=erste Ranghäufigkeit) mit ansteigender Wortlänge

2. Gesamtbild der Verteilung ändert sich !

Page 17: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Wortlänge Silben

p1

1 0,07552 0,09193 0,10304 0,10885 0,10986 0,1319

0,0000

0,0200

0,0400

0,0600

0,0800

0,1000

0,1200

0,1400

0 1 2 3 4 5 6 7

Wortlänge/Silben

p1

Zusammenhang: Wortlänge und p1?

� Je länger das Wort, desto höher der Anteil von p1.

Page 18: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Zusammenfassung

� Erweiterung der phonologischen Typologie slawischer Sprachen

� Textbasis (maximale Homogenität durch Paralleltexte)

� Beachtung von systematischen Interrelationen (MG)

� Graphemhäufigkeiten – relativer Vokalanteil – Silbenlänge – Wortlänge

= korrelierte Größen !

� Reduktion auf 1 Eigenschaft möglich und notwendig!

Perspektiven:

� Bedeutung des Phoneminventars muss geklärt werden

� phonologische Kodierung der Texte

� detaillierte Untersuchung der Phonemdistribution & Silbenstruktur

� Erweiterung auf weitere slawische Sprachen

Page 19: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Analyse von 1-silbigen Wörtern: Anzahl von kanonischen Silbentypen

SLOCVC

CCVC

CVCC

CCV

CV

CCCVCVC

CCVCCV

CCCVCCVCC

CCCCVCCCCV

CVCCC

14

MZCVC

CCVC

CV

CVCC

CCV

VCCCVCCCCCVC

VCVCCCCCCV

CCCVCCCCCCV

VCCCCCCCVCCVCCC

15

CZCVC

CCVC

CCV

CV

CVCC

CCCVCVC

CCVCCCCCV

VVCC

CVCCCCCCCVCCCCVCC

14

RUSCVC

CCVC

CVCC

CCVCC

CCV

CVCVCCC

VCCCCVC

VCCVCCC

VCCVCCC

CCCCVCCCCVCC

CCCVCVCCCC

CCCVCCCCCCCVCCCCCVCCV

20

Sprache Wortlänge SilbentypenSlo 2,55 14Mz 2,83 15Rus 2,8 20Cz 2,56 14

Page 20: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Silbenstruktur (kanonische Silbentypen) vs. Wortlänge ?

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

�Je höher die Wortlänge, desto einfacher die Silbenstruktur

= Je höher die Wortlänge, desto weniger kanonische Silbentypen?

Page 21: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Vokalanteil (System) vs. rel. V-Anteil (Text)?

Sprachen Inventar Vokalerel.

Vokalanteilrel.

VokalfrequenzSlo 25 6 0,24 0,40Mz 31 6 0,19 0,43Ru 33 5 0,15 0,41Cz 41 14 0,34 0,41

0,2

0,25

0,3

0,35

0,4

0,45

0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40

Rel. Vokalanteil (System)

Rel

. Vo

kalfr

equ

ezn

(Tex

t)

� kein systematischer Zusammenhang

Krámský (1948): Je mehr V im Inventar, desto höher Vokalfrequenz im Text.

Page 22: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Ziele einer quantitativen Sprachtypologie nach Altmann/Lehfeldt (1973: 15)

a.) Sprachklassifikation, d.h. Aufbau eines Ordnungssystems für die natürlichen Sprachen

b.) Aufdeckung von Konstruktionsmechanismen der Sprachen = Aufbau eines Beziehungssystems

� komplementär zu rein qualitativen Verfahren

� Unterschiede zur „crosslinguistisch“ orientieren

Universalienforschung

� Verwendung statistischer Methoden

� theoretische Anlehnung an die synergetische Linguistik

Page 23: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

y = 0,2772x0,4026

R2 = 0,5579

0,35

0,36

0,37

0,38

0,39

0,4

0,41

0,42

0,43

0,44

2,5 2,55 2,6 2,65 2,7 2,75 2,8 2,85

Cross-linguistische Vergleich:

Je länger die mittlere Wortlänge, desto höher der Vokalanteil?

• nur schwache statische Bestätigung !

• weitere Faktoren beeinflussen diese Relation !

Page 24: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Isačenko (1939/1940: 67) unterscheidet […] mit Rücksicht auf die phonologische Belastung, resp. auf ihren prosodischen ‘Überbau‘ […] innerhalb der slawischen Sprachen folgende Typen:

Bezogen auf das Vokalsystem:

1. polytonische Sprachen (a) mit musikalischer Intonation in kurzen und langen Silben und (b) in

langen Silben

2. monotonische Sprachen mir freier Quantität

3. monotonische Sprachen mit einem freien dynamischen Akzent

4. monotonische Sprachen ohne prosodische Belastung

Bezogen auf das Konsonantensystem:

1. Sprachen mit Unterscheidung harter und weicher Konsonanten

2. hart/weich nur innerhalb der Dentalgruppe (Schriftslowakisch, Čechisch, Štokavisch)

3. Sprachen ohne weiche Konsonanten (z.B. LjubljanerAussprache des Slowenischen)

Page 25: Emmerich Kelih (Graz) Vokal- und Konsonanten-Anteil …homepage.univie.ac.at/emmerich.kelih/wp-content/uploads/2009... · č 2299 d 4371 e 14117 f 362 g 2374 h 1545 i 13776 j 6394

Wortlänge vs. Silbenlänge Wortlänge vs. rel. V-Anteil

Sprache a b R²Slowenisch 3,06 -0,20 0,95

Mazedonisch 2,82 -0,18 0,92Russisch 3,23 -0,24 0,98

Tschechisch 2,99 -0,21 0,97

Sprache c d R²Slowenisch 0,33 0,19 0,95

Mazedonisch 0,35 0,18 0,92Russisch 0,31 0,23 0,98

Tschechisch 0,33 0,20 0,97

y = -0,0809x + 0,5744

R2 = 0,9919

0,25

0,27

0,29

0,31

0,33

0,35

0,37

2,70 2,80 2,90 3,00 3,10 3,20 3,30

Parameter a

Par

amet

er c

� Zusammenhang von rel. Vokalhäufigkeit und Silbenlänge !

� sprachübergreifende Gültigkeit !