Statistische Tests in der...

52
1/52 Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin [email protected] SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60 22765 Hamburg März 2007

Transcript of Statistische Tests in der...

Page 1: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

1/52

Statistische Tests in der Mehrsprachigkeitsforschung

Aufgaben, Anforderungen, Probleme.

Florian Frötscher und Demet Özç[email protected]

SFB 538 MehrsprachigkeitMax-Brauer-Allee 60

22765 Hamburg

März 2007

Page 2: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

2/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Bereiche der Statistik1.2 Hypothesentestung 1.3 Variablen 1.4 Skalenniveau2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 3: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

3/52

● Deskriptive Statistik:

Methoden zur Beschreibung von Daten – Tabellen, Grafiken, einzelne Kennwerte

● Inferenzstatistik, schließende St.:

Überprüfung der Richtigkeit von formulierten Hypothesen aufgrund von empirischen Daten

● Explorative Statistik:

(oft auch als Teil der Inferenzst. gesehen)

1 – GRUNDBEGRIFFE

1.1 Bereiche der Statistik

Page 4: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

4/52

H1: Forschungshypothese

H0: Nullhypothese

H0: Nullhypothese

H1: Forschungshypothese = Alternativhypothese

1.2 Hypothesentestung

1 – GRUNDBEGRIFFE

Page 5: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

5/52

Signifikanz

Die Unterschiede oder Zusammenhänge in einer Untersuchung können als signifikant bezeichnet werden, wenn sie nur mit einer gewissen maximalen Wahrscheinlichkeit (als Signifikanzniveau, meist 5%, festgelegt) zufällig zustande gekommen sein können

aber: S. ist von verschiedenen Einflussfaktoren abhängig

→ ist ein signifikantes Ergebnis auch inhaltlich relevant?

1.2 Hypothesentestung

1 – GRUNDBEGRIFFE

Page 6: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

6/52

unabhängige Variable (uV)

– Prädiktor, erklärende Variable

abhängige Variable (aV)

– Kriterium, Zielvariable

In einem Experiment wird untersucht, wie sich systematisch variierte uV auf die Ausprägungen der aV auswirken.

1.3 Variablen

1 – GRUNDBEGRIFFE

Page 7: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

7/52

Warum eigentlich ein Skalen- oder Messniveau?

„Messen“ ist die Zuordnung von Symbolen (Zahlen) zu beobachtbaren Merkmalen von Objekten nach definierten Regeln.

Wie werden beobachtete Zusammenhänge abgebildet?

Welche Beziehungen bestehen zwischen den Ausprägungen der entstandenen Variablen?

Welche Operationen und Aussagen sind mit der Variablen möglich?

1.4 Skalenniveau

1 – GRUNDBEGRIFFE

Page 8: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

8/52

Qualitative Daten - Kategorial

Nominalskala:

unterschiedliche Zahlen sind unterschiedliche Merkmalsausprägungen

Beispiel: Geschlecht, Nationalitäten

zugelassene Operationen: Häufigkeiten auszählen und vergleichen; keine direkten „mehr-weniger“ Aussagen möglich, keine Mittelwerte o.ä.

1.4 Skalenniveau

1 – GRUNDBEGRIFFE

Page 9: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

9/52

Quantitative Daten - Kategorial

Ordinalskala:

Zahlen drücken eine Rangfolge aus, ohne Aussage über Abstände zwischen den Ausprägungen

Beispiel: Präferenzreihenfolge, Zieleinlauf

zugelassene Operationen: Median, „größer-kleiner“ Aussagen möglich, keine Mittelwerte

1.4 Skalenniveau

1 – GRUNDBEGRIFFE

Page 10: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

10/52

Quantitative Daten - Kardinalskalen

Intervallskala:

Wie Ordinalskala, nur dass sich die Abstände zwischen den Klassen begründen lassen

Beispiel: Temperatur in Celsius, IQ-Werte

zugelassene Operationen: zusätzlich Mittelwerte, Streuungen

1.4 Skalenniveau

1 – GRUNDBEGRIFFE

Page 11: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

11/52

Quantitative Daten - Kardinalskalen

Verhältnisskala:

Wie Intervallskala, zusätzlich natürlicher Nullpunkt

Beispiel: cgs-System

zugelassene Operationen: z.B. „doppelt so...“, „halb so...“

1.4 Skalenniveau

1 – GRUNDBEGRIFFE

Page 12: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

12/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Bereiche der Statistik1.2 Hypothesentestung 1.3 Variablen 1.4 Skalenniveau2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 13: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

13/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Bereiche der Statistik1.2 Hypothesentestung 1.3 Variablen 1.4 Skalenniveau2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 14: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

14/52

Forschungsfrage

» statistische Fragestellung

+ Daten

___________________________________________________

geeignetes statistisches Verfahren

2 – STATISTISCHE VERFAHREN

2. Statistische Verfahren

Page 15: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

15/52

Überblick über einige statistische Verfahren:

der statistische Entscheidungsbaum

(nach Universität Bern

http://www.vislab.ch/Lehre/EST/est.html)

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 16: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

16/52

Page 17: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

17/52

Page 18: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

18/52

Eine Auswahl der zu beurteilenden Fragen:

Hypothesen prüfen oder Hypothesen entdecken?

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 19: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

19/52

Eine Auswahl der zu beurteilenden Fragen:

Hypothesen prüfen oder Hypothesen entdecken?

● Unterschiede oder Zusammenhänge? ● Unterschiede in… (zentraler Tendenz, Häufigkeiten,…)? ● Anzahl (und Stufen) der Variablen (uV/aV)?● Skalenniveau der Variablen?● Größe der Stichprobe?

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 20: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

20/52

Eine Auswahl der zu beurteilenden Fragen:

Hypothesen prüfen oder Hypothesen entdecken?

● Unterschiede oder Zusammenhänge? ● Unterschiede in… (zentraler Tendenz, Häufigkeiten,…)? ● Anzahl (und Stufen) der Variablen (uV/aV)?● Skalenniveau der aV?

● Größe der Stichprobe?

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 21: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

21/52

Page 22: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

22/52

Eine Auswahl der zu beurteilenden Fragen:

Hypothesen prüfen oder Hypothesen entdecken?

● mehrere mindestens intervallskalierte Variablen können mit Hilfe von Faktoren- und Reliabilitätsanalyse gebündelt und reduziert werden

● Ähnlichkeiten (Distanzen) zwischen Objekten und Personen können mittels Clusteranalyse in Gruppen gebündelt werden

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 23: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

23/52

Wichtig: Testvoraussetzungen beachten

Sonst ist Interpretation der Ergebnisse nicht sinnvoll und nicht zulässig

Viele linguistische Daten sind für die geläufigen statistischen Verfahren nicht geeignet.

2.1 Entscheidungsbaum

2 – STATISTISCHE VERFAHREN

Page 24: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

24/52

Problem: Existierende Übersichten...● beinhalten nicht Verfahren, die für den

linguistischen Bereich weiter entwickelt wurden ● sind nicht wirklich übersichtlich● sind statisch, nicht erweiterbar● sind schwer verständlich

2 – STATISTISCHE VERFAHREN

2.1 Entscheidungsbaum

Page 25: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

25/52

Projektbereichsübergreifendes Arbeitsprojekt (Pbü-Projekt):

Quantitative Methoden in der Mehrsprachigkeit

2 – STATISTISCHE VERFAHREN

2.2 QMwiki

Page 26: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

26/52

Ziel / Inhalte:

Systematisierende Darstellung unterschiedlicher mathematischer Verfahren

• Anwendungsfeld• Anwendungsvoraussetzungen• Ggf. Softwarewerkzeuge• Linguistische Beispiele und Beispielstudien

2 – STATISTISCHE VERFAHREN

2.2 QMwiki

Page 27: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

27/52

Darstellungsmedium: Web/Wiki

● Leichte Online-Verfügbarkeit

● Hypertext-Technik: Flexible Darstellungsform für vernetzte Inhalte / Baumstrukturen

● Leichte und langfristige Bearbeitung im Team möglich

2 – STATISTISCHE VERFAHREN

2.2 QMwiki

Page 28: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

28/52

Stand der Arbeit:

● Wiki-Grundgerüst angelegt mit einigen speziellen Erweiterungen zur Darstellung der Baumstruktur

● Wichtigste grundlegende Verfahren mit Entscheidungswegen eingefügt

● Beschreibungen und Beispiele müssen noch vervollständigt werden

● im Laufe dieses Jahres soll das Wiki breiter nutzbar sein

2 – STATISTISCHE VERFAHREN

2.2 QMwiki

Page 29: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

29/52

Page 30: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

30/52

2 – STATISTISCHE VERFAHREN

2.2 QMwiki

Page 31: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

31/52

Page 32: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

32/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Bereiche der Statistik1.2 Hypothesentestung 1.3 Variablen 1.4 Skalenniveau2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 33: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

33/52

1. Erklärung einiger Grundbegriffe1.1 Bereiche der Statistik1.2 Hypothesentestung 1.3 Variablen 1.4 Skalenniveau2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen

Daten

0 - ÜBERBLICK

Überblick

Page 34: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

34/52

Ein Beispiel (G. Doetjes)

● Sprachverständnis zwischen Schweden und Dänen und Effekte 9 Varianten sprecherseitiger Anpassungen

● Ca. 450 Probanden aufgeteilt in 2x9 Gruppen verschiedener Anpassungsbedingungen

● Ergebnisse eines Textverständnistests

3 - BEISPIEL

3 . Beispiel

Page 35: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

35/52

● 2 uVs uV1: L1, 2-fach gestuft

uV2: Sprachbedingung, 9-fach gestuft

● 1 aV Textverständnistest, verhältnisskaliert

● Hypothese: Unterschied

3 - BEISPIEL

3 . Beispiel

Page 36: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

36/52

Page 37: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

37/52

Page 38: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

38/52

Page 39: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

39/52

Page 40: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

40/52

Page 41: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

41/52

Page 42: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

42/52

Page 43: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

43/52

3 - BEISPIEL

3 . Beispiel: Auswertung

Page 44: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

44/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Hypothesentestung1.2 Signifikanz1.3 Skalenniveau1.4 Variablen2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 45: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

45/52

0 - ÜBERBLICK

Überblick

1. Erklärung einiger Grundbegriffe1.1 Hypothesentestung1.2 Signifikanz1.3 Skalenniveau1.4 Variablen2. Statistische Verfahren2.1 Entscheidungsbäume2.2 QMwiki3. Ein Beispiel 4. Schwierigkeiten bei linguistischen Daten

Page 46: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

46/52

4. Linguistische Daten

Warum Schwierigkeiten?

● Daten von sehr wenigen Personen

● Korpusdaten mit vielen seltenen und wenigen häufigen Variablen

» besondere Verfahren nötig

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 47: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

47/52

4. Beispiel Korpusdaten

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 48: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

48/52

4. Beispiel Korpusdaten

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 49: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

49/52

Aufgabenstellung statistisch gesehen:

(a) Gruppen von Fällen (Sätzen) zu finden, die sich in der englischen Version bedeutsam voneinander unterscheiden, und zu untersuchen, ob sich diese Gruppen im Deutschen ebenfalls unterscheiden.

Bzw. stellt sich die Frage, ob es

(b) ein multivariates Verfahren gibt, das diese Abhängigkeit mehrerer kategorialer aVs von mehreren kategorialen uVs abbilden kann.

4. Beispiel Korpusdaten

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 50: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

50/52

Spezielle Probleme:

● Große Anzahl von Variablen, die eine sehr geringe Auftrittshäufigkeit haben

● Hierarchische Abhängigkeit einzelner Variablen untereinander

● Naheliegende Verfahren können nicht ohne weiteres angewendet werden (Clusteranalyse, Faktorenanalyse)

4. Beispiel Korpusdaten

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 51: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

51/52

Noch einige ungelöste Aufgaben –

Recherche nach Verfahren, die auf diese Art von Daten und linguistische Fragestellungen spezialisiert sind

AnswerTree

Logit-Loglineare Modelle

Hauptkomponentenanalyse für kategoriale Daten

Variable Rules Analysis (GoldVarb, R-Varb)

Randomization Tests (Trotter)

4. Linguistische Daten

4 – SCHWIERIGKEITEN BEI LINGUISTISCHEN DATEN

Page 52: Statistische Tests in der Mehrsprachigkeitsforschungfedora.clarin-d.uni-saarland.de/croco-gecco/croco/froetscher.pdfStatistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen,

52/52

q.e.d.