09.12.13 1

17
09.12.13 1 VL Methodenlehre I WS13/14 Schäfer DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen VL Methodenlehre I WS13/14 Schäfer Standardisierung von Daten z-Standardisierung Standardnormalverteilung

Transcript of 09.12.13 1

Page 1: 09.12.13 1

09.12.13  

1  

VL Methodenlehre I WS13/14 Schäfer

DAS THEMA: TABELLEN UND ABBILDUNGEN •  Standardisierung von Daten •  Darstellung von Daten in Texten,

Tabellen und Abbildungen

VL Methodenlehre I WS13/14 Schäfer

Standardisierung von Daten •  z-Standardisierung •  Standardnormalverteilung

Page 2: 09.12.13 1

09.12.13  

2  

•  Ausgangspunkt: einzelne Messwerte und Kennwerte lassen sich schwer

vergleichen, wenn sie von verschiedenen Messinstrumenten stammen

•  Beispiel: Tim hat im Abitur in Bayern 620 Punkte, Mia im Abitur in

Sachsen 640 Punkte à ist Mia wirklich besser, wenn wir wissen, dass

das Abitur in Sachsen etwas leichter war?

•  Lösung: Daten auf eine einheitliche Skala transformieren

•  eine Transformation berücksichtigt immer Lage und Streuung von

Verteilungen

•  bei der z-Transformation bekommt jede Person einen neuen Wert

zugewiesen, der nun vergleichbar (standardisiert) ist:

DIE Z-STANDARDISIERUNG

VL Methodenlehre I WS13/14 Schäfer

z-­‐Wert  absolute  Differenz  zum  Mi:el  rela&viert  an  der  Streuung  

•  z-Werte bilden eine standardisierte Skala

•  sie haben immer einen Mittelwert von 0 und eine SD von 1

•  die Verteilung der z-Werte sieht daher immer gleich aus

•  sind die Rohwerte normalverteilt, ergibt die z-Verteilung eine

Standardnormalverteilung:

DIE STANDARDNORMALVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

Standardabweichung    

Prozente    

z-­‐Werte  

Page 3: 09.12.13 1

09.12.13  

3  

•  jedem z-Wert kann ein bestimmter Flächenanteil der SNV zugeordnet

werden

•  der Flächenanteil entspricht der Auftretenswahrscheinlichkeit für diesen

Wert und alle kleineren Werte

zurück zum Beispiel – wir brauchen M und SD der beiden Bundesländer:

und können dann die z-Werte bestimmen:

à beide sind überdurchschnittlich

à Tim hat aber – im standardisierten Vergleich – die bessere Leistung

erreicht

DIE STANDARDNORMALVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

à wenn der z-Wert von Tim etwa 75% der Fläche der Verteilung

abschneidet, heißt das, dass nur etwa 25% aller Schüler besser waren als er

DIE STANDARDNORMALVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

Mia                Tim  

Page 4: 09.12.13 1

09.12.13  

4  

•  neben der z-Standardisierung gibt es weitere Standardisierungs-

Möglichkeiten à so entstehen entsprechend andere Verteilungen

•  auch die IQ-Verteilung ist eine standardisierte Verteilung mit M = 100

und SD = 15

DIE STANDARDNORMALVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

VL Methodenlehre I WS13/14 Schäfer

Darstellung von Daten in Texten, Tabellen und Abbildungen •  Texte und Tabellen •  Abbildungen

Page 5: 09.12.13 1

09.12.13  

5  

•  wenige deskriptive Daten lassen sich gut im Fließtext beschreiben

•  liegen mehr Daten vor, bietet sich eine übersichtliche Darstellung in

Tabellen an

•  auch hier werden Lage- und Streuungsmaße angegeben

•  in Manuskripten werden Tabellen nach APA-Richtlinien formatiert:

TEXTE UND TABELLEN

VL Methodenlehre I WS13/14 Schäfer

MusiksFl   M   SD  

Klassik   2,9   1,1  

Rock   4,1   0,8  

Rap   3,3   1,2  

TEXTE UND TABELLEN

VL Methodenlehre I WS13/14 Schäfer

Page 6: 09.12.13 1

09.12.13  

6  

•  auch in Abbildungen sollten Lage- und Streuungsmaße enthalten sein

ABBILDUNGEN

VL Methodenlehre I WS13/14 Schäfer

ABBILDUNGEN

VL Methodenlehre I WS13/14 Schäfer

Page 7: 09.12.13 1

09.12.13  

7  

alternative Darstellungsmöglichkeiten (siehe Inferenzstatistik):

Liniendiagramm ...mit Fehlerbalken

ABBILDUNGEN

VL Methodenlehre I WS13/14 Schäfer

mit  Standardfehlern                                      Fehlerplots  

Beginnt die Beschriftung der Y-Achse bei 0?

LÜGEN MIT ABBILDUNGEN

VL Methodenlehre I WS13/14 Schäfer

Page 8: 09.12.13 1

09.12.13  

8  

Zeigt die Y-Achse gleich große Intervalle?

LÜGEN MIT ABBILDUNGEN

VL Methodenlehre I WS13/14 Schäfer

TEIL 4: EXPLORATIVE DATENANALYSE

VL Methodenlehre I WS13/14 Schäfer

Page 9: 09.12.13 1

09.12.13  

9  

VL Methodenlehre I WS13/14 Schäfer

DAS THEMA: GRAFISCHE DATENANALYSE •  Darstellung von Verteilungen •  Darstellung von Zusammenhängen

zwischen Variablen

VL Methodenlehre I WS13/14 Schäfer

Darstellung von Verteilungen •  Boxplot •  Stamm-und-Blatt-Diagramm

Page 10: 09.12.13 1

09.12.13  

10  

•  Mittelwert und SD liefern recht idealisierte Darstellungen, da sie

symmetrisch- oder normalverteilte Daten zugrunde legen

•  für die Darstellung von Auffälligkeiten (Schiefe, Ausreißer) eignen sich

daher andere Maße besser

•  verwendet man die verzerrungs-resistenten Maße Median und IA, erhält

man ein Boxplot

BOXPLOT

VL Methodenlehre I WS13/14 Schäfer

BOXPLOT

VL Methodenlehre I WS13/14 Schäfer

     Median  IA              Whiskers  

Wo  liegen  die  Whiskers?  1.  BesFmmen  der  Zäune:  IA  x  1,5  nach  oben  und  untern  an  die  Box  antragen  2.  diejenigen  echten  Werte  suchen,  die  auf  der  Seite  der  Box  am  nächsten  dran  liegen  

IA  =  19-­‐14  =  5  IAx1,5  =  7,5  oberer  Zaun:  19+7,5  =  26,5  unterer  Zaun:  14-­‐7,5  =  6,5  oberer  Whisker:  21  unterer  Whisker:  12  

wichtige Informationen: •  Wie lang ist die Box? à Höhe der Streuung •  Wo liegt der Median innerhalb der Box? à

Symmetrie/Schiefe der Verteilung •  Liegen Werte außerhalb der Whiskers? à Ausreißer

(werden durch Sterne oder Kreise dargestellt)

Page 11: 09.12.13 1

09.12.13  

11  

BOXPLOT UND HÄUFIGKEITSVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

BOXPLOT UND HÄUFIGKEITSVERTEILUNG

VL Methodenlehre I WS13/14 Schäfer

Page 12: 09.12.13 1

09.12.13  

12  

à  bei schiefen Verteilungen liefern Boxplots wesentlich bessere Aussagen

über die Streuung als die SD

à  außerdem bleiben Ausreißer unberücksichtigt

BOXPLOT UND STANDARDABWEICHUNG

VL Methodenlehre I WS13/14 Schäfer

•  zeigt jeden einzelnen Wert einer Verteilung

•  hilft schiefe oder ungewöhnliche Verteilungen (z.B. multimodale) zu

identifizieren

STAMM-UND-BLATT-DIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

Häufigkeit  von  Werten  die  Blä:er  zeigen  die  Einerstelle  oder  die  Nachkommastelle  jeweils  für  eine  Person  

der  Stamm  zeigt  die  Dezimalstelle  oder  die  Zahl  vor  dem  Komma  

z.B.  eine  Person  mit  dem  Wert  2,3  (oder  23)  

Page 13: 09.12.13 1

09.12.13  

13  

Beispiel für ein back-to-back Stamm-und-Blatt-Diagramm

STAMM-UND-BLATT-DIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

VL Methodenlehre I WS13/14 Schäfer

Darstellung von Zusammenhängen zwischen Variablen •  Streudiagramm •  Sonnenblumendiagramm •  Bubble-Plot •  Streudiagramm-Matrix

Page 14: 09.12.13 1

09.12.13  

14  

um den Zusammenhang von Variablen zu visualisieren, kann man Werte

von Personen auf beiden Variablen in ein gemeinsames Diagramm

einzeichnen à Streudiagramm

à das Diagramm zeigt eine Punktewolke, die etwas über das

Vorhandensein und die Stärke des Zusammenhangs verrät

STREUDIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

•  je „dünner“ die Punktewolke – also je mehr sie sich um eine gedachte

Linie konzentriert – desto stärker der Zusammenhang

•  außerdem kann der Zusammenhang

positiv oder negativ sein

•  seine Größe lässt sich durch den

Korrelationskoeffizienten ausdrücken

STREUDIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

unkorreliert

schwach positiv stark positiv

schwach negativ stark negativ

Page 15: 09.12.13 1

09.12.13  

15  

•  der Zusammenhang kann auch kurvi-linear sein

STREUDIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

•  Streudiagramme können nur mit Daten ab Intervallskalenniveau

konstruiert werden

•  die Variablen können dabei auch nur 2 Ausprägungen haben (siehe

Intervallskalenniveau bei dichotomen Variablen)

STREUDIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

1  –  weiblich  2  –  männlich  

Page 16: 09.12.13 1

09.12.13  

16  

•  liegen in einem Streudiagramm viele Werte aufeinander, kann die Interpretation schwierig werden

•  Abhilfe schafft das Sonnenblumendiagramm, in dem die Anzahl

übereinander liegender Werte durch Blütenblätter dargestellt wird

à besonders sinnvoll, wenn eine der Variablen nur wenige Ausprägungen

hat

SONNENBLUMENDIAGRAMM

VL Methodenlehre I WS13/14 Schäfer

Durchschni:snote  

•  eine dritte Variable kann in Streudiagrammen eingefügt und durch die

Größe der Punkte (Bubbles) codiert werden à Bubble-Plot

BUBBLE-PLOT

VL Methodenlehre I WS13/14 Schäfer

Bubbles  =  soziale  Kompetenz  

Page 17: 09.12.13 1

09.12.13  

17  

•  der Zusammenhang mehrerer Variablen kann auch mit Hilfe mehrerer

normaler Streudiagramme in einer Matrix dargestellt werden

STREUDIAGRAMM-MATRIX

VL Methodenlehre I WS13/14 Schäfer

LITERATUR

VL Methodenlehre I WS13/14 Schäfer

•  Hussy, W., Schreier, M. & Echterhoff, G. (2010). Forschungsmethoden in

Psychologie und Sozialwissenschaften. Heidelberg: Springer.

•  Schäfer, T. (2010). Statistik I. Deskriptive und Explorative Datenanalyse.

Wiesbaden: Springer VS.

•  Sedlmeier, P. & Renkewitz, F. (2013). Forschungsmethoden und Statistik: Ein

Lehrbuch für Psychologen und Sozialwissenschaftler. München: Pearson.