Einführung in die Datenanalyse
-
Upload
daria-murphy -
Category
Documents
-
view
46 -
download
2
description
Transcript of Einführung in die Datenanalyse
Einführung in die Datenanalyse
Die DatenmatrixStruktur einer Datenmatrix
Untersuchungseinheit
Variablen
1 2 3 4 … m
1 X11 X12 X13 X14 … X1m
2 X21 X22 X23 X24 … X2m
3 X31 X32 X33 X34 … X3m
… … … … … … …
n Xn1 Xn2 Xn3 Xn4 … Xnm
X
X
X
X
XXX
X
XXX
X
Vom Fragebogen zur Datenmatrix
Vom Fragebogen zur Datenmatrix
X
X
X
X
XXX
X
XXX
X
Randauszählung bzw. univariate Analyse I: absolute Häufigkeit
Randauszählung bzw. univariate Analyse II: relative Häufigkeit
VAR00001
6 40,0 40,0 40,0
4 26,7 26,7 66,7
3 20,0 20,0 86,7
2 13,3 13,3 100,0
15 100,0 100,0
1,00 stimme sehr zu
2,00 stimme eher zu
3,00 stimmer eher nichtzu
4,00 stimme gar nicht zu
Gesamt
Gültig
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
VAR00001
6 30,0 40,0 40,0
4 20,0 26,7 66,7
3 15,0 20,0 86,7
2 10,0 13,3 100,0
15 75,0 100,0
5 25,0
20 100,0
1,00 stimme sehr zu
2,00 stimme eher zu
3,00 stimmer eher nichtzu
4,00 stimme gar nicht zu
Gesamt
Gültig
,00 keine AngabeFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Randauszählung bzw. univariate Analyse III: Häufigkeitstabellen
Beispiel für eine Tabelle mit fehlenden Werten
Lage- und Streuparameter nach Skalenniveau
Skalenniveau nominal ordinal intervall ratio
Lageparameter
Modus X X X X
Median - X X X
arithmetisches Mittel - - X X
Streuungsparameter
relativer Informationsgehalt X X X X
Interquartilsabstand - X X X
Varianz/Standardabweichung - - X X
Variationskoeffizient - - X X
• Parameter drücken Verteilung in einer einzigen Zahl aus• Lageparameter: was ist der typische Wert der Verteilung?• Streuparameter: wie typisch ist dieser Wert für die Verteilung?
• Modus: die häufigste Merkmalsausprägung
• Median: teilt eine der Größe nach geordnete Reihe in zwei Hälften
– ungerade Fallzahl:
– gerade Fallzahl:
• arithmetisches Mittel:
– ungruppierte Daten:
– gruppierte Daten:
2
1~
nxx
2~ 1
22
nn xxx
n
xx
n
ii
1
n
fxx
kx
n
kk )(
1
Lageparametermaxxxh h
(bei mehrfach vorkommenden Messwerten)
• relativer Informationsgehalt:
• Interquartilsabstand:
• Varianz:
mittlere Summe der Abweichungsquadrate aller Messwerte vom arithmetischen Mittel
• Standardabweichung:
n
xxs
n
ii
1
2
2
)(
Streuparameter
n
xxss
n
ii
1
2
2
)(
k
i ii ffH
1
1lg
13 QQQ
Beispiel: Lage- und Streuparameter
Subgruppen- oder bivariate Analyse: Kreuztabelle
VAR00004 Parteimitglied * VAR00003 SES Kreuztabelle
5 4 1 1 0 11
83,3% 66,7% 50,0% 25,0% ,0% 55,0%
1 2 1 3 2 9
16,7% 33,3% 50,0% 75,0% 100,0% 45,0%
6 6 2 4 2 20
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Anzahl
% von VAR00003 SES
Anzahl
% von VAR00003 SES
Anzahl
% von VAR00003 SES
,00 nein
1,00 ja
VAR00004 Parteimitglied
Gesamt
1,00 2,00 3,00 4,00 5,00
VAR00003 SES
Gesamt
Subgruppen- oder bivariate Analyse III: Mittelwertvergleich