Streuung
description
Transcript of Streuung
1
Streuung
• Bezeichnung
Streuung=Dispersion=Variabilität
• Fragestellung:
• Wie heterogen sind die Daten?• Wie weit weichen Merkmale von den Mittelwerten ab?
• Zweck der Berechnung
• Der Mittelwert/ Zentralwert ist zur Charakterisierung der Daten nicht ausreichend. Man will auch wissen, wie stark die Daten von der Mitte abweichen.
• Die Streuung ist ein Maß für die Abweichung.
• Beispiel: Altersangabe für 2 Arbeitsgruppen
Gruppe2: 27, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35
Gruppe1: 21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
2
Häufigkeitsverteilungen mit unterschiedlicher Streuung und gleichem Mittelwert
Merkmalsausprägungen
Häu
fig
keit
geringe Streuung
mittlere Streuung
große Streuung
3
Streuung(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
4
Spannweite(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
5
Streuungsmaß1Spannweite (Variationsbreite)
Definition:
Spannweite = Abstand zwischen
• dem minimalen und
• dem maximalen Merkmalswert xmax –xmin
• Beispiel: Zensuren: 1,1,2,2,2,2,5Spannweite = 5-1 = 4
• Nachteil
– empfindlich gegen Ausreißer
– nicht anwendbar bei offenen Klassen
6
Spannweite bei Klassen
• Spannweite bei Klassen
= Abstand zwischen
• der Untergrenze der untersten Klasse• der Obergrenze der obersten Klasse
• Problem
– Man muss alle Klassen vorher schließen
7
Mittlerer Quartilsabstand(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
Q1=29
Q3=33
MQ =(33-29) /2 =2
Q1=37
Q3=25
MQ =(37-25) /2 =6
8
• Quartilsabstand
= Abstand zwischen
• dem untersten und • dem obersten Quartil Q3-Q1
• Semiquartilsabstand (=mittlerer Quartilsabstand=MQA=MQ)
= mittlere Abweichung vom Zentralwert
Streuungsmaß 2Quartilsabstände
21Q3Q
2
)1Q(ZZ)3(Q
9
• Semiquartilsabstand (mittlerer Quartilsabstand=MQA,=MQ)
= mittlere Abweichung vom Zentralwert (Q3-Q1)/2
• Zeichnung: Whisker-Box-Plot (nicht klausurrelevant)
Quartilsabstand: Zeichnung
Z
Q1 Q3
Quartilsabstand
halber Quartilsabstand
10
• Mittlerer Quartilsabstand(MQM)
• ½(Q1-Q3)
– Beispiel:
Quartilsabstand: Beispiel
Merkmale 1 2 3 4 5 6 7 8
Häufigkeit 1 1 3 5 1 4 2 3
Z=4Q1=3 Q3=6
MQM=3
11
Quartilsabstand und die Gestalt der Verteilung
• linkssteil (Streuung vorwiegend nach rechts)
• rechtssteil (Streuung vorwiegend nach links)
• symmetrisch
2
31 QQZ
2
31 QQZ
2
31 QQZ
13
1
ZQ
QZ
13
1
ZQ
QZ
13
1
ZQ
QZ
12
Quartilsabstand und die Gestalt der Verteilung
• linkssteil (Streuung vorwiegend nach rechts)
2
31 QQZ
05
101520
2530
3540
10 11 12 13 14
x n
10 40
11 20
12 14
13 13
14 13
ZQQZ 31
13
Quartilsabstand:Problemfälle
• Behandlung von Ausreißern
– Werte, die von den Rändern der Box weit entfernt sind, werden nicht berücksichtigt.
– Weit heißt: 2/3 der Boxbreite
Z=4Q1=3 Q3=6
MQM=3/2vernachlässigbare Werte
14
Mittlere absolute Abweichung(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45
=x
Mittelwert=31
x Abstand vom Mittelwert
21 21-31 = --10
22 22-31= --9
....
40 40-31 = 9
41 41-31= 10
15
Mittlere absolute Abweichung(Abstände zum Mittelwert ermitteln)
Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31
x Abstand von x zum Mittelwert xi-
absoluter Abstand| xi- |
21 -10 10
24 -7 7
26 -5 5
31 0 0
36 5 5
38 7 7
41 10 10
16
Mittlere absolute Abweichung(durchschnittlichen Abstand ausrechnen)
Alter, Gruppe1 :vereinfachtes Beispiel: 21, 24, 26, 31, 36, 38, 41Mittelwert =31
x Abstand von x zum Mittelwert xi-
absoluter Abstand| xi- |
21 -10 10
24 -7 7
26 -5 5
31 0 0
36 5 5
38 7 7
41 10 10
Summe =44Durchschnittlicher Abstand =44/7=6,2857
17
quadratische Abweichung vom Mittelwert(Beispiel)Alter:21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
-10 10 30 50 70 90
31
32
33
36
38
38
40
41
18
quadratische Abweichung vom Mittelwert(Abstände)Alter:21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41
-10 10 30 50 70 90
31
32
33
36
38
38
40
41
Mittelwert=31
x Abstand vom Mittelwert
Quadrat
21 21-31 = --10 100
22 22-31= --9 81
.... ... ...
40 40-31 = 9 81
41 41-31= 10 100
19
Varianz(quadratischen Abstand zum Mittelwert ermitteln)
Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31
xi Abstand von x zum Mittelwert =xi-
quadratischer Abstand(xi- )²
21 -10 100
24 -7 49
26 -5 25
31 0 0
36 5 25
38 7 49
41 10 100
20
Varianz(Durchschnitt bilden)
Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31
x Abstand von x zum Mittelwert
xi-
quadratischer Abstand
(xi- )²
21 -10 100
24 -7 49
26 -5 25
31 0 0
36 5 25
38 7 49
41 10 100
Summe =348
Durchschnittlicher quadratischer Abstand
= 348/7 = 49,28