Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median
description
Transcript of Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median
Wiederholung (Kap. 2: Beschreibende Statistik)
2.4.2 MedianEine gegebene Liste von n Messwerten sei der Größe nach angeordnet:
X = { x1 x2 …. xn }Der Median ist der (evtl. gemittelte) Wert “in der Listen-Mitte” x_med = x k mit k = [n/2] +1 falls n ungerade
= (x k + x k+1)/2 mit k = n/2 falls n gerade
Bsp a: Bsp b: X = { 3 3 4 6 } X = { 3 3 3 3 3 4 6 } x_med = 3.5 x_med = 3Hier: Links und rechts von 3.5 liegen …hier liegen auch links und rechts genau so viele Werte, der “3 in der Listen-Mitte” genau so viele Werte, die kleiner bzw. größer sind aber die Werte können auch gleich 3 sein!!!
Bemerkung: Die Werte können auch rein ordinal sein: Bsp c: (Schmetterlinge)
Werte (Insekten-Stadien)
Anzahlen
Gesamtzahl: n = 29, k = [n/2]+1 = 15, x_med = Larve 1, denn x 15 hat den Wert: “Larve 1”
Für eine reele Zahl z bezeichnet die “Gauss-Klammer” k = [z] die kleinste ganze Zahl k z.Beispiel: [3.75] = 3
Ei Larve 1 Larve 2 Puppe Adult
10 5 7 3 4
0 1 2 3 4 5 6 7 80
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5 6 7 80
2
4
6
8
10
12
14
16
18
20
Schwalbenpositionen X = [1 3 4 7]
q = 1 Blaue Punkte:
Position y = y(t)einer zusätzlichenSchwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“
Grüne Kurve:
SUM1 (y)
0 1 2 3 4 5 6 7 80
20
40
60
80
100
120
140
160
180
0 1 2 3 4 5 6 7 80
20
40
60
80
100
120
140
160
180
Schwalbenpositionen X = [1 1 2 3 4 7]
q = 2
SUM = Summe der quadratischen Abstände von einem Punkt y zu den (roten) Positionen
y
Blaue Punkte:
Position y = y(t)einer zusätzlichenSchwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“
Grüne Kurve:
SUM2 (y)
0 1 2 3 4 5 6 7 80
1
2
3
4
5
0 1 2 3 4 5 6 7 80
0.2
0.4
0.6
0.8
1
x
F(x
)
Empirical CDF
Neue Form der beschreibenden Darstellung von Daten
2.4.3 Kumulatives Häufigkeitsdiagramm
Bsp: X = [ 1 1 2 3 4 7 ]
Der Median ist x_med = 2.5 (rot)
Die empirische (kumulative)Verteilungsfunktion ist die Kumulative Häufigkeitauf 1 normiert: F(x) = KH(x) / nDiese bezeichnet die relative Häufigkeit von Daten mit Werten x
Beispiel: F(5) = 0.83 = 5/6 dh.: Unterhalb von 5 (magenta) liegen 5/6 aller Werte !
0 500 1000 1500 2000 2500 30000
1
2
3
4x 10
-3
Standardabweichung: s = 453.9892 --- Schiefe: gamma = 0.22856
Mittwelwert
Median
0 500 1000 1500 2000 2500 30000
0.2
0.4
0.6
0.8
1
Flugweite [m]
F(x
)
Empirical CDF
Haufigkeitsdiagramme der Ausflugweiten von Schmetterlingen
P-Quantileder Datenreihe X = { 3 3 3 4 7}
¼ - ¾ Interquantil
P = [0.25 0.75] (blue)
P = 0.60 - QuantilLinie bei (1 + P*(n-1)) / n (magenta)
0 1 2 3 4 5 6 7 80
1
2
3
4
5
0 1 2 3 4 5 6 7 80
0.2
0.4
0.6
0.8
1
x
F(x
)
Empirical CDF
Boxplot
erstellt von15 Datenwerten X1, ...... Xn, welche um den Mittelwert m = 11.2 (schwarz) herum streuen mitStandardabweichung S = 3.67 [m – S, m + S] (schwarzer Balken)Der Median ist x_med = 10.0 (rot)
P = 0.20 – Quantil xP = 8.1 (magenta)Dh. die unteren 20 % der Werte liegen im Bereich bis 8.1
0 2 4 6 8 10 12 14 16 18 20
1
Values
Colu
mn N
um
ber
0 2 4 6 8 10 12 14 16 18 200
0.2
0.4
0.6
0.8
1
0 2 4 6 8 10 12 14 16 18 200
0.2
0.4
0.6
0.8
1
x
F(x
)
Empirical CDF
0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65-2
0
2
4
6
8
10
Mittelwert Median
Standardabweichung1/4-3/4-Interquantil
1/6-5/6-Interquantil
0.3 0.35 0.4 0.45 0.5 0.55 0.6
1
Values
Colum
n N
um
ber
Erststimmen -Daten
320 338 356 374 392 410 428 446 464 482 500 518 5360
0.002
0.004
0.006
0.008
0.01Juvenile Fische
350 400 450 500 5500
0.005
0.01
0.015
0.02
0.025Adulte Fische (in Flüssen und im Meer)
Körperlänge der Weibchen [mm]
Unimodale Verteilung der Körperlängen in der Lachszucht (Canadische Küste)
Bimodale Verteilung der Körperlängen nach Auswanderung (kleinere in Flüssen, größere in der Meeresbucht)
350 400 450 500 5500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Körperlängen [mm] --- xmed = 447.3149 --- xmean = 442.5403
F(x
)
Empirical CDF
Entsprechende Kumulative Verteilungsfunktionen: Unimodal (blau) und Bimodal (rot)