Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median

10
Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median Eine gegebene Liste von n Messwerten sei der Größe nach angeordnet: X = { x1 x2 …. xn } Der Median ist der (evtl. gemittelte) Wert “in der Listen-Mitte” x_med = x k mit k = [n/2] +1 falls n ungerade = (x k + x k+1 )/2 mit k = n/2 falls n gerade Bsp a: Bsp b: X = { 3 3 4 6 } X = { 3 3 3 3 3 4 6 } x_med = 3.5 x_med = 3 Hier: Links und rechts von 3.5 liegen …hier liegen auch links und rechts genau so viele Werte, der “3 in der Listen-Mitte” genau so viele Werte, die kleiner bzw. größer sind aber die Werte können auch gleich 3 sein!!! Bemerkung: Die Werte können auch rein ordinal sein: Bsp c: (Schmetterlinge) Werte (Insekten-Stadien) e reele Zahl z bezeichnet die “Gauss-Klammer” k = [z] die kleinste ganze Zahl k z. l: [3.75] = 3 Ei Larve 1 Larve 2 Puppe Adult 10 5 7 3 4

description

Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median Eine gegebene Liste von n Messwerten sei der Größe nach angeordnet: X = { x1  x2  ….  xn } Der Median ist der (evtl. gemittelte) Wert “in der Listen-Mitte” - PowerPoint PPT Presentation

Transcript of Wiederholung (Kap. 2: Beschreibende Statistik) 2.4.2 Median

Page 1: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

Wiederholung (Kap. 2: Beschreibende Statistik)

2.4.2 MedianEine gegebene Liste von n Messwerten sei der Größe nach angeordnet:

X = { x1 x2 …. xn }Der Median ist der (evtl. gemittelte) Wert “in der Listen-Mitte” x_med = x k mit k = [n/2] +1 falls n ungerade

= (x k + x k+1)/2 mit k = n/2 falls n gerade

Bsp a: Bsp b: X = { 3 3 4 6 } X = { 3 3 3 3 3 4 6 } x_med = 3.5 x_med = 3Hier: Links und rechts von 3.5 liegen …hier liegen auch links und rechts genau so viele Werte, der “3 in der Listen-Mitte” genau so viele Werte, die kleiner bzw. größer sind aber die Werte können auch gleich 3 sein!!!

Bemerkung: Die Werte können auch rein ordinal sein: Bsp c: (Schmetterlinge)

Werte (Insekten-Stadien)

Anzahlen

Gesamtzahl: n = 29, k = [n/2]+1 = 15, x_med = Larve 1, denn x 15 hat den Wert: “Larve 1”

Für eine reele Zahl z bezeichnet die “Gauss-Klammer” k = [z] die kleinste ganze Zahl k z.Beispiel: [3.75] = 3

Ei Larve 1 Larve 2 Puppe Adult

10 5 7 3 4

Page 2: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

0 1 2 3 4 5 6 7 80

2

4

6

8

10

12

14

16

18

0 1 2 3 4 5 6 7 80

2

4

6

8

10

12

14

16

18

20

Schwalbenpositionen X = [1 3 4 7]

q = 1 Blaue Punkte:

Position y = y(t)einer zusätzlichenSchwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“

Grüne Kurve:

SUM1 (y)

Page 3: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

0 1 2 3 4 5 6 7 80

20

40

60

80

100

120

140

160

180

0 1 2 3 4 5 6 7 80

20

40

60

80

100

120

140

160

180

Schwalbenpositionen X = [1 1 2 3 4 7]

q = 2

SUM = Summe der quadratischen Abstände von einem Punkt y zu den (roten) Positionen

y

Blaue Punkte:

Position y = y(t)einer zusätzlichenSchwalbe während ihrer dynamischen Gradienten-Suche nach der Minimum-Position = „Mitte“

Grüne Kurve:

SUM2 (y)

Page 4: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

0 1 2 3 4 5 6 7 80

1

2

3

4

5

0 1 2 3 4 5 6 7 80

0.2

0.4

0.6

0.8

1

x

F(x

)

Empirical CDF

Neue Form der beschreibenden Darstellung von Daten

2.4.3 Kumulatives Häufigkeitsdiagramm

Bsp: X = [ 1 1 2 3 4 7 ]

Der Median ist x_med = 2.5 (rot)

Die empirische (kumulative)Verteilungsfunktion ist die Kumulative Häufigkeitauf 1 normiert: F(x) = KH(x) / nDiese bezeichnet die relative Häufigkeit von Daten mit Werten x

Beispiel: F(5) = 0.83 = 5/6 dh.: Unterhalb von 5 (magenta) liegen 5/6 aller Werte !

Page 5: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

0 500 1000 1500 2000 2500 30000

1

2

3

4x 10

-3

Standardabweichung: s = 453.9892 --- Schiefe: gamma = 0.22856

Mittwelwert

Median

0 500 1000 1500 2000 2500 30000

0.2

0.4

0.6

0.8

1

Flugweite [m]

F(x

)

Empirical CDF

Haufigkeitsdiagramme der Ausflugweiten von Schmetterlingen

Page 6: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

P-Quantileder Datenreihe X = { 3 3 3 4 7}

¼ - ¾ Interquantil

P = [0.25 0.75] (blue)

P = 0.60 - QuantilLinie bei (1 + P*(n-1)) / n (magenta)

0 1 2 3 4 5 6 7 80

1

2

3

4

5

0 1 2 3 4 5 6 7 80

0.2

0.4

0.6

0.8

1

x

F(x

)

Empirical CDF

Page 7: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

Boxplot

erstellt von15 Datenwerten X1, ...... Xn, welche um den Mittelwert m = 11.2 (schwarz) herum streuen mitStandardabweichung S = 3.67 [m – S, m + S] (schwarzer Balken)Der Median ist x_med = 10.0 (rot)

P = 0.20 – Quantil xP = 8.1 (magenta)Dh. die unteren 20 % der Werte liegen im Bereich bis 8.1

0 2 4 6 8 10 12 14 16 18 20

1

Values

Colu

mn N

um

ber

0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

x

F(x

)

Empirical CDF

Page 8: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65-2

0

2

4

6

8

10

Mittelwert Median

Standardabweichung1/4-3/4-Interquantil

1/6-5/6-Interquantil

0.3 0.35 0.4 0.45 0.5 0.55 0.6

1

Values

Colum

n N

um

ber

Erststimmen -Daten

Page 9: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

320 338 356 374 392 410 428 446 464 482 500 518 5360

0.002

0.004

0.006

0.008

0.01Juvenile Fische

350 400 450 500 5500

0.005

0.01

0.015

0.02

0.025Adulte Fische (in Flüssen und im Meer)

Körperlänge der Weibchen [mm]

Unimodale Verteilung der Körperlängen in der Lachszucht (Canadische Küste)

Bimodale Verteilung der Körperlängen nach Auswanderung (kleinere in Flüssen, größere in der Meeresbucht)

Page 10: Wiederholung  (Kap. 2: Beschreibende Statistik) 2.4.2  Median

350 400 450 500 5500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Körperlängen [mm] --- xmed = 447.3149 --- xmean = 442.5403

F(x

)

Empirical CDF

Entsprechende Kumulative Verteilungsfunktionen: Unimodal (blau) und Bimodal (rot)