Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische...

190
Ansatz der Statistik Graphische Darstellungen Statistische Kenngr¨ Statistik f ¨ ur Informatiker, SS 2019 2. Ideen aus der Statistik 2.1 Deskriptive Statistik Matthias Birkner http://www.staff.uni-mainz.de/birkner/StatInfo19/ 24.6.2019 1/94

Transcript of Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische...

Page 1: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Statistik fur Informatiker, SS 2019

2. Ideen aus der Statistik

2.1 Deskriptive Statistik

Matthias Birkner

http://www.staff.uni-mainz.de/birkner/StatInfo19/

24.6.2019

1/94

Page 2: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

2/94

Page 3: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Viele Menschen stehen ”Statistik“ kritisch gegenuber:

It is easy to lie with statistics.

It is hard to tell the truth without it.

Andrejs Dunkels (1939–1998)

3/94

Page 4: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Viele Menschen stehen ”Statistik“ kritisch gegenuber:

It is easy to lie with statistics.It is hard to tell the truth without it.

Andrejs Dunkels (1939–1998)

3/94

Page 5: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Worum geht es in der Statistik?

Die Welt ist voller Variabilitat.

Wie geht man mit variablen Daten um?

Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall

(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert

werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische

Effekte von Zufalligem zu trennen.

4/94

Page 6: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Worum geht es in der Statistik?

Die Welt ist voller Variabilitat.

Wie geht man mit variablen Daten um?

Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall

(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert

werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische

Effekte von Zufalligem zu trennen.

4/94

Page 7: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Worum geht es in der Statistik?

Die Welt ist voller Variabilitat.

Wie geht man mit variablen Daten um?

Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall

(mathematische Abstraktion) modellieren

Die Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert

werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische

Effekte von Zufalligem zu trennen.

4/94

Page 8: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Worum geht es in der Statistik?

Die Welt ist voller Variabilitat.

Wie geht man mit variablen Daten um?

Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall

(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert

werden.

Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische

Effekte von Zufalligem zu trennen.

4/94

Page 9: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Worum geht es in der Statistik?

Die Welt ist voller Variabilitat.

Wie geht man mit variablen Daten um?

Idee der Statistik:Variabilitat (Erscheinung der Natur) durch Zufall

(mathematische Abstraktion) modellierenDie Daten werden als Realisierungen von Zufallsvariablenaufgefasst, die in einem stochastischen Modell spezifiert

werden.Man versucht dann, anhand der Daten Ruckschlusse aufParameter des Modells zu ziehen, und so systematische

Effekte von Zufalligem zu trennen.4/94

Page 10: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Deskriptive (d.h. beschreibende) Statistik

Wie geht man mit variablen Daten um?

”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen

5/94

Page 11: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von Mittelwerten

Deskriptive (d.h. beschreibende) Statistik

Wie geht man mit variablen Daten um?

”0. Antwort“: Man verschafft sich einenersten Eindruck mittels graphischerDarstellungen und statistischerKenngroßen

5/94

Page 12: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

6/94

Page 13: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Ein Beispiel

Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.

Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.

Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)

2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . .

7/94

Page 14: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Ein Beispiel

Bei einer biologischen Expeditionwurden in der Nordsee Springkrebse(Galathea intermedia) gefangenund untersucht.Die Daten: Helgolander Tiefe Rinne, Fang vom 6.9.

Carapaxlange (mm):Nichteiertragende Weibchen (n = 215)

2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,03,0 2,9 3,4 2,8 2,9 2,8 2,8 2,42,8 2,5 2,7 3,0 2,9 3,2 3,1 3,02,7 2,5 3,0 2,8 2,8 2,8 2,7 3,02,6 3,0 2,9 2,8 2,9 2,9 2,3 2,72,6 2,7 2,5 . . . . .

7/94

Page 15: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

0 50 100 150 200

2.0

2.5

3.0

Stichprobe vom 6. September, n=215

Index

Car

apax

lang

e[m

m]

8/94

Page 16: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

9/94

Page 17: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Eine Moglichkeit der graphischenDarstellung:

das Histogramm

10/94

Page 18: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Histogramm der Carapaxlangen in der Stichprobe

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?

11/94

Page 19: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Histogramm der Carapaxlangen in der Stichprobe

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?11/94

Page 20: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Histogramm der Carapaxlangen in der Stichprobe

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

22

Wieviele hatten Carapaxlange zwischen 2,0 und 2,2 mm ?22

12/94

Page 21: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Analoge Daten zwei Monate spater(Stichprobe vom 3.11. der Große n = 57)

Stichprobe vom 3. November, n=57

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

05

1015

2025

13/94

Page 22: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Vergleich der beiden VerteilungenBeide Stichproben

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57

Idee: stauche vertikale Achse so, dass Gesamtflache = 1.

14/94

Page 23: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Vergleich der beiden VerteilungenBeide Stichproben

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57

Idee: stauche vertikale Achse so, dass Gesamtflache = 1.

14/94

Page 24: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Vergleich der beiden VerteilungenBeide Stichproben

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

010

2030

4050

6070

Problem: ungleiche Stichprobenumfange:6.Sept: n = 2153.Nov : n = 57

Idee: stauche vertikale Achse so, dass Gesamtflache = 1.14/94

Page 25: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

Die Gesamtflache der Balken ist nun = 1.

Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).

15/94

Page 26: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

Die Gesamtflache der Balken ist nun = 1.

Die neue vertikale Koordinate ist jetzt eine Dichte (engl.density).

15/94

Page 27: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.

Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%

16/94

Page 28: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.

Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?

Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%

16/94

Page 29: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

Gesamtflache = 1. Dichte = Anteil am Ganzen pro mm.

Welcher Anteil hatte Lange zwischen 2,8 und 3,0 mm ?Etwa (3,0 − 2,8) ⋅ 0,5 = 0,1, d.h. ca. 10%

16/94

Page 30: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Die beiden Histogramme sind jetztvergleichbar

(sie haben dieselbe Gesamtflache).

17/94

Page 31: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Die beiden Histogramme sind jetztvergleichbar

(sie haben dieselbe Gesamtflache).

17/94

Page 32: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Versuche, die Histogramme zusammen zuzeigen:

Beide Stichproben

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

2.0

2.5

18/94

Page 33: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Versuche, die Histogramme zusammen zuzeigen:

Beide Stichproben

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

2.0

2.5

19/94

Page 34: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Versuche, die Histogramme zusammen zuzeigen:

1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7

Beide Stichproben0.

00.

51.

01.

52.

0

20/94

Page 35: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Versuche, die Histogramme zusammen zuzeigen:

Beide Stichproben

1.3 1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.90

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Sept

Nov

21/94

Page 36: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Vorschlag

Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein

,

fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.

22/94

Page 37: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Vorschlag

Total abgefahrene 3D-Plots konnen in der Werbung nutzlich sein,

fur die Wissenschaft sind einfache und klare2D-Darstellungen meistens angemessener.

22/94

Page 38: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Problem

Histogramme kann man nicht ohneweiteres

in demselben Graphendarstellen,

weil sie einanderuberdecken wurden.

23/94

Page 39: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Problem

Histogramme kann man nicht ohneweiteres

in demselben Graphendarstellen,

weil sie einanderuberdecken wurden.

23/94

Page 40: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Einfache und klare Losung: Dichtepolygone

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

24/94

Page 41: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Einfache und klare Losung: Dichtepolygone

Stichprobe vom 6. September, n=215

Carapaxlange [mm]

Dic

hte

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

25/94

Page 42: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Einfache und klare Losung: Dichtepolygone

Stichprobe vom 3. November, n=57

Carapaxlange [mm]

Anz

ahl

1.5 2.0 2.5 3.0 3.5

0.0

0.5

1.0

1.5

2.0

26/94

Page 43: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Zwei (oder mehr) Dichtepolygone in einem Plot

1.5 2.0 2.5 3.0 3.5 4.0

0.0

0.5

1.0

1.5

2.0

2.5

Beide Stichproben

Carapaxlange [mm]

Dic

hte

SeptNov

Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).

27/94

Page 44: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Zwei (oder mehr) Dichtepolygone in einem Plot

1.5 2.0 2.5 3.0 3.5 4.0

0.0

0.5

1.0

1.5

2.0

2.5

Beide Stichproben

Carapaxlange [mm]

Dic

hte

SeptNov

Man sieht sofort:Die Verteilung in der Stichprobe vom November ist gegenuberder vom September nach links verschoben (und sie ist auchstarker um den haufigsten Wert konzentriert).

27/94

Page 45: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Anzahl vs. DichteA

nzah

l

0 1 2 3 4 5 6 7

02

46

8

Anz

ahl

0 1 2 3 4 5 6 7

04

8

Dic

hte

0 1 2 3 4 5 6 7

0.0

0.2

0.4

Also:

Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!

28/94

Page 46: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Anzahl vs. DichteA

nzah

l

0 1 2 3 4 5 6 7

02

46

8

Anz

ahl

0 1 2 3 4 5 6 7

04

8

Dic

hte

0 1 2 3 4 5 6 7

0.0

0.2

0.4

Also:

Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!

28/94

Page 47: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Anzahl vs. DichteA

nzah

l

0 1 2 3 4 5 6 7

02

46

8

Anz

ahl

0 1 2 3 4 5 6 7

04

8

Dic

hte

0 1 2 3 4 5 6 7

0.0

0.2

0.4

Also:

Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!

28/94

Page 48: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Anzahl vs. DichteA

nzah

l

0 1 2 3 4 5 6 7

02

46

8

Anz

ahl

0 1 2 3 4 5 6 7

04

8

Dic

hte

0 1 2 3 4 5 6 7

0.0

0.2

0.4

Also:

Bei HistogrammenmitungleichmaßigerUnterteilungimmer Dichtenverwenden!

28/94

Page 49: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

29/94

Page 50: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stripchart, einfach

Carapaxlangen in den beiden Stichproben

1.5 2.0 2.5 3.0 3.5

Sep

tN

ov

30/94

Page 51: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stripchart, mit “jitter”

Carapaxlangen in den beiden Stichproben

1.5 2.0 2.5 3.0 3.5

Sep

tN

ov

31/94

Page 52: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Stripchart, mit “stacking”

Carapaxlangen in den beiden Stichproben

1.5 2.0 2.5 3.0 3.5

Sep

tN

ov

32/94

Page 53: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Histogramme/Dichtepolygone undStripcharts

gebenein ausfuhrliches Bildeines Datensatzes.

Manchmal zu ausfuhrlich.

33/94

Page 54: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Histogramme/Dichtepolygone undStripcharts

gebenein ausfuhrliches Bildeines Datensatzes.

Manchmal zu ausfuhrlich.

33/94

Page 55: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

34/94

Page 56: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Zu viel Information erschwert den Uberblick

Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum

Wald?

35/94

Page 57: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Zu viel Information erschwert den Uberblick

Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum

Wald?

35/94

Page 58: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, einfache Ausfuhrung

0 2 4 6

x

0 2 4 6

36/94

Page 59: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, einfache Ausfuhrung

0 2 4 6

x

0 2 4 6

25% 25% 25% 25%

36/94

Page 60: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, einfache Ausfuhrung

0 2 4 6

x

0 2 4 6

25% 25% 25% 25%

Min Max1. Quartil 3. QuartilMedian

36/94

Page 61: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, Standard-Ausfuhrung

0 2 4 6

x

0 2 4 6

37/94

Page 62: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, Standard-Ausfuhrung

0 2 4 6

x

0 2 4 6

Interquartilbereich (IQR)

1.5 × IQR 1.5 × IQR

37/94

Page 63: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, Profi-Ausfuhrung

0 2 4 6

x

0 2 4 6

38/94

Page 64: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Boxplot, Profi-Ausfuhrung

0 2 4 6

x

0 2 4 6

95%-Konfidenzintervall fur den Median

38/94

Page 65: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Beispiel:Vergleich von mehreren Gruppen

39/94

Page 66: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Dic

hte

8 10 12 14

0.00

Dic

hte

8 10 12 14

0.00

Dic

hte

8 10 12 14

0.0

Dic

hte

8 10 12 14

0.0

40/94

Page 67: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

12

34

8 10 12 14

40/94

Page 68: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

41/94

Page 69: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Graphische Tricksereien

im Bereich der deskriptiven Statistik / der Kommunikationvon numerischen Beobachtungen oder Resultaten:

(Graphische) Tricksereien / ”Aufhubschen“ vonBeobachtungen, z.B.

Irrefuhrende Wahl des NullpunktsStillschweigende nicht-lineare Transformationen derAchsenoptische Tauschung durch unpassende2d/3d-Grafiken...

konnen den Betrachter (manchmal absichtlich) in die Irrefuhren.

42/94

Page 70: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Beunruhigend große Fluktuationen beimDornfelder?

Hektarertrage Dornfelder, 1994–2013 (in hl)

1995 2000 2005 2010

110

120

130

140

150

160

170

Jahr

Hek

tare

rtra

g

Daten: Statistisches Landesamt RLP

43/94

Page 71: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Beunruhigend große Fluktuationen beimDornfelder?

Hektarertrage Dornfelder, 1994–2013 (in hl)

1995 2000 2005 2010

050

100

150

Jahr

Hek

tare

rtra

g

Daten: Statistisches Landesamt RLP

44/94

Page 72: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Rotwein in RLP: nur ein Tropfchen?

Bestockte Weinflachen in RLP 2013

Rotwein: 8881 ha Weißwein: 14686 ha

Daten: Statistisches Landesamt RLP; Bilder (c) Benutzer Andre Karwath

45/94

Page 73: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Rotwein in RLP: nur ein Tropfchen?Bestockte Weinflachen in RLP 2013

020

0040

0060

0080

0010

000

1200

014

000

Rotwein: 8881 ha Weißwein: 14686 ha

Daten: Statistisches Landesamt RLP46/94

Page 74: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Fazit

1 Histogramme erlauben einen detailierten Blick auf dieDaten

2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen

3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen

4 Bei kleinen Datenmengen eher Stripchartsangemessen

5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben

47/94

Page 75: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Fazit

1 Histogramme erlauben einen detailierten Blick auf dieDaten

2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen

3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen

4 Bei kleinen Datenmengen eher Stripchartsangemessen

5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben

47/94

Page 76: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Fazit

1 Histogramme erlauben einen detailierten Blick auf dieDaten

2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen

3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen

4 Bei kleinen Datenmengen eher Stripchartsangemessen

5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben

47/94

Page 77: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Fazit

1 Histogramme erlauben einen detailierten Blick auf dieDaten

2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen

3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen

4 Bei kleinen Datenmengen eher Stripchartsangemessen

5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben

47/94

Page 78: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenHistogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien

Fazit

1 Histogramme erlauben einen detailierten Blick auf dieDaten

2 Dichtepolygone erlauben Vergleiche zwischen vielenVerteilungen

3 Boxplot konnen große Datenmengen vereinfachtzusammenfassen

4 Bei kleinen Datenmengen eher Stripchartsangemessen

5 Vorsicht mit Tricks wie 3D oder halbtransparentenFarben

47/94

Page 79: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

48/94

Page 80: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Es ist oft moglich,das Wesentliche

an einer Stichprobe

mit ein paar Zahlenzusammenzufassen.

49/94

Page 81: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Wesentlich:

1. Wie groß?

Lageparameter

2. Wie variabel?

Streuungsparameter

50/94

Page 82: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Wesentlich:

1. Wie groß?

Lageparameter

2. Wie variabel?

Streuungsparameter

50/94

Page 83: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Wesentlich:

1. Wie groß?

Lageparameter

2. Wie variabel?

Streuungsparameter

50/94

Page 84: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

51/94

Page 85: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Eine Moglichkeitkennen wir schonaus dem Boxplot:

52/94

Page 86: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Lageparameter

Der Median

Streuungsparameter

Der Quartilabstand (Q3 −Q1)

53/94

Page 87: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Lageparameter

Der Median

Streuungsparameter

Der Quartilabstand (Q3 −Q1)

53/94

Page 88: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Lageparameter

Der Median

Streuungsparameter

Der Quartilabstand (Q3 −Q1)

53/94

Page 89: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Der Median1:die Halfte der Beobachtungen sind

kleiner,die Halfte sind großer.

Der Median istdas 50%-Quantil

der Daten.

1”saloppe“ Definition (wir sehen gleich die prazise Definition)

54/94

Page 90: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Der Median1:die Halfte der Beobachtungen sind

kleiner,die Halfte sind großer.

Der Median istdas 50%-Quantil

der Daten.

1”saloppe“ Definition (wir sehen gleich die prazise Definition)

54/94

Page 91: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das erste Quartil2, Q1:

ein Viertel der Beobachtungensind kleiner,

drei Viertel sind großer.

Q1 ist das25%-Quantilder Daten.

2”saloppe“ Definition (wir sehen gleich die prazise Definition)

55/94

Page 92: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das erste Quartil2, Q1:ein Viertel der Beobachtungen

sind kleiner,drei Viertel sind großer.

Q1 ist das25%-Quantilder Daten.

2”saloppe“ Definition (wir sehen gleich die prazise Definition)

55/94

Page 93: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das erste Quartil2, Q1:ein Viertel der Beobachtungen

sind kleiner,drei Viertel sind großer.

Q1 ist das25%-Quantilder Daten.

2”saloppe“ Definition (wir sehen gleich die prazise Definition)

55/94

Page 94: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das dritte Quartil3, Q3:

drei Viertel der Beobachtungensind kleiner,

ein Viertel sind großer.

Q3 ist das75%-Quantilder Daten.

3”saloppe“ Definition (wir sehen gleich die prazise Definition)

56/94

Page 95: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das dritte Quartil3, Q3:drei Viertel der Beobachtungen

sind kleiner,ein Viertel sind großer.

Q3 ist das75%-Quantilder Daten.

3”saloppe“ Definition (wir sehen gleich die prazise Definition)

56/94

Page 96: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Quartile

Das dritte Quartil3, Q3:drei Viertel der Beobachtungen

sind kleiner,ein Viertel sind großer.

Q3 ist das75%-Quantilder Daten.

3”saloppe“ Definition (wir sehen gleich die prazise Definition)

56/94

Page 97: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

(Empirische) Quantile, allgemein

Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn

gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und

1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.

Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k

n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.

57/94

Page 98: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

(Empirische) Quantile, allgemein

Seien n (reelle) Beobachtungswerte x1,x2, . . . ,xn

gegeben, α ∈ (0,1).q ist (ein) α-Quantil der n Beobachtungswerte, wenn gilt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und

1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.

Bem.: Im Allgemeinen ist ein α-Quantil nicht eindeutig:Seien x(1) ≤ x(2) ≤ ⋯ ≤ x(n) die der Große nach sortiertenWerte.Wenn α = k

n mit 1 ≤ k < n, so ist jeder Wert q ∈ [x(k),x(k+1)]ein α-Quantil,denn ∣i ∶ xi ≤ x(k)∣ ≥ k , ∣i ∶ xi ≥ x(k)∣ ≥ n − k + 1.Wenn nα /∈ 1, . . . ,n − 1, so ist das α-Quantil der Wertx(k) mit k = ⌈αn⌉.

57/94

Page 99: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

(Empirische) Quantile, allgemein II

n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und

1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.

Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑

ni=1 δxi betrachtet.

In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.

58/94

Page 100: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

(Empirische) Quantile, allgemein II

n (reelle) Beobachtungswerte x1,x2, . . . ,xn gegeben,α ∈ (0,1).(ein) α-Quantil q der n Beobachtungswerte erfullt1n∣1 ≤ i ≤ n ∶ xi ≤ q∣ ≥ α und

1n∣1 ≤ i ≤ n ∶ xi ≥ q∣ ≥ 1 − α.

Bem.:Die Definition passt zu unserer fruheren Definition furVerteilungen, wenn man die empirische Verteilung1n ∑

ni=1 δxi betrachtet.

In der Literatur (und auch in Statistik-Software) sindverschiedene Interpolationen ublich, um ”das“α-Quantil stetig in α zu machen.(In R siehe etwa help(quantile), es sind 9 Variantenimplementiert.)Die Uneindeutigkeit des α-Quantils ist fur halbwegsgroße n in der Praxis oft wenig von Belang.

58/94

Page 101: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

59/94

Page 102: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

n (reelle) Beobachtungswerte x1,x2, . . . ,xn

Am haufigsten werden benutzt:

Lageparameter

Der Mittelwert x ∶= 1n

n

∑i=1

xi

StreuungsparameterDie Standardabweichung s (bzw. σ)

wobei

σ2 = 1n

n

∑i=1

(xi − x)2 die (empirische) Varianz

s2 = 1n − 1

n

∑i=1

(xi − x)2 die korrigierte Stichproben-Varianz

( = nn−1σ

2)

60/94

Page 103: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

n (reelle) Beobachtungswerte x1,x2, . . . ,xn

Am haufigsten werden benutzt:

Lageparameter

Der Mittelwert x ∶= 1n

n

∑i=1

xi

StreuungsparameterDie Standardabweichung s (bzw. σ)

wobei

σ2 = 1n

n

∑i=1

(xi − x)2 die (empirische) Varianz

s2 = 1n − 1

n

∑i=1

(xi − x)2 die korrigierte Stichproben-Varianz

( = nn−1σ

2)

60/94

Page 104: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

n (reelle) Beobachtungswerte x1,x2, . . . ,xn

Am haufigsten werden benutzt:

Lageparameter

Der Mittelwert x ∶= 1n

n

∑i=1

xi

StreuungsparameterDie Standardabweichung s (bzw. σ)

wobei

σ2 = 1n

n

∑i=1

(xi − x)2 die (empirische) Varianz

s2 = 1n − 1

n

∑i=1

(xi − x)2 die korrigierte Stichproben-Varianz

( = nn−1σ

2)60/94

Page 105: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Erinnerung: Geometrische Bedeutungdes Mittelwerts

Der Schwerpunkt

61/94

Page 106: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Wir stellen uns die Beobachtungen alsgleich schwere Gewichte auf einer

Waage vor:

0 1 2 3

x

62/94

Page 107: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Wo muß der Drehpunkt sein, damit dieWaage im Gleichgewicht ist?

0 1 2 3

x

62/94

Page 108: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 1,5 ?

63/94

Page 109: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 1,5 ?

zu klein

63/94

Page 110: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 2 ?

63/94

Page 111: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 2 ?

zu groß

63/94

Page 112: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 1,8 ?

63/94

Page 113: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

m = 1,8 ?

richtig

63/94

Page 114: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Oft kann man ”mit dem bloßen Auge“anhand eines Histogramms den

Mittelwert gut einschatzen.

Beispiel: Galathea intermedia

”Rundlichkeit“:=

Abdominalbreite / Carapaxlange

64/94

Page 115: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 116: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 117: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 118: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 119: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 120: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 121: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 122: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

65/94

Page 123: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Beispiel:

3.11.88

66/94

Page 124: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 125: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 126: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 127: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 128: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 129: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 130: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

67/94

Page 131: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Standardabweichung (auch: Streuung)

Wie weit weichteine typische Beobachtung

vomMittelwert

ab ?

68/94

Page 132: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Die Standardabweichung (auch: Streuung)

Wie weit weichteine typische Beobachtung

vomMittelwert

ab ?

68/94

Page 133: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Mit n oder n − 1 berechnen?

Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)

σ =¿ÁÁÀ1

n

n

∑i=1

(xi − x)2.

Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher

s =¿ÁÁÀ 1

n − 1

n

∑i=1

(xi − x)2.

69/94

Page 134: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Mit n oder n − 1 berechnen?

Die Standardabweichung σ eines Zufallsexperiments mitn gleichwahrscheinlichen Ausgangen x1, . . . ,xn (z.B.Wurfelwurf) ist definiert durch (vgl. Def. 1.76)

σ =¿ÁÁÀ1

n

n

∑i=1

(xi − x)2.

Wenn es sich bei x1, . . . ,xn um Beobachtungswerte ineiner Stichprobe handelt, verwendet man eher

s =¿ÁÁÀ 1

n − 1

n

∑i=1

(xi − x)2.

69/94

Page 135: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

s als Schatzer fur σ

Wir werden sehen:Wenn X1, . . . ,Xn u.i.v. Zufallsvariablen mit VarianzVar[X1] = σ2,

X ∶= 1n

n

∑i=1

Xi ,

so hat die Zufallsvariable

S2 ∶= 1n − 1

n

∑i=1

(Xi −X)2

die EigenschaftE[S2] = σ2.

70/94

Page 136: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Faustregel fur die Standardabweichung

Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.

0.0

0.2

0.4

0.6

0.8

1.0

prob

abili

ty d

ensi

ty

x −− σσ x x ++ σσ

Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.

71/94

Page 137: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Faustregel fur die Standardabweichung

Bei ungefahr glockenformigen (also eingipfligen undsymmetrischen) Verteilungen liegen ca. 2/3 der Verteilungzwischen x − σ und x + σ.

0.0

0.2

0.4

0.6

0.8

1.0

prob

abili

ty d

ensi

ty

x −− σσ x x ++ σσ

Oft kann man so die Standardabweichung ”mit bloßemAuge“ abschatzen.

71/94

Page 138: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88

Nichteiertragende Weibchen

Carapaxlänge [mm]

Dic

hte

2.0 2.5 3.0

0.0

0.5

1.0

1.5 x == 2.53

Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.

72/94

Page 139: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88

Nichteiertragende Weibchen

Carapaxlänge [mm]

Dic

hte

2.0 2.5 3.0

0.0

0.5

1.0

1.5 x == 2.53x == 2.53σσ == 0.28

σσ2 == 0.077

Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.

72/94

Page 140: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Standardabweichung der Carapaxlangennichteiertragender Weibchen vom 6.9.88

Nichteiertragende Weibchen

Carapaxlänge [mm]

Dic

hte

2.0 2.5 3.0

0.0

0.5

1.0

1.5 x == 2.53x == 2.53σσ == 0.28

σσ2 == 0.077

Hier liegt der Anteil zwischen x − σ und x + σ bei 72%.72/94

Page 141: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenMedian und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung

Ubrigens: Einschlagige R-Befehle

Mittelwert (mean), Standardabweichung (sd), Median,und Quantilemean(x)sd(x)median(x)quantile(x, 0.25, type=1)quantile(x, 0.75, type=1)summary(x)

Boxplot, Histogrammboxplot(x)hist(x) (fur Dichtehistogramm: hist(x, prob=T))

Ein Dichtepolygon gewinnt man z.B. viah <- hist(x)plot(h$mids, h$density, type=’l’)

73/94

Page 142: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

74/94

Page 143: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig ist

und mussen andernfalls mit Vorsicht interpretiertwerden.

Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.

M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.

(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)

75/94

Page 144: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.

Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.

M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.

(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)

75/94

Page 145: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Mittelwert und Standardabweichung. . .charakterisieren die Daten gut, falls deren Verteilung(zumindest in etwa) glockenformig istund mussen andernfalls mit Vorsicht interpretiertwerden.

Wir betrachten dazu einige Lehrbuch-Beispiele aus derBiologie, siehe z.B.

M. Begon, C. R. Townsend, and J. L. Harper.Ecology: From Individuals to Ecosystems.Blackell Publishing, 4 edition, 2008.

(Wir verwenden an die Originalpublikationen angelehntesimulierte Daten, nehmen Sie also nicht alle Datenpunktewortlich.)

75/94

Page 146: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

76/94

Page 147: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Bachstelzen fressen DungfliegenRauber Beute

Bachstelze (White Wagtail) Gelbe DungfliegeMotacilla alba alba Scatophaga stercoraria

image (c) by Artur Mikołajewski image (c) by Viatour Luc

77/94

Page 148: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vermutung

Die Fliegen sind unterschiedlich großEffizienz fur die Bachstelze = Energiegewinn / Zeitzum Fangen und fressenLaborexperimente lassen vermuten, dass dieEffizienz bei 7mm großen Fliegen maximal ist.

N.B. Davies.Prey selection and social behaviour in wagtails (Aves:Motacillidae).J. Anim. Ecol., 46:37–57, 1977.

78/94

Page 149: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

available dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

050

100

150

79/94

Page 150: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

available dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

050

100

150 mean= 7.99

79/94

Page 151: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

available dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

050

100

150 mean= 7.99

sd= 0.96

79/94

Page 152: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

captured dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

010

2030

4050

60

79/94

Page 153: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

captured dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

010

2030

4050

60 mean= 6.79

79/94

Page 154: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

captured dung flies

length [mm]

num

ber

4 5 6 7 8 9 10 11

010

2030

4050

60 mean= 6.79

sd= 0.69

79/94

Page 155: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

79/94

Page 156: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert

6.79 < 7.99Standardabweichung 0.69 < 0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 157: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert

6.79

<

7.99Standardabweichung 0.69 < 0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 158: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert 6.79 < 7.99

Standardabweichung 0.69 < 0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 159: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert 6.79 < 7.99Standardabweichung

0.69 < 0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 160: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert 6.79 < 7.99Standardabweichung

0.69

<

0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 161: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Vergleich der Großenverteilungencaptured available

Mittelwert 6.79 < 7.99Standardabweichung 0.69 < 0.96

4 5 6 7 8 9 10 11

0.0

0.1

0.2

0.3

0.4

0.5

dung flies: available, captured

length [mm]

frac

tion

per

mm

availablecaptured

80/94

Page 162: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Interpretation

Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.

Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.

81/94

Page 163: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Interpretation

Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mmgroß sind.

Hier waren die Verteilungen glockenformig und esgenugten 4 Werte (die beiden Mittelwerte und die beidenStandardabweichungen), um die Daten adaquat zubeschreiben.

81/94

Page 164: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

82/94

Page 165: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensisimage (c) by Bernard Gagnon

83/94

Page 166: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Simulierte Daten:Eine Stichprobe von 70 SpinnenMittlere Große: 21,06 mmStandardabweichung der Große: 12,94 mm

84/94

Page 167: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

?????

size [mm]

Fre

quen

cy

0 10 20 30 40 50

01

23

45

6

85/94

Page 168: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensis (n=70)

size [mm]

Fre

quen

cy

0 10 20 30 40 50

02

46

810

1214

85/94

Page 169: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensis (n=70)

size [mm]

Fre

quen

cy

0 10 20 30 40 50

02

46

810

1214

mean= 21.06

85/94

Page 170: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensis (n=70)

size [mm]

Fre

quen

cy

0 10 20 30 40 50

02

46

810

1214

males females

85/94

Page 171: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensis (n=70)

size [mm]

Fre

quen

cy

0 10 20 30 40 50

02

46

810

1214

males females

85/94

Page 172: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Nephila madagascariensisimage (c) by Arthur Chapman 86/94

Page 173: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Fazit des Spinnenbeispiels

Wenn die Daten aus verschiedenen Gruppenzusammengesetzt sind, die sich bezuglich des Merkmalsdeutlich unterscheiden, kann es sinnvoll sein,Kenngroßen wie den Mittelwert fur jede Gruppe einzelnzu berechnen.

87/94

Page 174: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Inhalt1 Ansatz der Statistik2 Graphische Darstellungen

Histogramme und DichtepolygoneStripchartsBoxplotsGeschummelt: Graphische Tricksereien

3 Statistische KenngroßenMedian und andere Quartile, (empirische) QuantileMittelwert und Standardabweichung

4 Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische BachstelzenBeispiel: Spiderman & SpiderwomanBeispiel: Kupfertoleranz beim Roten Straußgras

88/94

Page 175: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Kupfertolerantes Rotes Straußgras

Rotes Straußgras KupferAgrostis tenuis Cuprum

image (c) Kristian Peters Hendrick met de Bles

89/94

Page 176: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Anpassung an Kupfer?

Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.

Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.

A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.

T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.

90/94

Page 177: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Anpassung an Kupfer?

Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.

Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.

A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.

T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.

90/94

Page 178: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Anpassung an Kupfer?

Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.

Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.

A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.

T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.

90/94

Page 179: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Anpassung an Kupfer?

Pflanzen, denen das Kupfer schadet, haben kurzereWurzeln.Die Wurzellangen von Pflanzen aus der Umgebungvon Kupferminen wird gemessen.Samen von unbelasteten Wiesen werden beiKupferminen eingesat.Die Wurzellangen dieser “Wiesenpflanzen” werdengemessen.

A.D. Bradshaw.Population Differentiation in agrostis tenius Sibth. III. populationsin varied environments.New Phytologist, 59(1):92 – 103, 1960.

T. McNeilly and A.D Bradshaw.Evolutionary Processes in Populations of Copper TolerantAgrostis tenuis Sibth.Evolution, 22:108–118, 1968.

90/94

Page 180: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

0 50 100 150 200

020

4060

8010

0 Copper Mine Grass

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 181: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

0 50 100 150 200

010

2030

40

Grass seeds from a meadow

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 182: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

0 50 100 150 200

010

2030

40

Grass seeds from a meadow

copper tolerant ?

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 183: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

0 50 100 150 200

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

meadow plants

copper mine plants

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 184: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

0 50 100 150 200

020

4060

8010

0 copper mine plants

m m+sm−s

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 185: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Browntop Bent (n=50)

root length (cm)

dens

ity p

er c

m

0 50 100 150 200

010

2030

40

meadow plants

m m+sm−s

2/3 der Wurzellangen innerhalb [m-sd,m+sd]???? Nein!

91/94

Page 186: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Fazit des Straußgras-Beispiels

Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben

werden.

z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max

92/94

Page 187: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Fazit des Straußgras-Beispiels

Manche Verteilungen konnen nur mit mehr alszwei Variablen angemessen beschrieben

werden.

z.B. mit den funf Werten der Boxplots:min, Q1, median, Q3, max

92/94

Page 188: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

0 50 100 150 200

Browntop Bent n=50+50

root length (cm)

copper mine plants

meadow plants

93/94

Page 189: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Schlussfolgerung

Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert

und die Standardabweichung hinreichendbeschrieben werden.

Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu

untersuchen,und sich nicht allein auf numerische

Kenngroßen zu verlassen.

94/94

Page 190: Statistik fur Informatiker, SS 2019¨ - staff.uni-mainz.de · Ansatz der StatistikGraphische DarstellungenStatistische Kenngroßen¨ Beispiele zum Sinn und Unsinn von Mittelwerten

Ansatz der Statistik Graphische Darstellungen Statistische Kenngroßen Beispiele zum Sinn und Unsinn von MittelwertenBeispiel: Wahlerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras

Schlussfolgerung

Viele Datenverteilungen sind annaherndglockenformig und konnen durch den Mittelwert

und die Standardabweichung hinreichendbeschrieben werden.

Es gibt aber auch Ausnahmen. Also:Besser ist es, die Daten auch graphisch zu

untersuchen,und sich nicht allein auf numerische

Kenngroßen zu verlassen.

94/94