Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f...

36
Statistik f¨ ur Ingenieure Vorlesung 9 Prof. Dr. Hans-J¨ org Starkloff TU Bergakademie Freiberg Institut f¨ ur Stochastik 19. Dezember 2016

Transcript of Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f...

Page 1: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Statistik fur IngenieureVorlesung 9

Prof. Dr. Hans-Jorg Starkloff

TU Bergakademie FreibergInstitut fur Stochastik

19. Dezember 2016

Page 2: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

4.2. Grafiken und statistische Maßzahlen (Kenngroßen,Parameter) fur Daten

I Grafiken und statistische Maßzahlen dienen dazu, einen Uberblickuber die vorliegenden Daten zu erhalten, Vorstellungen ubermogliche zugrundeliegende Verteilungen, Eigenschaften oderBesonderheiten zu entwickeln oder einfache Beschreibungen derDaten mit wenigen, moglichst aussagekraftigen Kenngroßen zuermoglichen.

I In Abhangigkeit von den Skalenniveaus und anderen Eigenschaftender Daten (wie z.B. univariate, bivariate oder multivariateDatensatze) konnen unterschiedliche Grafiken und Kenngroßengenutzt werden.

I Im Rahmen dieser Vorlesung werden nicht alle Moglichkeitenvorgestellt, sondern nur eine Auswahl von haufiger verwendeten bzw.aussagekraftigen Grafiken und Maßzahlen.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 2

Page 3: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Fragestellungen im Zusammenhang mit den Grafiken

I Fur welche Daten eignet sich die Grafik ?

I Wie ist die Grafik aufgebaut ?

I Wie interpretiert man die Grafik ?

I Welche Informationen kann die Grafik liefern und warum ?

I Welche Informationen kann die Grafik nicht liefern und warum ?

I Versucht man mit einer vorliegenden Grafik zu tauschen, etwasbestimmtes zu suggerieren ?

(Zitat, zu finden z.B. in Benesch, Schlusselkonzepte zur Statistik,Springer, 2013, S.2:

”Die Statistik ist dem Politiker, was die Laterne

dem Betrunkenen ist: Sie dient zum Festhalten, nicht derErleuchtung.“;siehe dazu zum Beispiel auch die

”Unstatistiken des Monats“ unter

http://www.rwi-essen.de/unstatistik/.)

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 3

Page 4: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

4.2.1. Grafiken fur univariate stetige Daten(a) Punktdiagramm

I Ein Punktdiagramm kann fur ein stetiges Merkmal erstellt werden.Dabei werden die Beobachtungswerte durch Punkte auf einemgeeigneten Abschnitt der reellen Zahlengeraden markiert.

I Man erhalt einen Uberblick uber den Bereich, in demBeobachtungswerte liegen und wie stark sie streuen.

I Teilweise kann man Teilbereiche erkennen, in denen sich dieBeobachtungswerte haufen oder seltener vorkommen.

I Ebenfalls kann man sehr große oder sehr kleine Beobachtungswerte,die von der

”Masse“ der Werte relativ weit entfernt sind und

eventuell als Ausreißer zu behandeln sind, erkennen.

I Die Zusatzinformationen zum Datensatz muss ggf. mit genutztwerden (falls Daten transformiert sind etc.).

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 4

Page 5: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Punktdiagramm fur Datensatz”morley“

> data(morley)

> lightspeeds=morley$Speed+299000

> stripchart(lightspeeds, main="Punktdiagramm Lichtgeschwindigkeitsmessungen")

299700 299800 299900 300000

Punktdiagramm Lichtgeschwindigkeitsmessungen

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 5

Page 6: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Probleme mit Punktdiagrammen

I Zusammenfallende oder sehr nah beieinander liegendeBeobachtungswerte sind im Diagramm nicht mehr unterscheidbar,so dass Punkte durch

”Uberdeckung“ verloren gehen konnen.

I Dieses Problem kann man beheben, indem man die Punktpositionenin die ungenutzte Richtung (vertikal bei horizontalenPunktdiagrammen) durch systematisches Stapeln (gestapeltesPunktdiagramm) oder durch zufalliges Verzittern (verzittertesPunktdiagramm) verschiebt.

I Ein verzittertes Punktdiagramm sieht nach jedem Neuzeichnenanders aus.

I Beim gestapelten Punktdiagramm konnen Muster vorgegaukeltwerden, die aber nur sehr zufallig und damit wenig aussagekraftigsind. Die Verteilung der Punkte kann nicht immer gut erfasstwerden.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 6

Page 7: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Gestapeltes Punktdiagramm fur Beispiel

> stripchart(lightspeeds,method="stack", main="Gestapeltes Punktdiagramm

Lichtgeschwindigkeitsmessungen")

299700 299800 299900 300000

Gestapeltes Punktdiagramm Lichtgeschwindigkeitsmessungen

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 7

Page 8: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Verzittertes Punktdiagramm fur Beispiel

> stripchart(lightspeeds,method="jitter", main="Verzittertes Punktdiagramm

Lichtgeschwindigkeitsmessungen")

299700 299800 299900 300000

Verzittertes Punktdiagramm Lichtgeschwindigkeitsmessungen

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 8

Page 9: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(b) Histogramm

I Ausgangspunkt ist eine Klasseneinteilung der Beobachtungswerte.

I Dazu wird ein Intervall, in dem alle Beobachtungswerte liegen, ineine endliche Anzahl disjunkter Teilintervalle, die sogenanntenKlassen oder Gruppen zerlegt. Jede Klasse ist dann eindeutig durchdie Klassenmitte und die Klassenbreite bzw. durch die untere undobere Klassengrenze bestimmt.

I Die Anzahl der Klassen sollte nicht zu klein und nicht zu groß sein.

I Die Klassenbreiten sollten ubereinstimmen (ggf. mit Ausnahme derRandklassen).

I Nach Festlegung einer Klasseneinteilung werden die absolutenKlassenhaufigkeiten bestimmt, d.h. fur jede Klasse wird die Anzahlder Beobachtungswerte in der Klasse gezahlt.

I Dann werden in einem Koordinatensystem aneinanderstoßendeRechtecke mit Flacheninhalten proportional zurKlassenhaufigkeit und Klassenintervallen als Basis gezeichnet.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 9

Page 10: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Histogramm fur Beispiel Lichtgeschwindigkeiten

> hist(lightspeeds)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100

05

1015

2025

30

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 10

Page 11: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Histogramm und gestapeltes Punktdiagramm fur Beispiel> hist(lightspeeds)

> stripchart(lightspeeds,method="stack",add=T,col=2)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100

05

1015

2025

30

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 11

Page 12: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Histogramm mit 3 Klassen und Beispielpunktdiagramm> b=c(299600,299800,300000,300200)

> hist(lightspeeds,breaks=b)

> stripchart(lightspeeds,method="stack",add=T,col=2)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100 300200

020

4060

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 12

Page 13: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Histogramm mit 50 Klassen und Beispielpunktdiagramm> b=c(seq(299600,300100,by=10))

> hist(lightspeeds,breaks=b)

> stripchart(lightspeeds,method="stack",add=T,col=2)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100

02

46

810

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 13

Page 14: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Bemerkungen zu Histogrammen

I Die Gestalt eines Histogramms hangt stark von der gewahltenKlasseneinteilung (und auch des gewahlten Gesamtintervalls) ab,deshalb sollte man ggf. etwas experimentieren, um ein moglichstaussagekraftiges Histogramm zu erzeugen.

I Durch die Klasseneinteilung geht Information verloren.

I Man kann ggf. Ausreißer am linken oder rechten Rand erkennen.

I Man kann eventuell Verteilungseigenschaften, wie Symmetrie oderSchiefe erkennen (oder erahnen).

I Bei ubereinstimmenden Klassenbreiten sind die Hohen der Rechteckeproportional zu den Haufigkeiten.

I Statt der absoluten Haufigkeiten konnen die Hohen der Rechteckeauch so normiert werden, dass der Gesamtflacheninhalt unter allenRechtecken gleich 1 ist. Dann ist ein (meist nicht sehr belastbarer)Vergleich mit einer Verteilungsdichte moglich.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 14

Page 15: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispielhistogramm mit Normalverteilungsdichteschatzung> hist(lightspeeds,freq=F)

> curve(dnorm(x,mean(lightspeeds),sd(lightspeeds)),add=T,col=2)

Histogram of lightspeeds

lightspeeds

Den

sity

299600 299700 299800 299900 300000 300100

0.00

00.

001

0.00

20.

003

0.00

40.

005

0.00

6

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 15

Page 16: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

4.2.2. Grafiken fur univariate diskrete Daten(a) Balkendiagramm

I Bei Balkendiagrammen werden die Anzahlen der Beobachtungswertein den einzelnen Kategorien (Klassen) durch gleich breite Balkenflachen- und auch hohenproportional dargestellt.

I Im Unterschied zum Histogramm fur stetige Daten haben die Balkenbeim Balkendiagramm einen Abstand, um den diskreten Charakterder Daten zu unterstreichen.

I Sowohl beim Histogramm als auch beim Balkendiagramm werdenaber Haufigkeiten oder Anteile flachenproportional dargestellt.

I Bei der Anzeige ordinaler Daten sollte die Reihenfolge der Balkender naturlichen Ordnung der Merkmalsauspragungen entsprechen.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 16

Page 17: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispiel Datensatz”Titanic“ R–Befehle

Funktion zur Gewinnung von Summenanzahlen z.B.

> margin=function(x, ...)

apply(x,pmatch(c(...),names(dimnames(x))), sum)

> margin(Titanic,"Survived")

No Yes

1490 711

Erzeugung der Balkendiagramme

> opar=par(mfrow=c(1,3))

> barplot(margin(Titanic,"Survived"),main="Survived")

> barplot(margin(Titanic,"Sex"),main="Sex")

> barplot(margin(Titanic,"Class"),main="Class")

> par(opar)

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 17

Page 18: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Balkendiagramme im Beispiel”Titanic“

No Yes

Survived

020

040

060

080

010

0012

0014

00

Male Female

Sex

050

010

0015

00

1st 2nd 3rd Crew

Class

020

040

060

080

0

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 18

Page 19: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(b) Kreisdiagramm

Die Anzahlen (oder Anteile) der Beobachtungswerte in den einzelnenKategorien (Klassen) konnen ggf. auch durch ein Kreisdiagramm(Tortendiagramm, Kuchendiagramm) flachenproportional (hier auchwinkelproportional) dargestellt werden.

R–Befehle zur Erzeugung der Kreisdiagramme im Beispiel:

> opar=par(mfrow=c(1,3))

> pie(margin(Titanic,"Survived"),main="Survived")

> pie(margin(Titanic,"Sex"),main="Sex")

> pie(margin(Titanic,"Class"),main="Class")

> par(opar)

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 19

Page 20: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispielkreisdiagramme

No

Yes

Survived

Male

Female

Sex

1st

2nd

3rd

Crew

Class

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 20

Page 21: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

4.2.3. Kenngroßen und Parameter zur Beschreibungunivariater Daten

I LageparameterI Mittelwerte (arithmetisch, geometrisch, harmonisch)

I empirischer Median

I empirische Quantile (Quartile, Dezentile, . . . )

I Variabililitatsparameter (Streuparameter)I empirische Varianz

I empirische Standardabweichung

I Spannweite

I empirischer (Inter-)Quartilsabstand IQR

I empirischer Variationskoeffizient

I empirische geometrische Standardabweichung

I FormparameterI empirische Schiefe

I empirische Wolbung

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 21

Page 22: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(a) Arithmetischer Mittelwert

I Fur reelle Beobachtungswerte x1, x2, . . . , xn ist der arithmetischeMittelwert definiert durch

x =1

n

n∑i=1

xi =1

n(x1 + x2 + . . . + xn) .

I In der Statistik wird er als Realisierung des Stichprobenmittelwerts(eine spezielle Stichproben- oder Schatzfunktion)

X =1

n

n∑i=1

Xi =1

n(X1 + X2 + . . . + Xn)

einer mathematischen Stichprobe (X1,X2, . . . ,Xn) (unabhangigeund identisch verteilte Zufallsgroßen) betrachtet. Unter geeignetenVoraussetzungen liefert er eine erwartungstreue und konsistenteSchatzfunktion fur den Erwartungswert der Xi : EX = X .

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 22

Page 23: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Unterschied zwischen konkreter und mathematischerStichprobe

I Liegen n beobachtete Werte x1, . . . , xn eines Merkmals X vor,so bilden diese eine konkrete Stichprobe vom Umfang n .

I Man betrachtet jeden beobachteten Wert xi als Realisierung einerZufallsgroße Xi , wobei die Xi (i = 1, ..., n) alle unabhangig undidentisch verteilt (engl.: i.i.d.) mit FXi

= FX seien.

I Die Zufallsgroße Xi beschreibt also das zufallige Ergebnis der i-tenMessung, des i-ten Zufallsexperiments oder der i-ten Auswahl einesMerkmalstragers, je nachdem wie die konkrete Stichprobe zustandegekommen ist.

I Die Zufallsgroßen X1, . . . ,Xn bilden die mathematische Stichprobe.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 23

Page 24: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Arithmetischer Mittelwert in R

Der Befehl in R zur Berechnung des (arithmetischen) Mittelwertes ist”mean()”.> mean(lightspeeds)

[1] 299852.4

Ein Histogramm mit Mittelwertslinie kanndann z.B. so erzeugt werden:> hist(lightspeeds)

> abline(v=mean(lightspeeds),col=2)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100

05

1015

2025

30

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 24

Page 25: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(b) Geometrischer Mittelwert

I Fur nichtnegative reelle Beobachtungswerte (einer ratio-Skala)x1, x2, . . . , xn ist der geometrische Mittelwert definiert durch

xG = n

√√√√ n∏i=1

xi = (x1 · x2 · . . . · xn)1n .

I Bemerkung: Es gilt immer xG ≤ x .

I Anwendung findet er zum Beispiel, wenn eine logarithmische Skala(Transformation) sinnvoll ist oder die Merkmalsauspragungenrelative Anderungen sind, so bei der Mittelung vonWachstumsfaktoren.

I In R kann man die Exponentialfunktion zur Berechnung vongeometrischen Mittelwerten nutzen:

xG = exp

(1

n

n∑i=1

ln(xi )

).

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 25

Page 26: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispiel zum geometrischen Mittelwert

I Beispiel:Zeitpunkt 0 1 2

Zustandswert 100 81 100

Merkmalswert=Wachstumsfaktor x1 = 0.81 x2 = 1.234

⇒ xG = 1.000aber x = 1.022 (obwohl insgesamt keine Anderung desZustandswerts zum Ausgangszeitpunkt vorliegt).

I In R ergibt zum Beispiel:> x=c(81/100,100/81)

> exp(mean(log(x)))

[1] 1

> mean(x)

[1] 1.022284

I Bemerkung: log(x) berechnet in R den Vektor der naturlichenLogarithmen des Vektors x .

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 26

Page 27: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(d) Harmonischer Mittelwert

I In manchen Situationen ist fur nur positive (oder nur negative)Beobachtungswerte x1, x2, . . . , xn der harmonische Mittelwert

xH =n

n∑i=1

1xi

besser geeignet, so z.B. bei Mittelwertbildung von Verhaltniszahlen(bei gleichem Zahler) wie Durchschittsgeschwindigkeiten(gleichlange Teilstrecken) oder Durchschnittspreisen (gleicheGeldbetrage).

I Gilt xi > 0 fur alle i = 1, . . . , n , dann gilt immer

xH ≤ xG ≤ x .

Im Fall von x1 = x2 = . . . = xn = x > 0 erhalt man

xH = xG = x = x .

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 27

Page 28: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispiel zum harmonischen Mittelwert

I Beispiel: Konstante Geschwindigkeiten auf jeweiligen TeilstreckenTeil-/Gesamtstrecke 1 2 1 + 2

Streckenlange in km 100 100 200

Zeit in h 2 1 3

Geschwindigkeit in km/h x1 = 50 x2 = 100 2003 = 66.6

⇒ xH =2

150 + 1

100

= 66.66 , aber x = 75 und xG = 70.71 .

I In R (ab dem Zeichen # beginnt ein Kommentar):> x=c(50,100)

> 1/mean(1/x) # Harmonisches Mittel

[1] 66.66667

> mean(x) # Arithmetisches Mittel

[1] 75

> exp(mean(log(x))) # Geometrisches Mittel

[1] 70.71068

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 28

Page 29: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(e) Empirischer Median

I Der empirische Median oder Zentralwert der Beobachtungsreihex1, x2, . . . , xn ist dadurch gekennzeichnet, dass jeweils 50 % derBeobachtungswerte einen Wert großer oder gleich bzw. kleiner odergleich dem empirischen Median annehmen.

I Sind

x(1) ≤ x(2) ≤ . . . ≤ x(n)

die der Große nach geordneten Beobachtungswerte, kann der(empirische) Median x bestimmt werden durch

x =

x( n+1

2 ), falls n ungerade,

12

(x( n

2 ) + x( n2+1)

), falls n gerade .

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 29

Page 30: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispiele zum empirischen Median

I Beobachtungswerte 4, 5, 1, 3, 6, 7, 8 ⇒ n = 7 , x = 5 , x = 4.857 .

I Beobachtungswerte 4, 5, 1, 3, 6, 7 ⇒ n = 6, x = 4.5 , x = 4.33 .

I Beobachtungswerte 4, 5, 1, 3, 6, 7, 800 ⇒ n = 7 , x = 5 , x = 118 .

I Der Median ist weniger empfindlich gegenuber Ausreißern in derBeobachtungsreihe, d.h. Werte, die weit von den ubrigen entferntliegen, beeinflussen den Median nicht (oder kaum). Dies trifft aufden arithmetischen Mittelwert im Allgemeinen nicht zu.

I In R:> median(lightspeeds)

[1] 299850

I Der Median kann sogar fur Daten auf einer nur ordinalen Skalagenutzt werden (wenn z.B. die Addition, die zur Bildung desarithmetischen Mittelwerts notwendig ist, gar keinen Sinn macht).

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 30

Page 31: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Histogramm mit Mittelwert (rot) und Median (blau)> hist(lightspeeds)

> abline(v=mean(lightspeeds),col=2)

> abline(v=median(lightspeeds),col=4)

Histogram of lightspeeds

lightspeeds

Fre

quen

cy

299600 299700 299800 299900 300000 300100

05

1015

2025

30

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 31

Page 32: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

(f) Empirische Quantile

I Ein Ordnen der Datenreihe x1, x2, . . . , xn der Große nach ergibt diegeordnete Datenreihe (geordnete Stichprobe, Variationsreihe)

xmin := x(1) ≤ x(2) ≤ . . . ≤ x(n−1) ≤ x(n) =: xmax .

I Andere Bezeichnungen fur die Variationsreihe sindx∗1 ≤ x∗2 ≤ . . . ≤ x∗n oder x1:n ≤ x2:n ≤ . . . ≤ xn:n .

I Das empirisches p−Quantil mit 0 < p < 1 ist ein Zahlenwert xp(oder bezeichnet mit xp) fur den gilt, dass p · 100% der Werte inder Variationsreihe kleiner oder gleich xp und (1− p) · 100% derWerte großer oder gleich xp sind.

xp =

x(k), falls np keine ganze Zahl ist, k ist

dann die auf np folgende ganze Zahl;

12

(x(k) + x(k+1)

), falls np =: k eine ganze Zahl ist.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 32

Page 33: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Beispiel zu empirischen Quantilen

I 10 Beobachtungswerte: 1, 3, 7, 2, 20, 9, 15, 2, 11, 10 .

I Variationsreihe: 1 ≤ 2 ≤ 2 ≤ 3 ≤ 7 ≤ 9 ≤ 10 ≤ 11 ≤ 15 ≤ 20 .

I 0.05−Quantil :p = 0.05, np = 0.5 ⇒ k = 1 , x0.05 = x(1) = 1 .

I 0.10−Quantil :p = 0.10, np = 1 = k ⇒ x0.05 = 1

2(x(1) + x(2)) = 1.5 .

I 0.20−Quantil :p = 0.20, np = 2 = k ⇒ x0.20 = 1

2(x(2) + x(3)) = 2 .

I 0.25−Quantil :p = 0.25, np = 2.5 ⇒ k = 3, x0.25 = x(3) = 2 .

I 0.50−Quantil :p = 0.50, np = 5 = k ⇒ x0.50 = 1

2(x(5) + x(6)) = 8 = x .

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 33

Page 34: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Spezielle Quantile

I Das 0.5−Quantil ist der Median.

I Das 0.25−Quantil heißt auch unteres oder erstes Quartil (oder auchunterer Viertelwert).

I Das 0.75−Quantil heißt auch oberes oder drittes Quartil (oder auchoberer Viertelwert).

I Das n10−Quantil mit n ∈ {1, 2, 3, 4, 5, 6, 7, 8, 9} heißt auch n−tes

Dezentil .

I Als 0−Quantil kann man das Minumum xmin = x(1) ansehen.

I Als 1−Quantil kann man das Maximum xmax = x(n) ansehen.

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 34

Page 35: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Berechnung von Quantilen mit R

I Der Befehl quantile() erzeugt als Ausgabe eine Tabelle mitWerten fur das Minimum, das Maximum, den Median und dieQuartile.

I Damit die Quantile nach der oben angegebenen Formel berechnetwerden, muss type=2 angegeben werden.

I Beispiel:> quantile(lightspeeds,type=2)

0% 25% 50% 75% 100%

299620 299805 299850 299895 300070

> quantile(lightspeeds)

0% 25% 50% 75% 100%

299620.0 299807.5 299850.0 299892.5 300070.0

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 35

Page 36: Statistik für Ingenieure Vorlesung 9 - tu-freiberg.de · Prof. Dr. Hans-J org Starklo Statistik f ur Ingenieure Vorlesung 9 Ge andert: 20. Dezember 2016 3. 4.2.1. Gra ken f ur univariate

Berechnung von Quantilen mit R

I Sollen fur bestimmte Niveaus p die zugehorigen Quantileberechnet werden, konnen diese dem Befehl mit ubergeben werden.

I Beispiele:> quantile(lightspeeds,c(0.1,0.2,0.3))

10% 20% 30%

299760 299798 299810> quantile(lightspeeds,c(0.1,0.2,0.3),type=2)

10% 20% 30%

299760 299795 299810

> quantile(lightspeeds,seq(0.85,0.95,0.05))

85% 90% 95%

299941.5 299960.0 299980.0> quantile(lightspeeds,seq(0.85,0.95,0.05),type=2)

85% 90% 95%

299945 299960.0 299980.0

Prof. Dr. Hans-Jorg Starkloff Statistik fur Ingenieure Vorlesung 9 Geandert: 20. Dezember 2016 36