Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

21
Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile

Transcript of Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

Page 1: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

Statistik: 11.11.04

Konfidenzintervall und Testen für den Mittelwert und Anteile

Page 2: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 2

Schließende Statistik

oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter (, p, etc.)Das Schätzen von Parametern: für den unbekann-ten Wert eines Parameters (, p, etc.) ist zu bestimmen

ein numerischer Wert (Punktschätzer) oder ein Intervall, in dem der unbekannte Wert mit

vorgegebener Wahrscheinlichkeit enthalten ist (Konfidenzintervall)

Entscheidung zwischen Behauptungen (Hypothesen)

Page 3: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 3

Beispiel A: Abfüllmenge

Der unbekannte Mittelwert μ der Füllmenge soll geschätzt werdenStichprobe (n = 25): = 126.7, s = 0.5.

Punktschätzer für μ ist Konfidenzintervall für μ: ± c. Testen von H0: μ = 126.4 gegen H1: μ > 126.4

x

xx

Page 4: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 4

Beispiel B: Anteil der Berufstätigen unter Studierenden

Anteil θ ist unbekannt Stichprobe (n = 200) gibt Anteil von p = 32% Punktschätzer für θ ist p = 0.32 Konfidenzintervall p ± c Testen die Nullhypothese H0: θ = 0.20

gegen H1: µ > 0.20

Page 5: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 5

Stichprobenverteilungen

Wahrscheinlichkeitsverteilungen von und p sind Basis von statistischen EntscheidungsverfahrenZentraler Grenzwertsatz

x

Page 6: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 6

Stichprobenmittelwert

Grundgesamtheit: X mit (beliebiger) Verteilung, und . Stichprobenmittelwert :

Mittelwert von ist Standardabweichung (Standardfehler,

standard error) von ist StdAbw( ) = /n

Für nicht zu kleines n: ist näherungsweise normalverteilt

x

x

x

xx

Page 7: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 7

Konfidenzintervall für μ

Konfidenzintervall zur Konfidenzzahl γ

Mit γ = 0.95c = 2/n

genauer: c = 1.96 /n99.7%-iges KI: ± 3 /n90%-iges KI: ± 1.645 /n

: { }x c P x c x c

xx

Page 8: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 8

Beispiel A: Abfüllmenge

Stichprobe (n = 25): = 126.7, s = 0.5.Punktschätzer für μ ist = 126.795%-iges Konfidenzintervall für μ :

Einsetzen gibt

oder: 126.5 ≤ ≤ 126.9

xx

1.96 1.96s s

x xn n

0.5 0.5126.7 1.96 126.7 1.96

25 25

Page 9: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 9

Konfidenzintervall: Wahl von c

Näherungsweise gilt Wahl von c0 so, dass

oder

Aus

folgt

und das 0.975-Perzentil c0 = 1.96

, /X N n

0 0 0.95X

P c n c

0 0 0.95P X c X cn n

0 0 0 0( ) ( ) 0.95X

P c n c c c

0

1 0.95( ) 0.975 (1.96)

2c

Page 10: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 10

100%iges Konfidenzintervall für μ

Symmetrisches Intervall um so, dass 100% aller so konstruierten Intervalle das wahre enthalten

x

(1 ) / 2 (1 ) / 2 0.95P X z X zn n

0.90 1.645

0.95 1.96

0.99 2.58

(1 ) / 2z Wahl von z für gegebenes

Page 11: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 11

Wahl des Stichprobenumfanges

Halbe Länge c des Konfidenzintervalls hängt ab von n, und Bei Vorgabe von c und kann n berechnet werden:

n =(z(1+)/2σ/c)2

Page 12: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 12

Unbekanntes

Verwendung der t -Verteilung statt der standardisierten Normalverteilung

Student‘sche t -Verteilung: hat einen Parameter (n-1), die „Zahl der Freiheitsgrade“ tabelliert, in EXCEL: Funktionen TVERT, TINV symmetrisch, glockenförmig für wachsendes n der Normalverteilung immer

ähnlicher

1Xn t n

s

Page 13: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 13

p t(2) t(10) t(20) t(30)t(100

)N(0,1

)

0.952.92

01.81

21.72

51.69

71.66

01.645

0.975

4.303

2.228

2.086

2.042

1.984

1.96

0.995

9.925

3.169

2.845

2.750

2.626

2.58

t -Verteilung: Perzentilep-Quantile der t -Verteilung für wachsende Zahl der Freiheitsgrade und der Normalverteilung

Page 14: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 14

Test für μ

VerfahrenLege die Nullhypothese H0 (μ = μ0) und die Alternative H1 festWähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit bezeichnet); z.B. 0.05Ziehe die Stichprobe, berechne Berechne den p-Wert Verwerfe H0, wenn der p -Wert kleiner als ist

x

Page 15: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 15

Beispiel A: Abfüllmenge

Nullhypothese H0: μ = 125g

Alternative H1: μ > 125g

Die Entscheidung soll für = 0.05 getroffen werdenStichprobe (n = 9): = 126.0, s = 1.5Wir verwerfen H0!

x

0126

126 1251 9 1 (2) 0.0228

1.5

p Wert P X H

Page 16: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 16

Testen von HypothesenMethode, auf Basis einer Zufallsstichprobe eine Entscheidung zwischen zwei Behauptungen (Vermutungen) zu treffenNullhypothese H0: ist jene Vermutung, über die entschieden werden soll (z.B. = 125)Alternativhypothese: eine konkurrierende Vermutung p -Wert: Wahrscheinlichkeit, den erhaltenen oder einen noch extremeren Wert für die Teststatistik zu erhalten, wenn H0 zutrifft; ein Maß für die Glaubwürdigkeit von H0

Fehlentscheidungen: Fehler 1. Art (-Fehler): richtige H0 wird nicht akzeptiert; der

p -Wert ist die Wahrscheinlichkeit, diesen Fehler zu begehen Fehler 2. Art: zutreffende Alternativhypothese wird nicht

akzeptiertSignifikanzniveau : maximal tolerierter p -Wert

Page 17: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 17

Wahl der Alternativhypothese

Das, was ich „beweisen“ möchteBeispiel: Abfüllmenge; H0: =125g Konsumentenschützer möchte erkennen,

wenn <125g; er möchte ziemlich sicher sein, dass er

recht hat, wenn er „<125g“ behauptet Test mit Signifikanzniveau =0.05: er irrt

höchstens in 5 von 100 Entscheidungen Analog: Produzent möchte erkennen, wenn

>125g oder wenn ≠125g

Page 18: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 18

Inferenz bei Anteilen

Schätzwert für Anteil aus Stichprobe (Umfang n): relative Häufigkeit pn

Stichprobenverteilung von pn (Zentraler Grenzwert-satz):

mit

Faustregel für „großes n'': n > 5, n (1-) > 5

2( , )n pp N

(1 )p n

Page 19: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 19

100%iges Konfidenzintervall für

Symmetrisches Intervall um pn so, dass 100% aller so konstruierten Intervalle das wahre enthalten

(1 ) / 2 (1 ) / 2n p n pp z p z

0.90 1.645

0.95 1.96

0.99 2.58

(1 ) / 2z Wahl von z für gegebenes

In p ist durchpn zu ersetzen!

Page 20: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 20

Beispiel B: Berufstätige

Anteil der Berufstätigen unter den Studierenden θ ist unbekannt Stichprobe (n = 200) gibt Anteil von p200 = 32%

Punktschätzer für θ ist p = 0.32 95%-iges Konfidenzintervall für θ :

oder: 0.255 ≤ θ ≤ 0.385Achtung! nθ ≈ 200 (0.32) = 64 > 5, n(1-θ) ≈ 200 (0.68) = 136 > 5

(0.32)(0.68) (0.32)(0.68)0.32 1.96 0.32 1.96

200 200

Page 21: Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile.

11.11.04 PI Statistik, WS 2004/05 (8) 21

Beispiel B: Berufstätige

Nullhypothese H0: θ = 30%

Alternative H1: μ > 30%

Die Entscheidung soll für = 0.05 getroffen werdenStichprobe (n = 200): p200 = 0.32

Wir verwerfen H0 nicht! 200 00.32

0.32 0.31 200 1 (0.617) 0.269

(0.3)(0.7)

p Wert P p H

Beachten Sie!