Wiederholung Statistik I - Fachbereich 022).pdf · Statistik II - 28.4.2006 2 Was wir bereits...

25
Statistik II - 28.4.2006 1 Wiederholung Statistik I Intervallschätzungen

Transcript of Wiederholung Statistik I - Fachbereich 022).pdf · Statistik II - 28.4.2006 2 Was wir bereits...

Statistik II - 28.4.2006 1

Wiederholung Statistik I

Intervallschätzungen

Statistik II - 28.4.2006 2

Was wir bereits wissen…• Durch die Gesetze der großen Zahl bzw. durch

den ZGW können wir die asymptotischen Eigenschaften von Punktschätzern herleiten.

• Dabei spielt die Normalverteilung eine wichtige Rolle.

• Häufig haben wir aber keine exakt normalverteilten Schätzer, sondern es liegen Verteilungen vor, die aus der Normalverteilung erzeugt wurden.

Statistik II - 28.4.2006 3

Was wir nicht wissen…

• Wie zuverlässig sind unsere Schätzungen?

• Mit welcher Wahrscheinlichkeit liegt die Schätzung in einem bestimmten Intervall?

• Wie breit ist das Intervall, in dem die Schätzung mit einer gegeben Wahrscheinlichkeit liegt?

Statistik II - 28.4.2006 4

• Sei die standardisiere ZV annähernd standardnormalverteilt.

• Dann ist

• Falls

• Siehe Tabellen der Standardnormalverteilung

Statistik II - 28.4.2006 5

• Beispiel: Stichprobenmittel

• Damit

Statistik II - 28.4.2006 6

• Falls bekannt sind, dann kann man direkte Schlüsse von der Grundgesamtheit auf die Stichprobe ziehen:

• Mit welcher Wahrscheinlichkeit liegtin einem vorgegebenem Intervall? -D(z) ist unbekannt

• Wie groß ist das Intervall, in welchesmit einer bestimmten Wahrscheinlichkeit fällt? -Intervallgrenzen unbekannt

Statistik II - 28.4.2006 7

Unbekannte Grundgesamtheit

• Intervall um eine unbekannte Größe bei gegebener Wahrscheinlichkeit .

• : Konfidenzwahrscheinlichkeit

Beispiel:• Erwartungswert• Varianz

Statistik II - 28.4.2006 8

Konfidenzintervall E-Wert

• Intervall basiert auf Stichprobenmittel und geschätzter Standardabweichung

• Wie ist verteilt?

Statistik II - 28.4.2006 9

• Benutzeals erwartungstreuen und konsistenten Schätzer der Standardabweichung.

Dann ist:

- Der Zähler ist standardnormalverteilt- ist verteilt (s.u.).

Damit ist Student-t verteilt mit n-1 d.f.

Statistik II - 28.4.2006 10

• Damit folgt:

• Und das Konfidenzintervall lautet:

Statistik II - 28.4.2006 11

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

x

f(x)

ft(x,5)

ft(x,10)

ft(x,100)

fSt

(0,1)

Simulation der t-Verteilung

Statistik II - 28.4.2006 12

1.5 2 2.5 3 3.50

0.01

0.02

0.03

0.04

0.05

0.06

0.07

x

f(x)

ft(x,5)

ft(x,10)

ft(x,100)

fSt

(0,1)

Statistik II - 28.4.2006 13

n ist groß

• Die t-Verteilung konvergiert gegen die Standardnormalverteilung, wenn n großgenug ist.

• Die Konfidenzintervalle können deshalb bei großen Stichproben auch mit der Normalverteilung gebildet werden:

Statistik II - 28.4.2006 14

Simulation KI für E-Wert• Ziehe n=5,10 und 100 Beobachtungen unabhängig aus

der Standardnormalverteilung.• Berechne , und setze • In unserem Beispiel ergibt sich:

• Ist

Statistik II - 28.4.2006 15

• Damit ergibt sich für

[-0.09;0.23][-0.10;0.23]n=100

[-0.72;0.10][-0.76;0.14]n=10

[-1.27;0.43][-1.52;0.43]n=5

NormalverteilungStudent-t

Statistik II - 28.4.2006 16

Konfidenzintervall Varianz• Die Varianz einer Zufallsstichprobe

ist auch eine ZV und lässt sich wie folgt umformen:

Statistik II - 28.4.2006 17

• Damit:

• Bemerke

und

Deshalb

Und damit

Mit als dem -Quantil der Verteilung

Statistik II - 28.4.2006 18

Wir erhalten:

Und damit

Falls man den erwartungstreuen Schätzer für die unbekannte Varianz verwendet:

Statistik II - 28.4.2006 19

Simulation der -Verteilung

• Folge einer Verteilung.• Wie sieht diese Verteilung für

verschiedene Freiheitsgrade aus?• Konvergiert sie für viele Freiheitsgrade

auch gegen die Normalverteilung?

Statistik II - 28.4.2006 20

0 5 10 150

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

x

f(x)

χ25

χ210

χ1002

fst

Statistik II - 28.4.2006 21

n ist groß• Wird die Zahl der Freiheitsgrade größer, so konvergiert

die Verteilung einer standardisierte -verteilten ZV gegen die Normalverteilung.

• Da ,

folgt:

und

Statistik II - 28.4.2006 22

Simulation für Konvergenz in Verteilung

1. Ziehe 1.000 Beobachtungen unabhängig aus der -Verteilung mit 5, 10 und 100 Freiheitsgraden.

2. Standardisiere die gezogenen Werte3. Schätze die Verteilung mit Hilfe der

empirischen Verteilungsfunktion 4. Vergleiche mit der Verteilungsfunktion

der Standardnormalverteilung.

Statistik II - 28.4.2006 23

−6 −4 −2 0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

z

F(z

)

F

5(z)

F10

(z)

F100

(z)

Fst

(z)

Statistik II - 28.4.2006 24

Simulation für KI-Varianz

• Selbes Design und Realisationen, wie bei der Simulation für KI des E-Werts.

• Wir erhalten:

• Und

Statistik II - 28.4.2006 25

• Damit ergibt sich für

[0.90;1.14][0.89;1.12]n=100

[0.62;1.74][0.57;1.28]n=10

[0.88;3.16][0.75;2.74]n=5

Normalverteilung-Verteilung