Anvendt Statistik Lektion 3

Anvendt StatistikLektion 3

Punkt- og intervalestimater

Konfidensintervaller

Valg af stikprøvestørrelse

Punkt- og intervalestimater: Motivation Motiverende eksempel:

I en undersøgelse er andelen af rygere 0.27. Det anslås at populationsandelen er mellem 0.25 og 0.29.

Begreber: De 0.27 er et punkt-estimat Intervallet 0.25 til 0.29 er et interval-estimat. Dvs. populationsandelen falder (anslået) indenfor

punkt-estimat +/- fejl-margin. Fejl-margin er her 0.02

Punkt-estimat og -estimator

En estimator er en ”generel formel”, der bruges til at estimere en parameter med, fx.

Et estimat er en konkret udregning af en estimator, ved at indsætte data.

Der kan være mange estimatore for den samme parameter. Hvis populationsfordelingen er symmetrisk er både stikprøve-median og -gennemsnit estimatorer for populations-middelværdien.

yyyy n

En god estimator En god estimator har typisk følgende egenskaber:

Den er Unbiased – dvs. at estimatoren i gennemsnit er lig parameteren.

Den er Efficient – dvs. fejl-marginen bliver mindre jo mere data der er til rådighed.

Eksempel: Stikprøve-gennemsnittet y er en unbiased og efficient estimator for populationsmiddelværdien m.

Eksempel: Stikprøve-medianen er en biased estimator for populationsmiddelværdien, hvis fordelingen ikke er symmetrisk.

Notation – en på hatten

Generelt vil vi betegne en estimator med en ”hat” ^. Fx. betegner m en estimator for m.^

Konfidensinterval Motivation:

Ifølge undersøgelse: 54% er vilde med pålægschokolade! (Et punkt-estimat)

Spørgsmål: Hvor sikkert er dette estimat?

Konfidensinterval Et konfidensinterval angiver et interval, hvor vi tror

parameteren ligger med en vis sikkerhed. Sandsynligheden for at vores stikprøve fører til et

konfidensinterval, der indeholder parameteren betegnes konfidensniveauet.

Konfidensniveauet er typisk 0.95 eller 0.99.

Konfidensinterval: Typisk opskrift I mange tilfælde er stikprøvefordelingen for

estimatoren (tilnærmelsesvis) normalfordelt. Fx stikprøvegennemsnittet.

I disse tilfælde er konfidensintervallet givet ved

punkt-estimat ± fejl-margin

Spørgsmål: Hvordan finder vi fejl-marginen?

Konfidensinterval for andele Notation

p : populations-andel p : stikprøve-andel

Bemærk: p er en estimator for p.

Antag y = 1 : succes / vild med pålægschokolade y = 0 : fiasko / ikke vild med pålægschokolade

Vi har

P(1) = p og P(0) = 1-p. Middelværdi og standard-afvigelse for y (populationen) er hhv.

m = p og s = √ (1- )p p

Andelen er et gennemsnit

Bemærk:

Dvs. stikprøve-andelen er et stikprøve-gennemsnit!

For stikprøve-gennemsnit ved vi at standard-fejlen

er så for stikprøve-andelen er den

yyy i in

Konfidensinterval for p for stort n Da p er et gennemsnit siger CLT, at p ca. følger en

normalfordeling hvis n bare er stor nok.

Med 95% sandsynlighed vil p falde i intervallet

Omvendt: Med 95% sandsynlighed vil p ligge i intervallet

ˆ96.1

ˆ96.1ˆ

196.1ˆ

Konfidens-interval: En figurStikprøvefordelingen for p

196.1ˆ

Konfidensinterval I praksis kender vi ikke p, dvs. vi kender ikke standard

fejlen:

I stedet for p bruger vi estimatet p :

Et 95% konfidens-interval for p er nu givet ved

se = ”standard error” = standardfejlen.

n)1(ˆ

se 96.1

nse )ˆ1(ˆ

Eksempel

Setup: Af 1200 adspurgte i Florida svarer 396 ja til reduktion af abortrettigheder.

Spørgsmål: Find et 95% konfidensinterval for populations-andelen af ja-sigere.

95% konfidensinterval:

-3 -2 -1 0 1 2 3

Hvad med et 99% konf. interval? Et 99% konfidensinterval:

Et (1-a)100% konfidensinterval

se 58.2

zˆ1ˆ

-3 -2 -1 0 1 2 3

Egenskaber ved konfidensintervaller:o Jo højere konfidensniveau, jo større z og jo længere

konfidens-intervalo Jo større stikprøve (n) jo kortere konfidensintervalo Firdobling af n sikre halvering af konfidensinterval.

z=2.58

(1- )100%a

( /2)100%a

Konfidensinterval for middelværdi Ingredienser:

m : Populations-middelværdi y : Stikprøve-gennemsnit

y er et punktestimat for m.

For store stikprøver er y normalfordelt. Standardfejlen er altid

hvor s er standard-afvigelsen for populationen. Den estimerede standard-fejl er

Eksempel Konfidensinterval for middelværdi er

Eksempel: På et spørgsmål om antal seksuelle partnere blandt n = 231

kvinder, var gennemsnittet y = 4.96 og standard-afvigelsen s = 6.81.

Find et 95% konfidensinterval for populations-middelværdien m.

ssesezy hvor ,

Konfidensinterval for middelværdi – små stikprøver Antag: populationen er normal-fordelt. Da er y normalfordelt – uanset stikprøve-størrelse n. Hvis vi kender pop. standard-afvigelsen s er et

(eksakt) konfidensinterval givet ved

Hvis s er ukendt, erstatter vi med stikprøve standard-afvigelsen s.

Problem: For små stikprøver medfører brugen af s i stedet for s en ekstra usikkerhed.

Løsning: Erstat z med t…!

-4 -2 0 2 4

t-fordelingen t-fordelingen er

Klokkeformet og symmetrisk omkring 0 Standard-afvigelsen er lidt større end 1 Faconen afhænger af antal frihedsgrader (df). Har lidt ”tykkere haler” end standard normalfordelingen. Ligner en normalfordeling jo højere antal df er.

df = 2

df = 6N(0,1)

-3 -2 -1 0 1 2 3

Konfidensinterval for små stikprøver

1-a/2a/2a

t /2at /2a

For en normalfordelt population er et (1-a)100% konfidensinterval for m

hvor df = n-1.n

ssesety hvor ,2/

Eksempel:

Vi har observeret 29 vægtændringer, hvor y = 3.01 og s = 7.31. Find et 95% konf. interval for m :

Løsning:

df = n-1 = 28, a = 0.025, så t0.025 = 2.048

t-tabellen

Se Tabel B i bogen side 593.

I SPSS SPSS: Analyze→Compare Means→One-Sample T-

Test…

Valg af stikprøvestørrelse

Hvordan vælger man stikprøvestørrelse n så vi opnår en Given fejl-margin ved et Givet konfidensniveau

Eksempel: Vi ønsker at bestemme et konfidensinterval for p, så

Fejl-margin : Max 0.04 Konfidensniveau : 95%

Løsning:

Generel løsning for andele For at populationsandel p vælg

Fejl-margin: M Signifikansniveau: (1-a)100%

Stikprøvestørrelsen skal da være:

-3 -2 -1 0 1 2 3

(1- )100%a

Hvis populations-andelen p er helt og aldeles ukendt bruges p = 0.5 i formlen.

For middelværdien m vælg Fejl-margin: M Signifikansniveau: (1-a)100%

Stikprøvestørrelsen skal da være:

Generel løsning for middelværdi

(1- )100%a

z-3 -2 -1 0 1 2 3

-3 -2 -1 0 1 2 3

Hvis populations-standardafvigelsen s er man nød til at gætte sig frem til. Hellere lidt for stor end for lille.

Eksempel Middel antal års uddannelse blandt indianere Ønsker:

Fejl-margin: M = 1år Konfidensniveau: 99%

Først skal vi gætte s ! Vi tror (næsten) alle har mellem 5 og 20 års uddannelse… Derfor er vores gæt s = 2.5 år…!

Anvendt Statistik Lektion 3

Documents

Transcript of Anvendt Statistik Lektion 3

Statistik über stationäre Pflegeeinrichtungen (Pflegeheime) · Amt für Statistik Berlin Brandenburg 3 Statistik über stationäre Pflegeeinrichtun-gen (Pflegeheime) A Erläuterungen

Schritte plus 1+2, Spielesammlung...Schritte plus 2 zu Lektion 8 95 zu Lektion 9 97 zu Lektion 10 99 zu Lektion 11 101 zu Lektion 12 103 zu Lektion 13 105 zu Lektion 14 107 Schritte

Email Marketing Lektion 3: Optimierung deiner Landingpage

Tyskundervisning 8. klasse LEKTION 3 Im Restaurant

Tangram aktuell im Internet - Hueber · Spiel zu Tangram aktuell 1, Lektion 3 Würfelspiel 1. LEKTION 3 Spiel zu Tangram aktuell 1, Lektion 3 2 3 2 Felder 1 Leere Felder: Bleiben

Die Agentur, en DM Lektion 3: Kultur. das Drehbuch,¨er DM Lektion 3: Kultur.

unterritsplAn lektiOn 1 - Hueber...3 unterritsplAn lektiOn 1 Sicher Bff/1, Unterrichtsplan Lektion 2 ff012 Hueber Verlag, Autorin: Claudia Böschel Schreiben 1 Sophies Geburtstag SOZIALFORM

Lektion 4 Mangelhafte Verträge (§ 3, I - IV) Privatrecht II.

App Design Lektion 3 Charlotte Lærke Weitze

Kurs-Übersicht „Liedbegleitung für Einsteiger“ - www ... · I-FE Lektion 15 Fingerpicking 2 I-FE Lektion 16 Fingerpicking 3, A-Dur I-FE Lektion 17 Die offenen Akkorde im Oberblick

Statistik der Adoptionen - statistik-berlin-brandenburg.de · Amt für Statistik Berlin Brandenburg 3 Statistik der Adoptionen A Erläuterungen Allgemeine Angaben Die Statistik der

Lektion 1 Lektion 2 Lektion 3 Seite 36 - Klett.huDas mag ich! Mein Name ist Brot. Toastbrot. Clip 1–2 Clip 3–4 Clip 5–6. 9. Lektion 4 Seite 48 Lektion 5 Seite 60 Lansdeskunde

Statistik der Banken und sonstigen Finanzinstitute ... · Deutsche Bundesbank Statistik Richtlinien Januar 2019 3 Triennial Survey OTC- Derivate Statistik Allgemeine Richtlinien Kreditnehmer-statistik

°ÂÚÌ·ÓÈÎ¿ Deutsch - ein Hit! - pi-schools.gr · Lektion 1 Anhang Ü-Material zu L1 Anhang Lektion 2 Anhang Ü-Material zu L2 Anhang Lektion 3 Anhang Ü-Material zu L3 Anhang

Lektion 3 · 2020. 10. 15. · heilungswerk ⏐ Lektion 3 ⏐ Seite 1 ⏐ Veit Lindau | homodea.com Lektion 3 Emotionale Heilung und Nähe Emotionale Heilung bedeutet, alle Emotionen

Attraktiv DM Lektion 1. anhänglich DM Lektion 1 bescheiden DM Lektion 1.

Buchner informiert - Schulbuchverlag C.C. · PDF fileLektion 7 Lektion 8 Lektion 9 Lektion 10 Lektion 11 Lektion 12 Lektion 13 Lektion 14 Lektion 15 Lektion 16 Lektion 17 ... 1 candela

3. Lektion - instructioneducation.info · 1 3. Lektion Einleitung Damit sich Ihr Ohr an den Klang des Hebräischen gewöhnt, gebe ich Ihnen zwei Links, unter denen Sie gesprochenes

Kursbuch, Lektion 3

LANDESFEUERWEHRSCHULE Folie 1 © Der Wohlfühlweg zum Laufen – Lektion 3 Wie trainiere ich richtig ? auf dem Wohlfühlweg zum Laufen Lektion 3 – die 3. Woche.