Verklarende Statistiek: Toetsen

Post on 12-Sep-2021

10 views 0 download

Transcript of Verklarende Statistiek: Toetsen

Verklarende Statistiek:Toetsen

Zat ik nou in dat kritische gebied of

niet?

Toetsen, Overzicht

Nulhypothese - Alternatieve hypothese(voorbeeld: toets voor p = po in binomiale steekproef)

Betrouwbaarheid en significantieniveauEenzijdig of tweezijdig toetsenProcedure - BeslisregelOverschrijdingskans

Nulhypothese- Alternatieve HypotheseNulhypothese Ho:

De hypothese die we met een toets, uitgevoerd op een steekproef, proberen te verwerpen.

Als dat lukt gaan we over op de Alternatieve hypothese H1

H1: Er zijn NIET evenveel mannelijke als vrouwelijke biologie studenten

Ho: Er zijn evenveel mannelijke als vrouwelijke biologie studenten

We plannen een steekproef ....

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is NIET 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5

De nul- en alternatieve hypothesen, Ho en H1, zeggen iets over een parameter van de kansverdeling van de variabele die we meten.

Het kiezen van een nulhypothese

•Ho en H1 zijn disjunct

De formulering is belangrijk en  moet precies zijn.

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

(1−α )-voorspellingsinterval

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

We verwerpen de nulhypothese niet als de gevonden toetsingsgrootheid in het (1−α)-voorspellingsinterval ligt.

(1−α )-voorspellingsinterval

Eenzijdig of tweezijdig toetsenTweezijdig toetsen:

De waarden die voldoen aan de alternatieve hypothese kunnen zowel groter als kleiner zijn dan die van de

nulhypothese

Ho : θ = θo H1 : θ ≠ θo

Tweezijdig:

Ho: θ ≤ θo

H1: θ > θo

Ho samengesteld:

Eenzijdig toetsen:

De waarden die voldoen aan de alternatieve hypothese zijn altijd

groter (of altijd kleiner) dan die van de nulhypothese

Eenzijdig:

Ho: θ = θo

H1: θ > θo

Ho enkelvoudig:

Ho: p ≤ 0.5

Ho: p = 0.5

Eenzijdig:

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is groter dan 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is kleiner dan 0.5

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is N IET 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5

Tweezijdig:

H1: p ≠ 0.5

H1: p > 0.5

Tweezijdige toets:

Ho: De kans dat een willekeurig gekozen student een man is, is 0.5.

H1: De kans dat een willekeurige student een man is, is NIET 0.5.

We toetsen aan het aantal mannen in een steekproef: k.

betrouwbaarheid 1- α is 0.95, significantieniveau α is 0.05.

We kiezen willekeurig 100 studenten: 66 vrouwen en 34 mannen.

De toetsingsgrootheid heeft dus de waarde 34.

Als Ho juist is geldt k ~ B (100, 0.5), E (k) = 50, Var(k) = 25.

We gebruiken een benadering van k met x ~ N (50, 5).

f (x)

x

E (x) = 50

Var(x) = 25

35 40 45 50 55 60 65 70

0.020.040.060.080.1

P (toetsingsgrootheid in het kritisch gebied | Ho) ≤ α

Als Ho waar is, valt de toetsingsgrootheid met kans 1-α = 0.95 in het voorspellingsinterval.

P ( 50 - 1.96 × 5 < x < 50 + 1.96 × 5 ) = 0.95

P ( 40.2 < x < 59.8 ) = 0.95

De waarden van x buiten het voorspellingsinterval [40.2, 59.8] vormen het kritisch gebied.

x

Rechts-Eenzijdige toets Ho: p ≤ 0.5

Verwerp Ho

P (x > 58.2) = 0.05

Aanvaard Ho

f (x)

35 40 45 50 55 60 65 700.020.040.060.080.1

f (x)

x

Tweezijdige toets Ho: p = 0.5

Aanvaard HoVerwerp Ho

P (x > 59.8) = 0.025

Verwerp Ho

P (x < 40.2 = 0.025)

35 40 45 50 55 60 65 700.020.040.060.080.1

0 1

Ho H1

voordeel van de twijfel: bereken met p = 0.5

0.5

P (40.2 < x < 59.8 ) = 0.95

35 40 45 50 55 60 65 700.020.040.060.080.1

terug naar de discrete verdeling van k

(met conservatieve continuiteitscorrectie):

P (39 < k < 61 ) ≥ 0.95

59.8

58 59 60 61 62 63 6437 38 39 40 41 42 43

40.2

Kritisch gebied: k ≤ 39 en k ≥ 61 . De toetsingsgrootheid k = 34 ligt in dit gebied.Ho wordt verworpen: p is NIET 0.5. Er zijn niet evenveel mannelijke als vrouwelijke biologiestudenten.

Procedure - Beslisregel1a) Stel nul - en alternatieve hypothese op (kies 1- of 2-zijdige test).

1b) kies de toetsingsgrootheid en significantieniveau α ( in de meeste gevallen wordt α = 0.05 gekozen).

2) Neem een steekproef.

3a) Bereken de toetsingsgrootheid.

3b) Bereken een voorspellingsinterval en een kritisch gebied voor de toetsingsgrootheid op basis van α en Ho.P (toetsingsgrootheid in het kritisch gebied | Ho) ≤ α.

4) Kijk of de toetsingsgrootheid in het kritisch gebied dan wel het voorspellingsinterval ligt.

•Als we α kleiner kiezen krimpt het kritische gebied.• Kritisch gebied zit vast aan de staarten van de kansverdeling voor θ=θo.

Overschrijdingskans3b) Als Ho waar is, valt de toetsingsgrootheid minstens met kans

1-α = 0.95 in het voorspellingsinterval.

Als de overschrijdingskans kleiner is dan het significantieniveau, verwerp je Ho

Andere aanpak:Bereken de kans, onder Ho, dat de toetsingsgrootheid x de

gevonden waarde x, dan wel een extremere waarde aanneemt:

de overschrijdingskans of p-waarde

rechtseenzijdige toets: p = P (x ≥ x | Ho)

linkseenzijdige toets: p = P (x ≤ x | Ho)

tweezijdige toets: p = 2 × Min[ P (x ≤ x | Ho) , P (x ≥ x | Ho) ]