Binomialverteilung und Anwendungendidaktik.mathematik.hu-berlin.de/files/binomial_2010_h.pdf ·...
Transcript of Binomialverteilung und Anwendungendidaktik.mathematik.hu-berlin.de/files/binomial_2010_h.pdf ·...
Binomialverteilung und Anwendungen
Elke Warmuth
Humboldt-Universitat Berlin
Sommersemester 2010
1 / 61
Unabhangigkeit von Ereignissen
1 Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
2 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Kolmogorow:”The concept of mutual independence of two or
more experiments holds, in a certain sense, a central position inthe theory of probability....Historically, the independence of experiments and random variablesrepresents the very mathematical concept that has given the theoryof probability its peculiar stamp.“
Quelle: A. N. Kolmogorov: Foundations of the Theory of Probability. New York: Chelsea Publishing Company, 1950.
3 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Was soll erfasst werden?
Ereignisse A und B haben folgende Eigenschaft:
Information uber das Eintreten von A beeinflusst unsere Bewertungder Chancen fur das Eintreten von B nicht.
Prototypen: Ziehen mit und ohne Zurucklegen
4 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
R1 – rote Kugel im 1. Zug, R2 – rote Kugel im 2. Zug
ohne Zurucklegen mit Zurucklegen
P(R2) = 310 P(R2) = 3
10
P(R2|R1) = 29 < 3
10 P(R2|R1) = 310
5 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Ziehen ohne Zurucklegen:
P(R1|R2) =P(R1 ∩ R2)
P(R2)=
310 ·
29
310
=2
9
Die Information daruber, dass die zweite Kugel rot ist, verandertdie Chancen fur eine rote Kugel im ersten Zug. Es istwahrscheinlicher, dass die erste Kugel weiß war.
Real ist R1 unbeeinflusst von R2, aber stochastisch, im Sinne derChancen, schon.
Provisorische Festlegung: Das Ereignis A ist stochastischunabhangig vom Ereignis B mit P(B) > 0, falls
P(A|B) = P(A)
gilt.
6 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Folgerungen aus der provisorischen Festlegung fur P(A) und P(B)positiv:
A unabhangig von B⇔ P(A|B) = P(A)
⇔ P(A ∩ B)
P(B)= P(A)
⇔ P(A ∩ B) = P(A) · P(B)
⇔ P(A ∩ B)
P(A)= P(B)
⇔ P(B|A) = P(B)
A unabhangig von B genau dann, wenn B unabhangig von A,stochastische Unabhangigkeit ist symmetrisch in A und B⇒ endgultige Definition
7 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Definition: Unabhangigkeit zweier Ereignisse
Zwei Ereignisse A und B heißen (stochastisch) unabhangig, fallsdie Produktformel
P(A ∩ B) = P(A) · P(B)
gilt.
Symmetrie
ohne Voraussetzung P(A) > 0 bzw. P(B) > 0.
Aspekte von Unabhangigkeit
Unabhangigkeit als Modellannahme
Unabhangigkeit in einem Modell nachweisen
8 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
gutes Beispiel:
Quelle: Barth, Haller: Stochastik Leistungskurs. Munchen: Oldenbourg Schulbuchverlag, 1998
Sehr empfehlenswertes Lehrbuch (fur Lehrerinnen und Lehrer)
9 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
schlechtes Beispiel:
Quelle: Mathematik. Band 2. Sachsen-Anhalt. Berlin: Cornelsen Verlag, 2005
10 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Begriff Unabhangigkeit festigen
Unabhangigkeit und Unvereinbarkeit
Unabhangigkeit in Vierfeldertafel
Beispiele und Gegenbeispiele
Verallgemeinerung auf n Ereignisse
Unabhangigkeit von Vorgangen
11 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Unabhangigkeit und Unvereinbarkeit
i.A. krasse Abhangigkeit:Eintreten von A macht Eintre-ten von B unmoglich und um-gekehrt.
Nagelprobe fur inhaltlichesVerstandnis
12 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Ausnahme: P(A ∩ B) = P(A) · P(B)0 = P(A) · P(B)P(A) = 0 oder P(B) = 0
Ereignisse mit Wahrscheinlichkeit 0 sind von allen Ereignissenunabhangig.
Ereignisse mit Wahrscheinlichkeit 1 auch. Sei namlichP(A) = 1
P(A) · P(B) = P(B) = P(B ∩ A) + P(B ∩ A) = P(B ∩ A)
Entspricht das inhaltlichem Verstandnis?
13 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Unabhangigkeit in Vierfeldertafel
A A
B P(A) · P(B) P(B)
B P(B)
P(A) P(A) 1
P(B)− P(A) · P(B) = P(B) [1− P(A)] = P(B) · P(A)
14 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Unabhangigkeit in Vierfeldertafel
A A
B P(A) · P(B) P(A) · P(B) P(B)
B P(A) · P(B) P(A) · P(B) P(B)
P(A) P(A) 1
Aus der Unabhangigkeit fur ein”Parchen“ folgt die
Unabhangigkeit fur alle anderen.
15 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Beispiele und Gegenbeispiele
1. Zweimaliges Wurfeln mit einem fairen Wurfel
A – erster Wurf 6, B – zweiter Wurf 3
Unabhangigkeit als Modellierungselement:
Argumentation: Das Eintreten von A beeinflusst die Chancenfur das Eintreten von B nicht (Gedachtnislosigkeit).
⇒ P(A ∩ B) =1
6· 1
6
Unabhangigkeit in einem Modell nachprufen:
Ω = (w1,w2) : w1,w2 ∈ 1, 2, . . . , 6Annahme: gleichwahrscheinlich, |Ω| = 36|A| = |B| = 6, |A ∩ B| = 1 ⇒ P(A ∩ B) = P(A) · P(B)⇒ A und B unabhangig
16 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
2. Zweimaliges Wurfeln mit einem fairen Wurfel
A – Augensumme gerade, B – zweite Augenzahl gerade
Was sagt die Intuition?
Ω = (w1,w2) : w1,w2 ∈ 1, 2, . . . , 6
Annahme: gleichwahrscheinlich, |Ω| = 36
P(A) = 1836 ,P(B) = 1
2
A ∩ B = (2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6)
⇒ P(A ∩ B) = 936 = 1
4 = P(A) · P(B)
⇒ A und B stochastisch unabhangig,
obwohl reale gegenseitige Beeinflussung von A und B.
17 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
3. Test auf Unabhangigkeit
Verungluckte Verkehrsteilnehmer bei Verkehrsunfallen in Berlin vonJanuar bis Juli 2006
Quelle: http://www.statistik-berlin.de/home.htm
unter 15 ab 15
mannlich 369 4716 5085
weiblich 288 3733 4021
657 8449 9106
1√9106
≈ 0, 01, sinnvoll runden
18 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
unter 15 ab 15
mannlich 0, 04 0, 52 0, 56
weiblich 0, 03 0, 41 0, 44
0, 07 0, 93 1, 00
0, 07 · 0, 56 ≈ 0, 04
Spricht fur Unabhangigkeitsannahme
Frage: Wie große Abweichungen von der Produktformel sind nochmit Zufallsschwankungen vertraglich?Typische Fragestellung bei statistischem Test.
19 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Was soll erfasst werden?
Information uber das Eintreten von A beeinflusst unsereBewertung der Chancen fur das Eintreten von B bzw. Cnicht.Analog B und C . Kurz paarweise Unabhangigkeit:
P(A ∩ B) = P(A) · P(B)P(A ∩ C ) = P(A) · P(C )P(B ∩ C ) = P(B) · P(C )
Aber auch: Information uber das Eintreten von A ∩ Bbeeinflusst unsere Bewertung der Chancen fur das Eintretenvon C nicht:
P((A ∩ B) ∩ C ) = P(A ∩ B) · P(C )P(A ∩ B ∩ C ) = P(A) · P(B) · P(C )
20 / 61
Unabhangigkeit von EreignissenBedeutung der UnabhangigkeitUnabhangigkeit von zwei EreignissenUnabhangigkeit von 3 Ereignissen
Definition: Vollstandige Unabhangigkeit von drei Ereignissen
Drei Ereignisse A, B und C heißen (vollstandig stochastisch)unabhangig, falls die folgenden Produktformeln
P(A ∩ B) = P(A) · P(B) (1)P(A ∩ C ) = P(A) · P(C ) (2)P(B ∩ C ) = P(B) · P(C ) (3)P(A ∩ B ∩ C ) = P(A) · P(B) · P(C ) (4)
gelten.
Weder die Gleichungen (1) bis (3) zusammen, noch die Gleichung(4) alleine reichen aus fur vollstandige Unabhangigkeit.
Naheliegende Verallgemeinerung auf n Ereignisse.
21 / 61
Bernoulli-Ketten
2 Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
22 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Unabhangige Experimente
Was heißt eigentlich”unabhangige Wiederholungen eines
Experiments“ oder auch”unabhangige Teilexperimente“?
Vorstellung: Gesamtexperiment besteht aus n Teilexperimenten.
Welche Eigenschaft musste das Modell dieses Gesamtexperimentshaben, wenn die Teilexperimente unabhangig heißen sollen?
23 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Halbformale Definition
Teilexperimente heißen unabhangig, wenn beliebige Ereignisse, dieetwas uber die Ausgange verschiedener Teilexperimente aussagen,unabhangig sind. Wenn A1 zum ersten, A2 zum zweiten, ..., An
zum n-ten von n unabhangigen Teilexperimenten gehort, dann giltdie Produktformel
P(A1 ∩ A2 ∩ . . . ∩ An) = P(A1) · (A2) · . . . · P(An).
Genau diese Situation liegt bei Bernoulli-Ketten vor.
24 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Quelle: Mathematik. Band 2. Sachsen-Anhalt. Berlin: Cornelsen Verlag, 2005
25 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Was heißt”in exakt gleicher Weise“
Warum wird der eingefuhrte Begriff”Unabhangigkeit“ nicht
benutzt?
Bernoulli-Kette
Vorgange mit zufalligem Ergebnis, bei denen nur zwischen Erfolg(1) und Misserfolg (0) unterschieden wird, heißenBernoulli-Experimente oder Bernoulli-Versuche.
Wird ein Bernoulli-Experiment mit derselbenErfolgswahrscheinlichkeit n mal unabhangig voneinanderausgefuhrt, so entsteht eine Bernoulli-Kette der Lange n mit derErfolgswahrscheinlichkeit p.
26 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Jakob Bernoulli (1654-1705)
Ars conjectandi (1713)
Schweizer Briefmarke 1994
Quelle: www.fh-friedberg.de/.../marke04 09 bild01.jpg”
Bernoulli-Ketten u.a. als Rahmen fur den Beweis des Gesetzes dergroßen Zahlen
27 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Bernoulli-Experiment: Ω = 0, 1,P(1) = p, 1.= Erfolg
Bernoulli-Kette:
Ergebnismenge: Ω = w = (w1, . . . ,wn) : wi ∈ 0, 1
Einzelwahrscheinlichkeiten:
P((w1, . . . ,wn)) = pAnzahl der Einsen·(1−p)Anzahl der Nullen
(Unabhangigkeit)
P(nur Erfolge) = p · p · . . . · p = pn
P(nur Misserfolge) = (1− p) · (1− p) · . . . · (1− p) = (1− p)n
P(genau einen Erfolg) = n · p · (1− p)n−1
P(genau k Erfolge) =(nk
)pk(1− p)n−k
Bernoulli-Experimente zeitlich parallel oder nacheinander
28 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Beispiele und Gegenbeispiele
Wurfeln, Erfolg – 6
Ziehen mit Zurucklegen, Erfolg – rote Kugel
Tageshochsttemperatur an aufeinanderfolgenden Tagen imJuli in Berlin, Erfolg – Sommertag
Multiple-Choice-Test, Erfolg – richtige Antwort
Totoschein 13er-Wette, Erfolg – richtiger Tipp
kleine Stichproben ohne Zurucklegen aus großenGrundgesamtheiten, Erfolg – Merkmal liegt vor
1000 Buchstaben eines Textes auswerten, Erfolg – Vokal
Elfmeterschusse, Erfolg – Tor
29 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
realer Vorgang als Bernoulli-Kette:
Unabhangigkeit der Teilvorgange
gleichbleibende Erfolgswahrscheinlichkeit
in der Regel idealisierende Annahmen, deshalb Modellkritikwichtig
aber
auch einfache Modelle konnen helfen Einsichten zu gewinnen
einfache Modelle als erster Schritt
PS: Wir lassen die Pfadregeln hinter uns.
30 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Zufallsgroßen als Modellierungswerkzeuge nutzen!
Xi =
1 falls i-ter Teilversuch Erfolg, d.h. wi = 10 falls i-ter Teilversuch Misserfolg, d.h. wi = 0
Xi unabhangig und identisch verteilt mit
P(Xi = 1) = p, E (Xi ) = p, Var(Xi ) = p(1− p)
Anzahl der Erfolge Sn = X1 + X2 + . . . + Xn
P(Sn = k) =(nk
)pk(1− p)n−k
E (Sn) = E (X1) + E (X2) + . . . + E (Xn) = np (Additivitat)
Var(Sn) = Var(X1) + Var(X2) + . . . + Var(Xn) = np(1− p)
(Additivitat bei Unabhangigkeit)
31 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
kσ-Intervalle
Mit σn =√
np(1− p) gilt fur große n
P (np − kσn ≤ Sn ≤ np + kσn) ≈
0, 683 k = 10, 954 k = 20, 997 k = 3
nur experimentell uberprufbar ⇒ experimentell uberprufen!
Faustregel fur Anwendung np(1− p) > 9
Wahrscheinlichkeiten fest, Lage und Lange der Intervalleabhangig n und p
Kleine Standardabweichung ⇒ kurze Intervalle
große Standardabweichung ⇒ lange Intervalle
sehr schone Interpretation von Erwartungswert undStandardabweichung
32 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Beispiele fur 2σ-Intervalle
33 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
B(50; 0, 3) : 15± 6 und B(150; 0, 3) : 45± 11
Intervalllange wachst mit n. Wachstum mit Großenordnung√
n.34 / 61
Bernoulli-KettenUnabhangigkeit von ExperimentenModell Bernoulli-KetteGestalt der Binomialverteilung
Exakte Aussagen uber kσ-Intervalle
Tschebyschewsche Ungleichung:
P(|X − EX | ≥ ε) ≤ VarXε2
⇔ P(|X − EX | < ε) ≥ 1− VarXε2
X ∼ B(n; p) und ε = kσ
P(|X − np| < kσ) ≥ 1− np(1−p)k2np(1−p)
≥
0 k = 10, 75 k = 20, 89 k = 3
35 / 61
Normalverteilung als Grenzfall der Binomialverteilung
3 Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
36 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
fur große n:E (Sn) → ∞
Var(Sn) → ∞
σn → ∞
Verteilungen (Histogramme)”fließen auseinander“, aber
Gesamtflache 1
Standardisierung in drei Schritten:
1. Zentrieren: Sn − np
2. Stauchen der Intervallbreite:Sn − np√np(1− p)
3. Strecken der Saulenhohe
Anpassung einer universellen Kurve an die standardisiertenHistogramme
37 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
1. Zentrieren
38 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
2. Stauchen und 3. Strecken
39 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
Beim 2. Schritt entstehen reelle Zahlen, die keine naturlichen sind:
Sn = k
⇔ k − 0, 5 ≤ Sn ≤ k + 0, 5
⇔ k − 0, 5− np ≤ Sn − np ≤ k + 0, 5− np
⇔ k − 0, 5− np
σn≤ Sn − np
σn≤ k + 0, 5− np
σn
Somit
P(Sn = k) = P
(k − 0, 5− np
σn≤ Sn − np
σn≤ k + 0, 5− np
σn
)= pk
±0, 5 – Stetigkeitskorrektur
40 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
P(Sn = k) = P
(k − 0, 5− np
σn≤ Sn − np
σn≤ k + 0, 5− np
σn
)= pk
Intervallbreite:k + 0, 5− np − (k − 0, 5− np)
σn=
1
σn41 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
Intervallbreite: 1σn
Saulenflache := pk , folglich Saulenhohe = pk · σn
universelle Kurve: ϕ – Gaußsche Glockenkurve
42 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
Quelle: www.geogebra.org/de
ϕ(x) = 1√2π
e−x2
2
X ∼ N(0, 1): P(a ≤ X ≤ b) =b∫a
ϕ(x)dx = φ(b)− φ(a)
siehe auch www.geogebra.org/de/examples/normalverteilung/normalverteilung.html
43 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
Grenzwertsatz von de Moivre-Laplace
Sei Sn ∼ B(n, p) mit 0 < p < 1. Dann gilt fur alle α < β
limn→∞
P
(α ≤ Sn − np√
np(1− p)≤ β
)= φ(β)− φ(α)
Praktische Anwendung:
Ersetze das n-te Folgeglied durch den Grenzwert
44 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
P(a ≤ Sn ≤ b) (∗)
= P(a− 0, 5 ≤ Sn ≤ b + 0, 5) Stetigkeitskorrektur
= P
(a−0,5−np√
np(1−p)≤ Sn−np√
np(1−p)≤ b+0,5−np√
np(1−p)
)Standardisierung
≈ φ
(b−0,5−np√
np(1−p)
)−(
a+0,5−np√np(1−p)
)Approximation
auf schwache Ungleichungen im Ansatz (*) achten
Stetigkeitskorrektur bei großen σn vernachlassigbar
Faustregel fur die Approximation: np(1− p) > 9
45 / 61
Normalverteilung als Grenzfall der BinomialverteilungStandardisierenStandardnormalverteilungGrenzwertsatz von de Moivre-Laplace
2σ-Intervalle:
P (np − 2σn ≤ Sn ≤ np + 2σn)
= P
(−2 ≤ Sn − np
σn≤ 2
)≈ φ(2)− φ(−2)
≈ 0, 954
Beispiel
X ∼ B(600, 1
6
),E (X ) = 100,Var(X ) = 500
6 , σ ≈ 9, 13
100− 2σ = 81, 74, 100 + 2σ = 118, 26
2σ-Intervall: [82; 118]
exakt: P(82 ≤ X ≤ 118) = 0, 958
46 / 61
AnwendungenPS
4 AnwendungenVerdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
5 PS
47 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Verdeckte Befragung
Prozentsatz sozial unerwunschter, peinlicher oder strafbarerHandlungen soll geschatzt werden
ehrliche Antworten auf direkte peinliche Fragen nicht zuerwarten
S. L. Warner (1965): RRT, Idee: verstarke das Gefuhl vonAnonymitat
W. R. Simmonds (1967): Unrelated Question Model, wieRRT, aber unverfanglicher.
P. T. Liu, L. P. Chow (1976): Quantitative RandomizedResponse Model
48 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Beispiel
Gesucht: Prozentsatz der Studierenden, die schon einmal beieiner Prufung betrogen haben
Befragungsdesign:
10 Kartchen: 7 mit der Aufforderung”Sagen Sie Ja!“ (Typ A)
3 mit der Frage”Haben Sie schon einmal bei einer Prufung
betrogen?“ (Typ B)
Kartchen auf der Ruckseite gleich.
befragte Person zieht eine Karte
Annahme: Die Befragten folgen der Aufforderung bzw.antworten wahrheitsgemaß.
Was spricht dafur, dass Befragte bei dieser Form eher ehrlichantworten?
Worin bestehen Nachteile dieses Verfahrens?
49 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Modell
π – Anteil der Typ-B-Karten, p – unbekannter Anteil derBetruger
P(Ja) = 1− π + π · pp – Schatzwert fur p aus einer großen Anzahl n von Befragten
Ansatz P(Ja) = hn(Ja) liefert p =hn(Ja)− 1 + π
π
50 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Eigenschaften des Schatzers p
Arbeiten im Modell, Nutzen von Zufallsgroßen, Eigenschaften vonErwartungswert und Varianz
p ist eine Zufallsgroße, E (p) =?,Var(p) =?
E (p) = E(
hn(Ja)−1+ππ
)= E(hn(Ja))−1+π
π
Var(p) = Var(
hn(Ja)−1+ππ
)= Var(hn(Ja))
π2
hn(Ja) = Snn , Sn – Anzahl der Ja-Antworten
E (hn(Ja)) = 1nE (Sn)
Var(hn(Ja)) = 1n2 Var(Sn)
51 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Verteilung von Sn – Anzahl der Ja-Antworten?
Annahmen:
1. Befragungen der n Personen sind unabhangige Teilexperimente2. Jede Person antwortet mit Wahrscheinlichkeit p auf eine
B-Frage mit”Ja“
Dann Sn ∼ B(n, 1− π + πp)
E (Sn) = n(1− π + πp),Var(Sn) = n(1− π + πp)(π − πp) = nπ(1− π + πp)(1− p)
Einsetzen in die bereitgestellten Formeln liefert
E (p) = p
Var(p) =p(1− p)
n+
(1− π)(1− p)
πn
52 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Diskussion der Eigenschaften des Schatzers
E (p) = p – im Mittel schatzen wir richtig
Var(p) =p(1− p)
n+
(1− π)(1− p)
πn
π = 1 bedeutet direkte BefragungVarianz erhoht sich durch RRT
p, n fest: Erhohung um so großer, je kleiner π
psychologisch gut ist π = 0, 5
53 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Zahlenbeispiel
n = 2000, π = 0, 5
p =h2000(Ja)− 0, 5
0, 5= 2 · h2000(Ja)− 1
Var(p) =p(1− p)
2000+
1− p
2000=
1− p2
2000≤ 1
2000
Genauigkeit der Schatzung: σ(p) ≤ 0, 022
Beispiel: hn(Ja) = 0, 67 liefert p = 2 · 0, 67− 1 = 0, 34
2σ-Intervall fur das unbekannte p: [0, 30; 0, 38].
Literaturhinweise:
K.Kruger: Wahrheit oder Pflicht. In: mathematik lehren, Heft 125, August 2004
A. Engel: Stochastik. Stuttgart: Klett, 1987
54 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Qualitatskontrolle des Ausschussanteils p bei Massenproduktion
Sollwert p ≤ 0, 05 durch zufallige Stichprobe vom Umfang nkontrolliert
X – Anzahl Ausschussteile in der StichprobeAnnahme: X ∼ B(n, p)
bei p = 0, 05 gilt EX = n · 0, 05 und σ =√
n · 0, 05 · 0, 95
Wenn K = X > n · 0, 05 + 2σ eintritt, dann Postenablehnen.
”Zu viel Ausschuss!“
Wenn p = 0, 05 gilt, dann P(K ) ≈ 0, 023 (2σ-Intervall)
Herstellerrisiko: Es kann sein, dass K eintritt, obwohlp ≤ 0.05. Chance: 2,3%
Abnehmerrisiko: Es kann sein, dass K nicht eintritt, obwohlp > 0, 05.
55 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Herstellerrisiko und Abnehmerrisiko konkurrieren!
56 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Abnehmerrisiko umso großer, je naher p an 0,05.
Abnehmer gibt einen fur ihn gerade noch ertraglichenAusschussanteil π > 0, 05 und eine Risikowahrscheinlichkeit βan, so dass gilt:
Pπ(K ) ≤ β,
d.h. schlechter Posten wird hochstens mit Wkeit β nichtzuruckgewiesen.
erfullbar nur durch genugend großes n
57 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Wahlen π = 0, 07 und β = 0, 1:
Pπ(X ≤ n · 0, 05 + 2σ) ≤ 0, 1
⇔ Pπ(X − n · 0, 07 ≤ n · 0, 05 + 2σ − n · 0, 07) ≤ 0, 1
⇔ Pπ
(X−n·0,07√
n·0,07(1−0,07)≤ n(0,05−0,07)+2σ√
n·0,07(1−0,07)
)≤ 0, 1
Normalapproximation:
φ
(n(0,05−0,07)+2σ√
n·0,07(1−0,07)
)≤ 0, 1
⇔ 1− φ(
0,02n−2σ√n·0,07·0,93
)≤ 0, 1
⇔ φ(
0,02n−2σ√n·0,07·0,93
)≥ 0, 9
58 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
⇔ φ
(0, 02
√n − 2σ√
0, 07 · 0, 93
)≥ 0, 9
⇔ 0, 02√
n − 2√
0, 05 · 0, 95√0, 07 · 0, 93
≥ 1, 28
n ≥ 1554
Ablehnungsbereich K = X > 87 sichert Herstellerrisiko vonhochstens 2, 3% und Abnehmerrisiko bei p = 0, 07 von 10%.
59 / 61
AnwendungenPS
Verdeckte BefragungStatistische QualitatskontrolleWeitere Beispiele
Weitere Beispiele
Uberbuchung
u.a. in:”Einheitliche Prufungsanforderungen in der
Abiturprufung – Mathematik“ (Beschluss der KMK vom24.05.2002)
Sammelproben
Kernzerfall
Irrfahrten
Mendelsche Gesetze
Wahlen
60 / 61
AnwendungenPS
Sunday, November 16, 2008Lieber Steini,als wir dieses Wochenende ein Spiel na-mens
”Abenteuer Menschheit“ (ahnlich wie
”Siedler von Catan“) spielten, beschwerte
sich mein kleiner Bruder ,dass mein Vaterviel mehr Karten bekam als er. Nach demSpiel berechnete ich aber die Wahrscheinlich-keit fur jede Farbe (rot, orange, blau, weiß) eine Karte zu bekommen (bei einen malwurfeln, mit zwei Wurfeln). Eine Karte be-kommt man, wenn ein Stamm (sieht so aus,wie eine Flamme; s. Bild) deiner Farbe an ei-nem Feld steht, worauf die Zahl zusehen ist,die gewurfelt wurde. Mein keiner Bruder hat-te blau und mein Vater rot. Aber nach derAusrechnung kam raus, dass WEISS (Mama)die beste Wahrscheinlichkeit von 27
36( 3
4) hat-
te und alle anderen Farben eine von 2636
( 1318
)hatten, eine Karte bei einen mal wurfelnzu bekommen. Ab jetzt an, kann ich wegender Wahrscheinlichkeitsrechnung viel strate-gischer gegen meine Familie spielen.Danke. Gruss Florian
61 / 61