Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher...

29
Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) 1

Transcript of Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher...

Page 1: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Einige Konzepte aus derWahrscheinlichkeitstheorie (Review)

1

Page 2: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Diskrete Zufallsvariablen (Random variables)

• Eine Zufallsvariable X(c) ist eine Variable (genauer eine Funktion), deren Wert

vom Ergebnis c eines Zufallsprozesses abhangt

• Eine diskrete Zufallsvariable X kann nur abzahlbar viele Zustande {x1, x2, . . .} an-

nehmen

2

Page 3: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Diskrete Zufallsvariablen (2)

• Eine Wahrscheinlichkeitsverteilung spezifiziert, mit welcher Wahrscheinlichkeit ei-

ne Zufallsvariable einen bestimmten Zustand einnimmt

• Eine Wahrscheinlichkeitsverteilung von X kann durch eine Wahrscheinlichkeits-

funktion f(x) definiert werden:

P (X = x) = P ({c : X(c) = x}) = f(x) (1)

• f(x) ist die Wahrscheinlichkeitsfunktion und x ist eine Realisierung von X. Typi-

scherweise macht man sich keine Gedanken uber den zugrundeliegenden Zufallsprozess

und man definiert einfach eine Wahrscheinlichkeitsverteilung.

• Wir schreiben in der Regel

f(x) = PX(x) = P (x) (2)

3

Page 4: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: 2 Wurfe eines fairen Wurfels: Elementarereignisse

• Elementarereignis: Ergebnis zweier Wur-

fe

• c = {c1, c2}: erster Wurf ist c1, der

zweite ist c2• Die Wahrscheinlichkeit jedes Elementa-

rereignisses ist 1/36

4

Page 5: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Zufallsvariable X

X = 0 falls c1 ∈ {1,2,3} und X = 1

anderenfalls

P (X = 0) = P ({c : X(c) = 0}) =

1/36× 3× 6 = 1/2 = f(0)

P (X = 1) = P ({c : X(c) = 1}) =

1/36× 3× 6 = 1/2 = f(1)

5

Page 6: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Zufallsvariable Y

• Y = 0 falls c2 ∈ {1,2,3,4} und

Y = 1 anderenfalls

P (Y = 0) = P ({c : Y (c) = 0}) =

1/36× 4× 6 = 2/3 = f(0)

P (Y = 1) = P ({c : Y (c) = 1}) =

1/36× 2× 6 = 1/3 = f(1)

6

Page 7: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Zufallsvariable Z

• Z = 0 falls c1 + c2 ≤ 5 und Z = 1

anderenfalls

P (Z = 0) = P ({c : Z(c) = 0}) =

1/36× 10 = 10/36 = f(0)

P (Z = 1) = P ({c : Z(c) = 1}) =

1/36× 26 = 26/36 = f(1)

7

Page 8: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Multivariate Verteilungen

• Man definiere zwei Zufallsvariablen X(c) und Y (c). Eine multivariate Verteilung ist

definiert durch:

P (x, y) = P (X = x, Y = y) = P (X = x ∧ Y = y) (3)

= P ({c : X(c) = x ∧ Y (c) = y}) (4)

8

Page 9: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Multivariate Verteilung X, Y

P (X = 1, Y = 1)

= P (X = 1 ∧ Y = 1)

= P ({c : X(c) = 1 ∧ Y (c) = 1})

1/36× 6 = 1/6

9

Page 10: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Multivariate Verteilung X, Z

P (X = 1, Z = 1)

= P (X = 1 ∧ Z = 1)

= P ({c : X(c) = 1 ∧ Z(c) = 1})

= 17/36

10

Page 11: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Bedingte Verteilungen

• Definition einer bedingten Verteilung

P (Y = y|X = x) =P (X = x, Y = y)

P (X = x)mit P (X = x) > 0

11

Page 12: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Bedingte Verteilung P (Y |X)

P (Y = 1|X = 1) =P (X = 1, Y = 1)

P (X = 1)

=1/6

1/2= 1/3

12

Page 13: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Bedingte Verteilung P (Z|X)

P (Z = 1|X = 1) =P (X = 1, Z = 1)

P (X = 1)

=17/36

1/2= 34/36

13

Page 14: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Produktzerlegungen und Kettenregel

• Es folgen: Produktsatz

P (x, y) = P (x|y)P (y) = P (y|x)P (x) (5)

• und die Kettenregel

P (x1, . . . , xM) = P (x1)P (x2|x1)P (x3|x1, x2) . . . P (xM |x1, . . . , xM−1)

(6)

14

Page 15: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Bayes’sche Regel

• Bayes’sche Regel

P (y|x) =P (x, y)

P (x)=

P (x|y)P (y)

P (x)P (x) > 0 (7)

15

Page 16: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Bayes’sche Regel

P (X = 1|Z = 1) =P (Z = 1|X = 1)P (X = 1)

P (Z = 1)

=34/36× 18/36

26/36= 17/26

16

Page 17: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Marginale Verteilungen

• Da die Ereignisse sich ausschließen,

P (X = x) = P (X = x, [Y = y1 ∨ Y = y2]) = (8)

P ({c : X(c) = x ∧ [Y (c) = y1 ∨ Y (c) = y2]}) = P (x, y1) + P (x, y2)

(9)

• Daraus folgt, dass sich die marginale (Rand-) Verteilungen berechnen laßt zu:

P (x) =∑y

P (x, y) (10)

17

Page 18: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Marginale Verteilung

P (X = 1) = P (Z = 0, X = 1)+P (Z = 1, X = 1)

= 1/36 + 17/36 = 1/2

18

Page 19: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Unabangige Zufallsvariablen

• Unabhangigkeit: zwei Zufallsvariablen sind unabhangig, falls gilt,

P (x, y) = P (x)P (y|x) = P (x)P (y) (11)

Beispiel: unabhangige Wurfelwurfe.

19

Page 20: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: 2 Wurfe eines Wurfels

P (Y = 1, X = 1) = P (X = 1)P (Y = 1)

= 1/2× 2/6 = 1/6

20

Page 21: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Erwartungswerte

• Erwartungswert

E(X) = EP (x)(X) =∑

i

xiP (X = xi) (12)

21

Page 22: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Erwartungswerte

E(X) = 0× 1/2 + 1× 1/2 = 1/2

E(Y ) = 0× 2/3 + 1× 1/3 = 1/3

E(Z) = 0×10/36+1×26/36 = 26/36

22

Page 23: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Varianzen

• Definition der Varianz einer Zufallsvariable:

var(X) =∑

i

(xi − E(X))2P (X = xi) (13)

23

Page 24: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Varianzen

var(X) = (0− 1/2)2 × 1/2 + (1− 1/2)2 × 1/2 = 1/4

var(Y ) = (0− 1/3)2 × 2/3 + (1− 1/3)2 × 1/3 = 6/27

var(Z) = (0− 26/36)2 × 10/36 + (1− 26/36)2 × 26/36 ≈ 0.20

24

Page 25: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Kovarianzen

• Kovarianz:

cov(X, Y ) =∑

i

∑j

(xi − E(X))(yj − E(Y ))P (X = xi, Y = yj) (14)

• Kovarianzmatrix:

Σ[XY ],[XY ] =

(var(X) cov(X, Y )

cov(Y, X) var(Y )

)(15)

• Falls cov(X, Y ) = 0, sind X und Y unkorreliert (aber nicht notwendigerweiseunabhangig). Aus Unabhangigkeit folgt Unkorreliertheit. Das Inverse gilt nicht!

• Beachte, das gilt:

cov(X, Y ) = E(XY )− E(X)E(Y )

wobei man E(XY ) als Korrelation bezeichnet. Beachte jedoch, dass der Korrelati-onskoeffizient definiert ist als

r =cov(X, Y )√

var(X)√

var(Y )25

Page 26: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Beispiel: Kovarianzen

cov(X, Y ) = (0− 1/2)(0− 1/3)× 1/3 + (0− 1/2)(1− 1/3)× 1/6

+(1− 1/2)(0− 1/3)× 1/3 + (1− 1/2)(1− 1/3)× 1/6 = 0

cov(X, Z) = (0−1/2)(0−26/36)×9/36+(0−1/2)(1−26/36)×1/36

+(1−1/2)(0−26/36)×9/36+(1−1/2)(1−26/36)×17/36 = 0.0617

26

Page 27: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Kontinuierliche (stetige) Zufallsvariablen

• Zufallsvariablen konnen auch kontinuierlich (stetig) sein. Hier definiert man die Wahr-scheinlichkeitsdichte als

f(x) = lim∆x→0

P (x ≤ X ≤ x + ∆x)

∆x

• Man erhalt

P (a < x < b) =

∫ b

af(x)dx

• Die Verteilungsfunktion ist

F (x) =

∫ x

−∞f(x)dx = P (X ≤ x)

Wir werden in der Notation keinen Unterschied machen zwischen einer Wahrschein-lichkeitsfunktion fur diskrete Variablen und Wahrscheinlichkeitsdichten fur stetige Va-riablen und schreiben ebenfalls

f(x) = P (x) (16)

27

Page 28: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Erwartungswerte fur stetige Variablen

• Erwartungswert

E(X) = EP (x)(X) =

∫xP (x)dx

• Varianz

var(X) =

∫(x− E(x))2P (x)dx (17)

• Kovarianz:

cov(X, Y ) =

∫(x− E(X))(y − E(Y ))P (x, y)dxdy (18)

28

Page 29: Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review) · 2009-05-28 · Statistik • Bisher hatten wir angenommen, dass z.B. P(X = x) bekannt ist • In der frequentistischen

Statistik

• Bisher hatten wir angenommen, dass z.B. P (X = x) bekannt ist

• In der frequentistischen Statistik gibt es unbekannte Parameter, die geschatzt

werden: P (X = 1) = θ. Wenn θ der wahre unbekannte Parameter ist, so ist

θ die Schatzung: wenn ich genugend viele Wurfelergebnisse beobachte, so ist z.B.

θ = Ntrue/N eine vernunftige Schatzung, wobei N die Anzahl der Wurfe ist und

Ntrue die Anzahl der Wurfe, in der X den Wert 1 annimmt

• In der Bayes’schen Statistik erweitert man das Wahrscheinlichkeitsmodell um eine

Verteilung uber die Parameter P (θ) und wendet die Regeln der Wahrscheinlichkeits-

lehre an; die W.-Verteilung ist dann P (θ)∏N

i=1 P (X = xi|θ) wobei xi ∈ {0,1}der Wert ist, den X im i-ten Wurf annimmt

29