Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...

43
Statistikpraktikum Carsten Rezny Institut f¨ ur angewandte Mathematik Universit¨ at Bonn Sommersemester 2014

Transcript of Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...

Page 1: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Statistikpraktikum

Carsten Rezny

Institut fur angewandte MathematikUniversitat Bonn

Sommersemester 2014

Page 2: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze:

x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Page 3: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Page 4: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Page 5: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Page 6: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Page 7: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Page 8: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Page 9: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Page 10: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Page 11: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 12: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 13: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 14: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 15: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 16: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Page 17: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Mit n Messwerten yi :

lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Page 18: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem

y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Page 19: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:y = Xb + u

Page 20: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Page 21: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 22: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 23: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 24: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2:

→ Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 25: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 26: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Page 27: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 28: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 29: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 30: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 31: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 32: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 33: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Page 34: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; FALSE

; TRUE

)

βm βm−1 . . . β1

β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 35: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; FALSE

; TRUE

)

βm βm−1 . . . β1

β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 36: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE

; TRUE

)

βm βm−1 . . . β1 β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 37: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 38: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βi

r2 Bestimmtheitsmaß (Quadrat desKorrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 39: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 40: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 41: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 42: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Page 43: Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte Mathematik Universit at Bonn Sommersemester 2014

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen