Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...

Post on 11-Aug-2019

216 views 0 download

Transcript of Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...

Statistikpraktikum

Carsten Rezny

Institut fur angewandte MathematikUniversitat Bonn

Sommersemester 2014

Multivariate Statistik

Mehrdimensionale Datensatze:

x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Multivariate Statistik

Mehrdimensionale Datensatze: x11 · · · x1m...

. . ....

xn1 · · · xnm

Grafische Darstellung:

XY- (Scatter-) Plot

Q-Q-Plot

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Quantil-Quantil-Plot

Grafischer Vergleich der Verteilung zweier Datensatze

1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%

2 bestimme Quantile (”Unterschreitungsanteile“)

nxi (p) und nyi (p): p-Quantil der xi bzw. yi

3 plotte nyi (p) gegen nxi (p)

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Gesucht: Zusammenhang zwischen m Variablen Xk und Y

Modell:

y = β0 +m∑

k=1

βkxk + u

y abhangige (”erklarte“)Variable

xk m unabhangige (”erklarende“)Variable

β0, βk Regressionsparameter

u Residuum

Lineare Regression

Mit n Messwerten yi :

lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem

y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:y = Xb + u

Lineare Regression

Mit n Messwerten yi : lineares Gleichungssystem y1...yn

=

1 x11 · · · x1m...

......

1 xn1 · · · xnm

β0

...βm

+

u1...un

oder:

y = Xb + u

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2:

→ Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Ansatz: Methode der kleinsten Quadrate

Betrachte Residuen u als Funktion von b:

u(b) = (y − Xb)

minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer

b = (XTX)−1XTy

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

Excel/OpenOffice:

RGP(y data; x data; type; stats)

y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte

x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten

typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt

statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben

(engl.: LINEST(...))

Lineare Regression

RGP(y data; x data; FALSE

; TRUE

)

βm βm−1 . . . β1

β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; FALSE

; TRUE

)

βm βm−1 . . . β1

β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE

; TRUE

)

βm βm−1 . . . β1 β0

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βi

r2 Bestimmtheitsmaß (Quadrat desKorrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen

Lineare Regression

RGP(y data; x data; TRUE; TRUE)

βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df

ssreg ssres

σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des

Korrelationskoeffizienten)

σy Standardfehler der Schatzung von y

F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)

df = n −m: Nenner-Freiheitsgrade von F

ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen