Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

24
Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen

Transcript of Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Page 1: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Kapitel 5

Statistische Bewertung von Regressionsbezie-hungen

Page 2: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

2

Einkommen und Konsum

PCR: Privater Konsum, real, in Mrd.EURPYR: Verfügbaren Einkom- men der Haushalte, real1970:1-2003:4

Basis: 1995Quelle: AWM-Datenbasis

200

400

600

800

1000

1200

70 75 80 85 90 95 00

PYR PCR

Page 3: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

3

Einkommen und Konsum: Zuwachsraten

-0.02

0.00

0.02

0.04

0.06

-0.04 -0.02 0.00 0.02 0.04 0.06 0.08

PYR_D4

PC

R_D

4

PCR_D4 vs. PYR_D4

PCR_D4: Privater Konsum, real, ZuwachsratePYR: Verfügbaren Einkom- men der Haushalte, real, Zuwachsrate1970:1-2003:4Basis: 1995Quelle: AWM-Datenbasis

Page 4: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

4

Konsumfunktion

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

Page 5: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

5

Dimensionen der Bewertung

Globale Bewertung: Kann das Modell den datengenerierenden Prozess der abhängigen Variablen als Ganzes erklären?

Globale Kriterien: Bestimmtheitsmaß Adjustiertes Bestimmtheitsmaß Logarithmierte Likelihoodfunktion Informationskriterien, zB Akaike‘s AIC-Kriterium

Inferenz der Regressionsparameter t-Test F-Test ANOVA-Tafel

Page 6: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

6

Residuen

y = X + u = Xb + e = ŷ + e

Residuen: e = y - Xb = y – ŷ = y – X(X‘X)-1X‘y = y - Py

= [I – X(X’X)-1X’]y = My P: Projektionsmatrix M: residuenerzeugende Matrix

Page 7: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

7

Konsumfunktion, Forts.

-0.03

-0.02

-0.01

0.00

0.01

0.02

0.03

-0.02

0.00

0.02

0.04

0.06

75 80 85 90 95 00

Residual Actual Fitted

Page 8: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

8

Schätzer der Varianz 2

ist ein erwartungstreuer Schätzer

Der ML-Schätzer

unterschätzt; der Bias beträgt

2 21 1'tt

s e e en k n k

2 21tte

n

2k

n

Page 9: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

9

Residuen: Eigenschaften

e = y - Xb = y – ŷ = My

Eigenschaften (inhomogene Regression): iei = 0

Achtung! Diese Eigenschaften setzen eine inhomogene Regression voraus!

Streuungszerlegung:

Ergibt sich durch Dividieren durch n und Subtrahieren von

ˆY Y

ˆ ˆ' ' 'y y y y e e 1 2 2 ... k kY b b X b X

2 2 2ˆy y es s s

2Y

Page 10: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

10

Bestimmtheitsmaß

Definition:

Anteil der durch das Regressionsmodell erklärten Varianz (der Varianz der geschätzten Y) an der Gesamtvarianz der Beobachtungen von Y

Anteil der Varianz der abhängigen Variablen, die durch das Modell erklärt wird

oft in Prozenten angegeben

Alternative Schreibweise

2ˆ22

y

y

sR

s

2 2ˆ22 21y e

y y

s sR

s s

Page 11: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

11

R2: Eigenschaften

Wegen gilt:

R2=1 bedeutet: ; alle Residuen sind Null! R2=0 bedeutet:

alle Regressionskoeffizienten haben den Wert Null! R2 soll einen möglichst hohen Wert haben

Einfache Regression: Multiple Regression:

R2 kann durch Hinzufügen eines Regressors nicht kleiner werden!

Achtung! Bei homogener Regression ist R2<0 möglich!

2 2 2ˆy y es s s

20 1R 2 2 2

ˆ , 0y y es s s 2 2 2

ˆ, 0y e ys s s

2 2 2ˆxy yyR r r

2 2ˆyyR r

Page 12: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

12

Beispiel: Konsumfunktion

Dependent Variable: PCR_D4Method: Least SquaresDate: 08/20/04 Time: 11:06Sample(adjusted): 1971:1 2002:4Included observations: 128 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010855 0.001053 10.31071 0.0000PYR_D4 0.747032 0.041840 17.85451 0.0000

R-squared 0.716716 Mean dependent var 0.024898Adjusted R-squared 0.714468 S.D. dependent var 0.014817S.E. of regression 0.007918 Akaike info criterion -6.823949Sum squared resid 0.007899 Schwarz criterion -6.779386Log likelihood 438.7327 F-statistic 318.7837Durbin-Watson stat 0.632776 Prob(F-statistic) 0.000000

ys2 2t ete ns

22

2 2

0.007899 0.007861 1 0.716716128 0.0148 0.0148

R

Page 13: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

13

Konsumfunktion

2 2t ete ns

22

2 2

0.007899 0.007861 1 0.716716128 0.0148 0.0148

R

2 2t ete ns

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

2 2t ete ns

22

2 2

0.010061/132 0.008761 1 0.6500.0148 131/132 0.01476

R

ys

Page 14: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

14

R2: Alternative Darstellung

2 2 2ˆy y es s s Aus ergibt sich

2

2 2

( )

ˆ( )

tt

t tt t

TSS Y Y

Y Y e ESS RSS

Es bedeuten: TSS: Gesamtvariation (total sum of squares) ESS: (durch die Regression) erklärte Variation

(explained sum of squares) RSS: residuale (nicht erklärte) Variation (residual

sum of squares)

Wir können schreiben: TSS = y‘M0y, analog ESS, mit0 1

'M In

2ˆ22

1y

y

s ESS RSSR

s TSS TSS

Page 15: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

15

Adjustiertes Bestimmtheitsmaß

Erweiterung eines Modells um einen Regressor: R2 wird größer Zunahme von R2 bedeutet nicht notwendigerweise, dass der neue

Regressor zur Erklärung beiträgt!

Adjustiertes Bestimmtheitsmaß:

Gut zum Vergleichen von Modellen

Bei großem n ist (n-1)/(n-k) ≈ 1

2 11n RSS

Rn k TSS

2 2R R

Page 16: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

16

Andere Kriterien

Meist Funktionen von se2

Logarithmierte Likelihoodfunktion

Akaike‘s Informationskriterium

Schwarz Informationskriterium

2( ) 1 log(2 ) log2 e

nb s

2 ( ) 2b kAIC

n n

2 ( ) logb k nSIC

n n

Page 17: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

17

Konsumfunktion

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

2132( ) 1 log(2 ) log(0.008797)

2b

Page 18: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

18

Konsumfunktion

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

2 ( ) 2b kAIC

n n

Page 19: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

19

Bewertung der Parameter

Frage: Trägt der Regressor Xi zur Erklärung bei? Test von H0: i = 0 gegen H1: i>0 oder H1: i≠0: (t-Test)

Konfidenzintervall für i

Tragen alle Regressoren zur Erklärung bei? Test von H0: 2 = … =k (F-Test)

Page 20: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

20

t-Test

Verteilung der OLS-Schätzer b:

Für den Schätzer bi gilt:

mit dem i-ten Diagonalelement aii aus (X‘X)-1

√(aii) bzw. s√(aii) heißt Standardfehler von bi

Test von H0: i=0 gegen H1: i≠0:

Entscheidung mittels p-Wert:

1 2 1( ' ) ' , ( ' )b X X X u N X X

2( , )i i iib N a

0ii

ii

bp Wert P T

s a

Page 21: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

21

Konsumfunktion

ii

bts a

17.85 0P T

17.85 0P T

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

15.55 0P T

ii

bts a

Page 22: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

22

F-Test

Test von H0: 1=…= k gegen H1: 0 trifft nicht zu

F ist exakt oder näherungsweise verteilt nach F(k-1, n-k)

Entscheidung mittels p-Wert

2

2

ˆ( )

1 1tt

tt

Y Y n k ESS n kF

e k RSS k

Page 23: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

23

Konsumfunktion

Dependent Variable: PCR_D4Method: Least SquaresDate: 02/03/05 Time: 18:06Sample(adjusted): 1971:1 2003:4Included observations: 132 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob. C 0.010708 0.001169 9.156915 0.0000PYR_D4 0.717628 0.046151 15.54963 0.0000

R-squared 0.650341 Mean dependent var 0.024451Adjusted R-squared 0.647652 S.D. dependent var 0.014821S.E. of regression 0.008797 Akaike info criterion -6.613670Sum squared resid 0.010061 Schwarz criterion -6.569991Log likelihood 438.5022 F-statistic 241.7910Durbin-Watson stat 0.502740 Prob(F-statistic) 0.000000

F-Statistikp-Wert = P{F > 241.79 | H0}

Page 24: Kapitel 5 Statistische Bewertung von Regressionsbezie- hungen.

Hackl, Einführung in die Ökonometrie

24

Konfidenzintervall für i

KI zur Konfidenzzahl

mit Perzentil der t(n-k)- oder der Normalverteilung

Beispiel: Konsumfunktion C = + Y + u

95%iges Konfidenzintervall für marginale Konsumneigung

0.7176 – (1.978) (0.0461) ≤ ≤ 0.7176 + (1.978) (0.0461)

oder 0.626 ≤ ≤ 0.809

(1 ) / 2 (1 ) / 2( ) ( )i ii i i iib t n k s a b t n k s a