Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme:...

13
1 Alexander Spermann Universität Freiburg 6. Sitzung Wichtige Spezifikationsprobleme: 1. Nicht-Berücksichtigung einer relevanten Variable 2. Berücksichtigung einer überflüssigen Variable 3. Falsche funktionale Form der Schätzgleichung Probleme der Modellspezifikation

Transcript of Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme:...

Page 1: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

1Alexander Spermann

Universität Freiburg

6. Sitzung

Wichtige Spezifikationsprobleme:

1. Nicht-Berücksichtigung einer relevanten Variable

2. Berücksichtigung einer überflüssigen Variable

3. Falsche funktionale Form der Schätzgleichung

Probleme der Modellspezifikation

Page 2: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

2Alexander Spermann

Universität Freiburg

6. Sitzung

1. Nicht-Berücksichtigung einer relevanten Variable, die eigentlich in der Schätzgleichung sein sollte:

1. y=α+β1x1+ β2x2+u

aber man berücksichtigt nicht, dass x2 auch eine Rolle spielt und schätzt:

2. y=α+β1x1+ u

es kommt zu einer Verzerrung

Konsequenzen: s.e. und t-Test sind ungültig

Probleme der Modellspezifikation

Page 3: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

3Alexander Spermann

Universität Freiburg

6. Sitzung

reg Lohn Schuljahre Berufserfahrung Betriebszugehörigkeit

Source | SS df MS Number of obs = 22640-------------+------------------------------ F( 3, 22636) = 1905.68 Model | 882.487532 3 294.162511 Prob > F = 0.0000 Residual | 3494.11654 22636 .154361042 R-squared = 0.2016-------------+------------------------------ Adj R-squared = 0.2015 Total | 4376.60407 22639 .19332144 Root MSE = .39289

------------------------------------------------------------------------------ Lohn | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- Schuljahre | .0590488 .0010871 54.32 0.000 .0569181 .0611795Berufserfa~g | -.0003357 .0002757 -1.22 0.223 -.0008761 .0002046Betriebszu~t | .0132637 .0003219 41.20 0.000 .0126326 .0138947 _cons | 2.150714 .015924 135.06 0.000 2.119502 2.181926------------------------------------------------------------------------------

reg Lohn Schuljahre Berufserfahrung

Source | SS df MS Number of obs = 22947-------------+------------------------------ F( 2, 22944) = 1870.90 Model | 629.788755 2 314.894377 Prob > F = 0.0000 Residual | 3861.75221 22944 .168312073 R-squared = 0.1402-------------+------------------------------ Adj R-squared = 0.1401 Total | 4491.54096 22946 .195743962 Root MSE = .41026

------------------------------------------------------------------------------ Lohn | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- Schuljahre | .0633375 .0011209 56.51 0.000 .0611405 .0655345Berufserfa~g | .0058886 .000238 24.74 0.000 .0054222 .0063551 _cons | 2.108452 .0164341 128.30 0.000 2.07624 2.140664------------------------------------------------------------------------------

reg Lohn Schuljahre Betriebszugehörigkeit

Source | SS df MS Number of obs = 22781-------------+------------------------------ F( 2, 22778) = 2846.20 Model | 880.364848 2 440.182424 Prob > F = 0.0000 Residual | 3522.75625 22778 .154656082 R-squared = 0.1999-------------+------------------------------ Adj R-squared = 0.1999 Total | 4403.12109 22780 .193288898 Root MSE = .39326

------------------------------------------------------------------------------ Lohn | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- Schuljahre | .0589361 .0010812 54.51 0.000 .0568169 .0610553Betriebszu~t | .0129839 .0002677 48.50 0.000 .0124593 .0135086 _cons | 2.148751 .0150927 142.37 0.000 2.119168 2.178334------------------------------------------------------------------------------

Probleme der Modellspezifikation

y=α+β1x1+ β2x2 +β3x3+u

Lohn= α+ β1Schuljahre + β2Berufserf + β3Betriebszug + u

Page 4: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

4Alexander Spermann

Universität Freiburg

6. Sitzung

Wirkungen der Nichtberücksichtigung einer relevanten Variablen:1.Beispiel: 1. Wenn Betriebszug. fehlt, dann entsteht eine

Verzerrung:

E(b2) =β2+Verzerrung

2. b2 = -0,0003357, bei einer Schätzung von x1, x2 und x3

b2 = 0,0058886 bei einer Schätzung von x1, x2

Ergebnisse: - b2 ist nach oben verzerrt bei einer Schätzung ohne x3

- Überschätzung des Einflusses der erklärenden Variable- Grund: positive Korrelation zwischen x2 und x3

Verzerrung hängt ab von der Korrelation zwischen x2 und x3. Je höher die Korrelation, desto größer die Verzerrung, d.h. keineVerzerrung bei einer Korrelation von 0.

Probleme der Modellspezifikation

Page 5: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

5Alexander Spermann

Universität Freiburg

6. Sitzung

reg Lohn Schuljahre Berufserf Betriebszug West

Source | SS df MS Number of obs = 22758-------------+------------------------------ F( 4, 22753) = 2231.16 Model | 1243.42509 4 310.856272 Prob > F = 0.0000 Residual | 3170.06138 22753 .139324985 R-squared = 0.2817-------------+------------------------------ Adj R-squared = 0.2816 Total | 4413.48646 22757 .193939731 Root MSE = .37326

------------------------------------------------------------------------------ Lohn | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- Schuljahre | .0647688 .0010347 62.60 0.000 .0627407 .0667969 Berufserf | .0011065 .0002613 4.23 0.000 .0005944 .0016186 Betriebszug | .0108213 .0003075 35.19 0.000 .0102186 .011424 West | .3207218 .0063453 50.54 0.000 .3082845 .333159 _cons | 1.810839 .0165128 109.66 0.000 1.778473 1.843206------------------------------------------------------------------------------

reg Lohn Schuljahre Berufserf Betriebszug

Source | SS df MS Number of obs = 22758-------------+------------------------------ F( 3, 22754) = 1909.03 Model | 887.482375 3 295.827458 Prob > F = 0.0000 Residual | 3526.00409 22754 .154961945 R-squared = 0.2011-------------+------------------------------ Adj R-squared = 0.2010 Total | 4413.48646 22757 .193939731 Root MSE = .39365

------------------------------------------------------------------------------ Lohn | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- Schuljahre | .059183 .001085 54.55 0.000 .0570564 .0613097 Berufserf | -.0004615 .0002736 -1.69 0.092 -.0009977 .0000748 Betriebszug | .0132101 .0003204 41.23 0.000 .012582 .0138381 _cons | 2.151206 .0159009 135.29 0.000 2.120039 2.182373------------------------------------------------------------------------------

Probleme der Modellspezifikation

y=α+β1x1+ β2x2 +β3x3+β4x4+u

Lohn= α+ β1Schuljahre + β2Berufserf + β3Betriebszug + β4West+ u

Page 6: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

6Alexander Spermann

Universität Freiburg

6. Sitzung

2.Beispiel: 1. Fehlt die Dummyvariable „West“ in der Spezifikation, so entsteht folgende Verzerrung:

E(b1) =β1+Verzerrung

2. b1 = 0,0647688 , bei einer Schätzung von x1, x2, x3 und x4

b1 = 0,059183 , bei einer Schätzung von x1, x2 und x3

Ergebnisse: - b1 ist nach unten verzerrt- Unterschätzung des Einflusses der erklärenden Variable- Grund: negative Korrelation zwischen x1 und x4

(Westdeutsche haben durchschnittlich weniger Schuljahre als Ostdeutsche)

Probleme der Modellspezifikation

Page 7: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

7Alexander Spermann

Universität Freiburg

6. Sitzung

Ausweg für das Problem fehlender Variablen bei fehlender Datenverfügbarkeit: Proxy Variable.

Idee: Es ist besser eine fehlende Variable durch eine Ersatzvariable, für die Daten vorliegen, zu schätzen als die Variable vollständig zu ignorieren.

Beispiel: Fähigkeit eines Arbeitnehmers ist schwer zu messen. Proxy ist z.B. Bildungsabschluss

Wahres ökonometrisches Modell: y=α+β1x1+ β2x2 +…+βkxk+u

Es liegen aber keine Daten für x1 vor, sondern nur für z.

x1=λ+μz

Annahme: Zwischen z und x1 besteht eine lineare Beziehung.

Neuformulierung des Modells:

y=α+β1(λ+μz)+ β2x2 +…+βkxk+u

=α+β1λ+ β1μz+ β2x2 +…+βkxk+u

Probleme der Modellspezifikation

Page 8: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

8Alexander Spermann

Universität Freiburg

6. Sitzung

Eigenschaften von Proxies:

1. Die Koeffizienten von x2,...,xk werden gleich sein, als ob x1 anstelle von z eingesetzt worden wäre.

2. Der Standardfehler und die t-Statistik der Koeffizienten x2,...,xk

werden gleich sein, als ob x1 anstelle von z eingesetzt worden wäre.

3. R2 wird gleich sein, als ob x1 anstelle von z eingesetzt worden wäre.

4. Der Koeffizient von z wird ein Schätzer von 1 sein.

5. Jedoch ist die t-Statistik für z die gleiche wie die, die man für x1 erhalten hätte, so dass man die Signifikanz von x1 beurteilen kann, selbst wenn man nicht in der Lage ist, den Koeffizienten zu schätzen.

Probleme der Modellspezifikation

Page 9: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

9Alexander Spermann

Universität Freiburg

6. Sitzung

2. Effekt der Schätzung einer überflüssigen Variablen

Wahres ökonometrisches Modell: y=α+β1x1+u

Schätzung: y=α+β1x1+ β2x2 +u

Ergebnis: Koeffizienten sind unverzerrt, aber ineffizient.

Quelle: Dougherty

Dichte-funktion

nutzt die Information, dass 02

1

nutzt nicht die Information, dass 02

1

Probleme der Modellspezifikation

Page 10: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

10Alexander Spermann

Universität Freiburg

6. Sitzung

Gefahr: Alle Variablen, die zur Verfügung stehen, werden in die Regressionsanalysen einbezogen und alle signifikanten Variablen werden als relevant erklärt.

Weshalb ist das gefährlich?-> Theorie muss die Auswahl der Variablen leiten!

Zur Beurteilung der Relevanz der Variablen werden t-Werte, F-Test und herangezogen und die Störgrößen untersucht.

3. Falsche funktionale Form der Schätzgleichung

Unter Umständen kann auch die funktionale Form der Gleichung falsch sein:

²R

Probleme der Modellspezifikation

Page 11: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

11Alexander Spermann

Universität Freiburg

6. Sitzung

Einfacher Ramsey Reset Test:RESET= Regression Specification Error Test

1. y=α+β1x1+u2. Aus dieser Schätzgleichung erhalten wir einen Schätzwert ŷ3. Neue Spezifikation (fiktives Beispiel)

4. ŷ² und ŷ³ enthalten nicht-lineare Funktionen von x1

5. Vergleich der R² der beiden Schätzungen

6. Ist der berechnete F-Wert signifikant, kann die Nullhypothese (= altes Modell ist nicht fehlspezifiziert) verworfen werden. (Intuition: Je größer Term im Zähler, desto besser scheint neues Modell y zu erklären)

³,ˆ²ˆ yyxy 3211

Modell)neuen im nzahlParametera/()²-(1

nRegressoreder Anzahl/)²²(

NR

RRF

neu

altneu

Probleme der Modellspezifikation

Page 12: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

12Alexander Spermann

Universität Freiburg

6. Sitzung

Beispiel:

1. y=166.467+19993x1

(19.021) (3.066) R2=0.8409

2. y=2140.7723 + 476.6987x1 - 0.09189ŷ² + 0.000118ŷ³ (132.0044) (33.3951) (0.00620) (0.0000074)R2=0.9983

3.

4. Da F > F crit wird die Nullhypothese verworfen. altes Modell ist fehlspezifiziert.

07281410998301

28409099830.

)/().(

/)..(

F

Probleme der Modellspezifikation

Page 13: Alexander Spermann Universität Freiburg 6. Sitzung 1 Wichtige Spezifikationsprobleme: Nicht-Berücksichtigung einer relevanten Variable Berücksichtigung.

13Alexander Spermann

Universität Freiburg

6. Sitzung

Weitere Spezifikationstests (werden hier nur nachrichtlich genannt)

Likelihood Ratio Test Wald Test Lagrange Multiplier Test Hausman Test

Probleme der Modellspezifikation