Ökonometrie - Eine Einführung - uni-trier.de · Ökonometrie - Eine Einführung 5. Auflage ......

Post on 18-Sep-2018

218 views 0 download

Transcript of Ökonometrie - Eine Einführung - uni-trier.de · Ökonometrie - Eine Einführung 5. Auflage ......

Ökonometrie - Eine Einführung5. Auflage

Ludwig von Auer

28. März 2011

Inhaltsverzeichnis

1

2

1 Einleitung 11.1 Braucht man Ökonometriker? . . . . . . . . . . . . . . . 21.2 Was ist Ökonometrie? . . . . . . . . . . . . . . . . . . . 21.3 Die vier Aufgaben der Ökonometrie . . . . . . . . . . . . 3

1.3.1 Spezifikation . . . . . . . . . . . . . . . . . . . . . 31.3.2 Schätzung . . . . . . . . . . . . . . . . . . . . . . 41.3.3 Hypothesentest . . . . . . . . . . . . . . . . . . . 81.3.4 Prognose . . . . . . . . . . . . . . . . . . . . . . . 8

1.4 Aufbau der Lehrveranstaltung . . . . . . . . . . . . . . . 91.5 Datenmaterial . . . . . . . . . . . . . . . . . . . . . . . . 10

3

2 Spezifikation 12.1 A-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 3

2.1.1 Erster Schritt: Formulierung eines plausiblen linea-ren Modells . . . . . . . . . . . . . . . . . . . . . 3

2.1.2 Zweiter und dritter Schritt: Hinzufügung eines Be-obachtungsindex und einer Störgröße . . . . . . . 5

2.1.3 Formulierung der A-Annahmen . . . . . . . . . . 92.2 Statistisches Repetitorium I . . . . . . . . . . . . . . . . 13

2.2.1 Zufallsvariable und Wahrscheinlichkeitsverteilung 132.2.2 Erwartungswert einer Zufallsvariable . . . . . . . 182.2.3 Varianz einer Zufallsvariable . . . . . . . . . . . . 202.2.4 Bedingte und gemeinsame Wahrscheinlichkeitsver-

teilung . . . . . . . . . . . . . . . . . . . . . . . . 222.2.5 Kovarianz zweier Zufallsvariablen . . . . . . . . . 262.2.6 Rechenregeln für Erwartungswert und Varianz . . 31

4

2.2.7 Eine spezielleWahrscheinlichkeitsverteilung: Die Nor-malverteilung . . . . . . . . . . . . . . . . . . . . 35

2.3 B-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 362.3.1 Begründungen für die Existenz der Störgröße . . . 362.3.2 Formulierung der B-Annahmen . . . . . . . . . . 37

2.4 Statistisches Repetitorium II . . . . . . . . . . . . . . . . 452.4.1 Stichproben-Mittelwert einer Variable . . . . . . . 452.4.2 Stichproben-Varianz einer Variable . . . . . . . . 462.4.3 Stichproben-Kovarianz zweier Variablen . . . . . 47

2.5 C-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 48

5

3 Schätzung I: Punktschätzung 13.1 KQ-Methode — eine Illustration . . . . . . . . . . . . . . 53.2 KQ-Methode — eine algebraische Formulierung . . . . . . 9

3.2.1 Summe der Residuenquadrate . . . . . . . . . . . 93.2.2 Herleitung der Schätzformeln . . . . . . . . . . . 12

3.3 Interpretation derKQ-Schätzer bα und bβ . . . . . . . . . . . . . . . . . . . . 23

3.4 Bestimmtheitsmaß R2 . . . . . . . . . . . . . . . . . . . 243.4.1 Grafische Veranschaulichung . . . . . . . . . . . . 243.4.2 Definition des Bestimmtheitsmaßes . . . . . . . . 313.4.3 Berechnung des Bestimmtheitsmaßes . . . . . . . 33

6

4 Indikatoren für die Qualität von Schätzverfahren 14.1 Statistischer Hintergrund . . . . . . . . . . . . . . . . . . 3

4.1.1 Warum ist yt eine Zufallsvariable? . . . . . . . . . 34.1.2 Warum sind die KQ-Schätzer bα und bβ Zufallsva-

riablen? . . . . . . . . . . . . . . . . . . . . . . . 64.2 Zwei Kriterien: Unverzerrtheit und Effizienz . . . . . . . 74.3 Unverzerrtheit und Effizienz der KQ-Methode . . . . . . 114.4 Statistisches Repetitorium III . . . . . . . . . . . . . . . 16

4.4.1 Standard-Normalverteilung . . . . . . . . . . . . . 164.4.2 χ2-Verteilung . . . . . . . . . . . . . . . . . . . . 194.4.3 t-Verteilung . . . . . . . . . . . . . . . . . . . . . 214.4.4 F -Verteilung . . . . . . . . . . . . . . . . . . . . 24

4.5 Wahrscheinlichkeitsverteilungen der KQ-Schätzer bα und bβ 264.5.1 Wahrscheinlichkeitsverteilung von yt . . . . . . . 264.5.2 Wahrscheinlichkeitsverteilungen von bα und bβ . . . 28

7

5 Schätzung II: Intervallschätzer 15.1 Intervallschätzer und ihre Interpretation . . . . . . . . . 35.2 Intervallschätzer für β bei bekanntem σ2 . . . . . . . . . 65.3 Intervallschätzer für β bei unbekanntem σ2 . . . . . . . . 14

5.3.1 Herleitung des Intervallschätzers . . . . . . . . . . 145.3.2 Interpretation des Intervallschätzers . . . . . . . . 225.3.3 Aussagekraft von Intervallschätzern . . . . . . . . 24

5.4 Intervallschätzer für α . . . . . . . . . . . . . . . . . . . 25

8

6 Hypothesentest 16.1 Zweiseitiger Hypothesentest . . . . . . . . . . . . . . . . 2

6.1.1 Ein grafisches Entscheidungsverfahren . . . . . . 36.1.2 Ein analytisches Entscheidungsverfahren . . . . . 76.1.3 Zusammenhang zwischen analytischem

und grafischem Vorgehen . . . . . . . . . . . . . . 136.2 Einseitiger Hypothesentest . . . . . . . . . . . . . . . . . 16

6.2.1 Ein grafisches Entscheidungsverfahren . . . . . . 166.2.2 Ein analytisches Entscheidungsverfahren . . . . . 18

6.3 p -Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246.4 Wahl der geeigneten Nullhypothese und des geeigneten Si-

gnifikanzniveaus . . . . . . . . . . . . . . . . . . . . . . . 266.4.1 Strategie A: Nullhypothese behauptet Gegenteil der

Anfangsvermutung . . . . . . . . . . . . . . . . . 276.4.2 Strategie B: Nullhypothese stimmt mit Anfangs-

vermutung überein . . . . . . . . . . . . . . . . . 30

9

6.4.3 Trennschärfe von Tests . . . . . . . . . . . . . . . 326.4.4 Anmerkungen zu zweiseitigen Tests . . . . . . . . 34

10

7 Prognose 17.1 Punktprognose . . . . . . . . . . . . . . . . . . . . . . . 2

7.1.1 Prognosewert und Prognosefehler . . . . . . . . . 27.1.2 Verlässlichkeit der Punktprognose . . . . . . . . . 4

7.2 Prognoseintervall . . . . . . . . . . . . . . . . . . . . . . 7

11

8 Spezifikation 28.1 A-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 4

8.1.1 Erster Schritt . . . . . . . . . . . . . . . . . . . . 48.1.2 Zweiter und dritter Schritt . . . . . . . . . . . . . 98.1.3 Formulierung der A-Annahmen . . . . . . . . . . 10

8.2 B-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 118.2.1 Formulierung der B-Annahmen . . . . . . . . . . 118.2.2 Interpretation der B-Annahmen . . . . . . . . . . 13

8.3 C-Annahmen . . . . . . . . . . . . . . . . . . . . . . . . 14

12

9 Schätzung 19.1 Punktschätzer bα, bβ1 und bβ2 . . . . . . . . . . . . . . . . 59.2 Interpretation der Schätzer bα, bβ1 und bβ2 . . . . . . . . . 11

9.2.1 Formale Interpretation . . . . . . . . . . . . . . . 119.2.2 Ökonomische Interpretation . . . . . . . . . . . . 12

9.3 Autonome Variation der exogenen Variablen . . . . . . . 149.3.1 Korrelation zwischen den exogenen Variablen . . 149.3.2 Berechnung der autonomen Variation . . . . . . . 20

9.4 Informationsverarbeitung der KQ-Methode und Bestimmt-heitsmaß R2 . . . . . . . . . . . . . . . . . . . . . . . . . 239.4.1 Definition des Bestimmtheitsmaßes . . . . . . . . 239.4.2 Berechnung des Bestimmtheitsmaßes . . . . . . . 259.4.3 Bestimmtheitsmaß und Venn-Diagramme . . . . . 279.4.4 KQ-Methode als zweistufiger Prozess . . . . . . . 299.4.5 Partielles Bestimmtheitsmaß . . . . . . . . . . . . 37

13

9.5 Unverzerrtheit und Effizienz der KQ-Methode . . . . . . 399.5.1 Erwartungswert und Varianz der KQ-Schätzer bα

und bβk . . . . . . . . . . . . . . . . . . . . . . . . 399.5.2 Interpretation der Formeln . . . . . . . . . . . . . 419.5.3 Schätzformeln für var(bα), var(bβk) und var(bβ1, bβ2) 429.5.4 BLUE- bzw. BUE-Eigenschaft der KQ-Schätzer . 44

9.6 Wahrscheinlichkeitsverteilungen der KQ-Schätzer bα und bβk 459.6.1 Wahrscheinlichkeitsverteilung der yt . . . . . . . . 459.6.2 Wahrscheinlichkeitsverteilungen der Schätzer bα undbβk . . . . . . . . . . . . . . . . . . . . . . . . . . 47

9.7 Intervallschätzer . . . . . . . . . . . . . . . . . . . . . . . 48

14

10 Hypothesentest 110.1 Testen einer Linearkombination von Parametern: t-Test . 2

10.1.1 Zweiseitiger t-Test . . . . . . . . . . . . . . . . . 210.1.2 Einseitiger t-Test . . . . . . . . . . . . . . . . . . 8

10.2 Simultaner Test mehrerer Linearkombinationen von Para-metern: F -Test . . . . . . . . . . . . . . . . . . . . . . . 910.2.1 Eine wichtige Nullhypothese . . . . . . . . . . . . 1010.2.2 Test einer allgemeinen Nullhypothese . . . . . . . 16

10.3 Zusammenhang zwischen t-Test und F -Test bei L=1 . . 1810.3.1 Zweiseitiger F-Test einer einzelnen Linearkombina-

tion . . . . . . . . . . . . . . . . . . . . . . . . . 1810.3.2 Probleme des F -Tests bei einseitigen Hypothesen 21

10.4 Zusammenhang zwischen t-Test und F -Test bei L=2 . . 2310.4.1 Numerisches Beispiel . . . . . . . . . . . . . . . . 24

15

10.4.2 Unterschied zwischen individuellen und simultanenParametertests . . . . . . . . . . . . . . . . . . . 26

16

11 Prognose 111.1 Punktprognose . . . . . . . . . . . . . . . . . . . . . . . 2

11.1.1 Prognosewert und Prognosefehler . . . . . . . . . 211.1.2 Verlässlichkeit der Punktprognose . . . . . . . . . 4

11.2 Prognoseintervall . . . . . . . . . . . . . . . . . . . . . . 8

17

12 Präsentation der Schätzergebnisse und deren computer-gestützte Berechnung 112.1 Computergestützte ökonometrische Analyse . . . . . . . 2

12.1.1 Ökonometrische Software . . . . . . . . . . . . . . 212.1.2 Interpretation des Computeroutputs . . . . . . . 4

12.2 Präsentation von Schätzergebnissen . . . . . . . . . . . . 5

18

13 Verletzung der Annahme A1:Fehlerhafte Auswahl der exogenen Variablen 113.1 Konsequenzen der Annahmeverletzung . . . . . . . . . . 3

13.1.1 Auslassen relevanter Variablen . . . . . . . . . . . 613.1.2 Verwendung irrelevanter Variablen . . . . . . . . 12

13.2 Diagnose und Neu-Spezifikation . . . . . . . . . . . . . . 1613.2.1 Korrigiertes Bestimmtheitsmaß R

2. . . . . . . . 17

13.2.2 Weitere Kennzahlen: AIC, SC und PC . . . . . . 2013.2.3 F -Test . . . . . . . . . . . . . . . . . . . . . . . . 2213.2.4 t-Test . . . . . . . . . . . . . . . . . . . . . . . . 2313.2.5 Zusammenhang zwischen korrigiertem Bestimmt-

heitsmaß, F -Test und t-Test . . . . . . . . . . . . 2413.2.6 Ungenesteter F -Test . . . . . . . . . . . . . . . . 27

13.3 Spezifikations-Methodologien . . . . . . . . . . . . . . . . 3013.3.1 Steinmetz- versus Maurer-Methodologie . . . . . . 30

19

13.3.2 Wichtiges Problem bei der Variablenauswahl . . . 31

20

14 Verletzung der Annahme A2:Nicht-lineare Wirkungszusammenhänge 114.1 Konsequenzen der Annahmeverletzung . . . . . . . . . . 614.2 Einige alternative Funktionsformen . . . . . . . . . . . . 6

14.2.1 Semi-logarithmisches Modell . . . . . . . . . . . . 714.2.2 Inverses Modell . . . . . . . . . . . . . . . . . . . 814.2.3 Exponential-Modell . . . . . . . . . . . . . . . . . 1014.2.4 Logarithmisches Modell . . . . . . . . . . . . . . 1214.2.5 Log-inverses Modell . . . . . . . . . . . . . . . . . 1514.2.6 Quadratisches Modell . . . . . . . . . . . . . . . . 1614.2.7 Eine vergleichende Anwendung . . . . . . . . . . 17

14.3 Diagnose und Neu-Spezifikation . . . . . . . . . . . . . . 1914.3.1 Regression Specification Error Test (RESET) . . 1914.3.2 Bestimmtheitsmaß R2 . . . . . . . . . . . . . . . 2614.3.3 Box-Cox-Test . . . . . . . . . . . . . . . . . . . . 27

Kapitel 1

Einleitung

v. Auer, Ökonometrie 1—2

1.1 Braucht man Ökonometriker?

1.2 Was ist Ökonometrie?

Ökonomische Theorien werden der empirischen Realität gegenübergestellt.

Es existieren zwei Richtungen der empirischen Forschung:

1) experimentelle Empirie2) historische Empirie

Die Ökonometrie analysiert anhand von beobachtbaren Daten(ökonomische Realität) ökonomische Wirkungszusammenhänge(ökonomische Theorie). Dabei greift sie auf Methoden zurück, die in derstatistischen Theorie entwickelt wurden.

v. Auer, Ökonometrie 1—3

1.3 Die vier Aufgaben der Ökonometrie

Beispiel: Es soll der numerische Zusammenhang zwischen der Höhe desRechnungsbetrages und der Höhe des Trinkgeldes untersucht werden.

Das ökonomische Modell lautet: y = f(x)

1.3.1 Spezifikationa) Funktionale Spezifikation

y = βx (1.1)

yt = βxt (1.2)

yt = βxt + ut . (1.3)

b) Störgrößen-Spezifikationc) Variablen-Spezifikation

Das vollständig spezifizierte Modell (1.3) ist das ökonometrische Modell.

v. Auer, Ökonometrie 1—4

1.3.2 Schätzung

Numerische Illustration 1.1Es seien zwei Gäste beobachtet worden. Dabei bezeichnet xt denRechnungsbetrag und yt das Trinkgeld (beides in Euro):

Gast 1 : (x1 = 10, y1 = 2)

Gast 2 : (x2 = 30, y2 = 3) .

Es wurde im ökonometrischen Modell unterstellt, dass beide Gäste dengleichen Wert β besitzen. Sind bei den beiden Gästen Störeinflüssewirksam geworden?

Numerische Illustration 1.2Welche Werte für β sind plausibel?

v. Auer, Ökonometrie 1—5

Der Schätzwert für β wird durch bβ bezeichnet.Das geschätzte Modell (Variante I) lautet:

byt = bβxt . (1.4)

Die geschätzte Störung (genannt: Residuum) lautet:

but = yt − byt (1.5)

= yt − bβxt .Umstellen liefert das geschätzte Modell (Variante II):

yt = bβxt + but . (1.6)

v. Auer, Ökonometrie 1—6

Numerische Illustration 1.3Für bβ = 0, 15 lautet das geschätzte Modell:

byt = 0, 15 · xt (Variante I) (1.7)

yt = 0, 15 · xt + but (Variante II)

Folglich ergibt sich:

für Gast 1 : by1 = 0, 15 · 10 = 1, 5bu1 = y1 − by1 = 2− 1, 5 = 0, 5für Gast 2 : by2 = 0, 15 · 30 = 4, 5bu2 = y2 − by2 = 3− 4, 5 = −1, 5 .

v. Auer, Ökonometrie 1—7

Ökonomisches Modell⇓

Spezifikation⇓

Ökonometrisches Modell⇓

Schätzung⇓

Geschätztes Modell⇓ ⇓

Hypothesentest Prognose

Abbildung 1.1: Die vier Aufgaben ökonometrischer Analyse.

v. Auer, Ökonometrie 1—8

1.3.3 Hypothesentest

Auf Basis des geschätzten Modells lassen sich verschiedene Hypothesenüberprüfen.

1.3.4 Prognose

Numerische Illustration 1.4Welches Trinkgeld würde ein Gast schätzungsweise geben, der im Wertvon 40 Euro speist? Für bβ = 0, 15 und x0 = 40 ergibt sich aus demgeschätzten Modell (Variante I):

by0 = 0, 15 · 40 = 6 .

v. Auer, Ökonometrie 1—9

1.4 Aufbau der Lehrveranstaltung

Die Annahmen derfunktionalen Spezifikation werden als A-Annahmen, die derStörgrößen-Spezifikation als B-Annahmen und die derVariablen-Spezifikation als C-Annahmen

bezeichnet.

Teil I ist dem einfachen linearen Regressionsmodell gewidmet(Kapitel 2 bis 7).

Teil II beschäftigt sich mit dem multiplen linearen Regressionsmodell(Kapitel 8 bis 12).

Teil III untersucht die Probleme, die sich aus den verschiedenenmöglichen Annahmeverletzungen ergeben (Kapitel 13 bis 21).

Teil IV ist zwei weiterführenden Bereichen der Ökonometrie gewidmet(Kapitel 22 und 23).

v. Auer, Ökonometrie 1—10

1.5 Datenmaterial

Es existieren drei Typen von Daten:

• Zeitreihendaten• Querschnittsdaten• Paneldaten.

Tabelle 1.1: Datenpaare (xt = Rechnungsbetrag, yt = Trinkgeld; beidesin Euro) von 9 beobachteten Gäste.

Stammgast 1 Stammgast 2 Stammgast 31. Abend (x1, y1) = (10, 2) (x2, y2) = (20, 2) (x3, y3) = (25, 4)2. Abend (x4, y4) = (30, 3) (x5, y5) = (35, 3) (x6, y6) = (41, 6)3. Abend (x7, y7) = (50, 7) (x8, y8) = (14, 2) (x9, y9) = (17, 2)

Kapitel 2

Spezifikation

v. Auer, Ökonometrie 2—2

Beispiel: Es wird weiterhin das Trinkgeldbeispiel betrachtet. 20 Gästewurden beobachtet. Die entsprechenden Daten sind in der folgendenTabelle wiedergegeben.

Tabelle 2.1: Die Daten von 20 beobachteten Gästen.

t xt yt t xt yt1 10,00 2,00 11 60,00 7,002 30,00 3,00 12 47,50 5,50...

......

......

...10 12,50 1,00 20 20,00 2,50

v. Auer, Ökonometrie 2—3

2.1 A-Annahmen

Mit Hilfe der A-Annahmen erfolgt die funktionale Spezifikation desökonometrischen Modells.

2.1.1 Erster Schritt: Formulierung eines plausiblenlinearen Modells

y = f(x) (ökonomisches Modell) (2.1)

y = α+ βx . (2.2)

Gleichung (2.2) beschreibt einen linearen aber nicht notwendigerweiseproportionalen Zusammenhang.

v. Auer, Ökonometrie 2—4

-

6

0 20 40 600

2

4

6

8

10

Trinkgeld y

Rechnungsbetrag x}α

⎫⎪⎬⎪⎭| {z }20

β · 20R

Abbildung 2.1: Der „wahre“ Zusammenhang zwischen Rechnungsbetragx und Trinkgeld y.

v. Auer, Ökonometrie 2—5

2.1.2 Zweiter und dritter Schritt: Hinzufügungeines Beobachtungsindex und einer Störgröße

Die Hinzufügung eines Beobachtungsindex liefert:

yt = α+ βxt für t = 1, 2, ..., 20 . (2.3)

Aus Abbildung 2.2 ist ersichtlich, dass Störeinflüsse aufgetreten sind.

v. Auer, Ökonometrie 2—6

-

6

xt

yt

0 20 40 600

2

4

6

8

10

tttt tt tttttt

ttttttt t

Abbildung 2.2: Die Daten des Trinkgeld-Beispiels in grafischer Form.

v. Auer, Ökonometrie 2—7

Das zum ökonomischenModell korrespondierende ökonometrischeModelllautet:

yt = α+ βxt + ut für t = 1, 2, ..., 20 . (2.4)

Dabei werden die Parameter α und β als Regressionsparameter bezeich-net.

Die Variable ut ist als eine Störgröße definiert. Ihre grafische Interpreta-tion ist in Abbildung 2.3 wiedergegeben.

v. Auer, Ökonometrie 2—8

-

6

xt

yt

0 20 40 600

2

4

6

8

10

tttt tt tttttt

ttttttt t⎫⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭

{⎧⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎩

u19

y19

α+ βx19¡¡µ

R

Abbildung 2.3: Der Zusammenhang zwischen beobachtetem Wert yt,Störgröße ut und „ungestörtem“ Einfluss α+ βxt.

v. Auer, Ökonometrie 2—9

2.1.3 Formulierung der A-Annahmen

Das ökonometrische Modell lautete:

yt = α+ βxt + ut (2.4)

Annahme a1 Es fehlen keine relevanten exogenen Variablen und dieexogene Variable xt ist nicht irrelevant.

Annahme a2 Der wahre Zusammenhang zwischen xt und yt ist linear.

Annahme a3 Die Parameter α und β sind für alle T Beobachtungen(xt, yt) konstant.

v. Auer, Ökonometrie 2—10

-

6

xt

yt

0 20 40 600

2

4

6

8

10

t tt t tt t t t tt tt

t tttttt t

Abbildung 2.4: Eine Punktwolke, die auf eine Verletzung der A-Annahmen hindeutet.

v. Auer, Ökonometrie 2—11

-

6

xt

yt

0 20 40 600

2

4

6

8

10

tt tt tt t tt t

tt t t ttt tt t

Abbildung 2.5: Eine weitere Punktwolke, die auf eine Verletzung der A-Annahmen hindeutet.

v. Auer, Ökonometrie 2—12

-

6

xt

yt

0 20 40 600

2

4

6

8

10

tt t t t tt tt t tt tt tt

ttt

Abbildung 2.6: Eine weitere Punktwolke, die auf eine Verletzung der A-Annahmen hindeutet.

v. Auer, Ökonometrie 2—13

2.2 Statistisches Repetitorium I

2.2.1 Zufallsvariable undWahrscheinlichkeitsverteilung

Wie viele mögliche Ausprägungen besitzt die Zufallsvariable:

u1 = “Geworfene Augenzahl bei einmaligem Würfeln” ?

Welche Wahrscheinlichkeit besitzt jede einzelne Ausprägung?Wie viele mögliche Ausprägungen besitzt die Zufallsvariable:

u2 = “Summe der geworfenen Augenzahlen bei zweimaligem Würfeln” ?

v. Auer, Ökonometrie 2—14

Die Wahrscheinlichkeit für die Ausprägung “2” beträgt bei u2:

f(2) = (1/6) · (1/6) = 1/36 .

Die Wahrscheinlichkeit für die Ausprägung “3” beträgt

f(3) = 2 · (1/6) · (1/6) = 2/36 .

Jeder der möglichen Ausprägungen von u2 kann eine Wahrscheinlichkeitihres Auftretens zugeordnet werden.

Man bezeichnet diese Zuordnung als die Wahrscheinlichkeitsverteilungder Zufallsvariable u2.

v. Auer, Ökonometrie 2—15

1 2 3 4 5 7 9 10111286

1/362/36

4/363/36

5/366/36

-

6

u2

f(u2)

Abbildung 2.7: (Teil a) Eine diskrete Wahrscheinlichkeitsverteilung.

v. Auer, Ökonometrie 2—16

00

1

2

1-

6

u4

f(u4)

Abbildung 2.7: (Teil b) Eine stetige Wahrscheinlichkeitsverteilung.

v. Auer, Ökonometrie 2—17

Man unterscheidet zwischen diskreten Zufallsvariablen und stetigenZufallsvariablen.

Ein weiteres Beispiel für eine diskrete Zufallsvariable ist:

u3 = „Summe der geworfenen Augenzahlen bei 100.000 mal Würfeln“

Ein Beispiel für eine stetige Zufallsvariable ist:

u4 = “eine reelle Zahl aus dem Intervall [0, 1]” .

v. Auer, Ökonometrie 2—18

2.2.2 Erwartungswert einer Zufallsvariable

Der Erwartungswert der Zufallsvariable u lautet:

E(u) =NXi=1

f(ui) · ui . (2.5)

Dabei bezeichnet f(ui) die Wahrscheinlichkeit, mit der die Ausprägungi der Zufallsvariable u beobachtet wird.

v. Auer, Ökonometrie 2—19

Numerische Illustration 2.1Für die Zufallsvariable

u = “Geworfene Augenzahl bei einmaligem Würfeln”

gilt N = 6. Der Erwartungswert beträgt

E(u) =6X

i=1

1/6 · ui = 1/66X

i=1

ui = 1/6 (1 + 2 + 3 + 4 + 5 + 6) = 3, 5 .

Wahrscheinlichkeiten müssen sich zu 1 addieren:NXi=1

f(ui) = 1 .

Der Erwartungswert E(u) ist das mit den Wahrscheinlichkeiten f(ui)gewichtete Mittel aller möglichen Ausprägungen der Zufallsvariable u.

v. Auer, Ökonometrie 2—20

2.2.3 Varianz einer Zufallsvariable

Die Varianz einer Zufallsvariable misst die Streuung der Zufallsvariableum ihren Erwartungswert:

var(u) =NXi=1

f(ui) (ui −E(u))2 . (2.6)

Numerische Illustration 2.2Da im Würfel Beispiel E(u) = 3, 5, ergibt sich:

var(u) =1

6· 6, 25 + 1

6· 2, 25 + 1

6· 0, 25 + 1

6· 0, 25 + 1

6· 2, 25 + 1

6· 6, 25

= 2, 91666 .

v. Auer, Ökonometrie 2—21

Die quadrierte Abweichung (u−E(u))2 kann als Zufallsvariable aufgefasstwerden, wobei E(u) zufallsunabhängig ist:

f(ui) = f¡(ui −E(u))2

¢.

Folglich kann die Varianz auch in der Form

var(u) =NXi=1

f¡(ui −E(u))2

¢(ui −E(u))2 (2.7)

ausgedrückt werden, bzw.

var(u) = E£(u−E(u))2

¤. (2.8)

Die Wurzel der Varianz bezeichnet man als Standardabweichung (engl.:standard deviation):

sd(u) =pvar(u) .

v. Auer, Ökonometrie 2—22

2.2.4 Bedingte und gemeinsameWahrscheinlichkeitsverteilung

Gegeben seien die Zufallsvariablen

u1 = „Geworfene Augenzahl bei einmaligem Würfeln“

u6 = „Anzahl der natürlichen Zahlen, durch welche die

geworfene Augenzahl teilbar ist“ .

Tabelle 2.2: Ausprägungen der Zufallsvariablen u1 und u6 imZufallsexperiment „einmaliges Würfeln“.

Zufallsvariable Ausprägungu1 1 2 3 4 5 6u6 1 2 2 3 2 4

v. Auer, Ökonometrie 2—23

Für u1 lässt sich eine bedingte Wahrscheinlichkeitsverteilung definieren:f(u1i|u6j). Sie ordnet bei gegebenem Wert u6j jeder möglichenAusprägung von u1 die Wahrscheinlichkeit ihres Auftetens zu.

Für vorgegebenes u6j = 2 ergibt sich die folgende bedingte Wahrschein-lichkeitsverteilung:

f(u1i=1|u6j=2) = 0f(u1i=2|u6j=2) = 1/3f(u1i=3|u6j=2) = 1/3f(u1i=4|u6j=2) = 0f(u1i=5|u6j=2) = 1/3f(u1i=6|u6j=2) = 0

v. Auer, Ökonometrie 2—24

Die gemeinsame Wahrscheinlichkeitsverteilung f(u1i, u6j) ordnet jedermöglichen Ausprägungskombination (u1i, u6j) eine Wahrscheinlichkeitihres Auftretens zu. Es gilt:

f(u1i, u6j) = f(u1i|u6j) · f(u6j) = f(u6j|u1i) · f(u1i) . (2.9)

Numerische Illustration 2.3Die Wahrscheinlichkeit für das Auftreten der Ausprägungskombinationu1i = 3 und u6j = 2 ergibt sich gemäß der Gleichung (2.9) aus

f(u1i = 3, u6j = 2) = f(u1i = 3|u6j = 2) · f(u6j = 2) = 1/3 · 1/2 = 1/6

oder alternativ aus

f(u1i = 3, u6j = 2) = f(u6j = 2|u1i = 3) · f(u1i = 3) = 1 · 1/6 = 1/6 .

v. Auer, Ökonometrie 2—25

Tabelle 2.3: Gemeinsame Wahrscheinlichkeiten der Zufallsvariablen u1und u6.

u1i1 2 3 4 5 6

1 1/6 0 0 0 0 02 0 1/6 1/6 0 1/6 0u6j3 0 0 0 1/6 0 04 0 0 0 0 0 1/6

v. Auer, Ökonometrie 2—26

2.2.5 Kovarianz zweier Zufallsvariablen

Unkorreliertheit

Ein positiver Zusammenhang besteht, wenn tendenziell(u1i −E (u1)) > 0 ⇐⇒ (u6j −E (u6)) > 0

(u1i −E (u1)) < 0 ⇐⇒ (u6j −E (u6)) < 0 .

Ein negativer Zusammenhang besteht, wenn tendenziell(u1i −E (u1)) > 0 ⇐⇒ (u6j −E (u6)) < 0

(u1i −E (u1)) < 0 ⇐⇒ (u6j −E (u6)) > 0 .

Die Kovarianz der beiden Zufallsvariablen formalisiert diesenZusammenhang:

cov(u1, u6) =N1Xi=1

N6Xj=1

f(u1i, u6j) · [(u1i −E (u1)) (u6j −E (u6))] (2.10)

= E [(u1 −E (u1)) (u6 −E (u6))] . (2.11)

v. Auer, Ökonometrie 2—27

Beträgt die Kovarianz 0, dann üben die beiden Zufallsvariablen keinenlinearen Einfluss aufeinander aus. Sie sind dann unkorreliert.

Numerische Illustration 2.4Der Erwartungswert von u1 besitzt den Wert E(u1) = 3, 5. Für u6 erhältman:

E(u6) =1

6· 1 + 3

6· 2 + 1

6· 3 + 1

6· 4 = 2, 333

und mit Hilfe von Tabelle 2.3

cov(u1, u6) =1

6(-2, 5) (-1, 333) +

1

6(-1, 5) (-0, 333) +

1

6(-0, 5) (-0, 333) +

+1

6(0, 5) (0, 666) +

1

6(1, 5) (-0, 333) +

1

6(2, 5) (1, 666)

= 1, 333 .

v. Auer, Ökonometrie 2—28

Korrelationskoeffizient

Gegeben seien die Zufallsvariablen

u5 = „Körpergröße eines erwachsenen Engländers“ ,

u7 = „Schuhgröße eines erwachsenen Engländers“ .

Der Korrelationskoeffizient der Zufallsvariablen u5 und u7 lautet:

cor(u5, u7) =cov(u5, u7)

sd(u5) · sd(u7) . (2.12)

Es gilt immer −1 ≤ cor(u5, u7) ≤ 1.

v. Auer, Ökonometrie 2—29

Unabhängigkeit

Zufallsvariablen, die weder einen linearen noch einen nicht-linearenEinfluss aufeinander ausüben, werden als statistisch unabhängigbezeichnet.

Ein Beispiel:

u1 = „Geworfene Augenzahl bei Würfel 1“

undu2 = „Geworfene Augenzahl bei Würfel 2“ .

v. Auer, Ökonometrie 2—30

Die Kenntnis der tatsächlich beobachteten Ausprägung der erstenZufallsvariable gibt keinerlei zusätzliche Informationen über dieAusprägung der anderen Zufallsvariable:

f(u1i|u2j) = f(u1i) . (2.13)

Es ergibt sich aus (2.9) und (2.13):

f(u1i, u2j) = f(u1i|u2j) · f(u2j) = f(u1i) · f(u2j) . (2.14)

v. Auer, Ökonometrie 2—31

2.2.6 Rechenregeln für Erwartungswert und Varianz

Erwartungswert

Es seien u1 und u2 zwei Zufallsvariablen und x1 und x2 zwei Konstanten.Dann gilt:

E(x1) = x1 (2.15)

E(x1 · u1) = x1 · E(u1) (2.16)

E(u1 + u2) = E(u1) +E(u2) (2.17)

und damitE(x1 + x2 · u2) = x1 + x2 ·E(u2) . (2.18)

v. Auer, Ökonometrie 2—32

Im Regelfall gilt: E(u1 · u2) 6= E(u1) · E(u2). Nur wenn u1 und u2unkorreliert oder sogar voneinander unabhängig sind, gilt:

E(u1 · u2) = E(u1) ·E(u2) . (2.19)

Es gilt immer:E[E(u)] = E(u) .

v. Auer, Ökonometrie 2—33

Varianz

Die Zufallsvariable u3 ergebe sich aus den anderen Größen gemäßu3 = x1 · u1 + x2 · u2. Es gilt folgende Regel:

var(u3) = x21var(u1) + x22var(u2) + 2x1x2cov(u1, u2) . (2.20)

Für den Spezialfall u3 = x1 + x2 · u2 (also u1 = 1) ergibt sich:

var(u3) = x22var(u2) . (2.21)

v. Auer, Ökonometrie 2—34

Kovarianz

Die Kovarianz der zuvor definierten Zufallsvariable u3 und einer Zufalls-variable u4 lautet:

cov(u3, u4) = cov(x1 · u1 + x2 · u2 , u4)= x1cov(u1, u4) + x2cov(u2, u4) . (2.22)

Ein Blick auf Definition (2.11) zeigt, dass Kovarianzen immer symme-trisch sind:

cov(u3, u4) = cov(u4, u3) (2.23)

v. Auer, Ökonometrie 2—35

2.2.7 Eine spezielle Wahrscheinlichkeitsverteilung:Die Normalverteilung

Die Gestalt der Normalverteilunghängt ähnelt Abbildung 2.7.

Die Gestalt ist ausschließlich vom Erwartungswert und der Varianz derZufallsvariable u ab:

u ∼ N (E(u), var(u)) .

v. Auer, Ökonometrie 2—36

2.3 B-Annahmen

Annahmen, die im Rahmen der Störgrößen-Spezifikation, also bezüglichder Variablen ut getroffen werden, werden hier als B-Annahmenbezeichnet.

2.3.1 Begründungen für die Existenz der Störgröße

• Die verwendeten Daten enthalten Erhebungs- und Messfehler.• Bestimmte erklärende Variablen sind nicht berücksichtigt.• Das menschliche Verhalten enthält selbst ein Zufallselement.

v. Auer, Ökonometrie 2—37

2.3.2 Formulierung der B-Annahmen

Jede der T Störgrößen ut stellt eine eigene Zufallsvariable dar.

Annahme b1 Die Störgröße ut hat für alle Beobachtungen t einenErwartungswert von 0, das heißt,

E(ut) = 0 , für t = 1, 2, ..., T. (2.24)

Annahme b2 Die Störgröße ut hat für alle Beobachtungen t einekonstante Varianz, das heißt,

var(ut) = σ2 , für t = 1, 2, ..., T. (2.25)

Falls Annahme b2 verletzt ist, spricht man von heteroskedastischen (odernicht homoskedastischen) Störgrößen.

v. Auer, Ökonometrie 2—38

-

6

xt

yt

0 20 40 600

2

4

6

8

10

tttt tt tttttt

ttttttt tdddd dd d

dddddddddd

dd d R

Abbildung 2.8: Konstanter Messfehler bei der Erfassung von yt.

v. Auer, Ökonometrie 2—39

-

6

xt

yt

0 20 40 600

2

4

6

8

10

t t tt tt tt

tttt t

ttttt t

R

Abbildung 2.9: Eine Punktwolke, die auf heteroskedastische Störgrößenhindeutet.

v. Auer, Ökonometrie 2—40

Annahme b3 Die Störgrößen sind nicht korreliert, das heißt,

cov(ut, us) = 0 , (2.26)

für alle t 6= s sowie t = 1, 2, ..., T und s = 1, 2, .., T.

Ist Annahme b3 erfüllt, dann sagt man, dass keine Autokorrelation vor-liegt.

Annahme b4 Die Störgrößen ut sind normalverteilt, das heißt,

ut ∼ N(0, var(ut)) , für t = 1, 2, ..., T.

v. Auer, Ökonometrie 2—41

-

6

xt

yt

0 20 40 600

2

4

6

8

10

t t ttt t

tt ttt t

t tttttt tR

Abbildung 2.10: Eine Punktwolke, die auf Störgrößen hindeutet, welchenicht normalverteilt sind.

v. Auer, Ökonometrie 2—42

6

- ut

f(ut)

Abbildung 2.11: Eine mögliche Wahrscheinlichkeitsverteilung einer nichtnormalverteilten Störgröße ut.

v. Auer, Ökonometrie 2—43

Wenn die Annahmen b1 bis b3 erfüllt sind, dann spricht man vom weißenRauschen der Störgrößen.

Wenn alle vier B-Annahmen erfüllt sind, dann hat jede der T Zufallsva-riablen ut die gleiche Wahrscheinlichkeitsverteilung:

ut ∼ UN(0, σ2) , (2.27)

für alle t = 1, 2, ..., T .

v. Auer, Ökonometrie 2—44

x3

x2

x1

yt

RA

q xt

f(ut)

f(u1) f(u2)f(u3)

1

ru3

6

Abbildung 2.12: Eine Veranschaulichung des Annahmenkomplexes b1—b4.

v. Auer, Ökonometrie 2—45

2.4 Statistisches Repetitorium II

2.4.1 Stichproben-Mittelwert einer Variable

Der arithmetische Stichproben-Mittelwert der T Beobachtungenx1, x2, . . . , xT lautet:

x =1

T

TXt=1

xt ,

v. Auer, Ökonometrie 2—46

2.4.2 Stichproben-Varianz einer Variable

Der Durchschnitt der quadratischen Abweichungen vomStichproben-Mittelwert x beträgt:

dvar(x) = 1

T − 1TXt=1

(xt − x)2 =1

T − 1Sxx ,

wobei Sxx =PT

t=1(xt−x)2 als Variation der Variable x bezeichnet wird.

Die Stichproben-Standardabweichung lautet:

bsd(x) =pdvar(x) .

v. Auer, Ökonometrie 2—47

2.4.3 Stichproben-Kovarianz zweier Variablen

Für die T Beobachtungspaare (x1, y1), (x2, y2), . . . , (xT , yT ) lautet dieStichproben-Kovarianz:

ccov(x, y) = 1

T − 1TXt=1

(xt − x)(yt − y) =1

T − 1Sxy .

Dabei bezeichnet Sxy =PT

t=1(xt − x)(yt − y) die Kovariation.

Der Stichproben-Korrelationskoeffizient lautet:

ccor(x, y) = ccov(x, y)bsd(x) · bsd(y) = Sxy/(T − 1)pSxx/(T—1) ·

pSyy/(T—1)

=Sxy√

Sxx ·pSyy

.

v. Auer, Ökonometrie 2—48

2.5 C-Annahmen

Die Variablen-Spezifikation geschieht durch das Formulieren derC-Annahmen.

Annahme c1 Die exogene Variable xt ist keine Zufallsvariable, sondernkann wie in einem Experiment kontrolliert werden.

Annahme c2 Die exogene Variable xt weist nicht für alle Beobach-tungen t den gleichen Wert auf: Sxx > 0.

Für eine Schätzung der wahren Gerade R müssen mindestens zweiBeobachtungen vorliegen: T ≥ 2.