Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende...

37
Rumpfskript Deskriptive Statistik Prof. Dr. Ralf Runde Statistik und ¨ Okonometrie, Universit¨ at Siegen

Transcript of Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende...

Page 1: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Rumpfskript

Deskriptive Statistik

Prof. Dr. Ralf Runde

Statistik und Okonometrie, Universitat Siegen

Page 2: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Vorbemerkung

Vorbemerkung

Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein

Rumpfskript. Als solches dient es sowohl zur Vorbereitung auf die nachste Vorle-

sung als auch zur Nachbereitung aller schon gehorten Vorlesungen. Dies beinhaltet

als naturliche Konsequenz den Besuch der Vorlesungen: Ein Akt, der unerlasslich

ist, wenn man nicht nur Statistik verstehen, sondern die Klausur auch bestehen will.

Als Erganzung zum Skript sind die vorlesungsbegleitenden Materialien im Inter-

net erhaltlich.

Es schadet auch nicht unbedingt, mal in dem ein oder anderen Statistikbuch zu

schmokern.

Doch auch das allein reicht noch nicht aus, denn das Ziel ist schließlich das Losen

von statistischen Problemen. Um den Studierenden hierzu das erforderliche Training

zu ermoglichen, werden Ubungsveranstaltungen angeboten, deren Besuch ebenfalls

unbedingt notwendig ist.

Was letztendlich nachdrucklich empfohlen wird: Nach Moglichkeit ganz, ganz viele

Aufgaben rechnen.

gez. Prof. Dr. Ralf Runde

1

Page 3: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Inhaltsverzeichnis

Inhaltsverzeichnis

Literaturliste 7

I Statistische Grundbegriffe 8

1 Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.1 Grundgesamtheit . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2 Merkmalstrager . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3 Merkmal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4 Merkmalsauspragung . . . . . . . . . . . . . . . . . . . . . . . 8

2 Unterscheidung von Merkmalen . . . . . . . . . . . . . . . . . . . . . 9

2.1 Quantitatives Merkmal . . . . . . . . . . . . . . . . . . . . . 9

2.2 Qualitatives Merkmal . . . . . . . . . . . . . . . . . . . . . . 9

2.3 Diskretes Merkmal . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Stetiges Merkmal . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.1 Nominalskala . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.2 Ordinalskala . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.3 Intervallskala . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.4 Verhaltnisskala . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.5 Metrische Skala/Kardinalskala . . . . . . . . . . . . . . . . . 10

4 Haufigkeitsverteilung bei diskreten Merkmalen . . . . . . . . . . . . 11

4.1 Urliste/Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 11

4.2 Absolute Haufigkeit . . . . . . . . . . . . . . . . . . . . . . . 11

2

Page 4: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Inhaltsverzeichnis

4.3 Relative Haufigkeit . . . . . . . . . . . . . . . . . . . . . . . . 11

4.4 Haufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . 11

4.5 Empirische Verteilungsfunktion . . . . . . . . . . . . . . . . . 12

5 Haufigkeitsverteilung bei Klassenbildung . . . . . . . . . . . . . . . . 13

5.1 Absolute Klassenhaufigkeit . . . . . . . . . . . . . . . . . . . 13

5.2 Relative Klassenhaufigkeit . . . . . . . . . . . . . . . . . . . . 13

5.3 Klassierte empirische Verteilungsfunktion . . . . . . . . . . . 13

5.4 Histogramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

6 Haufigkeitsverteilung bei zweidimensionalen Beobachtungsreihen . . 14

6.1 Gemeinsame absolute Haufigkeit . . . . . . . . . . . . . . . . 14

6.2 Gemeinsame relative Haufigkeit . . . . . . . . . . . . . . . . . 15

6.3 Randhaufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 15

6.4 Kontingenztabelle . . . . . . . . . . . . . . . . . . . . . . . . 15

II Statistische Kennzahlen 16

7 Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

7.1 Arithmetisches Mittel . . . . . . . . . . . . . . . . . . . . . . 16

7.2 Gewogenes arithmetisches Mittel . . . . . . . . . . . . . . . . 16

7.3 Arithmetisches Mittel bei linearer Transformation . . . . . . 16

7.4 Geometrisches Mittel . . . . . . . . . . . . . . . . . . . . . . . 17

7.5 Harmonisches Mittel . . . . . . . . . . . . . . . . . . . . . . . 17

7.6 Vergleich der Mittelwerte . . . . . . . . . . . . . . . . . . . . 17

7.7 Haufigster Wert oder Modus . . . . . . . . . . . . . . . . . . 17

3

Page 5: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Inhaltsverzeichnis

8 Quantile und Quartile . . . . . . . . . . . . . . . . . . . . . . . . . . 18

8.1 α-Quantil oder 100α%-Quantil . . . . . . . . . . . . . . . . . 18

8.2 Quartile und Median . . . . . . . . . . . . . . . . . . . . . . . 18

8.3 Quantile bei linearer Transformation . . . . . . . . . . . . . . 18

9 Streuungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

9.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

9.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . . . . . 19

9.3 Mittlere absolute Abweichung . . . . . . . . . . . . . . . . . . 19

9.4 Minimumeigenschaft des Medians . . . . . . . . . . . . . . . . 19

9.5 Mittlere quadratische Abweichung . . . . . . . . . . . . . . . 19

9.6 Minimumeigenschaft des arithmetischen Mittels . . . . . . . . 20

9.7 Empirische Varianz . . . . . . . . . . . . . . . . . . . . . . . . 20

9.8 Empirische Varianz bei linearer Transformation . . . . . . . . 20

9.9 Empirische Standardabweichung . . . . . . . . . . . . . . . . 20

9.10 Empirische Standardabweichung bei linearer Transformation 21

9.11 Variationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . 21

9.12 Momente einer Beobachtungsreihe . . . . . . . . . . . . . . . 21

9.13 Empirische Schiefe . . . . . . . . . . . . . . . . . . . . . . . . 22

III Konzentrationsmaße 23

10.1 Lorenzkurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

10.2 Gini-Koeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4

Page 6: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Inhaltsverzeichnis

IV Indexzahlen 25

11 Preisindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

11.1 Preisindex nach Laspeyres . . . . . . . . . . . . . . . . . . . . 25

11.2 Preisindex nach Paasche . . . . . . . . . . . . . . . . . . . . . 25

12 Mengenindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

12.1 Mengenindex nach Laspeyres . . . . . . . . . . . . . . . . . . 25

12.2 Mengenindex nach Paasche . . . . . . . . . . . . . . . . . . . 25

V Zusammenhangsmaße 26

13.1 Empirische Kovarianz . . . . . . . . . . . . . . . . . . . . . . 26

13.2 Korrelationskoeffizient nach Bravais-Pearson . . . . . . . . . 26

13.3 Rangkorrelationskoeffizient nach Spearman . . . . . . . . . . 26

VI Elementare Regression 28

14.1 Modell der einfachen linearen Regression . . . . . . . . . . . . 28

14.2 Regressionsgerade . . . . . . . . . . . . . . . . . . . . . . . . 28

14.3 Methode der kleinsten Quadrate . . . . . . . . . . . . . . . . 29

14.4 Regressionskoeffizienten . . . . . . . . . . . . . . . . . . . . . 29

14.5 KQ-Residuen . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

14.6 Bestimmtheitsmaß . . . . . . . . . . . . . . . . . . . . . . . . 30

VII Elementare Zeitreihenanalyse 31

15.1 Zeitreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

15.2 Zeitreihendiagramm . . . . . . . . . . . . . . . . . . . . . . . 31

16 Komponenten einer Zeitreihe . . . . . . . . . . . . . . . . . . . . . . 32

5

Page 7: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Inhaltsverzeichnis

16.1 Trendkomponente . . . . . . . . . . . . . . . . . . . . . . . . 32

16.2 Konjunkturkomponente . . . . . . . . . . . . . . . . . . . . . 33

16.3 Glatte Komponente . . . . . . . . . . . . . . . . . . . . . . . 33

16.4 Saisonkomponente . . . . . . . . . . . . . . . . . . . . . . . . 33

16.5 Zufallskomponente . . . . . . . . . . . . . . . . . . . . . . . . 33

17 Saisonbereinigung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

17.1 Gleitender Durchschnitt . . . . . . . . . . . . . . . . . . . . . 33

17.2 Typische Saisonfigur . . . . . . . . . . . . . . . . . . . . . . . 35

17.3 Saisonbereinigte Werte . . . . . . . . . . . . . . . . . . . . . . 35

18 Trendbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

18.1 Linearer Trend . . . . . . . . . . . . . . . . . . . . . . . . . . 35

18.2 KQ-Methode bei Zeitreihen . . . . . . . . . . . . . . . . . . . 36

6

Page 8: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Literaturliste

Weiterfuhrende Literatur zum Rumpfskript:

Bamberg, G.; Baur, F. (2002): Statistik, 12. Auflage, Oldenbourg Verlag, Munchen.

Bleymuller, J.; Gehlert, G.; Gulicher, H. (2002): Statistik fur Wirtschaftswissen-

schaftler, 13. Auflage, Vahlen Verlag, Munchen.

Mosler, K.; Schmid, F. (2003): Beschreibende Statistik und Wirtschaftsstatistik, Spring-

er Verlag, Berlin.

Pflaumer, P.; Heine, B.; Hartung, J. (2001): Statistik fur Wirtschafts- und Sozial-

wissenschaften: Deskriptive Statistik, 2. Auflage, Oldenbourg Verlag, Munchen.

Weiterfuhrende popularwissenschaftliche Literatur:

Beck-Bornholdt, H.-P.; Dubben, H.-H. (2001): Der Hund, der Eier legt - Erkennen

von Fehlinformationen durch Querdenken, Rowohlt, Reinbek.

Kramer, W. (2000): So lugt man mit Statistik, Piper Verlag, Munchen.

Randow, G. von (1992): Das Ziegenproblem - Denken in Wahrscheinlichkeiten, Ro-

wohlt, Reinbek.

Scheid, H. (1996): Zufall: Kausalitat und Chaos in Alltag und Wissenschaft, BI-

Taschenbuchverlag, Mannheim.

Singh, S. (2003): Fermats letzter Satz. Die abenteuerliche Geschichte eines mathe-

matischen Ratsels, 8. Auflage, Deutscher Taschenbuch Verlag, Munchen.

7

Page 9: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

I Statistische Grundbegriffe

1 Begriffe

1.1 Definition (Grundgesamtheit)

Eine Grundgesamtheit ist die Zusammenfassung aller in Verbindung mit dem Un-

tersuchungsziel interessierenden Elemente ei, die Merkmalstrager mindestens eines

ubereinstimmenden Merkmals sind.

Symbol: Ω = ei|i = 1, . . . , n

1.2 Definition (Merkmalstrager)

Jedes Element ei, das Trager eines oder mehrerer Merkmale ist, heißt Merkmals-

trager.

1.3 Definition (Merkmal)

Eine Eigenschaft eines Merkmalstragers, die durch sachliche, raumliche und zeitliche

Abgrenzung exakt beschrieben ist, heißt Merkmal.

Symbol: A,B, X, Y usw.

1.4 Definition (Merkmalsauspragung)

Unter einer Merkmalsauspragung versteht man eine der grundsatzlich moglichen

Ausformulierungen eines Merkmals bei einem Merkmalstrager.

Symbol: a

8

Page 10: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

2 Unterscheidung von Merkmalen

2.1 Definition (Quantitatives Merkmal)

Merkmale, deren Auspragungen als Vielfaches einer elementaren Maßeinheit ange-

geben werden konnen, heißen quantitative Merkmale. Zwischen den verschiedenen

Auspragungen eines quantitativen Merkmals besteht immer eine Rangfolge (Reihen-

folge). Der Unterschied zwischen zwei Auspragungen kann stets quantifiziert (gemes-

sen) werden. Die Auspragungen werden oft durch reelle Zahlen dargestellt.

2.2 Definition (Qualitatives Merkmal)

Merkmale, die nicht quantitativ sind, heißen qualitative Merkmale. Solche Merkmale

lassen sich nur qualitativ (verbal) beschreiben. Auspragungen eines Qualitativen

Merkmals unterscheiden sich nur durch ihre Art. Der Unterschied zwischen zwei

Auspragungen kann nicht gemessen werden. Es kann eine Rangfolge bestehen.

2.3 Definition (Diskretes Merkmal)

Merkmale, die nur endlich viele oder hochstens abzahlbar unendlich viele verschie-

dene Merkmalsauspragungen besitzen, heißen diskrete Merkmale.

2.4 Definition (Stetiges Merkmal)

Merkmale, deren Auspragungen ein ganzes Intervall der Zahlengeraden bilden, hei-

ßen stetige Merkmale.

3 Skalierung

3.1 Definition (Nominalskala)

Eine Nominalskala liegt vor, wenn durch sie nur die Verschiedenheit der Merkmals-

auspragungen zum Ausdruck gebracht werden kann. Merkmale, deren Auspragung-

9

Page 11: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

en nur in einer solchen Skala dargestellt werden konnen, heißen nominale Merk-

male. Nominalskalen sind Skalen qualitativer Merkmale, bei denen es keine natur-

liche Rangordnung gibt.

3.2 Definition (Ordinalskala)

Eine Ordinalskala (Rangskala) liegt vor, wenn die unterscheidbaren Merkmalsauspra-

gungen in eine naturliche Rangordnung (Reihenfolge) gebracht werden konnen. Merk-

male, deren Auspragungen in einer solchen Skala dargestellt werden konnen, heißen

ordinale Merkmale. Die Abstande zwischen den verschiedenen Auspragungen ordi-

naler Merkmale sind nicht quantifizierbar.

3.3 Definition (Intervallskala)

Eine Intervallskala liegt vor, wenn neben der naturlichen Rangordnung die Moglich-

keit besteht, Abstande zwischen den einzelnen Merkmalsauspragungen anzugeben.

Dafur ist es notwendig, dass es sich um Auspragungen eines quantitativen Merkmals

handelt. Der Nullpunkt kann willkurlich festgelegt werden.

3.4 Definition (Verhaltnisskala)

Eine Verhaltnisskala liegt vor, wenn zusatzlich zu den Eigenschaften der Intervall-

skala noch ein absoluter Nullpunkt vorhanden ist. Dadurch wird der Quotient zweier

Merkmalsauspragungen unabhangig von der gewahlten Maßeinheit.

3.5 Definition (Metrische Skala/Kardinalskala)

Eine metrische Skala bzw. Kardinalskala liegt vor, wenn eine Intervallskala oder

Verhaltnisskala vorliegt. Merkmale, deren Auspragung in einer solchen Skala darge-

stellt werden konnen, heißen metrisch oder kardinal skaliert.

10

Page 12: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

4 Haufigkeitsverteilung bei diskreten Merkmalen

4.1 Definition (Urliste/Stichprobe)

Ein Merkmal X werde an n Merkmalstragern einer statistischen Grundgesamtheit

beobachtet, dann wird das n-Tupel (x1, . . . , xn) aller n Beobachtungen als Urliste

od. Stichprobe bezeichnet. Die in der Urliste vorkommenden Merkmalsauspragungen

seien mit a1, . . . , ar bezeichnet (r ≤ n).

4.2 Definition (Absolute Haufigkeit)

Die Anzahl derjenigen Beobachtungswerte aus der Urliste vom Umfang n, welche

die Merkmalsauspragung ai besitzen, nennt man absolute Haufigkeit von ai. Man

bezeichnet sie mit Hi = H(ai).

Bemerkung:

Es gilt∑r

i=1 Hi = n.

4.3 Definition (Relative Haufigkeit)

Gegeben sei die absolute Haufigkeit von ai, dann heißt der Anteilswert

hi = h(ai) =Hi

n

relative Haufigkeit von ai.

Bemerkung:

Es gilt∑r

i=1 hi = 1 und 0 ≤ hi ≤ 1.

4.4 Definition (Haufigkeitsverteilung)

Unter einer Haufigkeitsverteilung versteht man allgemein die Zuordnung von Haufig-

keiten zu den Merkmalsauspragungen:

(a1,H1), . . . , (ar,Hr) od. (a1, h1), . . . , (ar, hr).

11

Page 13: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

4.5 Definition (Empirische Verteilungsfunktion)

Die Funktion

Fn(x) =∑ai≤x

h(ai)

nennt man die kummulierte relative Haufigkeitsfunktion o. empirische Verteilungs-

funktion der Stichprobe. An jeder Stelle x ∈ R stellt der Funktionswert Fn(x) die

relative Haufigkeit derjenigen Stichprobenwerte dar, die kleiner oder gleich, also

hochstens gleich x sind.

Falls a1, . . . , ar der Große nach geordnete Auspragungen einer Stichprobe mit den

zugehorigen relativen Haufigkeiten h1, . . . , hr sind, gilt also:

Fn(x) =

0 fur x < a1

h1 fur a1 ≤ x < a2

h1 + h2 fur a2 ≤ x < a3

h1 + h2 + h3 fur a3 ≤ x < a4

......

1 fur ar ≤ x

Bemerkung:

Die empirische Verteilungsfunktion ist also eine rechtsseitig stetige Treppenfunktion

mit Sprungstellen an den beobachteten Auspragungen aj . Die Sprunghohe betragt

jeweils die zugehorige relative Haufigkeit hj .

Abbildung:

12

Page 14: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

5 Haufigkeitsverteilung bei Klassenbildung

5.1 Definition (Absolute Klassenhaufigkeit)

Die Anzahl der Beobachtungswerte, welche in der Klasse Kj der Breite bj ,

j = 1, . . . ,m, enthalten sind, heißt absolute Klassenhaufigkeit. Man bezeichnet sie

mit Hj = H(Kj).

Bemerkung:

Es gilt∑m

j=1 Hj = n.

5.2 Definition (Relative Klassenhaufigkeit)

Die relative Klassenhaufigkeit hj ist der Quotient aus absoluter Klassenhaufigkeit

Hj und dem Stichprobenumfang

hj = h(Kj) =Hj

n.

Bemerkung:

Es gilt∑m

j=1 hj = 1 und 0 ≤ hj ≤ 1.

5.3 Definition (Klassierte empirische Verteilungsfunktion)

Wir nehmen an, alle m Klassen seien links offen und rechts abgeschlossen, mit der

Darstellung Kj =]uj−1, uj ] mit j = 1, . . . ,m. Dann ist die Anzahl der Beobachtungs-

werte, welche die Grenze uk nicht ubersteigen gleich der Summe der absoluten Klas-

senhaufigkeiten aller Klassen bis zur Stelle uk. Mit den relativen Klassenhaufigkeiten

hj kann der Wert der klassierten empirischen Verteilungsfunktion an der Grenzstel-

le uk durch Fn(u0) = 0 und Fn(uk) =∑k

j=1 hj fur k = 1, . . . ,m berechnet werden.

Verbindet man nun die Punkte Fn(u0), Fn(u1), . . . , Fn(um) geradlinig miteinander

und setzt Fn(x) = 0 fur x ≤ u0 und Fn(x) = 1 fur x ≥ um, so erhalt man eine

stetige Funktion, die klassierte empirische Verteilungsfunktion.

13

Page 15: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

5.4 Definition (Histogramm)

Als Histogramm bezeichnet man die graphische Darstellung einer Haufigkeitsverteil-

ung bei Klassenbildung. Es besteht aus Rechtecken, die uber jeder Klasse auf der Ab-

zisse so errichtet werden, daß die Rechteckflache proportional zur jeweiligen relativen

bzw. absoluten Klassenhaufigkeit ist. Falls alle Klassen gleiche Breite besitzen, darf

alternativ die Rechteckhohe proportional zur jeweiligen Klassenhaufigkeit gewahlt

werden.

Abbildung:

6 Haufigkeitsverteilung bei zweidimensionalen Beobachtungsreihen

6.1 Definition (Gemeinsame absolute Haufigkeit)

Das Merkmal X besitze die Auspragungen a1, . . . , ar, das Merkmal Y die Auspra-

gungen b1, . . . , bs. Insgesamt gibt es r · s verschiedene Paare, namlich (aj , bk) fur

j = 1, . . . , r und k = 1, . . . , s. Die Anzahl der Beobachtungspaare (xi, yi) aus der

Urliste, welche mit (aj , bk) ubereinstimmen, heißt die gemeinsame absolute Haufig-

keit von (aj , bk). Man bezeichnet sie mit Hjk = H(aj , bk) fur j = 1, . . . , r und

k = 1, . . . , s.

Bemerkung:

Es gilt∑r

j=1

∑sk=1 Hjk = n.

14

Page 16: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Grundbegriffe

6.2 Definition (Gemeinsame relative Haufigkeit)

Gegeben sei die gemeinsame absolute Haufigkeit von (aj , bk), dann heißt der An-

teilswert

hjk = h(aj , bk) =Hjk

n

gemeinsame relative Haufigkeit von (aj , bk) fur j = 1, . . . , r und k = 1, . . . , s.

Bemerkung:

Es gilt∑r

j=1

∑sk=1 hjk = 1 und 0 ≤ hjk ≤ 1.

6.3 Definition (Randhaufigkeiten)

Die Anzahl derjenigen Merkmalstrager, die bzgl. des ersten Merkmals die Aus-

pragung aj aufweisen (gleichgultig welches die jeweilige Auspragung des zweiten

Merkmals ist) wird durch

Hj• =s∑

k=1

Hjk

angegeben. Entsprechend liefert die Summe

H•k =r∑

j=1

Hjk

die Anzahl der Merkmalstrager, die bzgl. des zweiten Merkmals die Auspragung bk

aufweisen. Diese Haufigkeiten Hj• bzw. H•k heißen Randhaufigkeiten.

6.4 Definition (Kontingenztabelle)

Kontingenztabelle heißt die tabellarische Darstellung der r·s gemeinsamen absoluten

Haufigkeiten Hjk und der Randhaufigkeiten Hj• bzw. H•k nach folgendem Muster:

b1 · · · bk · · · bs

a1 H11 · · · H1k · · · H1s H1•...

......

......

aj Hj1 · · · Hjk · · · Hjs Hj•...

......

......

ar Hr1 · · · Hrk · · · Hrs Hr•

H•1 · · · H•k · · · H•s n

15

Page 17: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

II Statistische Kennzahlen

7 Mittelwerte

7.1 Definition (Arithmetisches Mittel)

Es seien x1, . . . , xn Beobachtungen, dann heißt

x =1n

n∑i=1

xi

arithmetisches Mittel.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch x = 1n

∑ri=1 Hiai bzw.

x =∑r

i=1 hiai.

7.2 Definition (Gewogenes arithmetisches Mittel)

Gibt man sich allgemein n Zahlen (Gewichte) g1, . . . , gn vor mit 0 ≤ gi ≤ 1 fur alle

i und∑n

i=1 gi = 1, so heißt

xg =n∑

i=1

gixi

gewogenes (oder gewichtetes) arithmetisches Mittel der Stichprobe.

7.3 Satz (Arithmetisches Mittel bei linearer Transformation)

Werden alle Beobachtungswerte xi durch yi = a+bxi (a, b ∈ R) linear transformiert,

dann lautet das arithmetische Mittel der transformierten Stichprobe y1, . . . , yn:

y = a + bx.

16

Page 18: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

7.4 Definition (Geometrisches Mittel)

Es seien x1, . . . , xn positive Beobachtungen, dann heißt

x = n

√x1 · . . . · xn

geometrisches Mittel.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auchx = n

√aH1

1 · . . . · aHrr bzw.

x = ah1

1 · . . . · ahrr .

7.5 Definition (Harmonisches Mittel)

Es seien x1, . . . , xn entweder alle positive oder alle negative Beobachtungen, dann

heißt

xh =n

n∑i=1

1xi

harmonisches Mittel.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch xh =Pr

i=1 HiPri=1

Hiai

bzw.

xh = 1Pri=1

hiai

.

7.6 Satz (Vergleich der Mittelwerte)

Es seien x1, . . . , xn Beobachtungen, die alle großer als Null sind, dann gilt:

xh ≤x ≤ x.

7.7 Definition (Haufigster Wert oder Modus)

Die Merkmalsauspragung, welche in der Beobachtungsreihe die großte absolute Haufig-

keit besitzt, heißt Modus. Man bezeichnet den Modus mit xMod.

17

Page 19: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

8 Quantile und Quartile

8.1 Definition (α-Quantil oder 100α%-Quantil)

Es sei α eine reelle Zahl mit 0 < α < 1 und Fn bezeichne die empirische Verteilungs-

funktion, dann ist xα mit

xα = minx ∈ R : Fn(x ) ≥ α

das (empirische) α-Quantil der Beobachtungsreihe x1, . . . , xn.

8.2 Definition (Quartile und Median)

Das 0,5-Quantil x0,5 (xMed) heißt Median (oder Zentralwert).

Das 0,25-Quantil x0,25 heißt unteres (oder 1.) Quartil.

Das 0,75-Quantil x0,75 heißt oberes (oder 3.) Quartil.

8.3 Satz (Quantile bei linearer Transformation)

Werden alle Beobachtungswerte xi durch yi = a+bxi (a, b ∈ R) linear transformiert,

dann gilt fur die Quantile der transformierten Stichprobe y1, . . . , yn:

yα = a + bxα.

9 Streuungsmaße

9.1 Definition (Spannweite)

Bezeichne x(1), . . . , x(n) die der Große nach geordnete Stichprobe mit

x(1) ≤ x(2) ≤ . . . ≤ x(n), dann heißt der Abstand des großten vom kleinsten Beob-

achtungswert:

r = x(n) − x(1) = maxxi −minxi

die Spannweite (Range) der Beobachtungsreihe.

18

Page 20: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

9.2 Definition (Quartilsabstand)

Die Differenz zwischen oberem und unterem Quartil

Q = x0,75 − x0,25

heißt Quartilsabstand (Interquartilsabstand).

9.3 Definition (Mittlere absolute Abweichung)

Es sei c ein beliebiger Wert aus den reellen Zahlen , dann heißt

d(c) =1n

n∑i=1

|xi − c|

mittlere absolute Abweichung von c.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch d(c) = 1n

∑ri=1 |ai − c| ·Hi

bzw. d(c) =∑r

i=1 |ai − c| · hi .

9.4 Satz (Minimumeigenschaft des Medians)

Die mittlere absolute Abweichung ist minimal bezuglich des Medians. Es gilt:

minc

[1n

n∑i=1

|xi − c|] = xMed.

9.5 Definition (Mittlere quadratische Abweichung)

Es sei c ein beliebiger Wert aus den reellen Zahlen, dann heißt

MQA(c) =1n

n∑i=1

(xi − c)2

mittlere quadratische Abweichung von c.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch MQA(c) = 1n

∑ri=1(ai − c)2 ·Hi

bzw. MQA(c) =∑r

i=1(ai − c)2 · hi.

19

Page 21: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

9.6 Satz (Minimumeigenschaft des arithmetischen Mittels)

Die mittlere quadratische Abweichung ist minimal bezuglich des arithmetischen Mit-

tels. Es gilt:

minc

[1n

n∑i=1

(xi − c)2] = x.

9.7 Definition (Empirische Varianz)

Die mittlere quadratische Abweichung vom arithmetischen Mittel:

s∗2

=1n

n∑i=1

(xi − x)2

heißt empirische Varianz.

Bemerkung:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch s∗2

= 1n

∑ri=1(ai − x)2 · Hi

bzw. s∗2

=∑r

i=1(ai − x)2 · hi

9.8 Satz (Empirische Varianz bei linearer Transformation)

Sei s∗2

X die empirische Varianz der xi. Werden alle Beobachtungswerte xi durch

yi = a + bxi (a, b ∈ R) linear transformiert, dann lautet die empirische Varianz der

transformierten Stichprobe y1, . . . , yn:

s∗2

Y = b2s∗2

X .

9.9 Definition (Empirische Standardabweichung)

Die empirische Standardabweichung s∗ ist die Quadratwurzel aus der empirischen

Varianz:

s∗ =√

s∗2 .

20

Page 22: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

9.10 Satz (Empirische Standardabweichung bei linearer Transformation)

Sei s∗2

X die empirische Varianz der xi. Werden alle Beobachtungswerte xi durch

yi = a + bxi (a, b ∈ R) linear transformiert, dann lautet die empirische Standardab-

weichung der transformierten Stichprobe y1, . . . , yn:

s∗Y = |b|s∗X .

9.11 Definition (Variationskoeffizient)

Fur positive Beobachtungswerte x1, . . . , xn heißt der Quotient

v =s∗

x

Variationskoeffizient der Stichprobe.

Bemerkung 1:

Falls alle xi < 0 sind, wird im Nenner des Variationskoeffizienten mit |x| gearbeitet.

Bemerkung 2:

Falls die Beobachtungen kleiner und großer Null sind, ist mit Hilfe des Variations-

koeffizienten keine sinnvolle Aussage moglich.

9.12 Definition (Momente einer Beobachtungsreihe)

mr =1n

n∑i=1

xri , r = 1, 2, . . .

heißt r-tes Moment der Beobachtungsreihe.

mr =1n

n∑i=1

(xi − x)r , r = 1, 2, . . .

heißt r-tes zentrales Moment der Beobachtungsreihe.

21

Page 23: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Statistische Kennzahlen

9.13 Definition (Empirische Schiefe)

Es seien x1, . . . , xn Beobachtungen, dann heißt

y1 =

1n

n∑i=1

(xi − x)3(√1n

n∑i=1

(xi − x)2)3

=m3

s∗3

empirische Schiefe.

Bemerkung 1:

Ist y1 > 0, so bilden die Beobachtungen eine rechtsschiefe, bei y1 < 0 eine linksschiefe

und bei y1 = 0 eine symetrische Haufigkeitsverteilung.

Bemerkung 2:

Liegt eine Haufigkeitsverteilung vor, benutzt man auch

y1 =1n

Pri=1(ai−x)3·Hi(q

1n

P1i=1(ai−x)2·Hi

)3 .

22

Page 24: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Konzentrationsmaße

III Konzentrationsmaße

10.1 Definition (Lorenzkurve)

Es seien x(j) > 0 die der Große nach geordnete Beobachtungswerte. Die Merkmals-

trager mit den ersten i Beobachtungswerten haben an der Gesamtsumme∑n

j=1 xj

den kumulierten relativen Anteil

vi =

i∑j=1

x(j)

n∑j=1

xj

fur i = 1, . . . , n.

Tragt man diesen Anteilswert vi uber dem Anteilswert ui = in in ein (u, v)-Koordi-

natensystem ein und fugt noch den Punkt (0, 0) hinzu, so erhalt man die n + 1

Punkte: (0, 0) = (u0, v0), (u1, v1), . . . , (un, vn) = (1, 1). Der Streckenzug, der durch

diese Punkte lauft heißt Lorenzkurve.

Bemerkung 1:

Haufig werden vi und ui mit 100 multipliziert um jeweils den prozentualen Anteil

zu erhalten.

Bemerkung 2:

Sind a(1), . . . , a(r) die der Große nach geordneten Auspragungen mit den zugehorigen

absoluten Haufigkeiten H1, . . . ,Hr gegeben, so berechnen sich vi und ui wie folgt:

vi =

∑ij=1 a(j)Hj∑rj=1 a(j)Hj

, ui =

∑ij=1 Hj

n, i = 1, . . . , r.

Abbildung:

23

Page 25: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Konzentrationsmaße

10.2 Definition (Gini-Koeffizient)

Gegeben seien die Anteilswerte vi und ui der Lorenzkurve, so erhalt man durch

GK = 1−r∑

i=1

(ui − ui−1)(vi + vi−1)

den Gini-Koeffizienten (Lorenzsches Konzentrationsmaß).

Bemerkung 1:

Es gilt 0 ≤ GK < 1 und GKmax = n−1n .

Bemerkung 2:

GK = Inhalt der F lache zwischen der Diagonalen und der LorenzkurveInhalt der F lache unterhalb der Diagonalen

Abbildung:

24

Page 26: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Indexzahlen

IV Indexzahlen

Es sei:

p0(i) = Preis (je ME) des i-ten Gutes in der Basisperiode 0,

pt(i) = Preis (je ME) des i-ten Gutes in der Berichtsperiode t,

q0(i) = Menge des i-ten Gutes in der Basisperiode 0,

qt(i) = Menge des i-ten Gutes in der Berichtsperiode t

n = Anzahl der Guter im Warenkorb.

11 Preisindizes

11.1 Definition (Preisindex nach Laspeyres)

PL0t =

nPi=1

pt(i)q0(i)

nPi=1

p0(i)q0(i)heißt Preisindex nach Laspeyres.

11.2 Definition (Preisindex nach Paasche)

PP0t =

nPi=1

pt(i)qt(i)

nPi=1

p0(i)qt(i)heißt Preisindex nach Paasche.

12 Mengenindizes

12.1 Definition (Mengenindex nach Laspeyres)

QL0t =

nPi=1

p0(i)qt(i)

nPi=1

p0(i)q0(i)heißt Mengenindex nach Laspeyres.

12.2 Definition (Mengenindex nach Paasche)

QP0t =

nPi=1

pt(i)qt(i)

nPi=1

pt(i)q0(i)heißt Mengenindex nach Paasche.

25

Page 27: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Zusammenhangsmaße

V Zusammenhangsmaße

13.1 Definition (Empirische Kovarianz)

Gegeben seien Beobachtungspaare (xi, yi), i = 1, . . . , n, zweier kardinal skalierter

Merkmale X und Y . Dann heißt

s∗XY =1n

n∑i=1

(xi − x)(yi − y)

empirische Kovarianz der zweidimensionalen Beobachtungsreihe.

13.2 Definition (Korrelationskoeffizient nach Bravais-Pearson)

Die zweidimensionale Beobachtungsreihe zweier kardinal skalierter Merkmale X und

Y besitze die empirische Kovarianz s∗XY . Die empirische Standardabweichungen der

Randverteilungen seien s∗X 6= 0 und s∗Y 6= 0. Dann heißt

rXY =s∗XY

s∗X · s∗Y=

n∑i=1

(xi − x)(yi − y)√n∑

i=1(xi − x)2

n∑i=1

(yi − y)2

Korrelationskoeffizient nach Bravais-Pearson.

Bemerkung:

Es gilt −1 ≤ rXY ≤ 1 .

13.3 Definition (Rangkorrelationskoeffizient nach Spearman)

Der Rangkorrelationskoeffizient von Spearman basiert statt auf den direkten Beob-

achtungswerten xi bzw. yi auf den zugeordneten Rangen R(xi) und R(yi) und auf de-

ren arithmetischen Mitteln RX und RY . Der Rangkorrelationskoeffizient von Spear-

man rSP ist der auf diese Großen angewandte Bravais-Pearson-Korrelationskoeffizient:

rS,XY =

n∑i=1

(R(xi)− RX)(R(yi)− RY )√n∑

i=1(R(xi)− RX)2 ·

n∑i=1

(R(yi)− RY )2.

26

Page 28: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Zusammenhangsmaße

Bemerkung 1:

Es gilt −1 ≤ rSP ≤ 1.

Bemerkung 2:

Als Rang Ri = R(zi) wird jedem Beobachtungswert zi der Urliste die Platznum-

mer zugewiesen, die er in der der Große nach geordneten Beobachtungsreihe ein-

nimmt. Tritt eine Merkmalsauspragung ofters auf, so ordnet man den gleichen Be-

obachtungswerten das arithmetische Mittel derjenigen Platznummern zu, die diese

gleichen Beobachtungswerte einnehmen.

Bemerkung 3:

Tritt kein Beobachtungswert xi bzw. yi in der zugehorigen Urliste mehrmals auf, so

gilt:

rS,XY = 1−6

n∑i=1

(R(xi)−R(yi))2

(n− 1)n(n + 1).

27

Page 29: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Regression

VI Elementare Regression

X und Y seien kardinale Merkmale. Die empirische Standardabweichungen der

Randverteilungen seien s∗X 6= 0 und s∗Y 6= 0. Mit Hilfe einer “funktionalen“ Abhan-

gigkeit mochte man von einem Merkmal auf das andere schließen. Die einfache li-

neare Regression versucht diese Abhangigkeit naherungsweise durch eine Gerade zu

beschreiben.

14.1 Definition (Modell der einfachen linearen Regression)

Seien (x1, y1), . . . , (xn, yn) Beobachtungswerte. Die Gleichung

yi = b0 + b1xi + ui , i = 1, . . . , n

beschreibt das Modell der linearen Einfachregression. Dabei sind

yi die abhangigen Variablen (Regressanden),

xi die unabhangigen Variablen (Regressaren),

b0 und b1 die Regressionskoeffizienten.

Da die Beobachtungspaare (xi, yi), i = 1, . . . , n in der Regel nicht auf einer Ge-

raden liegen, wird fur jedes Beobachtungspaar eine individuelle Storungsgroße ui,

i = 1, . . . , n in das Modell aufgenommen.

14.2 Definition (Regressionsgerade)

Durch

y = b0 + b1x

ist die Gleichung der Regressionsgeraden von y bzgl. x gegeben. Dabei sind die y

(yi = b0 + b1xi, i = 1, . . . , n) die durch die Regression erklarten y-Werte. Die Re-

gressionskoeffizienten b0 und b1 geben den Achsenabschnitt bzw. die Steigung der

Regressionsgeraden an.

28

Page 30: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Regression

Abbildung:

14.3 Definition (Methode der kleinsten Quadrate)

Die Bestimmung der Regressionskoeffizienten durch die Minimierung der Summe der

quadrierten Storgroßen bzgl. b0 und b1,

(b0, b1) = min(b0,b1)

n∑i=1

u2i = min

(b0,b1)

n∑i=1

(yi − yi)2 = min(b0,b1)

n∑i=1

[yi − (b0 + b1xi)]2

heißt Methode der kleinsten Quadrate (KQ-Methode).

14.4 Satz (Regressionskoeffizienten)

Die durch die KQ-Methode bestimmten Regressionskoeffizienten ergeben sich zu

b0 = y − b1x,

b1 =s∗XY

s∗2

X

=

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2.

29

Page 31: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Regression

14.5 Definition (KQ-Residuen)

Die Großen

ui = yi − yi , i = 1, · · · , n

heißen KQ-Residuen oder KQ-Restgroßen.

14.6 Definition (Bestimmtheitsmaß)

Die Große

R2 =s∗

2

Y

s∗2

Y

=

n∑i=1

(yi − y)2

n∑i=1

(yi − y)2

heißt Bestimmtheitsmaß und gibt den Anteil der durch die Regression gegebenen

Varianz an.

Bemerkung:

R2 ist ein Maß fur die Gute der Anpassung der Punktewolke (xi, yi), i = 1, . . . , n,

durch die Regressionsgerade.

Weitere mogliche Regressionsansatze:

Einfache nichtlineare Regression: z.B.: y = b0 + b1x + b2x2 + b3x

3 + u

Multiple lineare Regression: z.B.: y = a0 + a1x + a2z + u

Multiple nichtlineare Regression: z.B.: y = a + bx + cx2 + dz + ez2 + fz3 + u

30

Page 32: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

VII Elementare Zeitreihenanalyse

15.1 Definition (Zeitreihe)

Werden die Beobachtungswerte y1, . . . , yn eines Merkmals Y im Zeitablauf, d.h. zu

bestimmten Zeitpunkten ti , i = 1, . . . , n, t1 < t2 < . . . < tn, betrachtet, so wird Y

bzw. y1, . . . , yn als Zeitreihe bezeichnet.

Bemerkung:

Die Zeitabstande zwischen aufeinanderfolgenden Beobachtungen mussen nicht not-

wendig aquidistant sein, werden aber haufig so gewahlt.

15.2 Definition (Zeitreihendiagramm)

Als Zeitreihendiagramm bezeichnet man die graphische Darstellung der Paare (ti, yi),

i = 1, . . . , n einer Zeitreihe in einem kartesischen Koordinatensystem.

Bemerkung:

Oft verbindet man die Punkte geradlinig miteinander und erhalt somit einen Poly-

gonzug.

Abbildungen:

31

Page 33: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

16 Komponenten einer Zeitreihe

Es sei vorausgesetzt, daß sich die Zeitreihe Y additiv aus vier Komponenten zusam-

mensetzt:

Y = M + K + S + Z ,

d.h. fur jeden Beobachtungswert yi gilt: yi = mi + ki + si + zi.

16.1 Definition (Trendkomponente)

Die Trendkomponente M bzw. mi beschreibt die langfristige systematische Verander-

ung des mittleren Niveaus der Zeitreihe. Fur den Verlauf der Trendkomponente sind

meist langfristig wirkende Ursachen verantwortlich. Man unterscheidet sechs Grund-

richtungen des Trends.

Abbildungen:

32

Page 34: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

16.2 Definition (Konjunkturkomponente)

Die Konjunkturkomponente K bzw. ki stellt eine in der Regel mehrjahrige konjunktur-

abhangige Schwankung dar. Weil die Konjunkturzyklen im allgemeinen nicht gleich

lang sind, sind die Schwankungen nicht regelmaßig.

16.3 Definition (Glatte Komponente)

Trendkomponente und Konjunkturkomponente zusammen, also G = M+K, bestim-

men die grobe Richtung der Zeitreihe. Die Punkte von G, also gi = mi + ki, liegen

im allgemeinen auf einer glatten Kurve. Man nennt G bzw. gi glatte Komponente.

16.4 Definition (Saisonkomponente)

Die Saisonkomponente S bzw. si gibt die in der Regel jahreszeitliche Abhangigkeit

wieder. Ihr Verlauf wird durch typische jahreszeitliche Schwankungen gepragt, die

sich fast unverandert jedes Jahr wiederholen.

16.5 Definition (Zufallskomponente)

Die Zufallskomponente Z bzw. zi wird durch diejenigen Einflusse erklart, welche

nicht fur die drei anderen Komponenten verantwortlich sind. Ursache fur sie konnen

u.a. plotzlich eintretende, nicht vorhersagbare Ereignisse sein.

17 Saisonbereinigung

17.1 Definition (Gleitender Durchschnitt)

Wenn man voraussetzt, dass sich die Saisoneinflusse innerhalb eines Jahres aus-

gleichen, ist ein einfaches Verfahren zur Eliminierung der Saisonkomponente die

Methode der gleitenden Durchschnitte. Dabei wird aus einer gegebenen Zeitreihe

eine neue abgeleitet. Das Ziel ist, typische periodische Schwankungen (Saisonkom-

ponente) und zufallige Einflusse (Zufallskomponente) so herauszufiltern, daß man

33

Page 35: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

eine gute Schatzung fur die grobe Richtung (glatte Komponente) der Reihe erhalt.

Die Schatzung ist besser, je mehr man die Periodizitat feststellt.

Gegeben seien die Beobachtungswerte y1, . . . , yn uber mehrere Jahre mit jeweils p

Perioden (und Beobachtungswerten) pro Jahr (z.B. p = 4 bei Quartalsdaten). Ist

p = 2m + 1, also p ungerade, dann sei

yi =yi−m + yi−m+1 + . . . + yi + . . . + yi+m−1 + yi+m

2m + 1

fur i = m + 1, . . . , n−m.

Ist p = 2m, also p gerade, dann sei

yi =12yi−m + yi−m+1 + . . . + yi + . . . + yi+m−1 + 1

2yi+m

2m

fur i = m + 1, . . . , n−m.

Die so gebildeten Zeitreihenwerte yi heißen gleitende Durchschnitte der Ordnung p.

Bemerkung 1:

gleitender Dreierdurchschnitt: yi = yi−1+yi+yi+1

3

gleitender Viererdurchschnitt: yi =12yi−2+yi−1+yi+yi+1+ 1

2yi+2

4

gleitender 12-er Durchschnitt: yi =12yi−6+yi−5+...+yi+5+ 1

2yi+6

12

Bemerkung 2:

Die gleitenden Durchschnitte yi bilden Naherungswerte fur die glatte Komponente

gi.

Bemerkung 3:

Die Differenz zwischen den Ursprungsdaten und den zugehorigen gleitenden Durch-

schnitten bilden die Saisoneinflusse, die allerdings von den Zufallskomponenten uber-

lagert werden:

yi − yi ≈ si + zi = si.

34

Page 36: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

17.2 Definition (Typische Saisonfigur)

Um fur die einzelnen Perioden j , j = 1, . . . , p, uber die Jahre hinweg eine jeweils

konstante Saisonbewegung zu erhalten, bildet man fur jede Periode j das arithmeti-

sche Mittel der si aus den Perioden j. Mit den so errechneten Werten sj werden die

normierten Großen sj = sj − 1p

∑pj=1 sj bestimmt, wobei sj als typische Saisonfigur

der Periode j , j = 1, . . . , p, bezeichnet wird.

Bemerkung:

Damit gilt:∑p

j=1 sj ≈ 0.

17.3 Definition (Saisonbereinigte Werte)

Bezeichne yij den Zeitreihenwert yi, i = 1, . . . , n, der in der Periode j,

j = 1, . . . , p, beobachtet wurde. Die Werte

y∗i = yij − sj , fur i = 1, . . . , n

heißen saisonbereinigte Werte.

18 Trendbestimmung

Bei der Bestimmung des Trends soll die glatte Komponente einer Zeitreihe durch

eine Naherungsfunktion angepasst werden. Ein einfaches Verfahren hierfur ist die

Methode der kleinsten Quadrate.

18.1 Definition (Linearer Trend)

Seien y1, . . . , yn Beobachtungswerte einer Zeitreihe mit yi = gi+si+zi , i = 1, . . . , n.

Falls fur die glatte Komponente

gi = b0 + b1ti, i = 1, . . . , n

unterstellt werden kann, spricht man von einem linearen Trend.

Bemerkung:

Quadratischer Trendansatz: gi = b0 + b1ti + b2t2i , i = 1, . . . , n.

35

Page 37: Rumpfskript Deskriptive Statistik - wiwi.uni-siegen.de · Vorbemerkung Vorbemerkung Das vorliegende Skript heißt nicht nur Rumpfskript, sondern ist auch nur ein Rumpfskript. Als

Elementare Zeitreihenanalyse

18.2 Definition (KQ-Methode bei Zeitreihen)

Wird bei einer Zeitreihe ein linearer Trend angenommen, so lassen sich Achsenab-

schnitt und Steigung der Trendgeraden durch die Methode der kleinsten Quadrate

bestimmen (siehe 14.3), wenn die xi durch die ti und die yi durch die saison-

bereinigten Werte y∗i ersetzt werden.

36