Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie...

Post on 06-Feb-2018

214 views 1 download

Transcript of Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie...

Kapitel 5

Zeitreihenanalyse

5.1 Einfuhrung der Zeitreihen

Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Große, deren Werte imZeitablauf zu bestimmten Zeitpunkten oder fur bestimmte Zeitintervalle erfasst und dargestelltwerden.

Beispiel 5.1.1 (fur Zeitreihen von zeitpunktbezogenen Merkmalen):

a) Weg-Zeit-Funktion beim freien Fall: s(t) = g2 t2 sei die in der Zeit t zuruckgelegte Fall-

strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberflache fur dieErdbeschleunigung g ≈ 9.81m sec−2.

b)

Devisenkurse fur US $ (Kassa Geld)

Tag 15.11.04 16.11.04 17.11.04 18.11.04 19.11.04

$ fur 1 Euro 1.2914 1.2931 1.3000 1.3003 1.2993

Fur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, wareeine “kompakte” Darstellung wie in Teil a) zweckmaßig, also y(t). Dabei ware t in Tagenzu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist,also:

i 1 2 3 4 5

y(i) 1.2914 1.2931 1.3000 1.3003 1.2993

Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur fur die angegebe-nen Werte von t, namlich 1, 2, 3, 4, 5 definiert. Allerdings ware z.B. y(2.5) sinnvoll, wennnoch genaue Uhrzeiten angegeben waren und der 12 Stunden spater als y(2) abgefragteKurswert bekannt ware. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern.

Bsp. 5.1.2 (fur eine Zeitreihe eines zeitintervallbezogenen Merkmals):

Jahr i := Nummer des Zeitintervalls Umsatz yi (in Mio. Euro) Jahr i yi

1988 1 4.8 1993 6 5.61989 2 5.2 1994 7 5.81990 3 5.6 1995 8 6.41991 4 4.9 1996 9 5.91992 5 6.2 × × ×

Eine Funktion y(t) ist bei Bsp 5.1.2 nur fur t = 1, 2, . . . , sinnvoll zu interpretieren. Nicht sinnvollist z.B. y(1.5). Um sich aber z.B. einen besseren Uberblick uber den Verlauf der Zeitreihe zu

26

verschaffen, ist es zweckmaßig, die Zeitreihe in einer Kurve darzustellen (Siehe die untenste-hende Fig. 5-1). Dabei ist zu beachten, dass y(t) nur fur bestimmte Werte von t sinnvoll zuinterpretieren ist.

6

y (Umsatz in Mio. Euro)

- t1 2 3 4 5 6 7 8 9

1

2

3

4

5

6

7

Fig. 5-1

5.2 Komponenten einer Zeitreihe

Bei langen Zeitreihen (etwa uber mehrere Jahrzehnte) ist eine Aufteilung in folgende 4 Kom-

ponenten sinnvoll:

a) Trend T (t): Grundrichtung, langfristige Entwicklung.

b) Zyklische Komponente Z(t): mitttelfristige Entwicklung, z.B. Einflusse von Konjunk-turschwankungen.

c) Saisonkomponente S(t): kurzfristige Entwicklung innerhalb der einzelnen Jahre durchsaisonbedingte Schwankungen.

d) Restkomponente R(t): einmalige oder seltene Einflusse und Zufallsschwankungen.

27

Bei kurzen Zeitreihen ist eine Trennung zwischen Trend und zyklischer Komponente nicht mehrsinnvoll. Es bleibt eine Aufteilung in 3 Komponenten:

a) Trend T (t): Grundrichtung, b) S(t) vergl. o., c) R(t) vergl. o.

In diesem Kapitel werden nur solche Zeitreihen behandelt.

Additive Verknupfung der Komponenten:

(5.2.1) y(t) = T (t) + S(t) + R(t)

Multiplikative Verknupfung der Komponenten:

(5.2.2) y(t) = T (t) · S(t) · R(t)

Reduktion auf additiver Verknupfung durch Logarithmeren (z.B. mit Basis ”e”)

(5.2.3) ln y(t) = ln T (t) + ln S(t) + ln R(t)

5.3 Schatzung des Trends

5.3.1 Die Methode der gleitenden Durchschnitte

Gleitender Durchschnitt uber eine ungerade Anzahl von Werten

(5.3.1) T (i) ≈ D2m+1(i) := yi−m+yi−m+1+...+yi+yi+1+...+yi+m

2m+1

Rekursionsformel:

(5.3.2) D2m+1(i) = D2m+1(i − 1) + yi+m−yi−m−1

2m+1

Eine Mittelbildung uber eine gerade Anzahl von Werten wurde eine Trendschatzung an einemnicht sinnvollen Wert von t liefern. Ware (wie etwa bei Monatswerten) doch eine Art Mittelbil-dung uber eine gerade Anzahl wunschenswert, so kann man folgende Modifikation des gleitendenDurchschnitts verwenden:

(5.3.3) T (i) ≈ D2m(i) := 0.5yi−m+yi−m+1+...+yi+m−1+0.5yi+m

2m

Rekursionsformel:

(5.3.4) D2m(i) = D2m(i − 1) + (yi+m+yi+m−1)−(yi−m+yi−m−1)4m

Nachteil des gleitenden Durchschnitts:keine Trendschatzung fur die ersten und letzten Werte von i.

5.3.2 Die Methode der exponentiellen Glattung

Rekursive Berechnung von T ∗(i) als Schatzung fur T (i) nach der Methode der exponentiellen

Glattung:

(5.3.5) T ∗(1) = y(1), T ∗(i) = α y(i) + (1 − α) T ∗(i − 1) (i ≥ 2)

Die Glattungskonstante α ist dabei eine vorher festzusetzende Zahl mit 0 ≤ α ≤ 1. Manerhalt eine starke Glattung, wenn α nahe bei 0 ist, und eine schwache Glattung, wenn α nahebei 1 ist.

28

Die Bezeichnung ”exponentielle” Glattung kommt daher, dass man aus (5.3.5) folgende Formelherleiten kann:

(5.3.5 a) T ∗(i) = αi−2∑

j=0(1 − α)j

y (i − j) + (1 − α)i−1y(1) (i ≥ 2)

Fur die praktische Berechnung ist aber (5.3.5) vorzuziehen.

5.3.3 Drei Funktionsansatze fur die Trendschatzung

Linearer Ansatz: T (t) ≈ a + bt

Parabolischer Ansatz: T (t) ≈ a + bt + ct2

Exponentieller Ansatz: T (t) ≈ a bt (a, b ≥ 0)

Reduktion des exponentiellen auf den linearen Ansatz:

(5.3.6) ln T (t) ≈ ln a + t ln b =: a∗ + t b∗

5.3.4 Die Freihandmethode

Anpassung einer Trendgerade (also linearer Ansatz) nach Augenmaß an die graphische Darstel-lung der Zeitreihe

5.3.5 Die Methode der kleinsten Quadrate

Vorbemerkung zur Schreibweise: Um bei den in diesem Abschnitt eingefuhrten arithmetischenMitteln den Zusammenhang mit der Zeitvariablen zum Ausdruck zu bringen, verwenden wir furdie Bezeichnung der Zeitpunkte oder Zeitintervalle die Bezeichnung “ti” statt einach “i”, auchwenn meist (aber nicht immer) ti = i ist.

a) Linearer Ansatz:Bestimme a und b so, dass

(5.3.7) 1n

n∑

i=1d2

i mit di := (a + b ti) − yi

ein Minimum wird. Diese Forderung ist erfullt, wenn a und b die folgenden Normalen-

gleichungen erfullen:

(5.3.8) a + t b = y

t a + t2 b = yt

Dabei bedeuten z.B.:

t := 1n

n∑

i=1ti, t2 := 1

n

n∑

i=1ti

2 (> t2

i.Allg.), y t := 1n

n∑

i=1yi ti (= ty 6= y t i.Allg.)

Zur Herleitung und zum Verstandnis der Normalengleichungen ist es nutzlich, (5.3.7)ausfuhrlich zu schreiben:

29

1

n

n∑

i=1

d2i =

1

n

n∑

i=1

(a + bti − yi)2

=1

n

n∑

i=1

(a2 + b2 t2i + y2i + 2abti − 2ayi − 2btiyi)

= a2 + b2t2 + y2 + 2abt − 2ay − 2bty

Bezeichnen wir diesen Ausdruck mit g(a, b), so mussen nach den u.a. in der Mathematik–II–Vorlesung bereitgestellten Verfahren folgende notwendige Bedingungen erfullt sein, damitg(a, b) minimal wird.

∂g(a,b)∂a

= 2a + 2bt − 2y!= 0, ∂g(a,b)

∂b= 2bt2 + 2at − 2ty

!= 0

Das fuhrt auf das System (5.3.8) der Normalengleichungen, das seinerseits immer eindeutiglosbar ist außer in dem Sonderfall

t2 = t2

(

⇔ alle ti sind gleich⇔ n = 1 (wegen t1 < t2 < . . . )

)

Die Losung des Systems (5.3.8) der Normalengleichungen lautet:

(5.3.9) b = t y−t y

t2−t2 , a = y − bt.

Dass die Werte fur a und b aus (5.3.9) – wie gefordert – die Funktion g(a, b) tatsachlichminimieren, muss noch gezeigt werden. Dabei genugt es i.Allg. nicht, die Hesse–Matrixzu untersuchen, da dies eine Aussage uber relative Extrema liefert. Da aber g(a, b) durchlineare Substitutionen in eine quadratische Form umgewandelt werden kann, genugt dieUntersuchung der Hesse–Matrix doch:

H(a, b) :=

(

∂2g(a,b)∂a2

∂2g(a,b)∂a∂b

∂2g(a,b)∂a∂b

∂2g(a,b)∂b2

)

=

(

2 2t

2t 2t2

)

Da fur n ≥ 2 die Determinante dieser Hesse–Matrix = 2 · 2t2 − (2t)2 = 4(t2 − t2) > 0 ist

und ∂2g(a,b)∂a2 = 2 > 0 ist, besitzt g(a, b) fur die Werte aus (5.3.9) nach Satz 11.6 b) der

Mathematik–II–Vorlesung ein relatives Minimum. Das ist aber gleichzeitig ein absolutesMinimum, da g(a, b) durch lineare Substitutionen in eine quadratische Form umgewandeltwerden kann.

Die bei der Mittelbildung notwendigen Divisionen durch n kann man bei der Berechnungvon b vermeiden, indem man den Bruch in (5.3.9) mit n2 erweitert und erhalt so die Al-ternativformeln:

(5.3.9a) b =n·(n·t y)−(n·t) (n·y)

n·(

n·t2)

−(n·t)2 , a = y − bt.

b) Parabolischer Ansatz: Bestimme a, b, c so, dass

30

(5.3.10) 1n

n∑

i=1d2

i mit di := (a + bti + ct2i ) − yi

ein Minimum wird. Diese Forderung ist erfullt, wenn a, b und c die folgende Normalenglei-chungen erfullen:

(5.3.11)a + t b + t2c = y

t a + t2 b + t3c = yt

t2 a + t3 b + t4c = yt2

Dabei bedeuten z.B.:

tk := 1n

n∑

i=1ti

k, , y tk := 1n

n∑

i=1ti

k yi.

Die bei der Mittelbildung notwendigen Divisionen durch n kann man vermeiden, indemman alle Gleichungen mit n durchmultipliziert:

(5.3.11a)

n · a + (n · t) b +(

n · t2)

c = (n · y)

(n · t) a +(

n · t2)

b +(

n · t3)

c = (n · yt)(

n · t2)

a +(

n · t3)

b +(

n · t4)

c =(

n · yt2)

Dieses System der Normalengleichungen ist eindeutig losbar bis auf die fur die Praxisbelanglosen Sonderfalle n = 1 und n = 2.

c) Exponentieller Ansatz: Statt analog zu a) und b) mit di = a bti − yi zu arbeiten, ist eszweckmaßiger, auf den linearen Ansatz (vergl. (5.3.6)) zu reduzieren. Man erhalt so:

(5.3.12) b∗ = t ln y−t ln y

t2−t2 , a∗ = ln y − b∗t

a = ea∗

, b = eb∗

Dabei bedeuten z.B.:

ln y := 1n

n∑

i=1ln yi, , t ln y := 1

n

n∑

i=1ti ln yi.

a∗, b∗ sind also die Koeffizienten bei dem linearen Ansatz fur die Trendschatzung bei derZeitsreihe “ln yi” statt “yi”.

Haufig ist es zweckmaßig, bei dieser Trendschatzung zu bleiben und auf die Umrechnungin a und b zu verzichten:

(5.3.13) ln T (t) ≈ T ∗

ln y(t) = a∗ + b∗ t (Trendschatzung fur ln yi).

Statt ”ln” kann man z.B. auch ”log10” verwenden. Man erhalt dann die Umrechnungsfor-meln a = 10a∗

, b = 10b∗ .

Die bei der Mittelbildung notwendigen Divisionen durch n kann man bei der Berechnungvon b∗ vermeiden, indem man den Bruch in (5.3.12) mit n2 erweitert und erhalt so dieAlternativformeln:

31

(5.3.12a) b∗ =n·(n·t ln y)−(n·t) (n·ln y)

n·(

n·t2)

−(n·t)2 , a∗ = ln y − b∗t.

a = ea∗

, b = eb∗

Allg. Bem. zu 5.3: In der Praxis sollte bei den Trendschatzungsverfahren n etwa ≥ 30 sein.

5.4 Saisonbereinigung

5.4.1 Ein Verfahren bei additiver Verknupfung

Es seien Zeitreihenwerte yi in monatlichen Daten vorgegeben. Bei andere Aufteilung des Jahressind die Einzelschritte entsprechend zu modifizieren.

• 1. Schritt: Trendschatzung durch gleit. Durchschnitte:

(5.4.1) T (i) ≈ D12(i) (”ti” durch ”i” ersetzt)

• 2. Schritt: Trendbereingung: Bestimmung von

(5.4.2) di := yi − D12(i)

als Schatzung fur yi − T (i) = S(i) + R(i).

Annahme 1: Der Wert der Saisonkomponente S(i) ist nur von dem Monat und nicht vondem Jahr abhangig. In allen Jahren soll die Saisonbewegung gleich sein. Damit bestimmen12 Werte von S(i), die den Monaten zugeordnet sind, die ganze Saisonkomponente:

(SI , SII , . . . , SXII)

Dieser Satz von 12 Zahlen heißt Saisonnormale. Die Verbindung zur Saisonkomponenteist dann in folgender Weise gegeben:

(5.4.3)S(i)(≡ Si) =

SI ,

SII ,...

falls der Monat mit der Nummer i ein Januar ist.falls der Monat mit der Nummer i ein Februar ist.

...

Die Schatzung der Saisonnormale ist das Ziel der nachsten Schritte.

• 3. Schritt: Bildung der arthm. Mittel aller Werte di, die zu jeweils einen Monat gehoren.Wir bezeichnen diese arithmetischen Mittel mit:

dI , dII , . . . , dXII .

dII ist z.B. das arithmetische Mittel aller Werte di, die zum Februar gehoren.

Annahme 2: Der Jahresdurchschnitt aller saisonbedingter Abweichungen verschwindet,d.h.

(5.4.4) 112(SI + SII + · · · + SXII) = 0

32

• 4. Schritt: Bestimmung von

(5.4.5) d := dI+dII+···+dXII

12

als Korrektur zu den Werten dI , dII , . . . , dXII . Damit ist eine Schatzung fur die Saison-normale wie folgt zu bestimmen:

(5.4.6) (S∗

I , S∗

II , . . . , S∗

XII) mit S∗

I := dI − d, . . . , S∗

XII := dXII − d.

• 5. Schritt: Bestimmung von

(5.4.7) B∗

i := yi − S∗

i mit (vergl. (5.4.3))

S∗(i)(≡ S∗

i ) =

S∗

I ,

S∗

II ,...

falls der Monat mit der Nummer i ein Januar ist,falls der Monat mit der Nummer i ein Februar ist,

...

als Schatzung fur yi − S(i) = T (i) + R(i)

Die Werte B∗

i bilden also eine Schatzung fur die saisonbereinigte Zeitreihe.

• 6. Schritt: Bestimmung von

(5.4.8) R∗

i := B∗

i − D12(i)

als Schatzung fur die Restkomponente: R(i) = yi − S(i) − T (i).

Bem.: di und R∗

i konnen nicht fur alle i der Zeitreihe berechnet werden, da die gleitendenDurchschnitte dabei werwendet werden.

Beispiele zur Saisonbereinigung finden Sie in den in diesem Verzeichnis abgelegten Files ”kap5erg1.pdf”und ”kap5erg2.pdf”.

5.4.2 Ein Verfahren bei multiplikativer Verknupfung

Durch Logarithmieren (vergl. (5.2.3)) lasst sich die Untersuchung auf den Fall der additiven Ver-knupfung reduzieren. Es ist also das Verfahren aus 5.4.1 auf die Zeitreihe “ln yi” anzuwenden. Esist dann zweckmaßig, die logarithmische Darstellung beizubehalten und erst bei der Auswertungeinzelner Zahlenergebnisse die Logarithmierung wieder ruckgangig zu machen.

33