Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie...

8
Kapitel 5 Zeitreihenanalyse 5.1 Einf¨ uhrung der Zeitreihen Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Gr¨ oße, deren Werte im Zeitablauf zu bestimmten Zeitpunkten oder f¨ ur bestimmte Zeitintervalle erfasst und dargestellt werden. Beispiel 5.1.1 (f¨ ur Zeitreihen von zeitpunktbezogenen Merkmalen): a) Weg-Zeit-Funktion beim freien Fall: s(t)= g 2 t 2 sei die in der Zeit t zur¨ uckgelegte Fall- strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberfl¨ ache f¨ ur die Erdbeschleunigung g 9.81m sec -2 . b) Devisenkurse f¨ ur US $ (Kassa Geld) Tag 15.11.04 16.11.04 17.11.04 18.11.04 19.11.04 $ f¨ ur 1 Euro 1.2914 1.2931 1.3000 1.3003 1.2993 ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, w¨ are eine “kompakte” Darstellung wie in Teil a) zweckm¨ aßig, also y(t). Dabei w¨ are t in Tagen zu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist, also: i 1 2 3 4 5 y(i) 1.2914 1.2931 1.3000 1.3003 1.2993 Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur f¨ ur die angegebe- nen Werte von t, n¨ amlich 1, 2, 3, 4, 5 definiert. Allerdings w¨ are z.B. y(2.5) sinnvoll, wenn noch genaue Uhrzeiten angegeben w¨ aren und der 12 Stunden sp¨ ater als y(2) abgefragte Kurswert bekannt w¨ are. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern. Bsp. 5.1.2 (f¨ ur eine Zeitreihe eines zeitintervallbezogenen Merkmals): Jahr i := Nummer des Zeitintervalls Umsatz y i (in Mio. Euro) Jahr i y i 1988 1 4.8 1993 6 5.6 1989 2 5.2 1994 7 5.8 1990 3 5.6 1995 8 6.4 1991 4 4.9 1996 9 5.9 1992 5 6.2 × × × Eine Funktion y(t) ist bei Bsp 5.1.2 nur f¨ ur t =1, 2,..., sinnvoll zu interpretieren. Nicht sinnvoll ist z.B. y(1.5). Um sich aber z.B. einen besseren ¨ Uberblick ¨ uber den Verlauf der Zeitreihe zu 26

Transcript of Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie...

Page 1: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

Kapitel 5

Zeitreihenanalyse

5.1 Einfuhrung der Zeitreihen

Unter einer Zeitreihe versteht man die Entwicklung einer bestimmten Große, deren Werte imZeitablauf zu bestimmten Zeitpunkten oder fur bestimmte Zeitintervalle erfasst und dargestelltwerden.

Beispiel 5.1.1 (fur Zeitreihen von zeitpunktbezogenen Merkmalen):

a) Weg-Zeit-Funktion beim freien Fall: s(t) = g2 t2 sei die in der Zeit t zuruckgelegte Fall-

strecke. Misst man t in Sekunden und s(t) in Metern, so gilt an der Erdoberflache fur dieErdbeschleunigung g ≈ 9.81m sec−2.

b)

Devisenkurse fur US $ (Kassa Geld)

Tag 15.11.04 16.11.04 17.11.04 18.11.04 19.11.04

$ fur 1 Euro 1.2914 1.2931 1.3000 1.3003 1.2993

Fur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapitel behandelt wird, wareeine “kompakte” Darstellung wie in Teil a) zweckmaßig, also y(t). Dabei ware t in Tagenzu messen, und zwar an Besten so, dass y(i) der Kurswert am i-te angegebene Tag ist,also:

i 1 2 3 4 5

y(i) 1.2914 1.2931 1.3000 1.3003 1.2993

Die Funktion y(t) ist aber offensichtlich ohne weitere Informationen nur fur die angegebe-nen Werte von t, namlich 1, 2, 3, 4, 5 definiert. Allerdings ware z.B. y(2.5) sinnvoll, wennnoch genaue Uhrzeiten angegeben waren und der 12 Stunden spater als y(2) abgefragteKurswert bekannt ware. Die Zeitskala ließe sich also prinzipiell beliebig verfeinern.

Bsp. 5.1.2 (fur eine Zeitreihe eines zeitintervallbezogenen Merkmals):

Jahr i := Nummer des Zeitintervalls Umsatz yi (in Mio. Euro) Jahr i yi

1988 1 4.8 1993 6 5.61989 2 5.2 1994 7 5.81990 3 5.6 1995 8 6.41991 4 4.9 1996 9 5.91992 5 6.2 × × ×

Eine Funktion y(t) ist bei Bsp 5.1.2 nur fur t = 1, 2, . . . , sinnvoll zu interpretieren. Nicht sinnvollist z.B. y(1.5). Um sich aber z.B. einen besseren Uberblick uber den Verlauf der Zeitreihe zu

26

Page 2: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

verschaffen, ist es zweckmaßig, die Zeitreihe in einer Kurve darzustellen (Siehe die untenste-hende Fig. 5-1). Dabei ist zu beachten, dass y(t) nur fur bestimmte Werte von t sinnvoll zuinterpretieren ist.

6

y (Umsatz in Mio. Euro)

- t1 2 3 4 5 6 7 8 9

1

2

3

4

5

6

7

Fig. 5-1

5.2 Komponenten einer Zeitreihe

Bei langen Zeitreihen (etwa uber mehrere Jahrzehnte) ist eine Aufteilung in folgende 4 Kom-

ponenten sinnvoll:

a) Trend T (t): Grundrichtung, langfristige Entwicklung.

b) Zyklische Komponente Z(t): mitttelfristige Entwicklung, z.B. Einflusse von Konjunk-turschwankungen.

c) Saisonkomponente S(t): kurzfristige Entwicklung innerhalb der einzelnen Jahre durchsaisonbedingte Schwankungen.

d) Restkomponente R(t): einmalige oder seltene Einflusse und Zufallsschwankungen.

27

Page 3: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

Bei kurzen Zeitreihen ist eine Trennung zwischen Trend und zyklischer Komponente nicht mehrsinnvoll. Es bleibt eine Aufteilung in 3 Komponenten:

a) Trend T (t): Grundrichtung, b) S(t) vergl. o., c) R(t) vergl. o.

In diesem Kapitel werden nur solche Zeitreihen behandelt.

Additive Verknupfung der Komponenten:

(5.2.1) y(t) = T (t) + S(t) + R(t)

Multiplikative Verknupfung der Komponenten:

(5.2.2) y(t) = T (t) · S(t) · R(t)

Reduktion auf additiver Verknupfung durch Logarithmeren (z.B. mit Basis ”e”)

(5.2.3) ln y(t) = ln T (t) + ln S(t) + ln R(t)

5.3 Schatzung des Trends

5.3.1 Die Methode der gleitenden Durchschnitte

Gleitender Durchschnitt uber eine ungerade Anzahl von Werten

(5.3.1) T (i) ≈ D2m+1(i) := yi−m+yi−m+1+...+yi+yi+1+...+yi+m

2m+1

Rekursionsformel:

(5.3.2) D2m+1(i) = D2m+1(i − 1) + yi+m−yi−m−1

2m+1

Eine Mittelbildung uber eine gerade Anzahl von Werten wurde eine Trendschatzung an einemnicht sinnvollen Wert von t liefern. Ware (wie etwa bei Monatswerten) doch eine Art Mittelbil-dung uber eine gerade Anzahl wunschenswert, so kann man folgende Modifikation des gleitendenDurchschnitts verwenden:

(5.3.3) T (i) ≈ D2m(i) := 0.5yi−m+yi−m+1+...+yi+m−1+0.5yi+m

2m

Rekursionsformel:

(5.3.4) D2m(i) = D2m(i − 1) + (yi+m+yi+m−1)−(yi−m+yi−m−1)4m

Nachteil des gleitenden Durchschnitts:keine Trendschatzung fur die ersten und letzten Werte von i.

5.3.2 Die Methode der exponentiellen Glattung

Rekursive Berechnung von T ∗(i) als Schatzung fur T (i) nach der Methode der exponentiellen

Glattung:

(5.3.5) T ∗(1) = y(1), T ∗(i) = α y(i) + (1 − α) T ∗(i − 1) (i ≥ 2)

Die Glattungskonstante α ist dabei eine vorher festzusetzende Zahl mit 0 ≤ α ≤ 1. Manerhalt eine starke Glattung, wenn α nahe bei 0 ist, und eine schwache Glattung, wenn α nahebei 1 ist.

28

Page 4: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

Die Bezeichnung ”exponentielle” Glattung kommt daher, dass man aus (5.3.5) folgende Formelherleiten kann:

(5.3.5 a) T ∗(i) = αi−2∑

j=0(1 − α)j

y (i − j) + (1 − α)i−1y(1) (i ≥ 2)

Fur die praktische Berechnung ist aber (5.3.5) vorzuziehen.

5.3.3 Drei Funktionsansatze fur die Trendschatzung

Linearer Ansatz: T (t) ≈ a + bt

Parabolischer Ansatz: T (t) ≈ a + bt + ct2

Exponentieller Ansatz: T (t) ≈ a bt (a, b ≥ 0)

Reduktion des exponentiellen auf den linearen Ansatz:

(5.3.6) ln T (t) ≈ ln a + t ln b =: a∗ + t b∗

5.3.4 Die Freihandmethode

Anpassung einer Trendgerade (also linearer Ansatz) nach Augenmaß an die graphische Darstel-lung der Zeitreihe

5.3.5 Die Methode der kleinsten Quadrate

Vorbemerkung zur Schreibweise: Um bei den in diesem Abschnitt eingefuhrten arithmetischenMitteln den Zusammenhang mit der Zeitvariablen zum Ausdruck zu bringen, verwenden wir furdie Bezeichnung der Zeitpunkte oder Zeitintervalle die Bezeichnung “ti” statt einach “i”, auchwenn meist (aber nicht immer) ti = i ist.

a) Linearer Ansatz:Bestimme a und b so, dass

(5.3.7) 1n

n∑

i=1d2

i mit di := (a + b ti) − yi

ein Minimum wird. Diese Forderung ist erfullt, wenn a und b die folgenden Normalen-

gleichungen erfullen:

(5.3.8) a + t b = y

t a + t2 b = yt

Dabei bedeuten z.B.:

t := 1n

n∑

i=1ti, t2 := 1

n

n∑

i=1ti

2 (> t2

i.Allg.), y t := 1n

n∑

i=1yi ti (= ty 6= y t i.Allg.)

Zur Herleitung und zum Verstandnis der Normalengleichungen ist es nutzlich, (5.3.7)ausfuhrlich zu schreiben:

29

Page 5: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

1

n

n∑

i=1

d2i =

1

n

n∑

i=1

(a + bti − yi)2

=1

n

n∑

i=1

(a2 + b2 t2i + y2i + 2abti − 2ayi − 2btiyi)

= a2 + b2t2 + y2 + 2abt − 2ay − 2bty

Bezeichnen wir diesen Ausdruck mit g(a, b), so mussen nach den u.a. in der Mathematik–II–Vorlesung bereitgestellten Verfahren folgende notwendige Bedingungen erfullt sein, damitg(a, b) minimal wird.

∂g(a,b)∂a

= 2a + 2bt − 2y!= 0, ∂g(a,b)

∂b= 2bt2 + 2at − 2ty

!= 0

Das fuhrt auf das System (5.3.8) der Normalengleichungen, das seinerseits immer eindeutiglosbar ist außer in dem Sonderfall

t2 = t2

(

⇔ alle ti sind gleich⇔ n = 1 (wegen t1 < t2 < . . . )

)

Die Losung des Systems (5.3.8) der Normalengleichungen lautet:

(5.3.9) b = t y−t y

t2−t2 , a = y − bt.

Dass die Werte fur a und b aus (5.3.9) – wie gefordert – die Funktion g(a, b) tatsachlichminimieren, muss noch gezeigt werden. Dabei genugt es i.Allg. nicht, die Hesse–Matrixzu untersuchen, da dies eine Aussage uber relative Extrema liefert. Da aber g(a, b) durchlineare Substitutionen in eine quadratische Form umgewandelt werden kann, genugt dieUntersuchung der Hesse–Matrix doch:

H(a, b) :=

(

∂2g(a,b)∂a2

∂2g(a,b)∂a∂b

∂2g(a,b)∂a∂b

∂2g(a,b)∂b2

)

=

(

2 2t

2t 2t2

)

Da fur n ≥ 2 die Determinante dieser Hesse–Matrix = 2 · 2t2 − (2t)2 = 4(t2 − t2) > 0 ist

und ∂2g(a,b)∂a2 = 2 > 0 ist, besitzt g(a, b) fur die Werte aus (5.3.9) nach Satz 11.6 b) der

Mathematik–II–Vorlesung ein relatives Minimum. Das ist aber gleichzeitig ein absolutesMinimum, da g(a, b) durch lineare Substitutionen in eine quadratische Form umgewandeltwerden kann.

Die bei der Mittelbildung notwendigen Divisionen durch n kann man bei der Berechnungvon b vermeiden, indem man den Bruch in (5.3.9) mit n2 erweitert und erhalt so die Al-ternativformeln:

(5.3.9a) b =n·(n·t y)−(n·t) (n·y)

n·(

n·t2)

−(n·t)2 , a = y − bt.

b) Parabolischer Ansatz: Bestimme a, b, c so, dass

30

Page 6: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

(5.3.10) 1n

n∑

i=1d2

i mit di := (a + bti + ct2i ) − yi

ein Minimum wird. Diese Forderung ist erfullt, wenn a, b und c die folgende Normalenglei-chungen erfullen:

(5.3.11)a + t b + t2c = y

t a + t2 b + t3c = yt

t2 a + t3 b + t4c = yt2

Dabei bedeuten z.B.:

tk := 1n

n∑

i=1ti

k, , y tk := 1n

n∑

i=1ti

k yi.

Die bei der Mittelbildung notwendigen Divisionen durch n kann man vermeiden, indemman alle Gleichungen mit n durchmultipliziert:

(5.3.11a)

n · a + (n · t) b +(

n · t2)

c = (n · y)

(n · t) a +(

n · t2)

b +(

n · t3)

c = (n · yt)(

n · t2)

a +(

n · t3)

b +(

n · t4)

c =(

n · yt2)

Dieses System der Normalengleichungen ist eindeutig losbar bis auf die fur die Praxisbelanglosen Sonderfalle n = 1 und n = 2.

c) Exponentieller Ansatz: Statt analog zu a) und b) mit di = a bti − yi zu arbeiten, ist eszweckmaßiger, auf den linearen Ansatz (vergl. (5.3.6)) zu reduzieren. Man erhalt so:

(5.3.12) b∗ = t ln y−t ln y

t2−t2 , a∗ = ln y − b∗t

a = ea∗

, b = eb∗

Dabei bedeuten z.B.:

ln y := 1n

n∑

i=1ln yi, , t ln y := 1

n

n∑

i=1ti ln yi.

a∗, b∗ sind also die Koeffizienten bei dem linearen Ansatz fur die Trendschatzung bei derZeitsreihe “ln yi” statt “yi”.

Haufig ist es zweckmaßig, bei dieser Trendschatzung zu bleiben und auf die Umrechnungin a und b zu verzichten:

(5.3.13) ln T (t) ≈ T ∗

ln y(t) = a∗ + b∗ t (Trendschatzung fur ln yi).

Statt ”ln” kann man z.B. auch ”log10” verwenden. Man erhalt dann die Umrechnungsfor-meln a = 10a∗

, b = 10b∗ .

Die bei der Mittelbildung notwendigen Divisionen durch n kann man bei der Berechnungvon b∗ vermeiden, indem man den Bruch in (5.3.12) mit n2 erweitert und erhalt so dieAlternativformeln:

31

Page 7: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

(5.3.12a) b∗ =n·(n·t ln y)−(n·t) (n·ln y)

n·(

n·t2)

−(n·t)2 , a∗ = ln y − b∗t.

a = ea∗

, b = eb∗

Allg. Bem. zu 5.3: In der Praxis sollte bei den Trendschatzungsverfahren n etwa ≥ 30 sein.

5.4 Saisonbereinigung

5.4.1 Ein Verfahren bei additiver Verknupfung

Es seien Zeitreihenwerte yi in monatlichen Daten vorgegeben. Bei andere Aufteilung des Jahressind die Einzelschritte entsprechend zu modifizieren.

• 1. Schritt: Trendschatzung durch gleit. Durchschnitte:

(5.4.1) T (i) ≈ D12(i) (”ti” durch ”i” ersetzt)

• 2. Schritt: Trendbereingung: Bestimmung von

(5.4.2) di := yi − D12(i)

als Schatzung fur yi − T (i) = S(i) + R(i).

Annahme 1: Der Wert der Saisonkomponente S(i) ist nur von dem Monat und nicht vondem Jahr abhangig. In allen Jahren soll die Saisonbewegung gleich sein. Damit bestimmen12 Werte von S(i), die den Monaten zugeordnet sind, die ganze Saisonkomponente:

(SI , SII , . . . , SXII)

Dieser Satz von 12 Zahlen heißt Saisonnormale. Die Verbindung zur Saisonkomponenteist dann in folgender Weise gegeben:

(5.4.3)S(i)(≡ Si) =

SI ,

SII ,...

falls der Monat mit der Nummer i ein Januar ist.falls der Monat mit der Nummer i ein Februar ist.

...

Die Schatzung der Saisonnormale ist das Ziel der nachsten Schritte.

• 3. Schritt: Bildung der arthm. Mittel aller Werte di, die zu jeweils einen Monat gehoren.Wir bezeichnen diese arithmetischen Mittel mit:

dI , dII , . . . , dXII .

dII ist z.B. das arithmetische Mittel aller Werte di, die zum Februar gehoren.

Annahme 2: Der Jahresdurchschnitt aller saisonbedingter Abweichungen verschwindet,d.h.

(5.4.4) 112(SI + SII + · · · + SXII) = 0

32

Page 8: Zeitreihenanalyse - Universität · PDF fileF¨ur eine Analyse dieser Zeitreihe, wie sie dann in diesem Kapi tel behandelt wird, w¨are eine “kompakte” Darstellung wie in Teil

• 4. Schritt: Bestimmung von

(5.4.5) d := dI+dII+···+dXII

12

als Korrektur zu den Werten dI , dII , . . . , dXII . Damit ist eine Schatzung fur die Saison-normale wie folgt zu bestimmen:

(5.4.6) (S∗

I , S∗

II , . . . , S∗

XII) mit S∗

I := dI − d, . . . , S∗

XII := dXII − d.

• 5. Schritt: Bestimmung von

(5.4.7) B∗

i := yi − S∗

i mit (vergl. (5.4.3))

S∗(i)(≡ S∗

i ) =

S∗

I ,

S∗

II ,...

falls der Monat mit der Nummer i ein Januar ist,falls der Monat mit der Nummer i ein Februar ist,

...

als Schatzung fur yi − S(i) = T (i) + R(i)

Die Werte B∗

i bilden also eine Schatzung fur die saisonbereinigte Zeitreihe.

• 6. Schritt: Bestimmung von

(5.4.8) R∗

i := B∗

i − D12(i)

als Schatzung fur die Restkomponente: R(i) = yi − S(i) − T (i).

Bem.: di und R∗

i konnen nicht fur alle i der Zeitreihe berechnet werden, da die gleitendenDurchschnitte dabei werwendet werden.

Beispiele zur Saisonbereinigung finden Sie in den in diesem Verzeichnis abgelegten Files ”kap5erg1.pdf”und ”kap5erg2.pdf”.

5.4.2 Ein Verfahren bei multiplikativer Verknupfung

Durch Logarithmieren (vergl. (5.2.3)) lasst sich die Untersuchung auf den Fall der additiven Ver-knupfung reduzieren. Es ist also das Verfahren aus 5.4.1 auf die Zeitreihe “ln yi” anzuwenden. Esist dann zweckmaßig, die logarithmische Darstellung beizubehalten und erst bei der Auswertungeinzelner Zahlenergebnisse die Logarithmierung wieder ruckgangig zu machen.

33