Szeregi czasowe i prognozowanie.

Transkrypt

Szeregi czasowe i prognozowanie.
Metody statystyczne w naukach biologicznych
2006-06-02
Wykład: Szeregi czasowe i prognozowanie
Analiza dynamiki niesie ze sobą nową jakość. Pozwala ona zbadać rozkład cechy statystycznej
w czasie. Szeregi dynamiczne przedstawiają kształtowanie się zjawisk w czasie. Rezultatem
prowadzonych badań w czasie jest zgromadzenie zbioru informacji postaci: t, yt. „t” oznacza czas
wyrażony w postaci skokowej, godzina, dzień, miesiąc, rok itp. Zaś „yt” oznacza wartość cechy
w czasie t. Zbiór par t, yt to tzw. szereg czasowy, dynamiczny, chronologiczny.
Jakie zagadnienia mogą być przedmiotem badań?
1. Jak zmienia się zjawisko w czasie?
2. Dlaczego zmienia się w taki sposób?
LATA
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
nr
Bydło ogółem w
kolejny szt. w woj. bydg.
czasu (t)
(yt)
t
bydło
419 723
1
2
398 889
3
399 907
4
403 622
5
398 970
6
386 722
7
338 050
8
361 262
9
347 766
10
336 173
Średnia
LATA
ruchoma
=(C1+C2+C3)/3
lata
1976
1977
1978
1979
1980
1981
1982
1983
1984
liczebność
406 173
400 806
400 833
396 438
374 581
362 011
349 026
348 400
340 376
Ad. 1. Za rozwiązanie tego problemu odpowiedzialne są indeksy statystyczne, które to dzielą się na
indywidualne oraz agregatowe (opisujące przebieg zjawisk złożonych).
a) indywidualne, jednorodne – charakteryzują one dynamikę zjawisk jednorodnych
Najprostszym indeksem jest przyrost absolutny lub bezwzględny.
∆y=y1-y0
y1 – poziom zjawiska w badanym okresie, zaś y0 to poziom zjawiska w czasie, który stanowi
punkt odniesienia.
Przyrost względny:
Ty =
∆y
y0
Wśród przyrostów względnych wyróżniamy o te stałej podstawie (gdy poziom zjawiska będący
punktem odniesienia nie ulega zmianie) i zmiennej, zwane też łańcuchowymi (punktem
odniesienia jest moment poprzedzający badany).
b) agregatowe opisują zjawiska złożone, nie można ich sumować, wyrażane są raczej w postaci
wartości
n
W
Iw = 1 =
W0
∑
q1i ⋅ p1i
∑
q 0i ⋅ p 0i
i= 1
n
i= 1
Autor: Dariusz Piwczyński
1
Metody statystyczne w naukach biologicznych
2006-06-02
q1i*p1i – wartość dobra w określonym czasie, będąca iloczynem wielkości tego dobra (q 1i) i jego
ceny jednostkowej (p1i).
Analiza przyczyn składających się na dynamikę zjawiska - jest to kolejny problem związany
z badaniem dynamiki zjawisk. Dane zjawisko rozważane jest w czasie, jako efekt działania
różnorodnych przyczyn. Różnica między podejściem regresyjnym, korelacyjnym a szeregiem
chronologicznym jest zasadnicza. W pierwszym przypadku zmienne są konkretnie określone,
zidentyfikowane, z kolei w przypadku analizy dynamiki mówi się o zespołach czynników.
Analizując dane statystyczne zestawione w szeregach czasowych prezentowanych w formie
wykresów, można zauważyć, że rozwój procesów nie jest równomierny.
Wśród przyczyn powodujących zmianę zjawiska w czasie można wyróżnić:
 przyczyny główne, które działają stale, niezmienne wyznaczające dane zjawisko w czasie.
To one wyznaczają tendencję, czyli tzw. trend.
Trendy - wyrażają zniżkową lub zwyżkową trwałą tendencję rozwojową, ujawniającą się w danej
dziedzinie działalności w ciągu stosunkowo długich okresów
 przyczyny okresowe, które dzielą się na typu:
• koniunkturalnego. Działają co pewien czas, dłuższy niż rok. Związane są z kierunkiem
zmian w otoczeniu zjawiska, jakim może być np. gospodarka narodowa
• sezonowego - zaliczamy tu różnego rodzaju wahania rytmiczne (okresowe, periodyczne,
cykliczne). Cykl obserwowanych zmian powtarza się w mniej więcej tych samych
rozmiarach co jakiś okres, w przybliżeniu ten sam:
o w. krótkoterminowe - w ciągu dnia, tygodnia, miesiąca
o w. sezonowe
 przypadkowe - nieregularne, nieperiodyczne zmiany w działalności gospodarczej, wyrażają
działanie czynników o charakterze losowym. Ich działanie jest nieprzewidywalne,.
Analiza szeregu dynamicznego o charakterze przyczynowo-skutkowym polega na: wyróżnieniu
tendencji rozwojowej, wykryciu wahań okresowych oraz ustaleniu wahań przypadkowych.
Metody wyodrębnienia tendencji rozwojowej:
{Tendencja rozwojowa - ogólna dążność badanych wielkości do wzrostu lub spadku, występująca
na przestrzeni badanego okresu}.
Ze względu na to, iż w szeregu dynamicznym występują różnego rodzaju wahania, spowodowane
różnymi przyczynami, do wykazania zmian związanych wyłącznie z tendencją rozwojową,
zachodzi konieczność usunięcia tych wahań.
Eliminacja wahań przypadkowych i okresowych zwana jest wyrównaniem lub wygładzeniem
szeregu statystycznego.
Autor: Dariusz Piwczyński
2
Metody statystyczne w naukach biologicznych
2006-06-02
Liczebność bydła w woj.bydgoskim (dawnym)
500 000
400 000
300 000
200 000
100 000
20
18
16
14
12
10
8
6
4
2
t
0
Wyróżniamy dwie metody wyrównania szeregów czasowych:
 metoda mechaniczna
 metoda analityczna
W metodzie mechanicznej eliminujemy wahania przypadkowe i okresowe poprzez obliczanie
średnich ruchomych. Średnia ruchoma jest średnią arytmetyczną z parzystej (średnie
scentrowane) lub nieparzystej (średnie zwykłe) liczby kolejnych wyrazów szeregu, np. 2-letnia, 4letnia lub 3-letnia, 5-letnia. Liczba składników średniej arytmetycznej ruchomej powinna
odpowiadać wahaniom okresowym lub ich wielokrotności.
Przykład obliczenia średniej ruchomej złożonej z 3 elementów:
y1, y2, y3, y4 - kolejne wyrazy szeregu czasowego
3 yk =
yk − 1 + yk + yk + 1
3
Obliczanie średniej scentrowanej o podstawie 4.
1
1
yk − 2 + yk − 1 + yk + yk + 1 + yk + 2
2
2
4 yk =
4
Im więcej okresów uwzględniamy obliczając średnią ruchomą, tym bardziej wyrównujemy
badany szereg, tym lepsza jest eliminacja wahań, ale też tym bardziej ten szereg skracamy. Zaletą
mechanicznej metody wygładzania szeregów jest to, że nie wymaga znajomości typu krzywej
mającej reprezentować trend, powstaje ona niejako w sposób mechaniczny.
Autor: Dariusz Piwczyński
3
Metody statystyczne w naukach biologicznych
2006-06-02
Wyodrębnienie tendencji rozwojowej za pomocą średniej
ruchomej
450 000
400 000
350 000
szt.
300 000
250 000
200 000
150 000
100 000
50 000
93
19
91
19
89
19
87
19
85
19
83
19
81
19
79
19
19
la
t
77
a
0
lata
Innym sposobem wyodrębniania tendencji rozwojowej jest rachunek wygładzania wykładniczego.
Metoda analityczna - tendencję rozwojową szeregu dynamicznego wyrażamy za pomocą
funkcji matematycznej.
Metoda analityczna pozwala na określenie parametrów funkcji, które w sposób syntetyczny
określają prawidłowość rozwoju zjawiska. Najprostszą i najczęściej stosowaną postacią trendu
jest linia prosta i odpowiadająca jej funkcja pierwszego stopnia.
Liczebność bydła w dawnym woj.bydgoskim
450 000
400 000
350 000
szt.
300 000
250 000
200 000
y = -9961x + 436844
150 000
100 000
50 000
20
18
16
14
12
10
8
6
4
2
t
0
kolejne lata
Trend liniowy:
yt = α ⋅ t + β
t - czas w postaci numerów okresów
β - poziom badanego zjawiska w okresie zerowym (t=0)
α - współczynnik kierunkowy wyrażający przeciętne (roczne, kwartalne, miesięczne) tempo
przyrostu (spadku) poziomu zjawiska, to współczynnik trendu.
yt
- kolejne wyrazy szeregu czasowego, wynikające z funkcji trendu
Do oszacowania parametrów α i β stosujemy klasyczną metodę najmniejszych kwadratów, stosując
następujący układ równań:
∑
∑
n
y t = nβ + α
t= 1
n
yt t = β
t= 1
n
∑
n
∑
t+ α
t= 1
t
t= 1
∑
n
t2
t= 1
Autor: Dariusz Piwczyński
4
Metody statystyczne w naukach biologicznych
2006-06-02
yt – empiryczne wartości zjawiska
Współczynnik trendu równa się:
α =
n∑ yt ⋅ t −
t
∑
yy ⋅ ∑ t
t


n⋅ ∑ t2 −  ∑ t
t
 t 
t
2
Wyraz wolny

β = y− α ⋅t
Średni błąd oszacowania wskazuje, w jaki stopniu poszczególne obserwacje odbiegają od prostej
trendu. Jest to pierwiastek kwadratowy ze średniej arytmetycznej kwadratów odchyleń danych
empirycznych od danych teoretycznych (trendu)
Sy =
1
n− k
∑
n
t= 1
( yt − yt ' ) 2
k - ilość parametrów (α,β) występujących w funkcji trendu
Kolejnym, ważnym zagadnieniem jest wyodrębnienie ustalenie wahań okresowych
i przypadkowych.
Autor: Dariusz Piwczyński
5