P O B I E R Z

Komentarze

Transkrypt

P O B I E R Z
Szeregi czasowe i ich analiza - wstęp
Szeregi czasowe
W badaniach wielu zjawiskach społeczno-ekonomicznych często mamy do czynienia z
danymi podającymi wielkości danego zjawiska w kolejnych momentach czasu. Tego
rodzaju dane nazywamy szeregiem czasowym. Tego rodzaju danych dostarczają nam
róŜne roczniki statystyczne. Są to na przykład: wielkość bezrobocia liczona na koniec
kolejnych miesięcy, zuŜycie energii elektrycznej przez kolej w kolejnych miesiącach,
liczba uŜywanych telefonów komórkowych w kolejnych miesiącach czy wielkość
eksportu w kolejnych kwartałach.
Oznaczając kolejne momenty (czy przedziały czasowe) przez t, t=1,2,3,...,n, zaś
obserwowane wielkości przez Yt szereg czasowy modelujemy jako ciąg Y1, Y2, ...,Yn,… .
Z punktu widzenia probabilistycznego jest to proces stochastyczny z czasem
dyskretnym.
1
Składniki szeregu czasowego:
- trend (tendencja rozwojowa) lub jego brak (stałość)
- wahania cykliczne (sezonowe)
- szum (wahania przypadkowe)
Trend jest odpowiedzią zmiennej wyjaśnianej Y na (być moŜe nie obserwowane)
przyczyny główne i wyraŜa się stałym znakiem zmian jej wartości. Trend moŜe
być rosnący lub malejący . PoniewaŜ jest to tylko jedna z kilku składowych
obserwowanego szeregu czasowego więc w praktyce moŜna go wykryć tylko
wtedy, gdy dysponujemy odpowiednio duŜą liczbą obserwacji. Brak trendu
oznacza stałość poziomu obserwowanego zjawiska.
Wahania cykliczne objawiają się długotrwałymi rytmicznymi wahaniami wartości
zmiennej wokół jej trendu (lub stałego poziomu) w cyklach. Nie muszą być one stałej
długości i w gospodarce są związane np. z koniunkturą (wahania koniunkturalne),
nieregularnie powtarzającym się występowaniem jednej z waŜnych przyczyn głównych
(np. występowanie wyŜy i niŜów demograficznych). Analiza tego rodzaju wahań w
ekonomii wymaga na ogół prowadzenia wieloletnich obserwacji.
Wahania sezonowe (okresowe) to rytmiczne wahania zmiennej wokół jej trendu o cyklu
najczęściej związanych z cyklem rocznym realizacji rozmaitych zjawisk. Są efektem
zmian pór roku oraz umownych podziałów okresu czasu na miesiące kwartały itp., czego
konsekwencją są równieŜ określone cykliczne zachowania społeczeństw.
Analiza tego rodzaju wahań wymaga prowadzenia obserwacji przez okres co najmniej
kilkuletni.
Pomiar (wyodrębnienie) poszczególnych składowych systematycznych szeregu
następuje poprzez jego dekompozycję. Prawidłowo przeprowadzona dekompozycja
powinna zakończyć się wyodrębnieniem szumu - "czysto" losowego składnika, który
nie wykazuje Ŝadnych tendencji czy regularności. Proces wyodrębniania szumu
nazywamy filtracją.
Formalnie szum to stacjonarny proces stochastyczny Z1, Z2,..., Zn,... o przyrostach
niezaleŜnych. W praktyce na ogół zadowalamy się stacjonarnością w szerszym
sensie, tzn. niezmienniczością momentów pierwszego i drugiego rzędu ze względu na
przesuniecie w czasie.
Szum nazywamy białym, jeśli zmienne losowe Zi, i=1,2,… mają rozkład normalny o
stałych (takich samych) momentach.
2
Proces stochastyczny jest procesem o przyrostach niezaleŜnych jeśli dla
dowolnych t1, t2,..., tn , przyrosty (zmienne losowe):
Zt2 - Zt1, Zt3 - Zt2, … , Ztn - Ztn-1
są niezaleŜne
Proces stacjonarny w węŜszym sensie (strictly stationary process ):
dla dowolnych t1, t2,..., tn oraz k rozkład wektora
(Zt1, Zt2,..., Ztn )
jest identyczny z rozkładem wektora
(Zt1+k, Zt2+k,..., Ztn+k)
Proces stacjonarny w szerszym sensie (weakly stationary process):
Momenty drugiego rzędu są niezmiennicze ze względu na przesunięcie. Zachodzi to
wtedy tylko wtedy, gdy
E(Zt)= m = constans
Var(Zt)= s 2 = constans
cov(Zt,Zt+k)=R(k)
Najczęstsze modele szeregów czasowych:
- model błądzenia losowego
- model regresji (dla trendu i wahań okresowych)
- model autoregresji AR
- inne (ARMA, ARCH, GARCH etc)
3
Model błądzenia losowego (random walk)
Proces Y1, Y2,..., Yn nazywamy procesem błądzenia losowego, jeśli
Yn=Yn -1+Zn
gdzie Z1, Z2,..., Zn,..., jest szumem, zaś Y0 jest danym stanem początkowym
Prognoza na l okresów do przodu:
przy załoŜeniu, Ŝe znamy wartość Yn oraz Ŝe szum jest biały , przy
współczynniku ufności q przedziałem ufności dla wartości Yn+l jest
przedział:
[Yn + l ⋅ Z − u β sZ l , Yn + l ⋅ Z + u β sZ l ]
gdzie Z , s Z to oszacowania wartości oczekiwanej oraz odchylenia
standardowego szumu otrzymane na podstawie n obserwacji. Liczba
uβ jest - jak zwykle - kwantylem rzędu (1+q)/2 z rozkładu normalnego
standaryzowanego.
Karty kontrolne w badaniu szumu
Karta obserwacji
Karta X (karta średnich)
Karta s
(karta odchyleń standardowych)
Karta R
(karta rozstępów)
4
Weryfikacja hipotezy losowości
Hipoteza zerowa: Obserwowane wartości mają losowe odchylenia od średniej
Hipoteza alternatywna: odchylenia obserwowanych wartości od średniej wykazują
regularność
Opis testu:
Obliczamy reszty tj: odchylenia wartości od ich średniej.
Szeregujemy reszty według czasu
Resztom dodatnim przypisujemy znak „+”, resztom ujemnym „−”.
Reszty równe 0 odrzucamy!
Otrzymujemy w ten sposób ciąg typu: − − + + + − + − + + − + + + − − − −
Obliczmy liczbę serii występujących w otrzymanym ciągu. Serią jest ciąg takich samych
znaków (takŜe jednoelementowy)
Odczytujemy z tablic dla testu serii i danego poziomu istotności wartość krytyczną N*
(zaleŜy ona od liczby znaków „+” i liczby znaków „–” .
Hipotezę zerową odrzucamy, jeśli liczba serii Ns jest mniejsza od N*.
5
Wartości kwantyli dla testu serii dla małych prób
PrzybliŜone wartości kwantyli dla testu serii dla duŜych prób moŜna obliczyć z wzoru
kα =
4n12
n2
2n1
+ uα
3
n1
 n1 
1+
1 + 
n2
 n2 
Hipotezę o liniowości modelu odrzucamy, gdy liczba serii jest mniejsza od wartości
kwantyla kα gdzie α jest poziomem istotności testu
6