P O B I E R Z
Transkrypt
P O B I E R Z
Szeregi czasowe i ich analiza - wstęp Szeregi czasowe W badaniach wielu zjawiskach społeczno-ekonomicznych często mamy do czynienia z danymi podającymi wielkości danego zjawiska w kolejnych momentach czasu. Tego rodzaju dane nazywamy szeregiem czasowym. Tego rodzaju danych dostarczają nam róŜne roczniki statystyczne. Są to na przykład: wielkość bezrobocia liczona na koniec kolejnych miesięcy, zuŜycie energii elektrycznej przez kolej w kolejnych miesiącach, liczba uŜywanych telefonów komórkowych w kolejnych miesiącach czy wielkość eksportu w kolejnych kwartałach. Oznaczając kolejne momenty (czy przedziały czasowe) przez t, t=1,2,3,...,n, zaś obserwowane wielkości przez Yt szereg czasowy modelujemy jako ciąg Y1, Y2, ...,Yn,… . Z punktu widzenia probabilistycznego jest to proces stochastyczny z czasem dyskretnym. 1 Składniki szeregu czasowego: - trend (tendencja rozwojowa) lub jego brak (stałość) - wahania cykliczne (sezonowe) - szum (wahania przypadkowe) Trend jest odpowiedzią zmiennej wyjaśnianej Y na (być moŜe nie obserwowane) przyczyny główne i wyraŜa się stałym znakiem zmian jej wartości. Trend moŜe być rosnący lub malejący . PoniewaŜ jest to tylko jedna z kilku składowych obserwowanego szeregu czasowego więc w praktyce moŜna go wykryć tylko wtedy, gdy dysponujemy odpowiednio duŜą liczbą obserwacji. Brak trendu oznacza stałość poziomu obserwowanego zjawiska. Wahania cykliczne objawiają się długotrwałymi rytmicznymi wahaniami wartości zmiennej wokół jej trendu (lub stałego poziomu) w cyklach. Nie muszą być one stałej długości i w gospodarce są związane np. z koniunkturą (wahania koniunkturalne), nieregularnie powtarzającym się występowaniem jednej z waŜnych przyczyn głównych (np. występowanie wyŜy i niŜów demograficznych). Analiza tego rodzaju wahań w ekonomii wymaga na ogół prowadzenia wieloletnich obserwacji. Wahania sezonowe (okresowe) to rytmiczne wahania zmiennej wokół jej trendu o cyklu najczęściej związanych z cyklem rocznym realizacji rozmaitych zjawisk. Są efektem zmian pór roku oraz umownych podziałów okresu czasu na miesiące kwartały itp., czego konsekwencją są równieŜ określone cykliczne zachowania społeczeństw. Analiza tego rodzaju wahań wymaga prowadzenia obserwacji przez okres co najmniej kilkuletni. Pomiar (wyodrębnienie) poszczególnych składowych systematycznych szeregu następuje poprzez jego dekompozycję. Prawidłowo przeprowadzona dekompozycja powinna zakończyć się wyodrębnieniem szumu - "czysto" losowego składnika, który nie wykazuje Ŝadnych tendencji czy regularności. Proces wyodrębniania szumu nazywamy filtracją. Formalnie szum to stacjonarny proces stochastyczny Z1, Z2,..., Zn,... o przyrostach niezaleŜnych. W praktyce na ogół zadowalamy się stacjonarnością w szerszym sensie, tzn. niezmienniczością momentów pierwszego i drugiego rzędu ze względu na przesuniecie w czasie. Szum nazywamy białym, jeśli zmienne losowe Zi, i=1,2,… mają rozkład normalny o stałych (takich samych) momentach. 2 Proces stochastyczny jest procesem o przyrostach niezaleŜnych jeśli dla dowolnych t1, t2,..., tn , przyrosty (zmienne losowe): Zt2 - Zt1, Zt3 - Zt2, … , Ztn - Ztn-1 są niezaleŜne Proces stacjonarny w węŜszym sensie (strictly stationary process ): dla dowolnych t1, t2,..., tn oraz k rozkład wektora (Zt1, Zt2,..., Ztn ) jest identyczny z rozkładem wektora (Zt1+k, Zt2+k,..., Ztn+k) Proces stacjonarny w szerszym sensie (weakly stationary process): Momenty drugiego rzędu są niezmiennicze ze względu na przesunięcie. Zachodzi to wtedy tylko wtedy, gdy E(Zt)= m = constans Var(Zt)= s 2 = constans cov(Zt,Zt+k)=R(k) Najczęstsze modele szeregów czasowych: - model błądzenia losowego - model regresji (dla trendu i wahań okresowych) - model autoregresji AR - inne (ARMA, ARCH, GARCH etc) 3 Model błądzenia losowego (random walk) Proces Y1, Y2,..., Yn nazywamy procesem błądzenia losowego, jeśli Yn=Yn -1+Zn gdzie Z1, Z2,..., Zn,..., jest szumem, zaś Y0 jest danym stanem początkowym Prognoza na l okresów do przodu: przy załoŜeniu, Ŝe znamy wartość Yn oraz Ŝe szum jest biały , przy współczynniku ufności q przedziałem ufności dla wartości Yn+l jest przedział: [Yn + l ⋅ Z − u β sZ l , Yn + l ⋅ Z + u β sZ l ] gdzie Z , s Z to oszacowania wartości oczekiwanej oraz odchylenia standardowego szumu otrzymane na podstawie n obserwacji. Liczba uβ jest - jak zwykle - kwantylem rzędu (1+q)/2 z rozkładu normalnego standaryzowanego. Karty kontrolne w badaniu szumu Karta obserwacji Karta X (karta średnich) Karta s (karta odchyleń standardowych) Karta R (karta rozstępów) 4 Weryfikacja hipotezy losowości Hipoteza zerowa: Obserwowane wartości mają losowe odchylenia od średniej Hipoteza alternatywna: odchylenia obserwowanych wartości od średniej wykazują regularność Opis testu: Obliczamy reszty tj: odchylenia wartości od ich średniej. Szeregujemy reszty według czasu Resztom dodatnim przypisujemy znak „+”, resztom ujemnym „−”. Reszty równe 0 odrzucamy! Otrzymujemy w ten sposób ciąg typu: − − + + + − + − + + − + + + − − − − Obliczmy liczbę serii występujących w otrzymanym ciągu. Serią jest ciąg takich samych znaków (takŜe jednoelementowy) Odczytujemy z tablic dla testu serii i danego poziomu istotności wartość krytyczną N* (zaleŜy ona od liczby znaków „+” i liczby znaków „–” . Hipotezę zerową odrzucamy, jeśli liczba serii Ns jest mniejsza od N*. 5 Wartości kwantyli dla testu serii dla małych prób PrzybliŜone wartości kwantyli dla testu serii dla duŜych prób moŜna obliczyć z wzoru kα = 4n12 n2 2n1 + uα 3 n1 n1 1+ 1 + n2 n2 Hipotezę o liniowości modelu odrzucamy, gdy liczba serii jest mniejsza od wartości kwantyla kα gdzie α jest poziomem istotności testu 6