Szeregi czasowe i prognozowanie.
Transkrypt
Szeregi czasowe i prognozowanie.
Metody statystyczne w naukach biologicznych 2006-06-02 Wykład: Szeregi czasowe i prognozowanie Analiza dynamiki niesie ze sobą nową jakość. Pozwala ona zbadać rozkład cechy statystycznej w czasie. Szeregi dynamiczne przedstawiają kształtowanie się zjawisk w czasie. Rezultatem prowadzonych badań w czasie jest zgromadzenie zbioru informacji postaci: t, yt. „t” oznacza czas wyrażony w postaci skokowej, godzina, dzień, miesiąc, rok itp. Zaś „yt” oznacza wartość cechy w czasie t. Zbiór par t, yt to tzw. szereg czasowy, dynamiczny, chronologiczny. Jakie zagadnienia mogą być przedmiotem badań? 1. Jak zmienia się zjawisko w czasie? 2. Dlaczego zmienia się w taki sposób? LATA 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 nr Bydło ogółem w kolejny szt. w woj. bydg. czasu (t) (yt) t bydło 419 723 1 2 398 889 3 399 907 4 403 622 5 398 970 6 386 722 7 338 050 8 361 262 9 347 766 10 336 173 Średnia LATA ruchoma =(C1+C2+C3)/3 lata 1976 1977 1978 1979 1980 1981 1982 1983 1984 liczebność 406 173 400 806 400 833 396 438 374 581 362 011 349 026 348 400 340 376 Ad. 1. Za rozwiązanie tego problemu odpowiedzialne są indeksy statystyczne, które to dzielą się na indywidualne oraz agregatowe (opisujące przebieg zjawisk złożonych). a) indywidualne, jednorodne – charakteryzują one dynamikę zjawisk jednorodnych Najprostszym indeksem jest przyrost absolutny lub bezwzględny. ∆y=y1-y0 y1 – poziom zjawiska w badanym okresie, zaś y0 to poziom zjawiska w czasie, który stanowi punkt odniesienia. Przyrost względny: Ty = ∆y y0 Wśród przyrostów względnych wyróżniamy o te stałej podstawie (gdy poziom zjawiska będący punktem odniesienia nie ulega zmianie) i zmiennej, zwane też łańcuchowymi (punktem odniesienia jest moment poprzedzający badany). b) agregatowe opisują zjawiska złożone, nie można ich sumować, wyrażane są raczej w postaci wartości n W Iw = 1 = W0 ∑ q1i ⋅ p1i ∑ q 0i ⋅ p 0i i= 1 n i= 1 Autor: Dariusz Piwczyński 1 Metody statystyczne w naukach biologicznych 2006-06-02 q1i*p1i – wartość dobra w określonym czasie, będąca iloczynem wielkości tego dobra (q 1i) i jego ceny jednostkowej (p1i). Analiza przyczyn składających się na dynamikę zjawiska - jest to kolejny problem związany z badaniem dynamiki zjawisk. Dane zjawisko rozważane jest w czasie, jako efekt działania różnorodnych przyczyn. Różnica między podejściem regresyjnym, korelacyjnym a szeregiem chronologicznym jest zasadnicza. W pierwszym przypadku zmienne są konkretnie określone, zidentyfikowane, z kolei w przypadku analizy dynamiki mówi się o zespołach czynników. Analizując dane statystyczne zestawione w szeregach czasowych prezentowanych w formie wykresów, można zauważyć, że rozwój procesów nie jest równomierny. Wśród przyczyn powodujących zmianę zjawiska w czasie można wyróżnić: przyczyny główne, które działają stale, niezmienne wyznaczające dane zjawisko w czasie. To one wyznaczają tendencję, czyli tzw. trend. Trendy - wyrażają zniżkową lub zwyżkową trwałą tendencję rozwojową, ujawniającą się w danej dziedzinie działalności w ciągu stosunkowo długich okresów przyczyny okresowe, które dzielą się na typu: • koniunkturalnego. Działają co pewien czas, dłuższy niż rok. Związane są z kierunkiem zmian w otoczeniu zjawiska, jakim może być np. gospodarka narodowa • sezonowego - zaliczamy tu różnego rodzaju wahania rytmiczne (okresowe, periodyczne, cykliczne). Cykl obserwowanych zmian powtarza się w mniej więcej tych samych rozmiarach co jakiś okres, w przybliżeniu ten sam: o w. krótkoterminowe - w ciągu dnia, tygodnia, miesiąca o w. sezonowe przypadkowe - nieregularne, nieperiodyczne zmiany w działalności gospodarczej, wyrażają działanie czynników o charakterze losowym. Ich działanie jest nieprzewidywalne,. Analiza szeregu dynamicznego o charakterze przyczynowo-skutkowym polega na: wyróżnieniu tendencji rozwojowej, wykryciu wahań okresowych oraz ustaleniu wahań przypadkowych. Metody wyodrębnienia tendencji rozwojowej: {Tendencja rozwojowa - ogólna dążność badanych wielkości do wzrostu lub spadku, występująca na przestrzeni badanego okresu}. Ze względu na to, iż w szeregu dynamicznym występują różnego rodzaju wahania, spowodowane różnymi przyczynami, do wykazania zmian związanych wyłącznie z tendencją rozwojową, zachodzi konieczność usunięcia tych wahań. Eliminacja wahań przypadkowych i okresowych zwana jest wyrównaniem lub wygładzeniem szeregu statystycznego. Autor: Dariusz Piwczyński 2 Metody statystyczne w naukach biologicznych 2006-06-02 Liczebność bydła w woj.bydgoskim (dawnym) 500 000 400 000 300 000 200 000 100 000 20 18 16 14 12 10 8 6 4 2 t 0 Wyróżniamy dwie metody wyrównania szeregów czasowych: metoda mechaniczna metoda analityczna W metodzie mechanicznej eliminujemy wahania przypadkowe i okresowe poprzez obliczanie średnich ruchomych. Średnia ruchoma jest średnią arytmetyczną z parzystej (średnie scentrowane) lub nieparzystej (średnie zwykłe) liczby kolejnych wyrazów szeregu, np. 2-letnia, 4letnia lub 3-letnia, 5-letnia. Liczba składników średniej arytmetycznej ruchomej powinna odpowiadać wahaniom okresowym lub ich wielokrotności. Przykład obliczenia średniej ruchomej złożonej z 3 elementów: y1, y2, y3, y4 - kolejne wyrazy szeregu czasowego 3 yk = yk − 1 + yk + yk + 1 3 Obliczanie średniej scentrowanej o podstawie 4. 1 1 yk − 2 + yk − 1 + yk + yk + 1 + yk + 2 2 2 4 yk = 4 Im więcej okresów uwzględniamy obliczając średnią ruchomą, tym bardziej wyrównujemy badany szereg, tym lepsza jest eliminacja wahań, ale też tym bardziej ten szereg skracamy. Zaletą mechanicznej metody wygładzania szeregów jest to, że nie wymaga znajomości typu krzywej mającej reprezentować trend, powstaje ona niejako w sposób mechaniczny. Autor: Dariusz Piwczyński 3 Metody statystyczne w naukach biologicznych 2006-06-02 Wyodrębnienie tendencji rozwojowej za pomocą średniej ruchomej 450 000 400 000 350 000 szt. 300 000 250 000 200 000 150 000 100 000 50 000 93 19 91 19 89 19 87 19 85 19 83 19 81 19 79 19 19 la t 77 a 0 lata Innym sposobem wyodrębniania tendencji rozwojowej jest rachunek wygładzania wykładniczego. Metoda analityczna - tendencję rozwojową szeregu dynamicznego wyrażamy za pomocą funkcji matematycznej. Metoda analityczna pozwala na określenie parametrów funkcji, które w sposób syntetyczny określają prawidłowość rozwoju zjawiska. Najprostszą i najczęściej stosowaną postacią trendu jest linia prosta i odpowiadająca jej funkcja pierwszego stopnia. Liczebność bydła w dawnym woj.bydgoskim 450 000 400 000 350 000 szt. 300 000 250 000 200 000 y = -9961x + 436844 150 000 100 000 50 000 20 18 16 14 12 10 8 6 4 2 t 0 kolejne lata Trend liniowy: yt = α ⋅ t + β t - czas w postaci numerów okresów β - poziom badanego zjawiska w okresie zerowym (t=0) α - współczynnik kierunkowy wyrażający przeciętne (roczne, kwartalne, miesięczne) tempo przyrostu (spadku) poziomu zjawiska, to współczynnik trendu. yt - kolejne wyrazy szeregu czasowego, wynikające z funkcji trendu Do oszacowania parametrów α i β stosujemy klasyczną metodę najmniejszych kwadratów, stosując następujący układ równań: ∑ ∑ n y t = nβ + α t= 1 n yt t = β t= 1 n ∑ n ∑ t+ α t= 1 t t= 1 ∑ n t2 t= 1 Autor: Dariusz Piwczyński 4 Metody statystyczne w naukach biologicznych 2006-06-02 yt – empiryczne wartości zjawiska Współczynnik trendu równa się: α = n∑ yt ⋅ t − t ∑ yy ⋅ ∑ t t n⋅ ∑ t2 − ∑ t t t t 2 Wyraz wolny β = y− α ⋅t Średni błąd oszacowania wskazuje, w jaki stopniu poszczególne obserwacje odbiegają od prostej trendu. Jest to pierwiastek kwadratowy ze średniej arytmetycznej kwadratów odchyleń danych empirycznych od danych teoretycznych (trendu) Sy = 1 n− k ∑ n t= 1 ( yt − yt ' ) 2 k - ilość parametrów (α,β) występujących w funkcji trendu Kolejnym, ważnym zagadnieniem jest wyodrębnienie ustalenie wahań okresowych i przypadkowych. Autor: Dariusz Piwczyński 5