ANALIZA DYNAMIKI ZJAWISK (dok.) WYGŁADZANIE szeregu
Transkrypt
ANALIZA DYNAMIKI ZJAWISK (dok.) WYGŁADZANIE szeregu
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [1] ANALIZA DYNAMIKI ZJAWISK (dok.) 1. szereg czasowy, chronologiczny (momentów, okresów) 2. średni poziom zjawiska w czasie (średnia arytmetyczna, średnia chronologiczna) 3. miary dynamiki (indeksy indywidualne, agregatowe) 4. średnie tempo zmian zjawiska w czasie 5. wygładzanie szeregu czasowego (mechaniczne, analityczne) 6. analiza wahań okresowych (wskaźniki sezonowości) WYGŁADZANIE szeregu czasowego Wygładzanie jest to zabieg prowadzący do: • eliminacji wahań i do • wyodrębnienia tendencji rozwojowej badanego zjawiska (tendencja rosnąca, malejąca bądź stabilizacja). Szeregi czasowe wygładzamy stosując metody: 1. mechaniczną (wykorzystanie średnich ruchomych) oraz 2. analityczną (dopasowanie odpowiedniej funkcji do danych szeregu czasowego). D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [2] Wygładzanie MECHANICZNE (średnie ruchome k-okresowe) Oznaczmy kolejne wartości szeregu czasowego: y1 , y2 , y3 ,L, yn −2 , yn −1 , yn Średnie ruchome wyznaczamy róŜnie w zaleŜności od ich długości (k). Inaczej gdy k jest nieparzyste, np. k = 3, 5, 7, itd. Inaczej zaś gdy k jest parzyste, np. k = 2, 4, 6, itd. Gdy k jest nieparzyste (np. k=3), to średnie ruchome wyznacza się następująco: y1 + y2 + y3 y2 + y3 + y4 y2 = y3 = 3 3 , , yn −2 + yn −1 + yn yn −1 = 3 itd. aŜ do przedostatniego okresu ZauwaŜmy, Ŝe przy k=3 straciliśmy jedną informację na początku i jedną na końcu szeregu czasowego (1+1=2 straty). Przy k=5 straty wyniosą juŜ 2+2=4, a przy k=7 wyniosą aŜ 3+3=6. REGUŁA: im dłuŜsza średnia ruchoma (im większe k), tym większe straty na informacji, ale za to lepsze wygładzenie i moŜliwość zaobserwowania tendencji rozwojowej badanego zjawiska. D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 Gdy k jest parzyste (np. k=4), to średnie ruchome wyznacza się następująco (tzw. średnia scentrowana): 1 1 y1 + y 2 + y 3 + y 4 + y 5 2 y3 = 2 , 4 1 1 y2 + y3 + y4 + y5 + y6 2 y4 = 2 , itd. aŜ do 4 1 1 yn−4 + yn−3 + yn −2 + yn−1 + yn 2 yn − 2 = 2 4 PRZYKŁAD 1 Obroty ( yt ) firmy ALFA [w tys. zł] w ciągu 12 kolejnych okresów (t) przedstawia poniŜsza tabela. W dwóch ostatnich kolumnach pokazano średnie ruchome o róŜnej długości (k nieparzyste i parzyste) okres obroty t 1 2 3 4 5 6 7 8 9 10 11 12 yt 121 146 132 204 132 212 192 211 209 303 247 316 średnie ruchome nieparzyste parzyste k=3 k=5 k=4 k=6 x x x x 133 x x x 161 147 152 x 156 165 162 164 183 174 178 175 179 190 186 187 205 191 196 202 204 225 217 219 241 232 236 238 253 257 256 x 289 x x x x x x x [3] D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 Obroty firmy ALFA (wygładzanie k nieparzyste) 350 yt 300 k=3 250 k=5 200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 10 11 12 Obroty firmy ALFA (wygładzanie k parzyste) 350 yt 300 k=4 250 k=6 200 150 100 50 0 1 2 3 4 5 6 7 8 9 [4] D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [5] Wygładzanie ANALITYCZNE (liniowa funkcja TRENDU) Wygładzanie szeregu czasowego polega tutaj na oszacowaniu liniowej funkcji trendu: yˆ t = at + b Nieznane parametry a i b wyliczamy na podstawie danych z szeregu czasowego stosując następujące wzory: n ∑ (t − t )( y t a= − y) t =1 n 2 ( ) t − t ∑ t =1 b = y − at a – oznacza okresowe tempo wzrostu (a>0) lub ubytku (a<0) wielkości badanego zjawiska b – oznacza stan zjawiska w okresie wyjściowym (tzn. dla t=0) D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 PRZYKŁAD 2 W tabeli zawarte są obliczenia pomocnicze przy wyznaczaniu liniowej funkcji trendu dla obrotów firmy ALFA. W ostatniej kolumnie pokazano teoretyczne wartości obrotów wyliczone na podstawie oszacowanej funkcji trendu. (1) (2) t yt 1 2 3 4 5 6 7 8 9 10 11 12 121 146 132 204 132 212 192 211 209 303 247 316 (3) (4) (t − t ) ( yt − y ) 78 2425 -5,5 -4,5 -3,5 -2,5 -1,5 -0,5 0,5 1,5 2,5 3,5 4,5 5,5 -81 -56 -70 2 -70 10 -10 9 7 101 45 114 x x 78 t= = 6,5 12 2246,5 a= = 15,7 143 (5) (6) (7) (3)*(4) (t − t )2 ŷt 445,5 252,0 245,0 -5,0 105,0 -5,0 -5,0 13,5 17,5 353,5 202,5 627,0 30,25 20,25 12,25 6,25 2,25 0,25 0,25 2,25 6,25 12,25 20,25 30,25 2246,5 143,00 116 131 147 163 179 194 210 226 241 257 273 288 x 2425 y= = 202 12 b = 202 − 15,7 × 6,5 = 100 Zatem funkcja trendu opisująca obroty firmy ALFA ma postać: yˆt = 15,7 t + 100 [6] D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 Do oceny dopasowania linii trendu do danych empirycznych (rzeczywiste 2 obroty firmy ALFA) słuŜy współczynnik zbieŜności (ϕ ): n ϕ2 = 2 ˆ ( ) y − y ∑ t t t =1 n ∑(y − y) 2 t 0 ≤ ϕ2 ≤ 1 gdzie t =1 2 Im ϕ jest bliŜszy 0, tym dopasowanie jest lepsze. 2 Popularniejszą miarą dopasowania jest współczynnik determinacji (R ): R 2 = 1 − ϕ2 0 ≤ R2 ≤ 1 gdzie 2 Tutaj im R jest bliŜszy 1, tym dopasowanie jest lepsze. 2 Popularna interpretacja R : 2 liniowa funkcja trendu w (R ×100)% opisuje kształtowanie się badanego zjawiska. yt Liniowy (yt) Obroty firmy ALFA (wygładzanie trendem) 350 300 yt = 15,7 t + 100 250 200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 [7] D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [8] (c.d. przykładu 2) PRZYKŁAD 3 W tabeli zawarte są obliczenia pomocnicze przy wyliczaniu współczynnika 2 zbieŜności (ϕ ) dla liniowej funkcji trendu obrotów firmy ALFA. Przypomnijmy, Ŝe średni kwartalny poziom obrotów w firmie ALFA wyniósł: y= (1) (2) (3) t yt ŷt 1 2 3 4 5 6 7 8 9 10 11 12 121 146 132 204 132 212 192 211 209 303 247 316 116 131 147 163 179 194 210 226 241 257 273 288 razem ϕ2 = 9838 = 0,218 45053 (4) 2425 = 202 12 (5) (6) (7) ( yt − yˆt ) ( yt − y ) ( yt − yˆt )2 ( yt − y )2 5 15 -15 41 -47 18 -18 -15 -32 46 -26 28 x -81 -56 -70 2 -70 10 -10 9 7 101 45 114 25 225 225 1681 2209 324 324 225 1024 2116 676 784 6561 3136 4900 4 4900 100 100 81 49 10201 2025 12996 x 9838 45053 R 2 = 1 − 0,218 = 0,782 yˆ = 15,7 t + 100 t Liniowa funkcja trendu wygładzająca wahania przypadkowe opisuje obroty firmy ALFA w 78,2% (R2=0,782). Wartość współczynnika determinacji R2 zauwaŜalnie odbiega od jedności (1). WNIOSEK: obok wahań przypadkowych występują równieŜ inne wahania, np. wahania sezonowe (cykliczne). D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [9] Analiza WAHAŃ OKRESOWYCH Aby wyodrębnić wahania sezonowe (cykliczne) w szeregu o n okresach dzielimy ten szereg na s cykli. Podział musi być taki, aby w kaŜdym cyklu występowała stała liczba k faz. Działania mające na celu wyodrębnienie wahań sezonowych są następujące: { } 1. Wygładzamy szereg czasowy yt analitycznie (lub mechanicznie średnią ruchomą k-okresową). Na podstawie wyznaczonej funkcji trenu obliczamy wartości { } teoretyczne ŷt . 2. Uwalniamy szereg czasowy od trendu. W tym celu wyliczamy wielkości wt i sezonowe. = yt yˆ t . Wielkości te zawierają wahania przypadkowe 3. Pozbywamy się wahań przypadkowych w wielkościach wt . W tym celu dla jednoimiennych okresów i (tj. okresów naleŜących do tej samej fazy) wyliczamy ich średnią arytmetyczną s −1 ∑w i + j ×k ci' = j =0 s ( dla kaŜdej fazy i=1, 2, ... ,k ). Są to tzw. SUROWE wskaźniki sezonowości. INTERPRETACJA (wskaźnik surowy – 1)× ×100% : ”O ile procent poziom zjawiska w danej fazie cyklu jest wyŜszy (znak plus) lub niŜszy (znak minus) od poziomu jaki byłby osiągnięty, gdyby nie było wahań cyklicznych, a rozwój następował zgodnie z trendem”. 4. Suma takich wskaźników dla wszystkich faz powinna być równa k. JeŜeli tak nie jest, to naleŜy surowe wskaźniki sezonowości podzielić przez odpowiedni współczynnik korygujący (= [suma wskaźników surowych] / k). Otrzymamy w ten sposób CZYSTE wskaźniki sezonowości. D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 (c.d. przykładu 3) Liczba okresów w szeregu czasowym n=12 [10] PRZYKŁAD 4 (12 danych kwartalnych o obrotach firmy ALFA). Liczba cykli s=3 (bo szereg opisuje dane kwartalne przez 3 lata). Liczba faz w kaŜdym cyklu k=4 (bo w kaŜdym roku są 4 kwartały). (1) (2) (3) t yt ŷt 1 2 3 4 5 6 7 8 9 10 11 12 razem 121 146 132 204 132 212 192 211 209 303 247 316 x 116 131 147 163 179 194 210 226 241 257 273 288 x (4) (5) (6) (7) (8) (9) yt kwartał I II III IV yˆt 1,04 I 1,04 1,11 II 1,11 0,90 III 0,90 1,25 IV 1,25 0,74 I 0,74 1,09 II 1,09 0,91 III 0,91 0,93 IV 0,93 0,87 I 0,87 1,18 II 1,18 0,90 III 0,90 1,10 IV 1,10 x x 2,65 3,38 2,71 3,28 SUROWE wskaźniki sezonowości 0,883 1,127 0,903 1,093 Σ 4,006 Σ / 4 1,0015 CZYSTE wskaźniki sezonowości 0,882 1,125 0,902 1,091 Surowe wskaźniki sezonowości: 2,65 / 3=0,883; 3,38 / 3=1,127; 2,71 / 3=0,903; 3,28 / 3=1,093 Suma surowych wskaźników sezonowości wynosi: 4,006 Współczynnik korygujący: 4,006 /4 = 1,0015 Czyste wskaźniki sezonowości: 1,127 / 1,0015=1,125 0,903 / 1,0015=0,902 0,833 / 1,0015=0,882 1,093 / 1,0015=1,091 Suma czystych wskaźników sezonowości wynosi: 4,000 D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [11] JeŜeli pomnoŜymy w kaŜdym okresie teoretyczny poziom zjawiska ŷt przez odpowiedni dla danego okresu wskaźnik sezonowości, to otrzymamy teoretyczny poziom zjawiska uwzględniający wahania sezonowe. PRZYKŁAD 5 (c.d. przykładu 4) Wyznaczymy prognozę obrotów firmy ALFA na kolejny rok (4 kolejne kwartały: 13, 14, 15 i 16) wykorzystując funkcję trendu yˆt = 15,7 t + 100 oraz czyste wskaźniki sezonowości (0,882 dla kwartałów I; 1,125 dla II; 0,902 dla III oraz 1,091 dla kwartałów IV). (1) t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 (2) (3) dane dane teoretyczne rzeczywiste z trendu yt ŷt (4) kwartał (5) (6) dane teoretyczne wskaźniki skorygowane sezonowości 121 116 I 0,882 146 131 II 1,125 132 147 III 0,902 204 163 IV 1,091 132 179 I 0,882 212 194 II 1,125 192 210 III 0,902 211 226 IV 1,091 209 241 I 0,882 303 257 II 1,125 247 273 III 0,902 316 288 IV 1,091 PROGNOZY dla kolejnych kwartałów ? 304 I 0,882 ? 320 II 1,125 ? 336 III 0,902 ? 351 IV 1,091 ŷt 102 147 133 178 158 218 189 247 213 289 246 314 268 360 303 383 D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10 [12] Obroty firmy ALFA (wygładzanie,sezonowość, prognozy) 400 rzeczywiste 350 trend trend z sezon. 300 250 PROGNOZA 200 150 100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 W domu: Dla danych z kolumn (2) i (6) ostatniej tabeli (t=1,2,...,12) – strona 11; policz współczynnik zbieŜności i współczynnik determinacji (gotowa tabela poniŜej). Sprawdź o ile poprawiło się dopasowanie na skutek uwzględnienia sezonowości. (1) (2) t yt 1 2 3 4 5 6 7 8 9 10 11 12 121 146 132 204 132 212 192 211 209 303 247 316 razem (3) ŷt Skor.sez. (4) (5) (6) (7) ( yt − yˆt ) ( yt − y ) ( yt − yˆt )2 ( yt − y )2 102 147 133 178 158 218 189 247 213 289 246 314 19 -1 -1 26 -26 -6 3 -36 -4 14 1 2 x ϕ2 = 0,073 -81 -56 -70 2 -70 10 -10 9 7 101 45 114 x 361 1 1 676 676 36 9 1296 16 196 1 4 6561 3136 4900 4 4900 100 100 81 49 10201 2025 12996 3273 45053 R2 = 0,927