ANALIZA DYNAMIKI ZJAWISK (dok.) WYGŁADZANIE szeregu

Transkrypt

ANALIZA DYNAMIKI ZJAWISK (dok.) WYGŁADZANIE szeregu
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[1]
ANALIZA DYNAMIKI ZJAWISK
(dok.)
1. szereg czasowy, chronologiczny (momentów, okresów)
2. średni poziom zjawiska w czasie (średnia arytmetyczna,
średnia chronologiczna)
3. miary dynamiki (indeksy indywidualne, agregatowe)
4. średnie tempo zmian zjawiska w czasie
5. wygładzanie szeregu czasowego (mechaniczne,
analityczne)
6. analiza wahań okresowych (wskaźniki sezonowości)
WYGŁADZANIE szeregu czasowego
Wygładzanie jest to zabieg prowadzący do:
• eliminacji wahań i do
• wyodrębnienia tendencji rozwojowej badanego zjawiska
(tendencja rosnąca, malejąca bądź stabilizacja).
Szeregi czasowe wygładzamy stosując metody:
1. mechaniczną (wykorzystanie średnich ruchomych) oraz
2. analityczną (dopasowanie odpowiedniej funkcji do
danych szeregu czasowego).
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[2]
Wygładzanie MECHANICZNE
(średnie ruchome k-okresowe)
Oznaczmy kolejne wartości szeregu czasowego:
y1 , y2 , y3 ,L, yn −2 , yn −1 , yn
Średnie ruchome wyznaczamy róŜnie w zaleŜności od ich długości (k).
Inaczej gdy k jest nieparzyste, np. k = 3, 5, 7, itd.
Inaczej zaś gdy k jest parzyste, np. k = 2, 4, 6, itd.
Gdy k jest nieparzyste (np. k=3), to średnie ruchome
wyznacza się następująco:
y1 + y2 + y3
y2 + y3 + y4
y2 =
y3 =
3
3
,
,
yn −2 + yn −1 + yn
yn −1 =
3
itd. aŜ do przedostatniego okresu
ZauwaŜmy, Ŝe przy k=3 straciliśmy jedną informację na początku i jedną na
końcu szeregu czasowego (1+1=2 straty).
Przy k=5 straty wyniosą juŜ 2+2=4, a przy k=7 wyniosą aŜ 3+3=6.
REGUŁA: im dłuŜsza średnia ruchoma (im większe k), tym
większe straty na informacji, ale za to lepsze wygładzenie i
moŜliwość zaobserwowania tendencji rozwojowej badanego
zjawiska.
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
Gdy k jest parzyste (np. k=4), to średnie ruchome
wyznacza się następująco (tzw. średnia scentrowana):
1
1
y1 + y 2 + y 3 + y 4 + y 5
2
y3 = 2
,
4
1
1
y2 + y3 + y4 + y5 + y6
2
y4 = 2
,
itd. aŜ do
4
1
1
yn−4 + yn−3 + yn −2 + yn−1 + yn
2
yn − 2 = 2
4
PRZYKŁAD 1
Obroty ( yt ) firmy ALFA [w tys. zł] w ciągu 12 kolejnych okresów (t)
przedstawia poniŜsza tabela. W dwóch ostatnich kolumnach pokazano
średnie ruchome o róŜnej długości (k nieparzyste i parzyste)
okres
obroty
t
1
2
3
4
5
6
7
8
9
10
11
12
yt
121
146
132
204
132
212
192
211
209
303
247
316
średnie ruchome
nieparzyste
parzyste
k=3
k=5
k=4
k=6
x
x
x
x
133
x
x
x
161
147
152
x
156
165
162
164
183
174
178
175
179
190
186
187
205
191
196
202
204
225
217
219
241
232
236
238
253
257
256
x
289
x
x
x
x
x
x
x
[3]
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
Obroty firmy ALFA
(wygładzanie k nieparzyste)
350
yt
300
k=3
250
k=5
200
150
100
50
0
1
2
3
4
5
6
7
8
9
10
11
12
10
11
12
Obroty firmy ALFA
(wygładzanie k parzyste)
350
yt
300
k=4
250
k=6
200
150
100
50
0
1
2
3
4
5
6
7
8
9
[4]
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[5]
Wygładzanie ANALITYCZNE
(liniowa funkcja TRENDU)
Wygładzanie szeregu czasowego polega tutaj na oszacowaniu liniowej funkcji
trendu:
yˆ t = at + b
Nieznane parametry a i b wyliczamy na podstawie danych z szeregu
czasowego stosując następujące wzory:
n
∑ (t − t )( y
t
a=
− y)
t =1
n
2
(
)
t
−
t
∑
t =1
b = y − at
a – oznacza okresowe tempo wzrostu (a>0) lub ubytku (a<0) wielkości
badanego zjawiska
b – oznacza stan zjawiska w okresie wyjściowym (tzn. dla t=0)
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
PRZYKŁAD 2
W tabeli zawarte są obliczenia pomocnicze przy wyznaczaniu liniowej
funkcji trendu dla obrotów firmy ALFA.
W ostatniej kolumnie pokazano teoretyczne wartości obrotów wyliczone na
podstawie oszacowanej funkcji trendu.
(1)
(2)
t
yt
1
2
3
4
5
6
7
8
9
10
11
12
121
146
132
204
132
212
192
211
209
303
247
316
(3)
(4)
(t − t ) ( yt − y )
78 2425
-5,5
-4,5
-3,5
-2,5
-1,5
-0,5
0,5
1,5
2,5
3,5
4,5
5,5
-81
-56
-70
2
-70
10
-10
9
7
101
45
114
x
x
78
t=
= 6,5
12
2246,5
a=
= 15,7
143
(5)
(6)
(7)
(3)*(4)
(t − t )2
ŷt
445,5
252,0
245,0
-5,0
105,0
-5,0
-5,0
13,5
17,5
353,5
202,5
627,0
30,25
20,25
12,25
6,25
2,25
0,25
0,25
2,25
6,25
12,25
20,25
30,25
2246,5 143,00
116
131
147
163
179
194
210
226
241
257
273
288
x
2425
y=
= 202
12
b = 202 − 15,7 × 6,5 = 100
Zatem funkcja trendu opisująca obroty firmy ALFA ma postać:
yˆt = 15,7 t + 100
[6]
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
Do oceny dopasowania linii trendu do danych empirycznych (rzeczywiste
2
obroty firmy ALFA) słuŜy współczynnik zbieŜności (ϕ ):
n
ϕ2 =
2
ˆ
(
)
y
−
y
∑ t t
t =1
n
∑(y
− y)
2
t
0 ≤ ϕ2 ≤ 1
gdzie
t =1
2
Im ϕ jest bliŜszy 0, tym dopasowanie jest lepsze.
2
Popularniejszą miarą dopasowania jest współczynnik determinacji (R ):
R 2 = 1 − ϕ2
0 ≤ R2 ≤ 1
gdzie
2
Tutaj im R jest bliŜszy 1, tym dopasowanie jest lepsze.
2
Popularna interpretacja R :
2
liniowa funkcja trendu w (R ×100)% opisuje kształtowanie się badanego
zjawiska.
yt
Liniowy (yt)
Obroty firmy ALFA
(wygładzanie trendem)
350
300
yt = 15,7 t + 100
250
200
150
100
50
0
1
2
3
4
5
6
7
8
9
10
11
12
[7]
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[8]
(c.d. przykładu 2)
PRZYKŁAD 3
W tabeli zawarte są obliczenia pomocnicze przy wyliczaniu współczynnika
2
zbieŜności (ϕ ) dla liniowej funkcji trendu obrotów firmy ALFA.
Przypomnijmy, Ŝe średni kwartalny poziom obrotów w firmie ALFA
wyniósł:
y=
(1)
(2)
(3)
t
yt
ŷt
1
2
3
4
5
6
7
8
9
10
11
12
121
146
132
204
132
212
192
211
209
303
247
316
116
131
147
163
179
194
210
226
241
257
273
288
razem
ϕ2 =
9838
= 0,218
45053
(4)
2425
= 202
12
(5)
(6)
(7)
( yt − yˆt ) ( yt − y ) ( yt − yˆt )2 ( yt − y )2
5
15
-15
41
-47
18
-18
-15
-32
46
-26
28
x
-81
-56
-70
2
-70
10
-10
9
7
101
45
114
25
225
225
1681
2209
324
324
225
1024
2116
676
784
6561
3136
4900
4
4900
100
100
81
49
10201
2025
12996
x
9838
45053
R 2 = 1 − 0,218 = 0,782
yˆ = 15,7 t + 100
t
Liniowa funkcja trendu
wygładzająca
wahania przypadkowe opisuje obroty firmy ALFA w 78,2% (R2=0,782).
Wartość współczynnika determinacji R2 zauwaŜalnie odbiega od jedności (1).
WNIOSEK:
obok wahań przypadkowych występują równieŜ inne wahania,
np. wahania sezonowe (cykliczne).
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[9]
Analiza WAHAŃ OKRESOWYCH
Aby wyodrębnić wahania sezonowe (cykliczne) w szeregu o n okresach
dzielimy ten szereg na s cykli.
Podział musi być taki, aby w kaŜdym cyklu występowała stała liczba k faz.
Działania mające na celu wyodrębnienie wahań sezonowych są następujące:
{ }
1. Wygładzamy szereg czasowy yt analitycznie (lub mechanicznie
średnią ruchomą k-okresową).
Na podstawie wyznaczonej funkcji trenu obliczamy wartości
{ }
teoretyczne ŷt .
2. Uwalniamy szereg czasowy od trendu. W tym celu wyliczamy
wielkości wt
i sezonowe.
= yt yˆ t . Wielkości te zawierają wahania przypadkowe
3. Pozbywamy się wahań przypadkowych w wielkościach
wt .
W tym celu dla jednoimiennych okresów i (tj. okresów naleŜących do
tej samej fazy) wyliczamy ich średnią arytmetyczną
s −1
∑w
i + j ×k
ci' =
j =0
s
( dla kaŜdej fazy
i=1, 2, ... ,k ).
Są to tzw. SUROWE wskaźniki sezonowości.
INTERPRETACJA (wskaźnik surowy – 1)×
×100% :
”O ile procent poziom zjawiska w danej fazie cyklu jest wyŜszy (znak
plus) lub niŜszy (znak minus) od poziomu jaki byłby osiągnięty, gdyby
nie było wahań cyklicznych, a rozwój następował zgodnie z trendem”.
4. Suma takich wskaźników dla wszystkich faz powinna być równa k.
JeŜeli tak nie jest, to naleŜy surowe wskaźniki sezonowości podzielić
przez odpowiedni współczynnik korygujący (= [suma wskaźników
surowych] / k). Otrzymamy w ten sposób
CZYSTE wskaźniki sezonowości.
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
(c.d. przykładu 3)
Liczba okresów w szeregu czasowym n=12
[10]
PRZYKŁAD 4
(12 danych kwartalnych o
obrotach firmy ALFA).
Liczba cykli s=3 (bo szereg opisuje dane kwartalne przez 3 lata).
Liczba faz w kaŜdym cyklu k=4 (bo w kaŜdym roku są 4 kwartały).
(1)
(2)
(3)
t
yt
ŷt
1
2
3
4
5
6
7
8
9
10
11
12
razem
121
146
132
204
132
212
192
211
209
303
247
316
x
116
131
147
163
179
194
210
226
241
257
273
288
x
(4)
(5)
(6)
(7)
(8)
(9)
yt
kwartał
I
II
III
IV
yˆt
1,04
I
1,04
1,11
II
1,11
0,90 III
0,90
1,25
IV
1,25
0,74
I
0,74
1,09
II
1,09
0,91 III
0,91
0,93
IV
0,93
0,87
I
0,87
1,18
II
1,18
0,90 III
0,90
1,10
IV
1,10
x
x
2,65 3,38 2,71 3,28
SUROWE wskaźniki sezonowości 0,883 1,127 0,903 1,093
Σ 4,006 Σ / 4 1,0015
CZYSTE wskaźniki sezonowości 0,882 1,125 0,902 1,091
Surowe wskaźniki sezonowości:
2,65 / 3=0,883;
3,38 / 3=1,127;
2,71 / 3=0,903;
3,28 / 3=1,093
Suma surowych wskaźników sezonowości wynosi: 4,006
Współczynnik korygujący:
4,006 /4 = 1,0015
Czyste wskaźniki sezonowości:
1,127 / 1,0015=1,125
0,903 / 1,0015=0,902
0,833 / 1,0015=0,882
1,093 / 1,0015=1,091
Suma czystych wskaźników sezonowości wynosi:
4,000
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[11]
JeŜeli pomnoŜymy w kaŜdym okresie teoretyczny poziom zjawiska ŷt przez
odpowiedni dla danego okresu wskaźnik sezonowości, to otrzymamy
teoretyczny poziom zjawiska uwzględniający wahania sezonowe.
PRZYKŁAD 5
(c.d. przykładu 4)
Wyznaczymy prognozę obrotów firmy ALFA na kolejny rok (4 kolejne
kwartały: 13, 14, 15 i 16) wykorzystując funkcję trendu
yˆt = 15,7 t + 100
oraz czyste wskaźniki sezonowości (0,882 dla
kwartałów I; 1,125 dla II; 0,902 dla III oraz 1,091 dla kwartałów IV).
(1)
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)
(3)
dane
dane
teoretyczne
rzeczywiste
z trendu
yt
ŷt
(4)
kwartał
(5)
(6)
dane
teoretyczne
wskaźniki
skorygowane
sezonowości
121
116
I
0,882
146
131
II
1,125
132
147
III
0,902
204
163
IV
1,091
132
179
I
0,882
212
194
II
1,125
192
210
III
0,902
211
226
IV
1,091
209
241
I
0,882
303
257
II
1,125
247
273
III
0,902
316
288
IV
1,091
PROGNOZY dla kolejnych kwartałów
?
304
I
0,882
?
320
II
1,125
?
336
III
0,902
?
351
IV
1,091
ŷt
102
147
133
178
158
218
189
247
213
289
246
314
268
360
303
383
D. Miszczyńska,M.Miszczyński, Materiały do wykładu 6 ze Statystyki, 2009/10
[12]
Obroty firmy ALFA
(wygładzanie,sezonowość, prognozy)
400
rzeczywiste
350
trend
trend z sezon.
300
250
PROGNOZA
200
150
100
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
W domu: Dla danych z kolumn (2) i (6) ostatniej tabeli (t=1,2,...,12) – strona 11; policz
współczynnik zbieŜności i współczynnik determinacji (gotowa tabela poniŜej).
Sprawdź o ile poprawiło się dopasowanie na skutek uwzględnienia sezonowości.
(1)
(2)
t
yt
1
2
3
4
5
6
7
8
9
10
11
12
121
146
132
204
132
212
192
211
209
303
247
316
razem
(3)
ŷt
Skor.sez.
(4)
(5)
(6)
(7)
( yt − yˆt ) ( yt − y ) ( yt − yˆt )2 ( yt − y )2
102
147
133
178
158
218
189
247
213
289
246
314
19
-1
-1
26
-26
-6
3
-36
-4
14
1
2
x
ϕ2 =
0,073
-81
-56
-70
2
-70
10
-10
9
7
101
45
114
x
361
1
1
676
676
36
9
1296
16
196
1
4
6561
3136
4900
4
4900
100
100
81
49
10201
2025
12996
3273
45053
R2 =
0,927