ε α αα

Transkrypt

ε α αα
Mariusz Plich
Konspekty wykładów z ekonometrii
Budowa i weryfikacja modelu - treść przykładu
W wyniku systematycznych badań popytu na warzywa w pewnym mieście,
otrzymano następujące szeregi czasowe:
— przyrost (zmiany) popytu na warzywa (w zł. na osobę): 2 3 4 1 1 4 6 2 4
3 (zmienna y)
— przyrost (zmiany) dochodu (w setkach zł. na osobę): 1 1 1 1 1 2 2 2 2 2
(zmienna x2)
— przyrost (zmiany) ceny warzyw (w zł.): 0 0 0 1 1 0 0 1 1 1 (zmienna x3)
Polecenia:
1. Oszacuj parametry modelu popytu na warzywa postaci y = α1 + α 2 x 2 + α 3 x3 + ε
2. Zweryfikuj model pod względem statystycznym:
a. Oszacuj i zinterpretuj miary dopasowania modelu:
— średni błąd
— średni błąd procentowy modelu
— współczynnik determinacji
b. Zbadaj autokorelację składnika losowego:
— oblicz współczynnik autokorelacji reszt
— zweryfikuj hipotezę o braku autokorelacji
c. Zbadaj jakość oszacowań parametrów strukturalnych:
— oszacuj błędy średnie ocen parametrów
— zweryfikuj hipotezy o istotności ocen parametrów
3. Zweryfikuj model pod względem merytorycznym:
— oceń sensowność znaków oszacowanych parametrów
— zinterpretuj wartości oszacowanych parametrów i oceń ich sensowność
4. Sporządź prognozę przyrostów popytu na warzywa dla kolejnych trzech
okresów wiedząc, że:
— przewidywane zmiany dochodów wynoszą 3, 4 i 5 zł na osobę
— przewidywane zmiany cen warzyw wynoszą 0, 2 i 4 zł
1
Mariusz Plich
Konspekty wykładów z ekonometrii
Rozwiązanie
Model teoretyczny przyjmuje następującą postać:
y = α 1 + α 2 x 2 + α 3 x3 + ε
gdzie:
yt
― przyrost popytu na warzywa w okresie w okresie
xt 2
― przyrost dochodu na osobę w okresie
xt 3
― przyrost cen warzyw w okresie
α1 , α 2 , α 3
ε
t
t
t
― parametry strukturalne modelu
― składnik losowy
Model empiryczny można zapisać następująco:
yˆ t = αˆ1 + αˆ 2 xt 2 + αˆ 3 xt 3
gdzie:
αˆ1 , αˆ 2 , αˆ 3
― oszacowania parametrów strukturalnych
αˆ1 
αˆ = αˆ 2  - wektor oszacowań parametrów strukturalnych
αˆ 3 
ad 1)
Ponieważ model teoretyczny jest liniowy względem parametrów, można dokonać oszacowania
wielkości jego parametrów strukturalnych
następującym wzorem:
(
αˆ = X T X
)
−1
α za pomocą MNK. Estymator tego wektora dany jest
X T Y . Informacje liczbowe (dane empiryczne) zawarte w
treści zadania zapiszemy w postaci macierzowej
2
Mariusz Plich
Konspekty wykładów z ekonometrii
2 
1
3 
1
 

4 
1
 

1 
1
1 
1
Y= , X=
4 
1
6 
1
 

2 
1
4 
1
 

3
1
1 0
1 0
1 0

1 1
1 1

2 0
2 0

2 1
2 1

2 1 
Wykorzystując powyższe dane wykonujemy następujące obliczenia cząstkowe:
10 15 5
 1,0167 − 0,583 − 0,083
30 




T
−1
T
X X = 15 25 8 , ( X X) = − 0,583 0,4166 − 0,083 , X Y = 49
 5 8 5
− 0,083 − 0,083 0,4166 
11 
T
i otrzymujemy ostatecznie oszacowanie parametrów modelu:
(
T
αˆ = X X
)
−1
 1,0167 − 0,583 − 0,083
X Y = − 0,583 0,4166 − 0,083
− 0,083 − 0,083 0,4166 
T
30  1 
49 =  2 
   
11 − 2
Ostatecznie mamy więc oszacowany model popytu na warzywa postaci:
yˆ t = 1 + 2 xt 2 − 2 xt 3
Ad 2a)
W celu dokonania weryfikacji statystycznej, wykorzystując oszacowany w punkcie 1 model,
należy obliczyć miedzy innymi miary dopasowania modelu do danych empirycznych. Bazują one
na odchyleniach wartości empirycznych (
y ) i teoretycznych ( ŷ ) zmiennej objaśnianej dla
przedziału próby. Aby je obliczyć, trzeba najpierw wyznaczyć wartości teoretyczne zmian
popytu na warzywa według formuły
yˆt = 1 + 2 xt , 2 − 2 xt ,3 (dla t = 1,..., n) . Wartość teoretyczną dla
pierwszej obserwacji wyliczamy następująco:
yˆ1 = 1 + 2 x1, 2 − 2 x1,3 = 1 + 2 ⋅ 1 − 2 ⋅ 0 = 3
3
Mariusz Plich
Konspekty wykładów z ekonometrii
Te, a także szereg innych obliczeń związanych z weryfikacją modelu, można przeprowadzić w
postaci tabelarycznej ― por. Tabela 1.
Tabela 1. Obliczenia robocze do przykładu
Numer
obserwacji (t)
wyraz
wolny
xt , 2
xt ,3
yt
yt
1
1
1
0
2
2
1
1
0
3
1
1
4
1
5
2
et =
2
det =
et −1
et et −1 et − et −1
2
ŷt
y t − yˆ t
et
4
3
-1
1
-
-
-
-
3
9
3
0
0
-1
0
1
1
0
4
16
3
1
1
0
0
1
1
1
1
1
1
1
0
0
1
0
-1
1
1
1
1
1
1
1
0
0
0
0
0
0
6
1
2
0
4
16
5
-1
1
0
0
-1
1
7
1
2
0
6
36
5
1
1
-1
-1
2
4
8
1
2
1
2
4
3
-1
1
1
-1
-2
4
9
1
2
1
4
16
3
1
1
-1
-1
2
4
10
1
2
1
3
9
3
0
0
1
0
-1
1
Razem
10
15
5
30
112
30
0
6
0
-3
1
17
Teraz można obliczyć odchylenia wartości empirycznych i teoretycznych w próbie
et (błędy
modelu, reszty) wg formuły:
et = yt − yˆ t
np.
e1 = y1 − ŷ1 (wszystkie wyniki obliczeń można znaleźć w tabeli 1).
Mając obliczone wielkości błędów w przedziale próby można przystąpić do obliczenia miar
dopasowania modelu do danych empirycznych. W pierwszej kolejności obliczymy sumę
kwadratów reszt:
S = ∑ et2 = 6
t
Na jej podstawie trudno wyciągnąć wnioski o jakości dopasowania modelu, bo jest to miara
nieunormowana i nie poddająca się merytorycznej interpretacji. Jest za to podstawą do
obliczenia średniego błędu modelu, zwanego także odchyleniem standardowym reszt lub
średnim błędem szacunku.
4
det
Mariusz Plich
Konspekty wykładów z ekonometrii
Średni błąd modelu
Se =
S
6
=
= 0,857 = 0,926 ≈ 0,93 zł.
n−k
10 − 3
W powyższym wzorze
n oznacza liczbę obserwacji, na podstawie których dokonano oszacowania
parametrów modelu (liczebność próby), która wynosi w naszym przykładzie 10. Wielkość
k
oznacza liczbę szacowanych w modelu parametrów, czyli w naszym przykładzie będzie to 3.
Warto zauważyć, że różnica
n-k określana jest jako liczba stopni swobody oraz, że niektóre
programy komputerowe wyliczają średni błąd modelu w odmienny sposób, tj.:
Se =
S
, co nie zmienia interpretacji tej wielkości.
n
Interpretacja: obliczona wartość średniego błędu modelu oznacza, że przewidywania zmian
popytu na warzywa (tj. zmiennej objaśnianej przez model) sporządzane dla przedziału próby na
podstawie oszacowanego modelu różnią się średnio od wartości empirycznych tej zmiennej o
0,93 zł.
Średni błąd procentowy modelu
VSe % =
Se
⋅ 100% = 30,9%
Y
Interpretacja: przewidywania zmian popytu na warzywa sporządzane na podstawie
oszacowanego modelu dla przedziału próby różnią się średnio od wartości empirycznych o
30,9% średniej wartości zmian popytu na warzywa.
Współczynnik determinacji
∑ ( yt − y )
2
= ∑ yt 2 − ny 2
t
R2 = 1−
t
S
∑ yt 2 − ny 2
=1−
6
6
= 1−
= 0,72(72) ≈ 0,73
112 − 10 ⋅ 3 ⋅ 3
22
t
5
Mariusz Plich
Konspekty wykładów z ekonometrii
Interpretacja: zmiany dochodów i cen (model) w 73% objaśniają wahania zmian popytu na
warzywa (zmiennej objaśnianej).
Ad 2b)
Przyczyny występowania autokorelacji składnika losowego:
— pominięcie istotnej zmiennej objaśniającej,
— dłuższe niż 1 okres działanie czynników przypadkowych,
— przyjęcie niewłaściwych opóźnień zmiennych objaśniających,
— przyjęcie niewłaściwej postaci funkcyjnej.
Współczynnik autokorelacji reszt
n
cov( y t , y t −1 )
ρˆ =
=
D 2 ( y t −1 )
∑e e
t t −1
t =2
n
∑e
=
2
−3
= −0,6
5
t
t =2
Test Durbina–Watsona
Stawiamy hipotezę zerową mówiącą o braku autokorelacji składników losowych w modelu,
podczas gdy hipoteza alternatywna stwierdza, że występuje autokorelacja ujemna (ze względu
na współczynnik autokorelacji obliczonego na podstawie próby).
H0 : ρ = 0
H1 : ρ < 0
Zweryfikujemy hipotezę zerową za pomocą testu Durbina–Watsona na poziomie istotności 0,05.
Sprawdzianem w tym teście jest statystyka DW:
n
∑ (et − et −1 )2
DW =
t =2
S
Wartości krytyczne
=
17
= 2,83
6
dl i du odczytujemy z tablic rozkładu DW, której fragment pokazuje tabela
2, a na ich podstawie obliczamy wartości dl ' = 4 − dl oraz du ' = 4 − du , otrzymując:
dl=0,697;
du=1,641
du'=2,359
dl'=3,303.
Zauważmy, że na poziomie istotności 0,05 wartość sprawdzianu z próby wynosząca 2,83
znalazła się pomiędzy wartościami du’ i dl’.
du ' < DW < dl '
6
Mariusz Plich
Konspekty wykładów z ekonometrii
czyli w obszarze niekonkluzywności. Oznacza to, że na podstawie tego testu nie można podjąć
decyzji o występowaniu bądź braku autokorelacji w rozważanym modelu.
Tabela 2. Wartości krytyczne statystyki Durbina-Watsona ( α
(k ― liczba szacowanych parametrów,
n ― liczba obserwacji)
k=2
n
6
7
8
9
10
11
12
13
14
15
= 0,05 )
k=3
dl
du
dl
du
0,61
0,70
0,73
0,82
0,88
0,93
0,97
1,01
1,04
1,08
1,40
1,36
1,33
1,32
1,32
1,32
1,33
1,34
1,35
1,36
0,47
0,56
0,63
0,70
0,76
0,81
0,86
0,91
0,95
1,90
1,78
1,70
1,64
1,60
1,58
1,56
1,55
1,54
Źródło: www.stanford.edu/~clint/bench/dwcrit.htm
Ad 2c)
Średnie błędy ocen parametrów
Średnie błędy ocen parametrów wyznacza się według wzoru:
S α̂ j = S e c jj
[c ] = (X X) , co oznacza, że wielkości c to kolejne elementy głównej przekątnej
macierzy (X X ) . Średni błąd dla oszacowania parametru α wynosi więc:
gdzie
−1
T
ij
jj
T
−1
0
Sαˆ1 = Se c11 = 0,926 ⋅ 1,0166 = 0,934
a dla pozostałych parametrów odpowiednio
Sαˆ 2 = 0,5976 i Sαˆ 3 = 0,5976
Test istotności ocen parametrów
Test przeprowadzamy oddzielnie dla każdego z parametrów według następującego schematu:
Stawiamy hipotezę zerową mówiącą o tym, że parametr
αj
jest równy 0 (hipoteza o
nieistotności parametru) wobec hipotezy alternatywnej, że parametr
αj
jest różny od 0
(parametr jest istotny pod względem statystycznym). Uwaga! hipoteza alternatywna może być
sformułowana również w postaci
αj <0
lub
αj >0
7
Mariusz Plich
Konspekty wykładów z ekonometrii
H0 :α j = 0
H1 : α j ≠ 0
Hipotezę zerową zweryfikujemy na poziomie istotności 0,05 przy dwustronnym obszarze
odrzucenia (co wynika z postaci hipotezy alternatywnej). Sprawdzianem w tym teście jest
statystyka postaci:
αˆ j
tαˆ j =
Sαˆ j
,
n − k = 10 − 3 = 7 stopniach swobody.
która ma rozkład t-Studenta o
Wartość krytyczna odczytana z tablic rozkładu t-Studenta dla 7 stopni swobody wynosi
t 0, 05 = 2,365 .
Obliczamy wartość sprawdzianu w próbie dla parametru
tαˆ1 =
αˆ1
Sαˆ1
=
α1 :
1
= 1,071
0,934
Dla pozostałych parametrów wartości sprawdzianu wynoszą odpowiednio tαˆ
2
= 3,347
tαˆ 3 = −3,347 .
Porównując wartość sprawdzianu dla parametru
α1
z wartością krytyczną zauważamy, że
tαˆ1 < t0,05 bo 1,071 < 2,365
Stwierdzamy więc, że na poziomie istotności 0,05 nie ma podstaw do odrzucenia hipotezy
zerowej mówiącej o tym, że parametr
α1
w badanym modelu jest nieistotny pod względem
statystycznym (wyraz wolny nie jest istotny).
W przypadku parametrów
α2
i
α 3 między wartościami sprawdzianów a wartością krytyczną
zachodzą następujące relacje:
tα 2 > t0,05
oraz
tα 3 > t0,05
Zarówno w przypadku parametru
bo
α2
jak i
3,347 > 2,365
α3
stwierdzamy więc, że na poziomie istotności 0,05
odrzucamy hipotezy zerowe i przyjmujemy hipotezy alternatywne, mówiące o tym, że
8
Mariusz Plich
parametry
α2
Konspekty wykładów z ekonometrii
i
α3
w badanym modelu są istotne pod względem statystycznym, a to oznacza,
że zmienne z nimi związane, tj. zmiany dochodów i zmiany cen są istotne.
Ad 3)
Ocena znaków parametrów przy zmiennych objaśniających:
— dodatni znak przy dochodach oznacza, że wzrost dochodu powoduje wzrost popytu na
warzywa; reakcja popytu na zmianę dochodów odzwierciedlona w modelu jest więc
zgodna z teorią ekonomii;
— ujemny znak przy cenie oznacza, że wzrost ceny powoduje spadek popytu na warzywa;
reakcja popytu na zmianę ceny odzwierciedlona w modelu jest więc zgodna z teorią
ekonomii.
Interpretacja parametrów modelu.
Oszacowany model ma postać liniową, a więc parametry stojące przy poszczególnych
zmiennych interpretuje się jako zmiany krańcowe.
— wzrost dochodów na osobę o 100 zł. powoduje wzrost popytu na warzywa o 2 zł. na
osobęł
— wzrost ceny warzyw o 1 zł. powoduje spadek popytu na warzywa o 2 zł. na osobę.
Wyraz wolny interpretuje się jako wartość zmiennej objaśnianej przy założeniu, że wszystkie
zmienne są równe 0. Nie w każdym modelu przyjęcie takiego założenia ma sens. Ponieważ
zmienne objaśniające naszego modelu zdefiniowane są jako zmiany dochodów i zmiany cen,
można powiedzieć, że jeśli dochody i ceny nie zmieniają (tj. jeśli ich zmiany wynoszą 0) to
popyt na warzywa rośnie (z okresu na okres) o 1 zł. na osobę.
Ad 4)
Założenia prognozowania na podstawie modelu ekonometrycznego.
— znana i stabilna postać rozkładu składnika losowego (struktury stochastycznej modelu);
— znana i stabilna postać analityczna modelu i jego parametrów;
— znane wartości zmiennych objaśniających w okresie prognozowanym (z planów, z
ekstrapolacji trendów, z innych modeli).
Sporządzenie prognozy polega na użyciu przewidywanych na kolejne okresy wartości zmiennych
objaśniających i wyliczeniu wartości zmiennej objaśnianej zgodnie z formułą modelu, tj.
yˆt = 1 + 2 xt , 2 − 2 xt ,3 . Na przykład, wartość prognozy dla okresu 11 obliczamy następująco:
yˆ11 = 1 + 2 ⋅ 3 − 2 ⋅ 0 = 7
9
Mariusz Plich
Konspekty wykładów z ekonometrii
Na podstawie modelu przewidujemy, że przyrost popytu na warzywa w badanej populacji będzie
wynosić 7 zł na osobę. Wyniki obliczeń dla wszystkich okresów prognozowanych okresów
przedstawia poniższa tabela:
Tabela 3. Obliczenia robocze do przykładu
Numer
okresu
Wartości zmiennych
objaśniających
Prognoza
popytu ( ŷ )
Dochód ( x2 )
Cena ( x3 )
11
3
0
7
12
4
2
5
13
5
4
3
10