ε α αα
Transkrypt
ε α αα
Mariusz Plich Konspekty wykładów z ekonometrii Budowa i weryfikacja modelu - treść przykładu W wyniku systematycznych badań popytu na warzywa w pewnym mieście, otrzymano następujące szeregi czasowe: — przyrost (zmiany) popytu na warzywa (w zł. na osobę): 2 3 4 1 1 4 6 2 4 3 (zmienna y) — przyrost (zmiany) dochodu (w setkach zł. na osobę): 1 1 1 1 1 2 2 2 2 2 (zmienna x2) — przyrost (zmiany) ceny warzyw (w zł.): 0 0 0 1 1 0 0 1 1 1 (zmienna x3) Polecenia: 1. Oszacuj parametry modelu popytu na warzywa postaci y = α1 + α 2 x 2 + α 3 x3 + ε 2. Zweryfikuj model pod względem statystycznym: a. Oszacuj i zinterpretuj miary dopasowania modelu: — średni błąd — średni błąd procentowy modelu — współczynnik determinacji b. Zbadaj autokorelację składnika losowego: — oblicz współczynnik autokorelacji reszt — zweryfikuj hipotezę o braku autokorelacji c. Zbadaj jakość oszacowań parametrów strukturalnych: — oszacuj błędy średnie ocen parametrów — zweryfikuj hipotezy o istotności ocen parametrów 3. Zweryfikuj model pod względem merytorycznym: — oceń sensowność znaków oszacowanych parametrów — zinterpretuj wartości oszacowanych parametrów i oceń ich sensowność 4. Sporządź prognozę przyrostów popytu na warzywa dla kolejnych trzech okresów wiedząc, że: — przewidywane zmiany dochodów wynoszą 3, 4 i 5 zł na osobę — przewidywane zmiany cen warzyw wynoszą 0, 2 i 4 zł 1 Mariusz Plich Konspekty wykładów z ekonometrii Rozwiązanie Model teoretyczny przyjmuje następującą postać: y = α 1 + α 2 x 2 + α 3 x3 + ε gdzie: yt ― przyrost popytu na warzywa w okresie w okresie xt 2 ― przyrost dochodu na osobę w okresie xt 3 ― przyrost cen warzyw w okresie α1 , α 2 , α 3 ε t t t ― parametry strukturalne modelu ― składnik losowy Model empiryczny można zapisać następująco: yˆ t = αˆ1 + αˆ 2 xt 2 + αˆ 3 xt 3 gdzie: αˆ1 , αˆ 2 , αˆ 3 ― oszacowania parametrów strukturalnych αˆ1 αˆ = αˆ 2 - wektor oszacowań parametrów strukturalnych αˆ 3 ad 1) Ponieważ model teoretyczny jest liniowy względem parametrów, można dokonać oszacowania wielkości jego parametrów strukturalnych następującym wzorem: ( αˆ = X T X ) −1 α za pomocą MNK. Estymator tego wektora dany jest X T Y . Informacje liczbowe (dane empiryczne) zawarte w treści zadania zapiszemy w postaci macierzowej 2 Mariusz Plich Konspekty wykładów z ekonometrii 2 1 3 1 4 1 1 1 1 1 Y= , X= 4 1 6 1 2 1 4 1 3 1 1 0 1 0 1 0 1 1 1 1 2 0 2 0 2 1 2 1 2 1 Wykorzystując powyższe dane wykonujemy następujące obliczenia cząstkowe: 10 15 5 1,0167 − 0,583 − 0,083 30 T −1 T X X = 15 25 8 , ( X X) = − 0,583 0,4166 − 0,083 , X Y = 49 5 8 5 − 0,083 − 0,083 0,4166 11 T i otrzymujemy ostatecznie oszacowanie parametrów modelu: ( T αˆ = X X ) −1 1,0167 − 0,583 − 0,083 X Y = − 0,583 0,4166 − 0,083 − 0,083 − 0,083 0,4166 T 30 1 49 = 2 11 − 2 Ostatecznie mamy więc oszacowany model popytu na warzywa postaci: yˆ t = 1 + 2 xt 2 − 2 xt 3 Ad 2a) W celu dokonania weryfikacji statystycznej, wykorzystując oszacowany w punkcie 1 model, należy obliczyć miedzy innymi miary dopasowania modelu do danych empirycznych. Bazują one na odchyleniach wartości empirycznych ( y ) i teoretycznych ( ŷ ) zmiennej objaśnianej dla przedziału próby. Aby je obliczyć, trzeba najpierw wyznaczyć wartości teoretyczne zmian popytu na warzywa według formuły yˆt = 1 + 2 xt , 2 − 2 xt ,3 (dla t = 1,..., n) . Wartość teoretyczną dla pierwszej obserwacji wyliczamy następująco: yˆ1 = 1 + 2 x1, 2 − 2 x1,3 = 1 + 2 ⋅ 1 − 2 ⋅ 0 = 3 3 Mariusz Plich Konspekty wykładów z ekonometrii Te, a także szereg innych obliczeń związanych z weryfikacją modelu, można przeprowadzić w postaci tabelarycznej ― por. Tabela 1. Tabela 1. Obliczenia robocze do przykładu Numer obserwacji (t) wyraz wolny xt , 2 xt ,3 yt yt 1 1 1 0 2 2 1 1 0 3 1 1 4 1 5 2 et = 2 det = et −1 et et −1 et − et −1 2 ŷt y t − yˆ t et 4 3 -1 1 - - - - 3 9 3 0 0 -1 0 1 1 0 4 16 3 1 1 0 0 1 1 1 1 1 1 1 0 0 1 0 -1 1 1 1 1 1 1 1 0 0 0 0 0 0 6 1 2 0 4 16 5 -1 1 0 0 -1 1 7 1 2 0 6 36 5 1 1 -1 -1 2 4 8 1 2 1 2 4 3 -1 1 1 -1 -2 4 9 1 2 1 4 16 3 1 1 -1 -1 2 4 10 1 2 1 3 9 3 0 0 1 0 -1 1 Razem 10 15 5 30 112 30 0 6 0 -3 1 17 Teraz można obliczyć odchylenia wartości empirycznych i teoretycznych w próbie et (błędy modelu, reszty) wg formuły: et = yt − yˆ t np. e1 = y1 − ŷ1 (wszystkie wyniki obliczeń można znaleźć w tabeli 1). Mając obliczone wielkości błędów w przedziale próby można przystąpić do obliczenia miar dopasowania modelu do danych empirycznych. W pierwszej kolejności obliczymy sumę kwadratów reszt: S = ∑ et2 = 6 t Na jej podstawie trudno wyciągnąć wnioski o jakości dopasowania modelu, bo jest to miara nieunormowana i nie poddająca się merytorycznej interpretacji. Jest za to podstawą do obliczenia średniego błędu modelu, zwanego także odchyleniem standardowym reszt lub średnim błędem szacunku. 4 det Mariusz Plich Konspekty wykładów z ekonometrii Średni błąd modelu Se = S 6 = = 0,857 = 0,926 ≈ 0,93 zł. n−k 10 − 3 W powyższym wzorze n oznacza liczbę obserwacji, na podstawie których dokonano oszacowania parametrów modelu (liczebność próby), która wynosi w naszym przykładzie 10. Wielkość k oznacza liczbę szacowanych w modelu parametrów, czyli w naszym przykładzie będzie to 3. Warto zauważyć, że różnica n-k określana jest jako liczba stopni swobody oraz, że niektóre programy komputerowe wyliczają średni błąd modelu w odmienny sposób, tj.: Se = S , co nie zmienia interpretacji tej wielkości. n Interpretacja: obliczona wartość średniego błędu modelu oznacza, że przewidywania zmian popytu na warzywa (tj. zmiennej objaśnianej przez model) sporządzane dla przedziału próby na podstawie oszacowanego modelu różnią się średnio od wartości empirycznych tej zmiennej o 0,93 zł. Średni błąd procentowy modelu VSe % = Se ⋅ 100% = 30,9% Y Interpretacja: przewidywania zmian popytu na warzywa sporządzane na podstawie oszacowanego modelu dla przedziału próby różnią się średnio od wartości empirycznych o 30,9% średniej wartości zmian popytu na warzywa. Współczynnik determinacji ∑ ( yt − y ) 2 = ∑ yt 2 − ny 2 t R2 = 1− t S ∑ yt 2 − ny 2 =1− 6 6 = 1− = 0,72(72) ≈ 0,73 112 − 10 ⋅ 3 ⋅ 3 22 t 5 Mariusz Plich Konspekty wykładów z ekonometrii Interpretacja: zmiany dochodów i cen (model) w 73% objaśniają wahania zmian popytu na warzywa (zmiennej objaśnianej). Ad 2b) Przyczyny występowania autokorelacji składnika losowego: — pominięcie istotnej zmiennej objaśniającej, — dłuższe niż 1 okres działanie czynników przypadkowych, — przyjęcie niewłaściwych opóźnień zmiennych objaśniających, — przyjęcie niewłaściwej postaci funkcyjnej. Współczynnik autokorelacji reszt n cov( y t , y t −1 ) ρˆ = = D 2 ( y t −1 ) ∑e e t t −1 t =2 n ∑e = 2 −3 = −0,6 5 t t =2 Test Durbina–Watsona Stawiamy hipotezę zerową mówiącą o braku autokorelacji składników losowych w modelu, podczas gdy hipoteza alternatywna stwierdza, że występuje autokorelacja ujemna (ze względu na współczynnik autokorelacji obliczonego na podstawie próby). H0 : ρ = 0 H1 : ρ < 0 Zweryfikujemy hipotezę zerową za pomocą testu Durbina–Watsona na poziomie istotności 0,05. Sprawdzianem w tym teście jest statystyka DW: n ∑ (et − et −1 )2 DW = t =2 S Wartości krytyczne = 17 = 2,83 6 dl i du odczytujemy z tablic rozkładu DW, której fragment pokazuje tabela 2, a na ich podstawie obliczamy wartości dl ' = 4 − dl oraz du ' = 4 − du , otrzymując: dl=0,697; du=1,641 du'=2,359 dl'=3,303. Zauważmy, że na poziomie istotności 0,05 wartość sprawdzianu z próby wynosząca 2,83 znalazła się pomiędzy wartościami du’ i dl’. du ' < DW < dl ' 6 Mariusz Plich Konspekty wykładów z ekonometrii czyli w obszarze niekonkluzywności. Oznacza to, że na podstawie tego testu nie można podjąć decyzji o występowaniu bądź braku autokorelacji w rozważanym modelu. Tabela 2. Wartości krytyczne statystyki Durbina-Watsona ( α (k ― liczba szacowanych parametrów, n ― liczba obserwacji) k=2 n 6 7 8 9 10 11 12 13 14 15 = 0,05 ) k=3 dl du dl du 0,61 0,70 0,73 0,82 0,88 0,93 0,97 1,01 1,04 1,08 1,40 1,36 1,33 1,32 1,32 1,32 1,33 1,34 1,35 1,36 0,47 0,56 0,63 0,70 0,76 0,81 0,86 0,91 0,95 1,90 1,78 1,70 1,64 1,60 1,58 1,56 1,55 1,54 Źródło: www.stanford.edu/~clint/bench/dwcrit.htm Ad 2c) Średnie błędy ocen parametrów Średnie błędy ocen parametrów wyznacza się według wzoru: S α̂ j = S e c jj [c ] = (X X) , co oznacza, że wielkości c to kolejne elementy głównej przekątnej macierzy (X X ) . Średni błąd dla oszacowania parametru α wynosi więc: gdzie −1 T ij jj T −1 0 Sαˆ1 = Se c11 = 0,926 ⋅ 1,0166 = 0,934 a dla pozostałych parametrów odpowiednio Sαˆ 2 = 0,5976 i Sαˆ 3 = 0,5976 Test istotności ocen parametrów Test przeprowadzamy oddzielnie dla każdego z parametrów według następującego schematu: Stawiamy hipotezę zerową mówiącą o tym, że parametr αj jest równy 0 (hipoteza o nieistotności parametru) wobec hipotezy alternatywnej, że parametr αj jest różny od 0 (parametr jest istotny pod względem statystycznym). Uwaga! hipoteza alternatywna może być sformułowana również w postaci αj <0 lub αj >0 7 Mariusz Plich Konspekty wykładów z ekonometrii H0 :α j = 0 H1 : α j ≠ 0 Hipotezę zerową zweryfikujemy na poziomie istotności 0,05 przy dwustronnym obszarze odrzucenia (co wynika z postaci hipotezy alternatywnej). Sprawdzianem w tym teście jest statystyka postaci: αˆ j tαˆ j = Sαˆ j , n − k = 10 − 3 = 7 stopniach swobody. która ma rozkład t-Studenta o Wartość krytyczna odczytana z tablic rozkładu t-Studenta dla 7 stopni swobody wynosi t 0, 05 = 2,365 . Obliczamy wartość sprawdzianu w próbie dla parametru tαˆ1 = αˆ1 Sαˆ1 = α1 : 1 = 1,071 0,934 Dla pozostałych parametrów wartości sprawdzianu wynoszą odpowiednio tαˆ 2 = 3,347 tαˆ 3 = −3,347 . Porównując wartość sprawdzianu dla parametru α1 z wartością krytyczną zauważamy, że tαˆ1 < t0,05 bo 1,071 < 2,365 Stwierdzamy więc, że na poziomie istotności 0,05 nie ma podstaw do odrzucenia hipotezy zerowej mówiącej o tym, że parametr α1 w badanym modelu jest nieistotny pod względem statystycznym (wyraz wolny nie jest istotny). W przypadku parametrów α2 i α 3 między wartościami sprawdzianów a wartością krytyczną zachodzą następujące relacje: tα 2 > t0,05 oraz tα 3 > t0,05 Zarówno w przypadku parametru bo α2 jak i 3,347 > 2,365 α3 stwierdzamy więc, że na poziomie istotności 0,05 odrzucamy hipotezy zerowe i przyjmujemy hipotezy alternatywne, mówiące o tym, że 8 Mariusz Plich parametry α2 Konspekty wykładów z ekonometrii i α3 w badanym modelu są istotne pod względem statystycznym, a to oznacza, że zmienne z nimi związane, tj. zmiany dochodów i zmiany cen są istotne. Ad 3) Ocena znaków parametrów przy zmiennych objaśniających: — dodatni znak przy dochodach oznacza, że wzrost dochodu powoduje wzrost popytu na warzywa; reakcja popytu na zmianę dochodów odzwierciedlona w modelu jest więc zgodna z teorią ekonomii; — ujemny znak przy cenie oznacza, że wzrost ceny powoduje spadek popytu na warzywa; reakcja popytu na zmianę ceny odzwierciedlona w modelu jest więc zgodna z teorią ekonomii. Interpretacja parametrów modelu. Oszacowany model ma postać liniową, a więc parametry stojące przy poszczególnych zmiennych interpretuje się jako zmiany krańcowe. — wzrost dochodów na osobę o 100 zł. powoduje wzrost popytu na warzywa o 2 zł. na osobęł — wzrost ceny warzyw o 1 zł. powoduje spadek popytu na warzywa o 2 zł. na osobę. Wyraz wolny interpretuje się jako wartość zmiennej objaśnianej przy założeniu, że wszystkie zmienne są równe 0. Nie w każdym modelu przyjęcie takiego założenia ma sens. Ponieważ zmienne objaśniające naszego modelu zdefiniowane są jako zmiany dochodów i zmiany cen, można powiedzieć, że jeśli dochody i ceny nie zmieniają (tj. jeśli ich zmiany wynoszą 0) to popyt na warzywa rośnie (z okresu na okres) o 1 zł. na osobę. Ad 4) Założenia prognozowania na podstawie modelu ekonometrycznego. — znana i stabilna postać rozkładu składnika losowego (struktury stochastycznej modelu); — znana i stabilna postać analityczna modelu i jego parametrów; — znane wartości zmiennych objaśniających w okresie prognozowanym (z planów, z ekstrapolacji trendów, z innych modeli). Sporządzenie prognozy polega na użyciu przewidywanych na kolejne okresy wartości zmiennych objaśniających i wyliczeniu wartości zmiennej objaśnianej zgodnie z formułą modelu, tj. yˆt = 1 + 2 xt , 2 − 2 xt ,3 . Na przykład, wartość prognozy dla okresu 11 obliczamy następująco: yˆ11 = 1 + 2 ⋅ 3 − 2 ⋅ 0 = 7 9 Mariusz Plich Konspekty wykładów z ekonometrii Na podstawie modelu przewidujemy, że przyrost popytu na warzywa w badanej populacji będzie wynosić 7 zł na osobę. Wyniki obliczeń dla wszystkich okresów prognozowanych okresów przedstawia poniższa tabela: Tabela 3. Obliczenia robocze do przykładu Numer okresu Wartości zmiennych objaśniających Prognoza popytu ( ŷ ) Dochód ( x2 ) Cena ( x3 ) 11 3 0 7 12 4 2 5 13 5 4 3 10