Szymon Bargłowski, sb39345 MODEL

Transkrypt

Szymon Bargłowski, sb39345
MODEL
1. Równania rozpatrywanego modelu:
gdzie:
1
PKB t = a1  a 2 E t  a 3 Invest t  1
2
C t = b 1  b 2 PKBt  b3 Invest t−1  b 4 Gt   2
3
Invest t = d 1  d 2 C t  d 3 Rt  3
G
C
PKB
Invest
E
R
- wydatki rządowe
- konsumpcja
- PKB
- inwestycje
- zatrudnienie
- stopa banku centralnego
Pierwsze równanie opiera się na przypuszczeniu, że PKB w danym okresie
,,wypracowywane jest” głównie przez pracujących ludzi i zainwestowany
kapitał. Drugie równanie zakłada, że na konsumpcję w danym okresie wpływ
ma PKB oraz cześć wydatków rządowych z tego samego okresu (na przykład
świadczenia socjalne) oraz zwracające się inwestycje z poprzedniego okresu
(zakładamy, że część przychodu z inwestycji ludzie przeznaczają na
konsumpcję). Ostatnie równanie opiera się na założeniu, że konsumpcja
zwiększając się wprowadza optymistyczne nastroje wśród inwestorów i
nakłania do zwiększenia inwestycji, natomiast stopa banku centralnego rosnąc
powinna wywoływać zmniejszenie wielkości inwestycji.
Zauważmy, że model jest modelem równań współzależnych, gdyż PKB t
objaśniane jest przez Invest t , Invest t przez C t natomiast C t przez
PKB t . Dla formalności można zauważyć, że macierz B występująca w
postaci strukturalnej naszego modelu wygląda następująco:
1
0 −a 3
PKB t
−b 2 1
0
Ct
dla wektora zmiennych endogenicznych
0 −d 2 1
Invest t
[
]
[ ]
nie jest ona oczywiście macierzą trójkątną ani nie może zostać do niej
sprowadzona poprzez ciąg zamian typu wiersz – wiersz lub
kolumna – kolumna.
2. Sprawdzamy, czy model jest identyfikowalny (podstawowa własność przy
modelach równań współzależnych). Skorzystamy z twierdzenia:
,,Warunkiem koniecznym i wystarczającym, aby i-te równanie
wchodzące w skład modelu o m równaniach łącznie
współzależnych było identyfikowalne, jest by macierz Ai
parametrów znajdujących się przy zmiennych, które są w
modelu, a nie występują w równaniu, którego
identyfikowalność badamy, była rzędu m-1”
Oznaczmy przez k i liczbę zmiennych występujących w modelu, ale nie
występujących w równaniu i ;
badamy pierwsze równanie
warunek wymiaru: k 1 = 4  3 − 1
[
−b 4
1 −b 3 0
0 −d 2 0 −d 3
]
jest rzędu 2 = 3 – 1
zatem równanie jest niejednoznacznie identyfikowalne
badamy druge równanie
[
−a 3 −a 2
0
1
0 −d 3
]
zatem równanie jest niejednoznacznie identyfikowalne
badamy trzecie równanie
[
0
1
0 −a 2
−b 4 −b 2 −b 3 0
]
Każde z trzech równań modelu jest niejednoznacznie identyfikowalne, cały
model jest również niejednoznacznie identyfikowalny.
W dalszej części przetestujemy model na przykładzie Danii
Zakres danych od 1992q01 do 2006q02
Wykresy przedstawiające wykorzystywane przeze mnie zmienne:
3. Estymacja parametrów 2MNK:
Zapisuję układ równań za pomocą składni Gretla:
system name="Szymon's model"
equation PKB const E Invest
equation C const PKB Invest_1 G
equation Invest const C R
endog PKB C Invest
end system
Estymacja tego modelu metodą 2MNK daje następujące rezultaty:
Równanie 1: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: PKB
Instrumenty: Invest_1 G R
Zmienna
const
E
Invest
Współczynnik
50242,5
-13,6281
3,08718
Błąd stand.
16564,1
7,24038
0,345009
Statystyka t
3,033
-1,882
8,948
Wartość p
0,00242 ***
0,05980 *
<0,00001 ***
Srednia arytmetyczna zmiennej zależnej = 37990,6
Odchylenie standardowe zmiennej zależnej = 3536,37
Suma kwadratów reszt = 3,99363e+007
Błąd standardowy reszt = 859,978
Zmienna zależna: C
Instrumenty: E R
Zmienna
const
PKB
Invest_1
G
Współczynnik
1005,19
1,92950
-1,96186
-10,1943
Błąd stand.
5602,72
1,00868
1,63759
7,42099
Statystyka t
0,179
1,913
-1,198
-1,374
Wartość p
0,85762
0,05576 *
0,23091
0,16953
Zmienna zależna: Invest
Instrumenty: E Invest_1 G
Zmienna
const
C
R
Współczynnik
-13807,3
0,733106
139,485
Błąd stand.
1821,48
0,0561108
60,8376
Statystyka t
-7,580
13,065
2,293
Wartość p
<0,00001 ***
<0,00001 ***
0,02186 **
Macierz wariancji i kowariancji dla reszt poszczególnych równań
(skorelowania w nawisach - powyżej elementów diagonalnych)
7,0064e+005 (-0,121)
(-0,503)
-94049,
8,6184e+005
(0,002)
-1,9158e+005
825,90 2,0684e+005
- reszty poszczególnych równań nie są zmiennymi niezależnymi
logarytm wyznacznika = 39,0548
Wnioski:
Na podstawie raportu wygenerowanego przez program Gretl widzimy, że dobór
zmiennych objaśniających poszczególne zmienne endogeniczne był w miarę trafny
(tylko 2 wartości p nie są bardzo małe – dotyczące Invest_1 i G w drugim równaniu).
Z drugiej strony błędy standardowe reszt są dość znaczne. Sprzecznie z
oczekiwaniami współczynnik stojący przy R w trzecim równaniu okazał się być
dodatni. Z teorii makroekonomii wynikałoby, że powinien być on ujemny. Z kolei z
logicznego punktu widzenia współczynnik stojący przy E w pierwszym równaniu
powinien być dodatni, a jest ujemny. Możliwe, że taki stan rzeczy spowodowała zbyt
mała ilość obserwacji, albo po prostu nieoptymalna metoda estymacji równań
współzależnych. Na przykład ,,metoda pozornie niepowiązanych równań” daje
rozsądne wartości współczynników występujących w modelu, a także wyraźnie
mniejsze błędy standardowe reszt. Usunięcie nieistotnej stałej z drugiego równania
sprawia, że wszystkie zmienne w modelu są istotne, jednakże zwiększa błąd
standardowy reszt w drugim równaniu (co nie jest zaskakujące).
Zmienne Invest oraz Invest_1 wyznaczają zbliżone do siebie szeregi czasowe
(zbliżone wartości w poszczególnych okresach), co mogło spowodować, że drugie
równanie okazało się przypominać zależność C = PKB – I – G. Nie udało się zatem
potwierdzić, że na konsumpcję dodatnio wpływają trzy wybrane przeze mnie
zmienne PKB t (interpretowane jako siła gospodarki), I t−1 oraz G t .
4. Weryfikacja założeń dotyczących każdego z równań z osobna
estymowanych oddzielnie KMNK:
PIERWSZE RÓWNANIE:
Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2
Zmienna zależna: PKB
Zmienna
const
E
Invest
Współczynnik
14240,3
2,21797
2,32262
Błąd stand.
10973,7
4,74928
0,218375
Statystyka t
1,298
0,467
10,636
Wartość p
0,19982
0,64234
<0,00001 ***
Średnia arytmetyczna zmiennej zależnej = 37885
Wsp. determinacji R-kwadrat = 0,955523
Skorygowany wsp. R-kwadrat = 0,953905
Statystyka F (2, 55) = 590,794 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności
zmiennych niezależnych
Statystyka testu Durbina-Watsona = 0,791781
Autokorelacja reszt rzędu pierwszego = 0,59272
Logarytm wiarygodności = -466,408
Kryterium informacyjne Akaike'a (AIC) = 938,816
Kryterium bayesowskie Schwarza (BIC) = 944,998
Kryterium infor. Hannana-Quinna (HQC) = 941,224
Pierwsze co widzimy to bliska 1 wartość współczynnika determinacji R, co oznacza,
że zmienność PKB została w wysokim stopniu wyjaśniona przez zmienne
objaśniające oraz że regresja dobrze dopasowała się do danych empirycznych.
Inwestycje są zmienną bardzo istotną, z kolei zatrudnienie (w przeciwieństwie do
łącznej estymacji modelu 2MNK) przestało być zmienną istotną.
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Zmienna zależna: uhat^2
Zmienna
const
E
Invest
sq_E
E_Invest
sq_Invest
Współczynnik
-4,66826E+08
369866
-4638,49
-72,8985
1,65759
0,0197621
Błąd stand.
7,24161E+08
627768
28383,4
136,160
12,3528
0,284728
Statystyka t
-0,645
0,589
-0,163
-0,535
0,134
0,069
Wartość p
0,52199
0,55829
0,87082
0,59466
0,89377
0,94493
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: TR^2 = 4,383174,
z wartością p = P(Chi-kwadrat(5) > 4,383174) = 0,495665
wartość krytyczna χ 2 dla poziomu istotności  = 0,05 oraz dla 5 stopni swobody
wynosi 11,07
Skoro TR2 = 58∗R 2 = 4,383174  11,07 to nie mamy podstaw do odrzucenia
hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt.
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Zmienna zależna: uhat
Zmienna
const
E
Invest
uhat_1
Współczynnik
-16869,5
7,55964
-0,402800
0,671877
Błąd stand.
8915,86
3,87364
0,181748
0,111520
Statystyka t
-1,892
1,952
-2,216
6,025
Wartość p
0,06395 *
0,05628 *
0,03099 **
<0,00001 ***
Statystyka testu: LMF = 36,480267,
z wartością p = P(F(1,53) > 36,4803) = 1,56e-007
Alternatywna statystyka: TR^2 = 23,238366,
z wartością p = P(Chi-kwadrat(1) > 23,2384) = 1,43e-006
Ljung-Box Q' = 20,1049 z wartością p = P(Chi-kwadrat(1) > 20,1049) = 7,33e-006
wartość krytyczna χ 2 dla  = 0,05 oraz 1 stopnia swobody wynosi 3,841
TR2 = 23,238366  3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji
Test normalności rozkładu reszt
Rozkład częstości dla reszt (zmienna uhat18 przedstawiona na wykresie poniżej), obserwacje 1-58
liczba przedziałów = 7, średnia = 3,76343e-012, odch.std. = 772,117
Przedziały
< -1322,4
-1322,4 - -830,54
-830,54 - -338,65
-338,65 - 153,24
153,24 - 645,13
645,13 - 1137,0
>= 1137,0
średnia
-1568,4
-1076,5
-584,59
-92,706
399,18
891,07
1383,0
liczba
2
10
5
13
13
13
2
częstość
3,45%
17,24%
8,62%
22,41%
22,41%
22,41%
3,45%
skumlowana
3,45% *
20,69% ******
29,31% ***
51,72% ********
74,14% ********
96,55% ********
100,00% *
Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny:
Chi-kwadrat(2) = 6,494 z wartością p 0,03888
Wartość p < 0,05 wskazuje na to, że na poziomie istotności 5% należy odrzucić
hipotezę o normalności rozkładu reszt. Potwierdza to też wykres.
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji
6)
5)
E 9,626
Invest 9,626
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Nie ma problemu ze współliniowością.
Graficzne przedstawienie jak wartości wyrównane przybliżają wartości empiryczne:
Widzimy, że wartości wyrównane zmiennej PKB zadowalająco przybliżają wartości
empiryczne.
DRUGIE RÓWNANIE:
Zmienna zależna: C
Zmienna
const
Invest_1
PKB
G
Współczynnik
5689,59
-0,133640
0,792880
-2,06189
Błąd stand.
1964,91
0,188502
0,0933060
1,10974
Statystyka t
2,896
-0,709
8,498
-1,858
Wartość p
0,00549 ***
0,48146
<0,00001 ***
0,06873 *
Średnia arytmetyczna zmiennej zależnej = 28558,8
Ponownie zauważamy, że współczynnik determinacji jest bliski 1, co pozwala
stwierdzić, że zmienność konsumpcji została w dużym stopniu wyjaśniona przez
zmienne objaśniające, a regresja dobrze dopasowała równanie do wartości
empirycznych. Jedyną zmienną nieistotną okazuje się być Invest_1, usunięcie tej
zmiennej daje model, w którym wszystkie zmienne są istotne, suma kwadratów reszt
marginalnie wzrasta, współczynnik determinacji R2 również, zatem usunięcie tej
zmiennej z równania jest sensowne. Dopasowanie równania do zmiennych
empirycznych po dokonaniu regresji przedstawia wykres:
Zmienna
const
Invest_1
PKB
G
sq_Invest_1
Invest_PKB
Invest_G
sq_PKB
PKB_G
sq_G
Współczynnik
-5,68396E+06
-1557,99
350,518
3598,18
0,0276908
0,0977468
-0,754823
-0,0383981
0,582592
-3,33968
Błąd stand.
2,76288E+07
5238,41
2140,38
25420,6
0,249631
0,200620
2,29133
0,0538494
1,34775
9,45423
Statystyka t
-0,206
-0,297
0,164
0,142
0,111
0,487
-0,329
-0,713
0,432
-0,353
Wartość p
0,83789
0,76746
0,87062
0,88804
0,91215
0,62837
0,74330
0,47933
0,66752
0,72548
Statystyka testu: TR^2 = 16,508828,
wartość krytyczna χ 2 dla poziomu istotności  = 0,05 oraz 9 stopni swobody
wynosi 16,919
TR2 = 57∗R 2 = 16,508828  16,919 a zatem nie mamy podstaw do odrzucenia
Zmienna
const
Invest_1
PKB
G
uhat_1
Współczynnik
1185,55
0,330637
-0,187446
1,13348
0,813202
Błąd stand.
1400,34
0,132014
0,0655365
0,771541
0,0968358
Statystyka t
0,847
2,505
-2,860
1,469
8,398
Wartość p
0,40116
0,01550 **
0,00612 ***
0,14794
<0,00001 ***
Hipoteza zerowa: brak autokorelacji składnika losowego
z wartością p = P(F(1,51) > 70,5282) = 3,49e-011
Rozkład częstości dla reszt (zmienna uhat2 przedstawiona niżej na wykresie), obserwacje 1-58
liczba przedziałów = 7, średnia = -4,46769e-013, odch.std. = 493,887
Przedziały
średnia
< -932,86
-1120,4
-932,86 - -557,77 -745,31
-557,77 - -182,68 -370,23
-182,68 - 192,40
4,8577
192,40 - 567,49
379,94
567,49 - 942,57
755,03
>= 942,57
1130,1
liczba
2
6
9
23
10
6
1
częstość
3,51%
10,53%
15,79%
40,35%
17,54%
10,53%
1,75%
skumlowana
3,51% *
14,04% ***
29,82% *****
70,18% **************
87,72% ******
98,25% ***
100,00%
Brakujace obserwacje = 1 ( 1,72%)
Wartość p jak i wykres częstości reszt wskazują, że nie ma podstaw do odrzucenia
H0 o normalności rozkładu częstości dla reszt.
8)
4)
2)
Invest_1 15,974
PKB 24,996
G 9,165
Zmienne Invest_1 oraz PKB przekraczają wartość 10, co może oznaczać, że w
przypadku drugiego rówania mamy do czynienia ze współliniowością. Możliwe, że
nieistotność zmiennej Invest_1 spowodowana jest zależnością liniową z inną
zmienną.
TRZECIE RÓWNANIE
Zmienna zależna: Invest
Zmienna
const
C
R
Współczynnik
-9633,61
0,603961
20,1951
Błąd stand.
1423,92
0,0439351
48,0882
Statystyka t
-6,766
13,747
0,420
Wartość p
<0,00001 ***
<0,00001 ***
0,67615
Średnia arytmetyczna zmiennej zależnej = 7658,13
Poraz kolejny otrzymujemy wysoki współczynnik determinacji R 2 świadczący o
dobrym dopasowaniu się regresji do danych empirycznych. Zmienność poziomu
inwestycji została w dużym stopniu wyjaśniona przez zmienne objaśniające C oraz R.
O ile C jest zmienną istotną, to R okazała się być nieistotna – usunięcie jej faktycznie
nie wiele zmienia. Nie potwierdziły się (podobnie jak przy 2MNK) przypuszczenia,
że wzrastająca stopa banku centralnego obniża wielkość inwestycji oraz jest ważnym
czynnikiem determinującym poziom inwestycji. Możliwe, że gospodarka Danii jest
tak atrakcyjna dla inwestorów, że nawet wzrastająca cena kredytów nie wpływa na
ich skłonność do inwestowania. Dopasowanie równania do zmiennych empirycznych
po dokonaniu regresji przedstawia wykres:
Zmienna
const
C
R
sq_C
C_R
sq_R
Współczynnik
-1,63680E+07
894,722
1,71632E+06
-0,0120128
-47,4047
-38849,1
Błąd stand.
Statystyka t
1,40791E+07 -1,163
838,995
1,066
1,10865E+06 1,548
0,0125094
-0,960
33,3232
-1,423
20317,5
-1,912
Wartość p
0,25031
0,29116
0,12766
0,34135
0,16083
0,06138 *
Statystyka testu: TR^2 = 5,633494
wartość krytyczna χ 2 dla  = 0,05 oraz 5 stopni swobody wynosi 11,07
TR2 = 58∗R 2 = 5,633494  11,07 a zatem nie mamy podstaw do odrzucenia
Zmienna
const
C
R
uhat_1
Współczynnik
102,267
-0,00187231
-11,6254
0,651263
Błąd stand.
1115,04
0,0343118
38,8866
0,105161
Statystyka t
0,092
-0,055
-0,299
6,193
Wartość p
0,92727
0,95669
0,76614
<0,00001 ***
z wartością p = P(F(1,53) > 38,3631) = 8,89e-008
Hipoteza zerowa: brak autokorelacji składnika losowego
Rozkład częstości dla reszt (zmienna uhat7, przedstawiona niżej na wykresie), obserwacje 1-58
liczba przedziałów = 7, średnia = 6,42919e-013, odch.std. = 430,475
Przedziały
< -688,80
-688,80 - -391,65
-391,65 - -94,506
-94,506 - 202,64
202,64 - 499,79
499,79 - 796,93
>= 796,93
średnia
-837,37
-540,23
-243,08
54,067
351,21
648,36
945,51
liczba
1
10
13
10
18
4
2
częstość
1,72%
17,24%
22,41%
17,24%
31,03%
6,90%
3,45%
skumlowana
1,72%
18,97% ******
41,38% ********
58,62% ******
89,66% ***********
96,55% **
100,00% *
wartość krytyczna χ 2 dla  = 0,05 oraz 2 stopni swobody wynosi 5,991
1,218  5,991 a zatem nie mamy podstaw do odrzucenia hipotezy zerowej o
normalności rozkładu częstości dla reszt
3)
7)
C 3,312
R 3,312
Żadna wartość nie przekracza 10, więc współliniowość nie występuje.
5. Opis danych/transformacji na danych
Dane zostały zaimportowane z udostępnionego pliku baza_danych_metody.xls
Dla wybranych zmiennych wyznaczyłem najdłuższy wspólny okres, dla którego
dysponujemy danymi o tych zmiennych. W przypadku zmiennej E musiałem
uzupełnić kilka obserwacji we własnym zakresie.
6. Wnioski
Problemem w modelu jest występowanie autokorelacji, która jest dosyć częstym
zjawiskiem dla prawdziwych danych makroekonomicznych. Autokorelacja powoduje
pogorszenie się efektywności estymatorów MNK. W jednym z równań pojawiła się
współliniowość. Prawdopodobnie za mała była również liczba obserwacji. Bardzo
możliwe, że inne metody estymacji poradziłyby sobie lepiej z rozpatrywanym
układem równań dla tych danych – co zostało nawet sprawdzone przeze mnie przez
porównanie estymacji całego układu metodą 2MNK oraz ,,metodą pozornie
niepowiązanych równań”. O ile wyniki estymacji poszczególnych równań metodą
KMNK są w miarę zadowalające, to wyniki estymacji całego modelu łącznie 2MNK
są już nieco gorsze. Możliwe, że w przypadku innych krajów model sprawdziłby się
lepiej, ale dla Danii kilka moich przypuszczeń nie potwierdziło się.

Szymon Bargłowski, sb39345 MODEL

Transkrypt

Podobne dokumenty

ξ α α

Spółka cywilna - Invest in Lubelskie

Wydział Promocji Handlu i Inwestycji Ambasady RP w Londynie

O Firmie - Co.Invest

Warszawa, 01 lutego 2013 r. Komentarz rynkowy Nowy trend na

STATYSTYKA CBOS - ROŚNIE ZAUFANIE DO POLICJI (STYCZEŃ

Otoczenie biznesu - Invest in Lubelskie

JR INVEST SA z planami nowych inwestycji