Szymon Bargłowski, sb39345 MODEL

Transkrypt

Szymon Bargłowski, sb39345 MODEL
Szymon Bargłowski, sb39345
MODEL
1. Równania rozpatrywanego modelu:
gdzie:
1
PKB t = a1  a 2 E t  a 3 Invest t  1
2
C t = b 1  b 2 PKBt  b3 Invest t−1  b 4 Gt   2
3
Invest t = d 1  d 2 C t  d 3 Rt  3
G
C
PKB
Invest
E
R
- wydatki rządowe
- konsumpcja
- PKB
- inwestycje
- zatrudnienie
- stopa banku centralnego
Pierwsze równanie opiera się na przypuszczeniu, że PKB w danym okresie
,,wypracowywane jest” głównie przez pracujących ludzi i zainwestowany
kapitał. Drugie równanie zakłada, że na konsumpcję w danym okresie wpływ
ma PKB oraz cześć wydatków rządowych z tego samego okresu (na przykład
świadczenia socjalne) oraz zwracające się inwestycje z poprzedniego okresu
(zakładamy, że część przychodu z inwestycji ludzie przeznaczają na
konsumpcję). Ostatnie równanie opiera się na założeniu, że konsumpcja
zwiększając się wprowadza optymistyczne nastroje wśród inwestorów i
nakłania do zwiększenia inwestycji, natomiast stopa banku centralnego rosnąc
powinna wywoływać zmniejszenie wielkości inwestycji.
Zauważmy, że model jest modelem równań współzależnych, gdyż PKB t
objaśniane jest przez Invest t , Invest t przez C t natomiast C t przez
PKB t . Dla formalności można zauważyć, że macierz B występująca w
postaci strukturalnej naszego modelu wygląda następująco:
1
0 −a 3
PKB t
−b 2 1
0
Ct
dla wektora zmiennych endogenicznych
0 −d 2 1
Invest t
[
]
[ ]
nie jest ona oczywiście macierzą trójkątną ani nie może zostać do niej
sprowadzona poprzez ciąg zamian typu wiersz – wiersz lub
kolumna – kolumna.
2. Sprawdzamy, czy model jest identyfikowalny (podstawowa własność przy
modelach równań współzależnych). Skorzystamy z twierdzenia:
,,Warunkiem koniecznym i wystarczającym, aby i-te równanie
wchodzące w skład modelu o m równaniach łącznie
współzależnych było identyfikowalne, jest by macierz Ai
parametrów znajdujących się przy zmiennych, które są w
modelu, a nie występują w równaniu, którego
identyfikowalność badamy, była rzędu m-1”
Oznaczmy przez k i liczbę zmiennych występujących w modelu, ale nie
występujących w równaniu i ;
badamy pierwsze równanie
warunek wymiaru: k 1 = 4  3 − 1
[
−b 4
1 −b 3 0
0 −d 2 0 −d 3
]
jest rzędu 2 = 3 – 1
zatem równanie jest niejednoznacznie identyfikowalne
badamy druge równanie
warunek wymiaru: k 2 = 3  3 − 1
[
−a 3 −a 2
0
1
0 −d 3
]
jest rzędu 2 = 3 – 1
zatem równanie jest niejednoznacznie identyfikowalne
badamy trzecie równanie
warunek wymiaru: k 3 = 4  3 − 1
[
0
1
0 −a 2
−b 4 −b 2 −b 3 0
]
jest rzędu 2 = 3 – 1
Każde z trzech równań modelu jest niejednoznacznie identyfikowalne, cały
model jest również niejednoznacznie identyfikowalny.
W dalszej części przetestujemy model na przykładzie Danii
Zakres danych od 1992q01 do 2006q02
Wykresy przedstawiające wykorzystywane przeze mnie zmienne:
3. Estymacja parametrów 2MNK:
Zapisuję układ równań za pomocą składni Gretla:
system name="Szymon's model"
equation PKB const E Invest
equation C const PKB Invest_1 G
equation Invest const C R
endog PKB C Invest
end system
Estymacja tego modelu metodą 2MNK daje następujące rezultaty:
Równanie 1: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: PKB
Instrumenty: Invest_1 G R
Zmienna
const
E
Invest
Współczynnik
50242,5
-13,6281
3,08718
Błąd stand.
16564,1
7,24038
0,345009
Statystyka t
3,033
-1,882
8,948
Wartość p
0,00242 ***
0,05980 *
<0,00001 ***
Srednia arytmetyczna zmiennej zależnej = 37990,6
Odchylenie standardowe zmiennej zależnej = 3536,37
Suma kwadratów reszt = 3,99363e+007
Błąd standardowy reszt = 859,978
Równanie 2: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: C
Instrumenty: E R
Zmienna
const
PKB
Invest_1
G
Współczynnik
1005,19
1,92950
-1,96186
-10,1943
Błąd stand.
5602,72
1,00868
1,63759
7,42099
Statystyka t
0,179
1,913
-1,198
-1,374
Wartość p
0,85762
0,05576 *
0,23091
0,16953
Srednia arytmetyczna zmiennej zależnej = 28558,8
Odchylenie standardowe zmiennej zależnej = 2326,36
Suma kwadratów reszt = 4,91247e+007
Błąd standardowy reszt = 962,747
Równanie 3: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: Invest
Instrumenty: E Invest_1 G
Zmienna
const
C
R
Współczynnik
-13807,3
0,733106
139,485
Błąd stand.
1821,48
0,0561108
60,8376
Statystyka t
-7,580
13,065
2,293
Wartość p
<0,00001 ***
<0,00001 ***
0,02186 **
Srednia arytmetyczna zmiennej zależnej = 7695,18
Odchylenie standardowe zmiennej zależnej = 1438,05
Suma kwadratów reszt = 1,17901e+007
Błąd standardowy reszt = 467,263
Macierz wariancji i kowariancji dla reszt poszczególnych równań
(skorelowania w nawisach - powyżej elementów diagonalnych)
7,0064e+005 (-0,121)
(-0,503)
-94049,
8,6184e+005
(0,002)
-1,9158e+005
825,90 2,0684e+005
- reszty poszczególnych równań nie są zmiennymi niezależnymi
logarytm wyznacznika = 39,0548
Wnioski:
Na podstawie raportu wygenerowanego przez program Gretl widzimy, że dobór
zmiennych objaśniających poszczególne zmienne endogeniczne był w miarę trafny
(tylko 2 wartości p nie są bardzo małe – dotyczące Invest_1 i G w drugim równaniu).
Z drugiej strony błędy standardowe reszt są dość znaczne. Sprzecznie z
oczekiwaniami współczynnik stojący przy R w trzecim równaniu okazał się być
dodatni. Z teorii makroekonomii wynikałoby, że powinien być on ujemny. Z kolei z
logicznego punktu widzenia współczynnik stojący przy E w pierwszym równaniu
powinien być dodatni, a jest ujemny. Możliwe, że taki stan rzeczy spowodowała zbyt
mała ilość obserwacji, albo po prostu nieoptymalna metoda estymacji równań
współzależnych. Na przykład ,,metoda pozornie niepowiązanych równań” daje
rozsądne wartości współczynników występujących w modelu, a także wyraźnie
mniejsze błędy standardowe reszt. Usunięcie nieistotnej stałej z drugiego równania
sprawia, że wszystkie zmienne w modelu są istotne, jednakże zwiększa błąd
standardowy reszt w drugim równaniu (co nie jest zaskakujące).
Zmienne Invest oraz Invest_1 wyznaczają zbliżone do siebie szeregi czasowe
(zbliżone wartości w poszczególnych okresach), co mogło spowodować, że drugie
równanie okazało się przypominać zależność C = PKB – I – G. Nie udało się zatem
potwierdzić, że na konsumpcję dodatnio wpływają trzy wybrane przeze mnie
zmienne PKB t (interpretowane jako siła gospodarki), I t−1 oraz G t .
4. Weryfikacja założeń dotyczących każdego z równań z osobna
estymowanych oddzielnie KMNK:
PIERWSZE RÓWNANIE:
Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2
Zmienna zależna: PKB
Zmienna
const
E
Invest
Współczynnik
14240,3
2,21797
2,32262
Błąd stand.
10973,7
4,74928
0,218375
Statystyka t
1,298
0,467
10,636
Wartość p
0,19982
0,64234
<0,00001 ***
Średnia arytmetyczna zmiennej zależnej = 37885
Odchylenie standardowe zmiennej zależnej = 3596,32
Suma kwadratów reszt = 3,27891e+007
Błąd standardowy reszt = 772,117
Wsp. determinacji R-kwadrat = 0,955523
Skorygowany wsp. R-kwadrat = 0,953905
Statystyka F (2, 55) = 590,794 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności
zmiennych niezależnych
Statystyka testu Durbina-Watsona = 0,791781
Autokorelacja reszt rzędu pierwszego = 0,59272
Logarytm wiarygodności = -466,408
Kryterium informacyjne Akaike'a (AIC) = 938,816
Kryterium bayesowskie Schwarza (BIC) = 944,998
Kryterium infor. Hannana-Quinna (HQC) = 941,224
Pierwsze co widzimy to bliska 1 wartość współczynnika determinacji R, co oznacza,
że zmienność PKB została w wysokim stopniu wyjaśniona przez zmienne
objaśniające oraz że regresja dobrze dopasowała się do danych empirycznych.
Inwestycje są zmienną bardzo istotną, z kolei zatrudnienie (w przeciwieństwie do
łącznej estymacji modelu 2MNK) przestało być zmienną istotną.
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2
Zmienna zależna: uhat^2
Zmienna
const
E
Invest
sq_E
E_Invest
sq_Invest
Współczynnik
-4,66826E+08
369866
-4638,49
-72,8985
1,65759
0,0197621
Błąd stand.
7,24161E+08
627768
28383,4
136,160
12,3528
0,284728
Statystyka t
-0,645
0,589
-0,163
-0,535
0,134
0,069
Wartość p
0,52199
0,55829
0,87082
0,59466
0,89377
0,94493
Wsp. determinacji R-kwadrat = 0,075572
Hipoteza zerowa: heteroskedastyczność reszt nie występuje
Statystyka testu: TR^2 = 4,383174,
z wartością p = P(Chi-kwadrat(5) > 4,383174) = 0,495665
wartość krytyczna χ 2 dla poziomu istotności  = 0,05 oraz dla 5 stopni swobody
wynosi 11,07
Skoro TR2 = 58∗R 2 = 4,383174  11,07 to nie mamy podstaw do odrzucenia
hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt.
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: uhat
Zmienna
const
E
Invest
uhat_1
Współczynnik
-16869,5
7,55964
-0,402800
0,671877
Błąd stand.
8915,86
3,87364
0,181748
0,111520
Statystyka t
-1,892
1,952
-2,216
6,025
Wartość p
0,06395 *
0,05628 *
0,03099 **
<0,00001 ***
Wsp. determinacji R-kwadrat = 0,407691
Statystyka testu: LMF = 36,480267,
z wartością p = P(F(1,53) > 36,4803) = 1,56e-007
Alternatywna statystyka: TR^2 = 23,238366,
z wartością p = P(Chi-kwadrat(1) > 23,2384) = 1,43e-006
Ljung-Box Q' = 20,1049 z wartością p = P(Chi-kwadrat(1) > 20,1049) = 7,33e-006
wartość krytyczna χ 2 dla  = 0,05 oraz 1 stopnia swobody wynosi 3,841
TR2 = 23,238366  3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji
Test normalności rozkładu reszt
Rozkład częstości dla reszt (zmienna uhat18 przedstawiona na wykresie poniżej), obserwacje 1-58
liczba przedziałów = 7, średnia = 3,76343e-012, odch.std. = 772,117
Przedziały
< -1322,4
-1322,4 - -830,54
-830,54 - -338,65
-338,65 - 153,24
153,24 - 645,13
645,13 - 1137,0
>= 1137,0
średnia
-1568,4
-1076,5
-584,59
-92,706
399,18
891,07
1383,0
liczba
2
10
5
13
13
13
2
częstość
3,45%
17,24%
8,62%
22,41%
22,41%
22,41%
3,45%
skumlowana
3,45% *
20,69% ******
29,31% ***
51,72% ********
74,14% ********
96,55% ********
100,00% *
Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny:
Chi-kwadrat(2) = 6,494 z wartością p 0,03888
Wartość p < 0,05 wskazuje na to, że na poziomie istotności 5% należy odrzucić
hipotezę o normalności rozkładu reszt. Potwierdza to też wykres.
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji
6)
5)
E 9,626
Invest 9,626
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Nie ma problemu ze współliniowością.
Graficzne przedstawienie jak wartości wyrównane przybliżają wartości empiryczne:
Widzimy, że wartości wyrównane zmiennej PKB zadowalająco przybliżają wartości
empiryczne.
DRUGIE RÓWNANIE:
Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: C
Zmienna
const
Invest_1
PKB
G
Współczynnik
5689,59
-0,133640
0,792880
-2,06189
Błąd stand.
1964,91
0,188502
0,0933060
1,10974
Statystyka t
2,896
-0,709
8,498
-1,858
Wartość p
0,00549 ***
0,48146
<0,00001 ***
0,06873 *
Średnia arytmetyczna zmiennej zależnej = 28558,8
Odchylenie standardowe zmiennej zależnej = 2326,36
Suma kwadratów reszt = 1,2928e+007
Błąd standardowy reszt = 493,887
Wsp. determinacji R-kwadrat = 0,957343
Skorygowany wsp. R-kwadrat = 0,954929
Statystyka F (3, 53) = 396,491 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności
zmiennych niezależnych
Statystyka testu Durbina-Watsona = 0,566849
Autokorelacja reszt rzędu pierwszego = 0,717882
Logarytm wiarygodności = -432,337
Kryterium informacyjne Akaike'a (AIC) = 872,675
Kryterium bayesowskie Schwarza (BIC) = 880,847
Kryterium infor. Hannana-Quinna (HQC) = 875,851
Ponownie zauważamy, że współczynnik determinacji jest bliski 1, co pozwala
stwierdzić, że zmienność konsumpcji została w dużym stopniu wyjaśniona przez
zmienne objaśniające, a regresja dobrze dopasowała równanie do wartości
empirycznych. Jedyną zmienną nieistotną okazuje się być Invest_1, usunięcie tej
zmiennej daje model, w którym wszystkie zmienne są istotne, suma kwadratów reszt
marginalnie wzrasta, współczynnik determinacji R2 również, zatem usunięcie tej
zmiennej z równania jest sensowne. Dopasowanie równania do zmiennych
empirycznych po dokonaniu regresji przedstawia wykres:
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: uhat^2
Zmienna
const
Invest_1
PKB
G
sq_Invest_1
Invest_PKB
Invest_G
sq_PKB
PKB_G
sq_G
Współczynnik
-5,68396E+06
-1557,99
350,518
3598,18
0,0276908
0,0977468
-0,754823
-0,0383981
0,582592
-3,33968
Błąd stand.
2,76288E+07
5238,41
2140,38
25420,6
0,249631
0,200620
2,29133
0,0538494
1,34775
9,45423
Statystyka t
-0,206
-0,297
0,164
0,142
0,111
0,487
-0,329
-0,713
0,432
-0,353
Wartość p
0,83789
0,76746
0,87062
0,88804
0,91215
0,62837
0,74330
0,47933
0,66752
0,72548
Wsp. determinacji R-kwadrat = 0,289629
Statystyka testu: TR^2 = 16,508828,
z wartością p = P(Chi-kwadrat(9) > 16,508828) = 0,056987
wartość krytyczna χ 2 dla poziomu istotności  = 0,05 oraz 9 stopni swobody
wynosi 16,919
TR2 = 57∗R 2 = 16,508828  16,919 a zatem nie mamy podstaw do odrzucenia
hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt.
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Estymacja KMNK z wykorzystaniem 56 obserwacji 1992:3-2006:2
Zmienna zależna: uhat
Zmienna
const
Invest_1
PKB
G
uhat_1
Współczynnik
1185,55
0,330637
-0,187446
1,13348
0,813202
Błąd stand.
1400,34
0,132014
0,0655365
0,771541
0,0968358
Statystyka t
0,847
2,505
-2,860
1,469
8,398
Wartość p
0,40116
0,01550 **
0,00612 ***
0,14794
<0,00001 ***
Wsp. determinacji R-kwadrat = 0,580344
Hipoteza zerowa: brak autokorelacji składnika losowego
Statystyka testu: LMF = 70,528156,
z wartością p = P(F(1,51) > 70,5282) = 3,49e-011
Alternatywna statystyka: TR^2 = 32,499273,
z wartością p = P(Chi-kwadrat(1) > 32,4993) = 1,19e-008
Ljung-Box Q' = 30,5386 z wartością p = P(Chi-kwadrat(1) > 30,5386) = 3,27e-008
wartość krytyczna χ 2 dla  = 0,05 oraz 1 stopnia swobody wynosi 3,841
TR2 = 32,499273  3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji
Test normalności rozkładu reszt
Rozkład częstości dla reszt (zmienna uhat2 przedstawiona niżej na wykresie), obserwacje 1-58
liczba przedziałów = 7, średnia = -4,46769e-013, odch.std. = 493,887
Przedziały
średnia
< -932,86
-1120,4
-932,86 - -557,77 -745,31
-557,77 - -182,68 -370,23
-182,68 - 192,40
4,8577
192,40 - 567,49
379,94
567,49 - 942,57
755,03
>= 942,57
1130,1
liczba
2
6
9
23
10
6
1
częstość
3,51%
10,53%
15,79%
40,35%
17,54%
10,53%
1,75%
skumlowana
3,51% *
14,04% ***
29,82% *****
70,18% **************
87,72% ******
98,25% ***
100,00%
Brakujace obserwacje = 1 ( 1,72%)
Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny:
Chi-kwadrat(2) = 0,013 z wartością p 0,99363
Wartość p jak i wykres częstości reszt wskazują, że nie ma podstaw do odrzucenia
H0 o normalności rozkładu częstości dla reszt.
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji
8)
4)
2)
Invest_1 15,974
PKB 24,996
G 9,165
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Zmienne Invest_1 oraz PKB przekraczają wartość 10, co może oznaczać, że w
przypadku drugiego rówania mamy do czynienia ze współliniowością. Możliwe, że
nieistotność zmiennej Invest_1 spowodowana jest zależnością liniową z inną
zmienną.
TRZECIE RÓWNANIE
Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2
Zmienna zależna: Invest
Zmienna
const
C
R
Współczynnik
-9633,61
0,603961
20,1951
Błąd stand.
1423,92
0,0439351
48,0882
Statystyka t
-6,766
13,747
0,420
Wartość p
<0,00001 ***
<0,00001 ***
0,67615
Średnia arytmetyczna zmiennej zależnej = 7658,13
Odchylenie standardowe zmiennej zależnej = 1453,03
Suma kwadratów reszt = 1,0192e+007
Błąd standardowy reszt = 430,475
Wsp. determinacji R-kwadrat = 0,915309
Skorygowany wsp. R-kwadrat = 0,912229
Statystyka F (2, 55) = 297,209 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności
zmiennych niezależnych
Statystyka testu Durbina-Watsona = 0,70465
Autokorelacja reszt rzędu pierwszego = 0,648415
Logarytm wiarygodności = -432,522
Kryterium informacyjne Akaike'a (AIC) = 871,044
Kryterium bayesowskie Schwarza (BIC) = 877,225
Kryterium infor. Hannana-Quinna (HQC) = 873,451
Poraz kolejny otrzymujemy wysoki współczynnik determinacji R 2 świadczący o
dobrym dopasowaniu się regresji do danych empirycznych. Zmienność poziomu
inwestycji została w dużym stopniu wyjaśniona przez zmienne objaśniające C oraz R.
O ile C jest zmienną istotną, to R okazała się być nieistotna – usunięcie jej faktycznie
nie wiele zmienia. Nie potwierdziły się (podobnie jak przy 2MNK) przypuszczenia,
że wzrastająca stopa banku centralnego obniża wielkość inwestycji oraz jest ważnym
czynnikiem determinującym poziom inwestycji. Możliwe, że gospodarka Danii jest
tak atrakcyjna dla inwestorów, że nawet wzrastająca cena kredytów nie wpływa na
ich skłonność do inwestowania. Dopasowanie równania do zmiennych empirycznych
po dokonaniu regresji przedstawia wykres:
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2
Zmienna zależna: uhat^2
Zmienna
const
C
R
sq_C
C_R
sq_R
Współczynnik
-1,63680E+07
894,722
1,71632E+06
-0,0120128
-47,4047
-38849,1
Błąd stand.
Statystyka t
1,40791E+07 -1,163
838,995
1,066
1,10865E+06 1,548
0,0125094
-0,960
33,3232
-1,423
20317,5
-1,912
Wartość p
0,25031
0,29116
0,12766
0,34135
0,16083
0,06138 *
Wsp. determinacji R-kwadrat = 0,0971292
Statystyka testu: TR^2 = 5,633494
z wartością p = P(Chi-kwadrat(5) > 5,633494) = 0,343530
wartość krytyczna χ 2 dla  = 0,05 oraz 5 stopni swobody wynosi 11,07
TR2 = 58∗R 2 = 5,633494  11,07 a zatem nie mamy podstaw do odrzucenia
hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt.
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2
Zmienna zależna: uhat
Zmienna
const
C
R
uhat_1
Współczynnik
102,267
-0,00187231
-11,6254
0,651263
Błąd stand.
1115,04
0,0343118
38,8866
0,105161
Statystyka t
0,092
-0,055
-0,299
6,193
Wartość p
0,92727
0,95669
0,76614
<0,00001 ***
Wsp. determinacji R-kwadrat = 0,419897
Statystyka testu: LMF = 38,363068,
z wartością p = P(F(1,53) > 38,3631) = 8,89e-008
Hipoteza zerowa: brak autokorelacji składnika losowego
Alternatywna statystyka: TR^2 = 23,934123,
z wartością p = P(Chi-kwadrat(1) > 23,9341) = 9,97e-007
Ljung-Box Q' = 25,2866 z wartością p = P(Chi-kwadrat(1) > 25,2866) = 4,94e-007
wartość krytyczna χ 2 dla  = 0,05 oraz 1 stopnia swobody wynosi 3,841
TR2 = 23,934123  3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji
Test normalności rozkładu reszt
Rozkład częstości dla reszt (zmienna uhat7, przedstawiona niżej na wykresie), obserwacje 1-58
liczba przedziałów = 7, średnia = 6,42919e-013, odch.std. = 430,475
Przedziały
< -688,80
-688,80 - -391,65
-391,65 - -94,506
-94,506 - 202,64
202,64 - 499,79
499,79 - 796,93
>= 796,93
średnia
-837,37
-540,23
-243,08
54,067
351,21
648,36
945,51
liczba
1
10
13
10
18
4
2
częstość
1,72%
17,24%
22,41%
17,24%
31,03%
6,90%
3,45%
skumlowana
1,72%
18,97% ******
41,38% ********
58,62% ******
89,66% ***********
96,55% **
100,00% *
Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny:
Chi-kwadrat(2) = 1,218 z wartością p 0,54394
wartość krytyczna χ 2 dla  = 0,05 oraz 2 stopni swobody wynosi 5,991
1,218  5,991 a zatem nie mamy podstaw do odrzucenia hipotezy zerowej o
normalności rozkładu częstości dla reszt
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji
3)
7)
C 3,312
R 3,312
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Żadna wartość nie przekracza 10, więc współliniowość nie występuje.
5. Opis danych/transformacji na danych
Dane zostały zaimportowane z udostępnionego pliku baza_danych_metody.xls
Dla wybranych zmiennych wyznaczyłem najdłuższy wspólny okres, dla którego
dysponujemy danymi o tych zmiennych. W przypadku zmiennej E musiałem
uzupełnić kilka obserwacji we własnym zakresie.
6. Wnioski
Problemem w modelu jest występowanie autokorelacji, która jest dosyć częstym
zjawiskiem dla prawdziwych danych makroekonomicznych. Autokorelacja powoduje
pogorszenie się efektywności estymatorów MNK. W jednym z równań pojawiła się
współliniowość. Prawdopodobnie za mała była również liczba obserwacji. Bardzo
możliwe, że inne metody estymacji poradziłyby sobie lepiej z rozpatrywanym
układem równań dla tych danych – co zostało nawet sprawdzone przeze mnie przez
porównanie estymacji całego układu metodą 2MNK oraz ,,metodą pozornie
niepowiązanych równań”. O ile wyniki estymacji poszczególnych równań metodą
KMNK są w miarę zadowalające, to wyniki estymacji całego modelu łącznie 2MNK
są już nieco gorsze. Możliwe, że w przypadku innych krajów model sprawdziłby się
lepiej, ale dla Danii kilka moich przypuszczeń nie potwierdziło się.

Podobne dokumenty