Szymon Bargłowski, sb39345 MODEL
Transkrypt
Szymon Bargłowski, sb39345 MODEL
Szymon Bargłowski, sb39345 MODEL 1. Równania rozpatrywanego modelu: gdzie: 1 PKB t = a1 a 2 E t a 3 Invest t 1 2 C t = b 1 b 2 PKBt b3 Invest t−1 b 4 Gt 2 3 Invest t = d 1 d 2 C t d 3 Rt 3 G C PKB Invest E R - wydatki rządowe - konsumpcja - PKB - inwestycje - zatrudnienie - stopa banku centralnego Pierwsze równanie opiera się na przypuszczeniu, że PKB w danym okresie ,,wypracowywane jest” głównie przez pracujących ludzi i zainwestowany kapitał. Drugie równanie zakłada, że na konsumpcję w danym okresie wpływ ma PKB oraz cześć wydatków rządowych z tego samego okresu (na przykład świadczenia socjalne) oraz zwracające się inwestycje z poprzedniego okresu (zakładamy, że część przychodu z inwestycji ludzie przeznaczają na konsumpcję). Ostatnie równanie opiera się na założeniu, że konsumpcja zwiększając się wprowadza optymistyczne nastroje wśród inwestorów i nakłania do zwiększenia inwestycji, natomiast stopa banku centralnego rosnąc powinna wywoływać zmniejszenie wielkości inwestycji. Zauważmy, że model jest modelem równań współzależnych, gdyż PKB t objaśniane jest przez Invest t , Invest t przez C t natomiast C t przez PKB t . Dla formalności można zauważyć, że macierz B występująca w postaci strukturalnej naszego modelu wygląda następująco: 1 0 −a 3 PKB t −b 2 1 0 Ct dla wektora zmiennych endogenicznych 0 −d 2 1 Invest t [ ] [ ] nie jest ona oczywiście macierzą trójkątną ani nie może zostać do niej sprowadzona poprzez ciąg zamian typu wiersz – wiersz lub kolumna – kolumna. 2. Sprawdzamy, czy model jest identyfikowalny (podstawowa własność przy modelach równań współzależnych). Skorzystamy z twierdzenia: ,,Warunkiem koniecznym i wystarczającym, aby i-te równanie wchodzące w skład modelu o m równaniach łącznie współzależnych było identyfikowalne, jest by macierz Ai parametrów znajdujących się przy zmiennych, które są w modelu, a nie występują w równaniu, którego identyfikowalność badamy, była rzędu m-1” Oznaczmy przez k i liczbę zmiennych występujących w modelu, ale nie występujących w równaniu i ; badamy pierwsze równanie warunek wymiaru: k 1 = 4 3 − 1 [ −b 4 1 −b 3 0 0 −d 2 0 −d 3 ] jest rzędu 2 = 3 – 1 zatem równanie jest niejednoznacznie identyfikowalne badamy druge równanie warunek wymiaru: k 2 = 3 3 − 1 [ −a 3 −a 2 0 1 0 −d 3 ] jest rzędu 2 = 3 – 1 zatem równanie jest niejednoznacznie identyfikowalne badamy trzecie równanie warunek wymiaru: k 3 = 4 3 − 1 [ 0 1 0 −a 2 −b 4 −b 2 −b 3 0 ] jest rzędu 2 = 3 – 1 Każde z trzech równań modelu jest niejednoznacznie identyfikowalne, cały model jest również niejednoznacznie identyfikowalny. W dalszej części przetestujemy model na przykładzie Danii Zakres danych od 1992q01 do 2006q02 Wykresy przedstawiające wykorzystywane przeze mnie zmienne: 3. Estymacja parametrów 2MNK: Zapisuję układ równań za pomocą składni Gretla: system name="Szymon's model" equation PKB const E Invest equation C const PKB Invest_1 G equation Invest const C R endog PKB C Invest end system Estymacja tego modelu metodą 2MNK daje następujące rezultaty: Równanie 1: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: PKB Instrumenty: Invest_1 G R Zmienna const E Invest Współczynnik 50242,5 -13,6281 3,08718 Błąd stand. 16564,1 7,24038 0,345009 Statystyka t 3,033 -1,882 8,948 Wartość p 0,00242 *** 0,05980 * <0,00001 *** Srednia arytmetyczna zmiennej zależnej = 37990,6 Odchylenie standardowe zmiennej zależnej = 3536,37 Suma kwadratów reszt = 3,99363e+007 Błąd standardowy reszt = 859,978 Równanie 2: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: C Instrumenty: E R Zmienna const PKB Invest_1 G Współczynnik 1005,19 1,92950 -1,96186 -10,1943 Błąd stand. 5602,72 1,00868 1,63759 7,42099 Statystyka t 0,179 1,913 -1,198 -1,374 Wartość p 0,85762 0,05576 * 0,23091 0,16953 Srednia arytmetyczna zmiennej zależnej = 28558,8 Odchylenie standardowe zmiennej zależnej = 2326,36 Suma kwadratów reszt = 4,91247e+007 Błąd standardowy reszt = 962,747 Równanie 3: Estymacja 2MNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: Invest Instrumenty: E Invest_1 G Zmienna const C R Współczynnik -13807,3 0,733106 139,485 Błąd stand. 1821,48 0,0561108 60,8376 Statystyka t -7,580 13,065 2,293 Wartość p <0,00001 *** <0,00001 *** 0,02186 ** Srednia arytmetyczna zmiennej zależnej = 7695,18 Odchylenie standardowe zmiennej zależnej = 1438,05 Suma kwadratów reszt = 1,17901e+007 Błąd standardowy reszt = 467,263 Macierz wariancji i kowariancji dla reszt poszczególnych równań (skorelowania w nawisach - powyżej elementów diagonalnych) 7,0064e+005 (-0,121) (-0,503) -94049, 8,6184e+005 (0,002) -1,9158e+005 825,90 2,0684e+005 - reszty poszczególnych równań nie są zmiennymi niezależnymi logarytm wyznacznika = 39,0548 Wnioski: Na podstawie raportu wygenerowanego przez program Gretl widzimy, że dobór zmiennych objaśniających poszczególne zmienne endogeniczne był w miarę trafny (tylko 2 wartości p nie są bardzo małe – dotyczące Invest_1 i G w drugim równaniu). Z drugiej strony błędy standardowe reszt są dość znaczne. Sprzecznie z oczekiwaniami współczynnik stojący przy R w trzecim równaniu okazał się być dodatni. Z teorii makroekonomii wynikałoby, że powinien być on ujemny. Z kolei z logicznego punktu widzenia współczynnik stojący przy E w pierwszym równaniu powinien być dodatni, a jest ujemny. Możliwe, że taki stan rzeczy spowodowała zbyt mała ilość obserwacji, albo po prostu nieoptymalna metoda estymacji równań współzależnych. Na przykład ,,metoda pozornie niepowiązanych równań” daje rozsądne wartości współczynników występujących w modelu, a także wyraźnie mniejsze błędy standardowe reszt. Usunięcie nieistotnej stałej z drugiego równania sprawia, że wszystkie zmienne w modelu są istotne, jednakże zwiększa błąd standardowy reszt w drugim równaniu (co nie jest zaskakujące). Zmienne Invest oraz Invest_1 wyznaczają zbliżone do siebie szeregi czasowe (zbliżone wartości w poszczególnych okresach), co mogło spowodować, że drugie równanie okazało się przypominać zależność C = PKB – I – G. Nie udało się zatem potwierdzić, że na konsumpcję dodatnio wpływają trzy wybrane przeze mnie zmienne PKB t (interpretowane jako siła gospodarki), I t−1 oraz G t . 4. Weryfikacja założeń dotyczących każdego z równań z osobna estymowanych oddzielnie KMNK: PIERWSZE RÓWNANIE: Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2 Zmienna zależna: PKB Zmienna const E Invest Współczynnik 14240,3 2,21797 2,32262 Błąd stand. 10973,7 4,74928 0,218375 Statystyka t 1,298 0,467 10,636 Wartość p 0,19982 0,64234 <0,00001 *** Średnia arytmetyczna zmiennej zależnej = 37885 Odchylenie standardowe zmiennej zależnej = 3596,32 Suma kwadratów reszt = 3,27891e+007 Błąd standardowy reszt = 772,117 Wsp. determinacji R-kwadrat = 0,955523 Skorygowany wsp. R-kwadrat = 0,953905 Statystyka F (2, 55) = 590,794 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności zmiennych niezależnych Statystyka testu Durbina-Watsona = 0,791781 Autokorelacja reszt rzędu pierwszego = 0,59272 Logarytm wiarygodności = -466,408 Kryterium informacyjne Akaike'a (AIC) = 938,816 Kryterium bayesowskie Schwarza (BIC) = 944,998 Kryterium infor. Hannana-Quinna (HQC) = 941,224 Pierwsze co widzimy to bliska 1 wartość współczynnika determinacji R, co oznacza, że zmienność PKB została w wysokim stopniu wyjaśniona przez zmienne objaśniające oraz że regresja dobrze dopasowała się do danych empirycznych. Inwestycje są zmienną bardzo istotną, z kolei zatrudnienie (w przeciwieństwie do łącznej estymacji modelu 2MNK) przestało być zmienną istotną. Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2 Zmienna zależna: uhat^2 Zmienna const E Invest sq_E E_Invest sq_Invest Współczynnik -4,66826E+08 369866 -4638,49 -72,8985 1,65759 0,0197621 Błąd stand. 7,24161E+08 627768 28383,4 136,160 12,3528 0,284728 Statystyka t -0,645 0,589 -0,163 -0,535 0,134 0,069 Wartość p 0,52199 0,55829 0,87082 0,59466 0,89377 0,94493 Wsp. determinacji R-kwadrat = 0,075572 Hipoteza zerowa: heteroskedastyczność reszt nie występuje Statystyka testu: TR^2 = 4,383174, z wartością p = P(Chi-kwadrat(5) > 4,383174) = 0,495665 wartość krytyczna χ 2 dla poziomu istotności = 0,05 oraz dla 5 stopni swobody wynosi 11,07 Skoro TR2 = 58∗R 2 = 4,383174 11,07 to nie mamy podstaw do odrzucenia hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt. Test Breuscha-Godfreya na autokorelację rzędu pierwszego Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: uhat Zmienna const E Invest uhat_1 Współczynnik -16869,5 7,55964 -0,402800 0,671877 Błąd stand. 8915,86 3,87364 0,181748 0,111520 Statystyka t -1,892 1,952 -2,216 6,025 Wartość p 0,06395 * 0,05628 * 0,03099 ** <0,00001 *** Wsp. determinacji R-kwadrat = 0,407691 Statystyka testu: LMF = 36,480267, z wartością p = P(F(1,53) > 36,4803) = 1,56e-007 Alternatywna statystyka: TR^2 = 23,238366, z wartością p = P(Chi-kwadrat(1) > 23,2384) = 1,43e-006 Ljung-Box Q' = 20,1049 z wartością p = P(Chi-kwadrat(1) > 20,1049) = 7,33e-006 wartość krytyczna χ 2 dla = 0,05 oraz 1 stopnia swobody wynosi 3,841 TR2 = 23,238366 3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji Test normalności rozkładu reszt Rozkład częstości dla reszt (zmienna uhat18 przedstawiona na wykresie poniżej), obserwacje 1-58 liczba przedziałów = 7, średnia = 3,76343e-012, odch.std. = 772,117 Przedziały < -1322,4 -1322,4 - -830,54 -830,54 - -338,65 -338,65 - 153,24 153,24 - 645,13 645,13 - 1137,0 >= 1137,0 średnia -1568,4 -1076,5 -584,59 -92,706 399,18 891,07 1383,0 liczba 2 10 5 13 13 13 2 częstość 3,45% 17,24% 8,62% 22,41% 22,41% 22,41% 3,45% skumlowana 3,45% * 20,69% ****** 29,31% *** 51,72% ******** 74,14% ******** 96,55% ******** 100,00% * Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny: Chi-kwadrat(2) = 6,494 z wartością p 0,03888 Wartość p < 0,05 wskazuje na to, że na poziomie istotności 5% należy odrzucić hipotezę o normalności rozkładu reszt. Potwierdza to też wykres. Ocena współliniowości VIF - czynnika powiększania wariancji Minimalna możliwa wartość = 1.0 Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji 6) 5) E 9,626 Invest 9,626 VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu. Nie ma problemu ze współliniowością. Graficzne przedstawienie jak wartości wyrównane przybliżają wartości empiryczne: Widzimy, że wartości wyrównane zmiennej PKB zadowalająco przybliżają wartości empiryczne. DRUGIE RÓWNANIE: Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: C Zmienna const Invest_1 PKB G Współczynnik 5689,59 -0,133640 0,792880 -2,06189 Błąd stand. 1964,91 0,188502 0,0933060 1,10974 Statystyka t 2,896 -0,709 8,498 -1,858 Wartość p 0,00549 *** 0,48146 <0,00001 *** 0,06873 * Średnia arytmetyczna zmiennej zależnej = 28558,8 Odchylenie standardowe zmiennej zależnej = 2326,36 Suma kwadratów reszt = 1,2928e+007 Błąd standardowy reszt = 493,887 Wsp. determinacji R-kwadrat = 0,957343 Skorygowany wsp. R-kwadrat = 0,954929 Statystyka F (3, 53) = 396,491 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności zmiennych niezależnych Statystyka testu Durbina-Watsona = 0,566849 Autokorelacja reszt rzędu pierwszego = 0,717882 Logarytm wiarygodności = -432,337 Kryterium informacyjne Akaike'a (AIC) = 872,675 Kryterium bayesowskie Schwarza (BIC) = 880,847 Kryterium infor. Hannana-Quinna (HQC) = 875,851 Ponownie zauważamy, że współczynnik determinacji jest bliski 1, co pozwala stwierdzić, że zmienność konsumpcji została w dużym stopniu wyjaśniona przez zmienne objaśniające, a regresja dobrze dopasowała równanie do wartości empirycznych. Jedyną zmienną nieistotną okazuje się być Invest_1, usunięcie tej zmiennej daje model, w którym wszystkie zmienne są istotne, suma kwadratów reszt marginalnie wzrasta, współczynnik determinacji R2 również, zatem usunięcie tej zmiennej z równania jest sensowne. Dopasowanie równania do zmiennych empirycznych po dokonaniu regresji przedstawia wykres: Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: uhat^2 Zmienna const Invest_1 PKB G sq_Invest_1 Invest_PKB Invest_G sq_PKB PKB_G sq_G Współczynnik -5,68396E+06 -1557,99 350,518 3598,18 0,0276908 0,0977468 -0,754823 -0,0383981 0,582592 -3,33968 Błąd stand. 2,76288E+07 5238,41 2140,38 25420,6 0,249631 0,200620 2,29133 0,0538494 1,34775 9,45423 Statystyka t -0,206 -0,297 0,164 0,142 0,111 0,487 -0,329 -0,713 0,432 -0,353 Wartość p 0,83789 0,76746 0,87062 0,88804 0,91215 0,62837 0,74330 0,47933 0,66752 0,72548 Wsp. determinacji R-kwadrat = 0,289629 Statystyka testu: TR^2 = 16,508828, z wartością p = P(Chi-kwadrat(9) > 16,508828) = 0,056987 wartość krytyczna χ 2 dla poziomu istotności = 0,05 oraz 9 stopni swobody wynosi 16,919 TR2 = 57∗R 2 = 16,508828 16,919 a zatem nie mamy podstaw do odrzucenia hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt. Test Breuscha-Godfreya na autokorelację rzędu pierwszego Estymacja KMNK z wykorzystaniem 56 obserwacji 1992:3-2006:2 Zmienna zależna: uhat Zmienna const Invest_1 PKB G uhat_1 Współczynnik 1185,55 0,330637 -0,187446 1,13348 0,813202 Błąd stand. 1400,34 0,132014 0,0655365 0,771541 0,0968358 Statystyka t 0,847 2,505 -2,860 1,469 8,398 Wartość p 0,40116 0,01550 ** 0,00612 *** 0,14794 <0,00001 *** Wsp. determinacji R-kwadrat = 0,580344 Hipoteza zerowa: brak autokorelacji składnika losowego Statystyka testu: LMF = 70,528156, z wartością p = P(F(1,51) > 70,5282) = 3,49e-011 Alternatywna statystyka: TR^2 = 32,499273, z wartością p = P(Chi-kwadrat(1) > 32,4993) = 1,19e-008 Ljung-Box Q' = 30,5386 z wartością p = P(Chi-kwadrat(1) > 30,5386) = 3,27e-008 wartość krytyczna χ 2 dla = 0,05 oraz 1 stopnia swobody wynosi 3,841 TR2 = 32,499273 3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji Test normalności rozkładu reszt Rozkład częstości dla reszt (zmienna uhat2 przedstawiona niżej na wykresie), obserwacje 1-58 liczba przedziałów = 7, średnia = -4,46769e-013, odch.std. = 493,887 Przedziały średnia < -932,86 -1120,4 -932,86 - -557,77 -745,31 -557,77 - -182,68 -370,23 -182,68 - 192,40 4,8577 192,40 - 567,49 379,94 567,49 - 942,57 755,03 >= 942,57 1130,1 liczba 2 6 9 23 10 6 1 częstość 3,51% 10,53% 15,79% 40,35% 17,54% 10,53% 1,75% skumlowana 3,51% * 14,04% *** 29,82% ***** 70,18% ************** 87,72% ****** 98,25% *** 100,00% Brakujace obserwacje = 1 ( 1,72%) Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny: Chi-kwadrat(2) = 0,013 z wartością p 0,99363 Wartość p jak i wykres częstości reszt wskazują, że nie ma podstaw do odrzucenia H0 o normalności rozkładu częstości dla reszt. Ocena współliniowości VIF - czynnika powiększania wariancji Minimalna możliwa wartość = 1.0 Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji 8) 4) 2) Invest_1 15,974 PKB 24,996 G 9,165 VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu. Zmienne Invest_1 oraz PKB przekraczają wartość 10, co może oznaczać, że w przypadku drugiego rówania mamy do czynienia ze współliniowością. Możliwe, że nieistotność zmiennej Invest_1 spowodowana jest zależnością liniową z inną zmienną. TRZECIE RÓWNANIE Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2 Zmienna zależna: Invest Zmienna const C R Współczynnik -9633,61 0,603961 20,1951 Błąd stand. 1423,92 0,0439351 48,0882 Statystyka t -6,766 13,747 0,420 Wartość p <0,00001 *** <0,00001 *** 0,67615 Średnia arytmetyczna zmiennej zależnej = 7658,13 Odchylenie standardowe zmiennej zależnej = 1453,03 Suma kwadratów reszt = 1,0192e+007 Błąd standardowy reszt = 430,475 Wsp. determinacji R-kwadrat = 0,915309 Skorygowany wsp. R-kwadrat = 0,912229 Statystyka F (2, 55) = 297,209 (wartość p < 0,00001) Odrzucamy hipotezę zerową o łącznej nieistotności zmiennych niezależnych Statystyka testu Durbina-Watsona = 0,70465 Autokorelacja reszt rzędu pierwszego = 0,648415 Logarytm wiarygodności = -432,522 Kryterium informacyjne Akaike'a (AIC) = 871,044 Kryterium bayesowskie Schwarza (BIC) = 877,225 Kryterium infor. Hannana-Quinna (HQC) = 873,451 Poraz kolejny otrzymujemy wysoki współczynnik determinacji R 2 świadczący o dobrym dopasowaniu się regresji do danych empirycznych. Zmienność poziomu inwestycji została w dużym stopniu wyjaśniona przez zmienne objaśniające C oraz R. O ile C jest zmienną istotną, to R okazała się być nieistotna – usunięcie jej faktycznie nie wiele zmienia. Nie potwierdziły się (podobnie jak przy 2MNK) przypuszczenia, że wzrastająca stopa banku centralnego obniża wielkość inwestycji oraz jest ważnym czynnikiem determinującym poziom inwestycji. Możliwe, że gospodarka Danii jest tak atrakcyjna dla inwestorów, że nawet wzrastająca cena kredytów nie wpływa na ich skłonność do inwestowania. Dopasowanie równania do zmiennych empirycznych po dokonaniu regresji przedstawia wykres: Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) Estymacja KMNK z wykorzystaniem 58 obserwacji 1992:1-2006:2 Zmienna zależna: uhat^2 Zmienna const C R sq_C C_R sq_R Współczynnik -1,63680E+07 894,722 1,71632E+06 -0,0120128 -47,4047 -38849,1 Błąd stand. Statystyka t 1,40791E+07 -1,163 838,995 1,066 1,10865E+06 1,548 0,0125094 -0,960 33,3232 -1,423 20317,5 -1,912 Wartość p 0,25031 0,29116 0,12766 0,34135 0,16083 0,06138 * Wsp. determinacji R-kwadrat = 0,0971292 Statystyka testu: TR^2 = 5,633494 z wartością p = P(Chi-kwadrat(5) > 5,633494) = 0,343530 wartość krytyczna χ 2 dla = 0,05 oraz 5 stopni swobody wynosi 11,07 TR2 = 58∗R 2 = 5,633494 11,07 a zatem nie mamy podstaw do odrzucenia hipotezy zerowej o niewystępowaniu heteroskedastyczności reszt. Test Breuscha-Godfreya na autokorelację rzędu pierwszego Estymacja KMNK z wykorzystaniem 57 obserwacji 1992:2-2006:2 Zmienna zależna: uhat Zmienna const C R uhat_1 Współczynnik 102,267 -0,00187231 -11,6254 0,651263 Błąd stand. 1115,04 0,0343118 38,8866 0,105161 Statystyka t 0,092 -0,055 -0,299 6,193 Wartość p 0,92727 0,95669 0,76614 <0,00001 *** Wsp. determinacji R-kwadrat = 0,419897 Statystyka testu: LMF = 38,363068, z wartością p = P(F(1,53) > 38,3631) = 8,89e-008 Hipoteza zerowa: brak autokorelacji składnika losowego Alternatywna statystyka: TR^2 = 23,934123, z wartością p = P(Chi-kwadrat(1) > 23,9341) = 9,97e-007 Ljung-Box Q' = 25,2866 z wartością p = P(Chi-kwadrat(1) > 25,2866) = 4,94e-007 wartość krytyczna χ 2 dla = 0,05 oraz 1 stopnia swobody wynosi 3,841 TR2 = 23,934123 3,841 czyli odrzucamy hipotezę zerową o braku autokorelacji Test normalności rozkładu reszt Rozkład częstości dla reszt (zmienna uhat7, przedstawiona niżej na wykresie), obserwacje 1-58 liczba przedziałów = 7, średnia = 6,42919e-013, odch.std. = 430,475 Przedziały < -688,80 -688,80 - -391,65 -391,65 - -94,506 -94,506 - 202,64 202,64 - 499,79 499,79 - 796,93 >= 796,93 średnia -837,37 -540,23 -243,08 54,067 351,21 648,36 945,51 liczba 1 10 13 10 18 4 2 częstość 1,72% 17,24% 22,41% 17,24% 31,03% 6,90% 3,45% skumlowana 1,72% 18,97% ****** 41,38% ******** 58,62% ****** 89,66% *********** 96,55% ** 100,00% * Test Jarque-Bera'y. Ho: dystrybuanta empiryczna posiada rozkład normalny: Chi-kwadrat(2) = 1,218 z wartością p 0,54394 wartość krytyczna χ 2 dla = 0,05 oraz 2 stopni swobody wynosi 5,991 1,218 5,991 a zatem nie mamy podstaw do odrzucenia hipotezy zerowej o normalności rozkładu częstości dla reszt Ocena współliniowości VIF - czynnika powiększania wariancji Minimalna możliwa wartość = 1.0 Wartości > 10.0 mogą wskazywać na problem współliniowości - rozdęcia wariancji 3) 7) C 3,312 R 3,312 VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu. Żadna wartość nie przekracza 10, więc współliniowość nie występuje. 5. Opis danych/transformacji na danych Dane zostały zaimportowane z udostępnionego pliku baza_danych_metody.xls Dla wybranych zmiennych wyznaczyłem najdłuższy wspólny okres, dla którego dysponujemy danymi o tych zmiennych. W przypadku zmiennej E musiałem uzupełnić kilka obserwacji we własnym zakresie. 6. Wnioski Problemem w modelu jest występowanie autokorelacji, która jest dosyć częstym zjawiskiem dla prawdziwych danych makroekonomicznych. Autokorelacja powoduje pogorszenie się efektywności estymatorów MNK. W jednym z równań pojawiła się współliniowość. Prawdopodobnie za mała była również liczba obserwacji. Bardzo możliwe, że inne metody estymacji poradziłyby sobie lepiej z rozpatrywanym układem równań dla tych danych – co zostało nawet sprawdzone przeze mnie przez porównanie estymacji całego układu metodą 2MNK oraz ,,metodą pozornie niepowiązanych równań”. O ile wyniki estymacji poszczególnych równań metodą KMNK są w miarę zadowalające, to wyniki estymacji całego modelu łącznie 2MNK są już nieco gorsze. Możliwe, że w przypadku innych krajów model sprawdziłby się lepiej, ale dla Danii kilka moich przypuszczeń nie potwierdziło się.