DANE PANELOWE Co będziemy robić
Transkrypt
DANE PANELOWE Co będziemy robić
DANE PANELOWE Modelowanie handlu zagranicznego Co będziemy robić 1. 2. 3. 4. 5. Panele – wprowadzenie, obróbka danych Kwestia mierzenia odległości Co było najpierw: handel czy PKB? Co jeszcze ma wpływ na handel? Waluta? Czym się rożni wróbelek? Jaki jest sens badań panelowych ⇒ pooled data w ekonometrii ⇒ panele w ekonometrii ⇒ wzdłuż czy w poprzek ⇒ efekty stałe czy zmienne? Model grawitacyjny W pewnym momencie w czasie badacze: – – – – – – cała ta teoria jest bardzo fajna, ale nie bierze pod uwagę, że są koszty transportu, oraz że duży kraj to duży rynek => przyciąganie i odpychanie Isard (1954), logarytmicznie Tinbergen (1962) [co by było gdyby nie było żadnych ograniczeń w handlu, coś jak „missing trade”], Linneman (1966) [model grawitacyjny to w rzeczywistości IS-LM-BP], Anderson (1979) [pierwszy model teoretyczny – na podstawie wydatków] Helpman-Krugman (1985) [w handlu wewnątrzgałęziowym] Bergstrand (1985) [model równowagi ogólnej handlu światowego przy podziale jeden kraj - jeden czynnik] Bergstrand (1989) [model H-O z hipotezą Lindera] Wprowadzanie danych Strona internetowa: http://www.wne.uw.edu.pl/~jtyrowicz -> MHM Ściągnąć plik: zajecia_1.xls Zapisać w jakimś konkretnym miejscu Otworzyć STATę Otworzyć Exploratora Windows Skopiować z górnego okienka ścieżkę do miejsca, w którym zapisaliście plik Wpisać w STATA: cd „cała ta ścieżka tak, jak wam się przekopiowała” Wczytywanie danych do STATy Najprościej: – – – – – Otworzyć STATę Wpisać w okienku edit Pojawi się duża „tabelka” – do niej można po prostu wkleić skopiowane z Excela (czy skąd inąd) dane Nacisnąć Preserve (w lewym górnym rogu) Zapisać plik w STATa (pod dowolnie wybraną nazwą): save alamakota, replace Nieco bardziej skomplikowana, ale też bardziej niezawodna metoda: – – – Zapisać plik w Excel (albo innym programie) jako ASCII lub XML Skorzystać z aplikacji importującej w STATA (xmluse) Zawsze pojawi się kilka problemów, ale też dane będą poprawnie opisane ☺ Obejrzyjmy te dane Obejrzenie cyferek zawsze możliwe po wpisaniu słowa edit Ale możemy chcieć obejrzeć je jakoś bardziej syntetycznie, np.: – – podstawowe informacje o zmiennych: des podstawowe własności zmiennych: sum Model powinien mieć logarytmy (tak wiemy z teorii) można oczywiście opracować cały plik w Excel… – … ale Excel nie zrobi kilku przydatnych rzeczy (np. opóźnień) – STATA umie wygenerować wszystko, o co ją poprosimy ☺ gen lntrade=ln(zmienna_opisujaca_handel) label variable lntrade `”Log of trade”’ save, replace … – Najprostszy model Zmienne: Objaśniana: wymiana handlowa – Objaśniające : PKB, populacje, odległość reg trade gdp pop dist – Source SS df MS Model Residual 196764.006 129238.277 3 65588.002 1070 120.783436 Total 326002.283 1073 303.82319 trade Coef. Std. Err. t gdp pop dist _cons .0141613 .0528096 -.0073704 5.762674 .0011921 11.88 .0228549 2.31 .0005152 -14.31 1.067794 5.40 Number of obs= 1074 F( 3, 1070)= 543.02 Prob > F = 0.0000 R-squared = 0.6036 Adj R-squared= 0.6025 Root MSE = 10.99 P>t [95% Conf. Interval] 0.000 0.021 0.000 0.000 .0118221 .0079642 -.0083813 3.667467 .0165004 .097655 -.0063594 7.857882 Model panelowy Te same dane i ten sam problem Tylko bierzemy pod uwagę, że coś jest „grupą w czasie” a całość składa się z grup STATA uczy się czegoś takiego na różne sposoby 1. Wykorzystując komendy: iis nazwa_zmiennej_grupujacej tis nazwa_zmiennej_okreslajacej_czas 2. xtset nazwa_zmiennej_grupujacej nazwa_zmiennej_okreslajacej_czas 3. tsset nazwa_zmiennej_grupujacej nazwa_zmiennej_okreslajacej_czas (ta ostatnia metoda jest najczęściej wykorzystywana przy szeregach czasowych, ale zawsze działa także dla paneli) Czy dane powiedzą nam o sobie coś więcej? xtsum Regresja panelowa Generalnie STATA ma bardzo rozbudowane menu kontekstowe (Statistics oraz Graphics), więc nie trzeba wszystkiego pamiętać Pamiętanie pomaga, kiedy się wie, czego się szuka (help oraz findit) Poszukajmy możliwości zrobienia regresji panelowej: Statistics => Longtitudal/panel data – Jest tam bardzo dużo opcji: xtset, sum, des, tab (spróbujcie ☺) – Także: linear models Najprostszy kod xtreg trade pop gdp dist Wyniki panelowe Source SS df MS Model 196764.006 Residual 129238.277 3 65588.002 1070 120.783436 Total 326002.283 1073 303.82319 trade Coef. Std. Err. gdp pop dist _cons .0141613 .0528096 -.007370 5.762674 .0011921 11.88 .0228549 2.31 .0005152 -14.31 1.067794 5.40 t Number of obs F( 3, 1070) Prob > F = 0.0000 R-squared Adj R-squared Root MSE P>t [95% Conf. Interval] 0.000 0.021 0.000 0.000 .0118221 .0079642 -.0083813 3.667467 .0165004 .097655 -.0063594 7.857882 = 1074 = 543.02 = 0.6036 = 0.6025 = 10.99 Skąd wiadomo, czy to sensowne wyniki i co dostaliśmy? Zawsze można zrobić cudo: help xtreg Poza tym, trochę wiadomo z literatury, a trochę z doświadczenia – – – Warto sprawdzić, jaki dokładnie model wyestymowaliśmy (fixed czy random effects?) Jaki chcielibyśmy wyestymować? Jak sprawdzić, czy poszło nam dobrze? xttest0 Breusch and Pagan Lagrangian multiplier test for random effects trade[ID,t] = Xb + u[ID] + e[ID,t] Estimated results: Var sd = sqrt(Var) ---------+----------------------------trade 303.8232 17.43052 e 11.50993 3.392628 u 111.018 10.53651 Test: Var(u) = 0 chi2(1) = 4793.89 Prob > chi2 = 0.0000 Wnioski 1. 2. 3. 4. 5. Umiemy zadeklarować panel Umiemy przeprowadzić najprostsze analizy Wiemy, jak sprawdzić, czy miały sens Umiemy poprawić, jeśli nie miały sensu Umiemy nauczyć się więcej ☺