DANE PANELOWE Co będziemy robić

Transkrypt

DANE PANELOWE Co będziemy robić
DANE PANELOWE
Modelowanie handlu
zagranicznego
Co będziemy robić
1.
2.
3.
4.
5.
Panele – wprowadzenie, obróbka danych
Kwestia mierzenia odległości
Co było najpierw: handel czy PKB?
Co jeszcze ma wpływ na handel?
Waluta?
Czym się rożni wróbelek?
Jaki jest sens badań panelowych
⇒ pooled
data w ekonometrii
⇒ panele w ekonometrii
⇒ wzdłuż czy w poprzek
⇒ efekty stałe czy zmienne?
Model grawitacyjny
W pewnym momencie w czasie badacze:
–
–
–
–
–
–
cała ta teoria jest bardzo fajna, ale nie bierze pod uwagę, że
są koszty transportu, oraz że duży kraj to duży rynek =>
przyciąganie i odpychanie
Isard (1954), logarytmicznie Tinbergen (1962) [co by było
gdyby nie było żadnych ograniczeń w handlu, coś jak „missing
trade”], Linneman (1966) [model grawitacyjny to w
rzeczywistości IS-LM-BP],
Anderson (1979) [pierwszy model teoretyczny – na podstawie
wydatków]
Helpman-Krugman (1985) [w handlu wewnątrzgałęziowym]
Bergstrand (1985) [model równowagi ogólnej handlu
światowego przy podziale jeden kraj - jeden czynnik]
Bergstrand (1989) [model H-O z hipotezą Lindera]
Wprowadzanie danych
Strona internetowa:
http://www.wne.uw.edu.pl/~jtyrowicz -> MHM
Ściągnąć plik: zajecia_1.xls
Zapisać w jakimś konkretnym miejscu
Otworzyć STATę
Otworzyć Exploratora Windows
Skopiować z górnego okienka ścieżkę do miejsca, w którym
zapisaliście plik
Wpisać w STATA:
cd „cała ta ścieżka tak, jak wam się przekopiowała”
Wczytywanie danych do STATy
Najprościej:
–
–
–
–
–
Otworzyć STATę
Wpisać w okienku edit
Pojawi się duża „tabelka” – do niej można po prostu wkleić
skopiowane z Excela (czy skąd inąd) dane
Nacisnąć Preserve (w lewym górnym rogu)
Zapisać plik w STATa (pod dowolnie wybraną nazwą):
save alamakota, replace
Nieco bardziej skomplikowana, ale też bardziej niezawodna
metoda:
–
–
–
Zapisać plik w Excel (albo innym programie) jako ASCII lub XML
Skorzystać z aplikacji importującej w STATA (xmluse)
Zawsze pojawi się kilka problemów, ale też dane będą poprawnie
opisane ☺
Obejrzyjmy te dane
Obejrzenie cyferek zawsze możliwe po wpisaniu słowa edit
Ale możemy chcieć obejrzeć je jakoś bardziej syntetycznie, np.:
–
–
podstawowe informacje o zmiennych: des
podstawowe własności zmiennych: sum
Model powinien mieć logarytmy (tak wiemy z teorii)
można oczywiście opracować cały plik w Excel…
– … ale Excel nie zrobi kilku przydatnych rzeczy (np. opóźnień)
– STATA umie wygenerować wszystko, o co ją poprosimy ☺
gen lntrade=ln(zmienna_opisujaca_handel)
label variable lntrade `”Log of trade”’
save, replace
…
–
Najprostszy model
Zmienne:
Objaśniana: wymiana handlowa
– Objaśniające : PKB, populacje, odległość
reg trade gdp pop dist
–
Source
SS
df
MS
Model
Residual
196764.006
129238.277
3 65588.002
1070 120.783436
Total
326002.283
1073 303.82319
trade
Coef.
Std. Err.
t
gdp
pop
dist
_cons
.0141613
.0528096
-.0073704
5.762674
.0011921 11.88
.0228549 2.31
.0005152 -14.31
1.067794 5.40
Number of obs= 1074
F( 3, 1070)= 543.02
Prob > F = 0.0000
R-squared = 0.6036
Adj R-squared= 0.6025
Root MSE = 10.99
P>t
[95% Conf. Interval]
0.000
0.021
0.000
0.000
.0118221
.0079642
-.0083813
3.667467
.0165004
.097655
-.0063594
7.857882
Model panelowy
Te same dane i ten sam problem
Tylko bierzemy pod uwagę, że coś jest „grupą w czasie” a całość składa
się z grup
STATA uczy się czegoś takiego na różne sposoby
1. Wykorzystując komendy:
iis nazwa_zmiennej_grupujacej
tis nazwa_zmiennej_okreslajacej_czas
2. xtset nazwa_zmiennej_grupujacej nazwa_zmiennej_okreslajacej_czas
3. tsset nazwa_zmiennej_grupujacej nazwa_zmiennej_okreslajacej_czas
(ta ostatnia metoda jest najczęściej wykorzystywana przy szeregach
czasowych, ale zawsze działa także dla paneli)
Czy dane powiedzą nam o sobie coś więcej?
xtsum
Regresja panelowa
Generalnie STATA ma bardzo rozbudowane menu kontekstowe
(Statistics oraz Graphics), więc nie trzeba wszystkiego pamiętać
Pamiętanie pomaga, kiedy się wie, czego się szuka (help oraz findit)
Poszukajmy możliwości zrobienia regresji panelowej: Statistics =>
Longtitudal/panel data
–
Jest tam bardzo dużo opcji: xtset, sum, des, tab (spróbujcie ☺)
–
Także: linear models
Najprostszy kod xtreg trade pop gdp dist
Wyniki panelowe
Source
SS
df
MS
Model
196764.006
Residual 129238.277
3 65588.002
1070 120.783436
Total
326002.283
1073 303.82319
trade
Coef.
Std. Err.
gdp
pop
dist
_cons
.0141613
.0528096
-.007370
5.762674
.0011921 11.88
.0228549 2.31
.0005152 -14.31
1.067794 5.40
t
Number of obs
F( 3, 1070)
Prob > F = 0.0000
R-squared
Adj R-squared
Root MSE
P>t
[95% Conf.
Interval]
0.000
0.021
0.000
0.000
.0118221
.0079642
-.0083813
3.667467
.0165004
.097655
-.0063594
7.857882
= 1074
= 543.02
= 0.6036
= 0.6025
= 10.99
Skąd wiadomo, czy to sensowne
wyniki i co dostaliśmy?
Zawsze można zrobić cudo: help xtreg
Poza tym, trochę wiadomo z literatury, a trochę z
doświadczenia
–
–
–
Warto sprawdzić, jaki dokładnie model wyestymowaliśmy
(fixed czy random effects?)
Jaki chcielibyśmy wyestymować?
Jak sprawdzić, czy poszło nam dobrze?
xttest0
Breusch and Pagan Lagrangian multiplier test for random effects
trade[ID,t] = Xb + u[ID] + e[ID,t]
Estimated results:
Var sd = sqrt(Var)
---------+----------------------------trade
303.8232
17.43052
e
11.50993
3.392628
u
111.018
10.53651
Test: Var(u) = 0
chi2(1) = 4793.89
Prob > chi2 = 0.0000
Wnioski
1.
2.
3.
4.
5.
Umiemy zadeklarować panel
Umiemy przeprowadzić najprostsze analizy
Wiemy, jak sprawdzić, czy miały sens
Umiemy poprawić, jeśli nie miały sensu
Umiemy nauczyć się więcej ☺