Pytania teoretyczne 1. Wyjasnic, co to s ˛a zmienne I(0) i I(1) i

Transkrypt

Pytania teoretyczne 1. Wyjasnic, co to s ˛a zmienne I(0) i I(1) i
Pytania teoretyczne
1. Wyjaśnić, co to sa˛ zmienne I(0) i I(1) i udowodnić, że bładzenie
˛
przypadkowe jest zmienna˛ I(1).
Rozwiazanie:
˛
P∞
Zmienna˛ I (0) definiuje si˛e jako zmienna˛ stacjonarny, który można przedstawić jako xt = i=0 θ i εt−i ,
gdzie εi i εj sa˛ nieskorelowane. Zmienna xt jest I(1), jeśli ∆xt jest I (0)
¢
¡
Pt
Bładzenie
˛
przypadkowe yt = yt−1 +εt , εt ∼ IID 0, σ 2 . Podstawiajac
˛ rekurencyjnie: yt = y0 + s=1 εs .
Pt
Var (yt ) = s=1 Var (εs ) = tσ 2 . Nie jest spełnione założenie o stacjonarności. Zmienna nie jest I (0).
Po zastosowaniu pierwszych różnic ∆yt = εt . E (εt ) = 0, Var (εt ) = σ 2 , Cov (εt , εt−s ) = 0 dla
s 6= 0 zmienna jest stacjonarna i jest oczywiście procesoem liniowym (można przedstawić ja jako sum˛e
nieskorelowanych εt )
2. Wyjaśnić, w jaki sposób w estymatorze efektów stałych pozbywamy si˛e wpływu efektu indywidualnego.
Rozwiazanie:
˛
Uśredniamy po czasie równanie
yit = xit β + ui + εit
otrzymujemy
gdzie y i =
PT
t=1
T
yit
, xi =
PT
t=1
T
xit
, εi =
yi =
PT
t=1
xi β + ui + εi
εit
T
Odejmujac
˛ od siebie stronami model i model uśredniny po czasie otrzymujemy:
yit − y i = (xit − xi ) β+ (εit − εi )
eliminujemy efekt indywidualny ui !
Z ADANIE 1 Dany jest model:
∆yt = α(yt−1 − βxt−1 ) + δ∆yt−1 + ²t
i wyniki nast˛epujacych
˛
regresji dla 100 obserwacji (poziom istotności α = 0, 05):
∆yt = − 0.4 yt−1 + 0.2 ∆yt−1 ,
(0.2)
(0.02)
∆xt = − 0.8 xt−1 + 0.2 ∆xt−1 ,
(0.5)
(0.1)
yt = 0.8 + 3.2 xt .
(0.1)
(0.1)
1. Czy w tym przypadku ma sens (i dlaczego) testowanie kointegracji pomi˛edzy xt i yt ?
2. Reszty MNK u
bt z regresji yt na xt zostały użyte w regresji ∆b
ut na u
bt−1 , która dała nast˛epujacy
˛ wynik
(bł˛edy standardowe w nawiasach):
∆b
ut = − 0.8 u
bt−1 .
(0.2)
Jaki jest wynik testu na kointegracj˛e? Jaka˛ postać ma ewentualny wektor kointegrujacy?
˛
3. Przeprowadzono regresj˛e ∆yt na u
bt−1 i ∆yt−1 i otrzymano
∆yt = −0.4u
bt−1 + 0.3 ∆yt−1
(0.1)
(0.1)
Jaki model został w ten sposób oszacowany? Zinterpretować parametr stojacy
˛ przed u
bt−1 .
4. Jakie ograniczenie musza˛ spełniać parametry tego modelu, by x nie było przyczyna˛ w sensie Grangera y?
Wartości krytyczne: test pierwiastka jednostkowego ADF, α = 0.05, 100 obs., bez wyrazu wolnego −1.95,
z wyrazem wolnym −3.00, Fuller (1976), test na kointegracj˛e ADF , α = 0.05, bez wyrazu wolnego −2.76,
z wyrazem wolnym −3.37, Philips i Ouliaris (1990)
Rozwiazanie:
˛
1
1. Wartość statystyki wynosi:
−0.4
= −2.
0.2
Ponieważ statystyka testowa ty = −2 < tDF (100) = −1, 95 należy uznać, że istnieje pierwiastek jednostkowy, czyli szereg yt jest zintegrowany stopnia jeden I(0).
ty =
tx =
−0.8
= −1.6.
0.5
Ponieważ statystyka testowa tx = −1.6 > tDF (100) = −1, 95 należy uznać, że istnieje pierwiastek
jednostkowy, czyli szereg yt jest zintegrowany stopnia jeden I(1). Ponieważ jeden z szeregów jest I(0),
testowanie kointegracji nie ma sensu.
2.
−0.8
= −4.
0.2
Ponieważ statystyka testowa tx = −4 < tDF (1, 100) = −2.76 odrzucamy hipotez˛e zerowa˛ o braku kointegracji należy uznać, że zmienne sa˛ skointegrowane. Postać wyestymowanego wektora kointegrujacego:
˛
a[1, −β]0 = a[1, −0.8, −3.2] dla dowolnego a.
t=
3. Oszacowno model korekty bł˛edem ECM. Wielkość −0.4 jest zwiazana
˛
z szybkościa˛ korygowania bł˛edów.
40% odchylenia od relacji długookresowej jest korygowana w ciagu
˛ roku.
4. αβ = 0 - tylko dla tego przypadku yt nie zależy od xt−1
Z ADANIE 2 Na podstawie wyników badań Polskiego Generalnego Sondażu Społecznego starano si˛e zidentyfikować zmienne, które wpływaja˛ na prawdopodbieństwo zajmowania przez dana˛ osob˛e stanowiska kierowniczego. Analizowana zmienna suplev może przyjmować trzy wartości: 1 nie jest kierownikiem, 2 kieruje szeregowymi pracownikami, 3 kieruje kierownikami. Jako zmienne objaśniajace
˛ znalazły si˛e nast˛epujace
˛ zmienne
sex (1 m˛eżczyzna, 2 kobieta), age (wiek), age2 (wiek2 ), educ ( liczba lat nauki). Poniżej znajduja˛ si˛e oszacowania
wielkości parametrów i oszacowania efektów czastkowych
˛
dla alternatywy 1 i 2 uzyskane z modelu uporzad˛
kowanego probita.
Testy przeprowadzamy na poziomie istotności α = 0.05.
Ordered probit estimates
Number of obs
LR chi2(4)
Prob > chi2
Pseudo R2
Log likelihood = -4947.6703
=
=
=
=
7990
1518.60
0.0000
0.1330
-----------------------------------------------------------------------------suplev |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.1829266
.0056096
32.61
0.000
.1719319
.1939212
age |
.0568477
.006653
8.54
0.000
.043808
.0698873
age2 | -.0004052
.0000654
-6.20
0.000
-.0005334
-.0002771
_Isex_2 | -.5340639
.0316125
-16.89
0.000
-.5960233
-.4721046
-------------+---------------------------------------------------------------_cut1 |
4.110273
.1699068
(Ancillary parameters)
_cut2 |
4.979499
.1727096
-----------------------------------------------------------------------------Marginal effects after oprobit
y = Pr(suplev==1) (predict, outcome(1))
= .78588087
-----------------------------------------------------------------------------variable |
dy/dx
Std. Err.
z
P>|z| [
95% C.I.
]
X
---------+-------------------------------------------------------------------educ | -.0533219
.00163 -32.66
0.000 -.056522 -.050122
10.5166
age | -.0165707
.00193
-8.58
0.000 -.020356 -.012785
47.1865
2
age2 |
.0001181
.00002
6.22
0.000
.000081 .000155
2468.78
_Isex_2*|
.1574484
.00931
16.91
0.000
.139203 .175693
.538673
-----------------------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1
Marginal effects after oprobit
y = Pr(suplev==2) (predict, outcome(2))
= .16580617
-----------------------------------------------------------------------------variable |
dy/dx
Std. Err.
z
P>|z| [
95% C.I.
]
X
---------+-------------------------------------------------------------------educ |
.0349658
.00135
25.89
0.000
.032319 .037612
10.5166
age |
.0108663
.00129
8.40
0.000
.008331 .013402
47.1865
age2 | -.0000775
.00001
-6.14
0.000 -.000102 -.000053
2468.78
_Isex_2*| -.1008964
.00625 -16.13
0.000 -.113155 -.088638
.538673
-----------------------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1
1. Wypisać założenia modelu uporzadkowanego
˛
probita.
2. Wyjaśnić dlaczego w przypadku takiego badania stosuje si˛e model uporzadkowanego
˛
probitowa a nie zwykła˛
regresj˛e liniowa˛ lub zwykły model probitowy.
3. Zinterpretować wielkość pseudo R2 i sprawdzić, czy wszystkie zmienne w modelu sa˛ łacznie
˛
istotne.
4. Podać list˛e zmiennych, które okazały si˛e istotne w tym modelu (uzasadnij to wielkościa˛ statystyk i p-value).
5. Zinterpretować znak przy zmiennej educ, oraz przy zmiennej zero-jedynkowej sex_2.
6. Zintepretować uzyskane wielkości efektów czastkowych
˛
dla alternatywy 1 i 2 dla zmiennych educ i sex.
7. Wyjaśnić jaka jest relacja mi˛edzy znakami tych efektów czastkowych
˛
dla poszczególnych alternatyw a
znakami parametrów modelu.
8. Oszacować efekt czastkowy
˛
dla wieku dla pierwszej alternatywy i średniej w próbie wynoszacej
˛ 47.2.
9. Używane dane pochodziły z pi˛eciu różnych lat badania,. Przetestować, czy upływ czasu nie wpływa na
postać modelu, jeśli dla modelu oszacowano po dodaniu zmiennych zero jedynkowych zwiazanych
˛
z rokiem
badania. uzyskana wielkość funkcji logarytmu funkcji wiarygodności jest równa −4944.5353.
Podpowiedź: χ20.95 (3) = 7.81, χ20.95 (4) = 9.49, χ20.95 (5) = 11.07
Rozwiazanie:
˛
1. Zmienna ukryta
yi∗
εi
=
∼
xi β + εi
N (0, 1)
i poszczególne obserwacje sa˛ niezależne. Obserwujemy y, który powstaje w sposób nast˛epujacy:
˛
yi = 0
yi = 1
..
.
jeśli yi∗ ≤ α1
jeśli α1 < yi∗ ≤ α2
..
.
yi = J
jeśli yi∗ > αJ
gdzie α1 < α2 < . . . < αJ sa˛ nieznane.
2. Zmienna zależna jest zmienna˛ dyskretna˛ o dobrze zdefiniowanym porzadku
˛
i liczbie możliwych alternatym
(3 alternatywy). W tym przypadku nie możemy stosować modelu probitowego (wi˛ecej niż dwie alternatywy)
nie powinniśmy też stosować regresji liniowej, ponieważ chcemy wyjaśnić prawdopodobieństwo alternatyw
(wartości dopasowane z regresji liniowej b˛eda˛ trudne do zintepretowania, moga˛ być np. ujemne)
3
3. 13.3% zmienności w modelu wyjaśniona przez zmienne niezależne, odrzucamy na postawie statystyki LR
hipotez˛e o tym, że wszystkie zmienne w modelu sa˛ niestotne [1518.6, 0.000 < 0.05].
4. W modelu istotne okazały si˛e zmienne: educ [32.61, 0.000 < 0.05], age [8.54, 0.000 < 0.05], age2
[−6.2, 0.000 < 0.05], sex_2 [−16.89, 0.000 < 0.05]
5. Dodatni znak przy zmiennej educ oznacza, że wraz ze wzrostem liczby lat edukacji rośnie prawdopodbieństwo, że respondent b˛edzie kierował kierownikami i maleje prawdopodobieństwo, że b˛edzie pracował
na stanowisku niekierowniczym.
6. Prawdopodobieństwo, że dana b˛edzie pracowała na stanowisku niekierowniczym maleje o 5.3% z każdym
rokiem nauki. Kobiety maja˛ o 15.7% wyższe prawdopodobieństwo pracy na stanowiskach niekierowniczych. Prawdopodbieństwo, że dana osoba b˛edzie kierowała niekierownikami rośnie o 3.4% wraz z każdym
rokiem nauki. Kobiety maja˛ o 10% niższe prawdopodobieństwo kierowania niekirownikami niż m˛eżczyźni.
7. Znak efektu czastkowego
˛
i parametru przy danej zmiennej jest jest taki sam dla ostatniej alternatywy a
odwrotny dla pierwszej. Dla pozostałych alternatyw zwiazek
˛
mi˛edzy znakiem efektemu czastkowego
˛
a
znakiem parametru jest nieustalony.
(xβ)
8. Efekt czaskowy
˛
dla modeli ze binarna˛ zmienna˛ zależna˛ jest równy ∂F∂x
= f (xβ) β k . W analizowanym
k
modelu policzone automatycznie efekty czastkowe
˛
dotycza˛ modelu, w którym wiek i wiek2 sa˛ osobnymi
zmiennymi (podczas gdy w rzeczywistości wiek2 jest funkcja˛ zmiennej wiek). Mamy wi˛ec efekt czaskowy
˛
dla wieku f (xβ) β wiek i wieku do kwadratu f (xβ) β wiek2 . Liczac
˛ bezpośrednio pochodna˛ uzysku∂F (β wiek wiek+β wiek2 wiek2 )
jemy
= f (xβ) β wiek + 2wiekf (xβ) β wiek2 . Prawidłowy efekt czastkowy
˛
∂wiek
policzony dla średnich wieku jest wi˛ec równy f (xβ) β wiek + 2wiekf (xβ) β wiek2 . Wielkości efektów
f (xb) bwiek = −.0165707 i f (xb) bwiek2 = .0001181 odczytujemy z tablicy z wynikami i otrzymujemy
całościowy efekt czaskowy
˛
na poziomie
−.0165707 + 2 × 47.2 × .0001181 = −.005 4
9. Statystyka testu LR ma postać: .
LR = 2 (−4944.53 + 4947.67) = 6.28 < χ20.95 (4) = 9.49
Testujemy zerowość 4 współczynników (jeden poziom zmiennej dyskretnej został usuni˛ety jako bazowy) a
wi˛ec właściwa˛ wartościa˛ krytyczna˛ jest χ20.95 (4). Nie ma podstaw do odrzucenia hipotezy o tym, że rok
badania nie wpływa istotnie na prawdopodobieństwo zajmowania stanowiska kierowniczego.
Z ADANIE 3 Mamy nast˛epujace
˛ próby:
1.
(a) ciag
˛ obserwacji z lat 1995-2004 opartych na statystyce dochodu narodowego zawierajacych
˛
zagregowane dochody gospodarstw domowych, wartość produkcji żywności oraz indeks cen żywności i
indeks cen pozostałych artykułów konsumpcyjnych dla Polski.
(b) prób˛e losowa˛ z roku 2000 z badań gospodarstw domowych zawierajac
˛ a˛ dochody gospodarstw domowych, wydatki na żywność oraz wartość indeksu cen żywności dla Polski i indeksu cen pozostałych
artykułów konsumpcyjnych dla Polski.
(c) prób˛e oparta˛ na badaniach z budżetów gospodarstw domowych zawierajac
˛ a˛ składajac
˛ a˛ si˛e z niezależnych prób losowych z lat 1990, 1995, 2000 zawierajacych
˛
te same zmienne co próba z punktu 1b
(d) prób˛e oparta˛ na badaniach z budżetów gospodarstw domowych zawierajac
˛ a˛ obserwacje z lat 19951999, składajac
˛ a˛ si˛e z czterech próbek (po jednej dla każdego roku) dotyczacych
˛
tych samych gospodarstw domowych w każdym roku i zawierajac
˛ a˛ te same zmienne co próba z punktu 1b
2. Określić typ prób z punktów a,b,c,d. Odpowiedź uzasadnić.
Dla każdego z poniższych pytań podać próby, na których których podstawie możnaby wyestymować dany
model lub odpowiedzieć na dane pytanie badawcze. Każda˛ odpowiedź należy uzasadnić.
3. Estymacja kształu krzywych Engla dla żywności.
4
4. Estymacja modelu popytu dla żywności.
Podpowiedź: zastanów si˛e nad stopniem zróżnicowania zmiennych objaśnijacych
˛
dla poszczególnych prób.
5. Badanie zróżnicowania dochodów i wydatków na żywność gospodarstw domowych.
6. Badanie zmian zróżnicowania zróżnicowania dochodów i wydatków na żywność gospodarstw domowych.
7. Badanie problemu długotrwałego ubóstwa i jego wpływu na poziom wydatków na żywność
8. Budowa modelu, na podstawie którego b˛edzie można określić stopień zróżnicowania popytu na żywność
opartego na nieobserwowalnych ale stałych w czasie cechach indywidualnych gospodarstw.
Rozwiazanie:
˛
1.
2. Rodzaje prób
(a) szereg czasowy: dla każdego roku dysponujemy jedna˛ obserwacja˛ dotyczac
˛ a˛ całej Polski.
(b) próba przekrojowa: dla danego roku mamy wiele obserwacji dotyczacych
˛
różnych gospodarstw domowych
(c) próba przekrojowo czasowa: dla każdego roku obserwujemy wiele obserwacji dotyczaych
˛
różnych
gospodarstw, jednak sa˛ to inne gospodarstwa dla każdego roku
(d) panel: dla każdego roku obserwujemy wiele obserwacji dotyczacych
˛
gospodarstw jednak co roku sa˛ to
te same gospodarstwa
3. Krzywa Engla jest zależnościa˛ mi˛edzy dochodem gospodarstwa a udziałem wydatków na określone dobro
(żywność) w całości wydatków. W każdej z analizowanych prób mamy tego typu informacje wi˛ec na każdej
z niech można wyestymować ten model. Najbardziej watpliwa
˛
jest jednak estymacja tego modelu na próbie
1a, ponieważ produkcja żywnosci nie musi być równa jej konsumpcji (jest jeszcze import i eksport). Także
z racji na najmniejsza˛ liczb˛e obserwacji oszacowanie na podstwawie szeregu czasowego b˛edzie najmniej
precyzyjne.
4. Estmacji funkcji popytu na żywność można dokonać na wszytkich próbach poza próba˛ przekrojowa,˛ ponieważ
funkcja popytu jest zależnościa˛ mi˛edzy wydatkami a cenami. Dla próby przekrojowej mamy tylko jedna˛
cen˛e (indeks cen żywności dla roku 2000). Nie b˛edzie wi˛ec oczywiście możliwe policzenie na tej podstawie
reakcji wydatków na zmiany cen (wystapi
˛ dokładna współliniowość mi˛edzy cena˛ a stała).
5. Badania zróżnicowania dochodów i wydatków na żywność można dokonać na podstawie wszytkich prób
poza szeregiem czasowym ponieważ w tym ostatnim przypadku dysponujemy wyłacznie
˛
danymi zagregowanymi zaś do stopnia zróżnicowania zmiennych musimy posiadać dane indywidualne.
6. Zmiany zróżnicowania dochodów i wydatków na żywność możemy przebadać na podstawie próby przekrojowo czasowej lub panelu. Nie można takiego badania przeprowadzić na danych szeregu czasowym ponieważ
sa˛ to dane zagregowane. Nie da si˛e też tego badania przeprowadzić na próbie przekrojowej, ponieważ w tym
przypadku można określić zróżnicowanie dochodów i wydatków ale tylko dla jednego roku - my zaś chcemy
śledzić zmiany zróżnicowania.
7. Gospodarstwa długotrwale ubogie można zidentyfikować jedynie jeśli obserwuje si˛e je dłużej. Takimi abserwacjami dla poszczególnych gospodarstw dysponujemy jedynie dla panelu.
8. Nieobserwowalne zróżnicowanie gospodarstw oparte na cechach nieobserwowalnych (i stałych w czasie)
można uwzgl˛ednić jedynie w modelu szacowanym na próbie panelowej.
5