Pytania teoretyczne 1. Wyjasnic, co to s ˛a zmienne I(0) i I(1) i
Transkrypt
Pytania teoretyczne 1. Wyjasnic, co to s ˛a zmienne I(0) i I(1) i
Pytania teoretyczne 1. Wyjaśnić, co to sa˛ zmienne I(0) i I(1) i udowodnić, że bładzenie ˛ przypadkowe jest zmienna˛ I(1). Rozwiazanie: ˛ P∞ Zmienna˛ I (0) definiuje si˛e jako zmienna˛ stacjonarny, który można przedstawić jako xt = i=0 θ i εt−i , gdzie εi i εj sa˛ nieskorelowane. Zmienna xt jest I(1), jeśli ∆xt jest I (0) ¢ ¡ Pt Bładzenie ˛ przypadkowe yt = yt−1 +εt , εt ∼ IID 0, σ 2 . Podstawiajac ˛ rekurencyjnie: yt = y0 + s=1 εs . Pt Var (yt ) = s=1 Var (εs ) = tσ 2 . Nie jest spełnione założenie o stacjonarności. Zmienna nie jest I (0). Po zastosowaniu pierwszych różnic ∆yt = εt . E (εt ) = 0, Var (εt ) = σ 2 , Cov (εt , εt−s ) = 0 dla s 6= 0 zmienna jest stacjonarna i jest oczywiście procesoem liniowym (można przedstawić ja jako sum˛e nieskorelowanych εt ) 2. Wyjaśnić, w jaki sposób w estymatorze efektów stałych pozbywamy si˛e wpływu efektu indywidualnego. Rozwiazanie: ˛ Uśredniamy po czasie równanie yit = xit β + ui + εit otrzymujemy gdzie y i = PT t=1 T yit , xi = PT t=1 T xit , εi = yi = PT t=1 xi β + ui + εi εit T Odejmujac ˛ od siebie stronami model i model uśredniny po czasie otrzymujemy: yit − y i = (xit − xi ) β+ (εit − εi ) eliminujemy efekt indywidualny ui ! Z ADANIE 1 Dany jest model: ∆yt = α(yt−1 − βxt−1 ) + δ∆yt−1 + ²t i wyniki nast˛epujacych ˛ regresji dla 100 obserwacji (poziom istotności α = 0, 05): ∆yt = − 0.4 yt−1 + 0.2 ∆yt−1 , (0.2) (0.02) ∆xt = − 0.8 xt−1 + 0.2 ∆xt−1 , (0.5) (0.1) yt = 0.8 + 3.2 xt . (0.1) (0.1) 1. Czy w tym przypadku ma sens (i dlaczego) testowanie kointegracji pomi˛edzy xt i yt ? 2. Reszty MNK u bt z regresji yt na xt zostały użyte w regresji ∆b ut na u bt−1 , która dała nast˛epujacy ˛ wynik (bł˛edy standardowe w nawiasach): ∆b ut = − 0.8 u bt−1 . (0.2) Jaki jest wynik testu na kointegracj˛e? Jaka˛ postać ma ewentualny wektor kointegrujacy? ˛ 3. Przeprowadzono regresj˛e ∆yt na u bt−1 i ∆yt−1 i otrzymano ∆yt = −0.4u bt−1 + 0.3 ∆yt−1 (0.1) (0.1) Jaki model został w ten sposób oszacowany? Zinterpretować parametr stojacy ˛ przed u bt−1 . 4. Jakie ograniczenie musza˛ spełniać parametry tego modelu, by x nie było przyczyna˛ w sensie Grangera y? Wartości krytyczne: test pierwiastka jednostkowego ADF, α = 0.05, 100 obs., bez wyrazu wolnego −1.95, z wyrazem wolnym −3.00, Fuller (1976), test na kointegracj˛e ADF , α = 0.05, bez wyrazu wolnego −2.76, z wyrazem wolnym −3.37, Philips i Ouliaris (1990) Rozwiazanie: ˛ 1 1. Wartość statystyki wynosi: −0.4 = −2. 0.2 Ponieważ statystyka testowa ty = −2 < tDF (100) = −1, 95 należy uznać, że istnieje pierwiastek jednostkowy, czyli szereg yt jest zintegrowany stopnia jeden I(0). ty = tx = −0.8 = −1.6. 0.5 Ponieważ statystyka testowa tx = −1.6 > tDF (100) = −1, 95 należy uznać, że istnieje pierwiastek jednostkowy, czyli szereg yt jest zintegrowany stopnia jeden I(1). Ponieważ jeden z szeregów jest I(0), testowanie kointegracji nie ma sensu. 2. −0.8 = −4. 0.2 Ponieważ statystyka testowa tx = −4 < tDF (1, 100) = −2.76 odrzucamy hipotez˛e zerowa˛ o braku kointegracji należy uznać, że zmienne sa˛ skointegrowane. Postać wyestymowanego wektora kointegrujacego: ˛ a[1, −β]0 = a[1, −0.8, −3.2] dla dowolnego a. t= 3. Oszacowno model korekty bł˛edem ECM. Wielkość −0.4 jest zwiazana ˛ z szybkościa˛ korygowania bł˛edów. 40% odchylenia od relacji długookresowej jest korygowana w ciagu ˛ roku. 4. αβ = 0 - tylko dla tego przypadku yt nie zależy od xt−1 Z ADANIE 2 Na podstawie wyników badań Polskiego Generalnego Sondażu Społecznego starano si˛e zidentyfikować zmienne, które wpływaja˛ na prawdopodbieństwo zajmowania przez dana˛ osob˛e stanowiska kierowniczego. Analizowana zmienna suplev może przyjmować trzy wartości: 1 nie jest kierownikiem, 2 kieruje szeregowymi pracownikami, 3 kieruje kierownikami. Jako zmienne objaśniajace ˛ znalazły si˛e nast˛epujace ˛ zmienne sex (1 m˛eżczyzna, 2 kobieta), age (wiek), age2 (wiek2 ), educ ( liczba lat nauki). Poniżej znajduja˛ si˛e oszacowania wielkości parametrów i oszacowania efektów czastkowych ˛ dla alternatywy 1 i 2 uzyskane z modelu uporzad˛ kowanego probita. Testy przeprowadzamy na poziomie istotności α = 0.05. Ordered probit estimates Number of obs LR chi2(4) Prob > chi2 Pseudo R2 Log likelihood = -4947.6703 = = = = 7990 1518.60 0.0000 0.1330 -----------------------------------------------------------------------------suplev | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .1829266 .0056096 32.61 0.000 .1719319 .1939212 age | .0568477 .006653 8.54 0.000 .043808 .0698873 age2 | -.0004052 .0000654 -6.20 0.000 -.0005334 -.0002771 _Isex_2 | -.5340639 .0316125 -16.89 0.000 -.5960233 -.4721046 -------------+---------------------------------------------------------------_cut1 | 4.110273 .1699068 (Ancillary parameters) _cut2 | 4.979499 .1727096 -----------------------------------------------------------------------------Marginal effects after oprobit y = Pr(suplev==1) (predict, outcome(1)) = .78588087 -----------------------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------educ | -.0533219 .00163 -32.66 0.000 -.056522 -.050122 10.5166 age | -.0165707 .00193 -8.58 0.000 -.020356 -.012785 47.1865 2 age2 | .0001181 .00002 6.22 0.000 .000081 .000155 2468.78 _Isex_2*| .1574484 .00931 16.91 0.000 .139203 .175693 .538673 -----------------------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1 Marginal effects after oprobit y = Pr(suplev==2) (predict, outcome(2)) = .16580617 -----------------------------------------------------------------------------variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---------+-------------------------------------------------------------------educ | .0349658 .00135 25.89 0.000 .032319 .037612 10.5166 age | .0108663 .00129 8.40 0.000 .008331 .013402 47.1865 age2 | -.0000775 .00001 -6.14 0.000 -.000102 -.000053 2468.78 _Isex_2*| -.1008964 .00625 -16.13 0.000 -.113155 -.088638 .538673 -----------------------------------------------------------------------------(*) dy/dx is for discrete change of dummy variable from 0 to 1 1. Wypisać założenia modelu uporzadkowanego ˛ probita. 2. Wyjaśnić dlaczego w przypadku takiego badania stosuje si˛e model uporzadkowanego ˛ probitowa a nie zwykła˛ regresj˛e liniowa˛ lub zwykły model probitowy. 3. Zinterpretować wielkość pseudo R2 i sprawdzić, czy wszystkie zmienne w modelu sa˛ łacznie ˛ istotne. 4. Podać list˛e zmiennych, które okazały si˛e istotne w tym modelu (uzasadnij to wielkościa˛ statystyk i p-value). 5. Zinterpretować znak przy zmiennej educ, oraz przy zmiennej zero-jedynkowej sex_2. 6. Zintepretować uzyskane wielkości efektów czastkowych ˛ dla alternatywy 1 i 2 dla zmiennych educ i sex. 7. Wyjaśnić jaka jest relacja mi˛edzy znakami tych efektów czastkowych ˛ dla poszczególnych alternatyw a znakami parametrów modelu. 8. Oszacować efekt czastkowy ˛ dla wieku dla pierwszej alternatywy i średniej w próbie wynoszacej ˛ 47.2. 9. Używane dane pochodziły z pi˛eciu różnych lat badania,. Przetestować, czy upływ czasu nie wpływa na postać modelu, jeśli dla modelu oszacowano po dodaniu zmiennych zero jedynkowych zwiazanych ˛ z rokiem badania. uzyskana wielkość funkcji logarytmu funkcji wiarygodności jest równa −4944.5353. Podpowiedź: χ20.95 (3) = 7.81, χ20.95 (4) = 9.49, χ20.95 (5) = 11.07 Rozwiazanie: ˛ 1. Zmienna ukryta yi∗ εi = ∼ xi β + εi N (0, 1) i poszczególne obserwacje sa˛ niezależne. Obserwujemy y, który powstaje w sposób nast˛epujacy: ˛ yi = 0 yi = 1 .. . jeśli yi∗ ≤ α1 jeśli α1 < yi∗ ≤ α2 .. . yi = J jeśli yi∗ > αJ gdzie α1 < α2 < . . . < αJ sa˛ nieznane. 2. Zmienna zależna jest zmienna˛ dyskretna˛ o dobrze zdefiniowanym porzadku ˛ i liczbie możliwych alternatym (3 alternatywy). W tym przypadku nie możemy stosować modelu probitowego (wi˛ecej niż dwie alternatywy) nie powinniśmy też stosować regresji liniowej, ponieważ chcemy wyjaśnić prawdopodobieństwo alternatyw (wartości dopasowane z regresji liniowej b˛eda˛ trudne do zintepretowania, moga˛ być np. ujemne) 3 3. 13.3% zmienności w modelu wyjaśniona przez zmienne niezależne, odrzucamy na postawie statystyki LR hipotez˛e o tym, że wszystkie zmienne w modelu sa˛ niestotne [1518.6, 0.000 < 0.05]. 4. W modelu istotne okazały si˛e zmienne: educ [32.61, 0.000 < 0.05], age [8.54, 0.000 < 0.05], age2 [−6.2, 0.000 < 0.05], sex_2 [−16.89, 0.000 < 0.05] 5. Dodatni znak przy zmiennej educ oznacza, że wraz ze wzrostem liczby lat edukacji rośnie prawdopodbieństwo, że respondent b˛edzie kierował kierownikami i maleje prawdopodobieństwo, że b˛edzie pracował na stanowisku niekierowniczym. 6. Prawdopodobieństwo, że dana b˛edzie pracowała na stanowisku niekierowniczym maleje o 5.3% z każdym rokiem nauki. Kobiety maja˛ o 15.7% wyższe prawdopodobieństwo pracy na stanowiskach niekierowniczych. Prawdopodbieństwo, że dana osoba b˛edzie kierowała niekierownikami rośnie o 3.4% wraz z każdym rokiem nauki. Kobiety maja˛ o 10% niższe prawdopodobieństwo kierowania niekirownikami niż m˛eżczyźni. 7. Znak efektu czastkowego ˛ i parametru przy danej zmiennej jest jest taki sam dla ostatniej alternatywy a odwrotny dla pierwszej. Dla pozostałych alternatyw zwiazek ˛ mi˛edzy znakiem efektemu czastkowego ˛ a znakiem parametru jest nieustalony. (xβ) 8. Efekt czaskowy ˛ dla modeli ze binarna˛ zmienna˛ zależna˛ jest równy ∂F∂x = f (xβ) β k . W analizowanym k modelu policzone automatycznie efekty czastkowe ˛ dotycza˛ modelu, w którym wiek i wiek2 sa˛ osobnymi zmiennymi (podczas gdy w rzeczywistości wiek2 jest funkcja˛ zmiennej wiek). Mamy wi˛ec efekt czaskowy ˛ dla wieku f (xβ) β wiek i wieku do kwadratu f (xβ) β wiek2 . Liczac ˛ bezpośrednio pochodna˛ uzysku∂F (β wiek wiek+β wiek2 wiek2 ) jemy = f (xβ) β wiek + 2wiekf (xβ) β wiek2 . Prawidłowy efekt czastkowy ˛ ∂wiek policzony dla średnich wieku jest wi˛ec równy f (xβ) β wiek + 2wiekf (xβ) β wiek2 . Wielkości efektów f (xb) bwiek = −.0165707 i f (xb) bwiek2 = .0001181 odczytujemy z tablicy z wynikami i otrzymujemy całościowy efekt czaskowy ˛ na poziomie −.0165707 + 2 × 47.2 × .0001181 = −.005 4 9. Statystyka testu LR ma postać: . LR = 2 (−4944.53 + 4947.67) = 6.28 < χ20.95 (4) = 9.49 Testujemy zerowość 4 współczynników (jeden poziom zmiennej dyskretnej został usuni˛ety jako bazowy) a wi˛ec właściwa˛ wartościa˛ krytyczna˛ jest χ20.95 (4). Nie ma podstaw do odrzucenia hipotezy o tym, że rok badania nie wpływa istotnie na prawdopodobieństwo zajmowania stanowiska kierowniczego. Z ADANIE 3 Mamy nast˛epujace ˛ próby: 1. (a) ciag ˛ obserwacji z lat 1995-2004 opartych na statystyce dochodu narodowego zawierajacych ˛ zagregowane dochody gospodarstw domowych, wartość produkcji żywności oraz indeks cen żywności i indeks cen pozostałych artykułów konsumpcyjnych dla Polski. (b) prób˛e losowa˛ z roku 2000 z badań gospodarstw domowych zawierajac ˛ a˛ dochody gospodarstw domowych, wydatki na żywność oraz wartość indeksu cen żywności dla Polski i indeksu cen pozostałych artykułów konsumpcyjnych dla Polski. (c) prób˛e oparta˛ na badaniach z budżetów gospodarstw domowych zawierajac ˛ a˛ składajac ˛ a˛ si˛e z niezależnych prób losowych z lat 1990, 1995, 2000 zawierajacych ˛ te same zmienne co próba z punktu 1b (d) prób˛e oparta˛ na badaniach z budżetów gospodarstw domowych zawierajac ˛ a˛ obserwacje z lat 19951999, składajac ˛ a˛ si˛e z czterech próbek (po jednej dla każdego roku) dotyczacych ˛ tych samych gospodarstw domowych w każdym roku i zawierajac ˛ a˛ te same zmienne co próba z punktu 1b 2. Określić typ prób z punktów a,b,c,d. Odpowiedź uzasadnić. Dla każdego z poniższych pytań podać próby, na których których podstawie możnaby wyestymować dany model lub odpowiedzieć na dane pytanie badawcze. Każda˛ odpowiedź należy uzasadnić. 3. Estymacja kształu krzywych Engla dla żywności. 4 4. Estymacja modelu popytu dla żywności. Podpowiedź: zastanów si˛e nad stopniem zróżnicowania zmiennych objaśnijacych ˛ dla poszczególnych prób. 5. Badanie zróżnicowania dochodów i wydatków na żywność gospodarstw domowych. 6. Badanie zmian zróżnicowania zróżnicowania dochodów i wydatków na żywność gospodarstw domowych. 7. Badanie problemu długotrwałego ubóstwa i jego wpływu na poziom wydatków na żywność 8. Budowa modelu, na podstawie którego b˛edzie można określić stopień zróżnicowania popytu na żywność opartego na nieobserwowalnych ale stałych w czasie cechach indywidualnych gospodarstw. Rozwiazanie: ˛ 1. 2. Rodzaje prób (a) szereg czasowy: dla każdego roku dysponujemy jedna˛ obserwacja˛ dotyczac ˛ a˛ całej Polski. (b) próba przekrojowa: dla danego roku mamy wiele obserwacji dotyczacych ˛ różnych gospodarstw domowych (c) próba przekrojowo czasowa: dla każdego roku obserwujemy wiele obserwacji dotyczaych ˛ różnych gospodarstw, jednak sa˛ to inne gospodarstwa dla każdego roku (d) panel: dla każdego roku obserwujemy wiele obserwacji dotyczacych ˛ gospodarstw jednak co roku sa˛ to te same gospodarstwa 3. Krzywa Engla jest zależnościa˛ mi˛edzy dochodem gospodarstwa a udziałem wydatków na określone dobro (żywność) w całości wydatków. W każdej z analizowanych prób mamy tego typu informacje wi˛ec na każdej z niech można wyestymować ten model. Najbardziej watpliwa ˛ jest jednak estymacja tego modelu na próbie 1a, ponieważ produkcja żywnosci nie musi być równa jej konsumpcji (jest jeszcze import i eksport). Także z racji na najmniejsza˛ liczb˛e obserwacji oszacowanie na podstwawie szeregu czasowego b˛edzie najmniej precyzyjne. 4. Estmacji funkcji popytu na żywność można dokonać na wszytkich próbach poza próba˛ przekrojowa,˛ ponieważ funkcja popytu jest zależnościa˛ mi˛edzy wydatkami a cenami. Dla próby przekrojowej mamy tylko jedna˛ cen˛e (indeks cen żywności dla roku 2000). Nie b˛edzie wi˛ec oczywiście możliwe policzenie na tej podstawie reakcji wydatków na zmiany cen (wystapi ˛ dokładna współliniowość mi˛edzy cena˛ a stała). 5. Badania zróżnicowania dochodów i wydatków na żywność można dokonać na podstawie wszytkich prób poza szeregiem czasowym ponieważ w tym ostatnim przypadku dysponujemy wyłacznie ˛ danymi zagregowanymi zaś do stopnia zróżnicowania zmiennych musimy posiadać dane indywidualne. 6. Zmiany zróżnicowania dochodów i wydatków na żywność możemy przebadać na podstawie próby przekrojowo czasowej lub panelu. Nie można takiego badania przeprowadzić na danych szeregu czasowym ponieważ sa˛ to dane zagregowane. Nie da si˛e też tego badania przeprowadzić na próbie przekrojowej, ponieważ w tym przypadku można określić zróżnicowanie dochodów i wydatków ale tylko dla jednego roku - my zaś chcemy śledzić zmiany zróżnicowania. 7. Gospodarstwa długotrwale ubogie można zidentyfikować jedynie jeśli obserwuje si˛e je dłużej. Takimi abserwacjami dla poszczególnych gospodarstw dysponujemy jedynie dla panelu. 8. Nieobserwowalne zróżnicowanie gospodarstw oparte na cechach nieobserwowalnych (i stałych w czasie) można uwzgl˛ednić jedynie w modelu szacowanym na próbie panelowej. 5