1 2 ∑ Pytania teoretyczne 1. Poka˙z, ˙ze w modelu ze stał ˛aTSS
Transkrypt
1 2 ∑ Pytania teoretyczne 1. Poka˙z, ˙ze w modelu ze stał ˛aTSS
1 2 P Pytania teoretyczne 1. Pokaż, że w modelu ze stała˛ T SS = RSS + ESS. b +e z definicji reszty i wartości teoretycznej y=y b z własności hiperpłaszczyzny regresji y=y b 0 e = 0 z własności hiperpłaszczyzny regresji y ³ ´0 ³ ´ ³ ´0 ³ ´ 0 b +e− y b b +e− y b = y b−y b b−y b + |{z} e0 e + 2b y 0 e − 2b T SS = y y y ye |{z} |{z} {z } RSS | 0 0 ESS 0 0 b = lb b e = ybl e = 0 z własności hiperpłaszczyzny regresji ponieważ y y, y 2. Wyprowadź estymator U M N K parametru β Zakładamy, że macierz wariancji Var (ε) = σ 2 V = Ω. Pozostałe założenenia KM RL spełnione. Zakładamy, że istnieje L takie, że LV L0 = I. Mnożac ˛ równanie y = Xβ + ε przez L uzyskujemy równanie przekształcone Ly = LXβ + Lε które spełnia wszytkie założenia KM RL, ponieważ wariancja Var (Lε) = L Var (ε) L0 = σ 2 LV L0 = σ 2 I. W zwiazku ˛ z tym najlepszym lniowym i nieobcia˛żonym estymatorem parametru β b˛edzie estymator ¡ ¢−1 0 0 b = X 0 L0 LX X L Ly ¡ ¢−1 Ponieważ LV L0 = I wi˛ec, L−1 L−10 = V i w konsekwencji V −1 = L−1 L−10 = L0 L. Estymator UMNK można wi˛ec zapisać jako ¡ ¢−1 0 −1 ¡ ¢−1 0 −1 b = X 0 V −1 X XV y = X 0 Ω−1 X XΩ y IMIE˛ NAZWISKO.......................................................................... 1 2 3 P Z ADANIE 1 Chcemy oszacować funkcj˛e produkcji Cobba-Douglasa postaci Q = ALα K β mamy jednak tylko dane dotyczace ˛ wielkości produkcji (Q), zatrudnienia (L) i wysokości realnej stopy procentowej (r) a nie mamy danych na temat wielkości kapitału (K). 1. Wykorzystujac ˛ warunek, że w gospodarce doskonale konkurencyjnej wynagrodzenie kapitału równe jest ich krańcowej produktywności kapitału, przekształcić model tak, by wielkość produkcji zależała jedynie od zatrudnienia i stopy procentowej. 2. Wyjaśnij w jaki sposób można oszacować za pomoca˛ M N K parametry α, β za pomoca˛ modelu z punktu (1). 3. Jakie warunki powinny spełniać parametry modelu z punktu (1), by funkcja produkcji charakteryzowała si˛e stałymi przychodami skali? Rozwiazanie: ˛ 1. Krańcowa produktywność kapitału jest równa Q ∂Q = βALα K β−1 = β ∂K K w gospodarce doskonale konkurencyjnej ∂Q ˛ ac ˛ to równanie dla K otrzymujemy K = β Q ∂L = r. Rozwiazuj r. Wstawiaj ˛ ac ˛ do funkcji produkcji otrzymujemy: Q = ALα β β Qβ r−β dzielac ˛ obie strony przez Q−β i wyciagaj ˛ ac ˛ pierwiastek stopnia 1 − β otrzymujemy 1 β α β Q = A 1−β β 1−β L 1−β r− 1−β 2. Po zlogarytmowaniu obu stron uzyskujemy model ³ 1 ´ β ln Q = ln A 1−β β 1−β + α β ln L − ln r 1−β 1−β ´ ³ 1 β oznaczajac ˛ przez γ 1 = ln A 1−β β 1−β , γ 2 = β α 1−β , γ 3 = − 1−β otrzymujemy model liniowy ln Q = γ2 1 1 γ 1 + γ 2 ln L + γ 3 ln r. Zauważmy, że 1 − γ 3 = 1−β , a wi˛ec β = 1 − 1−γ . Z kolei α = 1−γ . Wynika z 3 3 b2 γ b =1− 1 . b = 1−bγ a β tego, że zgodne oszacowania prametrów α i β można uzyskać jako α 1−b γ3 3 3. Przychody skali sa˛ stałe dla funkcji Cobba-Douglasa jeśli α + β = 1. Jeśli hipoteza ta jest prawdziwa to α α = 1 − β. W takim przypadku γ 2 = 1−β = 1−β 1−β = 1. W modelu szacowanym powinno być spełnione, że γ 2 = 1. IMIE˛ NAZWISKO.......................................................................... 1 2 3 4 5 6 7 8 9 10 11a 11b 11c P Z ADANIE 2 Oszacowano regresj˛e stopy bezrobocia (zmienna u) na wzroście realnego PKB (zmienna pkb) i stopie inflacji (zmienna cpi) oraz na zmiennych zero-jedynkowych zwiazanymi ˛ z kwartałami. Regresj˛e przeprowadzono na danych kwartalnych dla Polski z okresu 1995-2003. Wyniki regresji oraz wykresy zmiennych znajduja˛ si˛e poniżej: 1997q1 1999q1 2001q1 2003q1 1997q1 1999q1 2001q1 2003q1 1995q1 1997q1 1999q1 2001q1 2003q1 .1 .12 .14 u .16 .18 .2 1995q1 0 0 .1 .02 cpi .2 pkb .04 .3 .06 .4 .08 Source | SS df MS Number of obs = 34 -------------+-----------------------------F( 5, 28) = 6.52 Model | .020931923 5 .004186385 Prob > F = 0.0004 Residual | .01796652 28 .000641661 R-squared = 0.5381 -------------+-----------------------------Adj R-squared = 0.4556 Total | .038898443 33 .001178741 Root MSE = .02533 -----------------------------------------------------------------------------u | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------pkb | -.72455 .2843119 -2.55 0.017 -1.306937 -.1421634 cpi | -.0966945 .081363 -1.19 0.245 -.263359 .06997 _Iq_2 | -.0068327 .0119961 -0.57 0.574 -.0314056 .0177403 _Iq_3 | -.0117543 .0124543 -0.94 0.353 -.0372657 .0137572 _Iq_4 | -.0126153 .0124595 -1.01 0.320 -.0381374 .0129067 _cons | .1980322 .0112852 17.55 0.000 .1749155 .2211489 -----------------------------------------------------------------------------Durbin-Watson(6,34) = .24 Breusch-Godfrey F(2,26) = 12.62 [0.0001] Breusch-Pagan chi2(2) = 10.41 [0.0054] White chi2(14) = 25.80 [0.0274] RESET F(3,25) = 2.01 [0.1379] Jarque-Bera chi(2) = 2.18 [.33723] Chow(k=1998.1) F(6,22) = 3.87 [0.0087] 1995q1 Przy założonym poziomie istotności α = 0.05 przeprowadzić analiz˛e wyników. Każda˛ z odpowiedzi należy uzasadnić wielkościami odpowiednich statystyk testowych. Podpowiedź: wartości dL i dU dla testu DW przy 34 obserwacjach, 5 zmiennych i stałej oraz α = 0.05 wynosza˛ dL = 1.15, dU = 1.81. 1. Określić, czy model jest dobrze dopasowany, czy zbiór zmiennych niezależnych istotnie objaśnia zmienna˛ zależna.˛ 2. Podać, które zmienne w modelu sa˛ istotne. 3. Zbadać, czy w modelu wyst˛epuje autokorelacja. IMIE˛ NAZWISKO.......................................................................... 4. Zbadać, czy w modelu wyst˛epuje heteroskedastyczność. 5. Sprawdzić, czy forma funkcyjna modelu jest prawidłowa. 6. Przetestować, czy bład ˛ losowy w modelu ma rozkład normalny. 7. Sprawdzić, czy parametry w modelu sa˛ stabilne. 8. Zinterpretować współczynnik przy cpi. 9. Wyjaśnić na podstawie wykresów zmiennych dlaczego w modelu zawarto kwartalne zmienne sezonowe. 10. W jaki sposób należałoby weryfikować hipotez˛e mówiac ˛ a˛ o tym, że jedyna˛ zmienna˛ wpływajac ˛ a˛ na bezrobocie jest pkb? 11. Jeśli model nie spełnia założeń KMRL określić: (a) które założenie nie jest spełnione? (b) jakie ma to konsekwencje dla wnioskowania statystycznego? (c) za pomoca˛ jakich metod estymacji można rozawiazać ˛ problemy sygnalizowane przez wyniki testów? Rozwiazanie: ˛ 1. Oszacowany model objaśnia prawie 54% zmienności zmiennej zależnej (współczynnik R2 = 0.538). Zbiór zmiennych objaśniajacych ˛ (poza stała) ˛ jest łacznie ˛ istotny (F5,28 = 6.52, pvalue 0.0004 < 0.05). 2. Tylko stała i pkb sa˛ istotne w modelu na zadanym poziomie istotności (p-value dla statystyk t dla tych zmiennych sa˛ mniejsze od 0.05). 3. Na podstawie testu Breuscha-Godfreya (0.0001 < 0.05) i Durbina-Watsona (0.24 < dL = 1.15) należy odrzucić H0 o braku autokorelacji. 4. Na podstawie testu Breuscha-Pagana (0.0054 < 0.05) należy odrzucić H0 o braku heteroskedastyczności, na to samo wskazuje test White’a (0.0274 < 0.05). 5. Na podstawie testu RESET (0.1379 > 0.05) nie można odrzucić hipotezy o poprawnej formie funkcyjnej. 6. Na podstawie testu Jarque’a-Bery (0.3372 > 0.05) nie można odrzucić hipotezy o normalności rozkładu bł˛edów losowych. 7. Na podstawie testu Chowa (0.0087 < 0.05) należy odrzucić hipotez˛e o stabilności parametrów modelu w okresach t < 1998Q1 i t ≥ 1998Q1. 8. Współczynnik przy zmiennej oznacza, że wzrost cpi o 1% spowoduje spadek stopy bezrobocia o 0.096%. 9. Na wykresie bezroocia widać, że zjwisko to ma charakter sezonowy (regularne ”zabki” ˛ na poczatku ˛ pierwszego kwartału). Aby to uwzgl˛ednić, zawarto w modelu zmienne sezonowe. 10. Hipoteze o łacznej ˛ nieistotności stałej, cpi i zmiennych kwartalnych należy testestować za pomoca˛ testu F , nakładajac ˛ łaczne ˛ ograniczenie na parametry przy tych zmiennych - przyrównujac ˛ je jednocześnie do zera. 11. (a) Niespełnione jest założenie o braku autokorelacji i homoskedastyczności składnika losowego oraz o stałości parametrów w całej próbie. (b) W przypadku autokorelacji składnika losowego estymator MNK b jest nadal nieobcia˛żony, ale jest nieefektywny. Obcia˛żenie estymatora macierzy wariancji-kowariancji uniemożliwia prowadzenie wnioskowania statystycznego. Z racji na niestabilność parametrów w czasie wynik regresji wydaje si˛e w całości watpliwy. ˛ (c) Model można szacować oddzielnie na podpróbach, co umożliwi obliczenie różnych wielkości współczynników regresji. W celu wyeliminowania uzyskania prawidłowego oszacowania macierzy waraincji kowariancji można zastosować odporna˛ macierz Newey’ego-Westa. Można też podjać ˛ prób˛e usuni˛ecia heteroskedastyczności i heteroskedastyczności za pomoca˛ Stosowalnej UMNK. IMIE˛ NAZWISKO.......................................................................... 1 2 3 4 P Z ADANIE 3 Uzyskano na podstawie dwóch niezależnych próbek o liczebnościach n1 i n2 oszacowania b1 i b2 parametru β w modelu: y i = x i β + εi Oznaczmy jako X 1 , y 1 macierze obserwacji w pierwszej próbie i odpowiednio jako X 2 , y 2 macierze obserwacji w drugiej próbie. Załóżmy, że w obu próbkach spełnione sa˛ założenia KM RL. Uwaga: przez niezależność próbek rozumiemy, że bł˛edy losowe w obu próbach sa˛ od siebie niezależne. 1. Zaproponowano, żeby β wyestymować za średniej ważonej nast˛epujacej ˛ średniej ważonej b1 i b2 : b = w1 b1 + w2 b2 gdzie nielosowe wagi w1 + w2 = 1. Pokazać, że estymator ten jest nieobcia˛żony i policzyć jego wariancj˛e. 2. Pokazać, że estymator M N K policzona na połaczonych ˛ próbkach b˛edzie miał inna˛ postać niż estymator b, że można go przedstawić jako b = W 1 b1 + W 2 b2 i że W 1 +W 2 = I. · ¸ · ¸ y1 X1 Podpowiedź: Macierze obserwacji dla całej próby można zapisać jako y = iX = . y2 X2 3. Dla szczególnego przypadku, kiedy w modelu mamy jedynie stała˛ znaleźć takie wagi w1 i w2 , dla których estymator b b˛edzie równoważny estymatorowi b. 4. Przy założeniu, że β i σ 2 sa˛ w obu podpróbkach takie same, który z estymatorów (M N K czy b) b˛edzie lepszy? (odpowiedź uzasadnić) Rozwiazanie: ˛ 1. Wartość oczekiwana estymatora b ¡ ¢ E b = = E (w1 b1 + w2 b2 ) = w1 E (b1 ) + w2 E (b2 ) w1 β+ w2 β = β przy czym skorzystaliśmy z nieobcia˛żoności estymatora M N K w KM RL. Wariancja b = w12 Var (b1 ) + w22 Var (b2 ) + w1 w2 Cov (b1 , b2 ) ¡ ¢−1 ¡ ¢−1 = w12 σ 21 X 01 X 1 + w22 σ 22 X 02 X 2 Var (w1 b1 + w2 b2 ) Przy czym skorzystaliśmy z tego, że estymatory policzone na podstawie niezależnych próbek sa˛ od siebie niezależne a wi˛ec Cov (b1 , b2 ) = 0 2. Estymator M N K ma postać X0 X = £ X0 y = b = = = £ X 01 X 02 X 01 X 02 ¤ · ¤ · X1 X2 y1 y2 ¸ = X 01 X 1 + X 02 X 2 ¸ = X 01 y 1 + X 02 y 2 ¡ 0 ¢−1 0 ¡ ¢−1 ¡ 0 ¢ XX X y = X 01 X 1 + X 02 X 2 X 1 y 1 + X 02 y 2 ¡ 0 ¢−1 0 ¡ ¢−1 0 X 1 X 1 + X 02 X 2 X 1 y 1 + X 01 X 1 + X 02 X 2 X 2 y2 ¡ 0 ¢−1 ¡ 0 ¢¡ 0 ¢−1 0 0 X 1X 1 + X 2X 2 X 1X 1 X 1X 1 X 1 y1 | {z }| {z } W1 b1 ¡ ¢−1 0 ¢−1 ¡ 0 ¢¡ + X 01 X 1 + X 02 X 2 X 2 y2 X 2 X 2 X 02 X 2 {z }| {z } | W2 b2 i rzeczywiście W1 + W2 = = ¡ 0 ¢−1 ¡ 0 ¢ ¡ ¢−1 ¡ 0 ¢ X 1 X 1 + X 02 X 2 X 1 X 1 + X 01 X 1 + X 02 X 2 X 2X 2 ¡ 0 ¢−1 ¡ 0 ¢ X 1 X 1 + X 02 X 2 X 1 X 1 + X 02 X 2 = I IMIE˛ NAZWISKO.......................................................................... 1 1 .. .. 3. Jeśli X 1 = . i X 2 = . , to X 01 X 1 = n1 , X 02 X 2 = n2 a X 0 X = X 01 X 1 + X 02 X 2 = n1 + n2 . 1 1 2 1 = w a W 2 = n1n+n = w2 . Macierz W 1 = n1n+n 1 2 2 4. Jeśli β i σ 2 sa˛ takie same w obu podpróbkach, to dla próby złożonej ze wszystkich obserwacji spełnione sa˛ założenia KM RL. Z twierdzenia Gaussa-Markowa wnioskujemy, że najlepszym liniowym i niebcia˛żonym estymatorem bazujacym ˛ na wszystkich obserwacjach jest estymator M N K. Estymator b jest liniowy i nieobcia˛żony ale ma inna˛ postać niż estymator M N K - musi wi˛ec być gorszy niż estymator M N K (mieć wi˛eksza˛ wariancj˛e) IMIE˛ NAZWISKO..........................................................................