1 2 ∑ Pytania teoretyczne 1. Poka˙z, ˙ze w modelu ze stał ˛aTSS

Transkrypt

1 2 ∑ Pytania teoretyczne 1. Poka˙z, ˙ze w modelu ze stał ˛aTSS
1
2
P
Pytania teoretyczne
1. Pokaż, że w modelu ze stała˛ T SS = RSS + ESS.
b +e z definicji reszty i wartości teoretycznej
y=y
b z własności hiperpłaszczyzny regresji
y=y
b 0 e = 0 z własności hiperpłaszczyzny regresji
y
³
´0 ³
´ ³
´0 ³
´
0
b +e− y
b
b +e− y
b = y
b−y
b
b−y
b + |{z}
e0 e + 2b
y 0 e − 2b
T SS = y
y
y
ye
|{z}
|{z}
{z
} RSS
|
0
0
ESS
0
0
b = lb
b e = ybl e = 0 z własności hiperpłaszczyzny regresji
ponieważ y
y, y
2. Wyprowadź estymator U M N K parametru β
Zakładamy, że macierz wariancji Var (ε) = σ 2 V = Ω. Pozostałe założenenia KM RL spełnione. Zakładamy, że istnieje L takie, że LV L0 = I. Mnożac
˛ równanie
y = Xβ + ε
przez L uzyskujemy równanie przekształcone
Ly = LXβ + Lε
które spełnia wszytkie założenia KM RL, ponieważ wariancja Var (Lε) = L Var (ε) L0 = σ 2 LV L0 =
σ 2 I. W zwiazku
˛
z tym najlepszym lniowym i nieobcia˛żonym estymatorem parametru β b˛edzie estymator
¡
¢−1 0 0
b = X 0 L0 LX
X L Ly
¡
¢−1
Ponieważ LV L0 = I wi˛ec, L−1 L−10 = V i w konsekwencji V −1 = L−1 L−10
= L0 L. Estymator
UMNK można wi˛ec zapisać jako
¡
¢−1 0 −1
¡
¢−1 0 −1
b = X 0 V −1 X
XV
y = X 0 Ω−1 X
XΩ y
IMIE˛ NAZWISKO..........................................................................
1
2
3
P
Z ADANIE 1 Chcemy oszacować funkcj˛e produkcji Cobba-Douglasa postaci
Q = ALα K β
mamy jednak tylko dane dotyczace
˛ wielkości produkcji (Q), zatrudnienia (L) i wysokości realnej stopy procentowej (r) a nie mamy danych na temat wielkości kapitału (K).
1. Wykorzystujac
˛ warunek, że w gospodarce doskonale konkurencyjnej wynagrodzenie kapitału równe jest
ich krańcowej produktywności kapitału, przekształcić model tak, by wielkość produkcji zależała jedynie od
zatrudnienia i stopy procentowej.
2. Wyjaśnij w jaki sposób można oszacować za pomoca˛ M N K parametry α, β za pomoca˛ modelu z punktu
(1).
3. Jakie warunki powinny spełniać parametry modelu z punktu (1), by funkcja produkcji charakteryzowała si˛e
stałymi przychodami skali?
Rozwiazanie:
˛
1. Krańcowa produktywność kapitału jest równa
Q
∂Q
= βALα K β−1 = β
∂K
K
w gospodarce doskonale konkurencyjnej ∂Q
˛ ac
˛ to równanie dla K otrzymujemy K = β Q
∂L = r. Rozwiazuj
r.
Wstawiaj
˛ ac
˛ do funkcji produkcji otrzymujemy:
Q = ALα β β Qβ r−β
dzielac
˛ obie strony przez Q−β i wyciagaj
˛ ac
˛ pierwiastek stopnia 1 − β otrzymujemy
1
β
α
β
Q = A 1−β β 1−β L 1−β r− 1−β
2. Po zlogarytmowaniu obu stron uzyskujemy model
³ 1
´
β
ln Q = ln A 1−β β 1−β +
α
β
ln L −
ln r
1−β
1−β
´
³ 1
β
oznaczajac
˛ przez γ 1 = ln A 1−β β 1−β , γ 2 =
β
α
1−β , γ 3 = − 1−β otrzymujemy model liniowy ln Q =
γ2
1
1
γ 1 + γ 2 ln L + γ 3 ln r. Zauważmy, że 1 − γ 3 = 1−β
, a wi˛ec β = 1 − 1−γ
. Z kolei α = 1−γ
. Wynika z
3
3
b2
γ
b =1− 1 .
b = 1−bγ a β
tego, że zgodne oszacowania prametrów α i β można uzyskać jako α
1−b
γ3
3
3. Przychody skali sa˛ stałe dla funkcji Cobba-Douglasa jeśli α + β = 1. Jeśli hipoteza ta jest prawdziwa to
α
α = 1 − β. W takim przypadku γ 2 = 1−β
= 1−β
1−β = 1. W modelu szacowanym powinno być spełnione,
że γ 2 = 1.
IMIE˛ NAZWISKO..........................................................................
1
2
3
4
5
6
7
8
9
10
11a
11b
11c
P
Z ADANIE 2 Oszacowano regresj˛e stopy bezrobocia (zmienna u) na wzroście realnego PKB (zmienna pkb) i stopie
inflacji (zmienna cpi) oraz na zmiennych zero-jedynkowych zwiazanymi
˛
z kwartałami. Regresj˛e przeprowadzono
na danych kwartalnych dla Polski z okresu 1995-2003. Wyniki regresji oraz wykresy zmiennych znajduja˛ si˛e
poniżej:
1997q1
1999q1
2001q1
2003q1
1997q1
1999q1
2001q1
2003q1
1995q1
1997q1
1999q1
2001q1
2003q1
.1
.12
.14
u
.16
.18
.2
1995q1
0
0
.1
.02
cpi
.2
pkb
.04
.3
.06
.4
.08
Source |
SS
df
MS
Number of obs =
34
-------------+-----------------------------F( 5,
28) =
6.52
Model | .020931923
5 .004186385
Prob > F
= 0.0004
Residual |
.01796652
28 .000641661
R-squared
= 0.5381
-------------+-----------------------------Adj R-squared = 0.4556
Total | .038898443
33 .001178741
Root MSE
= .02533
-----------------------------------------------------------------------------u |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pkb |
-.72455
.2843119
-2.55
0.017
-1.306937
-.1421634
cpi | -.0966945
.081363
-1.19
0.245
-.263359
.06997
_Iq_2 | -.0068327
.0119961
-0.57
0.574
-.0314056
.0177403
_Iq_3 | -.0117543
.0124543
-0.94
0.353
-.0372657
.0137572
_Iq_4 | -.0126153
.0124595
-1.01
0.320
-.0381374
.0129067
_cons |
.1980322
.0112852
17.55
0.000
.1749155
.2211489
-----------------------------------------------------------------------------Durbin-Watson(6,34)
=
.24
Breusch-Godfrey F(2,26) = 12.62 [0.0001]
Breusch-Pagan
chi2(2) = 10.41 [0.0054]
White
chi2(14) = 25.80 [0.0274]
RESET
F(3,25) = 2.01 [0.1379]
Jarque-Bera
chi(2) = 2.18 [.33723]
Chow(k=1998.1)
F(6,22) = 3.87 [0.0087]
1995q1
Przy założonym poziomie istotności α = 0.05 przeprowadzić analiz˛e wyników. Każda˛ z odpowiedzi należy
uzasadnić wielkościami odpowiednich statystyk testowych.
Podpowiedź: wartości dL i dU dla testu DW przy 34 obserwacjach, 5 zmiennych i stałej oraz α = 0.05 wynosza˛
dL = 1.15, dU = 1.81.
1. Określić, czy model jest dobrze dopasowany, czy zbiór zmiennych niezależnych istotnie objaśnia zmienna˛
zależna.˛
2. Podać, które zmienne w modelu sa˛ istotne.
3. Zbadać, czy w modelu wyst˛epuje autokorelacja.
IMIE˛ NAZWISKO..........................................................................
4. Zbadać, czy w modelu wyst˛epuje heteroskedastyczność.
5. Sprawdzić, czy forma funkcyjna modelu jest prawidłowa.
6. Przetestować, czy bład
˛ losowy w modelu ma rozkład normalny.
7. Sprawdzić, czy parametry w modelu sa˛ stabilne.
8. Zinterpretować współczynnik przy cpi.
9. Wyjaśnić na podstawie wykresów zmiennych dlaczego w modelu zawarto kwartalne zmienne sezonowe.
10. W jaki sposób należałoby weryfikować hipotez˛e mówiac
˛ a˛ o tym, że jedyna˛ zmienna˛ wpływajac
˛ a˛ na bezrobocie jest pkb?
11. Jeśli model nie spełnia założeń KMRL określić:
(a) które założenie nie jest spełnione?
(b) jakie ma to konsekwencje dla wnioskowania statystycznego?
(c) za pomoca˛ jakich metod estymacji można rozawiazać
˛ problemy sygnalizowane przez wyniki testów?
Rozwiazanie:
˛
1. Oszacowany model objaśnia prawie 54% zmienności zmiennej zależnej (współczynnik R2 = 0.538). Zbiór
zmiennych objaśniajacych
˛
(poza stała)
˛ jest łacznie
˛
istotny (F5,28 = 6.52, pvalue 0.0004 < 0.05).
2. Tylko stała i pkb sa˛ istotne w modelu na zadanym poziomie istotności (p-value dla statystyk t dla tych
zmiennych sa˛ mniejsze od 0.05).
3. Na podstawie testu Breuscha-Godfreya (0.0001 < 0.05) i Durbina-Watsona (0.24 < dL = 1.15) należy
odrzucić H0 o braku autokorelacji.
4. Na podstawie testu Breuscha-Pagana (0.0054 < 0.05) należy odrzucić H0 o braku heteroskedastyczności,
na to samo wskazuje test White’a (0.0274 < 0.05).
5. Na podstawie testu RESET (0.1379 > 0.05) nie można odrzucić hipotezy o poprawnej formie funkcyjnej.
6. Na podstawie testu Jarque’a-Bery (0.3372 > 0.05) nie można odrzucić hipotezy o normalności rozkładu
bł˛edów losowych.
7. Na podstawie testu Chowa (0.0087 < 0.05) należy odrzucić hipotez˛e o stabilności parametrów modelu w
okresach t < 1998Q1 i t ≥ 1998Q1.
8. Współczynnik przy zmiennej oznacza, że wzrost cpi o 1% spowoduje spadek stopy bezrobocia o 0.096%.
9. Na wykresie bezroocia widać, że zjwisko to ma charakter sezonowy (regularne ”zabki”
˛
na poczatku
˛ pierwszego kwartału). Aby to uwzgl˛ednić, zawarto w modelu zmienne sezonowe.
10. Hipoteze o łacznej
˛
nieistotności stałej, cpi i zmiennych kwartalnych należy testestować za pomoca˛ testu F ,
nakładajac
˛ łaczne
˛
ograniczenie na parametry przy tych zmiennych - przyrównujac
˛ je jednocześnie do zera.
11.
(a) Niespełnione jest założenie o braku autokorelacji i homoskedastyczności składnika losowego oraz o
stałości parametrów w całej próbie.
(b) W przypadku autokorelacji składnika losowego estymator MNK b jest nadal nieobcia˛żony, ale jest
nieefektywny. Obcia˛żenie estymatora macierzy wariancji-kowariancji uniemożliwia prowadzenie wnioskowania statystycznego. Z racji na niestabilność parametrów w czasie wynik regresji wydaje si˛e w całości
watpliwy.
˛
(c) Model można szacować oddzielnie na podpróbach, co umożliwi obliczenie różnych wielkości współczynników regresji. W celu wyeliminowania uzyskania prawidłowego oszacowania macierzy waraincji
kowariancji można zastosować odporna˛ macierz Newey’ego-Westa. Można też podjać
˛ prób˛e usuni˛ecia
heteroskedastyczności i heteroskedastyczności za pomoca˛ Stosowalnej UMNK.
IMIE˛ NAZWISKO..........................................................................
1
2
3
4
P
Z ADANIE 3 Uzyskano na podstawie dwóch niezależnych próbek o liczebnościach n1 i n2 oszacowania b1 i b2
parametru β w modelu:
y i = x i β + εi
Oznaczmy jako X 1 , y 1 macierze obserwacji w pierwszej próbie i odpowiednio jako X 2 , y 2 macierze obserwacji
w drugiej próbie. Załóżmy, że w obu próbkach spełnione sa˛ założenia KM RL.
Uwaga: przez niezależność próbek rozumiemy, że bł˛edy losowe w obu próbach sa˛ od siebie niezależne.
1. Zaproponowano, żeby β wyestymować za średniej ważonej nast˛epujacej
˛ średniej ważonej b1 i b2 :
b = w1 b1 + w2 b2
gdzie nielosowe wagi w1 + w2 = 1. Pokazać, że estymator ten jest nieobcia˛żony i policzyć jego wariancj˛e.
2. Pokazać, że estymator M N K policzona na połaczonych
˛
próbkach b˛edzie miał inna˛ postać niż estymator b,
że można go przedstawić jako b = W 1 b1 + W 2 b2 i że W 1 +W 2 = I.
·
¸
·
¸
y1
X1
Podpowiedź: Macierze obserwacji dla całej próby można zapisać jako y =
iX =
.
y2
X2
3. Dla szczególnego przypadku, kiedy w modelu mamy jedynie stała˛ znaleźć takie wagi w1 i w2 , dla których
estymator b b˛edzie równoważny estymatorowi b.
4. Przy założeniu, że β i σ 2 sa˛ w obu podpróbkach takie same, który z estymatorów (M N K czy b) b˛edzie
lepszy? (odpowiedź uzasadnić)
Rozwiazanie:
˛
1. Wartość oczekiwana estymatora b
¡ ¢
E b =
=
E (w1 b1 + w2 b2 ) = w1 E (b1 ) + w2 E (b2 )
w1 β+ w2 β = β
przy czym skorzystaliśmy z nieobcia˛żoności estymatora M N K w KM RL. Wariancja b
= w12 Var (b1 ) + w22 Var (b2 ) + w1 w2 Cov (b1 , b2 )
¡
¢−1
¡
¢−1
= w12 σ 21 X 01 X 1
+ w22 σ 22 X 02 X 2
Var (w1 b1 + w2 b2 )
Przy czym skorzystaliśmy z tego, że estymatory policzone na podstawie niezależnych próbek sa˛ od siebie
niezależne a wi˛ec Cov (b1 , b2 ) = 0
2. Estymator M N K ma postać
X0 X =
£
X0 y =
b
=
=
=
£
X 01
X 02
X 01
X 02
¤
·
¤
·
X1
X2
y1
y2
¸
= X 01 X 1 + X 02 X 2
¸
= X 01 y 1 + X 02 y 2
¡ 0 ¢−1 0
¡
¢−1 ¡ 0
¢
XX
X y = X 01 X 1 + X 02 X 2
X 1 y 1 + X 02 y 2
¡ 0
¢−1 0
¡
¢−1 0
X 1 X 1 + X 02 X 2
X 1 y 1 + X 01 X 1 + X 02 X 2
X 2 y2
¡ 0
¢−1 ¡ 0
¢¡ 0
¢−1 0
0
X 1X 1 + X 2X 2
X 1X 1 X 1X 1
X 1 y1
|
{z
}|
{z
}
W1
b1
¡
¢−1 0
¢−1 ¡ 0
¢¡
+ X 01 X 1 + X 02 X 2
X 2 y2
X 2 X 2 X 02 X 2
{z
}|
{z
}
|
W2
b2
i rzeczywiście
W1 + W2
=
=
¡ 0
¢−1 ¡ 0
¢ ¡
¢−1 ¡ 0
¢
X 1 X 1 + X 02 X 2
X 1 X 1 + X 01 X 1 + X 02 X 2
X 2X 2
¡ 0
¢−1 ¡ 0
¢
X 1 X 1 + X 02 X 2
X 1 X 1 + X 02 X 2 = I
IMIE˛ NAZWISKO..........................................................................


 
1
1
 .. 
 .. 
3. Jeśli X 1 =  .  i X 2 =  . , to X 01 X 1 = n1 , X 02 X 2 = n2 a X 0 X = X 01 X 1 + X 02 X 2 = n1 + n2 .
1
1
2
1
=
w
a
W 2 = n1n+n
= w2 .
Macierz W 1 = n1n+n
1
2
2
4. Jeśli β i σ 2 sa˛ takie same w obu podpróbkach, to dla próby złożonej ze wszystkich obserwacji spełnione sa˛
założenia KM RL. Z twierdzenia Gaussa-Markowa wnioskujemy, że najlepszym liniowym i niebcia˛żonym
estymatorem bazujacym
˛
na wszystkich obserwacjach jest estymator M N K. Estymator b jest liniowy i
nieobcia˛żony ale ma inna˛ postać niż estymator M N K - musi wi˛ec być gorszy niż estymator M N K (mieć
wi˛eksza˛ wariancj˛e)
IMIE˛ NAZWISKO..........................................................................