1. Na podstawie danych zawartych w pliku [zgony - E-SGH

Transkrypt

1. Na podstawie danych zawartych w pliku [zgony - E-SGH
1. Na podstawie danych zawartych w pliku [zgony niemowlat.xls] oszacuj (przy pomocy
pakietu gretl lub arkusza kalkulacyjnego) parametry MNK następującego liniowego
modelu ekonometrycznego:
ZNt = a0 + a1 ALKt + a2 P APt + a3 LOIMt + a4 P KBP Ct + ξt ,
gdzie:
ZN – zgony niemowląt na 1000 urodzeń żywych,
ALK – spożycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w przeliczeniu na alkohol 100% w litrach na osobę,
P AP – spożycie papierosów w tys. sztuk na osobę,
LOIM – przeciętna liczba osób na 1 izbę w mieszkaniu,
P KBP C – produkt krajowy brutto na 1 mieszkańca w tys. zł (ceny stałe).
(a) zinterpretuj oszacowania parametrów i oceń ich sensowność ekonomiczną. Jakie czynniki wpływające na śmiertelność niemowląt zostały, Twoim zdaniem,
niesłusznie pominięte w zaproponowanym modelu?
(b) sprawdź: hipotezę o normalności składnika losowego
(c) hipotezę o braku autokorelacji składnika losowego
(d) hipotezę o homoskedastyczności składnika losowego
(e) czy występuje współliniowość zmiennych objaśniających
(f) porównaj błędy standardowe i statystyki o istotności parametrów dla modelu ze
„zwykłymi” błędami standardowymi oraz z błędami obliczonymi wg procedury
Neweya-Westa (HAC)
(g) sprawdź stabilność parametrów
(h) dokonaj prognoz wewnątrz próby na lata 2003 - 2005. Oceń jakość prognoz.
(i) porównaj jakość prognozowania alternatywnych modeli. Użyj wszystkich znanych miar.
2. (na podstawie Wooldridge 2003) Oszacowano następujący model rocznego wynagrodzenia szefów 209 firm w roku 1990 w USA:
log wynagr
ˆ
= 4, 322
+ 0, 276 log sprzeda + 0, 0215 roe − 0, 00008 roe2
(0, 324)
(0, 033)
(0, 0129)
(0, 00026)
n = 209, R2 = 0, 282,
gdzie wynagrodzenie jest wyrażone w tys. USD, roczna sprzedaż firmy w mln USD,
natomiast roe czyli stopa zwrotu z kapitału w firmie (średnia za lata 1988–90) – w
procentach.
a) podaj i zinterpretuj elastyczność zarobków szefów względem obrotów firm, którymi
kierują,
b) ten model daje możliwość zmniejszającego się wpływu roe na zmienną objaśnianą;
1
czy ma to sens? jaka jest wartość roe, od której log wynagrodzenie zaczyna maleć?
[zauważmy przy okazji, że roe2 jest zmienną nieistotną statystycznie],
c) jaka jest elastyczność zmiennej wynagrodzenie względem roe? oblicz ją dla średnich wartości zmiennych wynagrodzenie (=1281), sprzedaż (=6924) i roe (=17,2),
d) czy wartość R2 dla tego modelu nie jest zbyt niska?
3. Dla modelu Y = a + bX1 + cX2 + dX1 · X2 + ξ oblicz:
a) przyrost Y związany z jednostkowym przyrostem X1 (dla X2 = const),
b) przyrost Y związany z jednostkowym przyrostem X2 (dla X1 = const),
c) przyrost Y związany z jednostkowym przyrostem X1 oraz jednostkowym przyrostem X2
4. (Gujarati 2004) Na zbiorze danych dla 54 obszarów metropolitalnych Demaris oszacował następujący model logitowy objaśniający wysokość stopy morderstw w obszarze:
log Ôi = 1, 1387 + 0, 0014Pi + 0, 0561Ci − 0, 4050Ri
se =
(0, 0009)
(0, 0227)
(0, 1568)
gdzie O = iloraz szans wysokiej stopy morderstw, P = wielkość populacji (w tys.)
w 1980, C = stopa wzrostu populacji od 1970 do 1980, R = wskaźnik umiejętności
czytania i pisania, se = asymptotyczne błędy standardowe.
a) Jak należy interpretować poszczególne współczynniki?
b) Które ze współczynników są statystycznie istotne?
c) Jaki będzie efekt jednostkowego wzrostu wskaźnika umiejętności czytania i pisania
na iloraz szans wyższej stopy morderstw?
d) Jaki wpływ na stopę morderstw będzie miał 1-procentowy wzrost stopy wzrostu
populacji na iloraz szans wyższej stopy morderstw?
5. Dla próby 103 miesięcznych obserwacji (od 01.1999 do 07.2007) zbadano stacjonarność zmiennej wyrażającej kurs złotego wobec euro. Na podstawie poniższych wyników oceń, czy zmienna ta jest stacjonarna:
∆EU Rt = 0, 269 − 0, 067EU Rt−1 − 0, 188∆EU Rt−1
(0, 135) (0, 033)
(0, 098)
R2 = 0, 06, DW = 1, 95
W nawiasach podano średnie błędy szacunku. Wartość krytyczna testu Dickeya i
Fullera przy poziomie istotności 5% wynosi –2,89, a wartość krytyczna z rozkładu
t-Studenta 1,98 (przy tym samym poziomie istotności).
2
6. Sprawdzono, że zmienne x, y i z są zintegrowane pierwszego stopnia. Na podstawie
150 obserwacji i przy użyciu MNK oszacowano parametry trzech następujących modeli regresji:
(1)
ŷt = 4, 4xt + 4, 1zt ADF=-1,7 DW=0,5 R2=0,95
(1,1) (0,1)
(2)
ŷt = 5, 2xt
ADF=-4,7 DW=0,6 R2=0,89
(0,6)
(3)
ŷt = 5, 5zt
ADF=0,7 DW=0,4 R2=0,85
(0,3)
Wartości krytyczne dla roszerzonego testu Dickeya-Fullera na kointegrację przy poziomie istotności 0,05, 150 obserwacji:
Statystyka ADF
Liczba zmiennych objaśniających
1
2
3
Dolna wartość krytyczna
-2,87 -3,37 -3,80
Górna wartość krytyczna
-2,64 -3,21 -3,60
Między którymi z tych zmiennych może zachodzić relacja kointegrująca?
7. Poniższy wydruk przedstawia wyniki estymacji modelu autoregresyjnego dla zwrotów
z japońskich obligacji. Odpowiedz na pytania i uzasadnij.
EQ( 3) Modelling BONDJP by OLS (using mills_obligacje.xls)
The present sample is: 7 to 960
Variable
Constant
BONDJP_1
BONDJP_2
BONDJP_3
BONDJP_4
BONDJP_5
BONDJP_6
Coefficient
0.0094062
1.0618
0.15837
-0.15675
-0.035340
0.056423
-0.086478
Std.Error
0.0092556
0.032372
0.047275
0.047540
0.047462
0.047126
0.032364
t-value
1.016
32.801
3.350
-3.297
-0.745
1.197
-2.672
t-prob PartR^2
0.3098 0.0011
0.0000 0.5319
0.0008 0.0117
0.0010 0.0113
0.4567 0.0006
0.2315 0.0015
0.0077 0.0075
R^2 = 0.996269 F(6,947) = 42146 [0.0000] $\sigma$ = 0.0376928
RSS = 1.345445925 for 7 variables and 954 observations
DW = 2.00
(a) Które zmienne modelu są statystycznie istotne?
(b) Co mówi nam statystyka Walda?
(c) Czy w modelu występuje autokorelacja składnika losowego?
(d) Czy składnik losowy w modelu jest homoskedastyczny?
(e) Czy jest to model przyczynowo-skutkowy?
8. (Zad. 6.7) Które z następujących problemów można analizować przy użyciu modelu
logitowego lub modelu probitowego:
(a) student SGH decyduje się na studiowanie za granicą przez jeden semestr,
(b) płeć pracownika ma wpływ na poziom zarobków,
3
(c) starający się o kredyt nie spłacą go,
(d) kandydat rozpocznie studia po przyjęciu go na uczelnię.
9. Korzystając z generatora liczb losowych w programie EXCEL wygeneruj proces
AR(1) , MA(2), ARIMA(1,2). Skorzystaj z funkcji LOS() oraz
ROZKŁAD.NORMALNY.S.ODW() w celu wygenerowania zmiennej białoszumowej.
Jakie wartości parametrów pozwolą wygenerować stacjonarny proces AR(1)?
10. Czy za pomocą metody najmniejszych kwadratów można oszacować jednorównaniowy model liniowy:
(a) w którym zmienną objaśniającą jest opóźniona zmienna zależna, a model nie
zawiera wyrazu wolnego?
(b) opisujący kształtowanie się produkcji zakładu (Y) od zatrudnienia robotników
w wydziale produkcji podstawowej (X1), zatrudnienia robotników w wydziałach produkcji pomocniczej (X2) oraz zatrudnienia łącznego robotników w obu
rodzajach wydziałów (X3, X3 = X1 + X2)?
(c) opisujący zależność poziomu płacy, w przedsiębiorstwie, w którego skład wchodzą zakłady wytwarzające ten sam wyrób, od wielkości produkcji w sztukach
(X1) oraz od wartości produkcji w mln zł (X2), jeśli cena zbytu produkowanego
wyrobu jest taka sama dla wszystkich zakładów?
(d) w którym występuje jedynie wyraz wolny i składnik losowy?
(e) w którym wszystkie zmienne objaśniające mają charakter jakościowy?
11. Zespół glacjologów pracujących w stacji na Antarktydzie zlecił obliczenia polegające na analizie zależności między aktywnością badawczą polarników Y a wysokością
temperatury powietrza X. Na podstawie danych miesięcznych za rok 1994 otrzymano
następujące rezultaty:
Ŷt = 16, 3 + 3, 32Xt
R2 = 0, 75
Program komputerowy był na tyle niedoskonały, że nie można było uzyskać ani informacji o odchyleniach standardowych estymatorów parametrów, ani o macierzy
wariancji – kowariancji składników losowych. W jaki sposób na podstawie podanych
informacji można ocenić, czy aktywność polarników w istotny sposób determinują
warunki atmosferyczne?
12. Na podstawie 20 obserwacji oszacowano model ekonometryczny
yt = α0 + α1 x1t + α2 x2t + εt ,
t = 1, 2, . . . , 20
Uzyskano następujące oszacowania względnych błędów szacunku odpowiednio dla
parametrów modelu: 70%, 30%, 60% oraz oszacowanie współczynnika autokorelacji
ρ̂ = 0, 5.
4
(a) Zbadaj istotność zmiennych objaśniających w tym modelu.
(b) Wyznacz wartość statystyki Durbina-Watsona.
13. (Pindyck i Rubinfeld 1976) Oszacowano następujący nieliniowy model funkcji konsumpcji dla gospodarki USA korzystając z kwartalnych danych z okresu 1946:1 –
1974:1
Ĉt = −10, 3507 + 1, 2409Yt0,9539 ,
gdzie C oznacza realną zagregowaną konsumpcję, natomiast Y – realny zagregowany
dochód do dyspozycji.
a) jaką metodą można było oszacować parametry modelu?
b) czy otrzymane wyniki świadczą o prawdziwości hipotezy o malejącej (w miarę
wzrostu dochodu) krańcowej skłonności do konsumpcji (KSK)? [wskazówka: KSK
jest pochodną konsumpcji względem dochodu],
c) oblicz i zinterpretuj KSK dla średniej wartości Y równej 417 mld USD (w warunkach roku 1958) i porównaj ją z KSK otrzymaną dla modelu liniowego oszacowanego
dla tych samych danych:
Ĉt = 7, 9852 + 0, 8905Yt .
d) zarówno model liniowy, jak i nieliniowy dobrze pasują do danych i mają parametry
istotnie różne od zera; na jakiej podstawie można dokonać wyboru jednego z tych
modeli?
5
14. Według propozycji z podręcznika Maddali (2006) strony 381-382 dla danych z tablicy
8.4 dostępnych w formacie gretl na stronie internetowej naszego podręcznika:
a) Oszacuj modele: LMP, logitowy i probitowy dla zmiennej zerojedynkowej oznaczającej dopuszczenie (lub nie) kary śmierci w danym stanie USA.
b) Oblicz i zinterpretuj wrażliwość prawdopodobieństwa dopuszczenia kary śmierci
względem zmiennej LF tj. stopy zatrudnienia w stanie w roku 1950:
– na podstawie LMP,
– na podstawie modelu logitowego,
– na podstawie modelu probitowego,
dla wartości średnich pozostałych zmiennych w modelu.
c) zbadaj dopasowanie modeli do danych.
15. Sprawdź, czy model opisujący kształtowanie się liczby kradzieży za pomocą opóźnionego o jeden okres wskaźnika ich wykrywalności oraz liczby ludności (zbiór danych
[przestepstwa PL.xls]) cechuje autokorelacja składnika losowego. Czy oba znane Ci
testy autokorelacji mają w tym przypadku zastosowanie? Dlaczego?
Czy w tym przypadku zastosowanie do oceny istotności parametrów błędów standardowych Neweya-Westa jest uzasadnione?
16. Liczba y(t) pracowników pewnego przedsiębiorstwa w roku t (t = 1, . . . , 10) opisana
jest (po odpowiednim oszacowaniu) następującym modelem:
y(t) = exp(5 − 5/t)
Odpowiedz:
a) czy do oszacowania parametrów tego modelu można użyć KMNK?
b) o ile więcej osób w porównaniu z rokiem t pracowało w tym przedsiębiorstwie w
roku t+1
c) ile osób pracowało w przedsiębiorstwie w pierwszym roku?
17. Oszacowana funkcja produkcji przyjmuje postać (t jest zmienną czasową, przyjmującą
w kolejnych okresach wartości równe t = 1, 2, . . .):
Ŷi = 3K 0,5 L0,5 e0,05t
gdzie:
Yt – wielkość produkcji
Kt - wartość kapitału zaangażowanego w proces produkcji, w tys. USD
Lt - liczba zatrudnionych pracowników.
Odpowiedz:
a) o ile wzrośnie produkcja z okresu t na okres t + 1 przy niezmienionych poziomach
kapitału i liczby pracowników?
6
b) o ile zmieni się wielkość produkcji jeśli zwiększymy nakłady kapitału i liczbę pracowników o 10%?
c) jakiego stopnia jednorodności jest to funkcja?
d) kiedy krańcowa stopa substytucji kapitału przez pracę jest równa krańcowej stopie
substytucji pracy przez kapitał?
e) jakie jest techniczne uzbrojenie pracy dla K=10 i L=100?
18. (według: Wooldridge 2003) Ile pracują kobiety? Dla próby 753 kobiet oszacowano
zależność między liczbą godzin (zmienna hours) przepracowanych w roku 1975 (dane
z USA) i zmiennymi charakteryzującymi kobietę oraz jej rodzinę. W tej próbie 428
kobiet pracowało w roku 1975 (hours > 0) natomiast 325 nie (hours = 0). Wyniki
estymacji w programie gretl są następujące:
Model PRACA KOBIET: Estymacja Tobit z wykorzystaniem 753 obserwacji 1-753
Zmienna zależna: hours
Zmienna
const
nwifeinc
educ
exper
expersq
age
kidslt6
kidsge6
Współczynnik
Błąd stand.
965,305
-8,81424
80,6456
131,564
-1,86416
-54,4050
-894,022
-16,2180
Statystyka t
449,287
4,41614
21,6835
16,2839
0,506061
7,80965
112,258
38,7426
2,149
-1,996
3,719
8,079
-3,684
-6,966
-7,964
-0,419
Wartość p
0,03167
0,04594
0,00020
<0,00001
0,00023
<0,00001
<0,00001
0,67550
**
**
***
***
***
***
***
Srednia arytmetyczna zmiennej zależnej = 740,576
Odchylenie standardowe zmiennej zależnej = 871,314
Cenzurowane obserwacje: 325 (43,2%)
Sigma (Se) = 1122,02
Logarytm wiarygodności = -3819,09
Znaczenie poszczególnych zmiennych jest następujące: nwif einc – dochód rodziny
oprócz zarobków kobiety (w tys. dolarów), educ – liczba lat nauki, exper – doświadczenie na rynku pracy w latach, expersq – kwadrat zmiennej exper, age – wiek kobiety
w latach, kidslt6 – liczba dzieci do 6 lat, kidsge6 – liczba dzieci w wieku 6-18 lat.
a) dokonaj interpretacji parametrów przy zmiennych nwif einc, educ, age, kidslt6,
kidsge6;
b) oblicz i zinterpretuj pochodną zmiennej Y ∗ (reprezentowanej dla wartości nieujemnych przez zmienną hours) względem zmiennej exper dla średniego poziomu exper
w próbie równego 10,631 lat;
7
c) wiadomo, że czynnik 1 − λ(ci )[ci + λ(ci )] ze wzoru (6.15) dla wartości średnich w
próbie równa się 0,451; oblicz efekt jednostkowego wzrostu zmiennej educ na wartości zmiennej hours pod warunkiem, że bierzemy pod uwagę jedynie obserwacje, dla
których hours > 0;
d) czynnik F (ci ) ze wzoru (6.16) dla wartości średnich w próbie równa się 0,645;
oblicz efekt jednostkowego wzrostu zmiennej educ na wartości zmiennej hours biorąc
pod uwagę wszystkie obserwacje na zmiennej hours;
e) wyjaśnij różnicę między wynikami w c) i d).
19. Na podstawie 120 obserwacji (t = 1, 2, . . . , 120) oszacowano parametry modelu ARMA
(1, 2) otrzymując następujące rezultaty:
yt = 0, 8yt–1 + ξt + 0, 6ξt−1 − 0, 4ξt−2 .
Wyznacz prognozę zmiennej yt na okres t = 121 oraz t = 122, jeżeli wiadomo, że
y120 = 7, e119 = −2, e120 = 1, gdzie et oznacza składnik resztowy z okresu t.
20. Na podstawie 100 obserwacji metodą najmniejszych kwadratów oszacowano parametry modelu ekonometrycznego w siedmiu wersjach:
(1)
ŷt = 123, 1 + 45, 5xt + 0, 4yt−1 + 15, 2xt−1 LM=2,4 R2=0,68 SIC=3,70
(12,0) (10,9) (0,1) (12,6)
(2)
ŷt = 122, 5 + 49, 9xt + 0, 5yt−1
LM=1,5 R2=0,67 SIC=3,69
(12,1) (9,7) (0,1)
(3)
ŷt = 122, 8 + 47, 2xt + 17, 9xt−1
LM=12,4 R2=0,67 SIC=3,69
(11,9) (9,7) (18,1)
(4)
ŷt = 123, 0 + 0, 6yt−1 + 35, 9xt−1
LM=1,8 R2=0,64 SIC=3,80
(12,1) (0,2) (14,1)
(5)
ŷt = 123, 5 + 50, 2xt
LM=15,7 R2=0,66 SIC=3,68
(11,5) (10,1)
(6)
ŷt = 123, 1 + 0, 4yt−1
LM=2,7 R2=0,41 SIC=4,25
(11,5) (0,15)
(7)
ŷt = 124, 7 + 44, 2xt−1
LM=15,9 R2=0,45 SIC=4,17
(10,5) (15,1)
W nawiasach przedstawiono błędy standardowe oszacowań parametrów. Obok oszacowanych modeli zapisano wartości obliczonych statystyk, gdzie LM oznacza wartość
testu mnożnika Lagrange’a na autokorelację pierwszego rzędu składnika losowego,
R2 oznacza współczynnik determinacji, a SIC oznacza wartość kryterium informacyjnego Schwarza.
Który model zostałby wybrany jako najlepszy, gdyby do wyboru modelu optymalnego zastosowano strategię:
a) od ogólnego do szczególnego,
b) od szczególnego do ogólnego,
8
c) kryterium informacyjnego?
Gdyby każdy wybrany model musiał dodatkowo spełniać warunek braku autokorelacji składnika losowego, to czy optymalny model pozostałby ten sam?
Gdyby możliwych do wykorzystania było 10 potencjalnych zmiennych objaśniających, to ile modeli należałoby oszacować, żeby sprawdzić, który model jest optymalny
ze względu na kryterium informacyjne Schwarza?
Które zmienne pozostają istotne w modelu niezależnie od jego specyfikacji?
(Wartość krytyczna testu t-Studenta wynosi 2,27; dla testy mnożnika Lagrange’a:
3,84; poziom istotności α = 0, 05)
21. Na podstawie danych zawartych w pliku [powiaty 2000.xls] oszacuj parametry MNK
następujących modeli ekonometrycznych:
a) W Y Ni = a0 + a1 P OT ROZi + εi ,
b) W Y Ni = a0 + a1 P OT ROZi + a2 LU D Mi + εi ,
c) W Y Ni = a0 + a1 P OT ROZi + a2 LU D Mi + a3 DOCHi + εi ,
d) W Y Ni = a0 + a1 P OT ROZi + a2 LU D Mi + a3 DOCHi + a4 P ROD Pi + εi ,
(opis – zad. 1.3, DOCH – dochody budżetów powiatów i miast na prawach powiatów
ogółem (mln zł)).
Dla każdego z powyższych modeli wyznacz zwykły i skorygowany współczynnik determinacji i wyciągnij na tej postawie wnioski na temat ostatecznej postaci modelu.
Sprawdź, czy zastosowanie kryterium informacyjnego Akaike’a prowadzi do takich
samych wniosków na temat końcowej postaci modelu.
22. Zaproponowano dwa alternatywne modele opisujące zgony niemowląt na 1000 urodzeń żywych:
Model A: ZNt = a0 + a1 ALKt + a2 P APt + ξt ,
Model B: ZNt = b0 + b1 LOIMt + b2 P KBP Ct + ϑt .
a) Za pomocą testu Davidsona-MacKinnona oceń kompletność konkurencyjnych modeli
b) Dokonaj wyboru między modelami A i B na podstawie znanych Ci kryteriów.
9

Podobne dokumenty