Macierz wariancji kowariancji excel

Transkrypt

Macierz wariancji kowariancji excel
Ekonometria
Lista nr 2
II ZIF IiE LS gr. 8, 9
1. W tabeli poniżej przedstawiono dane o wartości miesięcznej sprzedaży jabłek w pewnym
hipermarkecie (J, tony miesięcznie), średniej cenie jabłek w tym sklepie (CJ, zł/kg) oraz średniej
cenie pomarańczy w tym sklepie (CP, zł/kg) za okres od lipca do grudnia 2005.
t
J
CJ
CP
1
6
1
7
2
6
2
6
3
4
3
6
4
3
4
5
5
2
5
4
6
3
5
3
a) Jakiego rodzaju zależności należy się spodziewać między popytem na jabłka a ceną jabłek i ceną
pomarańczy?
b) Oszacuj parametry modelu regresji:
J  0  1CJ   2CP   ,
c) Znajdź wektor reszt oraz ocenę wariancji składnika losowego S e2 .
d) Znajdź macierz wariancji kowariancji ocen parametrów oraz oblicz średnie błędy ocen
parametrów.
e) Jaką interpretację mają oceny parametrów tego modelu?
2. W pliku Dane_2.xls znajdują się dane z 10ciu kolejnych miesięcy dotyczące konsumpcji
pomarańczy (K, w kg miesięcznie) oraz dochodów (D, setki PLN na osobę miesięcznie) rodziny
Kowalskich, a także przeciętne ceny pomarańczy (C, w PLN/kg). Oszacowano (KMNK) model
(1)
K   0  1 D   2C  
otrzymując następujące wyniki (w nawiasach podano błędy standardowe):
Kˆ  4,58  1,12 D  1,08C
(7,22) (0,35) (0,45)
se  2,69
Wykonaj obliczenia w programie MS Excel i zaprezentuj wyniki.
a) Jakie są założenia standardowego modelu regresji liniowej?
b) Podaj interpretację oszacowanych parametrów w modelu (1). Co dokładnie oznacza warunek
ceteris paribus?
c) Oblicz i zinterpretuj współczynniki korelacji dla wszystkich kombinacji zmiennych K, D i C.
d) Oszacuj parametry modeli:
(2)
K   0  1 D   ,
(3)
K   0   1C   .
Jaka jest przyczyna otrzymania innych oszacowań parametrów w modelu (1) w porównaniu z
modelami (2) i (3)? Jaki warunek musi być spełniony, aby odpowiednie oszacowania w tych
modelach były takie same? Wskazówka: zastanów się nad wynikami z punktu c).
e) Załóżmy, że interesuje nas tylko bezpośredni wpływ dochodu (zmienna D) na konsumpcję
pomarańczy (zmienna K). Które oszacowanie (z modelu (1) czy (2)) jest w takim przypadku
odpowiednie? Jak będzie w przypadku, gdy interesuje nas całkowity wpływ dochodu na
konsumpcję pomarańczy?
f) Alternatywnym sposobem oszacowania bezpośredniego wpływu dochodu na konsumpcję jest
następująca dwu-stopniowa metoda regresji cząstkowej:
Krok 1. Eliminacja wpływu ceny (C) na konsumpcję (K).
Oszacuj regresję opisującą zależność K od C (taka regresja jest już oszacowana w punkcie d)
jako model (3)) i oblicz reszty modelu eK. Oszacuj regresję opisującą zależność D od C i oblicz
reszty modelu eD. Reszty eK i eD można interpretować jako zmienne “oczyszczone” z wpływu
zmiennej C. Oblicz współczynniki korelacji dla par zmiennych: eK and C; eD and C.
1
Ekonometria
Lista nr 2
II ZIF IiE LS gr. 8, 9
Krok 2.Szacowanie bezpośredniego wpływu D na K.
Oszacuj model zależności eK od eD.
Porównaj otrzymane rezultaty z oszacowaniami modelu (1).
3. W pliku Dane_2.xls znajdują dane z roku 1994 dotyczące produkcji dla grupy n = 25 firm
działających w USA w sektorze przemysłu metalowego. Dla każdej firmy podano wartości trzech
zmiennych: produkcja (P, wartość dodana w milionach dolarów), zatrudnienie (Z, całkowity
fundusz płac w milionach dolarów) kapitał (K, wartość zaangażowanego kapitału w milionach
dolarów). Wykonaj obliczenia w programie MS Excel i zaprezentuj wyniki.
a) Omów własności estymatorów KMNK.
b) Grupa badaczy postanowiła oszacować liniowy model produkcji:
(1)
P   0  1 Z   2 K  
jednakże po chwili zastanowienia poszerzono zakres badania o model log-liniowy:
(2)
ln P   0  1 ln Z   2 ln K   .
Oszacowania modeli (KMNK) są następujące (w nawiasach podano błędy standardowe):
Pˆ  281,87  2,01Z  0,06 K
ln Pˆ  0,51  0,74 ln Z  0,28 ln K
(155,16) (0,35)
c)
d)
e)
f)
g)
(0,11)
(0,56) (0,1)
(0,14)
se  520,55
se  0,29
Zinterpretuj oszacowania parametrów modelu (1) i modelu (2). Wskazówka: w modelu logliniowym parametr stojący przy zmiennej objaśniającej interpretuje się jako elastyczność
zmiennej objaśnianej (P) względem danej zmiennej objaśniającej (Z lub K).
Oblicz logarytmy wszystkich zmiennych. Narysuj wykresy dla następujących par zmiennych:
(Z, P), (K, P), (lnZ, lnP), (lnK, lnP). Dlaczego badacze zdecydowali się oszacować model logliniowy?
Na początku 1995 roku na rozpatrywanym rynku pojawiła się nowa firma, w której zakładany
roczny fundusz płac wynosi 400 milionów dolarów a kapitał 2 500 milionów dolarów.
Korzystając z oszacowanego modelu (2) wyznacz wartość produkcji (P) tej firmy w roku 1995.
Jaka jest wydajność pracy i produktywność kapitału tej firmy (jaką produkcję uzyskuje się z
jednostki pracy (kapitału))?
W styczniu 1996 w ramach oszczędności firma rozpatrywała możliwość zwolnienia części
pracowników. Zwolnienia spowodowałyby 8% zmniejszenie funduszu płac a także
zmniejszenie produkcji firmy. O ile procent zmniejszyłaby się produkcja firmy w roku 1996?
Wskazówka: skorzystaj z interpretacji elastyczności z punktu c).
Ze względu na protesty związków zawodowych firma została zmuszona do rezygnacji z planów
zwolnienia pracowników. Jako alternatywę postanowiono sprzedać jedną z mniej ważnych
fabryk oraz dwa magazyny, co spowodowało 7% spadek wartości kapitału firmy. O ile procent
zmniejszy się produkcja firmy w wyniku podjętych działań? Wskazówka: skorzystaj z
interpretacji elastyczności z punktu c).
4. W tabeli poniżej przedstawiono dane na temat wartości miesięcznej sprzedaży pewniej firmy (Y,
setki tys. zł), miesięcznych wydatków na reklamę w telewizji tej firmy (X1, tys. zł) oraz
miesięcznych wydatków na reklamę w prasie (X2, tys. zł) za okres od stycznia do czerwca 2007.
t
Y
X1
X2
1
3
1
1
2
3
2
2
3
4
4
1
4
7
4
2
5
6
5
3
6
7
6
2
Do opisu zależności między sprzedażą a wydatkami reklamowymi wybrano model:
2
Ekonometria
Lista nr 2
II ZIF IiE LS gr. 8, 9
Yt   0  1 X1,t 1   2 X 2,t 1   t .
a) Oszacuj parametry tego modelu, znajdź wektor reszt, ocenę wariancji składnika losowego S e2 ,
macierz wariancji kowariancji ocen parametrów oraz oblicz średnie błędy ocen parametrów.
b) Jaką interpretację mają oceny parametrów tego modelu?
c) Jakiej zmiany sprzedaży można się spodziewać, jeśli w bieżącym miesiącu wydatki reklamę w
telewizji spadły o 1500 zł (c.p.)?
d) Znajdź realizację 95% przedziału ufności dla parametru  2 analizowanej regresji (zakładając
normalność rozkładu estymatora parametru b2 ).
e) Dokonaj prognozy sprzedaży na lipiec 2007 roku. Jakie są założenia i źródła błędu tej prognozy?
5. Próbowano oszacować parametry następującego modelu regresji na podstawie danych rocznych z
lat 1978-1985:
yt   0  1 x1,t   2 x2,t   t .
Niestety prace przerwano. Do dziś zachowały się niektóre wyniki obliczeń cząstkowych, jednak
część z nich, a także dane wyjściowe uległy zniszczeniu. Oto zachowane dane:
  
   


T
T
X y   64  , X X   48   , y  2 , x1  2 , x 2 =0.
216 
 8 24 
Czy na podstawie tych informacji można oszacować parametry strukturalne? Jeśli tak, dokonaj
odpowiednich obliczeń.
6. Oblicz ocenę parametru a1 liniowego modelu ekonometrycznego Yˆ  a1 X 1  a2 X 2  a3 X 3  a0
wiedząc, że:
8
 26 13 20
 13 11 15
 7 
T

X X
 20 15 22  10


5 
 8  7  10
Wyznacznik macierzy XTX wynosi 36. Obserwacje zmiennych zawiera tabela:
Y
X1
X2
X3
1
-4
-2
-3
2
-3
-1
-2
3
-1
-2
-2
4
0
-1
-1
5
0
-1
-2
7. Dlaczego w zad. 3.10 str. 72 w podręczniku pod red. prof. Dziechciarza nie można oszacować
parametrów modelu ekonometrycznego? (Wskazówka: pomyśl, nie obliczaj niczego)
Treść: W pewnej firmie w ciągu 5 miesięcy stwierdzono następujące wartości 6 zmiennych:
x2
x3
x4
x5
x6
Miesiąc x1
1 2,5 0,13 25 12,5 1457 11
2 2,4 0,21 25 13,4 1452 12
3 2,3 0,19 25 13,8 1448 13
4 2,4 0,05 25 14,0 1463 13
5 2,2 0,09 25 14,2 1469 14
gdzie:
X1 – koszty jednostkowe, w tys. zł/szt.,
3
Ekonometria
Lista nr 2
II ZIF IiE LS gr. 8, 9
X 2 – udział braków w produkcji całkowitej, w %,
X 3 – liczba pracowników bezpośrednio produkcyjnych, w osobach,
X 4 – zużycie energii elektrycznej, w MWh,
X 5 – przeciętne wynagrodzenie miesięczne pracowników bezpośrednio produkcyjnych, w zł,
X 6 – poziom produkcji, w tys. szt.
Oszacować model opisujący zależność wielkości produkcji od zatrudnienia pracowników
bezpośrednio produkcyjnych i zużycia energii elektrycznej.
8. Zadanie na podstawie zad. 3.17 ze strony 73 z podręcznika pod red. prof. Dziechciarza.
Wykaż, że parametrów  ,  ,  ,  modelu ekonometrycznego:
Z    X  Y   X  Y    
nie można oszacować żadną metodą (model jest nieidentyfikowalny).
Dodatek teoretyczny
Oznaczenia:
K – liczba szacowanych parametrów modelu regresji
m – liczba zmiennych objaśniających w modelu regresji
n – liczba obserwacji (liczebność próby)
We wszystkich zadaniach przyjmuje się, że wszystkie założenia MNK są spełnione.
1. Dana jest macierz obserwacji zmiennych objaśniających X o wymiarach n × K, n>K. Ile wynosi
maksymalny rząd tej macierzy r(X)? W jakiej sytuacji r(X)=K?. Kiedy tak nie jest? Podaj przykład.
2. Dana jest pewna macierz M:


1
M  I  X XTX XT
gdzie X jest wymiaru n × K, n>K, a I to macierz jednostkowa wymiaru n × n.
Wykaż, że:
a) macierz M jest idempotentna: M  M  M ,
b) macierz M jest symetryczna: M T  M ,
c) ślad macierzy M wynosi: tr M   n  K , gdzie n i K to wymiary macierzy X tak jak w
zadaniu poprzednim,
d) macierz M jest osobliwa: det M   0 .
3. Wykaż, że:
a) X T e  0Kx1 , gdzie e to reszty modelu ekonometrycznego e  y  Xb , a 0 to wektor zerowy,
b) yˆ T e  0 (skalar),
c)  ei  0 , jeżeli w modelu występuje wyraz wolny.
i
4. Wykaż, że:
a)
b)
c)
d)
e)
e  My
e  M
eT e  yT My
eT e   T M
eT e  yT y  bT X T y
5. Wykaż nieobciążoność estymatora metody najmniejszych kwadratów:
E b   
4
Ekonometria
Lista nr 2
II ZIF IiE LS gr. 8, 9
6. Wykaż, że wariancja estymatora metody najmniejszych kwadratów wynosi:

var b    2 X T X
Wskazówka: pokaż najpierw, że:

b    XTX
a następnie oblicz:

1

1
X T
b   b   T
i znajdź wartość oczekiwaną tego wyrażenia.
7. Wykaż, że S e2 :
S e2 
e
2
i
nK
jest nieobciążonym estymatorem nieznanej wariancji składnika losowego  2 .
8. Wykaż, że
D 2 b   S e2 X T X 
jest nieobciążonym estymatorem dla var(b).
1
9. W twierdzeniu Gaussa-Markowa jest mowa, że dowolny liniowy nieobciążony estymator inny
niż estymator KMNK ma macierz wariancji większą o pewną nieujemnie określoną macierz. Podaj
przykłady takich macierzy dla K=2 oraz K=3.
10. Niech:

TSS    yi  y   y  y   y  y  (Total Sum of Squares)
2
i


 
ESS   yˆ i  yˆ  yˆ  yˆ
2
T
 yˆ  yˆ  (Explained Sum of Squares)
T
i

RSS   ei2  eT e (Residual Sum of Squares)
i
gdzie ŷ oznacza średnią z wartości teoretycznych zmiennej objaśnianej.
Wykaż, że w modelu z wyrazem wolnym (stałą):
TSS = ESS + RSS.
Wskazówka: Zacznij od pokazania, że w modelu ze stałą (wyrazem wolnym) y  yˆ .
5