Macierz wariancji kowariancji excel
Transkrypt
Macierz wariancji kowariancji excel
Ekonometria Lista nr 2 II ZIF IiE LS gr. 8, 9 1. W tabeli poniżej przedstawiono dane o wartości miesięcznej sprzedaży jabłek w pewnym hipermarkecie (J, tony miesięcznie), średniej cenie jabłek w tym sklepie (CJ, zł/kg) oraz średniej cenie pomarańczy w tym sklepie (CP, zł/kg) za okres od lipca do grudnia 2005. t J CJ CP 1 6 1 7 2 6 2 6 3 4 3 6 4 3 4 5 5 2 5 4 6 3 5 3 a) Jakiego rodzaju zależności należy się spodziewać między popytem na jabłka a ceną jabłek i ceną pomarańczy? b) Oszacuj parametry modelu regresji: J 0 1CJ 2CP , c) Znajdź wektor reszt oraz ocenę wariancji składnika losowego S e2 . d) Znajdź macierz wariancji kowariancji ocen parametrów oraz oblicz średnie błędy ocen parametrów. e) Jaką interpretację mają oceny parametrów tego modelu? 2. W pliku Dane_2.xls znajdują się dane z 10ciu kolejnych miesięcy dotyczące konsumpcji pomarańczy (K, w kg miesięcznie) oraz dochodów (D, setki PLN na osobę miesięcznie) rodziny Kowalskich, a także przeciętne ceny pomarańczy (C, w PLN/kg). Oszacowano (KMNK) model (1) K 0 1 D 2C otrzymując następujące wyniki (w nawiasach podano błędy standardowe): Kˆ 4,58 1,12 D 1,08C (7,22) (0,35) (0,45) se 2,69 Wykonaj obliczenia w programie MS Excel i zaprezentuj wyniki. a) Jakie są założenia standardowego modelu regresji liniowej? b) Podaj interpretację oszacowanych parametrów w modelu (1). Co dokładnie oznacza warunek ceteris paribus? c) Oblicz i zinterpretuj współczynniki korelacji dla wszystkich kombinacji zmiennych K, D i C. d) Oszacuj parametry modeli: (2) K 0 1 D , (3) K 0 1C . Jaka jest przyczyna otrzymania innych oszacowań parametrów w modelu (1) w porównaniu z modelami (2) i (3)? Jaki warunek musi być spełniony, aby odpowiednie oszacowania w tych modelach były takie same? Wskazówka: zastanów się nad wynikami z punktu c). e) Załóżmy, że interesuje nas tylko bezpośredni wpływ dochodu (zmienna D) na konsumpcję pomarańczy (zmienna K). Które oszacowanie (z modelu (1) czy (2)) jest w takim przypadku odpowiednie? Jak będzie w przypadku, gdy interesuje nas całkowity wpływ dochodu na konsumpcję pomarańczy? f) Alternatywnym sposobem oszacowania bezpośredniego wpływu dochodu na konsumpcję jest następująca dwu-stopniowa metoda regresji cząstkowej: Krok 1. Eliminacja wpływu ceny (C) na konsumpcję (K). Oszacuj regresję opisującą zależność K od C (taka regresja jest już oszacowana w punkcie d) jako model (3)) i oblicz reszty modelu eK. Oszacuj regresję opisującą zależność D od C i oblicz reszty modelu eD. Reszty eK i eD można interpretować jako zmienne “oczyszczone” z wpływu zmiennej C. Oblicz współczynniki korelacji dla par zmiennych: eK and C; eD and C. 1 Ekonometria Lista nr 2 II ZIF IiE LS gr. 8, 9 Krok 2.Szacowanie bezpośredniego wpływu D na K. Oszacuj model zależności eK od eD. Porównaj otrzymane rezultaty z oszacowaniami modelu (1). 3. W pliku Dane_2.xls znajdują dane z roku 1994 dotyczące produkcji dla grupy n = 25 firm działających w USA w sektorze przemysłu metalowego. Dla każdej firmy podano wartości trzech zmiennych: produkcja (P, wartość dodana w milionach dolarów), zatrudnienie (Z, całkowity fundusz płac w milionach dolarów) kapitał (K, wartość zaangażowanego kapitału w milionach dolarów). Wykonaj obliczenia w programie MS Excel i zaprezentuj wyniki. a) Omów własności estymatorów KMNK. b) Grupa badaczy postanowiła oszacować liniowy model produkcji: (1) P 0 1 Z 2 K jednakże po chwili zastanowienia poszerzono zakres badania o model log-liniowy: (2) ln P 0 1 ln Z 2 ln K . Oszacowania modeli (KMNK) są następujące (w nawiasach podano błędy standardowe): Pˆ 281,87 2,01Z 0,06 K ln Pˆ 0,51 0,74 ln Z 0,28 ln K (155,16) (0,35) c) d) e) f) g) (0,11) (0,56) (0,1) (0,14) se 520,55 se 0,29 Zinterpretuj oszacowania parametrów modelu (1) i modelu (2). Wskazówka: w modelu logliniowym parametr stojący przy zmiennej objaśniającej interpretuje się jako elastyczność zmiennej objaśnianej (P) względem danej zmiennej objaśniającej (Z lub K). Oblicz logarytmy wszystkich zmiennych. Narysuj wykresy dla następujących par zmiennych: (Z, P), (K, P), (lnZ, lnP), (lnK, lnP). Dlaczego badacze zdecydowali się oszacować model logliniowy? Na początku 1995 roku na rozpatrywanym rynku pojawiła się nowa firma, w której zakładany roczny fundusz płac wynosi 400 milionów dolarów a kapitał 2 500 milionów dolarów. Korzystając z oszacowanego modelu (2) wyznacz wartość produkcji (P) tej firmy w roku 1995. Jaka jest wydajność pracy i produktywność kapitału tej firmy (jaką produkcję uzyskuje się z jednostki pracy (kapitału))? W styczniu 1996 w ramach oszczędności firma rozpatrywała możliwość zwolnienia części pracowników. Zwolnienia spowodowałyby 8% zmniejszenie funduszu płac a także zmniejszenie produkcji firmy. O ile procent zmniejszyłaby się produkcja firmy w roku 1996? Wskazówka: skorzystaj z interpretacji elastyczności z punktu c). Ze względu na protesty związków zawodowych firma została zmuszona do rezygnacji z planów zwolnienia pracowników. Jako alternatywę postanowiono sprzedać jedną z mniej ważnych fabryk oraz dwa magazyny, co spowodowało 7% spadek wartości kapitału firmy. O ile procent zmniejszy się produkcja firmy w wyniku podjętych działań? Wskazówka: skorzystaj z interpretacji elastyczności z punktu c). 4. W tabeli poniżej przedstawiono dane na temat wartości miesięcznej sprzedaży pewniej firmy (Y, setki tys. zł), miesięcznych wydatków na reklamę w telewizji tej firmy (X1, tys. zł) oraz miesięcznych wydatków na reklamę w prasie (X2, tys. zł) za okres od stycznia do czerwca 2007. t Y X1 X2 1 3 1 1 2 3 2 2 3 4 4 1 4 7 4 2 5 6 5 3 6 7 6 2 Do opisu zależności między sprzedażą a wydatkami reklamowymi wybrano model: 2 Ekonometria Lista nr 2 II ZIF IiE LS gr. 8, 9 Yt 0 1 X1,t 1 2 X 2,t 1 t . a) Oszacuj parametry tego modelu, znajdź wektor reszt, ocenę wariancji składnika losowego S e2 , macierz wariancji kowariancji ocen parametrów oraz oblicz średnie błędy ocen parametrów. b) Jaką interpretację mają oceny parametrów tego modelu? c) Jakiej zmiany sprzedaży można się spodziewać, jeśli w bieżącym miesiącu wydatki reklamę w telewizji spadły o 1500 zł (c.p.)? d) Znajdź realizację 95% przedziału ufności dla parametru 2 analizowanej regresji (zakładając normalność rozkładu estymatora parametru b2 ). e) Dokonaj prognozy sprzedaży na lipiec 2007 roku. Jakie są założenia i źródła błędu tej prognozy? 5. Próbowano oszacować parametry następującego modelu regresji na podstawie danych rocznych z lat 1978-1985: yt 0 1 x1,t 2 x2,t t . Niestety prace przerwano. Do dziś zachowały się niektóre wyniki obliczeń cząstkowych, jednak część z nich, a także dane wyjściowe uległy zniszczeniu. Oto zachowane dane: T T X y 64 , X X 48 , y 2 , x1 2 , x 2 =0. 216 8 24 Czy na podstawie tych informacji można oszacować parametry strukturalne? Jeśli tak, dokonaj odpowiednich obliczeń. 6. Oblicz ocenę parametru a1 liniowego modelu ekonometrycznego Yˆ a1 X 1 a2 X 2 a3 X 3 a0 wiedząc, że: 8 26 13 20 13 11 15 7 T X X 20 15 22 10 5 8 7 10 Wyznacznik macierzy XTX wynosi 36. Obserwacje zmiennych zawiera tabela: Y X1 X2 X3 1 -4 -2 -3 2 -3 -1 -2 3 -1 -2 -2 4 0 -1 -1 5 0 -1 -2 7. Dlaczego w zad. 3.10 str. 72 w podręczniku pod red. prof. Dziechciarza nie można oszacować parametrów modelu ekonometrycznego? (Wskazówka: pomyśl, nie obliczaj niczego) Treść: W pewnej firmie w ciągu 5 miesięcy stwierdzono następujące wartości 6 zmiennych: x2 x3 x4 x5 x6 Miesiąc x1 1 2,5 0,13 25 12,5 1457 11 2 2,4 0,21 25 13,4 1452 12 3 2,3 0,19 25 13,8 1448 13 4 2,4 0,05 25 14,0 1463 13 5 2,2 0,09 25 14,2 1469 14 gdzie: X1 – koszty jednostkowe, w tys. zł/szt., 3 Ekonometria Lista nr 2 II ZIF IiE LS gr. 8, 9 X 2 – udział braków w produkcji całkowitej, w %, X 3 – liczba pracowników bezpośrednio produkcyjnych, w osobach, X 4 – zużycie energii elektrycznej, w MWh, X 5 – przeciętne wynagrodzenie miesięczne pracowników bezpośrednio produkcyjnych, w zł, X 6 – poziom produkcji, w tys. szt. Oszacować model opisujący zależność wielkości produkcji od zatrudnienia pracowników bezpośrednio produkcyjnych i zużycia energii elektrycznej. 8. Zadanie na podstawie zad. 3.17 ze strony 73 z podręcznika pod red. prof. Dziechciarza. Wykaż, że parametrów , , , modelu ekonometrycznego: Z X Y X Y nie można oszacować żadną metodą (model jest nieidentyfikowalny). Dodatek teoretyczny Oznaczenia: K – liczba szacowanych parametrów modelu regresji m – liczba zmiennych objaśniających w modelu regresji n – liczba obserwacji (liczebność próby) We wszystkich zadaniach przyjmuje się, że wszystkie założenia MNK są spełnione. 1. Dana jest macierz obserwacji zmiennych objaśniających X o wymiarach n × K, n>K. Ile wynosi maksymalny rząd tej macierzy r(X)? W jakiej sytuacji r(X)=K?. Kiedy tak nie jest? Podaj przykład. 2. Dana jest pewna macierz M: 1 M I X XTX XT gdzie X jest wymiaru n × K, n>K, a I to macierz jednostkowa wymiaru n × n. Wykaż, że: a) macierz M jest idempotentna: M M M , b) macierz M jest symetryczna: M T M , c) ślad macierzy M wynosi: tr M n K , gdzie n i K to wymiary macierzy X tak jak w zadaniu poprzednim, d) macierz M jest osobliwa: det M 0 . 3. Wykaż, że: a) X T e 0Kx1 , gdzie e to reszty modelu ekonometrycznego e y Xb , a 0 to wektor zerowy, b) yˆ T e 0 (skalar), c) ei 0 , jeżeli w modelu występuje wyraz wolny. i 4. Wykaż, że: a) b) c) d) e) e My e M eT e yT My eT e T M eT e yT y bT X T y 5. Wykaż nieobciążoność estymatora metody najmniejszych kwadratów: E b 4 Ekonometria Lista nr 2 II ZIF IiE LS gr. 8, 9 6. Wykaż, że wariancja estymatora metody najmniejszych kwadratów wynosi: var b 2 X T X Wskazówka: pokaż najpierw, że: b XTX a następnie oblicz: 1 1 X T b b T i znajdź wartość oczekiwaną tego wyrażenia. 7. Wykaż, że S e2 : S e2 e 2 i nK jest nieobciążonym estymatorem nieznanej wariancji składnika losowego 2 . 8. Wykaż, że D 2 b S e2 X T X jest nieobciążonym estymatorem dla var(b). 1 9. W twierdzeniu Gaussa-Markowa jest mowa, że dowolny liniowy nieobciążony estymator inny niż estymator KMNK ma macierz wariancji większą o pewną nieujemnie określoną macierz. Podaj przykłady takich macierzy dla K=2 oraz K=3. 10. Niech: TSS yi y y y y y (Total Sum of Squares) 2 i ESS yˆ i yˆ yˆ yˆ 2 T yˆ yˆ (Explained Sum of Squares) T i RSS ei2 eT e (Residual Sum of Squares) i gdzie ŷ oznacza średnią z wartości teoretycznych zmiennej objaśnianej. Wykaż, że w modelu z wyrazem wolnym (stałą): TSS = ESS + RSS. Wskazówka: Zacznij od pokazania, że w modelu ze stałą (wyrazem wolnym) y yˆ . 5