1. E(u)
Transkrypt
1. E(u)
ZAŁOŻENIA ESTYMATORA MNK 1. E(u) – średnia wartośd oczekiwana równa 0 Zakłócenia (składniki losowe, reszty) nie wykazują żadnej tendencji do odchylania wartości empirycznych zmiennej objaśnianej od wartości teoretycznych na plus czy minus. 2. E(uu2) =cov(u)=σ2 I – macierz wariancji-kowariancji zakłóceo u jest macierzą skalarną tzn. iloczynem σ 2 oraz macierzy jednostkowej 1 0 0 σ 2I = σ 2 0 1 0 0 0 0 1 2.1. Homoskedastycznośd zakłóceo losowych Na przekątnej (po wymnożeniu) macierzy wariancji-kowariancji wariancje zakłóceo w różnych okresach. 2 Zgodnie z założeniami estymatora MNK wariancja zakłóceo jest stała i równa σ – nie zależy więc od numeru obserwacji. Tę właściwośd nazywamy homoskedastycznością zakłóceo. Brak stałości zakłóceo nazywamy heteroskedastycznością zakłóceo losowych. 2.2. Brak autokorelacji zakłóceo losowych równania Poza przekątną macierzy leżą współczynniki autokorelacji – tzn. współczynniki korelacji pomiędzy zakłóceniami pochodzącymi z obserwacji oddalonych o kolejne okresy. Gdy te współczynniki są istotnie statystycznie różne od zera mówimy o autokorelacji zakłóceo (składnika losowego). WŁASNOŚCI DOBRYCH ESTYMATORÓW NIEOBCIĄŻONOŚD Estymator jest nieobciążony, jeśli jego wartośd oczekiwana pokrywa się z wartością szacowanego parametru. Gdybyśmy z tej samej populacji genralnej wylosowali wiele prób, to choć wartość MNK-estymatora będzie się różniła od prawdziwej wartości szacowanego parametru –jego średnia wartość policzona na podstawie wyników dla poszczególnych prób była bliska wartości szacowanego parametru. EFEKTYWNOŚD Estymator MNK jest efektywny, kiedy jest nieobciążony oraz posiada minimalną wariancję – najmniejsze rozproszenie liczone wokół prawdziwej wartości szacowanego parametru. ZGODNOŚD Estymator jest zgodny, kiedy jest stochastycznie zbieżny do szacowanego nieznanego parametru (w próbie generalnej). Zbieżnośd stochastyczna oznacza, że wraz ze wzrostem liczebności próby, prawdopodobieostwo tego, że otrzymane oszacowania parametrów będą zbieżne z wartością parametru (zbiorowośd generalna) rośnie. Jednocześie wariancja estymatora zmierza do zera. Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 1 z 6 TESTOWANIE WŁAŚCIWOŚCI SKŁADNIKA LOSOWEGO (NARUSZENIE ZAŁOŻEO MNK-ESTYMATORA) WERYFIKACJA HIPOTEZ O NORMALNOŚCI ROZKŁADU SKŁADNIKA LOSOWEGO Założenie o normalności rozkładu składnika losowego, w literaturze przedmiotu jest często podawane jako jedno z założeo estymatora MNK. Normalnośd rozkładu składnika losowego (reszt) nie wpływa bezpośrednio na własności estymatora. Należy podkreślid, że tablice wartości krytycznych testów m.in. służących do weryfikacji hipotez o właściwościach szacowanych parametrów (testu t-Studenta – weryfikacja istotności statystycznej oszacowanych parametrów) czy badaniu autokorelacji składnika losowego (test DurbinaWatsona) konstruowane są przy założeniu, że reszty modelu mają rozkład normalny. Do weryfikacji hipotezy o normalności rozkładu składnika losowego oraz oceny poprawności zastosowanej postaci funkcyjnej służy test Jarque-Bera. Konsekwencje braku normalności rozkładu składnika losowego Odczytywane wartości krytyczne statystyk opartych na rozkładzie normalnym nie są poprawne. Jeśli t-empiryczne wynosi 2,5 natomiast t-krytyczne wynosi 2,3 nie możemy do końca stwierdzić, że parametr dla którego weryfikujemy istotność statystyczna jest istotny, chociaż t-empiryczne > tkrytycznego. W tym przypadku t-krytyczne (odczytane z tablic) może przyjmować zarówno wartości większe jak i mniejsze od sprawdzianu (t-empirycznego). W ten sposób na podstawie testu t-Studenta nie możemy zweryfikować hipotezy o istotności parametrów. Test Jarque-Bera 1. Przyjmujemy hipotezy: H0: Reszty szacowanego modelu mają rozkład normalny (poprawna postad funkcyjna modelu) H1: Reszty nie mają rozkładu normalnego (niepoprawna postad funkcyjna modelu) 2. Obliczamy (odczytujemy z wydruków programu) wartośd sprawdzianu dla testu: n k 2 ( K 3) 2 JB (Se ) 6 4 2 gdzie: n - liczba obserwacji, k – liczba stopni swobody, Su – wariancja reszt modelu, K – kurtoza reszt 3. Przyjmujemy poziom istotności np. α=0,05 4. Z tablic wartości krytycznych rozkładu Chi-kwadrat odczytujemy wartośd krytyczną dla 2 stopni swobody oraz istotności 0,05. Chi-kwadrat (krytyczne)=5,99. 5. Weryfikacja JB (wartośd sprawdzianu – obliczona) < Chi-kwadrat (5,99) Ponieważ wartość sprawdzianu nie przekracza wartości krytycznej odczytanej z tablic rozkładu Chikwadrat, dla poziomu istotności 0,05, można wnioskować, że nie ma podstaw do odrzucenia hipotezy zerowej, mówiącej, że reszty szacowanego modelu cechuje rozkład normalny (poprawna postać funkcyjna modelu) JB (wartośd sprawdzianu – obliczona) > Chi-kwadrat (5,99) Na podstawie wartości sprawdzianu JB należy odrzucić hipotezę zerowa na rzecz alternatywnej, która wskazuje na brak rozkładu normalnego reszt szacowanego modelu. Należy przyjąć, iż model posiada niewłaściwą postać funkcyjną. ZJAWISKO AUTOKORELACJI SKŁADNIKA LOSOWEGO Rozważanie autokorelacji zakłóceo ma sens, kiedy obserwacje w próbie są uporządkowane – np. wg czasu. Kiedy obserwacje są nieuporządkowane można je dowolnie przestawiad, wtedy też traci sens pojęcie Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 2 z 6 obserwacji sąsiadujących. Poza przekątną macierzy wariancji-kowariancji reszt modelu leżą współczynniki autokorelacji – tzn. współczynniki korelacji pomiędzy zakłóceniami pochodzącymi z obserwacji oddalonych o kolejne okresy. Gdy te współczynniki są istotnie statystycznie różne od zera mówimy o autokorelacji zakłóceo (składnika losowego). Przyczyny występowania 1. Błędy specyfikacji modelu: pominięcie ważnej zmiennej objaśniającej, przyjęcie niewłaściwej postaci funkcyjnej, pominięcie wśród zmiennych objaśniających opóźnionej zmiennej objaśnianej 2. Oddziaływanie czynników przypadkowych powodujących zaburzenia w normalnym przebiegu prawidłowości ekonomicznych. Gdy efekty działania czynników ubocznych trwają dłużej niż jeden okres, wówczas występuje zależnośd pomiędzy kolejnymi zmiennymi AUTOKORELACJA DODATNIA Dodatnia korelacja składnika losowego sprawia, że jeżeli błąd w okresie t jest dodatni to będzie większe prawdopodobieostwo, że w okresie t + 1 będzie dodatni, niż ujemny. Natomiast jeżeli w okresie t błąd był ujemny, to będzie wyższe prawdopodobieostwo otrzymania w okresie t + 1 błędu ujemnego niż błędu dodatniego. Dodatnia autokorelacja jest znacznie częściej występującą formą autokorelacji, niż autokorelacja ujemna. Jest ona powszechnym zjawiskiem w przypadku modeli szacowanych na szeregach czasowych. Występuje w przypadku, gdy zjawisko losowe zaburzające przeciętny poziom zmiennych ma wpływ na ich wartości w więcej niż jednym okresie. Autokorelacja dodatnia zawyża wartośd współczynnika determinacji. AUTOKORELACJA UJEMNA Ujemna autokorelacja składnika losowego powoduje, że większe jest prawdopodobieostwo zmiany znaku przez składnik losowy. Jeżeli w okresie t jest on dodatni, to w okresie t + 1 ze znacznie większym prawdopodobieostwem będzie on ujemny niż dodatni. Natomiast jeżeli w okresie t składnik losowy jest ujemny, to ze znacznie większym prawdopodobieostwem będzie on w okresie t + 1 dodatni. Autokorelacja ujemna zaniża wartośd współczynnika determinacji. Wykres reszt w przypadku autokorelacji dodatniej i ujemnej Jeśli występują autokorelacja dodatnia to sąsiednie reszty oszacowao będą przyjmowad wartości o tych samych znakach – wyznaczają pewną prawidłowośd. W przypadku autokorelacji ujemnej reszty będą wykazywad skłonnośd do naprzemiennego ułożenia względem osi 0X. - Test Durbina-Watsona1 Jest najpopularniejszym testem stosowanym do weryfikacji istnienia autokorelacji składnika losowego (I stopnia – korelacja między resztą z okresu t i t-1). Test rozstrzyga czy współczynnik autokorelacji istotnie różni się od zera. Współczynnik autokorelacji oznaczony jest wzorem ρ̂ WARUNKI STOSOWANIA TESTU DURBINA-WATSONA: 1. 2. 3. 4. 5. 1 W równaniu występuje wyraz wolny (reszty muszą mied średnią wartośd równą 0 – co jest zapewnione przez włączenie wyrazu wolnego); Reszty modelu mają rozkład normalny; Wśród zmiennych objaśniających nie występuje opóźniona zmienna objaśniana; Stosowany do weryfikowania autokorelacji I rzędu (reszty opóźnione o jeden okres); Sprawdza się przy małych próbach; Por. Jan B. Gajda, Ekonometria, CH Beck, Warszawa 2004., s. 92. Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 3 z 6 PROCEDURA TESTOWANIA 1. Obliczamy ocenę współczynnika autokorelacji T ∑(e e t t -1 ̂ ) t 2 T T et2 e t 1 2 t 1 t 2 2. Przyjmujemy hipotezy H0: ρ=0 brak istotności współczynnika autokorelacji (brak autokorelacji) H1: ρ>0 współczynnik autokorelacji jest dodatni (autokorelacja dodatnia) H1: ρ<0 współczynnik autokorelacji jest ujemny (autokorelacja ujemna) 3. Sprawdzianem hipotez jest statystyka d T d (e t t 2 et 1 ) 2 T (e ) t 1 2 t 4. Na poziomie istotności z tablic rozkładu Durbina-Watsona odczytujemy dla liczby szacowanych parametrów (bez wyrazu wolnego) odczytujemy wartości krytyczne dL – dolną dU - górną 5. Wnioskowanie Jeśli ρ>0 H0: ρ=0 Jeśli 0 < ρ i d > 2, wtedy oblicza d’=4-d wobec H1: ρ>0 d>dU – nie ma podstaw do odrzucenia H0 brak autokorelacji H0: ρ=0 wobec H1: d' > dU - nie ma podstaw do odrzucenia H0 brak autokorelacji d<dL – należy przyjąd H1 d’<dL – należy przyjąd H1 autokorelacja dodatnia autokorelacja ujemna dL<d<dU – przedział niekonkluzywności dL<d’<dU – przedział niekonkluzywności test nie daje odpowiedzi ρ<0 test nie daje odpowiedzi Konsekwencje występowania autokorelacji składnika losowego UTRATA EFEKTYWNOŚCI ESTYMATORA (PRZY ZACHOWANIU ZGODNOŚCI I BRAKU OBCIĄŻONOŚCI) Wariancja oszacowao parametrów zmiennych modelu nie są już najmniejsza (co stanowi jedno z głównych założeo MNK). Oznacza to, że szacując parametry inną metodą otrzymalibyśmy „dokładniejsze” oszacowanie parametru. Jeśli wariancja parametru jest wysoka, to jednocześnie błąd standardowy szacowanego parametru jest również wysoki. Należy pamiętad, że ten błąd jest stosowany do wyznaczenia statystyki tStudenta (wchodzi do mianownika). Wraz ze wzrostem błędu, maleje wartośd statystyki empirycznej tStudenta. Może się więc okazad, że błąd oszacowania parametru będzie na tyle duży, iż nie pozwoli na przyjęcie hipotezy o istotności szacowanego parametru. Mamy więc do czynienia z NIEADEKWATNOŚCIĄ WNIOSKOWANIA NA PODSTAWIE STATYSTYK T -STUDENTA I F Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 4 z 6 Poprawa jakości estymatorów w przypadku występowania autokorelacji składnika losowego - ocenid czy nie została pominięta, znacząca z punktu teorii ekonomii, znacząca zmienna objaśniająca, lub opóźniona zmienna objaśniana. - zmienid postad funkcyjną modelu, - zastosowad inną metodę estymacji parametrów modelu: Uogólniona Metoda Najmniejszych Kwadratów; Metoda iteracyjna Cochrane’a-Orcutta (UMNK); Metoda poszukiwao Hildreth’a-Lu (UMNK) WERYFIKACJA HIPOTEZY O HOMOSKEDASTYCZNOŚCI SKŁADNIKA LOSOWEGO Na przekątnej macierzy wariancji-kowariancji reszt modelu znajdują się wariancje zakłóceo w różnych okresach. Macierz ta jest określona wzorem: D2 (a) Se2 ( X T X )-1 Pierwiastki z elementów diagonalnych tej macierzy (elementów leżących na przekątnej) stanowią średnie błędy szacunku parametrów strukturalnych. Informują o wartościach odchyleo standardowych ocen parametrów strukturalnych modelu. 2 Zgodnie z założeniami estymatora MNK wariancja zakłóceo jest stała i równa σ – nie zależy więc od numeru obserwacji. Tę właściwośd nazywamy homoskedastycznością zakłóceo. Brak stałości zakłóceo nazywamy heteroskedastycznością zakłóceo losowych. Jeśli nie jest spełnione założenie o homoskedastyczności składników losowych, to estymatory parametrów strukturalnych uzyskane Klasyczną Metodą Najmniejszych Kwadratów są nieobciążone, zgodne ale nie są efektywne. W rezultacie uniemożliwia to rzetelną weryfikację hipotez dotyczących wartości parametrów strukturalnych. 1 0 0 σ 2I = σ 2 0 1 0 0 0 0 1 Przyczyny heteroskedastyczności Zjawisko to występuje szczególnie w przypadku analizy danych przekrojowych lub przekrojowo-czasowych. - niejednorodnośd obiektów, - niejednorodnośd danych (duża rozpiętośd), - występowanie obserwacji nietypowych (odstających) Heteroskedastycznośd może również wystąpid w przypadku szeregów czasowych. Hipotezy o homoskedastyczności składnika losowego Hipoteza zerowa: H 0 : 2 i 2 const Występuje homoskedastyczność zakłóceń losowych. Zróżnicowanie reszt jest stałe. Hipoteza alternatywna: H1 : 2 i j 2 Występuje heteroskedastyczność składnika losowego. Brak efektywności estymatora KMNK. Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 5 z 6 Testy weryfikacji hipotezy o homoskedastyczności składnika losowego TEST GOLDFELDA-QUANDTA Test Goldfelda-Quandta jest użyteczny w sytuacjach, kiedy zróżnicowanie wariancji składnika losowego jest zależne tylko od jednej zmiennej. Jeśli heteroskedastycznośd została spowodowana łącznie przez kilka zmiennych objaśniających, bardziej odpowiednie jest zastosowanie innych testów, takich jak test White’a czy Harleya-Goldfreya. Testy te mogą byd zastosowane jedynie dla dużej liczby obserwacji. TEST BREUSCHA-PAGANA TEST WHITE’A Test White’a można również potraktowad jako sprawdzian poprawności specyfikacji modelu – czy nie zostały popełnione błędy przy doborze zmiennych. OGÓLNA ZASADA TESTOWANIA (GRETL) – POZIOM ISTOTNOŚCI 0,05 Jeśli p-value > 0,05 Nie ma podstaw do odrzucenia hipotezy zerowej o homosekastyczności zakłóceń losowycy Jeśli p-value < 0,05 Należy odrzucić hipotezę zerową na rzecz alternatywnej – występuje heteroskedastyczność składnika losowego. W celu uzyskania efektywnych estymatorów parametry modelu należy szacować uogólnioną metodą najmniejszych kwadratów. Zadanie 8 – dane plik EKONOMETRIA cw 4.xls Za pomocą programu GRETL 1. Oszacować parametry strukturalne modelu wartości PKB (mln zł) od wartości inwestycji (mln zł) oraz liczby pracujących (tys. osób) 2. Zweryfikować istotność statystyczną zmiennych 3. Dokonać oceny dopasowania modelu do danych empirycznych 4. Zweryfikować normalność rozkładu składnika losowego (reszt modelu) 5. Zweryfikować występowanie autokorelacji składnika losowego 6. Zweryfikować występowanie heteroskedastyczności reszt Zadanie 8 Zbadać występowanie autokorelacji rzędu pierwszego, jeśli DW = 2,1 (dL=1,1, dU=1,3 ) Zajęcia 4. Materiały pomocnicze do dwiczeo z Ekonometrii mgr Emilia Modranka [email protected] Strona 6 z 6