1. E(u)

Transkrypt

1. E(u)
ZAŁOŻENIA
ESTYMATORA
MNK
1. E(u) – średnia wartośd oczekiwana równa 0
Zakłócenia (składniki losowe, reszty) nie wykazują żadnej tendencji do odchylania wartości empirycznych
zmiennej objaśnianej od wartości teoretycznych na plus czy minus.
2. E(uu2) =cov(u)=σ2 I – macierz wariancji-kowariancji zakłóceo u jest macierzą skalarną
tzn. iloczynem σ 2 oraz macierzy jednostkowej
1 0  0
σ 2I = σ 2
0 1  0

  0
0 0  1
2.1. Homoskedastycznośd zakłóceo losowych
Na przekątnej (po wymnożeniu) macierzy wariancji-kowariancji wariancje zakłóceo w różnych okresach.
2
Zgodnie z założeniami estymatora MNK wariancja zakłóceo jest stała i równa σ – nie zależy więc od numeru
obserwacji. Tę właściwośd nazywamy homoskedastycznością zakłóceo.
Brak stałości zakłóceo nazywamy heteroskedastycznością zakłóceo losowych.
2.2. Brak autokorelacji zakłóceo losowych równania
Poza przekątną macierzy leżą współczynniki autokorelacji – tzn. współczynniki korelacji pomiędzy zakłóceniami
pochodzącymi z obserwacji oddalonych o kolejne okresy. Gdy te współczynniki są istotnie statystycznie
różne od zera mówimy o autokorelacji zakłóceo (składnika losowego).
WŁASNOŚCI
DOBRYCH ESTYMATORÓW
NIEOBCIĄŻONOŚD
Estymator jest nieobciążony, jeśli jego wartośd oczekiwana pokrywa się z wartością szacowanego parametru.
Gdybyśmy z tej samej populacji genralnej wylosowali wiele prób, to choć wartość MNK-estymatora
będzie się różniła od prawdziwej wartości szacowanego parametru –jego średnia wartość policzona na
podstawie wyników dla poszczególnych prób była bliska wartości szacowanego parametru.
EFEKTYWNOŚD
Estymator MNK jest efektywny, kiedy jest nieobciążony oraz posiada minimalną wariancję – najmniejsze
rozproszenie liczone wokół prawdziwej wartości szacowanego parametru.
ZGODNOŚD
Estymator jest zgodny, kiedy jest stochastycznie zbieżny do szacowanego nieznanego parametru (w próbie
generalnej). Zbieżnośd stochastyczna oznacza, że wraz ze wzrostem liczebności próby, prawdopodobieostwo
tego, że otrzymane oszacowania parametrów będą zbieżne z wartością parametru (zbiorowośd generalna)
rośnie. Jednocześie wariancja estymatora zmierza do zera.
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 1 z 6
TESTOWANIE WŁAŚCIWOŚCI SKŁADNIKA LOSOWEGO
(NARUSZENIE ZAŁOŻEO MNK-ESTYMATORA)
WERYFIKACJA
HIPOTEZ O NORMALNOŚCI ROZKŁADU SKŁADNIKA LOSOWEGO
Założenie o normalności rozkładu składnika losowego, w literaturze przedmiotu jest często podawane jako jedno
z założeo estymatora MNK. Normalnośd rozkładu składnika losowego (reszt) nie wpływa bezpośrednio na
własności estymatora. Należy podkreślid, że tablice wartości krytycznych testów m.in. służących do
weryfikacji hipotez o właściwościach szacowanych parametrów (testu t-Studenta – weryfikacja istotności
statystycznej oszacowanych parametrów) czy badaniu autokorelacji składnika losowego (test DurbinaWatsona) konstruowane są przy założeniu, że reszty modelu mają rozkład normalny. Do weryfikacji
hipotezy o normalności rozkładu składnika losowego oraz oceny poprawności zastosowanej postaci
funkcyjnej służy test Jarque-Bera.
Konsekwencje braku normalności rozkładu składnika losowego
Odczytywane wartości krytyczne statystyk opartych na rozkładzie normalnym nie są poprawne.
Jeśli t-empiryczne wynosi 2,5 natomiast t-krytyczne wynosi 2,3 nie możemy do końca stwierdzić, że
parametr dla którego weryfikujemy istotność statystyczna jest istotny, chociaż t-empiryczne > tkrytycznego. W tym przypadku t-krytyczne (odczytane z tablic) może przyjmować zarówno wartości
większe jak i mniejsze od sprawdzianu (t-empirycznego). W ten sposób na podstawie testu t-Studenta
nie możemy zweryfikować hipotezy o istotności parametrów.
Test Jarque-Bera
1. Przyjmujemy hipotezy:
H0:
Reszty szacowanego modelu mają rozkład normalny (poprawna postad funkcyjna modelu)
H1:
Reszty nie mają rozkładu normalnego (niepoprawna postad funkcyjna modelu)
2. Obliczamy (odczytujemy z wydruków programu) wartośd sprawdzianu dla testu:
n  k 2 ( K  3) 2
JB 
(Se 
)
6
4
2
gdzie: n - liczba obserwacji, k – liczba stopni swobody, Su – wariancja reszt modelu, K – kurtoza reszt
3. Przyjmujemy poziom istotności np. α=0,05
4. Z tablic wartości krytycznych rozkładu Chi-kwadrat odczytujemy wartośd krytyczną dla 2 stopni
swobody oraz istotności 0,05. Chi-kwadrat (krytyczne)=5,99.
5. Weryfikacja

JB (wartośd sprawdzianu – obliczona) < Chi-kwadrat (5,99)
Ponieważ wartość sprawdzianu nie przekracza wartości krytycznej odczytanej z tablic rozkładu Chikwadrat, dla poziomu istotności 0,05, można wnioskować, że nie ma podstaw do odrzucenia
hipotezy zerowej, mówiącej, że reszty szacowanego modelu cechuje rozkład normalny
(poprawna postać funkcyjna modelu)

JB (wartośd sprawdzianu – obliczona) > Chi-kwadrat (5,99)
Na podstawie wartości sprawdzianu JB należy odrzucić hipotezę zerowa na rzecz alternatywnej, która
wskazuje na brak rozkładu normalnego reszt szacowanego modelu. Należy przyjąć, iż model posiada
niewłaściwą postać funkcyjną.
ZJAWISKO
AUTOKORELACJI SKŁADNIKA LOSOWEGO
Rozważanie autokorelacji zakłóceo ma sens, kiedy obserwacje w próbie są uporządkowane – np. wg czasu.
Kiedy obserwacje są nieuporządkowane można je dowolnie przestawiad, wtedy też traci sens pojęcie
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 2 z 6
obserwacji sąsiadujących. Poza przekątną macierzy wariancji-kowariancji reszt modelu leżą współczynniki
autokorelacji – tzn. współczynniki korelacji pomiędzy zakłóceniami pochodzącymi z obserwacji oddalonych o
kolejne okresy. Gdy te współczynniki są istotnie statystycznie różne od zera mówimy o autokorelacji zakłóceo
(składnika losowego).
Przyczyny występowania
1. Błędy specyfikacji modelu:



pominięcie ważnej zmiennej objaśniającej,
przyjęcie niewłaściwej postaci funkcyjnej,
pominięcie wśród zmiennych objaśniających opóźnionej zmiennej objaśnianej
2. Oddziaływanie czynników przypadkowych powodujących zaburzenia w normalnym przebiegu prawidłowości
ekonomicznych. Gdy efekty działania czynników ubocznych trwają dłużej niż jeden okres, wówczas
występuje zależnośd pomiędzy kolejnymi zmiennymi
AUTOKORELACJA DODATNIA
Dodatnia korelacja składnika losowego sprawia, że jeżeli błąd w okresie t jest dodatni to będzie większe
prawdopodobieostwo, że w okresie t + 1 będzie dodatni, niż ujemny. Natomiast jeżeli w okresie t błąd był
ujemny, to będzie wyższe prawdopodobieostwo otrzymania w okresie t + 1 błędu ujemnego niż błędu
dodatniego. Dodatnia autokorelacja jest znacznie częściej występującą formą autokorelacji, niż autokorelacja
ujemna. Jest ona powszechnym zjawiskiem w przypadku modeli szacowanych na szeregach czasowych.
Występuje w przypadku, gdy zjawisko losowe zaburzające przeciętny poziom zmiennych ma wpływ na ich
wartości w więcej niż jednym okresie. Autokorelacja dodatnia zawyża wartośd współczynnika determinacji.
AUTOKORELACJA UJEMNA
Ujemna autokorelacja składnika losowego powoduje, że większe jest prawdopodobieostwo zmiany znaku przez
składnik losowy. Jeżeli w okresie t jest on dodatni, to w okresie t + 1 ze znacznie większym
prawdopodobieostwem będzie on ujemny niż dodatni. Natomiast jeżeli w okresie t składnik losowy jest
ujemny, to ze znacznie większym prawdopodobieostwem będzie on w okresie t + 1 dodatni. Autokorelacja
ujemna zaniża wartośd współczynnika determinacji.
Wykres reszt w przypadku autokorelacji dodatniej i ujemnej
Jeśli występują autokorelacja dodatnia to sąsiednie reszty oszacowao będą przyjmowad wartości o tych samych
znakach – wyznaczają pewną prawidłowośd.
W przypadku autokorelacji ujemnej reszty będą wykazywad skłonnośd do naprzemiennego ułożenia względem
osi 0X.
- Test Durbina-Watsona1
Jest najpopularniejszym testem stosowanym do weryfikacji istnienia autokorelacji składnika losowego (I stopnia
– korelacja między resztą z okresu t i t-1). Test rozstrzyga czy współczynnik autokorelacji istotnie różni się od
zera. Współczynnik autokorelacji oznaczony jest wzorem ρ̂
WARUNKI STOSOWANIA TESTU DURBINA-WATSONA:
1.
2.
3.
4.
5.
1
W równaniu występuje wyraz wolny (reszty muszą mied średnią wartośd równą 0 – co jest zapewnione
przez włączenie wyrazu wolnego);
Reszty modelu mają rozkład normalny;
Wśród zmiennych objaśniających nie występuje opóźniona zmienna objaśniana;
Stosowany do weryfikowania autokorelacji I rzędu (reszty opóźnione o jeden okres);
Sprawdza się przy małych próbach;
Por. Jan B. Gajda, Ekonometria, CH Beck, Warszawa 2004., s. 92.
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 3 z 6
PROCEDURA TESTOWANIA
1. Obliczamy ocenę współczynnika autokorelacji
T
∑(e e
t t -1
̂ 
)
t 2
T
T
 et2
e
t 1
2
t 1
t 2
2. Przyjmujemy hipotezy
H0:
ρ=0
brak istotności współczynnika autokorelacji (brak autokorelacji)
H1: ρ>0
współczynnik autokorelacji jest dodatni (autokorelacja dodatnia)
H1: ρ<0
współczynnik autokorelacji jest ujemny (autokorelacja ujemna)
3. Sprawdzianem hipotez jest statystyka d
T
d
 (e
t
t 2
 et 1 ) 2
T
 (e )
t 1
2
t
4. Na poziomie istotności z tablic rozkładu Durbina-Watsona odczytujemy dla liczby szacowanych
parametrów (bez wyrazu wolnego) odczytujemy wartości krytyczne
dL – dolną dU - górną
5. Wnioskowanie
Jeśli ρ>0
H0: ρ=0
Jeśli 0 < ρ i d > 2, wtedy oblicza d’=4-d
wobec
H1:
ρ>0
d>dU – nie ma podstaw do odrzucenia H0
brak autokorelacji
H0: ρ=0
wobec
H1:
d' > dU - nie ma podstaw do odrzucenia H0
brak autokorelacji
d<dL – należy przyjąd H1
d’<dL – należy przyjąd H1
autokorelacja dodatnia
autokorelacja ujemna
dL<d<dU – przedział niekonkluzywności
dL<d’<dU – przedział niekonkluzywności
test nie daje odpowiedzi
ρ<0
test nie daje odpowiedzi
Konsekwencje występowania autokorelacji składnika losowego
UTRATA EFEKTYWNOŚCI ESTYMATORA (PRZY ZACHOWANIU ZGODNOŚCI I BRAKU OBCIĄŻONOŚCI)
Wariancja oszacowao parametrów zmiennych modelu nie są już najmniejsza (co stanowi jedno z głównych
założeo MNK). Oznacza to, że szacując parametry inną metodą otrzymalibyśmy „dokładniejsze” oszacowanie
parametru. Jeśli wariancja parametru jest wysoka, to jednocześnie błąd standardowy szacowanego
parametru jest również wysoki. Należy pamiętad, że ten błąd jest stosowany do wyznaczenia statystyki tStudenta (wchodzi do mianownika). Wraz ze wzrostem błędu, maleje wartośd statystyki empirycznej tStudenta. Może się więc okazad, że błąd oszacowania parametru będzie na tyle duży, iż nie pozwoli na
przyjęcie hipotezy o istotności szacowanego parametru. Mamy więc do czynienia z
NIEADEKWATNOŚCIĄ WNIOSKOWANIA NA PODSTAWIE STATYSTYK T -STUDENTA I F
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 4 z 6
Poprawa jakości estymatorów w przypadku występowania autokorelacji składnika
losowego
- ocenid czy nie została pominięta, znacząca z punktu teorii ekonomii, znacząca zmienna objaśniająca, lub
opóźniona zmienna objaśniana.
- zmienid postad funkcyjną modelu,
- zastosowad inną metodę estymacji parametrów modelu:
Uogólniona Metoda Najmniejszych Kwadratów;
Metoda iteracyjna Cochrane’a-Orcutta (UMNK);
Metoda poszukiwao Hildreth’a-Lu (UMNK)
WERYFIKACJA
HIPOTEZY O HOMOSKEDASTYCZNOŚCI SKŁADNIKA LOSOWEGO
Na przekątnej macierzy wariancji-kowariancji reszt modelu znajdują się wariancje zakłóceo w różnych okresach.
Macierz ta jest określona wzorem:
D2 (a)  Se2 ( X T X )-1
Pierwiastki z elementów diagonalnych tej macierzy (elementów leżących na przekątnej) stanowią średnie błędy
szacunku parametrów strukturalnych. Informują o wartościach odchyleo standardowych ocen parametrów
strukturalnych modelu.
2
Zgodnie z założeniami estymatora MNK wariancja zakłóceo jest stała i równa σ – nie zależy więc od numeru
obserwacji. Tę właściwośd nazywamy homoskedastycznością zakłóceo. Brak stałości zakłóceo nazywamy
heteroskedastycznością zakłóceo losowych. Jeśli nie jest spełnione założenie o homoskedastyczności
składników losowych, to estymatory parametrów strukturalnych uzyskane Klasyczną Metodą Najmniejszych
Kwadratów są nieobciążone, zgodne ale nie są efektywne. W rezultacie uniemożliwia to rzetelną
weryfikację hipotez dotyczących wartości parametrów strukturalnych.
1 0  0
σ 2I = σ 2
0 1  0

  0
0 0  1
Przyczyny heteroskedastyczności
Zjawisko to występuje szczególnie w przypadku analizy danych przekrojowych lub przekrojowo-czasowych.
- niejednorodnośd obiektów,
- niejednorodnośd danych (duża rozpiętośd),
- występowanie obserwacji nietypowych (odstających)
Heteroskedastycznośd może również wystąpid w przypadku szeregów czasowych.
Hipotezy o homoskedastyczności składnika losowego
Hipoteza zerowa:
H 0 :  2 i   2  const
Występuje homoskedastyczność zakłóceń losowych. Zróżnicowanie reszt jest stałe.
Hipoteza alternatywna:
H1 :  2 i   j
2
Występuje heteroskedastyczność składnika losowego. Brak efektywności estymatora KMNK.
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 5 z 6
Testy weryfikacji hipotezy o homoskedastyczności składnika losowego
TEST GOLDFELDA-QUANDTA
Test Goldfelda-Quandta jest użyteczny w sytuacjach, kiedy zróżnicowanie wariancji składnika losowego jest
zależne tylko od jednej zmiennej.
Jeśli heteroskedastycznośd została spowodowana łącznie przez kilka zmiennych objaśniających, bardziej
odpowiednie jest zastosowanie innych testów, takich jak test White’a czy Harleya-Goldfreya. Testy te mogą
byd zastosowane jedynie dla dużej liczby obserwacji.
TEST BREUSCHA-PAGANA
TEST WHITE’A
Test White’a można również potraktowad jako sprawdzian poprawności specyfikacji modelu – czy nie zostały
popełnione błędy przy doborze zmiennych.
OGÓLNA ZASADA TESTOWANIA (GRETL) – POZIOM ISTOTNOŚCI 0,05
Jeśli
p-value > 0,05
Nie ma podstaw do odrzucenia hipotezy zerowej o homosekastyczności zakłóceń losowycy
Jeśli
p-value < 0,05
Należy odrzucić hipotezę zerową na rzecz alternatywnej – występuje heteroskedastyczność składnika
losowego. W celu uzyskania efektywnych estymatorów parametry modelu należy szacować uogólnioną
metodą najmniejszych kwadratów.
Zadanie 8 – dane plik EKONOMETRIA cw 4.xls
Za pomocą programu GRETL
1. Oszacować parametry strukturalne modelu wartości PKB (mln zł) od wartości inwestycji (mln zł)
oraz liczby pracujących (tys. osób)
2. Zweryfikować istotność statystyczną zmiennych
3. Dokonać oceny dopasowania modelu do danych empirycznych
4. Zweryfikować normalność rozkładu składnika losowego (reszt modelu)
5. Zweryfikować występowanie autokorelacji składnika losowego
6. Zweryfikować występowanie heteroskedastyczności reszt
Zadanie 8
Zbadać występowanie autokorelacji rzędu pierwszego, jeśli DW = 2,1 (dL=1,1, dU=1,3 )
Zajęcia 4.
Materiały pomocnicze do dwiczeo z Ekonometrii
mgr Emilia Modranka
[email protected]
Strona 6 z 6

Podobne dokumenty