T i hi h Testowanie hipotez statystycznych związanych z

Transkrypt

T i hi h Testowanie hipotez statystycznych związanych z
Testowanie
T
i hipotez
hi
statystycznych
h
związanych
ą y z szacowaniem i ocenąą
modelu ekonometrycznego
Ze względu na jakość uzyskiwanych ocen parametrów
strukturalnych modelu oraz weryfikację modelu, metoda
najmniejszych kwadratów powinna być stosowana tylko
wówczas, gdy są spełnione następujące założenia:
• Zmienna prognozowana modelu jest liniową funkcją
zmiennych objaśniających oraz odchyleń losowych et .
• Zmienne objaśniające modelu są wielkościami nielosowymi o
ustalonych
t l
h wartościach.
t ś i h
• Między zmiennymi objaśniającymi modelu nie występuje
zjawisko współliniowości
współliniowości.
• Odchylenia losowe mają rozkład normalny, z wartością
oczekiwaną równą zeru, oraz stałą i skończoną wariancją.
• Odchylenia losowe wyznaczone dla różnych wartości
zmiennych objaśniających nie są ze sobą skorelowane.
Badanie
B
d i iistotności
ś i
p r m tró strukturalnych
parametrów
tr kt r ln h
Testowanie parametrów strukturalnych testem
T – Studenta
Badanie
B
d i istotności
i t t ś i parametrów
t ó strukturalnych
t kt l
h liniowego
li i
modelu
d l
ekonometrycznego ma na celu sprawdzenie, czy zmienne
objaśniające istotnie oddziałują na zmienną objaśnianą, czy też
nie.
i
Zakładając, że składnik losowy modelu ma rozkład normalny,
weryfikuje
y
j się
ę hipotezę
p
ę o istotności każdego
g p
parametru, tj.
j
sprawdza się, czy parametr istotnie różni się od zera. W tym celu
formułuje się hipotezę zerową i alternatywną:
gdzie: α i prawdziwa wartość parametru stojącego przy i-tej
i tej
zmiennej objaśniającej.
H0 : [αi = 0]
H1 :[αi ≠0]
S
Sprawdzeniem
d i tejj hipotezy
hi
jest
j statystyka:
k
ti =
ai
D (a i )
g
gdzie:
ai – wartość oceny parametru stojącego przy i-tej
zmiennejj objaśniającej,
j
ją j,
D(ai) – błąd oceny i-tego parametru.
Jeśli wartość statystyki ti jest większa od wartości krytycznej
tα
: (t i > tα ), odczytanej z tablicy rozkładu
p yp
małejj p
próby)
y) lub z tablicyy rozkładu
t-Studenta ((w przypadku
normalnego (dla dużej próby), dla przyjętego poziomu
istotności α oraz dla (n-m)stopni swobody, to wówczas
odrzuca się hipotezę zerową H0 na rzecz hipotezy
alternatywnej H1 . Mówimy wtedy, że i-ta zmienna
objaśniająca istotnie wpływa na zmienną prognozowaną. Gdy
( t i ≤ t α ) to
natomiast
t i t zachodzi
h d i relacja
l j odwrotna
d
t
t niema
i
wówczas podstaw do odrzucenia hipotezy zerowej. Oznacza
to,, że i-ta zmienna objaśniająca,
j
ją , nieistotnie wpływa
py
na
zmienną prognozowaną i powinna być usunięta z modelu.
PRZYKŁAD
PRZYKŁAD
Testowanie parametrów strukturalnych testem
F Fi h
F-Fishera-Snedecora
S d
Ocena istotności parametrów strukturalnych za pomocą testu F
polega na tym że tu stawia się hipotezę obejmującą parametry
stojące tylko przy zmiennych objaśniających: H0:a1=a2=...=ak=0
wobec hipotezy H1, że co najmniej jedna z równości nie jest
spełniona.
p
Test dla hipotezy
p
y zerowejj tak sformułowanejj opiera
p
się
ę na
statystyce F (statystyka F przy prawdziwości hipotezy ma rozkład F o
k oraz n-k-1 stopniach swobody) wyrażonej wzorem:
2
(1 y )
a X y−
(n − k − 1)
n
F=
T
k
u u
T
T
T
Hipoteza zakłada więc, że wszystkie zmienne
objaśniające nie oddziałują na zmienną
endogeniczną, co oznacza, iż nie powinny się
znaleźć
l źć w modelu.
d l
Odrzucenie hipotezy H0 na poziomie α następuje
w sytuacji
t
ji gdy
d F > Fα (gdzie
( d i Fα odczytano
d
t
z ttablic
bli
rozkładu F-Snedecora), co oznacza, że co
najmniej jedna wzięta do modelu zmienna jest
istotna.
Badanie rozkładu odchyleń losowych modelu
Badanie symetrii składnika losowego
Obserwacje odchylające się in plus (in minus) od
wartości modalnych powinny stanowić połowę
wszystkich obserwacji
obserwacji. Formułujemy zatem
hipotezę zerową głoszącą, że składnik resztowy
ma rozkład symetryczny:
y
y
y
⎡m 1⎤
H0 : ⎢ = ⎥
⎣ n 2⎦
wobec hipotezy
p
y alternatywnej
y
jg
głoszącej,
ą j, że
rozkład składnika resztowego nie jest
symetryczny
⎡m 1⎤
H1 : ⎢ ≠ ⎥
⎣ n 2⎦
Statystyka służąca do weryfikacji hipotezy H0 ma postać:
t emp =
m
1
−
n
2
m
m
(1 −
)
n
n
n −1
gdzie:
d i
m - liczba odchyleń dodatnich w próbie,
n - liczba wszystkich odchyleń w próbie.
próbie
Jeśli jej wartość jest większa od odczytanej (dla małej
próby) z tablic rozkładu
t-Studenta dla przyjętego poziomu istotności
oraz n-1
stopni swobody lub z tablicy rozkładu normalnego (dla
dużej próby), to oznacza to odrzucenie hipotezy H0,
czyli brak symetrii odchyleń losowych
α
Badanie losowości odchyleń losowych modelu
Badanie to ma na celu weryfikację hipotezy o trafności doboru
postaci analitycznej modelu.
modelu Do weryfikacji hipotezy zerowej:
H 0 : Yˆ = f ( X 1 ,K, X m )
Wobec hipotezy alternatywnej:
H 0 : Yˆ ≠ f ( X 1 ,K, X m )
można używać testu serii. W celu jego zastosowania należy
uporządkować chronologicznie reszty modelu. Następnie oblicza
ę liczbę
ę serii s reszt modelu, tj.j p
podciągów
ąg
reszt o tym
y samym
y
się
znaku – dodatnich lub ujemnych. Z tablicy testu liczby
serii dla n1 (liczby reszt dodatnich) i n2 (liczby reszt ujemnych)
oraz dla α i 1 − α
α
2
2
(gdzie
jest przyjętym poziomem istotności) odczytuje się
wartości krytyczne s1∗ i s 2∗.
∗
∗
s
<
s
<
s
Jeśli relacja 1
2 jest spełniona, to
wówczas uważa się
się, że niema podstaw do
odrzucenia przypuszczenia, iż przyjęta
postać analityczna modelu jest właściwa
właściwa,
gdy zaś powyższa relacja nie jest
spełniona odrzuca się hipotezę , co
spełniona,
oznacza że postać analityczna modelu nie
j t właściwa.
jest
ł ś i
Badanie autokorelacji
j składnika losowego
g
„
Autokorelacja składnika losowego może znacznie obniżyć
efektywność estymatorów, a w związku z tym i przydatność
otrzymywanych wyników do celów analizy. W literaturze
podawane jest kilka przyczyn występowania autokorelacji
składnika losowego:
Autokorelacja może wynikać z natury zjawiska.
zjawiska Są to na
przykład zdarzenia losowe takie jak trzęsienie ziemi, które
pozostawia za sobą ślady na wiele okresów.
„
„
Niepoprawna postać funkcji modelu.
modelu Może to być
związane z faktem, iż wiele zjawisk charakteryzuje się
cyklicznością. W szczególności może to dotyczyć modeli
gospodarki.
d ki Jeśli
J śli oszacowany model
d l nie
i będzie
b d i uwzględniał
l d i ł
tego faktu, to składniki losowe sąsiednich okresów będą na
siebie wpływać. Reszty natomiast układają się wtedy w serie
ujemne lub dodatnie.
Kolejnym źródłem jest wadliwa struktura dynamiczna
modelu Jest to sytuacja,
modelu.
sytuacja w której w grupie zmiennych
objaśniających nie zamieściliśmy opóźnionej zmiennej
objaśnianej, zmiennej czasowej lub opóźnionych zmiennych
niezależnych.
„
Bardzo istotnym powodem występowania autokorelacji jest
pominięcie w modelu ważnej zmiennej objaśniającej
objaśniającej. W takiej
sytuacji reszty modelu mogą wykazywać tendencję do
stałego zwiększania swojej wartości bezwzględnej.
„
Przyczyną występowania autokorelacji mogą być operacje
wykonywane na danych statystycznych,
statystycznych między innymi
interpolacje, agregacja lub wygładzanie.
„
Ważnym elementem w badaniu autokorelacji jest jej
właściwe wykrycie. Najpopularniejszym testem,
pozwalającym na weryfikację hipotezy o występowaniu
autokorelacji pierwszego rzędu jest test Durbina–Watsona.
Weryfikuje on hipotezę H0 postaci:
wobec hipotezy alternatywnej H1:
gdzie:
ρτ
H 0 : ρτ = 0
H 1 : ρτ ≠ 0
- jest współczynnikiem autokorelacji reszt rzędu
τ
„
Hipoteza zerowa zakłada więc, że autokorelacja nie
występuje.
t
j S
Sprawdzianem
d i
ttestu
t jjestt statystyka:
t t t k
n
d=
2
(
)
e
−
e
∑ t t −1
t =2
n
2
e
∑t
t =1
gdzie:
et - reszta modelu dla okresu t
t - numer obserwacji
n - liczba obserwacji
Wartości statystyki należą do przedziału (0,4). Wartości d<2
ś i d
świadczą
o występowaniu
t
i autokorelacji
t k l ji dodatniej,
d d t i j natomiast
t i t
wartości d>2 świadczą o autokorelacji ujemnej. Ponadto w
przypadku występowania autokorelacji ujemnej należy
wyznaczyćć : d’:
d’ d’=
d’ 1 – d
tablice wartości krytycznych dla przyjętego poziomu
istotności
podają
p
ją dwie wartości krytyczne:
yy
dolną
ą dL oraz
α wartość d>dU to wówczas niema podstaw do
górną dU . Jeśli
odrzucenia hipotezy zerowej, a więc wnioskujemy, iż reszty
modelu są
ą niezależne. Jeżeli natomiast d<dL to hipotezę
p
ę H0
należy odrzucić na rzecz hipotezy alternatywnej H1,
wnioskując, iż występuje autokorelacja reszt modelu.
Gdy spełniona jest relacja d L ≤ d ≤ d U ,wówczas
wówczas test nie
umożliwia oceny niezależności reszt modelu. Należy
wówczas zastosować inne testy statystyczne.
Badanie stałości wariancji (homoscedastyczności)
składników losowych
„
„
Jednym ze sposobów badania stałości wariancji składników
losowych jest zweryfikowanie hipotezy o równości wariancji
najczęściej dwóch skrajnych grup obserwacji (wtedy
jednakże musi się dać wprowadzić naturalne
uporządkowanie próby, które np. występuje w danych w
postaci szeregów czasowych).
Rozpatruje się takie dwa podzbiory obserwacji (próby), co
do których istnieje przypuszczenie
przypuszczenie, że wariancja jest
największa i najmniejsza. Niech N1 będzie liczbą obserwacji
w pierwszym podzbiorze, a N2 w drugiej podpróbie.
„
Do zweryfikowania
y
hipotezy
p
y zerowejj o równości wariancjij
składników losowych w obu podpróbach H 0 : σ 12 = σ 22
wobec hipotezy alternatywnej H 1 : σ 12 < σ 22 można wykorzystać
statystykę testową:
2
2
2
S2
F= 2
S1
gdzie S1 oraz S 2 są wariancjami resztowymi w regresji
odpowiednio w pierwszej i drugiej podpróbie. Statystyka F ma, przy
założeniu normalności składników losowych i prawdziwości H0
rozkład F Fishera-Snedecora, zatem z tablic tego rozkładu dla
przyjętego poziomu istotności
i dla N2 – K oraz N1 – K
stopni swobody odczytujemy wartość krytyczną F α Jeśli to niema
podstaw do odrzucenia hipotezy zerowej H0 o jednorodności
wariancji. Jeśli F > Fα
to H0 należy odrzucić na rzecz hipotezy alternatywnej H1 wariancja składników losowych w drugiej próbie jest statystycznie
istotnie większa od wariancji w pierwszym podzbiorze.
α
Badanie normalności rozkładu składników losowych
losowych.
„
Do oceny, czy reszty modelu mają rozkład normalny z wartością
oczekiwaną równą zeru, można przy dużej próbie użyć percentyli.
W tym celu przeprowadza się standaryzację reszt według wzoru
ei
~
ei =
s
gdzie:
~
ei - i-ta standaryzowana reszta modelu
ei
s
- i -ta
t reszta
t modelu,
d l
- odchylenie standardowe reszt.
,
zestandaryzowanych
y
y reszt modelu ma wartość z
Jeśli około 99,7%
przedziału (-3,+3), około 95% - z przedziału (-2,+2) i około 68% z
przedziału (-1,+1), to uważa się, że mają one rozkład normalny.
W celu sprawdzenia hipotezy H0 (o normalnym rozkładzie
reszt modelu) wobec hipotezy alternatywnej H1 (o innym
rozkładzie
kł d i resztt modelu)
d l ) można
ż w razie
i małej
ł j próby
ób użyć
ż ć
testu cel Hellwiga. Określa się wówczas liczbę cel pustych k,
do których nie trafia żadna ze standaryzowanych według
wzoru resztt modelu,
d l i porównuje
ó
j jją z wartościami
t ś i i
krytycznymi k1 i k2 odczytanymi, dla przyjętego poziomu
α
istotności
, z tablic testu cel. Jeśli nie została spełniona
podwójna
d ój nierówność
i ó
ść k1<k<k
k k2 to
t wówczas
ó
odrzuca
d
się
i
hipotezę H0, co oznacza, że rozkład reszt modelu nie jest
normalny, w przeciwnym razie brak jest podstaw do
odrzucenia hipotezy H0 .