T i hi h Testowanie hipotez statystycznych związanych z
Transkrypt
T i hi h Testowanie hipotez statystycznych związanych z
Testowanie T i hipotez hi statystycznych h związanych ą y z szacowaniem i ocenąą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych kwadratów powinna być stosowana tylko wówczas, gdy są spełnione następujące założenia: • Zmienna prognozowana modelu jest liniową funkcją zmiennych objaśniających oraz odchyleń losowych et . • Zmienne objaśniające modelu są wielkościami nielosowymi o ustalonych t l h wartościach. t ś i h • Między zmiennymi objaśniającymi modelu nie występuje zjawisko współliniowości współliniowości. • Odchylenia losowe mają rozkład normalny, z wartością oczekiwaną równą zeru, oraz stałą i skończoną wariancją. • Odchylenia losowe wyznaczone dla różnych wartości zmiennych objaśniających nie są ze sobą skorelowane. Badanie B d i iistotności ś i p r m tró strukturalnych parametrów tr kt r ln h Testowanie parametrów strukturalnych testem T – Studenta Badanie B d i istotności i t t ś i parametrów t ó strukturalnych t kt l h liniowego li i modelu d l ekonometrycznego ma na celu sprawdzenie, czy zmienne objaśniające istotnie oddziałują na zmienną objaśnianą, czy też nie. i Zakładając, że składnik losowy modelu ma rozkład normalny, weryfikuje y j się ę hipotezę p ę o istotności każdego g p parametru, tj. j sprawdza się, czy parametr istotnie różni się od zera. W tym celu formułuje się hipotezę zerową i alternatywną: gdzie: α i prawdziwa wartość parametru stojącego przy i-tej i tej zmiennej objaśniającej. H0 : [αi = 0] H1 :[αi ≠0] S Sprawdzeniem d i tejj hipotezy hi jest j statystyka: k ti = ai D (a i ) g gdzie: ai – wartość oceny parametru stojącego przy i-tej zmiennejj objaśniającej, j ją j, D(ai) – błąd oceny i-tego parametru. Jeśli wartość statystyki ti jest większa od wartości krytycznej tα : (t i > tα ), odczytanej z tablicy rozkładu p yp małejj p próby) y) lub z tablicyy rozkładu t-Studenta ((w przypadku normalnego (dla dużej próby), dla przyjętego poziomu istotności α oraz dla (n-m)stopni swobody, to wówczas odrzuca się hipotezę zerową H0 na rzecz hipotezy alternatywnej H1 . Mówimy wtedy, że i-ta zmienna objaśniająca istotnie wpływa na zmienną prognozowaną. Gdy ( t i ≤ t α ) to natomiast t i t zachodzi h d i relacja l j odwrotna d t t niema i wówczas podstaw do odrzucenia hipotezy zerowej. Oznacza to,, że i-ta zmienna objaśniająca, j ją , nieistotnie wpływa py na zmienną prognozowaną i powinna być usunięta z modelu. PRZYKŁAD PRZYKŁAD Testowanie parametrów strukturalnych testem F Fi h F-Fishera-Snedecora S d Ocena istotności parametrów strukturalnych za pomocą testu F polega na tym że tu stawia się hipotezę obejmującą parametry stojące tylko przy zmiennych objaśniających: H0:a1=a2=...=ak=0 wobec hipotezy H1, że co najmniej jedna z równości nie jest spełniona. p Test dla hipotezy p y zerowejj tak sformułowanejj opiera p się ę na statystyce F (statystyka F przy prawdziwości hipotezy ma rozkład F o k oraz n-k-1 stopniach swobody) wyrażonej wzorem: 2 (1 y ) a X y− (n − k − 1) n F= T k u u T T T Hipoteza zakłada więc, że wszystkie zmienne objaśniające nie oddziałują na zmienną endogeniczną, co oznacza, iż nie powinny się znaleźć l źć w modelu. d l Odrzucenie hipotezy H0 na poziomie α następuje w sytuacji t ji gdy d F > Fα (gdzie ( d i Fα odczytano d t z ttablic bli rozkładu F-Snedecora), co oznacza, że co najmniej jedna wzięta do modelu zmienna jest istotna. Badanie rozkładu odchyleń losowych modelu Badanie symetrii składnika losowego Obserwacje odchylające się in plus (in minus) od wartości modalnych powinny stanowić połowę wszystkich obserwacji obserwacji. Formułujemy zatem hipotezę zerową głoszącą, że składnik resztowy ma rozkład symetryczny: y y y ⎡m 1⎤ H0 : ⎢ = ⎥ ⎣ n 2⎦ wobec hipotezy p y alternatywnej y jg głoszącej, ą j, że rozkład składnika resztowego nie jest symetryczny ⎡m 1⎤ H1 : ⎢ ≠ ⎥ ⎣ n 2⎦ Statystyka służąca do weryfikacji hipotezy H0 ma postać: t emp = m 1 − n 2 m m (1 − ) n n n −1 gdzie: d i m - liczba odchyleń dodatnich w próbie, n - liczba wszystkich odchyleń w próbie. próbie Jeśli jej wartość jest większa od odczytanej (dla małej próby) z tablic rozkładu t-Studenta dla przyjętego poziomu istotności oraz n-1 stopni swobody lub z tablicy rozkładu normalnego (dla dużej próby), to oznacza to odrzucenie hipotezy H0, czyli brak symetrii odchyleń losowych α Badanie losowości odchyleń losowych modelu Badanie to ma na celu weryfikację hipotezy o trafności doboru postaci analitycznej modelu. modelu Do weryfikacji hipotezy zerowej: H 0 : Yˆ = f ( X 1 ,K, X m ) Wobec hipotezy alternatywnej: H 0 : Yˆ ≠ f ( X 1 ,K, X m ) można używać testu serii. W celu jego zastosowania należy uporządkować chronologicznie reszty modelu. Następnie oblicza ę liczbę ę serii s reszt modelu, tj.j p podciągów ąg reszt o tym y samym y się znaku – dodatnich lub ujemnych. Z tablicy testu liczby serii dla n1 (liczby reszt dodatnich) i n2 (liczby reszt ujemnych) oraz dla α i 1 − α α 2 2 (gdzie jest przyjętym poziomem istotności) odczytuje się wartości krytyczne s1∗ i s 2∗. ∗ ∗ s < s < s Jeśli relacja 1 2 jest spełniona, to wówczas uważa się się, że niema podstaw do odrzucenia przypuszczenia, iż przyjęta postać analityczna modelu jest właściwa właściwa, gdy zaś powyższa relacja nie jest spełniona odrzuca się hipotezę , co spełniona, oznacza że postać analityczna modelu nie j t właściwa. jest ł ś i Badanie autokorelacji j składnika losowego g Autokorelacja składnika losowego może znacznie obniżyć efektywność estymatorów, a w związku z tym i przydatność otrzymywanych wyników do celów analizy. W literaturze podawane jest kilka przyczyn występowania autokorelacji składnika losowego: Autokorelacja może wynikać z natury zjawiska. zjawiska Są to na przykład zdarzenia losowe takie jak trzęsienie ziemi, które pozostawia za sobą ślady na wiele okresów. Niepoprawna postać funkcji modelu. modelu Może to być związane z faktem, iż wiele zjawisk charakteryzuje się cyklicznością. W szczególności może to dotyczyć modeli gospodarki. d ki Jeśli J śli oszacowany model d l nie i będzie b d i uwzględniał l d i ł tego faktu, to składniki losowe sąsiednich okresów będą na siebie wpływać. Reszty natomiast układają się wtedy w serie ujemne lub dodatnie. Kolejnym źródłem jest wadliwa struktura dynamiczna modelu Jest to sytuacja, modelu. sytuacja w której w grupie zmiennych objaśniających nie zamieściliśmy opóźnionej zmiennej objaśnianej, zmiennej czasowej lub opóźnionych zmiennych niezależnych. Bardzo istotnym powodem występowania autokorelacji jest pominięcie w modelu ważnej zmiennej objaśniającej objaśniającej. W takiej sytuacji reszty modelu mogą wykazywać tendencję do stałego zwiększania swojej wartości bezwzględnej. Przyczyną występowania autokorelacji mogą być operacje wykonywane na danych statystycznych, statystycznych między innymi interpolacje, agregacja lub wygładzanie. Ważnym elementem w badaniu autokorelacji jest jej właściwe wykrycie. Najpopularniejszym testem, pozwalającym na weryfikację hipotezy o występowaniu autokorelacji pierwszego rzędu jest test Durbina–Watsona. Weryfikuje on hipotezę H0 postaci: wobec hipotezy alternatywnej H1: gdzie: ρτ H 0 : ρτ = 0 H 1 : ρτ ≠ 0 - jest współczynnikiem autokorelacji reszt rzędu τ Hipoteza zerowa zakłada więc, że autokorelacja nie występuje. t j S Sprawdzianem d i ttestu t jjestt statystyka: t t t k n d= 2 ( ) e − e ∑ t t −1 t =2 n 2 e ∑t t =1 gdzie: et - reszta modelu dla okresu t t - numer obserwacji n - liczba obserwacji Wartości statystyki należą do przedziału (0,4). Wartości d<2 ś i d świadczą o występowaniu t i autokorelacji t k l ji dodatniej, d d t i j natomiast t i t wartości d>2 świadczą o autokorelacji ujemnej. Ponadto w przypadku występowania autokorelacji ujemnej należy wyznaczyćć : d’: d’ d’= d’ 1 – d tablice wartości krytycznych dla przyjętego poziomu istotności podają p ją dwie wartości krytyczne: yy dolną ą dL oraz α wartość d>dU to wówczas niema podstaw do górną dU . Jeśli odrzucenia hipotezy zerowej, a więc wnioskujemy, iż reszty modelu są ą niezależne. Jeżeli natomiast d<dL to hipotezę p ę H0 należy odrzucić na rzecz hipotezy alternatywnej H1, wnioskując, iż występuje autokorelacja reszt modelu. Gdy spełniona jest relacja d L ≤ d ≤ d U ,wówczas wówczas test nie umożliwia oceny niezależności reszt modelu. Należy wówczas zastosować inne testy statystyczne. Badanie stałości wariancji (homoscedastyczności) składników losowych Jednym ze sposobów badania stałości wariancji składników losowych jest zweryfikowanie hipotezy o równości wariancji najczęściej dwóch skrajnych grup obserwacji (wtedy jednakże musi się dać wprowadzić naturalne uporządkowanie próby, które np. występuje w danych w postaci szeregów czasowych). Rozpatruje się takie dwa podzbiory obserwacji (próby), co do których istnieje przypuszczenie przypuszczenie, że wariancja jest największa i najmniejsza. Niech N1 będzie liczbą obserwacji w pierwszym podzbiorze, a N2 w drugiej podpróbie. Do zweryfikowania y hipotezy p y zerowejj o równości wariancjij składników losowych w obu podpróbach H 0 : σ 12 = σ 22 wobec hipotezy alternatywnej H 1 : σ 12 < σ 22 można wykorzystać statystykę testową: 2 2 2 S2 F= 2 S1 gdzie S1 oraz S 2 są wariancjami resztowymi w regresji odpowiednio w pierwszej i drugiej podpróbie. Statystyka F ma, przy założeniu normalności składników losowych i prawdziwości H0 rozkład F Fishera-Snedecora, zatem z tablic tego rozkładu dla przyjętego poziomu istotności i dla N2 – K oraz N1 – K stopni swobody odczytujemy wartość krytyczną F α Jeśli to niema podstaw do odrzucenia hipotezy zerowej H0 o jednorodności wariancji. Jeśli F > Fα to H0 należy odrzucić na rzecz hipotezy alternatywnej H1 wariancja składników losowych w drugiej próbie jest statystycznie istotnie większa od wariancji w pierwszym podzbiorze. α Badanie normalności rozkładu składników losowych losowych. Do oceny, czy reszty modelu mają rozkład normalny z wartością oczekiwaną równą zeru, można przy dużej próbie użyć percentyli. W tym celu przeprowadza się standaryzację reszt według wzoru ei ~ ei = s gdzie: ~ ei - i-ta standaryzowana reszta modelu ei s - i -ta t reszta t modelu, d l - odchylenie standardowe reszt. , zestandaryzowanych y y reszt modelu ma wartość z Jeśli około 99,7% przedziału (-3,+3), około 95% - z przedziału (-2,+2) i około 68% z przedziału (-1,+1), to uważa się, że mają one rozkład normalny. W celu sprawdzenia hipotezy H0 (o normalnym rozkładzie reszt modelu) wobec hipotezy alternatywnej H1 (o innym rozkładzie kł d i resztt modelu) d l ) można ż w razie i małej ł j próby ób użyć ż ć testu cel Hellwiga. Określa się wówczas liczbę cel pustych k, do których nie trafia żadna ze standaryzowanych według wzoru resztt modelu, d l i porównuje ó j jją z wartościami t ś i i krytycznymi k1 i k2 odczytanymi, dla przyjętego poziomu α istotności , z tablic testu cel. Jeśli nie została spełniona podwójna d ój nierówność i ó ść k1<k<k k k2 to t wówczas ó odrzuca d się i hipotezę H0, co oznacza, że rozkład reszt modelu nie jest normalny, w przeciwnym razie brak jest podstaw do odrzucenia hipotezy H0 .