Modele regresji cz III
Transkrypt
Modele regresji cz III
4/12/2016 Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe’a 4. Normalność rozkładu zakłóceń - test Jarque-Bera Szum Pomiar (wyodrębnienie) poszczególnych składowych systematycznych szeregu następuje poprzez jego dekompozycję. Prawidłowo przeprowadzona dekompozycja powinna zakończyć się wyodrębnieniem szumu - "czysto" losowego składnika, który nie wykazuje żadnych tendencji czy regularności. Proces wyodrębniania szumu nazywamy filtracją. Formalnie szum to stacjonarny proces stochastyczny Z1, Z2,..., Zn,... o przyrostach niezależnych. W praktyce na ogół zadowalamy się stacjonarnością w szerszym sensie, tzn. niezmienniczością momentów pierwszego i drugiego rzędu ze względu na przesuniecie w czasie. Szum nazywamy białym, jeśli zmienne losowe Zi, i=1,2,… mają rozkład normalny o stałych (takich samych) momentach. 1 4/12/2016 Przypomnienie Proces stochastyczny jest procesem o przyrostach niezależnych jeśli dla dowolnych t1, t2,..., tn , przyrosty (zmienne losowe): Zt2 - Zt1, Zt3 - Zt2, … , Ztn - Ztn-1 są niezależne Proces stacjonarny w węższym sensie (strictly stationary process ): dla dowolnych t1, t2,..., tn oraz k rozkład wektora (Zt1, Zt2,..., Ztn ) jest identyczny z rozkładem wektora (Zt1+k, Zt2+k,..., Ztn+k) Proces stacjonarny w szerszym sensie (weakly stationary process): Momenty drugiego rzędu są niezmiennicze ze względu na przesunięcie. Zachodzi to wtedy tylko wtedy, gdy E(Zt)= m = constans Var(Zt)= σ 2 = constans cov(Zt,Zt+k)=R(k) Karty kontrolne w badaniu szumu 1. Karta obserwacji 2. Karta (karta średnich) 3. Karta s (karta odchyleń standardowych) 4. Karta R (karta rozstępów) Przykłady w pakiecie Mathematica 2 4/12/2016 Weryfikacja hipotezy losowości odchyleń Hipoteza zerowa: Obserwowane wartości mają losowe odchylenia od średniej Hipoteza alternatywna: odchylenia obserwowanych wartości od średniej wykazują regularność Opis testu: Obliczamy reszty tj: odchylenia wartości od ich średniej. Szeregujemy reszty według czasu Resztom dodatnim przypisujemy znak „+”, resztom ujemnym „−”. Reszty równe 0 odrzucamy! Otrzymujemy w ten sposób ciąg typu: − − + + + − + − + + − + + + − − − − Obliczmy liczbę serii występujących w otrzymanym ciągu. Serią jest ciąg takich samych znaków (także jednoelementowy) Odczytujemy z tablic dla testu serii i danego poziomu istotności wartość krytyczną N* (zależy ona od liczby znaków „+” i liczby znaków „–” . Hipotezę zerową odrzucamy, jeśli liczba serii Ns jest mniejsza od N*. Wartości kwantyli dla testu serii dla małych prób 3 4/12/2016 Przybliżone wartości kwantyli dla testu serii dla dużych prób można obliczyć z wzoru Hipotezę o liniowości modelu odrzucamy, gdy liczba serii jest mniejsza od wartości kwantyla kα gdzie α jest poziomem istotności testu Testy w weryfikacji przyjętych założeń 2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Model: Y = β1X1+ β2X2+ ...+ βkXk+Z Autokorelacja zakłóceń (proces autokorelacji pierwszego rzędu): Zi+1 = ρ Zi+ V, i=1,2,....,n-1 ρ - współczynnik autokorelacji , |ρ |<1 V - zmienna losowa o średniej 0 i skończonej wariancji Autokorelacja występuje często, gdy model szacujemy na podstawie szeregów czasowych 4 4/12/2016 Testy w weryfikacji przyjętych założeń 2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Model z wyrazem wolnym: Y = β1+ β2X2 + ...+ βkXk+ Z ρ =0 Hipoteza zerowa: Hipoteza alternatywna: ρ≠0 ( brak autokorelacji) ( autokorelacja występuje) Test Durbina - Watsona Krok 1 Estymujemy parametry modelu. Krok 2 Obliczmy reszty w oszacowanym modelu : e1,e2,...,en Krok 3 Wyznaczamy wartość statystyki testowej Testy w weryfikacji przyjętych założeń 2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Test Durbina - Watsona Schemat podejmowania decyzji: dL oraz du - wartości krytyczne wyznaczane z tablic d ≤ dL dL < d < dU dU < d < 4 - dU Hipotezę zerową odrzucamy brak decyzji Nie ma podstaw do odrzucenia hipotezy zerowej 4-dU ≤ d ≤ 4-dL brak decyzji 4-dL < d Hipotezę zerową odrzucamy 5 4/12/2016 Test Durbina – Watsona: Wartości krytyczne dL oraz dU dla poziomu istotności α = 0.05: Testy w weryfikacji przyjętych założeń 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe’a Model nazywamy heteroskedastycznym, jeżeli składniki losowe dla poszczególnych obserwacji mają różne wariancje. Jeśli wariancje są takie same dla każdej obserwacji model nazywamy homoskedastycznym Heteroskedastyczność składnika losowego pojawia sie czesto, gdy szacujemy model na podstawie danych przekrojowych lub przekrojowo-czasowych Formułujemy hipotezy. Hipoteza zerowa: Hipoteza alternatywna: σi = const σi ≠ const i=1,2,....,n (model homoskedastyczny) ( model heteroskedastyczny) 6 4/12/2016 Testy w weryfikacji przyjętych założeń 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe’a Krok 1 Estymujemy parametry modelu : Y = β1X1+ β2X2+ ...+ βkXk + Z Krok 2 Obliczamy reszty w oszacowanym modelu i porządkujemy je od najmniejszej do największej : e1,e2,...,en Krok 3 Wyznaczamy wartość statystyki testowej gdzie m jest środkowym numerem obserwacji (dla n parzystego przyjmujemy m=n/2) Uwaga: musi być spełniony warunek: n>2k Testy w weryfikacji przyjętych założeń 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe’a Krok 4 Dla przyjętego poziomu istotności a odczytujemy z tablic rozkładu F-Snedecora wartości: F1 dla stopni swobody (n-m) i (m-k ) oraz F2 dla stopni swobody (n-m-k ) i m. Krok 5 Wyznaczamy wartości krytyczne bL oraz dU dla poziomu istotności α : Schemat podejmowania decyzji: b ≤ bL bL < b < dU dU ≤ b Hipotezę zerową odrzucamy brak decyzji Nie ma podstaw do odrzucenia hipotezy zerowej 7 4/12/2016 Testy w weryfikacji przyjętych założeń 4. Normalność rozkładu zakłóceń Test Jarque-Bera Hipoteza zerowa: Składnik losowy Z ma rozkład normalny Hipoteza alternatywna: Składnik losowy Z ma rozkład inny niż normalny Krok 1 Estymujemy parametry modelu : Y = β1X1+ β2X2+ ...+ βkXk + Z Krok 2 Obliczamy reszty w oszacowanym modelu : e1,e2,...,en Krok 3 Obliczamy Testy w weryfikacji przyjętych założeń 4. Normalność rozkładu zakłóceń Test Jarque-Bera Statystyka testowa: Zbiór krytyczny: gdzie χ1-α jest kwantylem rzędu 1-α z rozkładu χ2 o dwóch stopniach swobody, α jest przyjętym poziomem istotności testu 8 4/12/2016 Testy w weryfikacji przyjętych założeń 4. Normalność rozkładu zakłóceń Uwaga: Jeśli pakiety które wykorzystujemy umożliwiają weryfikacje założnia o normalności rozkładu zakłóceń za pomocą testu Shapiro-Wilka, to go wykorzystujemy! Jest to test mocniejszy od testu Jarque-Bera Uwaga: A jakie są konsekwencje niespełnienia poszczególnych założeń? 9