tylko wzory do regresji
Transkrypt
tylko wzory do regresji
1.4.1 Błąd średni modelu Se Błąd średni nazywany jest również błędem standardowym (np. w Excelu) lub bardziej fachowo odchyleniem standardowym reszt, lub pierwiastkiem z wariancji resztowej. Błąd ten jest liczony na podstawie wartości odchyleń (reszt et) pomiędzy wartościami teoretycznymi badanego zjawiska (czyli zmiennej objaśnianej ŷ t , wyliczonej z równania ekonometrycznego), a wartościami empirycznymi, czyli igrekami- yt , które podstawialiśmy do równania przed jego oszacowaniem. Liczymy go za pomocą następującej formuły: 1 1 ( yt − yˆ t ) = et2 ∑ ∑ n−k n−k Se = S 2 = gdzie n jest liczbą obserwacji, a k liczbą szacowanych parametrów. 1.4.2. Współczynnik determinacji R2 Mówi nam o stopniu dopasowania modelu do danych empirycznych (a dokładnie jaką część całkowitej zmienności zmiennej objaśnianej stanowi zmienność wyjaśniona przez model). Jest miarą dobroci modelu (tzn. wskazuje na ile model jest dobry, a nie zły, jak w przypadku Se). Współczynnik n R = 2 ∑ ( yˆ t =1 n t − y) 2 ∑ ( yt − y) R2 determinacji 2 ∑( y =1 − ∑( y t − yˆ t ) 2 t − yt ) 2 =1− (n − k ) S e ∑( y t określony jest wzorem: 2 − yt ) 2 t =1 1.4.3. Błędy średnie estymatorów S (αˆ j ) , czyli oszacowanych parametrów Nazywane są również odchyleniem standardowym estymatorów (oszacowanych parametrów), lub pierwiastkiem z wariancji estymatorów (patrz komentarz do Se). Błędy te mówią nam o ile średnio mylimy się szacując dany parametr αj. Aby wyliczyć błąd S(αj) należy znać macierz (xTx)-1, której diagonalne elementy pomnożone przez wariancję resztową Se2 (kwadrat błędu średniego równania z p. 1.4.1) są wariancjami poszczególnych parametrów. Jeśli zatem macierz wariancji kowariancji estymatorów jako D2(α)= Se2(xTx)-1 , a jej elementy diagonalne jako dij to błąd średni (odchylenie standardowe) estymatora (oszacowanego parametru) zapiszemy jako: S (αˆ j ) = d ij 1.4.4. Statystyki t-Studenta Służą do testowania istotności parametrów i zmiennych włączonych do modelu. Poniżej zaprezentowany test jest statystycznym narzędziem podejmowania decyzji co do istotności wpływu uwzględnionych w równaniu czynników na zmienną objaśnianą. Wnioskowanie o istotności zmiennych odbywa się pośrednio: poprzez wnioskowanie o istotności parametrów. W tym celu stawiamy następujący zespół hipotez: H0: αj=0 (nieistotność statystyczna) H1: αj≠0 (istotność statystyczna) Ten zespół hipotez weryfikujemy za pomocą statystyki t postaci: (1.4.4) tαj = αˆ j S (αˆ j ) mającej rozkład t-Studenta. Następnie należy wybrać właściwą wartość krytyczną rozkładu t-Studenta: tkr, którą odczytujemy dla: - odpowiedniego poziomu istotności (jest to przeciwieństwo poziomu prawdopodobieństwa wnioskowania – poziomu ufności, najczęściej 0.05, czemu odpowiada 95% prawdopodobieństwo testu); - odpowiedniej liczby stopni swobody równania, która jest różnicą pomiędzy liczbą obserwacji n a liczbą szacowanych parametrów k. Decyzja o istotności lub jej braku jest następująca: - jeżeli tαj<tkr , to nie ma podstaw do odrzucenia hipotezy zerowej (parametr i ew. zmienna z nim związana są nieistotne statystycznie); - jeżeli tαj>tkr , to odrzucamy hipotezę zerową na korzyść alternatywnej (parametr i ew. zmienna z nim związana mają istotny wpływ na badane zjawisko) 1.4.5. Przedziały ufności dla parametrów: Przedziały ufności wyznaczają granice w których znajdą się wartości parametrów z góry określonym prawdopodobieństwem. Wyznaczanie przedziałów ufności nazywane jest również estymacją przedziałową bo zamiast konkretnej, jednej wartości estymatora (oszacowanego parametru) wyznacza się prawdopodobny przedział jego wartości, wg wzoru: (1.4.5) αj∈( αˆ j − t kr S (αˆ j ); αˆ j + t kr S (αˆ j ) ) gdzie: αj – „prawdziwa” wartość parametru αj α̂ j - estymator (oszacowanie) parametru αj tkr – wartość krytyczna rozkładu t- Studenta dla n-k stopni swobody i z góry ustalonym prawdopodobieństwie S (αˆ j ) - błąd średni estymatora (oszacowania) αj Przedziały ufności mówią nam, że przy danym prawdopodobieństwie (równym prawdopodobieństwu dla wartości tkr we wzorze (1.4.5) przedział o podanych krańcach pokryje prawdziwą wartość badanego parametru.