tylko wzory do regresji

Transkrypt

tylko wzory do regresji
1.4.1 Błąd średni modelu Se
Błąd średni nazywany jest również błędem standardowym (np. w Excelu) lub bardziej fachowo
odchyleniem standardowym reszt, lub pierwiastkiem z wariancji resztowej. Błąd ten jest liczony na
podstawie wartości odchyleń (reszt et) pomiędzy wartościami teoretycznymi badanego zjawiska (czyli
zmiennej objaśnianej ŷ t , wyliczonej z równania ekonometrycznego), a wartościami empirycznymi, czyli
igrekami- yt , które podstawialiśmy do równania przed jego oszacowaniem. Liczymy go za pomocą
następującej formuły:
1
1
( yt − yˆ t ) =
et2
∑
∑
n−k
n−k
Se = S 2 =
gdzie n jest liczbą obserwacji, a k liczbą szacowanych parametrów.
1.4.2. Współczynnik determinacji R2
Mówi nam o stopniu dopasowania modelu do danych empirycznych (a dokładnie jaką część całkowitej
zmienności zmiennej objaśnianej stanowi zmienność wyjaśniona przez model). Jest miarą dobroci
modelu (tzn. wskazuje na ile model jest dobry, a nie zły, jak w przypadku Se).
Współczynnik
n
R =
2
∑ ( yˆ
t =1
n
t
− y) 2
∑ ( yt − y)
R2
determinacji
2
∑( y
=1 −
∑( y
t
− yˆ t ) 2
t
− yt ) 2
=1−
(n − k ) S e
∑( y
t
określony
jest
wzorem:
2
− yt ) 2
t =1
1.4.3. Błędy średnie estymatorów S (αˆ j ) , czyli oszacowanych parametrów
Nazywane są również odchyleniem standardowym estymatorów (oszacowanych parametrów), lub
pierwiastkiem z wariancji estymatorów (patrz komentarz do Se). Błędy te mówią nam o ile średnio
mylimy się szacując dany parametr αj.
Aby wyliczyć błąd S(αj) należy znać macierz (xTx)-1, której diagonalne elementy pomnożone przez
wariancję resztową Se2 (kwadrat błędu średniego równania z p. 1.4.1) są wariancjami poszczególnych
parametrów. Jeśli zatem macierz wariancji kowariancji estymatorów jako D2(α)= Se2(xTx)-1 , a jej
elementy diagonalne jako dij to błąd średni (odchylenie standardowe) estymatora (oszacowanego
parametru) zapiszemy jako:
S (αˆ j ) = d ij
1.4.4. Statystyki t-Studenta
Służą do testowania istotności parametrów i zmiennych włączonych do modelu. Poniżej zaprezentowany
test jest statystycznym narzędziem podejmowania decyzji co do istotności wpływu uwzględnionych w
równaniu czynników na zmienną objaśnianą. Wnioskowanie o istotności zmiennych odbywa się
pośrednio: poprzez wnioskowanie o istotności parametrów. W tym celu stawiamy następujący zespół
hipotez:
H0: αj=0 (nieistotność statystyczna)
H1: αj≠0 (istotność statystyczna)
Ten zespół hipotez weryfikujemy za pomocą statystyki t postaci:
(1.4.4) tαj =
αˆ j
S (αˆ j )
mającej rozkład t-Studenta.
Następnie należy wybrać właściwą wartość krytyczną rozkładu t-Studenta: tkr, którą odczytujemy dla:
-
odpowiedniego poziomu istotności (jest to przeciwieństwo poziomu prawdopodobieństwa
wnioskowania – poziomu ufności, najczęściej 0.05, czemu odpowiada 95% prawdopodobieństwo
testu);
-
odpowiedniej liczby stopni swobody równania, która jest różnicą pomiędzy liczbą obserwacji n a
liczbą szacowanych parametrów k.
Decyzja o istotności lub jej braku jest następująca:
-
jeżeli tαj<tkr , to nie ma podstaw do odrzucenia hipotezy zerowej (parametr i ew. zmienna z nim
związana są nieistotne statystycznie);
-
jeżeli tαj>tkr , to odrzucamy hipotezę zerową na korzyść alternatywnej (parametr i ew. zmienna
z nim związana mają istotny wpływ na badane zjawisko)
1.4.5. Przedziały ufności dla parametrów:
Przedziały ufności wyznaczają granice w których znajdą się wartości parametrów z góry określonym
prawdopodobieństwem.
Wyznaczanie
przedziałów
ufności
nazywane
jest
również
estymacją
przedziałową bo zamiast konkretnej, jednej wartości estymatora (oszacowanego parametru) wyznacza się
prawdopodobny przedział jego wartości, wg wzoru:
(1.4.5) αj∈( αˆ j − t kr S (αˆ j ); αˆ j + t kr S (αˆ j ) )
gdzie:
αj – „prawdziwa” wartość parametru αj
α̂ j - estymator (oszacowanie) parametru αj
tkr – wartość krytyczna rozkładu t- Studenta dla n-k stopni swobody i z góry ustalonym
prawdopodobieństwie
S (αˆ j ) - błąd średni estymatora (oszacowania) αj
Przedziały ufności mówią nam, że przy danym prawdopodobieństwie (równym prawdopodobieństwu dla
wartości tkr we wzorze (1.4.5) przedział o podanych krańcach pokryje prawdziwą wartość badanego
parametru.

Podobne dokumenty