MIWS_Szacowanie parametrów strukturalnych modelu

Transkrypt

MIWS_Szacowanie parametrów strukturalnych modelu
Szacowanie parametrów strukturalnych modelu
ܻ = ߙ଴ + ߙଵ ܺଵ + ߙଶ ܺଶ + ⋯ + ߙ௞ ܺ௞ + ߝ
Y – zmienna objaśniana,
X1,X2,…,Xk – zmienne objaśniające, k zmiennych objaśniających,
α0, α1, α2, …,αk – parametry strukturalne modelu, k+1 parametrów modelu,
ε – składnik losowy, symbolizuje różnice między wartościami empirycznymi i
teoretycznymi (wynikającymi z modelu), symbolizuje czynniki losowe, które
wpływają na kształtowanie zmiennej objaśnianej.
Metoda Najmniejszych Kwadratów (MNK) polega na ustaleniu (estymacji,
szacowaniu) parametrów strukturalnych modelu tak, aby realizowały postulat
minimalnej sumy kwadratów różnic między wartościami empirycznymi i
teoretycznymi zmiennej objaśnianej.
ܻ෠ = ߙ଴ + ߙଵ ܺଵ + ߙଶ ܺଶ + ⋯ + ߙ௞ ܺ௞ - wartości teoretyczne
௡
෍(ܻ௧ − ܻ෠௧ )ଶ → ݉݅݊
诲瞰
௧ୀଵ
瞴 瞶 瞶
Ćwiczenie
1. Otwórz plik z danymi MIWS_szacowanie_parametrów_modelu.xls
Oblicz współczynniki zmienności dla wszystkich zmiennych w wierszu 18.
2. Oszacuje parametry modelu ܻ = ߙ଴ + ߙଵ ܺଵ + ߙଶ ܺଶ + ߙଷ ܺଷ + ߝ, wykorzystując funkcję
REGLINP(). Funkcja REGLINP() jest funkcją tablicową. Przed wyborem (wstawieniem) funkcji
REGLINP() zaznacz tyle komórek w wierszu, ile jest parametrów w modelu.
Następnie z menu WSTAW (Formuły) wywołaj, wklej funkcję REGLINP()
W polu Znane_y wskazujemy obszar komórek z danymi dotyczącymi zmiennej objaśnianej
W polu Znane_x wskazujemy obszar komórek z danymi dotyczącymi zmiennych
objaśniających
W polu Stała wpisujemy 1. W polu Statystyka wpisujemy 0.
UWAGA! Nie klikaj OK.! Funkcje tablicowe wymagają kombinacji klawiszy
<CTRL>+<SHIFT>+<ENTER>
Model ma następującą postać analityczną:
ܻ = −2,74721 − 0,00011ܺଵ + 0,14169ܺଶ + 0,05251ܺଷ + ߝ
3. Zinterpretuj wartości oszacowanych parametrów.
Znak przed parametrem informuje czy zmienna przy parametrze jest stymulantą (+), czy
destymulantą (-). Jeśli wartość zmiennej wzrośnie o jednostkę, to wartość zmiennej
objaśnianej:
• wzrośnie o wartość parametru przy zmiennej, jeśli jest stymulantą,
• spadnie w przypadku destymulanty.
Badanie istotności parametrów strukturalnych modelu
Badanie ma na celu sprawdzenie statystycznej istotności wartości
oszacowanych parametrów strukturalnych modelu ܻ = ߙ଴ + ߙଵ ܺଵ + ߙଶ ܺଶ +
⋯ + ߙ௞ ܺ௞ + ߝ. Ma odpowiedzieć na pytanie: czy parametry są istotnie różne
od zera. Jeśli parametry nie są istotnie różne od zera, to zmienna przy danym
parametrze nie ma istotnego wpływu na kształtowanie się badanego zjawiska
(nie ma wpływu na zmienną objaśnianą) – dowolna wartość zmiennej
pomnożona przez zero wynosi zero… Wobec tego zmienną taką należy
wyeliminować z modelu, a badanie ma sens jedynie dla parametrów, które są
przy zmiennych objaśniających (nie badamy istotności parametru α0).
Badanie polega na weryfikacji hipotezy:
‫ܪ‬଴ : ߙ௜ = 0,
wobec hipotezy alternatywnej:
‫ܪ‬ଵ : ߙ௜ ≠ 0.
Sprawdzianem hipotezy H0 jest statystyka:
|ఈ |
‫ = ܫ‬ௌ(ఈ೔ ),
೔
która ma rozkład t-Studenta o n-k-1 stopniach swobody.
ܵ(ߙ௜ ) - oznacza standardowy błąd szacunku parametru αi .
Obliczoną wartość statystyki I należy porównać z wartością I* odczytaną z
tablic testu t-Studenta dla przyjętego poziomu istotności (najczęściej 0,05) oraz
n-k-1 stopni swobody (n – liczba obserwacji, k – liczba zmiennych
objaśniających w modelu). Jeśli spełniony jest warunek:
I < I*,
to nie ma podstaw do odrzucenia hipotezy H0, w przeciwnym wypadku
odrzucamy tę hipotezę na rzecz hipotezy H1.
Ćwiczenie
1. Wykorzystaj funkcję REGLINP(), w celu oszacowania parametrów strukturalnych modelu wraz
z statystykami szacunku. Zaznacz obszar komórek o wymiarach 5x(k+1) – 5 wierszy oraz k+1
kolumn (tyle kolumn ile parametrów w modelu)
Zastosuj funkcję REGLINP(), w polu Statystyka wpisz 1.
<CTRL>+<SHIFT>+<ENTER>
W pierwszym wierszu znajdują się szacunki parametrów strukturalnych, w drugim
standardowe błędy tych szacunków
Ponadto:
R2
Współczynnik wyznaczania (determinacji). Porównuje szacunkowe i rzeczywiste wartości
y, a jego wartość jest w zakresie od 0 do 1. Jeśli współczynnik jest równy 1, istnieje
doskonała korelacja w próbce, tzn. nie ma różnicy między szacowaną wartością y a
rzeczywistą wartością y. Przy drugiej wartości skrajnej, jeśli współczynnik wyznaczania
ma wartość 0, równanie regresji nie jest pomocne w obliczaniu badanej (prognozowanej)
wartości y.
Se
Standardowy błąd oceny y. Standardowy błąd modelu.
F
Statystyka F lub wartość obserwowana F. Statystykę F stosuje się do określania, czy
obserwowana zależność pomiędzy zmienną zależną a zmienną niezależną występuje
przypadkowo. Wykorzystuje się do badanie istotności R2
df
Stopnie swobody. Można użyć stopni swobody, aby łatwiej znaleźć wartości krytyczne F
w tabeli statystycznej. Należy porównać wartości znalezione w tabeli ze statystyką F
zwróconą przez funkcję REGLINP w celu określenia poziomu ufności modelu.
ssreg
ssresid
Regresyjna suma kwadratów.
Resztkowa suma kwadratów. Suma kwadratów reszt modelu.
2. Oblicz wartość krytyczną. Wykorzystaj funkcję ROZKŁAD.T.ODW()
3. Oblicz wartości statystyk I, dla parametrów przy zmiennych objaśniających w modelu. Należy
podzielić wiersz z wartościami parametrów przez wiersz z wartościami standardowych
błędów tych parametrów. Ponieważ w liczniku znajduje się wartość bezwzględna należy
wykorzystać funkcję MODUŁ.LICZBY().
Wartości statystyk znajdują się w wierszu 27. Jak można zauważyć, jedynie w komórce C27
jest wartość implikująca stwierdzenie, że należy odrzucić hipotezę H0 na rzecz hipotezy
alternatywnej H1. Odpowiada to parametrowi przy zmiennej X2.
Nie ma podstaw do odrzucenia hipotezy H0 w przypadku pozostałych parametrów, czyli
parametry te nie są istotnie różne od zera, a zmienne przy których one się znajdują, nie mają
istotnego znaczenia na kształtowanie się Y. Jedynie zmienna X2 ma istotny wpływ na Y.
4. Oszacuj parametry modelu wyłącznie ze zmienną X2. Wykorzystaj w analogiczny sposób
funkcję REGLINP()
<CTRL>+<SHIFT>+<ENTER>
5. Zinterpretuj wartość współczynnika determinacji oraz parametrów modelu.
Model wyjaśnia w ok. 65,7% zmienność liczby posiadanych dzieci… Wiek kobiety wyjaśnia w
ok. 65,7% liczbę posiadanych dzieci w badanej grupie dzieci. Jeżeli wiek kobiety wzrośnie o
ok. 7,5 lat, to liczba posiadanych dzieci wzrasta o jedno dziecko… *
* klasyczna interpretacja nie jest sensowna: jeśli wiek kobiety wzrośnie o 1 rok, to liczba
posiadanych wzrośnie o ok. 0,133 dziecka ☺ Należy sobie zadać pytanie, o ile powinien
wzrosnąć wiek kobiety, aby posiadała o jedno dziecko więcej – taka interpretacja jest bardziej
sensowna. Należy skorzystać z proporcji.
Można zwrócić uwagę na to, że w modelu pierwszym (z trzema zmiennymi), model wyjaśniał
kształtowanie się Y w prawie 69%. Usunięcie dwóch zmiennych spowodowało spadek
wartości współczynnika determinacji jedynie o ok. 0,032. Można to traktować jako
potwierdzenie, że zmienne usunięte z modelu nie miały istotnego znaczenia.
GRATULACJE ☺