Estymacja

Transkrypt

Estymacja
dr Dariusz Karaś
EKONOMETRIA
Definicja
Estymacja (tj. szacowanie) parametrów strukturalnych modelu ekonometrycznego oznacza
znalezienie ocen parametrów strukturalnych na podstawie konkretnej próby (sprowadza się do
przypisywania nieokreślonym liczbowo parametrom konkretnych wartości liczbowych). Szacowanie
to powinno być przeprowadzone w taki sposób, aby zapewniło najlepsze dopasowanie modelu do
danych empirycznych.
Metoda
Powszechnie wykorzystywaną metodą szacowana parametrów strukturalnych liniowych modeli
ekonometrycznych jest klasyczna metoda najmniejszych kwadratów (KMNK).
Twierdzenie Gaussa-Markowa
W klasycznym modelu regresji liniowej najlepszym nieobciążonym estymatorem liniowym
parametrów jest estymator uzyskany Metodą Najmniejszych Kwadratów (MNK). Idea MNK:
minimalizuje sumę kwadratów odchyleń (reszt).
Własności estymatorów
Nieobciążoność – g jest nieobciążonym estymatorem θ, jeżeli E(g)= θ, to znaczy, gdy wartość
oczekiwana w rozkładzie z próby g jest równa θ. Oznacza to, że gdybyśmy obliczali wartość g dla
każdej z prób, którymi dysponujemy i powtarzali ten proces nieskończenie wiele razy, to średnia z
uzyskanych ocen byłaby równa θ.
Efektywność – estymator jest efektywny, jeżeli wartości g wyliczone dla różnych prób nie różnią się
między sobą znacznie tzn. jeżeli wariancja estymatorów jest mała. Estymator z najmniejszą wariancją
to estymator najbardziej efektywny.
Zgodność – (własność dużych prób) zwiększanie liczebności próby umożliwia uzyskiwanie estymatora
o wartości coraz bliższej szacowanego parametru, z prawdopodobieństwem bliskim jedności:
lim 𝑃(|𝑔 − 𝜃| < 𝜀) = 1
𝑛→∞
Można wykazać, że estymator oszacowany Klasyczną Metoda Najmniejszych Kwadratów jest:
nieobciążony
zgodny
najbardziej efektywny w klasie estymatorów nieobciążonych,
czyli: BLUE –Best Linear Unbiased Estimator (najlepszy liniowy nieobciążony estymator).
Warunki stosowalności KMNK
1) liczba obserwacji musi być większa niż liczba szacowanych parametrów,
2) rząd macierzy zmiennych objaśniających X musi być równy liczbie szacowanych parametrów
(warunek ten oznacza brak wspóliniowości zmiennych, tzn. że zmienne objaśniające są liniowo
niezależne, czyli nie tworzą ze sobą takiej kombinacji liniowej, która w wyniku daje wektor zerowy),
3) postać modelu jest liniowa względem parametrów (lub sprowadzalna do liniowej),
1
dr Dariusz Karaś
EKONOMETRIA
4) wartość oczekiwana składnika losowego jest równa 0,
5) wariancja składnika losowego jest jednakowa dla wszystkich obserwacji (homoskedastyczność),
6) nie występuje autokorelacja składników losowych - składniki losowe dla różnych obserwacji nie
zależą od siebie,
7) zmienne objaśniające są nielosowe - nie zalezą od składnika losowego,
8) składnik losowy dla każdej obserwacji ma rozkład normalny.
Jeżeli nie są spełnione założenia 1) - 2), nie można zastosować matematycznych formuł na KMNK.
Jeżeli nie są spełnione założenia 4) - 7), to estymator KMNK nie jest efektywny.
Założenie 8) nie ma znaczenia dla własności estymatora KMNK. Jego spełnienie jest konieczne, aby
można było zastosować testy statystyczne pozwalające sprawdzić pozostałe założenia (większość
testów statystycznych bazuje na założeniu, że zmienna losowa ma rozkład normalny).
𝛼̂ = (𝑋 𝑇 𝑋)−1 𝑋 𝑇 𝑌
Estymator KMNK:
Interpretacja ocen parametrów strukturalnych modelu
𝛼0 - wyraz wolny, bez interpretacji
𝛼𝑖 - wraz ze wzrostem zmiennej objaśniającej o jedną jednostkę, zmienna objaśniana zmieni się (tj.
wzrośnie/zmaleje) o 𝜶𝒊 jednostek, przy pozostałych czynnikach niezmienionych (ceteris paribus).
𝑆(𝛼𝑖 ) – szacując wartość tego parametru, myliśmy się przeciętnie o +/- 𝑆(𝛼𝑖 ) jednostek.
Każdy parametr interpretuje się osobno.
Etapy procesu weryfikacji modelu ekonometrycznego
Weryfikacja ekonomiczna
Sprawdzenie zgodności wyników oszacowania (znaków parametrów) z teorią ekonomiczną.
Weryfikacja ilościowa
Sprawdzenie statystycznej istotności zależności pomiędzy zmienną objaśnianą a zmiennymi
objaśniającymi.
Sprawdzenie poprawności doboru postaci analitycznej modelu.
Sprawdzenie jakości dopasowania modelu do danych rzeczywistych.
Weryfikacja stochastyczna
Sprawdzenie prawidłowości założeń dotyczących składnika losowego – badanie własności estymatora
MNK dla modelu:
2
dr Dariusz Karaś
EKONOMETRIA
- weryfikacja hipotezy o normalności rozkładu składnika losowego,
- weryfikacja hipotezy o stałości wariancji składników losowych,
- weryfikacja hipotezy o normalności rozkładu składnika losowego.
Sprawdzenie własności prognostycznych modelu.
Skutki błędnej specyfikacji modelu
Autokorelacja
Z autokorelacją mamy do czynienia wówczas, gdy składniki losowe dotyczące różnych obserwacji są
ze sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych. W
modelach przekrojowych mamy do czynienia z autokorelacją przestrzenną.
Przyczyny autokorelacji:
- pominięcie w modelu ważnej zmiennej objaśniającej,
- niewłaściwy dobór opóźnień zmiennych objaśniających,
- skutki działania czynnika przypadkowego i jego wpływ na następne okresy,
- wybór niewłaściwej postaci analitycznej modelu,
- uwzględnienie w modelu zbyt dużej liczby zmiennych objaśniających przypadkowo dobranych,
- pominięcie efektu sezonowości analizowanej zmiennej objaśnianej.
Konsekwencje występowania autokorelacji:
- estymator MNK nadal jest nieobciążony, ale przestaje być najefektywniejszy,
- obciążenie estymatora wariancji składnika losowego,
- błędne wyniki testów istotności - wariancja jest niedoszacowana co prowadzi do pozornie większej
dokładności ocen parametrów i otrzymujemy zawyżone statystyki t-Studenta,
- niewiarygodne syntetyczne miary dopasowania.
Heteroskedastyczność
Oznacza, iż składniki losowe modelu mają różne wariancje (zmienność wariancji –
heteroskedastyczność). Z taką sytuacją spotykamy się najczęściej w przypadku modeli przekrojowych
i panelowych.
Konsekwencje heteroskedastyczności:
- estymator MNK nadal jest nieobciążony, ale staje się nieefektywny,
- obciążone oceny błędów szacunku parametrów strukturalnych,
3
EKONOMETRIA
dr Dariusz Karaś
- niewiarygodne wyniki testów istotności.
Niespełnienie założenia o normalności rozkładu składnika losowego
Sposoby rozwiązania problemu:
- zmodyfikować metody uwzględniając inny lepszy w danym przypadku rozkład: gamma, lognormalny, itd.
- dokonać transformacji zmiennych (np. zlogarytmować, podnieść do potęgi) tak, aby uzyskać rozkład
normalny - przykładem takiej transformacji jest transformacja Boxa-Coxa.
4