Estymacja
Transkrypt
Estymacja
dr Dariusz Karaś EKONOMETRIA Definicja Estymacja (tj. szacowanie) parametrów strukturalnych modelu ekonometrycznego oznacza znalezienie ocen parametrów strukturalnych na podstawie konkretnej próby (sprowadza się do przypisywania nieokreślonym liczbowo parametrom konkretnych wartości liczbowych). Szacowanie to powinno być przeprowadzone w taki sposób, aby zapewniło najlepsze dopasowanie modelu do danych empirycznych. Metoda Powszechnie wykorzystywaną metodą szacowana parametrów strukturalnych liniowych modeli ekonometrycznych jest klasyczna metoda najmniejszych kwadratów (KMNK). Twierdzenie Gaussa-Markowa W klasycznym modelu regresji liniowej najlepszym nieobciążonym estymatorem liniowym parametrów jest estymator uzyskany Metodą Najmniejszych Kwadratów (MNK). Idea MNK: minimalizuje sumę kwadratów odchyleń (reszt). Własności estymatorów Nieobciążoność – g jest nieobciążonym estymatorem θ, jeżeli E(g)= θ, to znaczy, gdy wartość oczekiwana w rozkładzie z próby g jest równa θ. Oznacza to, że gdybyśmy obliczali wartość g dla każdej z prób, którymi dysponujemy i powtarzali ten proces nieskończenie wiele razy, to średnia z uzyskanych ocen byłaby równa θ. Efektywność – estymator jest efektywny, jeżeli wartości g wyliczone dla różnych prób nie różnią się między sobą znacznie tzn. jeżeli wariancja estymatorów jest mała. Estymator z najmniejszą wariancją to estymator najbardziej efektywny. Zgodność – (własność dużych prób) zwiększanie liczebności próby umożliwia uzyskiwanie estymatora o wartości coraz bliższej szacowanego parametru, z prawdopodobieństwem bliskim jedności: lim 𝑃(|𝑔 − 𝜃| < 𝜀) = 1 𝑛→∞ Można wykazać, że estymator oszacowany Klasyczną Metoda Najmniejszych Kwadratów jest: nieobciążony zgodny najbardziej efektywny w klasie estymatorów nieobciążonych, czyli: BLUE –Best Linear Unbiased Estimator (najlepszy liniowy nieobciążony estymator). Warunki stosowalności KMNK 1) liczba obserwacji musi być większa niż liczba szacowanych parametrów, 2) rząd macierzy zmiennych objaśniających X musi być równy liczbie szacowanych parametrów (warunek ten oznacza brak wspóliniowości zmiennych, tzn. że zmienne objaśniające są liniowo niezależne, czyli nie tworzą ze sobą takiej kombinacji liniowej, która w wyniku daje wektor zerowy), 3) postać modelu jest liniowa względem parametrów (lub sprowadzalna do liniowej), 1 dr Dariusz Karaś EKONOMETRIA 4) wartość oczekiwana składnika losowego jest równa 0, 5) wariancja składnika losowego jest jednakowa dla wszystkich obserwacji (homoskedastyczność), 6) nie występuje autokorelacja składników losowych - składniki losowe dla różnych obserwacji nie zależą od siebie, 7) zmienne objaśniające są nielosowe - nie zalezą od składnika losowego, 8) składnik losowy dla każdej obserwacji ma rozkład normalny. Jeżeli nie są spełnione założenia 1) - 2), nie można zastosować matematycznych formuł na KMNK. Jeżeli nie są spełnione założenia 4) - 7), to estymator KMNK nie jest efektywny. Założenie 8) nie ma znaczenia dla własności estymatora KMNK. Jego spełnienie jest konieczne, aby można było zastosować testy statystyczne pozwalające sprawdzić pozostałe założenia (większość testów statystycznych bazuje na założeniu, że zmienna losowa ma rozkład normalny). 𝛼̂ = (𝑋 𝑇 𝑋)−1 𝑋 𝑇 𝑌 Estymator KMNK: Interpretacja ocen parametrów strukturalnych modelu 𝛼0 - wyraz wolny, bez interpretacji 𝛼𝑖 - wraz ze wzrostem zmiennej objaśniającej o jedną jednostkę, zmienna objaśniana zmieni się (tj. wzrośnie/zmaleje) o 𝜶𝒊 jednostek, przy pozostałych czynnikach niezmienionych (ceteris paribus). 𝑆(𝛼𝑖 ) – szacując wartość tego parametru, myliśmy się przeciętnie o +/- 𝑆(𝛼𝑖 ) jednostek. Każdy parametr interpretuje się osobno. Etapy procesu weryfikacji modelu ekonometrycznego Weryfikacja ekonomiczna Sprawdzenie zgodności wyników oszacowania (znaków parametrów) z teorią ekonomiczną. Weryfikacja ilościowa Sprawdzenie statystycznej istotności zależności pomiędzy zmienną objaśnianą a zmiennymi objaśniającymi. Sprawdzenie poprawności doboru postaci analitycznej modelu. Sprawdzenie jakości dopasowania modelu do danych rzeczywistych. Weryfikacja stochastyczna Sprawdzenie prawidłowości założeń dotyczących składnika losowego – badanie własności estymatora MNK dla modelu: 2 dr Dariusz Karaś EKONOMETRIA - weryfikacja hipotezy o normalności rozkładu składnika losowego, - weryfikacja hipotezy o stałości wariancji składników losowych, - weryfikacja hipotezy o normalności rozkładu składnika losowego. Sprawdzenie własności prognostycznych modelu. Skutki błędnej specyfikacji modelu Autokorelacja Z autokorelacją mamy do czynienia wówczas, gdy składniki losowe dotyczące różnych obserwacji są ze sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych. W modelach przekrojowych mamy do czynienia z autokorelacją przestrzenną. Przyczyny autokorelacji: - pominięcie w modelu ważnej zmiennej objaśniającej, - niewłaściwy dobór opóźnień zmiennych objaśniających, - skutki działania czynnika przypadkowego i jego wpływ na następne okresy, - wybór niewłaściwej postaci analitycznej modelu, - uwzględnienie w modelu zbyt dużej liczby zmiennych objaśniających przypadkowo dobranych, - pominięcie efektu sezonowości analizowanej zmiennej objaśnianej. Konsekwencje występowania autokorelacji: - estymator MNK nadal jest nieobciążony, ale przestaje być najefektywniejszy, - obciążenie estymatora wariancji składnika losowego, - błędne wyniki testów istotności - wariancja jest niedoszacowana co prowadzi do pozornie większej dokładności ocen parametrów i otrzymujemy zawyżone statystyki t-Studenta, - niewiarygodne syntetyczne miary dopasowania. Heteroskedastyczność Oznacza, iż składniki losowe modelu mają różne wariancje (zmienność wariancji – heteroskedastyczność). Z taką sytuacją spotykamy się najczęściej w przypadku modeli przekrojowych i panelowych. Konsekwencje heteroskedastyczności: - estymator MNK nadal jest nieobciążony, ale staje się nieefektywny, - obciążone oceny błędów szacunku parametrów strukturalnych, 3 EKONOMETRIA dr Dariusz Karaś - niewiarygodne wyniki testów istotności. Niespełnienie założenia o normalności rozkładu składnika losowego Sposoby rozwiązania problemu: - zmodyfikować metody uwzględniając inny lepszy w danym przypadku rozkład: gamma, lognormalny, itd. - dokonać transformacji zmiennych (np. zlogarytmować, podnieść do potęgi) tak, aby uzyskać rozkład normalny - przykładem takiej transformacji jest transformacja Boxa-Coxa. 4