Model logitowy (1) - E-SGH
Transkrypt
Model logitowy (1) - E-SGH
Ekonometria WYKŁAD 6 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych Plan Czym się zajmiemy: 1. Błędy HAC - uzupełnienie 2. Modele zmiennej jakościowej Skorygowane błędy standardowe w przypadku autokorelacji i heteroskedastyczności ► Postać ogólna macierzy kowariancji składnika losowego ► Postać ogólna macierzy kowariancji estymatora: ►Postać macierzy kowariancji dla estymatora FGLS (feasible generalized least squares) lub EGLS (od estimated): Heteroscedasticity- consistent standard errors (błędy White’a lub błędy HC) ► Na podstawie macierz kowariancji można zapisać też jako: ► White (1980) pokazał, że do estymacji tej macierzy potrzebny jest jedynie zgodny estymator macierzy Heteroscedasticity- consistent standard errors (błędy White’a lub błędy HC) ► Przy dość ogólnych założeniach zgodnym estymatorem powyższej macierzy jest co pozwala na estymację „prawdziwej” macierzy kowariancji estymatora OLS ► Na tej postawie można wyznaczyć zgodne błędy szacunku Heteroscedasticity-and-autocorellation- consistent standard errors (błędy HAC lub błędy Neweya-Westa) ► Podejście HA jest szczególnym przypadkiem estymacji błędów HAC postaci: gdzie ►Dla w(j)=0 otrzymujemy błędy HA. Przy autokorelacji najczęściej stosuje się wago Bartletta postaci ► Intuicyjnie oddają one fakt, że zazwyczaj autokorelacja maleje wraz z rzędem opóźnienia j. Modele zmiennej jakościowej ►Zmienne jakościowe stosowane są do kwantyfikacji cech jakościowych np. płci, przedziału dochodów, jakości produktu itp. ►Bardzo często zmienne te przyjmują postać binarną (zerojedynkową) np. 1- kobieta, 0- mężczyzna ►Modele zmiennej jakościowej to takie, w których zmienną objaśnianą w modelu jest zmienna jakościowa zazwyczaj zerojedynkowa. ►Zmienne objaśniające mogą być zarówno zmiennymi jakościowymi, jak i ilościowymi ►Postać funkcyjna zależności może być różna, w szczególności może mieć charakter nieliniowy Liniowy Model Prawdopodobieństwa (1) ►LMP w postaci teoretycznej zapisujemy jako gdzie y(i) jest zmienną zero-jedynkową ►Wartości empiryczne zmiennej objaśnianej są równe 0 lub 1, jednak wartości teoretyczne (wynikające z modelu) nie mają takich ograniczeń ►Jaka jest interpretacja wartości teoretycznych y(i)? Co oznacza wartość 0.3, jeśli zmienna objaśniana przyjmuje wartość 1, gdy dana osoba jest bezrobotna, a 0 gdy pracująca? ►Należy zauważyć, że: natomiast z postaci funkcyjnej modelu wynika, że Liniowy Model Prawdopodobieństwa (2) ►Z powyższego wynika że: co oznacza, że wartość teoretyczna zmiennej objaśnianej może być interpretowana jako prawdopodobieństwo tego, że zmienna y(i) przyjmie wartość 1 ► Interpretacja parametrów strukturalnych LMP odnosi się do zmian prawdopodobieństwa w reakcji na jednostkową zmianę wartości zmiennej objaśniającej przy innych czynnikach niezmienionych. Liniowy Model Prawdopodobieństwa (3) ►Przykład: oszacowano LMP postaci: gdzie y(i) przyjmuje wartość 1, gdy dane gospodarstwo domowe posiada mieszkanie na własność i 0 w pozostałych przypadkach, zaś zmienna x określa miesięczny dochód rozporządzalny gospodarstwa domowego w tys. zł. ►Przy dochodzie rozporządzalnym równym 10 tys. zł prawdopodobieństwo tego, że dane gospodarstwo domowe posiada mieszkanie na własność wynosi 0.5, zaś wzrost dochodu o 1 tys. zł prowadzi do wzrostu prawdopodobieństwa posiadania mieszkania o 0.03. Liniowy Model Prawdopodobieństwa (4) Główne ograniczenia LMP: ►Ograniczenie nr 1: ► składniki losowe w LMP nie mają rozkładu normalnego; ► analizując własności składnika losowego na podstawie poznanych wcześniej testów, dochodzimy do wniosku, że charakteryzuje się on heteroskedastycznością gdyż zachodzi: ► utrudniona jest więc ocena istotności dokonywana na podstawie standardowych testów ►Ograniczenie nr 2: ► teoretyczne wartości zmiennej objaśnianej mogą być mniejsze od 0 i większe od 1 ► uniemożliwia to ich interpretację w kategoriach prawdopodobieństwa Liniowy Model Prawdopodobieństwa (5) Model logitowy (1) ►Model logitowy bazuje na funkcji logistycznej określonej wzorem ►Przykład funkcji logistycznej: Model logitowy (2) ►Funkcję logistyczną można sformułować w innej wersji, w której przyjmuje wartość nasycenia równą 1, stąd nadaje się do modelowania prawdopodobieństwa: ►Model prawdopodobieństwa ma więc postać: gdzie: ►Z powyższego wynika, że Model logitowy (3) ►Logit to logarytm ilorazu szans, czyli relacji prawdopodobieństwa zdarzenia, dla którego y przyjmuje wartość 1 i zdarzenia przeciwnego – relacja z zakładów bukmacherskich ►Przykład: przy strzelaniu do tarczy i prawdopodobieństwie trafienia w jej środek równym 0.33 iloraz szans wynosi ½, czyli szansa na trafienie vs. szansa na nietrafienie mają się jak 1 do 2. ►Iloraz szans ma postać zaś logit: Model logitowy (4) ►Z powyższego wynika interpretacja parametrów strukturalnych, która jest inna niż w LMP. ►Z powyższego wynika, że zmiana wartości zmiennej jednostkę prowadzi do wzrostu ilorazu szans o o ►Wpływ zmian wartości zmiennej na wartość prawdopodobieństwa przyjęcia przez zmienną objaśnianą wartości 1 definiujemy jako efekt krańcowy i wyznaczamy ze wzoru Model logitowy (5) ►Uwaga do interpretacji efektu krańcowego: wartość efektu krańcowego jest funkcją wartości pozostałych zmiennych objaśniających modelu. Oznacza to, że efekt krańcowy jest nieliniowy: ► wpływ na prawdopodobieństwo tej samej zmiany jednostkowej zmiennej objaśniającej prowadzi do innej zmiany prawdopodobieństwa w zależności od pozostałych wartości zmiennych objaśniających ► wartość efektu krańcowego podaje się dla zadanej wartości wszystkich zmiennych objaśniających modelu. ►W pakietach ekonometrycznych podaje się efekty krańcowe dla średniej wartości prawdopodobieństwa. Model logitowy (6) ►Standardowe miary dopasowania (stosowane w przypadku zwykłego modelu liniowego) w modelu logitowym nie znajdują zastosowania. ►W modelu logitowym stosuje się inne metody estymacji, gdyż jest to model nieliniowy. Zazwyczaj jest to Metoda Największej Wiarygodności, gdzie maksymalizuje się funkcję wiarygodności postaci ►Na podstawie tej metody wyznacza się (wyliczany standardowo w większości pakietów) współczynnik pseudo-R^2 McFadena : gdzie LMP to wartość funkcji wiarygodności dla pełnego modelu (zawierającego wszystkie zmienne objaśniające) zaś LMZ to wartość funkcji wiarygodności dla modelu zredukowanego do wyrazu wolnego Model logitowy (6) ►Druga standardowa miara dopasowania bazuje na tzw. tablicy trafności prognoz ex post konstruowanej według następujacej procedury: ► po estymacji parametrów modelu dokonuje się oszacowania wartości teoretycznych prawdopodobieństw według wzoru: ► dla tak wyznaczonych prawdopodobieństw wyznaczamy wartości teoretyczne zmiennej objaśnianej według ► (1) jeśli próba jest zbilansowana tzn. liczba 0 i 1 dla zmiennej objaśnianej jest mniej więcej równa ► (2) jeśli próba jest niezbilansowana, przy czym jest równa udziałowi wartości 1 w wartościach Y(i) (tzw. metoda optymalnej wartości granicznej Cramera) Model logitowy (7) ► w kolejnym kroku tworzy się tablicę postaci: Empiryczne Teoretyczne Razem Y=1 Y=0 Y=1 N11 N10 N1. Y=0 N01 N00 N0. Razem N.1 N.0 N ►wyznaczamy wartość tzw. R^2 zliczeniowego postaci Model probitowy ►W modelu probitowym wartość prawdopodobieństwa określona jest dystrybuantą standardowego rozkładu normalnego tzn. gdzie: ►Efekty krańcowe w tym modelu mają postać gdzie jest funkcją gęstości standardowego rozkładu normalnego ►Relacja między parametrami modelu logitowego i probitowego jest dana wzorem Model tobitowy (2) ►Jest to jeden z modeli służących do estymacji w przypadku zmiennej ograniczonej, czyli przyjmującej wartość liczbową w jakimś przedziale (gdy są obserwowalne) oraz wartość jakościową poza tym przedziałem (wtedy nadajemy im jakąś umowną wartość np. 0). ►Najczęściej model opisujący kształtowanie się takiej zmiennej ma postać ►Model ten zwany też modelem normalnej regresji cenzurowanej ma zastosowanie w modelowaniu np. ► wydatków na zakup mieszkania w gospodarstwach domowych ► przychodów z pracy w danym okresie wśród osób o różnym statusie na rynku pracy ► nakładów inwestycyjnych w danym okresie Dziękuję za uwagę