Model logitowy (1) - E-SGH

Transkrypt

Ekonometria
WYKŁAD 6
Piotr Ciżkowicz
Katedra Międzynarodowych Studiów Porównawczych
Plan
Czym się zajmiemy:
1. Błędy HAC - uzupełnienie
2. Modele zmiennej jakościowej
Skorygowane błędy standardowe w przypadku
autokorelacji i heteroskedastyczności
► Postać ogólna macierzy kowariancji składnika losowego
► Postać ogólna macierzy kowariancji estymatora:
►Postać macierzy kowariancji dla estymatora FGLS (feasible
generalized least squares) lub EGLS (od estimated):
Heteroscedasticity- consistent standard errors (błędy
White’a lub błędy HC)
► Na podstawie
macierz kowariancji można zapisać też jako:
► White (1980) pokazał, że do estymacji tej macierzy potrzebny
jest jedynie zgodny estymator macierzy
Heteroscedasticity- consistent standard errors (błędy
White’a lub błędy HC)
► Przy dość ogólnych założeniach zgodnym estymatorem
powyższej macierzy jest
co pozwala na estymację „prawdziwej” macierzy kowariancji
estymatora OLS
► Na tej postawie można wyznaczyć zgodne błędy szacunku
Heteroscedasticity-and-autocorellation- consistent
standard errors (błędy HAC lub błędy Neweya-Westa)
► Podejście HA jest szczególnym przypadkiem estymacji
błędów HAC postaci:
gdzie
►Dla w(j)=0 otrzymujemy błędy HA. Przy autokorelacji
najczęściej stosuje się wago Bartletta postaci
► Intuicyjnie oddają one fakt, że zazwyczaj autokorelacja
maleje wraz z rzędem opóźnienia j.
Modele zmiennej jakościowej
►Zmienne jakościowe stosowane są do kwantyfikacji cech
jakościowych np. płci, przedziału dochodów, jakości produktu
itp.
►Bardzo często zmienne te przyjmują postać binarną
(zerojedynkową) np. 1- kobieta, 0- mężczyzna
►Modele zmiennej jakościowej to takie, w których zmienną
objaśnianą w modelu jest zmienna jakościowa zazwyczaj zerojedynkowa.
►Zmienne objaśniające mogą być zarówno zmiennymi
jakościowymi, jak i ilościowymi
►Postać funkcyjna zależności może być różna, w szczególności
może mieć charakter nieliniowy
Liniowy Model Prawdopodobieństwa (1)
►LMP w postaci teoretycznej zapisujemy jako
gdzie y(i) jest zmienną zero-jedynkową
►Wartości empiryczne zmiennej objaśnianej są równe 0 lub 1,
jednak wartości teoretyczne (wynikające z modelu) nie mają
takich ograniczeń
►Jaka jest interpretacja wartości teoretycznych y(i)? Co oznacza
wartość 0.3, jeśli zmienna objaśniana przyjmuje wartość 1, gdy
dana osoba jest bezrobotna, a 0 gdy pracująca?
►Należy zauważyć, że:
natomiast z postaci funkcyjnej modelu wynika, że
►Z powyższego wynika że:
co oznacza, że wartość teoretyczna zmiennej objaśnianej może
być interpretowana jako prawdopodobieństwo tego, że zmienna
y(i) przyjmie wartość 1
► Interpretacja parametrów strukturalnych LMP odnosi się do
zmian prawdopodobieństwa w reakcji na jednostkową zmianę
wartości zmiennej objaśniającej przy innych czynnikach
niezmienionych.
►Przykład: oszacowano LMP postaci:
gdzie y(i) przyjmuje wartość 1, gdy dane gospodarstwo domowe
posiada mieszkanie na własność i 0 w pozostałych przypadkach,
zaś zmienna x określa miesięczny dochód rozporządzalny
gospodarstwa domowego w tys. zł.
►Przy dochodzie rozporządzalnym równym 10 tys. zł
prawdopodobieństwo tego, że dane gospodarstwo domowe
posiada mieszkanie na własność wynosi 0.5, zaś wzrost dochodu
o 1 tys. zł prowadzi do wzrostu prawdopodobieństwa posiadania
mieszkania o 0.03.
Główne ograniczenia LMP:
►Ograniczenie nr 1:
► składniki losowe w LMP nie mają rozkładu normalnego;
► analizując własności składnika losowego na podstawie
poznanych wcześniej testów, dochodzimy do wniosku, że
charakteryzuje się on heteroskedastycznością gdyż zachodzi:
► utrudniona jest więc ocena istotności dokonywana na
podstawie standardowych testów
►Ograniczenie nr 2:
► teoretyczne wartości zmiennej objaśnianej mogą być
mniejsze od 0 i większe od 1
► uniemożliwia to ich interpretację w kategoriach
prawdopodobieństwa
Model logitowy (1)
►Model logitowy bazuje na funkcji logistycznej określonej
wzorem
►Przykład funkcji logistycznej:
Model logitowy (2)
►Funkcję logistyczną można sformułować w innej wersji, w której
przyjmuje wartość nasycenia równą 1, stąd nadaje się do
modelowania prawdopodobieństwa:
►Model prawdopodobieństwa ma więc postać:
gdzie:
►Z powyższego wynika, że
Model logitowy (3)
►Logit to logarytm ilorazu szans, czyli relacji
prawdopodobieństwa zdarzenia, dla którego y przyjmuje
wartość 1 i zdarzenia przeciwnego – relacja z zakładów
bukmacherskich
►Przykład: przy strzelaniu do tarczy i prawdopodobieństwie
trafienia w jej środek równym 0.33 iloraz szans wynosi ½, czyli
szansa na trafienie vs. szansa na nietrafienie mają się jak 1 do 2.
►Iloraz szans ma postać
zaś logit:
Model logitowy (4)
►Z powyższego wynika interpretacja parametrów strukturalnych,
która jest inna niż w LMP.
►Z powyższego wynika, że zmiana wartości zmiennej
jednostkę prowadzi do wzrostu ilorazu szans o
o
►Wpływ zmian wartości zmiennej
na wartość
prawdopodobieństwa przyjęcia przez zmienną objaśnianą
wartości 1 definiujemy jako efekt krańcowy i wyznaczamy ze
wzoru
Model logitowy (5)
►Uwaga do interpretacji efektu krańcowego: wartość efektu
krańcowego jest funkcją wartości pozostałych zmiennych
objaśniających modelu. Oznacza to, że efekt krańcowy jest
nieliniowy:
► wpływ na prawdopodobieństwo tej samej zmiany
jednostkowej zmiennej objaśniającej prowadzi do innej
zmiany prawdopodobieństwa w zależności od pozostałych
wartości zmiennych objaśniających
► wartość efektu krańcowego podaje się dla zadanej wartości
wszystkich zmiennych objaśniających modelu.
►W pakietach ekonometrycznych podaje się efekty krańcowe dla
średniej wartości prawdopodobieństwa.
Model logitowy (6)
►Standardowe miary dopasowania (stosowane w przypadku
zwykłego modelu liniowego) w modelu logitowym nie znajdują
zastosowania.
►W modelu logitowym stosuje się inne metody estymacji, gdyż
jest to model nieliniowy. Zazwyczaj jest to Metoda Największej
Wiarygodności, gdzie maksymalizuje się funkcję wiarygodności
postaci
►Na podstawie tej metody wyznacza się (wyliczany standardowo
w większości pakietów) współczynnik pseudo-R^2 McFadena :
gdzie LMP to wartość funkcji wiarygodności dla pełnego modelu
(zawierającego wszystkie zmienne objaśniające) zaś LMZ to
wartość funkcji wiarygodności dla modelu zredukowanego do
wyrazu wolnego
Model logitowy (6)
►Druga standardowa miara dopasowania bazuje na tzw. tablicy
trafności prognoz ex post konstruowanej według następujacej
procedury:
► po estymacji parametrów modelu dokonuje się oszacowania
wartości teoretycznych prawdopodobieństw według wzoru:
► dla tak wyznaczonych prawdopodobieństw wyznaczamy
wartości teoretyczne zmiennej objaśnianej według
► (1)
jeśli próba jest zbilansowana tzn.
liczba 0 i 1 dla zmiennej objaśnianej jest mniej więcej równa
► (2)
jeśli próba jest niezbilansowana, przy
czym
jest równa udziałowi wartości 1 w wartościach Y(i)
(tzw. metoda optymalnej wartości granicznej Cramera)
Model logitowy (7)
► w kolejnym kroku tworzy się tablicę postaci:
Empiryczne
Teoretyczne
Razem
Y=1
Y=0
Y=1
N11
N10
N1.
Y=0
N01
N00
N0.
Razem
N.1
N.0
N
►wyznaczamy wartość tzw. R^2 zliczeniowego postaci
Model probitowy
►W modelu probitowym wartość prawdopodobieństwa określona
jest dystrybuantą standardowego rozkładu normalnego tzn.
gdzie:
►Efekty krańcowe w tym modelu mają postać
gdzie
jest funkcją gęstości standardowego rozkładu normalnego
►Relacja między parametrami modelu logitowego i probitowego
jest dana wzorem
Model tobitowy (2)
►Jest to jeden z modeli służących do estymacji w przypadku
zmiennej ograniczonej, czyli przyjmującej wartość liczbową w
jakimś przedziale (gdy są obserwowalne) oraz wartość
jakościową poza tym przedziałem (wtedy nadajemy im jakąś
umowną wartość np. 0).
►Najczęściej model opisujący kształtowanie się takiej zmiennej
ma postać
►Model ten zwany też modelem normalnej regresji cenzurowanej ma
zastosowanie w modelowaniu np.
► wydatków na zakup mieszkania w gospodarstwach domowych
► przychodów z pracy w danym okresie wśród osób o różnym
statusie na rynku pracy
► nakładów inwestycyjnych w danym okresie
Dziękuję za uwagę

Model logitowy (1) - E-SGH

Transkrypt

Podobne dokumenty

przykładowe zadania z rachunku prawdopodobieństwa studium

zestaw nr 24.

Pobierz

praca domowa nr 4

iloraz szans - E-SGH

Statystyczna analiza danych w programie STATISTICA 7.1 PL

SYLABUS

Ćwiczenia 2. Zmienna losowa typu skokowego. Rozkład