Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe - E-SGH

Transkrypt

Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe - E-SGH
Ekonometria, 21 listopada 2011 r.
Modele ściśle nieliniowe
Funkcja logistyczna należy do modeli ściśle nieliniowych względem
parametrów. Jest to funkcja jednej zmiennej, zwykle czasu (t). Dla t>0 wartośd
zmiennej rośnie początkowo bardzo szybko, potem tempo wzrostu maleje i
ostatecznie stabilizuje się w pobliżu asymptoty.
gdzie
. Dla
funkcja ma własności:
1)
– parametr ten oznacza maksymalny poziom nasycenia;
2) Dla t =0
.
3) Funkcja ma punkt przegięcia dla t= ln
.
4) Funkcja logistyczna jest jedynym rozwiązaniem równania różniczkowego
postaci:
przy warunku początkowym
. Zatem prędkośd zmian
zmiennej Y jest proporcjonalna do iloczynu
– pierwszy czynnik
nazywany jest czynnikiem rozpędu, drugi – czynnikiem hamowania.
5) Jeśli
, to wartośd jest większa niż średnia geometryczna
tzn.
Funkcja logistyczna stosowana jest do opisu długookresowego wzrostu liczby
ludności, a także do rozwoju rynku pewnego produktu – nowo wprowadzany
produkt najpierw cechuje szybki wzrost wielkości sprzedaży, następnie tempo
wzrostu maleje, aż wreszcie osiąga poziom nasycenia.
Model Boxa-Coxa jest również przykładem funkcji ściśle nieliniowej względem
parametrów.
gdzie jest również parametrem modelu. Tę postad można zastosowad wtedy,
gdy nie jesteśmy pewni, jaką postad – liniową, liniowo-logarytmiczną czy
logarytmiczną – należy zastosowad:
Dla
model przyjmuje postad liniową.
Dla
model ma postad graniczną:
.
Dla
otrzymujemy model hiperboliczny.
Estymacja modeli ściśle nieliniowych jest przeprowadzana m.in. nieliniową
metodą najmniejszych kwadratów. Jeśli model ma postad:
, gdzie g jest funkcją ściśle nieliniową,
to nieliniowa metoda najmniejszych kwadratów polega na dobraniu takich
ocen b wektora parametrów , które minimalizują sumę kwadratów reszt, czyli
Wyznaczamy pochodną tego wyrażenia względem wektora ocen i
przyrównujemy do zera:
– jest to układ p równao z p niewiadomymi.
Przykład (z zadania 5.8): Oszacowano logistyczną funkcję trendu tygodniowej
liczby pojazdów, które mogą przejeżdżad nowo otwartym mostem o
tygodniowej przepustowości 300 tys. pojazdów:
Poziom nasycenia (oszacowany) wynosi 265,053 [tys.].
Punkt przegięcia jest dla ln (39,447/0,783) = 3,92 *tys.+
Jeśli założymy, że techniczny poziom nasycenia jest równy przepustowości
mostu, czyli
, możemy przekształcid model do postaci liniowej i
zastosowad metodę najmniejszych kwadratów.
Przykład (z zadania 5.11): Oszacowano model popytu na pieniądz, w którym
zmienne objaśniające są przekształcone za pomocą transformacji Boxa-Coxa:
gdzie zmienną objaśnianą jest zasób pieniądza M2, X1 to stopa dyskontowa
banku centralnego, X2 – GNP (produkt narodowy brutto), model został
oszacowany na podstawie danych rocznych 1966-1985 dla Stanów
Zjednoczonych.
Wartośd parametru
estymacji.
została również otrzymana na podstawie
Jak liczymy pochodną funkcji złożonej?
Elastycznośd funkcji względem X1:
Y = exp(
,
Dopiero po wyznaczeniu wzoru na pochodną podstawiamy do niego wartości
argumentów, dla których mamy znaleźd wartośd pochodnej. Podobnie jest dla
elastyczności.
Po podstawieniu średnich wartości argumentów
otrzymujemy wartośd elastyczności w tym punkcie: –0,015246.
Modele logitowe, probitowe, tobitowe
Do zagadnieo mikroekonometrii należą modele zmiennej jakościowej – np.
opisującej zdarzenie polegające na wystąpieniu bankructwa firmy, zdolności
kredytowych klienta, prawdopodobieostwo podjęcia decyzji związanych z
udziałem w głosowaniu, prawdopodobieostwo decyzji co do zakupu dobra itp.
Przykład 1:
Estymacja liniowego modelu prawdopodobieostwa metodą najmniejszych
kwadratów:
Ankieta wśród 500 studentów SGH przyniosła odpowiedź na pytanie, czy
student/studentka mieszka z rodzicami (Y=1) czy samodzielnie (Y=0).
Zmiennymi objaśniającymi są rok studiów (X1), dochód rodziny
studenta/studentki (X2), X3 = 1 – jeśli kobieta, 0 jeśli mężczyzna. Oszacowanie
modelu liniowego MNK (str. 163 podręcznika) daje wynik:
Z każdym rokiem studiów prawdopodobieostwo samodzielnego zamieszkania
wzrasta o 0,0320.
Dla studentki trzeciego roku, której rodzina ma dochód X2=100, „prognoza”
prawdopodobieostwa samodzielnego zamieszkania byłaby równa
0,3652.
Jeśli w próbie połowa osób mieszkała z rodzicami, polowa samodzielnie, to Y=1
dla
i Y=0 dla
. Stąd jest bardziej prawdopodobne, że nasza
przykładowa studentka mieszka z rodzicami.
Przykład 2:
Model logitowy dla tego samego zbioru danych ma postad:
dla jednej zmiennej objaśniającej, lub ogólniej
=
Po odpowiednim przekształceniu
tzn. można oszacowad model metodą najmniejszych kwadratów. Zmienna po
lewej stronie to tzw. logit, który jest równy logarytmowi ilorazu szans przyjęcia
i nieprzyjęcia wartości 1 przez zmienną Y.
Na wydruku oszacowania modelu (na podstawie tych samych danych) podane
są oceny parametrów, błędy szacunku, wartości statystyk t Studenta ora efekty
kraocowe dla zmiennych objaśniających.
Podana jest również średnia dla zmiennej Y, równa 0,476 – jest to udział
jedynek w próbie wartości Y.
Po oszacowaniu modelu otrzymano oceny parametrów:
Prawdopodobieostwo p sytuacji, że Y–1, jest równe:
Podstawiamy wartości zmiennych objaśniających dla naszej przykładowej
studentki i otrzymujemy: p= 0,3512,tzn. wartośd nieco mniejszą niż dla modelu
liniowego prawdopodobieostwa.
Efekt kraocowy tzn. pochodna prawdopodobieostwa względem danej
zmiennej objaśniającej jest zmienna, zależy od wartości zmiennych
objaśniających w konkretnym punkcie. W praktyce podaje się wartośd efektu
kraocowego dla średnich arytmetycznych wartości zmiennych objaśniających
w próbie.
Przykład: Efekty kraocowe dla średnich w naszym przykładowym modelu są
równe 0,0351, 0,0044 oraz –0,1094. Oznacza to, że dla osób, których cechy
odpowiadają średnim wartościom zmiennych X1, X2 i X3, prawdopodobieostwo
mieszkania samodzielnie rośnie o 0,035 z każdym kolejnym rokiem studiów.
Interpretacja ocen parametrów:
Dla dodatniego wzrost zmiennej wiąże się ze wzrostem szans, że
Y=1.
Dla ujemnego wzrost zmiennej wiąże się ze spadkiem szans na to,
że Y=1.
Interpretacja z wykorzystaniem ilorazu szans:
– jeśli Xj wzrośnie o jednostkę, to iloraz szans zmienia się exp(
razy.
exp(0,1407) = 1.1511 dla zmiennej X1
exp(0,0176) = 1,0178 dla zmiennej X2
exp(–0,4388) = 0,6448 dla zmiennej X3
Zatem każdy dodatkowy rok studiów zwiększa prawdopodobieostwo
samodzielnego zamieszkania 1,15 razy, czyli o 15%.
Miary dopasowania:
Mc Faddena pseudoGdzie w liczniku jest logarytm funkcji wiarygodności dla modelu pełnego,
w mianowniku logarytm funkcji wiarygodności dla modelu zredukowanego,
zawierającego tylko wyraz wolny.
Można tę wartośd wykorzystad do porównania różnych wersji modeli
logitowych objaśniających tę samą zmienną.
Statystyki t Studenta służą do sprawdzania istotności poszczególnych
zmiennych.
Tablica trafności: Po oszacowaniu modelu można obliczyd wartości teoretyczne
zmiennej objaśnianej czyli logitów
dla każdej z n obserwacji.
Na tej podstawie wyznacza się oszacowane wartości prawdopodobieostw .
Jeśli w próbie udział wartości Y=1 wynosi , to przyjmuje się że Y=1 dla
,
Y=0 w pozostałych przypadkach.
Tablica trafności prognozy ex post:
Empiryczne
Y=1
Y=0
Razem
Prognozowane
Y=1
n11
n01
n.1
Y=0
n10
n00
n.0
Razem
n1.
n0.
N
Udział wartości z trafnymi prognozami w łącznej liczbie obserwacji to miara
trafności prognoz ex post oraz miara jakości dopasowania modelu (tzw.
zliczeniowy )
Przykład c.d. W naszym przykładzie na wydruku z gretl podana jest tablica:
Prognoza
0
1
Empiryczne 0 209 53
1 70 168
Stąd n11 = 209, n00 = 168, (n11+n00)/n = 377/500=75,4%.
Model probitowy – punkt 6.4 w podręczniku
Różnica jest taka, że funkcja wiążąca wartości Y z kombinacją zmiennych
objaśniających ma postad
czyli są to wartości
dystrybuanty rozkładu normalnego.
Wyniki i interpretacja są podobne jak dla modelu logitowego.
Model tobitowy – punkt 6.5 w podręczniku
Niekiedy zmienna objaśniana jest ciągła, ale ma ograniczony zakres. Wartości
takiej zmiennej obserwujemy – wtedy są zwykłymi kategoriami – lub ich nie
obserwujemy – a wtedy nadajemy im jakąś umowną wartośd.
Próba cenzurowana – dane dla zmiennej objaśnianej są dostępne dla
niektórych obserwacji, dla innych nie, ale zmienne objaśniające są znane dla
całej próby. Wtedy odpowiednim modelem jest model tobitowy.
Obserwujemy zmienną a zmienna jest ukryta – obserwowana tylko
wtedy, gdy jest dodatnia. Zmienna X jest obserwowana dla wszystkich
numerów obserwacji.
Przykład: inwestycja oznacza kwotę, jaką klienci banku przeznaczają
na inwestycję w pewien fundusz. Znamy wiek wszystkich 40 klientów. Tylko 20
spośród nich chce zainwestowad, podaje wartośd planowanej inwestycji. Dla
pozostałych Y=0.
Model jest modelem nieliniowym, jest szacowany metodą największej
wiarygodności.
Po oszacowaniu: Y = –411,85 + 9,093wiek.
Czy ocena parametru to wzrost wartości inwestycji w związku ze wzrostem
wieku klienta? Tak, jeśli myślimy o zmiennej Y* tzn. skłonności do
inwestowania (nieobserwowalnej). Nie, jeśli myślimy o kwocie inwestycji, tzn.
zmiennej obserwowanej Y.
Pochodna wartości Y względem zmiennej X jest równa iloczynowi oceny
parametru alfa przez wartośd dystrybuanty rozkładu normalnego, która jest
mniejsza od 1. Ocena parametru nie reprezentuje skutku jednostkowego
przyrostu zmiennej objaśniającej X.
(Dokładniejszy przykład jest na koocu rozdziału 6 – model oszacowano
na podstawie danych demograficznych i społecznych, więc interpretacje
efektów kraocowych są ciekawsze. )