Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe - E-SGH
Transkrypt
Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe - E-SGH
Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe Funkcja logistyczna należy do modeli ściśle nieliniowych względem parametrów. Jest to funkcja jednej zmiennej, zwykle czasu (t). Dla t>0 wartośd zmiennej rośnie początkowo bardzo szybko, potem tempo wzrostu maleje i ostatecznie stabilizuje się w pobliżu asymptoty. gdzie . Dla funkcja ma własności: 1) – parametr ten oznacza maksymalny poziom nasycenia; 2) Dla t =0 . 3) Funkcja ma punkt przegięcia dla t= ln . 4) Funkcja logistyczna jest jedynym rozwiązaniem równania różniczkowego postaci: przy warunku początkowym . Zatem prędkośd zmian zmiennej Y jest proporcjonalna do iloczynu – pierwszy czynnik nazywany jest czynnikiem rozpędu, drugi – czynnikiem hamowania. 5) Jeśli , to wartośd jest większa niż średnia geometryczna tzn. Funkcja logistyczna stosowana jest do opisu długookresowego wzrostu liczby ludności, a także do rozwoju rynku pewnego produktu – nowo wprowadzany produkt najpierw cechuje szybki wzrost wielkości sprzedaży, następnie tempo wzrostu maleje, aż wreszcie osiąga poziom nasycenia. Model Boxa-Coxa jest również przykładem funkcji ściśle nieliniowej względem parametrów. gdzie jest również parametrem modelu. Tę postad można zastosowad wtedy, gdy nie jesteśmy pewni, jaką postad – liniową, liniowo-logarytmiczną czy logarytmiczną – należy zastosowad: Dla model przyjmuje postad liniową. Dla model ma postad graniczną: . Dla otrzymujemy model hiperboliczny. Estymacja modeli ściśle nieliniowych jest przeprowadzana m.in. nieliniową metodą najmniejszych kwadratów. Jeśli model ma postad: , gdzie g jest funkcją ściśle nieliniową, to nieliniowa metoda najmniejszych kwadratów polega na dobraniu takich ocen b wektora parametrów , które minimalizują sumę kwadratów reszt, czyli Wyznaczamy pochodną tego wyrażenia względem wektora ocen i przyrównujemy do zera: – jest to układ p równao z p niewiadomymi. Przykład (z zadania 5.8): Oszacowano logistyczną funkcję trendu tygodniowej liczby pojazdów, które mogą przejeżdżad nowo otwartym mostem o tygodniowej przepustowości 300 tys. pojazdów: Poziom nasycenia (oszacowany) wynosi 265,053 [tys.]. Punkt przegięcia jest dla ln (39,447/0,783) = 3,92 *tys.+ Jeśli założymy, że techniczny poziom nasycenia jest równy przepustowości mostu, czyli , możemy przekształcid model do postaci liniowej i zastosowad metodę najmniejszych kwadratów. Przykład (z zadania 5.11): Oszacowano model popytu na pieniądz, w którym zmienne objaśniające są przekształcone za pomocą transformacji Boxa-Coxa: gdzie zmienną objaśnianą jest zasób pieniądza M2, X1 to stopa dyskontowa banku centralnego, X2 – GNP (produkt narodowy brutto), model został oszacowany na podstawie danych rocznych 1966-1985 dla Stanów Zjednoczonych. Wartośd parametru estymacji. została również otrzymana na podstawie Jak liczymy pochodną funkcji złożonej? Elastycznośd funkcji względem X1: Y = exp( , Dopiero po wyznaczeniu wzoru na pochodną podstawiamy do niego wartości argumentów, dla których mamy znaleźd wartośd pochodnej. Podobnie jest dla elastyczności. Po podstawieniu średnich wartości argumentów otrzymujemy wartośd elastyczności w tym punkcie: –0,015246. Modele logitowe, probitowe, tobitowe Do zagadnieo mikroekonometrii należą modele zmiennej jakościowej – np. opisującej zdarzenie polegające na wystąpieniu bankructwa firmy, zdolności kredytowych klienta, prawdopodobieostwo podjęcia decyzji związanych z udziałem w głosowaniu, prawdopodobieostwo decyzji co do zakupu dobra itp. Przykład 1: Estymacja liniowego modelu prawdopodobieostwa metodą najmniejszych kwadratów: Ankieta wśród 500 studentów SGH przyniosła odpowiedź na pytanie, czy student/studentka mieszka z rodzicami (Y=1) czy samodzielnie (Y=0). Zmiennymi objaśniającymi są rok studiów (X1), dochód rodziny studenta/studentki (X2), X3 = 1 – jeśli kobieta, 0 jeśli mężczyzna. Oszacowanie modelu liniowego MNK (str. 163 podręcznika) daje wynik: Z każdym rokiem studiów prawdopodobieostwo samodzielnego zamieszkania wzrasta o 0,0320. Dla studentki trzeciego roku, której rodzina ma dochód X2=100, „prognoza” prawdopodobieostwa samodzielnego zamieszkania byłaby równa 0,3652. Jeśli w próbie połowa osób mieszkała z rodzicami, polowa samodzielnie, to Y=1 dla i Y=0 dla . Stąd jest bardziej prawdopodobne, że nasza przykładowa studentka mieszka z rodzicami. Przykład 2: Model logitowy dla tego samego zbioru danych ma postad: dla jednej zmiennej objaśniającej, lub ogólniej = Po odpowiednim przekształceniu tzn. można oszacowad model metodą najmniejszych kwadratów. Zmienna po lewej stronie to tzw. logit, który jest równy logarytmowi ilorazu szans przyjęcia i nieprzyjęcia wartości 1 przez zmienną Y. Na wydruku oszacowania modelu (na podstawie tych samych danych) podane są oceny parametrów, błędy szacunku, wartości statystyk t Studenta ora efekty kraocowe dla zmiennych objaśniających. Podana jest również średnia dla zmiennej Y, równa 0,476 – jest to udział jedynek w próbie wartości Y. Po oszacowaniu modelu otrzymano oceny parametrów: Prawdopodobieostwo p sytuacji, że Y–1, jest równe: Podstawiamy wartości zmiennych objaśniających dla naszej przykładowej studentki i otrzymujemy: p= 0,3512,tzn. wartośd nieco mniejszą niż dla modelu liniowego prawdopodobieostwa. Efekt kraocowy tzn. pochodna prawdopodobieostwa względem danej zmiennej objaśniającej jest zmienna, zależy od wartości zmiennych objaśniających w konkretnym punkcie. W praktyce podaje się wartośd efektu kraocowego dla średnich arytmetycznych wartości zmiennych objaśniających w próbie. Przykład: Efekty kraocowe dla średnich w naszym przykładowym modelu są równe 0,0351, 0,0044 oraz –0,1094. Oznacza to, że dla osób, których cechy odpowiadają średnim wartościom zmiennych X1, X2 i X3, prawdopodobieostwo mieszkania samodzielnie rośnie o 0,035 z każdym kolejnym rokiem studiów. Interpretacja ocen parametrów: Dla dodatniego wzrost zmiennej wiąże się ze wzrostem szans, że Y=1. Dla ujemnego wzrost zmiennej wiąże się ze spadkiem szans na to, że Y=1. Interpretacja z wykorzystaniem ilorazu szans: – jeśli Xj wzrośnie o jednostkę, to iloraz szans zmienia się exp( razy. exp(0,1407) = 1.1511 dla zmiennej X1 exp(0,0176) = 1,0178 dla zmiennej X2 exp(–0,4388) = 0,6448 dla zmiennej X3 Zatem każdy dodatkowy rok studiów zwiększa prawdopodobieostwo samodzielnego zamieszkania 1,15 razy, czyli o 15%. Miary dopasowania: Mc Faddena pseudoGdzie w liczniku jest logarytm funkcji wiarygodności dla modelu pełnego, w mianowniku logarytm funkcji wiarygodności dla modelu zredukowanego, zawierającego tylko wyraz wolny. Można tę wartośd wykorzystad do porównania różnych wersji modeli logitowych objaśniających tę samą zmienną. Statystyki t Studenta służą do sprawdzania istotności poszczególnych zmiennych. Tablica trafności: Po oszacowaniu modelu można obliczyd wartości teoretyczne zmiennej objaśnianej czyli logitów dla każdej z n obserwacji. Na tej podstawie wyznacza się oszacowane wartości prawdopodobieostw . Jeśli w próbie udział wartości Y=1 wynosi , to przyjmuje się że Y=1 dla , Y=0 w pozostałych przypadkach. Tablica trafności prognozy ex post: Empiryczne Y=1 Y=0 Razem Prognozowane Y=1 n11 n01 n.1 Y=0 n10 n00 n.0 Razem n1. n0. N Udział wartości z trafnymi prognozami w łącznej liczbie obserwacji to miara trafności prognoz ex post oraz miara jakości dopasowania modelu (tzw. zliczeniowy ) Przykład c.d. W naszym przykładzie na wydruku z gretl podana jest tablica: Prognoza 0 1 Empiryczne 0 209 53 1 70 168 Stąd n11 = 209, n00 = 168, (n11+n00)/n = 377/500=75,4%. Model probitowy – punkt 6.4 w podręczniku Różnica jest taka, że funkcja wiążąca wartości Y z kombinacją zmiennych objaśniających ma postad czyli są to wartości dystrybuanty rozkładu normalnego. Wyniki i interpretacja są podobne jak dla modelu logitowego. Model tobitowy – punkt 6.5 w podręczniku Niekiedy zmienna objaśniana jest ciągła, ale ma ograniczony zakres. Wartości takiej zmiennej obserwujemy – wtedy są zwykłymi kategoriami – lub ich nie obserwujemy – a wtedy nadajemy im jakąś umowną wartośd. Próba cenzurowana – dane dla zmiennej objaśnianej są dostępne dla niektórych obserwacji, dla innych nie, ale zmienne objaśniające są znane dla całej próby. Wtedy odpowiednim modelem jest model tobitowy. Obserwujemy zmienną a zmienna jest ukryta – obserwowana tylko wtedy, gdy jest dodatnia. Zmienna X jest obserwowana dla wszystkich numerów obserwacji. Przykład: inwestycja oznacza kwotę, jaką klienci banku przeznaczają na inwestycję w pewien fundusz. Znamy wiek wszystkich 40 klientów. Tylko 20 spośród nich chce zainwestowad, podaje wartośd planowanej inwestycji. Dla pozostałych Y=0. Model jest modelem nieliniowym, jest szacowany metodą największej wiarygodności. Po oszacowaniu: Y = –411,85 + 9,093wiek. Czy ocena parametru to wzrost wartości inwestycji w związku ze wzrostem wieku klienta? Tak, jeśli myślimy o zmiennej Y* tzn. skłonności do inwestowania (nieobserwowalnej). Nie, jeśli myślimy o kwocie inwestycji, tzn. zmiennej obserwowanej Y. Pochodna wartości Y względem zmiennej X jest równa iloczynowi oceny parametru alfa przez wartośd dystrybuanty rozkładu normalnego, która jest mniejsza od 1. Ocena parametru nie reprezentuje skutku jednostkowego przyrostu zmiennej objaśniającej X. (Dokładniejszy przykład jest na koocu rozdziału 6 – model oszacowano na podstawie danych demograficznych i społecznych, więc interpretacje efektów kraocowych są ciekawsze. )