X - Czaj.org
Transkrypt
X - Czaj.org
Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński Regresja kwantylowa W standardowej Metodzie Najmniejszych Kwadratów modelujemy warunkową średnią zmiennej objaśnianej: E ( yi | Xi ) = μ ( Xi ) Pokazaliśmy, że można modelować równocześnie również jej drugi moment, to jest warunkową wariancję: var ( yi | Zi ) = σ 2 ( Zi ) W przypadku rozkładu normalnego, te dwa momenty w sposób jednoznaczny definiują rozkład zmiennej objaśnianej W praktyce, zmienne ciągłe mogą mieć inny rozkład Czasem chcielibyśmy modelować więcej charakterystyk rozkładu, aby lepiej zrozumieć co się dzieje w danych Rozwiązanie – regresja kwantylowa czaj.org Regresja kwantylowa Kwantylem rzędu τ nazywamy taką wartość λτ , dla której zachodzi: F ( λτ ) = τ Kwantyl można policzyć korzystając ze wzoru: λτ = F −1 (τ ) W regresji kwantylowej chcemy zobaczyć, jak różne kwantyle zależą od wybranych zmiennych objaśniających Definiuje się tzw. kwantyle warunkowe: Qτ ( yi | Xi ) = Fy−1 (τ | Xi ) Zazwyczaj, analogicznie jak w regresji liniowej, zakłada się zależność liniową: Qτ ( yi | Xi ) = Xi βτ Uwaga: w tej notacji parametry mogą być różne dla każdego kwantyla i czaj.org Regresja kwantylowa – estymacja Najprostszym wariantem regresji kwantylowej – tzw. regresja na medianie Staramy się znaleźć postać funkcyjną warunkowej mediany Parametry znajdujemy minimalizując następującą funkcję celu: Q ( β 0,5 ) = 0,5 i =1 yi − Xi β 0,5 N W literaturze model ten jest również nazywany estymatorem LAD (Least Absolute Deviations) Bardziej ogólnie, aby oszacować parametry dowolnego kwantyla minimalizujemy funkcję: Q ( βτ ) = i: yi ≥ Xi βτ τ yi − Xi βτ + (1 − τ ) y − X βτ i i i: yi ≤ Xi βτ Do optymalizacji używa się metod programowania liniowego (metoda simpleks) czaj.org Regresja kwantylowa w NLOGIT 1. 2. 3. Wczytaj zbiór danych me.medexp.lpj Policz regresję liniową, w której wydatki gospodarstw domowych na leczenie objaśniane są przez wszystkie inne dostępne zmienne Przeprowadź regresję kwantylową. Czy wyniki się różnią? QREG – polecenie wywołujące regresję kwantylową ; lhs = var1 – analogicznie jak w MNK definiujemy zmienną objaśnianą ; rhs = var2, var3… - definiujemy zmienne objaśniające $ 4. Domyślnie NLOGIT liczy regresję na medianie Policz regresje dla kwantyli innych rzędów np. 0,1; 0, 25; 0,75; 0,9 ; Quantile = tau1, tau2… - dodanie opcji do polecenia QREG policzy regresje kwantylowe dla wybranych kwantyli rzędu tau1, tau2… czaj.org Zalety regresji kwantylowej Brak założeń na temat rozkładu zmiennej zależnej Można modelować cały rozkład zmiennej, a nie tylko wybrane momenty Łatwość wykrycia heteroskedastyczności Bardziej odporna na występowanie outlierów niż MNK Kwantyl zmiennej przekształconej przy pomocy ściśle rosnącej funkcji g ( x ) jest równy przekształconemu kwantylowi oryginalnej zmiennej: Qτ ( g ( yi ) | Xi ) = g ( Qτ ( yi | Xi ) ) czaj.org Wady regresji kwantylowej Wzory analityczne na macierz kowariancji estymatora regresji kwantylowej są skomplikowane, a przez to rzadko stosowane W praktyce stosuje się metody symulacyjne np. bootstrap, przez co model liczy się dłużej niż np. regresja liniowa Współcześnie nie jest to duży problem czaj.org Metoda Bootstrap Bootstrap to metoda symulacyjna, która pozwala na przeprowadzenie wnioskowania statystycznego kiedy nie znamy teoretycznych właściwości danej statystyki/estymatora Uzasadnienie: Mając D prób z pewnej populacji, dla każdej z nich można policzyć określoną statystykę i w efekcie otrzymać jej D oszacowań Średnią z tych D oszacowań moglibyśmy traktować jako jej najlepsze oszacowanie, a wariancję jako miarę niepewności Wykorzystując te charakterystyki moglibyśmy przeprowadzić wnioskowanie statystyczne Wykorzystanie w praktyce: Zazwyczaj mamy tylko jedną próbę, a nie D Z próby wielkości N losujemy ze zwracaniem B 'sztucznych' prób, również o wielkości N Dla każdej z wylosowych prób 'sztucznych' liczymy szukaną statystykę/estymator Wnioskowanie statystyczne przeprowadzamy analizując rozkład B oszacowań tej statystyki/estymatora czaj.org Metoda Bootstrap 1. Sprawdź czy zmiana liczby wylosowanych prób zmienia oszacowania w regresji kwantylowej. Wypróbuj 20, 50, 100 i 200 prób ; nbt = B - dodanie opcji do polecenia QREG policzy regresję kwantylową przy użyciu B 'sztucznych' prób 2. Sprawdź czy istnieje istotna korelacja między wiekiem a logarytmem wydatków medycznych używając bootstrapu. Wypróbuj 100 i 300 `sztucznych’ prób PROC $ - początek kodu, PROC $ CALC ; c = cor(LHHEX12M,Age) $ ENDPROC $ EXECUTE ; N = 100 ; bootstrap = c ; histogram $ który ma zostać powtórzony ENDPROC $ - koniec kodu EXECUTE ; N = 100 $ - wykonuje 100 razy kod znajdujący się między PROC i ENDPROC ; bootstrap – bootstrapuje macierz AVC zadanej statystyki czaj.org Regresja kwantylowa a heteroskedastyczność Przeprowadzimy symulację, aby zobaczyć jak heteroskedastyczność wpływa na oszacowania regresji kwantylowej 1. Wygeneruj dane, bez heteroskedastyczności, z jedną zmienną objaśniającą X 2. Policz regresję liniową ze stałą i X jako zmiennymi objaśniającymi. Przeprowadź test Breusha-Pagana. 3. Policz analogiczną regresję kwantylową dla kwantyli rzędu: 0,1; 0,25; 0,5 ; 0,75 ; 0,9. Czy istnieje jakaś zależność? RESET SAMP; CREA; CREA; $ 1-1000 $ X = rnn(0,1) $ Y = X + rnn(0,1) $ czaj.org Regresja kwantylowa a heteroskedastyczność 1. Wygeneruj drugą zmienną objaśnianą Y2, tym razem z heteroskedastycznością CREA; SIG = exp(1 + 0.5*X) $ CREA; Y2 = X + SIG*rnn(0,1) $ 2. 3. Policz regresję liniową ze stałą i X jako zmiennymi objaśniającymi. Przeprowadź test Breusha-Pagana Policz analogiczną regresję kwantylową dla kwantyli rzędu: 0,1; 0, 25; 0,5; 0,75; 0,9. Czy coś się zmieniło w porównaniu z zadaniem z poprzedniego slajdu? czaj.org Praca domowa ME.4 1. W ekonomii finansowej jednym z centralnych zagadnień jest w jaki sposób rynek wycenia akcje firm. Teoretycznie ich cena powinna zależeć od przewidywań inwestorów odnośnie przyszłych zysków firmy. W praktyce nie obserwujemy ocen inwestorów, a jedynie ceny akcji oraz różne charakterystyki firmy. Wykorzystując zbiór me.equity.lpj oraz regresję kwantylową odpowiedz na następujące pytania: 1. Jakie charakterystyki firm wpływają na cenę ich nowych akcji? 2. W literaturze sugeruje się, że nowe akcje firm, które po raz pierwszy wchodzą na rynek finansowy (IPO – Initial Public Offering) są niedocenione w porównaniu z firmami, które już mają w obrocie jakieś swoje akcje (SEO – seasoned equity offering). Czy faktycznie tak jest? 3. Czy wnioski różnią się dla różnych kwantyli rozkładu? Porównaj różne formy funkcyjne Praca w grupach dwuosobowych (innych niż do tej pory) czaj.org 19.10.2015 22:56:43