X - Czaj.org

Transkrypt

X - Czaj.org
Mikroekonometria
4
Mikołaj Czajkowski
Wiktor Budziński
Regresja kwantylowa


W standardowej Metodzie Najmniejszych Kwadratów modelujemy
warunkową średnią zmiennej objaśnianej: E ( yi | Xi ) = μ ( Xi )
Pokazaliśmy, że można modelować równocześnie również jej drugi
moment, to jest warunkową wariancję: var ( yi | Zi ) = σ 2 ( Zi )




W przypadku rozkładu normalnego, te dwa momenty w sposób
jednoznaczny definiują rozkład zmiennej objaśnianej
W praktyce, zmienne ciągłe mogą mieć inny rozkład
Czasem chcielibyśmy modelować więcej charakterystyk rozkładu, aby lepiej
zrozumieć co się dzieje w danych
Rozwiązanie – regresja kwantylowa
czaj.org
Regresja kwantylowa



Kwantylem rzędu τ nazywamy taką wartość λτ , dla której
zachodzi: F ( λτ ) = τ
Kwantyl można policzyć korzystając ze wzoru: λτ = F −1 (τ )
W regresji kwantylowej chcemy zobaczyć, jak różne kwantyle
zależą od wybranych zmiennych objaśniających



Definiuje się tzw. kwantyle warunkowe: Qτ ( yi | Xi ) = Fy−1 (τ | Xi )
Zazwyczaj, analogicznie jak w regresji liniowej, zakłada się zależność
liniową: Qτ ( yi | Xi ) = Xi βτ
Uwaga: w tej notacji parametry mogą być różne dla każdego kwantyla
i
czaj.org
Regresja kwantylowa – estymacja

Najprostszym wariantem regresji kwantylowej – tzw. regresja na
medianie


Staramy się znaleźć postać funkcyjną warunkowej mediany
Parametry znajdujemy minimalizując następującą funkcję celu:
Q ( β 0,5 ) = 0,5 i =1 yi − Xi β 0,5
N


W literaturze model ten jest również nazywany estymatorem LAD
(Least Absolute Deviations)
Bardziej ogólnie, aby oszacować parametry dowolnego kwantyla
minimalizujemy funkcję:
Q ( βτ ) =


i: yi ≥ Xi βτ
τ yi − Xi βτ +
 (1 − τ ) y − X βτ
i
i
i: yi ≤ Xi βτ
Do optymalizacji używa się metod programowania liniowego
(metoda simpleks)
czaj.org
Regresja kwantylowa w NLOGIT
1.
2.
3.
Wczytaj zbiór danych me.medexp.lpj
Policz regresję liniową, w której wydatki gospodarstw domowych
na leczenie objaśniane są przez wszystkie inne dostępne zmienne
Przeprowadź regresję kwantylową. Czy wyniki się różnią?
QREG – polecenie wywołujące regresję kwantylową
; lhs = var1 – analogicznie jak w MNK definiujemy zmienną objaśnianą
; rhs = var2, var3… - definiujemy zmienne objaśniające $

4.
Domyślnie NLOGIT liczy regresję na medianie
Policz regresje dla kwantyli innych rzędów np. 0,1; 0, 25; 0,75; 0,9
; Quantile = tau1, tau2… - dodanie opcji do polecenia QREG policzy
regresje kwantylowe dla wybranych kwantyli rzędu tau1, tau2…
czaj.org
Zalety regresji kwantylowej





Brak założeń na temat rozkładu zmiennej zależnej
Można modelować cały rozkład zmiennej, a nie tylko wybrane
momenty
Łatwość wykrycia heteroskedastyczności
Bardziej odporna na występowanie outlierów niż MNK
Kwantyl zmiennej przekształconej przy pomocy ściśle rosnącej
funkcji g ( x ) jest równy przekształconemu kwantylowi
oryginalnej zmiennej:
Qτ ( g ( yi ) | Xi ) = g ( Qτ ( yi | Xi ) )
czaj.org
Wady regresji kwantylowej

Wzory analityczne na macierz kowariancji estymatora regresji
kwantylowej są skomplikowane, a przez to rzadko stosowane


W praktyce stosuje się metody symulacyjne np. bootstrap, przez co
model liczy się dłużej niż np. regresja liniowa
Współcześnie nie jest to duży problem
czaj.org
Metoda Bootstrap

Bootstrap to metoda symulacyjna, która pozwala na
przeprowadzenie wnioskowania statystycznego kiedy nie znamy
teoretycznych właściwości danej statystyki/estymatora

Uzasadnienie:




Mając D prób z pewnej populacji, dla każdej z nich można policzyć określoną
statystykę i w efekcie otrzymać jej D oszacowań
Średnią z tych D oszacowań moglibyśmy traktować jako jej najlepsze oszacowanie,
a wariancję jako miarę niepewności
Wykorzystując te charakterystyki moglibyśmy przeprowadzić wnioskowanie
statystyczne
Wykorzystanie w praktyce:




Zazwyczaj mamy tylko jedną próbę, a nie D
Z próby wielkości N losujemy ze zwracaniem B 'sztucznych' prób, również o
wielkości N
Dla każdej z wylosowych prób 'sztucznych' liczymy szukaną statystykę/estymator
Wnioskowanie statystyczne przeprowadzamy analizując rozkład B oszacowań tej
statystyki/estymatora
czaj.org
Metoda Bootstrap
1.
Sprawdź czy zmiana liczby wylosowanych prób zmienia
oszacowania w regresji kwantylowej. Wypróbuj 20, 50, 100 i 200
prób
; nbt = B - dodanie opcji do polecenia QREG policzy regresję
kwantylową przy użyciu B 'sztucznych' prób
2.
Sprawdź czy istnieje istotna korelacja między wiekiem a
logarytmem wydatków medycznych używając bootstrapu.
Wypróbuj 100 i 300 `sztucznych’ prób PROC $ - początek kodu,
PROC $
CALC
; c = cor(LHHEX12M,Age) $
ENDPROC $
EXECUTE
; N = 100
; bootstrap = c
; histogram $
który
ma zostać powtórzony
ENDPROC $ - koniec kodu
EXECUTE ; N = 100 $ -
wykonuje 100 razy kod
znajdujący się między PROC
i ENDPROC
; bootstrap – bootstrapuje
macierz AVC zadanej
statystyki
czaj.org
Regresja kwantylowa a heteroskedastyczność

Przeprowadzimy symulację, aby zobaczyć jak heteroskedastyczność
wpływa na oszacowania regresji kwantylowej
1. Wygeneruj dane, bez heteroskedastyczności, z jedną zmienną
objaśniającą X
2. Policz regresję liniową ze stałą i X jako zmiennymi objaśniającymi.
Przeprowadź test Breusha-Pagana.
3. Policz analogiczną regresję kwantylową dla kwantyli rzędu: 0,1;
0,25; 0,5 ; 0,75 ; 0,9. Czy istnieje jakaś zależność?
RESET
SAMP;
CREA;
CREA;
$
1-1000 $
X = rnn(0,1) $
Y = X + rnn(0,1) $
czaj.org
Regresja kwantylowa a heteroskedastyczność
1.
Wygeneruj drugą zmienną objaśnianą Y2, tym razem z
heteroskedastycznością
CREA; SIG = exp(1 + 0.5*X) $
CREA; Y2 = X + SIG*rnn(0,1) $
2.
3.
Policz regresję liniową ze stałą i X jako zmiennymi
objaśniającymi. Przeprowadź test Breusha-Pagana
Policz analogiczną regresję kwantylową dla kwantyli rzędu:
0,1; 0, 25; 0,5; 0,75; 0,9. Czy coś się zmieniło w porównaniu z
zadaniem z poprzedniego slajdu?
czaj.org
Praca domowa ME.4
1.

W ekonomii finansowej jednym z centralnych zagadnień jest w jaki
sposób rynek wycenia akcje firm. Teoretycznie ich cena powinna
zależeć od przewidywań inwestorów odnośnie przyszłych zysków
firmy. W praktyce nie obserwujemy ocen inwestorów, a jedynie
ceny akcji oraz różne charakterystyki firmy. Wykorzystując zbiór
me.equity.lpj oraz regresję kwantylową odpowiedz na następujące
pytania:
1. Jakie charakterystyki firm wpływają na cenę ich nowych akcji?
2. W literaturze sugeruje się, że nowe akcje firm, które po raz pierwszy
wchodzą na rynek finansowy (IPO – Initial Public Offering) są
niedocenione w porównaniu z firmami, które już mają w obrocie
jakieś swoje akcje (SEO – seasoned equity offering). Czy faktycznie
tak jest?
3. Czy wnioski różnią się dla różnych kwantyli rozkładu? Porównaj różne
formy funkcyjne
Praca w grupach dwuosobowych (innych niż do tej pory)
czaj.org
19.10.2015 22:56:43