slajdy 9 - Czaj.org

Transkrypt

slajdy 9 - Czaj.org
Mikroekonometria
9
Mikołaj Czajkowski
Wiktor Budziński
Wielomianowy model logitowy

Użyteczność konsumenta i z wyboru alternatywy j spośród Ji alternatyw
Uij = X ij β j + Z i γ j + ε ij




Parametry atrybutów zwykle są generyczne


X – wektor cech (atrybutów) danej alternatywy
Z – wektor cech (charakterystyk) konsumenta
ε – składnik losowy (np. nieobserwowalne skłonności konsumenta)
Takie same dla każdej alternatywy, brak indeksu j
Jeśli X zawiera stałe (specyficzne dla alternatywy) – nie może ich być więcej
niż Ji –1

Jedna z alternatyw – poziomem referencyjnym


Zmiana użyteczności wynikająca z wyboru innej alternatywy, związana z czynnikami
niekontrolowanymi przez inne atrybuty
Parametry charakterystyk respondentów muszą być specyficzne dla alternatywy



Inaczej ich wpływ się znosi, ponieważ Z nie różnią się pomiędzy alternatywami
Z nie może zawierać stałej
Jedna z alternatyw – poziomem referencyjnym (parametry ustalone na poziomie 0)

Wpływ charakterystyk respondenta na prawdopodobieństwo wyboru innej alternatywy
czaj.org
Wielomianowy model logitowy

εij – niezależne składniki losowe o jednakowych
rozkładach (ang. independent, identically distributed, IID)

Jeśli εij mają rozkład wartości ekstremalnych I rodzaju to
P (Yi = j ) =
exp ( X ij β j )
Ji
 exp ( X β )
ij
j =1

Zmienna objaśniana przyjmuje wartość 1 dla wybranej
alternatywy i 0 wpp (dij)
N
Ji
ln L =  dij
i =1 j =1
exp ( X ij β j )
Ji
 exp ( X β )
j =1

j
ij
j
Gradient i Hesjan są stosunkowo proste – estymacja przebiega
standardowo
czaj.org
Wielomianowy model logitowy




Ponieważ składniki losowe IID, a parametry takie same dla
każdego respondenta – panelowa struktura danych nie
ma znaczenia
Miary dopasowania – te same problemy co dla modeli
wyboru binarnego
Wyniki (parametry) wymagają uważnej interpretacji
Osadzenie w ramach modelu użyteczności losowej
pozwala na wygodną interpretację miar zmian dobrobytu

Gotowość do zapłaty (ang. willingness to pay, WTP)

Np. krańcowe stopy substytucji, zmiana kompensująca
czaj.org
Przykład – wybór sposobu wędkowania
1.
2.
Wczytaj zbiór danych me.fishmode.lpj
Skonstruuj model wyjaśniający wybór sposobu wędkowania
za pomocą charakterystyk respondentów (stałej i dochodu)
MLOGIT ; ... $
►
3.
MLOGIT – wielomianowy model logitowy (nie warunkowy dla danych specyficznych dla respondenta)
► 1 wiersz = 1 respondent
► Zmienna objaśniana – wartości od 0 do J-1
Zinterpretuj wyniki
czaj.org
Przykład – wybór sposobu wędkowania
4.
5.
Wczytaj zbiór danych me.fishmode2.lpj
Skonstruuj model wyjaśniający wybór sposobu wędkowania
za pomocą atrybutów wyboru (stałych specyficznych dla
alternatyw, ceny czarteru i oczekiwanej wielkości połowu)
NLOGIT ...
; choices =
; lhs = ...
; rhs = ...
? lub ; model:
?
U(alt1) =
?
U(alt2) =
?
(lub U(*)
►
...
$
... /
...
= ...)
NLOGIT – wielomianowy model logitowy dla danych specyficznych
dla alternatywy
► 1 wiersz = 1 alternatywa
► Zmienna objaśniana – wartości 0 lub 1
czaj.org
Przykład – wybór sposobu wędkowania
6.
7.
Uzupełnij powyższy model o charakterystyki respondentów
Zinterpretuj uzyskane wyniki
czaj.org
Efekty cząstkowe

Efekty cząstkowe definiuje się inaczej niż w pozostałych
modelach. Polecenie PARTIALS nie działa.
; effects: var1 [alt1,alt2, …] / var2 [alt1,alt2, …] – liczy
efekty cząstkowe
; full – dodatkowy output (elastyczności, istotność)
; means – liczy efekty cząstkowe dla średnich wartości zmiennych
8.
9.
10.
Policz efekty cząstkowe dla ceny czarteru i oczekiwanej
wielkości połowu
Policz efekt cząstkowy dla dochodu
Spróbuj uwzględnić w modelu logarytm dochodu, a
policzyć efekt cząstkowy dochodu (dochodu, nie
logarytmu dochodu!)
czaj.org
Niezależność od niewybranych alternatyw

Wielomianowy model logitowy jest prosty, ale narzuca dość
restrykcyjne założenia




Składniki losowe IID
Użyteczność z wyboru różnych alternatyw nieskorelowana
Iloraz prawdopodobieństw wyboru 2 alternatyw nie zależy od
atrybutów pozostałych alternatyw (ang. independence from
irrrelevant alternatives, IIA)
Jeśli dwie alternatywy podobne, to spodziewamy się, że
składnik losowy dla nich będzie skorelowany



Przykład – wybór między autobusem, czerwonym samochodem i
czarnym samochodem
Spodziewamy się, że możliwość wyboru czarnego samochodu nie
zmieni znacząco wyboru autobusu, a zmniejszy częstość wyboru
czerwonego samochodu
Założenia MNL oznaczają, że wpływ na wybór każdej alternatywy
będzie jednakowy
czaj.org
Niezależność od niewybranych alternatyw

Test IIA – test Hausmana i McFaddena

Jeśli jakiś podzbiór alternatyw faktycznie nie ma znaczenia dla
wyborów, to po ich usunięciu ze zbioru nie zmieni
systematycznie oszacowań parametrów


Jeśli założenia spełnione – pomijanie alternatyw jest nieefektywne,
ale nie powinno powodować niezgodności
Statystyka testu



−1
H = ( β r − β f )′ ( Vr − Vf ) ( β r − β f )
r – estymator dla ograniczonego zbioru wyborów
f – estymator dla pełnego zbioru wyborów
Statystyka ma rozkład chi-kwadrat z liczbą stopni swobody równą
liczbie parametrów
czaj.org
Niezależność od niewybranych alternatyw
Wykorzystaj me.fishmode2.lpj do przetestowania
właściwości IIA modelu MNL
1.
NLOGIT ; ... $
NLOGIT ; ...
; ias = <lista nazw alternatyw do pominięcia> $
►
Ręcznie:
► W części ; choices umieść nazwy alternatyw w
nawiasach


►
Test może nie działać dla modeli ze stałymi specyficznymi dla
alternatyw (modele muszą mieć tyle samo parametrów)
Zautomatyzowany test może nie działać dla niektórych alternatyw
(problemy numeryczne)
Duża wartość statystyki - małe prawdopodobieństwo (p-value)
popełnienia błędu odrzucając hipotezę zerową (o IIA)
czaj.org
Case study – segregacja odpadów

Badanie DCE z 2011 roku, mieszkańcy Podkowy Leśnej


Kontekst – wprowadzenie ustawy śmieciowej
Jakie czynniki mają znaczenie dla wyboru optymalnego
kontraktu wywozu odpadów?



Liczba kategorii sortowania
Częstotliwość odbioru
Koszt
czaj.org
Case study – segregacja odpadów

Przykładowa sytuacja wyboru

311 gospodarstw domowych
6 sytuacji wyboru na respondenta

czaj.org
Case study – segregacja odpadów
Wczytaj zbiór danych me.recycling.lpj
Skonstruuj model wyjaśniający jakie czynniki mają
znaczenie przy wyborze optymalnego kontraktu
1.
2.





Co oznaczają 'złe obserwacje'
Czy model powinien zawierać stałe specyficzne dla
alternatywy?
Przetestuj czy założenie o stałych krańcowych użytecznościach
atrybutów jest uzasadnione
Przetestuj założenie o IIA
Oblicz gotowości do zapłaty za poszczególne poziomy
atrybutów
czaj.org
Wielomianowe modele logitowe

Większość poznanych wcześniej narzędzi można stosować
także w przypadku modelu MNL




Testy statystyczne
Wprowadzanie restrykcji
Przechowywanie rezultatów
Kontrolowanie outputu
czaj.org
Praca domowa ME.9 (grupy 2 lub 3-osobowe)
Wczytaj zbiór danych me.modechoice.lpj
Policz prosty model wyjaśniający wybór środka podróży
czasem oczekiwania (TTME), kosztem podróży (INVC) oraz
czasem podróży (INVT)
1.
2.
Przetestuj założenie o IIA
Zinterpretuj wyniki wykorzystując WTP
1.
2.


3.
Jakie jest WTP za jednostkę czasu oczekiwania?
Jakie jest WTP za jednostkę czasu podróży?
Zinterpretuj wyniki wykorzystując efekty cząstkowe
Dodaj do modelu zmienne socjodemograficzne (PSIZE i
HINC) oraz stałe specyficzne dla alternatywy
3.
1.
2.
Zinterpretuj wyniki wykorzystując efekty cząstkowe
Czy wnioski się zmieniły?
czaj.org
2015-11-25 21:19:10