Materiały do zaawans. ekon. Z9

Transkrypt

Materiały do zaawans. ekon. Z9
Materiaªy do zaawans. ekon. Z9
Rafaª Wo¹niak
Faculty of Economic Sciences, University of Warsaw
Warsaw, 16-04-2012
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Metoda Najwi¦kszej Wiarogodno±ci
‚wiczenie 1.
Zmienne losowe X1 , . . . , Xn s¡ niezale»nymi zmiennymi
losowymi o rozkªadzie wykªadniczym o funkcji g¦sto±ci
f (x ) = λe −λx .
Wyznacz estymator najwi¦kszej wiarogodno±ci parametru λ.
λ̂ = arg maxλ L(X1 = x1 , . . . , Xn = xn )
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Metoda Najwi¦kszej Wiarogodno±ci
Interpretacja
Intuicyjnie metoda najwi¦kszej wiarogodno±ci polega na
uznaniu za oszacowanie parametru λ takiej warto±ci λ̂, która
maksymalizuje prawdopodobie«stwo zaobserwowania tej próby,
któr¡ rzeczywi±cie zaobserwowali±my.
Prawdopodobie«stwo zaobserwowania tej próby (czyli
X1 = x1 , . . . , Xn = xn ), to
L = f (X1 = x1 , . . . , Xn = xn ) = f (x1 )f (x2 ) . . . f (xn ).
Maksymalizujemy L, czyli ddλ L(X1 = x1 , . . . , Xn = xn ) = 0.
Skoro zaobserwowali±my t¦ prób¦, to powinna by¢ ona
najbardziej prawdopodobna.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Metoda Najwi¦kszej Wiarogodno±ci
Model liniowy z jedn¡ zmienn¡ i bez staªej.
yi = β xi + i
i ∼ N (0, σ 2 )
yi |xi ∼ N (β xi , σ ). Dlaczego?
2
Funkcja g¦sto±ci dla pojedynczej zmiennej to
f (Xi = xi ) =
e
−
√1
2πσ
(yi −β xi )2
2σ 2
Wyznacz estymatory dla parametrów β i σ 2 .
2
2
Ró»nica mi¦dzy σMNK
a σMNW
. Ró»nica mi¦dzy S 2 a Ŝ 2 .
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Metoda Najwi¦kszej Wiarogodno±ci
Za http://wazniak.mimuw.edu.pl/ Przykªad 12.3
‚wiczenie 2.
Spo±ród studentów informatyki pewnego elitarnego wydziaªu
wybrano losowo i niezale»nie od siebie 50 osób, a nast¦pnie
ka»d¡ z nich spytano, czy kiedykolwiek w trakcie studiów
otrzymaªa ocen¦ niedostateczn¡. Okazaªo si¦, i» 14 osób
odpowiedziaªo "TAK", natomiast pozostaªe odpowiedziaªy
"NIE". Pytamy teraz: jaki procent studentów informatyki
otrzymaª w trakcie swoich studiów ocen¦ niedostateczn¡.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Binarne Zmienne Niezale»ne
Za R. Carter Hill, William E. Griths and Guay C. Lim,
Principles of Econometrics, John Wiley & Sons.
W ekonomii najcz¦±ciej rozwa»a si¦ zmienne ci¡gªe takie jak
ilo±ci, ceny czy wielko±¢ produkcji. W mikroekonomiii rozwa»a
si¦ wybory dokonywane przez poszczególne rmy czy osoby, i
nie zawsze mo»na wtedy mówi¢ o zmiennych ci¡gªych. Modele
dla binarnych zmiennych niezale»nych sªu»¡ do opisywania
kwestii zwi¡zanych z wyborem.
Co±/kto± jest/nie jest jakie±/jaki±.
Zaªó»my teraz, »e nie interesuje nas jaki procent studentów
otrzymaª kiedykolwiek 2, tylko czynniki wpªywaj¡ce na to, »e
student otrzymaª 2.
Np. czy zmienna Xi zale»y od zmiennej rok_studiówi
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Rozkodowanie. Binarne Zmienne Niezale»ne
y okre±la czy co±/kto± jest/nie jest jakie±/jaki±.
(Mycielski J., Ekonometria) Przy rozkodowaniu zmiennej
zale»nej przyjmuje si¦ konwencj¦, wedªug której 0 jest pora»k¡,
a 1 sukcesem.
Co jes pora»k¡, a co jest sukcesem w ¢wiczeniu z
ocenami niedostateczenymi w±ród informatyków?
Pytanie:
Jak mo»na zarobki, wzrost, cen¦ przekodowa¢ na zmienne
binarne?
A czy jest sens? Czy zawsze?
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Prawdopodobie«stwo. Binarne Zmienne Niezale»ne
W modelach dla zmiennych binarnych wyja±niamy
prawdopodobie«stwa stanów, za pomoc¡ zmiennych
niezale»nych.
Chcemy powi¡za¢ te prawdopodobie«stwa z wielko±ci¡
zmiennych niezale»nych.
Szukamy warunkowych prawdopodobie«stw stanów przy
znanych wielko±ciach zmiennych niezale»nych.
1 − p (xi ), yi = 0,
= [p (xi )]y [1 − p (xi )]1−y
p (xi ),
yi = 1
i
i
Czym jest p (xi )? Jest funkcj¡, która przyjmuje warto±ci z
przedziaªu [0, 1].
p (xi ) to najcz¦±ciej dystrybuanta rozkªadu ci¡gªego,
p (xi ) = F (xi β).
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Prawdopodobie«stwo. Binarne Zmienne Niezale»ne
Funkcja wiarogodno±ci szacowanego modelu dla binarnych
zmiennych zale»nych na próbie przekrojowej ma nast¦puj¡c¡
posta¢:
Q
L(θ) = Ni=1 [p (xi )]y [1 − p (xi )]1−y ,
i
i
a wi¦c logarytm funkcji wiarogodno±ci b¦dzie mo»na zapisa¢
jako
P
P
l (θ) = Ni=1 yi lnp (xi ) + Ni=1 (1 − yi )ln[1 − p (xi )]
Poniewa» p (xi ) ∈ [0, 1], wi¦c lnp (xi ) ≤ 0 i ln[1 − p (xi )] ≤ 0, a
zatem tak»e l (θ) ≤ 0.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Binarne Zmienne Niezale»ne
Probit
W modelu probitowym zakªadamy, »e F (.) jest dystrybuant¡
rozkªadu normalnego.
Prawdopodobie«stwo sukcesu jest równe Φ(xi β), gdzie Φ(.)
jest dystrybuant¡ rozkªadu N (0, 1).
Logit
W przypadku modelu logitowego przyjmujemy, »e F (.) jest
dystrybuant¡ rozkªadu logistycznego.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Probit
. probit foreign weight mpg
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
5:
log
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
=
-45.03321
-27.914626
-26.858074
-26.844197
-26.844189
-26.844189
Probit regression
Log likelihood = -26.844189
Number of obs
LR chi2(2)
Prob > chi2
Pseudo R2
=
=
=
=
74
36.38
0.0000
0.4039
-----------------------------------------------------------------------------foreign |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------weight | -.0023355 .0005661
-4.13 0.000
-.003445
-.0012261
mpg | -.1039503 .0515689
-2.02 0.044
-.2050235
-.0028772
_cons | 8.275464 2.554142
3.24
0.001
3.269437
13.28149
------------------------------------------------------------------------------
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Interpretacja wspóªczynników
Modele dla zmiennych binarnych nie s¡ modelami liniowymi,
poniewa» warunkowa warto±¢ oczekiwana zmiennej zale»nej nie
jest dana funkcj¡ liniow¡:
E (y |x ) = 0[1 − F (x β)] + 1F (x β) = F (x β) = p (x β)
Warto±¢ oczekiwana zmiennej równa jest prawdopodobie«stwu
sukcesu.
Efekt cz¡stkowy
∂ E (y |x )
∂ xk
= ∂ p∂(xx β) = f (x β)βk
k
Efekt cz¡stkowy interpretujemy jako wpªyw jednostkowej
zmiany zmiennej niezale»nej na wielko±¢ prawdopodobie«stwa
sukcesu.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Interpretacja wspóªczynników
Wielko±¢ efektu cz¡stokowego zale»y od x .
Efekty cz¡stkowe zazwyczaj liczym dla ±rednich.
Dla zerojedynkowych zmiennych obja±niaj¡cych efekt kra«cowy
deniujemy jako ∆F (x̄ β) = F (x̄1 β) − F (x̄0 β).
Samych wielko±ci wspóªczynników nieinterpretuje si¦.
Mo»na zinterpretowa¢ proporcje mi¦dzy wspóªczynnikami.
∂ E (y |x ) ∂ E (y |x )
∂ xk / ∂ xm
=
βk
βm
i s¡ niezale»ne od wielko±ci zmiennych obja±niaj¡cych.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Logit
. logit foreign weight mpg
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
5:
log
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
=
-45.03321
-29.238536
-27.244139
-27.175277
-27.175156
-27.175156
Logistic regression
Log likelihood = -27.175156
Number of obs
LR chi2(2)
Prob > chi2
Pseudo R2
=
=
=
=
74
35.72
0.0000
0.3966
-----------------------------------------------------------------------------foreign |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------weight | -.0039067 .0010116
-3.86 0.000
-.0058894
-.001924
mpg | -.1685869 .0919175
-1.83 0.067
-.3487418
.011568
_cons | 13.70837 4.518709
3.03
0.002
4.851859
22.56487
------------------------------------------------------------------------------
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Logit
W przypadku modelu logitowego przyjmujemy, »e F (.) jest
dystrybuant¡ rokªadu logistyczengo. W modelu logitowym
prawdopodobie«stwo sukcesu jest równe:
p (xi ) = F (xi β) =
e
x
i
+e
1
β
x
i
β
= Λ(xi β)
gdzie Λ(.) oznacza dystrybuant¦ rozkªadu logistyczengo.
Istotn¡ zalet¡ jest analityczna posta¢ dystrybuanty.
Funkacja prawdopodobie«stwa dla pojedynczej obserwacji dana
jest wzorami
(
1
yi = 0,
β,
β
1+e
P (yi ) =
= [ 1+e e β ]y [ 1+e1 β ]1−y
β
e
yi = 1
β,
1+e
x
i
x
i
x
i
i
x
i
i
x
i
x
i
Wyznaczy¢ estymator β metod¡ najwi¦kszej wiarogodno±ci.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Maksymalizacja funkcji wiarogodno±ci
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Maksymalizacja funkcji wiarogodno±ci
Poprzedni przykªad za:
In Jae Myung, Tutorial on maximum likelihood estimation,
Journal of Mathematical Psychology 47 (2003) 90100.
Po co logit i probit?
Policzmy model MNK.
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
ŷ
dla wagi 4000 i mpg 100000
. reg foreign weight mpg
Source |
SS
df
MS
-------------+-----------------------------Model | 5.75462023
2 2.87731012
Residual | 9.70483923
71 .136687876
-------------+-----------------------------Total | 15.4594595
73 .211773417
Number of obs
F( 2,
71)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
74
21.05
0.0000
0.3722
0.3546
.36971
-----------------------------------------------------------------------------foreign |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------weight | -.0004678 .0000943
-4.96 0.000
-.0006558 -.0002797
mpg | -.0194295 .0126701
-1.53 0.130
-.044693
.005834
_cons | 2.123506 .5289824
4.01
0.000
1.068745
3.178267
------------------------------------------------------------------------------
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Logit
. logit insur medexp inc i.year
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
log
log
log
log
likelihood
likelihood
likelihood
likelihood
Logistic regression
Log likelihood = -640.25858
=
=
=
=
-692.08881
-640.29575
-640.25858
-640.25858
Number of obs
LR chi2(6)
Prob > chi2
Pseudo R2
=
=
=
=
1000
103.66
0.0000
0.0749
-----------------------------------------------------------------------------insur |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------medexp | .2254819 .0251901
8.95
0.000
.1761101
.2748537
inc | -.0170446 .0038934
-4.38 0.000
-.0246755
-.0094136
|
year |
2 |
.0548072
.2118509
0.26 0.796
-.360413
.4700273
3 |
.2279468
.2140647
1.06 0.287
-.1916123
.6475058
4 |
.2657228
.2162374
1.23 0.219
-.1580947
.6895403
5 |
.3194054
.220198
1.45 0.147
-.1121749
.7509856
|
_cons | -.1102377 .3028546
-0.36 0.716
-.7038217
.4833464
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
------------------------------------------------------------------------------
Probit
. probit insur medexp inc
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
log
log
log
log
likelihood
likelihood
likelihood
likelihood
=
=
=
=
-692.08881
-642.25581
-642.09415
-642.09414
Probit regression
Log likelihood = -642.09414
Number of obs
LR chi2(2)
Prob > chi2
Pseudo R2
=
=
=
=
1000
99.99
0.0000
0.0722
-----------------------------------------------------------------------------insur |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------medexp | .1373439 .0148298
9.26
0.000
.108278
.1664098
inc | -.0091535
.002252
-4.06
0.000
-.0135674
-.0047396
_cons | -.0579179 .1777576
-0.33 0.745
-.4063164
.2904807
------------------------------------------------------------------------------
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Logit
. logit auto dtime
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
-14.532272
-6.2047625
-6.1662139
-6.1660422
-6.1660422
Logistic regression
Log likelihood = -6.1660422
Number of obs
LR chi2(1)
Prob > chi2
Pseudo R2
=
=
=
=
21
16.73
0.0000
0.5757
-----------------------------------------------------------------------------auto |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------dtime | .5310983 .2064228
2.57
0.010
.126517
.9356795
_cons | -.2375754 .7504766
-0.32 0.752
-1.708483
1.233332
------------------------------------------------------------------------------
Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9
Probit
. probit auto dtime bustime autotime
note: autotime
Iteration 0:
Iteration 1:
Iteration 2:
Iteration 3:
Iteration 4:
Iteration 5:
omitted because of collinearity
log likelihood = -14.532272
log likelihood = -2.415721
log likelihood = -2.1686153
log likelihood = -2.1633002
log likelihood = -2.1632681
log likelihood = -2.1632681
Probit regression
Log likelihood = -2.1632681
Number of obs
LR chi2(2)
Prob > chi2
Pseudo R2
=
=
=
=
21
24.74
0.0000
0.8511
-----------------------------------------------------------------------------auto |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------dtime | -.0521013 .2822999
-0.18 0.854
-.605399
.5011964
bustime | .1034163 .0740366
1.40
0.162
-.0416928
.2485255
autotime |
0 (omitted)
_cons | -4.727522
3.1134
-1.52
0.129
-10.82967
1.37463
-----------------------------------------------------------------------------Rafaª Wo¹niak
Materiaªy do zaawans. ekon. Z9