Porządki generowane krzywą Lorenza

Transkrypt

Porządki generowane krzywą Lorenza
M A T H E M A T I C A L
E C O N O M I C S
No. 3 (10)
2006
Marek Biernacki
(Wrocław)
PORZĄDKI GENEROWANE KRZYWĄ LORENZA
Abstract. On a set of distributions (densities) of earnings it is possible to introduce sequence generated with curves and generalized Lorenz curves. If (generalized) Lorenz curve
of the first distribution is over the Lorenz curve of the second distribution, then we say that
the first distribution dominates second. When the curves intersect, they are noncomparable. It proves that these sequences are equivalent to relations arranging distributions in respect of the inequality of distributions of earnings, well-beings and the poverty.
Key words: Lorenz curve, generalized Lorenz curve, inequality of a distribution, well-being, poverty.
1. Wstęp
Dane są rozkłady dochodów dwóch społeczności lub jednej, ale w
dwóch różnych okresach. Mając te dwa wektory dochodów x = (x1, ..., xn)
oraz y = (y1, ..., yn) chcemy uzyskać odpowiedzi na następujące pytania:
a) w której populacji jest większa nierównomierność rozdziału dochodów?
b) w której populacji jest większy dobrobyt?
c) w której populacji jest mniejsze ubóstwo?
Pokażemy, że na te trzy pytania można odpowiedzieć, wykorzystując porządek generowany przez krzywe Lorenza.
2. Krzywa Lorenza
Załóżmy, że wektor dochodów x = (x1, ..., xn) jest realizacją zmiennej
losowej X o rozkładzie F i jest uporządkowany niemalejąco: x1 ≤ x2 ≤ ... ≤ xn.
Empiryczną krzywą Lorenza generują punkty, których pierwszymi współrzędnymi są liczby i/n, gdzie i = 0, 1, ..., n; n – ustalona liczba, a drugie
współrzędne są zdefiniowane następująco:
i s
L (0) = 0 i L   = i , gdzie si = x1 + x2 + ... + xi.
 n  sn
Marek Biernacki
126
Krzywa Lorenza L(p) jest zdefiniowana dla wszystkich punktów
p ∈ (0, 1) poprzez liniową interpolację. L(p) reprezentuje p-tą frakcję z
najmniejszymi wartościami (np. najmniejszymi dochodami).
Załóżmy, że rozważane liczby xi są próbką losową z rozkładu F(x), który jest funkcją ściśle rosnącą, 0 < F(x) < 1, oraz że średnia µ rozkładu F(x)
istnieje. Pierwsze założenie implikuje, że F −1(p) jest dobrze zdefiniowane i
jest to populacja p-tego kwantylu. Teoretyczna krzywa Lorenza odpowiadająca temu rozkładowi jest zdefiniowana następująco:
p
L( p ) = µ −1 ∫ F −1 (t )dt.
(1)
0
W tabeli 1 mamy krzywe Lorenza generowane przez pewne znane rozkłady (por. J. Gastwirth (1972)).
Tabela 1. Krzywe Lorenza generowane przez rozkłady
Rozkład
Dystrybuanta
0,
F ( x) = 
1,
Jednostajny
F ( x) = 1 − e
Wykładniczy
F ( x) = 1 − e
Przesunięty wykładniczy
Pareta
−λx
x<µ
x≥µ
, x>0
− λ ( x −a )
, x>a
F ( x) = 1 − ( a x ) , x > a , α > 1
α
Krzywa Lorenza
L( p ) = p
p + (1 − p ) ln(1 − p )
p + (1 + λ a ) (1 − p ) ln(1 − p )
−1
1 − (1 − p )
( a −1) α
Źródło: J. Gastwirth (1972).
Jeśli L(p) jest krzywą Lorenza odpowiadającą rozkładowi F(x), to L(p)
jest wypukła i jej pochodna
L ′( p) = 1 dla p = F ( µ ) .
3. Nierównomierność rozdziału dochodów
Najbardziej znanym miernikiem nierówności dochodów jest indeks
Giniego (znany także pod nazwą współczynnika koncentracji Lorenza).
Indeks Giniego G jest równy podwojonemu polu koncentracji (2S).
Alternatywny wzór dla indeksu Giniego G jest oparty na średniej różnicy
(∆) odpowiadającej rozkładowi F(x):
∆
G=
,
2µ
Porządki generowane krzywą Lorenza
127
gdzie
∆=
∞
∞
∫ ∫
−∞ −∞
∞
∞
−∞
−∞
x − y dF ( x )dF ( y ) = 2 ∫ F ( x ) [1 − F ( x ) ] dx = 4 ∫ x [ F ( x ) − 12 ] dF ( x ).
1
krzywa Lorenza
zakreskowana powierzchnia
nazywa się polem koncentracji − S
S
1
Rys. 1. Geometryczna interpretacja indeksu Giniego
Wzór
∆
2µ
pokazuje, że indeks Giniego mierzy relatywną nierówność – jako stosunek
miary rozproszenia średniej różnicy do wartości średniej (µ).
Pokażemy równoważność tych dwu definicji współczynnika Giniego.
G=
n
n
∑∑
i =1 j =1
n
n ⋅ ∑ xi =
i =1
j
n
 n n

xi − y j = 2 ∑ ∑ xi − ∑ ∑ xi  ,
j =1 i =1
 j =1 i = j

n
n
∑ ∑ xi =
j =1 i =1
n
∑
n
j
n
n
∑ xi + ∑ ∑ xi − ∑ xi ,
j =1 i = j
j =1 i =1
i =1
n
n
n
n n
n
n n


x
−
x
=
2
x
−
(
n
+
1)
x
−
x
=
4
x
−
2(
n
+
1)
xi ,
 ∑∑ i 
∑∑
∑
∑∑
∑
i
j
i ∑ ∑ i 
i
i =1 j =1
i =1
j =1 i =1
j =1 i = j
i =1
 j =1 i = j


n
n
n
n
∑∑
Gn =
i =1 j =1
xi − x j
n
2n ∑ xi
i =1
n
2∑
n
n
∑ xi
i =1 i = j
=
n
n ∑ xi
i =1
−
2(n + 1) ∑ xi
i =1
n
2n ∑ xi
i =1
n
n
∑ ∑ xi
i =1 i = j
2
≈
− 1.
n
n
n ∑ xi
i =1
Marek Biernacki
128
Ponieważ
k
k
L  =
n
∑y
i =1
n
∑y
i =1
i
,
i
stąd
2 n 
 i 
1 − L   − 1 .
∑
n i =1 
 n 
Jeśli S jest polem koncentracji, to
Gn ≈
Gn = 2 ( S + 12 ) − 1 = 2 S + 1 − 1 = 2 S .
Współczynnik Giniego jest relatywnym indeksem nierówności mierzącym skale proporcji dochodów, a nie efektywną miarę nierówności. Krzywa
Lorenza nie zmieni się, jeżeli wektor dochodów pomnożymy przez dowolną
dodatnią liczbę rzeczywistą. Indeks Giniego ma jednak ważną własność:
jeżeli zrobimy transfer od osoby bogatszej do biedniejszej, to indeks się
zmniejszy i na odwrót. Zatem możemy powiedzieć, że współczynnik Giniego jest indeksem relatywnej nierówności.
Załóżmy, że mamy 2 krzywe Lorenza dla 2 różnych populacji A i B.
Będziemy mówić, że rozkład populacji A dominuje nad rozkładem populacji B w sensie Lorenza LA ( x ) ≥ LB ( x ) ⇔ krzywa Lorenza dla populacji A
jest nad krzywą Lorenza dla populacji B (jeżeli się przecinają, to są nieporównywalne).
Łatwo zauważyć, że jeżeli rozkład populacji A dominuje nad rozkładem
populacji B w sensie Lorenza, to pole koncentracji dla A jest mniejsze niż
pole koncentracji dla B i tym samym w A jest mniejsza nierównomierność
rozkładu dochodów niż w B.
Zatem na zbiorze wektorów (rozkładów) dochodów porządek dominacji
w sensie Lorenza jest w pewien sposób równoważny z porządkiem nierównomierności rozkładu dochodów.
4. Dobrobyt
Okazuje się, że porządek dominacji w sensie Lorenza pokrywa się z porządkiem dobrobytu. Wiadomo, że współczynnik Giniego i krzywa Lorenza
są miarami względnymi (tzn. nieczułymi na przekształcenia jednorodne
dodatnie). Zatem porównywanie za ich pomocą poziomu dobrobytu różnych
populacji może doprowadzić do mylnych wniosków. Czy można poprawić
Porządki generowane krzywą Lorenza
129
te miary, aby móc nimi mierzyć dobrobyt populacji (lub porównywać dobrobyty różnych populacji)?
Jeżeli U(x) jest użytecznością dochodu x, a f(x) jest gęstością rozkładu
dochodów, to średnią użyteczność dochodu oblicza się ze wzoru:
∞
SW = ∫ U ( x ) f ( x )dx.
(2)
0
Często interpretuje się ją jako dobrobyt społeczny populacji o rozkładzie
dochodów f(x).
Twierdzenie Atkinsona (A.B. Atkinson (1970)). Niech F(x) i G(x)
będą dystrybuantami 2 rozkładów dochodów o takich samych dochodach
przeciętnych µ F = µ G . Wtedy
∞
∞
0
0
L F ( p) ≥ LG ( p) ⇔ ∫ U ( x) f ( x)dx ≥ ∫ U ( x) g ( x)dx
(3)
dla każdej U(x) takiej, że U(x) rośnie wklęśle (U ′( x ) > 0 i U ′′( x ) < 0 ).
Czyli dobrobyt populacji A (o dystrybuancie dochodów F(x)) jest nie
mniejszy niż dobrobyt populacji B (przy takich samych dochodach przeciętnych) wtedy i tylko wtedy, gdy rozkład populacji A dominuje w sensie
Lorenza nad rozkładem populacji B.
Twierdzenie Atkinsona uogólnił A.F. Shorrocks (1983), wprowadzając
uogólnioną krzywą Lorenza GL(x):
GL( x ) = µ ⋅ L( x ) ,
(4)
gdzie L(x) jest krzywą Lorenza, µ jest dochodem przeciętnym.
Twierdzenie Shorrocksa. Niech F(x) i G(x) będą dystrybuantami 2
rozkładów dochodów ( f(x) i g(x) odpowiednio do ich gęstości). Wówczas
∞
∞
0
0
GLF ( p ) ≥ GLG ( p) ⇔ ∫ U ( x) f ( x)dx ≥ ∫ U ( x) g ( x)dx
(5)
dla wszystkich U(x), takich że U ′( x ) > 0 i U ′′( x ) < 0 , oraz dla każdego
p ∈ [0, 1].
Czyli dobrobyt populacji A (o dystrybuancie dochodów F(x)) jest nie
mniejszy niż dobrobyt populacji B wtedy i tylko wtedy, gdy rozkład populacji A dominuje w sensie uogólnionych krzywych Lorenza nad rozkładem
populacji B.
Marek Biernacki
130
Uogólniona krzywa Lorenza dla populacji o rozkładzie F jest definiowana następująco:
p
GL( F ; p) = ∫ F −1 (q)dq , dla p ∈ [0, 1]
(6)
0
i stowarzyszony z nią częściowy porządek GL jest zdefiniowany
następująco:
FGLG ⇔ GL( F ; p ) ≥ GL(G; p ) , ∀p ∈ [0, 1]
oraz
GL( F ; p) > GL(G; p) dla pewnego p ∈ [0, 1] .
(7)
A.K. Sen (1973) wyprowadził następującą miarę dobrobytu:
ISF = µF(1 – GF).
Można łatwo pokazać, że porządek uogólnionych krzywych Lorenza implikuje porządek według miary dobrobytu Sena.
1
1
1
1
0
0
0
0
FGLG ⇒ ∫ GLF ( p )dp ≥ ∫ GLG ( p )dp ⇔ µ F ∫ LF ( p )dp ≥ µG ∫ LG ( p )dp ⇔
 1 − 2 S1 
 1 − 2 S2 
1
1
⇔ µF 
 ≥ µG 
 ⇔ 2 µF (1 − GF ) ≥ 2 µG (1 − GG ) ⇔ IS F ≥ ISG ,
 2 
 2 
gdzie S1 jest polem pod krzywą Lorenza dla F, a S2 jest polem pod krzywą
Lorenza dla G.
W drugą stronę implikacja jest nieprawdziwa, ponieważ porządek
uogólnionych krzywych Lorenza jest porządkiem częściowym, a porządek
według miary dobrobytu Sena jest porządkiem linowym.
5. Ubóstwo
Kontynuacją tego podejścia jest praca J.E. Fostera i A.F. Shorrocksa
(1988). W tej pracy rozkłady dochodów są reprezentowane przez dystrybuanty ze zbioru:
F = {F : ℜ + → [0, 1] : F niemalejąca i prawostronnie ciągła;
F (0) = 0 i F ( sF ) = 1 dla pewnego s F < ∞} ,
∞
µ F = ∫ sdF (s )
0
Porządki generowane krzywą Lorenza
oraz
131
F −1 ( p ) = inf {s ≥ 0 : F ( s ) ≥ p}, p ∈ [0, 1].
Indeks ubóstwa jest funkcją
P: F × ℜ + → ℜ ,
której wartości P(F; z) są stowarzyszone z dystrybuantą F przy ustalonej
linii ubóstwa z.
Przykłady:
1. P1 ( F ; z ) = F ( z ) – jest to procent ubogich.
W przypadku dyskretnym P1 = m/n, gdzie n oznacza moc całej populacji, m − moc populacji ubogich.
2. Luka dochodów ubogich
F ( z)
1
P2 ( F ; z ) =
z
∫
 z − F −1 ( p )  dp.
m
P2 =
∑
i =1
0
z − xi
.
z
(8)
3. Indeks typu Fostera:
1
P3 ( F ; z ) = 2
z
∫ [z − F
]
F (z)
−1
2
( p) dp . P3 =
0
1
nz 2
m
∑(z − x ) .
2
i
(9)
i =1
4. Uogólnienie indeksu P3
Pα ( F ; z ) =
1
z α −1
∫ [z − F
F ( z)
0
−1
( p)
]
α −1
dp , α ≥ 1, Pα =
1 m z − xi α
∑ ( z ) , (10)
n i =1
który zawiera P1 , P2 i P3 .
Na zbiorze F określa się relację porządku, którą określa się symbolem
P(z), gdzie z jest ustalone i z ∈ Z . „Z” oznacza pewien ustalony przedział
możliwych progów ubóstwa (na przykład od minimum biologicznego, do
60% średnich wydatków w danej populacji). Relacja ta jest zdefiniowana
następująco (por. J.E. Foster, A.F. Shorrocks (1988)):
F P ( z ) G ⇔ P ( F ; z ) ≤ P ( G ; z ) , ∀z ∈ Z
oraz
(11)
P( F ; z) < P(G; z) dla pewnego z ∈ Z .
Zapis F P( z )G oznacza, że populacja z dystrybuantą dochodów F ma
mniejsze ubóstwo niż populacja z dystrybuantą dochodów G ze względu na
indeks ubóstwa P i zbiór linii ubóstwa Z.
Marek Biernacki
132
Dla danego F ∈ F niech F1 = F oraz Fα będzie zdefiniowane rekurencyjnie dla α ≥ 2
s
Fα ( s ) = ∫ Fα −1 (t )dt i F1 ( s) = F ( s ).
(12)
0
Wówczas możemy zdefiniować relację dominacji stochastycznej Dα
stopnia α dla α ∈ N następująco:
F Dα G ⇔ Fα ( s) ≤ Gα ( s) dla wszystkich s > 0
oraz
Fα ( s) < Gα ( s) dla pewnego s > 0.
(13)
Zauważmy, że
z
z α −1 Pα ( F ; z ) = ∫ ( z − y )α −1 dF ( y ) .
(14)
0
Całkując przez części prawą stronę, otrzymamy:
z
α −1
∫ ( z − y)
dF ( y ) = (α − 1)! Fα ( z ),
(15)
0
skąd mamy wniosek 1.
Wniosek 1. Dla dowolnego α ∈ N
F Pα G ⇔ F Dα G .
(16)
Zauważmy też, że jeśli α ≤ β, to
F Pβ G ⇒ F Pα G.
Odpowiedniość między porządkami ubóstwa Pα i dominacjami stochastycznymi Dα daje możliwość otrzymania interesującej interpretacji Pα w
terminach funkcji dobrobytu społecznego. Załóżmy, że U jest klasą funkcji
dobrobytu postaci
U ( F ) = ∫ u ( x )dF ( x ),
gdzie u: ℜ + → ℜ jest funkcją ciągłą. Niech
U1 ⊂ U
będzie klasą tych funkcji, dla których u ′( x ) > 0 i U2 ⊂ U1 klasą tych funkcji,
dla których u ′′ < 0 i U3 ⊂ U2 takich funkcji, że u ′′′ > 0 .
Porządki generowane krzywą Lorenza
133
Dla α = 1, 2, 3 Uα będą częściowymi porządkami zdefiniowanymi następująco:
F Uα G ⇔ U ( F ) > U (G ) dla wszystkich U ∈Uα .
(17)
Wykorzystując znany wynik z dominacji stochastycznych (V.S. Bawa
(1975)), otrzymamy wniosek 2.
Wniosek 2. Dla α = 1, 2, 3 F Pα G ⇔ F Uα G .
Zatem stwierdzenie, że w społeczności o dystrybuancie dochodów F
jest mniejsze ubóstwo niż w społeczności o dystrybuancie dochodów G dla
Pα jest równoważne stwierdzeniu, że w społeczności o dystrybuancie dochodów F jest lepszy dobrobyt niż w społeczności o dystrybuancie dochodów G dla wszystkich funkcji dobrobytu z Uα .
Można pokazać stwierdzenie bardziej ogólne, a mianowicie, że porządek dominacji stochastycznych implikuje porządek ubóstwa.
Wniosek 3. Jeżeli rozkład F dominuje nad rozkładem G (13), to ubóstwo w populacji o rozkładzie dochodów F jest mniejsze niż ubóstwo w
populacji o rozkładzie dochodów G.
Niech
Φ : ℜ+ → ℜ
będzie funkcją malejącą, taką że
Φ (0) = 1
oraz
Φ ( z ) = 0 (F(0) = 0).
Wtedy
Φ ( F ) =∫ Φ (t )dF (t ) = Φ (t ) F (t ) 0z −∫ F (t )d Φ (t ) =∫ F (t )d ( − Φ (t ) ) . (18)
z
z
z
0
0
0
Stąd
P(G, z) – P(F, z) = Φ (G ) − Φ ( F ) = ∫ ( G (t ) − F (t ) ) d ( −Φ (t ) ) dt ≥ 0,
z
0
(19)
gdyż przyrosty niemalejącej funkcji −Φ (t ) wyznaczają miarę dodatnią i z
założenia F ≤ G (F D G ).
Zatem, korzystając z twierdzenia Bawy, mamy, że porządek dobrobytu
implikuje porządek ubóstwa.
134
Marek Biernacki
Literatura
A.B. Atkinson (1970). On the measurment of inequality. Journal of Economic
Theory. Vol. 2.
V.S. Bawa (1975). Optimal rules for ordering uncertain prospects. Journal of
Financial Economics. Vol. 2.
M. Biernacki (1998). Problemy pomiaru ubóstwa. Praca doktorska. AE. Wrocław.
J.E. Foster, A.F. Shorrocks (1988). Poverty Orderings. Econometrica. Vol. 56.
L. Gastwirth (1972). The estimation of the Lorenz curve and Gini index. The
Review of Economics and Statistics 63. Vol. 3.
A.K. Sen (1973). On Ignorance and equal distribution. American Economic
Review. Vol. 63.
A.F. Shorrocks (1983). Ranking Income Distributions. Economica. Vol. 50.