Porządki generowane krzywą Lorenza
Transkrypt
Porządki generowane krzywą Lorenza
M A T H E M A T I C A L E C O N O M I C S No. 3 (10) 2006 Marek Biernacki (Wrocław) PORZĄDKI GENEROWANE KRZYWĄ LORENZA Abstract. On a set of distributions (densities) of earnings it is possible to introduce sequence generated with curves and generalized Lorenz curves. If (generalized) Lorenz curve of the first distribution is over the Lorenz curve of the second distribution, then we say that the first distribution dominates second. When the curves intersect, they are noncomparable. It proves that these sequences are equivalent to relations arranging distributions in respect of the inequality of distributions of earnings, well-beings and the poverty. Key words: Lorenz curve, generalized Lorenz curve, inequality of a distribution, well-being, poverty. 1. Wstęp Dane są rozkłady dochodów dwóch społeczności lub jednej, ale w dwóch różnych okresach. Mając te dwa wektory dochodów x = (x1, ..., xn) oraz y = (y1, ..., yn) chcemy uzyskać odpowiedzi na następujące pytania: a) w której populacji jest większa nierównomierność rozdziału dochodów? b) w której populacji jest większy dobrobyt? c) w której populacji jest mniejsze ubóstwo? Pokażemy, że na te trzy pytania można odpowiedzieć, wykorzystując porządek generowany przez krzywe Lorenza. 2. Krzywa Lorenza Załóżmy, że wektor dochodów x = (x1, ..., xn) jest realizacją zmiennej losowej X o rozkładzie F i jest uporządkowany niemalejąco: x1 ≤ x2 ≤ ... ≤ xn. Empiryczną krzywą Lorenza generują punkty, których pierwszymi współrzędnymi są liczby i/n, gdzie i = 0, 1, ..., n; n – ustalona liczba, a drugie współrzędne są zdefiniowane następująco: i s L (0) = 0 i L = i , gdzie si = x1 + x2 + ... + xi. n sn Marek Biernacki 126 Krzywa Lorenza L(p) jest zdefiniowana dla wszystkich punktów p ∈ (0, 1) poprzez liniową interpolację. L(p) reprezentuje p-tą frakcję z najmniejszymi wartościami (np. najmniejszymi dochodami). Załóżmy, że rozważane liczby xi są próbką losową z rozkładu F(x), który jest funkcją ściśle rosnącą, 0 < F(x) < 1, oraz że średnia µ rozkładu F(x) istnieje. Pierwsze założenie implikuje, że F −1(p) jest dobrze zdefiniowane i jest to populacja p-tego kwantylu. Teoretyczna krzywa Lorenza odpowiadająca temu rozkładowi jest zdefiniowana następująco: p L( p ) = µ −1 ∫ F −1 (t )dt. (1) 0 W tabeli 1 mamy krzywe Lorenza generowane przez pewne znane rozkłady (por. J. Gastwirth (1972)). Tabela 1. Krzywe Lorenza generowane przez rozkłady Rozkład Dystrybuanta 0, F ( x) = 1, Jednostajny F ( x) = 1 − e Wykładniczy F ( x) = 1 − e Przesunięty wykładniczy Pareta −λx x<µ x≥µ , x>0 − λ ( x −a ) , x>a F ( x) = 1 − ( a x ) , x > a , α > 1 α Krzywa Lorenza L( p ) = p p + (1 − p ) ln(1 − p ) p + (1 + λ a ) (1 − p ) ln(1 − p ) −1 1 − (1 − p ) ( a −1) α Źródło: J. Gastwirth (1972). Jeśli L(p) jest krzywą Lorenza odpowiadającą rozkładowi F(x), to L(p) jest wypukła i jej pochodna L ′( p) = 1 dla p = F ( µ ) . 3. Nierównomierność rozdziału dochodów Najbardziej znanym miernikiem nierówności dochodów jest indeks Giniego (znany także pod nazwą współczynnika koncentracji Lorenza). Indeks Giniego G jest równy podwojonemu polu koncentracji (2S). Alternatywny wzór dla indeksu Giniego G jest oparty na średniej różnicy (∆) odpowiadającej rozkładowi F(x): ∆ G= , 2µ Porządki generowane krzywą Lorenza 127 gdzie ∆= ∞ ∞ ∫ ∫ −∞ −∞ ∞ ∞ −∞ −∞ x − y dF ( x )dF ( y ) = 2 ∫ F ( x ) [1 − F ( x ) ] dx = 4 ∫ x [ F ( x ) − 12 ] dF ( x ). 1 krzywa Lorenza zakreskowana powierzchnia nazywa się polem koncentracji − S S 1 Rys. 1. Geometryczna interpretacja indeksu Giniego Wzór ∆ 2µ pokazuje, że indeks Giniego mierzy relatywną nierówność – jako stosunek miary rozproszenia średniej różnicy do wartości średniej (µ). Pokażemy równoważność tych dwu definicji współczynnika Giniego. G= n n ∑∑ i =1 j =1 n n ⋅ ∑ xi = i =1 j n n n xi − y j = 2 ∑ ∑ xi − ∑ ∑ xi , j =1 i =1 j =1 i = j n n ∑ ∑ xi = j =1 i =1 n ∑ n j n n ∑ xi + ∑ ∑ xi − ∑ xi , j =1 i = j j =1 i =1 i =1 n n n n n n n n x − x = 2 x − ( n + 1) x − x = 4 x − 2( n + 1) xi , ∑∑ i ∑∑ ∑ ∑∑ ∑ i j i ∑ ∑ i i i =1 j =1 i =1 j =1 i =1 j =1 i = j i =1 j =1 i = j n n n n ∑∑ Gn = i =1 j =1 xi − x j n 2n ∑ xi i =1 n 2∑ n n ∑ xi i =1 i = j = n n ∑ xi i =1 − 2(n + 1) ∑ xi i =1 n 2n ∑ xi i =1 n n ∑ ∑ xi i =1 i = j 2 ≈ − 1. n n n ∑ xi i =1 Marek Biernacki 128 Ponieważ k k L = n ∑y i =1 n ∑y i =1 i , i stąd 2 n i 1 − L − 1 . ∑ n i =1 n Jeśli S jest polem koncentracji, to Gn ≈ Gn = 2 ( S + 12 ) − 1 = 2 S + 1 − 1 = 2 S . Współczynnik Giniego jest relatywnym indeksem nierówności mierzącym skale proporcji dochodów, a nie efektywną miarę nierówności. Krzywa Lorenza nie zmieni się, jeżeli wektor dochodów pomnożymy przez dowolną dodatnią liczbę rzeczywistą. Indeks Giniego ma jednak ważną własność: jeżeli zrobimy transfer od osoby bogatszej do biedniejszej, to indeks się zmniejszy i na odwrót. Zatem możemy powiedzieć, że współczynnik Giniego jest indeksem relatywnej nierówności. Załóżmy, że mamy 2 krzywe Lorenza dla 2 różnych populacji A i B. Będziemy mówić, że rozkład populacji A dominuje nad rozkładem populacji B w sensie Lorenza LA ( x ) ≥ LB ( x ) ⇔ krzywa Lorenza dla populacji A jest nad krzywą Lorenza dla populacji B (jeżeli się przecinają, to są nieporównywalne). Łatwo zauważyć, że jeżeli rozkład populacji A dominuje nad rozkładem populacji B w sensie Lorenza, to pole koncentracji dla A jest mniejsze niż pole koncentracji dla B i tym samym w A jest mniejsza nierównomierność rozkładu dochodów niż w B. Zatem na zbiorze wektorów (rozkładów) dochodów porządek dominacji w sensie Lorenza jest w pewien sposób równoważny z porządkiem nierównomierności rozkładu dochodów. 4. Dobrobyt Okazuje się, że porządek dominacji w sensie Lorenza pokrywa się z porządkiem dobrobytu. Wiadomo, że współczynnik Giniego i krzywa Lorenza są miarami względnymi (tzn. nieczułymi na przekształcenia jednorodne dodatnie). Zatem porównywanie za ich pomocą poziomu dobrobytu różnych populacji może doprowadzić do mylnych wniosków. Czy można poprawić Porządki generowane krzywą Lorenza 129 te miary, aby móc nimi mierzyć dobrobyt populacji (lub porównywać dobrobyty różnych populacji)? Jeżeli U(x) jest użytecznością dochodu x, a f(x) jest gęstością rozkładu dochodów, to średnią użyteczność dochodu oblicza się ze wzoru: ∞ SW = ∫ U ( x ) f ( x )dx. (2) 0 Często interpretuje się ją jako dobrobyt społeczny populacji o rozkładzie dochodów f(x). Twierdzenie Atkinsona (A.B. Atkinson (1970)). Niech F(x) i G(x) będą dystrybuantami 2 rozkładów dochodów o takich samych dochodach przeciętnych µ F = µ G . Wtedy ∞ ∞ 0 0 L F ( p) ≥ LG ( p) ⇔ ∫ U ( x) f ( x)dx ≥ ∫ U ( x) g ( x)dx (3) dla każdej U(x) takiej, że U(x) rośnie wklęśle (U ′( x ) > 0 i U ′′( x ) < 0 ). Czyli dobrobyt populacji A (o dystrybuancie dochodów F(x)) jest nie mniejszy niż dobrobyt populacji B (przy takich samych dochodach przeciętnych) wtedy i tylko wtedy, gdy rozkład populacji A dominuje w sensie Lorenza nad rozkładem populacji B. Twierdzenie Atkinsona uogólnił A.F. Shorrocks (1983), wprowadzając uogólnioną krzywą Lorenza GL(x): GL( x ) = µ ⋅ L( x ) , (4) gdzie L(x) jest krzywą Lorenza, µ jest dochodem przeciętnym. Twierdzenie Shorrocksa. Niech F(x) i G(x) będą dystrybuantami 2 rozkładów dochodów ( f(x) i g(x) odpowiednio do ich gęstości). Wówczas ∞ ∞ 0 0 GLF ( p ) ≥ GLG ( p) ⇔ ∫ U ( x) f ( x)dx ≥ ∫ U ( x) g ( x)dx (5) dla wszystkich U(x), takich że U ′( x ) > 0 i U ′′( x ) < 0 , oraz dla każdego p ∈ [0, 1]. Czyli dobrobyt populacji A (o dystrybuancie dochodów F(x)) jest nie mniejszy niż dobrobyt populacji B wtedy i tylko wtedy, gdy rozkład populacji A dominuje w sensie uogólnionych krzywych Lorenza nad rozkładem populacji B. Marek Biernacki 130 Uogólniona krzywa Lorenza dla populacji o rozkładzie F jest definiowana następująco: p GL( F ; p) = ∫ F −1 (q)dq , dla p ∈ [0, 1] (6) 0 i stowarzyszony z nią częściowy porządek GL jest zdefiniowany następująco: FGLG ⇔ GL( F ; p ) ≥ GL(G; p ) , ∀p ∈ [0, 1] oraz GL( F ; p) > GL(G; p) dla pewnego p ∈ [0, 1] . (7) A.K. Sen (1973) wyprowadził następującą miarę dobrobytu: ISF = µF(1 – GF). Można łatwo pokazać, że porządek uogólnionych krzywych Lorenza implikuje porządek według miary dobrobytu Sena. 1 1 1 1 0 0 0 0 FGLG ⇒ ∫ GLF ( p )dp ≥ ∫ GLG ( p )dp ⇔ µ F ∫ LF ( p )dp ≥ µG ∫ LG ( p )dp ⇔ 1 − 2 S1 1 − 2 S2 1 1 ⇔ µF ≥ µG ⇔ 2 µF (1 − GF ) ≥ 2 µG (1 − GG ) ⇔ IS F ≥ ISG , 2 2 gdzie S1 jest polem pod krzywą Lorenza dla F, a S2 jest polem pod krzywą Lorenza dla G. W drugą stronę implikacja jest nieprawdziwa, ponieważ porządek uogólnionych krzywych Lorenza jest porządkiem częściowym, a porządek według miary dobrobytu Sena jest porządkiem linowym. 5. Ubóstwo Kontynuacją tego podejścia jest praca J.E. Fostera i A.F. Shorrocksa (1988). W tej pracy rozkłady dochodów są reprezentowane przez dystrybuanty ze zbioru: F = {F : ℜ + → [0, 1] : F niemalejąca i prawostronnie ciągła; F (0) = 0 i F ( sF ) = 1 dla pewnego s F < ∞} , ∞ µ F = ∫ sdF (s ) 0 Porządki generowane krzywą Lorenza oraz 131 F −1 ( p ) = inf {s ≥ 0 : F ( s ) ≥ p}, p ∈ [0, 1]. Indeks ubóstwa jest funkcją P: F × ℜ + → ℜ , której wartości P(F; z) są stowarzyszone z dystrybuantą F przy ustalonej linii ubóstwa z. Przykłady: 1. P1 ( F ; z ) = F ( z ) – jest to procent ubogich. W przypadku dyskretnym P1 = m/n, gdzie n oznacza moc całej populacji, m − moc populacji ubogich. 2. Luka dochodów ubogich F ( z) 1 P2 ( F ; z ) = z ∫ z − F −1 ( p ) dp. m P2 = ∑ i =1 0 z − xi . z (8) 3. Indeks typu Fostera: 1 P3 ( F ; z ) = 2 z ∫ [z − F ] F (z) −1 2 ( p) dp . P3 = 0 1 nz 2 m ∑(z − x ) . 2 i (9) i =1 4. Uogólnienie indeksu P3 Pα ( F ; z ) = 1 z α −1 ∫ [z − F F ( z) 0 −1 ( p) ] α −1 dp , α ≥ 1, Pα = 1 m z − xi α ∑ ( z ) , (10) n i =1 który zawiera P1 , P2 i P3 . Na zbiorze F określa się relację porządku, którą określa się symbolem P(z), gdzie z jest ustalone i z ∈ Z . „Z” oznacza pewien ustalony przedział możliwych progów ubóstwa (na przykład od minimum biologicznego, do 60% średnich wydatków w danej populacji). Relacja ta jest zdefiniowana następująco (por. J.E. Foster, A.F. Shorrocks (1988)): F P ( z ) G ⇔ P ( F ; z ) ≤ P ( G ; z ) , ∀z ∈ Z oraz (11) P( F ; z) < P(G; z) dla pewnego z ∈ Z . Zapis F P( z )G oznacza, że populacja z dystrybuantą dochodów F ma mniejsze ubóstwo niż populacja z dystrybuantą dochodów G ze względu na indeks ubóstwa P i zbiór linii ubóstwa Z. Marek Biernacki 132 Dla danego F ∈ F niech F1 = F oraz Fα będzie zdefiniowane rekurencyjnie dla α ≥ 2 s Fα ( s ) = ∫ Fα −1 (t )dt i F1 ( s) = F ( s ). (12) 0 Wówczas możemy zdefiniować relację dominacji stochastycznej Dα stopnia α dla α ∈ N następująco: F Dα G ⇔ Fα ( s) ≤ Gα ( s) dla wszystkich s > 0 oraz Fα ( s) < Gα ( s) dla pewnego s > 0. (13) Zauważmy, że z z α −1 Pα ( F ; z ) = ∫ ( z − y )α −1 dF ( y ) . (14) 0 Całkując przez części prawą stronę, otrzymamy: z α −1 ∫ ( z − y) dF ( y ) = (α − 1)! Fα ( z ), (15) 0 skąd mamy wniosek 1. Wniosek 1. Dla dowolnego α ∈ N F Pα G ⇔ F Dα G . (16) Zauważmy też, że jeśli α ≤ β, to F Pβ G ⇒ F Pα G. Odpowiedniość między porządkami ubóstwa Pα i dominacjami stochastycznymi Dα daje możliwość otrzymania interesującej interpretacji Pα w terminach funkcji dobrobytu społecznego. Załóżmy, że U jest klasą funkcji dobrobytu postaci U ( F ) = ∫ u ( x )dF ( x ), gdzie u: ℜ + → ℜ jest funkcją ciągłą. Niech U1 ⊂ U będzie klasą tych funkcji, dla których u ′( x ) > 0 i U2 ⊂ U1 klasą tych funkcji, dla których u ′′ < 0 i U3 ⊂ U2 takich funkcji, że u ′′′ > 0 . Porządki generowane krzywą Lorenza 133 Dla α = 1, 2, 3 Uα będą częściowymi porządkami zdefiniowanymi następująco: F Uα G ⇔ U ( F ) > U (G ) dla wszystkich U ∈Uα . (17) Wykorzystując znany wynik z dominacji stochastycznych (V.S. Bawa (1975)), otrzymamy wniosek 2. Wniosek 2. Dla α = 1, 2, 3 F Pα G ⇔ F Uα G . Zatem stwierdzenie, że w społeczności o dystrybuancie dochodów F jest mniejsze ubóstwo niż w społeczności o dystrybuancie dochodów G dla Pα jest równoważne stwierdzeniu, że w społeczności o dystrybuancie dochodów F jest lepszy dobrobyt niż w społeczności o dystrybuancie dochodów G dla wszystkich funkcji dobrobytu z Uα . Można pokazać stwierdzenie bardziej ogólne, a mianowicie, że porządek dominacji stochastycznych implikuje porządek ubóstwa. Wniosek 3. Jeżeli rozkład F dominuje nad rozkładem G (13), to ubóstwo w populacji o rozkładzie dochodów F jest mniejsze niż ubóstwo w populacji o rozkładzie dochodów G. Niech Φ : ℜ+ → ℜ będzie funkcją malejącą, taką że Φ (0) = 1 oraz Φ ( z ) = 0 (F(0) = 0). Wtedy Φ ( F ) =∫ Φ (t )dF (t ) = Φ (t ) F (t ) 0z −∫ F (t )d Φ (t ) =∫ F (t )d ( − Φ (t ) ) . (18) z z z 0 0 0 Stąd P(G, z) – P(F, z) = Φ (G ) − Φ ( F ) = ∫ ( G (t ) − F (t ) ) d ( −Φ (t ) ) dt ≥ 0, z 0 (19) gdyż przyrosty niemalejącej funkcji −Φ (t ) wyznaczają miarę dodatnią i z założenia F ≤ G (F D G ). Zatem, korzystając z twierdzenia Bawy, mamy, że porządek dobrobytu implikuje porządek ubóstwa. 134 Marek Biernacki Literatura A.B. Atkinson (1970). On the measurment of inequality. Journal of Economic Theory. Vol. 2. V.S. Bawa (1975). Optimal rules for ordering uncertain prospects. Journal of Financial Economics. Vol. 2. M. Biernacki (1998). Problemy pomiaru ubóstwa. Praca doktorska. AE. Wrocław. J.E. Foster, A.F. Shorrocks (1988). Poverty Orderings. Econometrica. Vol. 56. L. Gastwirth (1972). The estimation of the Lorenz curve and Gini index. The Review of Economics and Statistics 63. Vol. 3. A.K. Sen (1973). On Ignorance and equal distribution. American Economic Review. Vol. 63. A.F. Shorrocks (1983). Ranking Income Distributions. Economica. Vol. 50.