Modelowanie zamo¿noœci - 13

Transkrypt

Modelowanie zamo¿noœci - 13
Poni¿sze trzy artyku³y by³y prezentowane podczas XV Konferencji
Naukowej M³odych Ekonomistów, która odby³a siê we wrzeœniu 2009 r.
w Warszawie. By³a ona zorganizowana przez WNE UW, SGH, SGGW,
Politechnikê Warszawsk¹ oraz Instytut Wiedzy i Innowacji.
Modelowanie zamo¿noœci
polskich gospodarstw domowych
metodami statystycznymi
Maciej Jagielski, mgr, Wydzia³ Fizyki, Uniwersytet Warszawski
Ryszard Kutner, prof. dr hab., Zak³ad Fizyki Biomedycznej, Instytut Fizyki Doœwiadczalnej, Wydzia³ Fizyki, Uniwersytet Warszawski
Wstêp
¯yjemy w czasach, w których do opisu z³o¿onoœci otaczaj¹cego nas œwiata
nie wystarczy ju¿ pos³ugiwanie siê metodologiami, jakie oferuj¹ poszczególne dyscypliny naukowe. Coraz czêœciej konieczne jest po³¹czenie metod stosowanych do tej pory w zupe³nie ró¿nych, czasem nawet bardzo odleg³ych od
siebie dziedzinach nauki. Jedn¹ z takich dyscyplin jest ekonofizyka, która
przy u¿yciu metod i modeli stosowanych w fizyce opisuje wybrane procesy
ekonomiczne, a tak¿e wzbogaca metodologiê ekonomii. Takie interdyscyplinarne podejœcie prowadzi do g³êbszego zrozumienia istoty tych procesów.
Na przyk³ad interdyscyplinarne spojrzenie na problemy dzisiejszych gospodarek rynkowych daje interesuj¹ce rezultaty w przypadku analizy dochodów ludnoœci w Polsce. Temat ten zosta³ omówiony w niniejszej pracy. Przedstawiono tutaj analizê empirycznych skumulowanych rozk³adów rocznych
dochodów gospodarstw domowych w Polsce, przyk³adowo, w latach 2000 i 2006.
Rozk³ady te porównano z przewidywaniami praw Pareto, Prawa Efektów Proporcjonalnych, uogólnionego modelu Lotka-Volterra oraz modeli zderzeñ.
154
ekonomia 25
Modelowanie zamo¿noœci polskich gospodarstw domowych metodami statystycznymi
1. Opis bazy danych
W analizie wykorzystano dane G³ównego Urzêdu Statystycznego dotycz¹ce
rocznych dochodów gospodarstw domowych w latach 2000 oraz 2006. Po usuniêciu niewielkiej liczby rekordów (252 w 2000 r. oraz 231 w 2006 r.), dla których dochód by³ mniejszy b¹dŸ równy zero, baza danych zwiera³a odpowiednio 35 911 i 37 277 obserwacji. Niedodatnie wartoœci dochodu uznano za
obserwacje b³êdne, gdy¿ zgodnie z definicj¹ dochód do dyspozycji to:
Dochód rozporz¹dzalny pomniejszony o pozosta³e wydatki. Dochód do dyspozycji
przeznaczony jest na wydatki na towary i us³ugi konsumpcyjne oraz przyrost oszczêdnoœci [GUS, 2009].
2. Analiza rocznych dochodów gospodarstw domowych w Polsce
Celem niniejszego opracowania jest analiza empirycznych rozk³adów skumulowanych rocznych dochodów gospodarstw domowych. Rozk³ady te zosta³y skonstruowane zgodnie z nastêpuj¹c¹ definicj¹:
Õ( m) =
1 N
å I( m i > m)
N i =1
(1)
gdzie:
m — roczny dochód do dyspozycji,
N — liczba obserwacji w próbie,
I(mi > m) — funkcja indykatorowa postaci:
ì
ï1 dla m i > m
I( m) = ï
í
ï
ï
î0 dla m i £ m
(2)
A zatem, dla ustalonego m zliczano gospodarstwa domowe indeksowane i
(i = 1, 2, …, N), których dochód jest wiêkszy ni¿ m, i dzielono przez liczbê
obserwacji w próbie. Wartoœæ m zmieniano co 1000 z³ (jest to krok dyskretyzacji histogramu rozk³adu), poczynaj¹c od 0.
W pierwszej kolejnoœci do „ogonów” powy¿szych rozk³adów dopasowano
s³abe prawo Pareto [Richmond i in., 2006] (rys. 1.; skala log-log)1:
-a
Õ( m) » ( m m 0 )
(3)
gdzie:
m0 — czynnik skaluj¹cy2: m 0 = exp(const a ),
a — wyk³adnik Pareto.
1
W przypadku wszystkich przedstawionych analiz wyniki dla roku 2003 mo¿na znaleŸæ
w pracy [Jagielski, 2009] oraz [Jagielski, Kutner, 2010].
2
Dla roku 2000 parametr m0 wynosi 70,8 ± 0,8 z³ a dla roku 2006: 77 ± 2 z³.
ekonomia 25
155
Maciej Jagielski, Ryszard Kutner
1
1
a = 3,113 ±0,005
Const = 13,26 ± 0,03
Rok 2000
0,1
a = 2,928 ± 0,009
Const = 12,72 ± 0,05
Rok 2006
0,1
0,01
P(m)
P(m)
0,01
1E – 3
1E – 3
1E – 4
1E – 4
1E – 5
1E – 5
1000
10000
100000
100000
10000
1000
1000000
1000000
m
m
Rys. 1.
Dopasowanie s³abego prawa Pareto (linia ci¹g³a) do empirycznego skumulowanego rozk³adu
dochodów gospodarstw domowych w Polsce (punkty) z roku 2000 (a = 3,113 ± 0.005) i 2006
(a = 2,928 ± 0,009)
Na rysunku 1. parametr a oznacza wyk³adnik Pareto (tzn. a = aPareto). Z kolei const jest sta³¹, pochodz¹c¹ z dopasowania prostej (w skali log-log). Mo¿emy zauwa¿yæ, ¿e s³abe prawo Pareto dobrze opisuje ogony analizowanych rozk³adów. Aby uzyskaæ tak dobre dopasowania konieczne by³o usuniêcie ok.
20–40 obserwacji skrajnych, czyli gospodarstw domowych osi¹gaj¹cych najwiêksze dochody (szara czêœæ krzywej w dolnej czêœci wykresów). Usuniête
obserwacje stanowi³y ok. 0,06% badanej populacji.
1000000
1000000
100000
100000
10000
Dochód
Dochód
10000
1000
1000
100
10
Rok 2000
aRanking = 0,3244 ± 0,0004
Const = 5,7357 ± 0,0014
1/aPareto = 0,3212 ± 0,0005
100
1
1
10
100
Ranking
1000
10000
10
Rok 2006
aRanking = 0,33516 ± 0,0002
Const = 5,8910 ± 0,0006
1/aPareto = 0,3415 ± 0,0010
1
10
100
1000
10000
Ranking
Rys. 2.
Ranking gospodarstw domowych (linia ci¹g³a oznacza dopasowanie, a punkty dane empiryczne)
— rok 2000 oraz 2006
Wartoœæ wyk³adnika Pareto otrzymujemy tak¿e analizuj¹c ranking gospodarstw domowych, czyli wykres dochodów gospodarstw domowych w zale¿-
156
ekonomia 25
Modelowanie zamo¿noœci polskich gospodarstw domowych metodami statystycznymi
noœci od ich miejsca w rankingu. Odpowiednie wykresy w skali logarytmicznej zamieszczono na rysunku 2.
Œredniozamo¿ne gospodarstwa domowe opisywane s¹ w skali logarytmicznej prost¹ o nachyleniu aranking. Okazuje siê, ¿e odwrotnoœæ wyk³adnika
Pareto uzyskanego w przypadku rozk³adów skumulowanych rocznych dochodów gospodarstw domowych jest bardzo zbli¿ona do wyznaczonych wartoœci
aranking. Wskazuje to na zgodnoϾ obu zastosowanych metod [Bouchard, Potters, 2001].
Do omawianych rozk³adów skumulowanych dopasowano równie¿ skumulowany rozk³ad log-normalny, wynikaj¹cy z Prawa Efektów Proporcjonalnych
[Armatte, 1995]. Wyniki — w skali logarytmicznej — zosta³y zaprezentowane
na rysunku 3.3:
æçln( m - m 0 ) - m ö÷ù
1é
÷÷ú
(4)
Õ( m) = êê1 - erf çç
÷øú
ç
2ê
s
2
è
úû
ë
1
1
Rok 2000
0,01
0,01
P(m)
0,1
P(m)
0,1
1E – 3
1E – 3
1E – 4
1E – 4
m = 9,83 ± 0,01
m = 10,07 ± 0,01
s = 0.59 ± 0,02
m0 = 0,0
s = 0.58 ± 0,02
m0 = 0,0
1E – 5
1E – 5
1000
Rok 2006
10000
100000
m
1000000
1000
10000
100000
1000000
m
Rys. 3.
Dopasowanie skumulowanego rozk³adu log-normalnego (linia ci¹g³a) do skumulowanego
rozk³adu dochodów gospodarstw domowych w Polsce (punkty) z roku 2000 i 2006
Skumulowany rozk³ad log-normalny bardzo dobrze opisuje skumulowane
dochody ubogich gospodarstw domowych. Fakt, ¿e skumulowany rozk³ad
log-normalny wykazuje tak dobr¹ zgodnoœæ z danymi empirycznymi wynika
bezpoœrednio z za³o¿eñ Prawa Efektów Proporcjonalnych. W modelu tym
zak³ada siê, ¿e zmiany dochodu mog¹ byæ niewielkie, co znajduje uzasadnienie w przypadku ubogich gospodarstw domowych [Armatte, 1995]. Z kolei s³abe prawo Pareto jest odpowiednie do opisu dochodów œredniozamo¿nych
3
Parametr m0 wynosi 0, gdy¿ nie wp³ywa on na wyniki estymacji pozosta³ych parametrów;
w celu dopasowania krzywych pos³u¿ono siê algorytmem Levenberga-Marquardta.
ekonomia 25
157
Maciej Jagielski, Ryszard Kutner
gospodarstw domowych, poniewa¿ w tym przypadku zaczyna odgrywaæ rolê
konkurencja rynkowa. Firmy konkuruj¹ miêdzy sob¹, a ich zyski przek³adaj¹
siê na zarobki pracowników — jednostek tworz¹cych gospodarstwa domowe
[Yamamoto i in., 2006]. Dlatego te¿ analiza wykresów na rysunkach 1. oraz 3.
nasuwa pytanie o wartoœæ dochodu w punkcie przeciêcia siê skumulowanego
rozk³adu log-normalnego i s³abego prawa Pareto. Punkt ten mo¿e stanowiæ
umown¹, lecz zarazem wystarczaj¹co precyzyjn¹ (ze wzglêdu na niewielki b³¹d)
granicê podzia³u miêdzy ubogimi a œredniozamo¿nymi gospodarstwami domowymi. Graniczna wartoœæ rocznego dochodu stanowi¹ca rozró¿nienie miêdzy
ubogimi a œredniozamo¿nymi gospodarstwami domowymi wynosi oko³o:
• 29 000 z³otych w roku 2000,
• 36 000 z³otych w roku 2006.
Do rozwa¿anych rozk³adów empirycznych dopasowano tak¿e rozk³ad skumulowany pochodz¹cy z uogólnionego modelu Lotka-Volterra — rys. 4.4
[Richmond, Solomon, 2001; Solomon, Richmond, 2002]:
æ a - 1ö÷
Gçça ,
÷
çè
x ÷ø
Õ( x) = 1 (a )
(5)
gdzie:
a — wyk³adnik kszta³tu opisuj¹cy dopasowan¹ funkcjê,
x = m/<m> — wzglêdny dochód gospodarstwa domowego (<m> — œrednia
wartoœæ dochodu gospodarstwa domowego w analizowanej próbie).
1
1
Rok 2000
a = 3,88 ± 0,09
Rok 2006
a = 3,7 ± 0,1
0,1
0,01
0,01
P(x)
P(x)
0,1
1E – 3
1E – 3
1E – 4
1E – 4
1E – 5
0,01
0,1
1
x = m/<m>
10
100
1E – 5
0,01
0,1
1
10
x = m/<m>
Rys. 4.
Dopasowanie uogólnionego modelu Lotka-Volterra (linia ci¹g³a) do skumulowanego rozk³adu
dochodów gospodarstw domowych w Polsce (punkty) z roku 2000 (a = 3,88 ± 0,09) i 2006
(a = 3,7 ± 0,1)
4
Skala log-log; w celu dopasowania krzywych pos³u¿ono siê algorytmem Levenberga-Marquardta.
158
ekonomia 25
Modelowanie zamo¿noœci polskich gospodarstw domowych metodami statystycznymi
Choæ uogólniony model Lotka-Volterra nie opisuje tak dobrze skumulowanego rozk³adu rocznych dochodów gospodarstw domowych jak skumulowany
rozk³ad log-normalny i Pareto, to jednak ró¿nice te s¹ niewielkie. Istotn¹ zalet¹ tego modelu jest mo¿liwoœæ scharakteryzowania analizowanych rozk³adów za pomoc¹ pojedynczej funkcji. Oferuje on tak¿e cenne podejœcie teoretyczne na poziomie mikroskopowym, w którym dochód gospodarstwa domowego determinowany jest przez dochody dotychczas uzyskiwane i przez wysokoœæ œwiadczeñ pomocy spo³ecznej (ogólniej mówi¹c redystrybucjê dochodów w spo³eczeñstwie) oraz ogólny stan gospodarki [Richmond, Solomon,
2001; Solomon, Richmond, 2002].
W modelu Lotka-Volterra mo¿na wyznaczyæ efektywn¹ minimaln¹ roczn¹
wartoϾ dochodu mmin:
m min =
a -1
< m >,
a +1
(6)
poni¿ej której prawdopodobieñstwo osi¹gania mniejszych dochodów gwa³townie maleje
Na podstawie powy¿szego wzoru otrzymujemy minimalne wartoœci rocznego dochodu:
• w roku 2000: mmin = 13 183,88 z³ dla <m> = 22 339,35 z³;
• w roku 2006: mmin = 16 373,32 z³ dla <m> = 28 501,70 z³.
W dotychczasowych rozwa¿aniach nie analizowano dochodów najbogatszych gospodarstw domowych, gdy¿ obserwacje takie by³y zbyt ma³o liczne,
aby mo¿na by³o je poddaæ opisowi statystycznemu. Problem ten mo¿na poœrednio rozwi¹zaæ analizuj¹c np. wartoœæ maj¹tku 100 najbogatszych Polaków w postaci rankingu5 (rys. 5.; skala logarytmiczna).
Bogactwo
1E9
1E8
Rok 2006
aranking = 0,88 ± 0,02
1E7 Const = 10,05 ± 0,3
aPareto = 1/aranking = 1,14 ± 0,03
1
10
100
Ranking
Rys. 5.
Ranking 100 najbogatszych Polaków z roku 2006 (aPareto = 1,14 ± 0,03; linia ci¹g³a oznacza dopasowanie, a punkty — dane empiryczne)
5
Dane o maj¹tku 100 najbogatszych Polaków w roku 2006 zosta³y uzyskane ze strony internetowej tygodnika „Wprost” [Rankingi Wprost, 2009].
ekonomia 25
159
Maciej Jagielski, Ryszard Kutner
Zgodnie z tym, co pokazano wczeœniej, jeœli ranking najbogatszych (krezusów) mo¿na w skali logarytmicznej opisaæ zale¿noœci¹ liniow¹, to wówczas dochody krezusów podlegaj¹ s³abemu prawu Pareto o wyk³adniku aPareto =
1/aranking. Choæ w tym przypadku zamiast o dochodach mówimy o bogactwie, to
jednak z w³asnoœci rozk³adu Pareto wynika, ¿e nie wp³ywa to na obserwowane uniwersalnoœci [Mandelbrot, 1960].
Otrzymane wartoœci wyk³adnika Pareto s¹ bliskie jednoœci, co jest zgodne
z wynikiem teoretycznym uzyskanym na podstawie modelu zderzeñ ze zró¿nicowan¹ sk³onnoœci¹ jednostek do oszczêdzania [Bhattacharyya i in., 2005;
Chatterjee, Chakrabarti, 2007 i referencje tam¿e]. Zatem mo¿na oczekiwaæ,
¿e bogacenie siê klasy œredniej bêdzie polega³o (z formalnego punktu widzenia) na maleniu wyk³adnika Pareto. Z kolei mechanizm zdobywania dochodów przez najbogatszych, podobnie jak w przypadku œredniozamo¿nych gospodarstw domowych, opiera siê na istnieniu konkurencji rynkowej [Yamamoto i in., 2006]. W tym przypadku jednostki tworz¹ce gospodarstwa domowe
s¹ przewa¿nie w³aœcicielami (konkuruj¹cych) firm, z których czerpi¹ swój
dochód. Dochody tych firm opisywane s¹ prawem Zipfa [Okuyama i in., 1999],
czyli w³aœnie s³abym prawem Pareto z wyk³adnikiem aPareto = 1.
Zakoñczenie
W pracy dokonano analizy empirycznych rozk³adów skumulowanych dotycz¹cych rocznych dochodów gospodarstw domowych w Polsce w latach 2000
i 2006. Okaza³o siê, ¿e mog¹ one byæ bardzo dobrze opisywane zarówno skumulowanym rozk³adem log-normalnym w przypadku ubogich gospodarstw
domowych, jak równie¿ s³abym prawem Pareto dla gospodarstw œredniozamo¿nych. Punkt przeciêcia obu rozk³adów mo¿e wyznaczaæ granicê podzia³u
miêdzy ubogimi, a œredniozamo¿nymi gospodarstwami domowymi. Fakt, ¿e
skumulowany rozk³ad log-normalny wykazuje tak dobr¹ zgodnoœæ z danymi
empirycznymi wynika bezpoœrednio z za³o¿eñ Prawa Efektów Proporcjonalnych. W modelu tym zak³ada siê, ¿e zmiany dochodu mog¹ byæ niewielkie, co
znajduje uzasadnienie w przypadku ubogich gospodarstw domowych.
Wœród rozwa¿anych modeli obiecuj¹ce wyniki uzyskano tak¿e dla uogólnionego modelu Lotka-Volterra. Model ten w dobrym przybli¿eniu odzwierciedla analizowane rozk³ady oraz oferuje cenne podejœcie teoretyczne na poziomie mikroskopowym, w którym dochód gospodarstwa domowego jest
okreœlony jest przez dochody dotychczas uzyskiwane i przez wysokoœæ œwiadczeñ pomocy spo³ecznej (redystrybucjê dochodów w spo³eczeñstwie) oraz aktualny stan gospodarki. Dziêki temu, i¿ wyk³adnik Pareto opisuj¹cy dochody
œredniozamo¿nych gospodarstw domowych mo¿na uzyskaæ zarówno poprzez
analizê rozk³adów skumulowanych, jak i rankingu, uda³o siê tak¿e wyznaczyæ
jego wartoœæ dla najbogatszych jednostek spo³eczeñstwa polskiego. A zatem
skumulowane roczne dochody gospodarstw domowych mog¹ byæ opisane
w ca³ym zakresie za pomoc¹ rozk³adów:
160
ekonomia 25
Modelowanie zamo¿noœci polskich gospodarstw domowych metodami statystycznymi
• skumulowanego log-normalnego w przypadku ubogich gospodarstw domowych,
• skumulowanego s³abego rozk³adu Pareto z wyk³adnikiem równym oko³o 3
w przypadku œredniozamo¿nych gospodarstw domowych,
• skumulowanego s³abego rozk³adu Pareto z wyk³adnikiem równym oko³o 1
w przypadku najbogatszych gospodarstw domowych.
Otrzymane rezultaty daj¹ impuls do dalszych badañ. Przede wszystkim
interesuj¹cym by³oby dokonanie analogicznej analizy w przypadku województw i porównanie jej z wynikami uzyskanymi w skali ca³ego kraju. Cennych informacji dostarczy³yby równie¿ studia nad dochodami spo³eczeñstw
innych krajów Europy. Zebrane w ten sposób informacje mog³yby pos³u¿yæ
budowie bardziej zaawansowanych modeli teoretycznych uwzglêdniaj¹cych
zarówno zró¿nicowany terytorialnie charakter zamo¿noœci spo³eczeñstw, jak
te¿ dynamikê zmian ich dochodów.
Podziêkowania
Sk³adamy podziêkowanie G³ównemu Urzêdowi Statystycznemu za udostêpnienie nieidentyfikowalnych danych Ÿród³owych dotycz¹cych rocznych
dochodów gospodarstw domowych w Polsce w latach 2000, 2003 oraz 2006.
Bibliografia
Armatte M., 1995, Robert Gibrat la loi de l’effet proportionnel, „Mathématiques et sciences humaines” nr 129.
Bhattacharyya P., Chatterjee A., Chakrabarti B.K., 2005, A common mode of origin of
power laws in models of market and earthquake, „Physica A” nr 381.
Bouchard J.-P., Potters M., 2001, Theory of financial risks: from statistical physics to
risk management, Cambridge University Press, Cambridge.
Chatterjee A., Chakrabarti B.K., 2007, Kinetic exchange models for income and wealth
distributions, „The European Physical Journal B” nr 60.
G³ówny Urz¹d Statystyczny, 2009, http://www.stat.gov.pl/.
Jagielski M., 2009, Badanie zamo¿noœci gospodarstw domowych w Polsce metodami
egzotycznej i tradycyjnej fizyki statystycznej, praca magisterska dostêpna w bibliotece IFD Wydzia³u Fizyki Uniwersytetu Warszawskiego.
Jagielski M., Kutner R., 2010, Study of households’ income in Poland by using the statistical physics approach, „Acta Physica Polonica A” t. 117, z. 4.
Mandelbrot B., 1960, New Methods in Statistical Economics, „The Journal of Political
Economy” nr 71.
Okuyama K., Takayasu M., Takayasu H., 1999, Zipf’s law in income distribution of companies, „Physica A” nr 269.
Rankingi Wprost, 2009, http://100najbogatszych.wprost.pl/.
Richmond P., Hutzler S., Coelho R., Repetowicz P., 2006, A Review of Empirical Studies and Models of Income Distributions, w: Chakrabarti B.K., Chakraborti A., Chatterjee A., Society in Econophysics and Sociophysics: Trends and Perspectives, WILEY-VCH, Weinheim.
Richmond P., Solomon S., 2001, Power laws are disguised Boltzmann laws, „International Journal of Modern Physics C” nr 12.
ekonomia 25
161
Maciej Jagielski, Ryszard Kutner
Solomon S., Richmond P., 2002, Stable power laws in variable economies; Lotka-Volterra implies Pareto-Zipf, „The European Physical Journal B” nr 27.
Yamamoto K., Miyazima S., Yamamoto H., Ohtsuki T., Fujihara A., 2006, The power-law exponent and the competition rule of the high income model, w: Takayasu H.,
Practical Fruits of Econophysics: Proceedings of the Third Nikkei Econophysics Symposium, Springer, Tokyo.
Abstract
162
Wealth Modeling of Polish Households Using Statistical Methods
The aim of this work is to analyze the empirical cumulative layouts of annual
household income in Poland between 2000 and 2006. Data were collected from
the Central Statistical Office. The layouts were compared with predictions of
Pareto rights, Law of Proportionate Effect, generalized Lotka-Volterra model
and models of collisions. It turned out that middle class and wealthy Polish
households are described very well by the cumulative distributions of Pareto,
which differ by the value of the Pareto exponent. On the other hand the income
of poor households is described by a cumulative log-normal distribution. To
describe the poor and middle class households the generalized Lotka-Volterra
model can be used, which provides the theoretical interpretation of the level
of individual households.
ekonomia 25