Na różnorodne skutki procesu przemian systemowych i

Transkrypt

Na różnorodne skutki procesu przemian systemowych i
PRÓBA ZASTOSOWANIA SIECI NEURONOWEJ TYPU SOM W
BADANIU PRZESTRZENNEGO ZRÓŻNICOWANIA
POWIATÓW W POLSCE.
Dr Kamila Migdał Najman
Dr Krzysztof Najman
Katedra Statystyki
Wydział Zarządzania
Uniwersytet Gdański
[email protected]
[email protected]
SOPOT 2002
Na
różnorodne
skutki
procesu
przemian
systemowych
i
strukturalnych,
dokonywanych w Polsce pod koniec XX wieku wskazują liczni autorzy, m.in. Z. Czyżowska
(1995), Z. Chojnicki (1996), M. Kałaska i J. Witkowski (1996), M. Szostak (1996). Do
pozytywnych następstw przemian zalicza się odzyskanie suwerenności państwowej,
powstanie demokratycznego ustroju politycznego, umocnienie samorządu terytorialnego,
rozwinięcie innych form samorządności, rozwój gospodarki rynkowej, upodmiotowienie
społeczeństwa, zmiana otoczenia międzynarodowego i geopolitycznego Polski. Powstaje
nowy porządek polityczny, gospodarczy, społeczny. Wszystko to przyczynia się do
stworzenia
nowych
szans
rozwoju
społeczno-gospodarczego
kraju.
Jednak
obok
pozostających starych zagrożeń pojawiają się nowe, które utrudniają i opóźniają proces
przekształcania systemu politycznego i gospodarczego. Zaliczyć do nich możemy przede
wszystkim
zacofanie
cywilizacyjne
i
techniczne,
zagrożenia
ekologiczne,
pewne
przyzwyczajenia i nawyki nie sprzyjające rozwojowi przedsiębiorczości, inicjatywy,
innowacyjności i aktywności zawodowej ludności. Do nowych zagrożeń zaliczyć możemy
rosnące niezadowolenie ludzi oczekujących szybkiej poprawy, utrzymujący się poziom
bezrobocia, wzrost patologii społecznej, trudności mieszkaniowe, stosunkowo niskie dochody
ludności.1 Wszystkie te cechy oddziałują z różną siłą w różnych rejonach Polski. Związane
jest to ze zróżnicowaniem kraju pod względem warunków historycznych, naturalnych, i
społeczno – ekonomicznych.
Celem badania, jest próba analizy zróżnicowania przestrzennego powiatów w Polsce
10 lat po transformacji. Analiza prowadzona będzie na podstawie danych statystycznych
obejmujących 307 powiatów badanych ze względu na 9 zmiennych demograficznych i 14
zmiennych ekonomicznych według stanu na rok 2000. Obiektem analizy są powiaty Polski.
Analiza nie uwzględnia powiatu warszawskiego i miast na prawach powiatu. Zastosowaną
metodą analityczną jest sieć neuronowa typu SOM.
1
Eugeniusz Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich, Wiadomości Statystyczne,
Listopad 1998
METODA BADAWCZA
Mapa Samoorganizująca (Self Organizing Map – SOM) znana również jako sieć
neuronowa Kohonena – nazwana tak od jej twórcy, fińskiego profesora Teuvo Kohonen’a jest jednym z bardziej zaawansowanych modeli sieci neuronowych. Oparta jest na nie
nadzorowanym uczeniu, co oznacza, że nie jest potrzebna żadna interwencja podczas jej
uczenia. Dostarcza topologicznego odwzorowania z przestrzeni wielowymiarowej na
dwuwymiarową mapę neuronów. Mapa zazwyczaj uformowana jest jako dwuwymiarowa
siatka i dlatego jest odwzorowaniem z przestrzeni wielowymiarowej na płaszczyznę.2 Może
być zastosowana w tym samym czasie do wizualizacji skupisk w zbiorze danych i do
wizualizacji zbioru wielowymiarowych danych na płaszczyźnie. Zachowuje nieliniowe
relacje między jednostkami i lokuje bliskie sobie jednostek bliżej siebie na mapie.
Zazwyczaj, neurony na mapie połączone są z sąsiadującymi neuronami przez relacje
sąsiedztwa dyktując w ten sposób strukturę (topologię) sieci. Typowa topologia sieci to
prostokątna bądź heksagonalna (sześciokątna) siatka albo zamknięty bądź otwarty łańcuch.
Na rysunku 1 przedstawione są relacje sąsiedztwa między neuronami.3
Rysunek 1.
Różne topologie sieci SOM: prostokątna, heksagonalna, łańcuch otwarty i
zamknięty.
Prostokątna
2
3
Heksagonalna
Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997, s. 85-87
Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing Company ITP 1996, s. 14-12
– 14-14
Łańcuch zamknięty4
Łańcuch otwarty
Każdy z tych neuronów połączony jest z wektorem wejściowym obiektu wejściowego
za pomocą wag synaptycznych, które są modyfikowane podczas uczenia sieci. Wszystkie
wagi łączą się z pojedynczym neuronem na mapie tworząc zbiór nazywany prototypem. Po
udanym treningu, prototypy reprezentują utworzone skupiska o podobnych własnościach.
Jeśli
nie
istnieją
wyraźne
skupiska
w
zbiorze
danych,
metoda
odwzorowania
samoorganizującej mapy ujawnia „pasma gór” i „wąwozów”. Pierwsze są często strefą
nieregularnie ukształtowaną z wysoką tendencją do tworzenia skupisk, podczas gdy drugie
rozdzielają zbiór danych na obszary, które mają odmienne właściwości.
Podczas procesu uczenia, dla każdego neurony na mapie obliczana jest między jego
prototypem a wektorem wejściowym odległość Euklidesowa. Neuron, który ma najmniejszą
odległość wygrywa współzawodnictwo wraz ze swoim prototypem oraz najbliższymi
sąsiadami. Aktualizują one swoje wagi i cała grupa prototypu (wraz z sąsiadami) przesuwa się
w kierunku wektorów wejściowych. O intensywności uczenia się neuronów będących w
bezpośrednim sąsiedztwie neuronu wygrywającego decyduje przyjęta funkcja sąsiedztwa.
Najczęściej stosowanymi są funkcje: gaussowska, ucięta gaussowska, bubble i ep.
Ocena jakości mapy wykonywana jest najczęściej na podstawie 4 typów błędów. Jest
to: błąd kwantyzacji, błąd topograficzny, błąd dystorsji i liczba martwych neuronów. Błąd
kwantyzacji określa poziom specjalizacji neuronów. Błąd topograficzny ocenia jakość
„rozciągnięcia” mapy na obiekty wejściowe.5 Błąd dystorsji mierzy zagęszczenie obiektów
przy pojedynczym neuronach. Liczba martwych neuronów to stosunek liczby neuronów
aktywnych do nieaktywnych. Optymalnie skonstruowana sieć SOM to sieć o wysokiej
specjalizacji neuronów, tj. o małym błędzie kwantyzacji. To sieć prawidłowo rozciągnięta na
badane obiekty, zajmująca w przestrzeni ten sam obszar, tj. mały błąd topograficzny. Gdy
obiekty zajmują przestrzeń na bazie trójkąta to sieć powinna być rozciągnięta w taki właśnie
trójkąt. Neurony powinny być w miarę równomiernie „przydzielone” poszczególnym
4
Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2000, s.
183
5
Więcej o roli sąsiedztwa i własnościach poszczególnych funkcji można znaleźć w: Vesanto J., Data Mining
Techniques Based on the Self Organizing Map, Thesis for the degree of Master of Science in Engineering,
Helsinki University of Technology, 1997, s. 6, 17-18
obiektom. Niski błąd dystorsji będzie świadczył o tym, że wszystkie obiekty mają tę samą
liczbę neuronów wyspecjalizowanych do ich rozpoznawania. Sieć nie może być również
„nadmiarowa”, czyli posiadać zbyt dużej liczby neuronów. Siatka neuronów powinna
zawierać ich tyle, ile potrzeba do rozpoznawania wszystkich obiektów, ale nie więcej. Każdy
dodatkowy – „martwy” neuron (neuron, który nie uczestniczy w uczeniu) to jedynie
dodatkowy czas analiz, nie zrekompensowany żadną dodatkową wiedzą. Ponieważ każdy
rodzaj błędu ma inne znaczenie i wagę w opisie sieci, a także przyjmuje wartości z innego
przedziału liczbowego dla celów tej analizy zbudowano syntetyczny wskaźnik, błąd
całkowity, jako funkcję czterech powyższych błędów według reguły: Błąd całkowity= 0.4 x
błąd kwantyzacji + 0.4 x błąd topologiczny + 0.1 x błąd dystorsji + 0.1 liczba martwych
neuronów.
Głównym powodem stosowania SOM w analizie danych jest to, że: jest metodą
nieparametryczną, nie wymaga a priori żadnych założeń, co do rozkładów analizowanych
zmiennych. Jest metodą, która wykrywa niespodziewane układy, struktury czy wzorce
podczas uczenia się, bez subiektywnego wpływu analityka.6 Doskonale radzi sobie z
różnorodnymi typami danych w pojedynczym zbiorze danych.
PRZEBIEG BADANIA
Do opisu powiatów wybrano 23 zmienne, z podziałem na zmienne demograficzne i
ekonomiczne. Do zmiennych demograficznych zostały wybrane następujące dane
statystyczne:
-
ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym,
-
ludność na 1 km2,
-
przyrost naturalny na 1000 ludności,
-
małżeństwa na 1000 ludności,
-
rozwody na 1000 ludności,
-
urodzenia żywe na 1000 ludności,
-
zgodny ogółem na 1000 ludności,
-
migracje wewnętrzne ludności: saldo migracji,
-
zgony niemowląt na 1000 urodzeń żywych.
6
Self-Organizing Maps, T. Kohonen, Sprinder-Verlag, 1997, s. xxx, 162 - 165
Do zmiennych ekonomicznych zostały wybrane następujące dane statystyczne:
-
pracujący na 1000 ludności, pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i
rybactwo w %,
-
pracujący: przemysł i budownictwo w %,
-
pracujący: usługi rynkowe w %,
-
pracujący: usługi nierynkowe w %,
-
bezrobotni zarejestrowani ogółem,
-
bezrobotne kobiety ogółem,
-
przeciętne miesięczne wynagrodzenie brutto w zł,
-
stopa bezrobocia w %,
-
dochody budżetów gmin na 1 mieszkańca w zł,
-
wydatki budżetów gmin inwestycyjne w %,
-
nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1 mieszkańca w zł,
-
wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł,
-
podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby prawne i
jednostki organizacyjne nie mające osobowości prawnej.
Zbiór danych objął wszystkie powiaty (307) z wyłączeniem powiatu warszawskiego i miast
na prawach powiatu7. Zbiór danych pochodzi z publikacji „Powiaty w Polsce” z 2001 roku.
WYNIKI BADAŃ
CHARAKTERYSTYKA POWIATÓW
BADANYCH ZE WZGLĘDU NA ZMIENNE DEMOGRAFICZNE
W analizie demograficznego zróżnicowania powiatów budowane były sieci o
wymiarach 6x6 do 19x19. Dla każdej z nich stosowano każdą z czterech funkcji sąsiedztwa.
Za każdym razem wyznaczano wszystkie miary jakości sieci. Dalszej analizie poddana
została sieć o najmniejszym błędzie całkowitym. Optymalna sieć miała wymiar 13x13
7
Powiaty te tak bardzo różnią się od innych, że zawsze stanowią osobna klasę. Dodanie ich do zbioru danych nie
wnosi, więc dodatkowego czynnika poznawczego. Zachowanie ich w zbiorze danych powoduje dodatkowo
problemy klasyfikacyjne innych powiatów ze względu na duże różnice w aktywizacji neuronów między
powiatami miejskimi a innymi.
neuronów z funkcją sąsiedztwa typu gaussowskiego. Przyjęto topologię heksagonalną8. Błędy
sieci były następujące:
błąd kwantyzacji
= 0.1509
błąd topograficzny
= 0.1726
błąd dystorsji
= 0.0294
liczba martwych neuronów = 11%
błąd całkowity
= 0.1436
Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi przedstawiona jest
na rysunku 2. Na podstawie macierzy stanów neuronów dokonana została metodą k-średnich
klasyfikacja powiatów na względnie jednorodne grupy. Klasyfikację tą przedstawiono na
rysunku 3.
Zmienne demograficzne:
-
zmienna 1 - ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym,
-
zmienna 2 - ludność na 1 km2,
-
zmienna 3 - przyrost naturalny na 1000 ludności,
-
zmienna 4 - małżeństwa na 1000 ludności,
-
zmienna 5 - rozwody na 1000 ludności,
-
zmienna 6 - urodzenia żywe na 1000 ludności,
-
zmienna 7 - zgodny ogółem na 1000 ludności,
-
zmienna 8 - migracje wewnętrzne ludności: saldo migracji,
-
zmienna 9 - zgony niemowląt na 1000 urodzeń żywych.
8
Do badania tego typu danych można zastosować schemat połączeń neuronów prostokątny lub heksagonalny.
Ze względu na większą liczbę sąsiadów w schemacie heksagonalnym, łatwiej przy jej pomocy analizować
bardzo złożone struktury danych. Przyjęto, więc ten schemat a priori we wszystkich analizach.
Rysunek 2.
Pobudzenie neuronów przez poszczególne zmienne demograficzne.
Źródło: Opracowanie własne
Rysunek 3.
Klasyfikacja powiatów ze względu na zmienne demograficzne na bazie
optymalnej sieci.
Źródło: Opracowanie własne
Z mapy wynika, że przestrzenne zróżnicowanie powiatów badanych ze względu na
zmienne demograficzne pogrupować można na trzy grupy powiatów. Przenosząc tak
uzyskane informacje na mapę administracyjną Polski uzyskujemy końcowy wynik analizy Rysunek 4. Należy tu dodać, że tak uzyskany podział administracyjny nie dzieli powiatów na
„lepsze” i „gorsze”. Wyróżnione zostały jedynie obszary różniące się między sobą. Ocena
spoczywa w ręku analityka.
Rysunek 4.
Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze
względu na zmienne demograficzne.
Źródło: Opracowanie własne
Tabela 1.
Średnia badanych cech dla wyodrębnionych trzech grup powiatów i średnia
krajowa bez powiatu warszawskiego i miast na prawach powiatu*.
Nazwa cechy
Ludność w wieku nieprodukcyjnym na 100
osób w wieku produkcyjnym
Ludność na 1 km2
Przyrost naturalny na 1000 ludności
Małżeństwa na 1000 ludności
Rozwody na 1000 ludności
Urodzenia żywe na 1000 ludności
Zgony ogółem na 1000 ludności
Migracje wewnętrzne ludności: saldo
migracji
Zgony niemowląt na 1000 urodzeń żywych
Grupa 1
Grupa 2
Grupa 3
Średnia
krajowa*
69,4
74,8
62,6
68,3
89,7
2,9
5,8
0,7
11,7
8,7
-6,5
63,9
-0,7
5,6
0,5
10,5
11,3
-115,9
139,1
0,1
5,3
1,0
9,5
9,4
89
101
1,1
5,6
0,8
10,6
9,6
1,0
7,7
7,8
8,3
8,0
Pierwszą grupę stanowi 124 powiatów występujących w północnej, północno-zachodniej,
centralnie zachodniej i południowo-wschodniej części kraju. Aż 80 % powiatów
zakwalifikowanych do grupy pierwszej znajduje się w województwie pomorskim,
warmińsko-mazurskim, kujawsko-pomorskim, wielkopolskim, małopolskim i podkarpackim.
Cechą charakterystyczną tych powiatów jest najbardziej zbliżony poziom liczby ludności na 1
km2 w porównaniu z średnią krajową (bez miast na prawach powiatu). Powiaty te
charakteryzują się zdecydowanie wysokim, dodatnim przyrostem naturalnym na 1000
ludności jak i wyższym poziomem zawieranych małżeństw na 1000 ludności. W grupa ta
charakteryzuje się niższym poziomem zgonów niemowląt na 1000 urodzeń żywych przy
najwyższym poziomie urodzeń żywych na 1000 ludności. Saldo migracji wewnętrznej jest na
dość niskim ujemnym poziomie.
Drugą grupę stanowią 74 powiaty skoncentrowane głównie w części środkowej i wschodniej
kraju. Powiaty te w 60% położone są w województwie łódzkim, mazowieckim,
świętokrzyskim, podlaskim i lubelskim. Powiaty, które znalazły się w tej grupie w bardzo
ciekawy sposób nałożyły się na administracyjne granice tych województw. Do grupy tej
zaliczymy powiaty o dość wysokim ujemnym przyroście naturalnym na 1000 ludności,
niskiej gęstości zaludnienia na 1 km2, gdzie liczba zawartych małżeństw jest na poziomie
średniej krajowej (bez miast na prawach powiatu). Powiaty te charakteryzuje stosunkowo
najniższy poziom rozwodów na 1000 ludności, ale za to najwyższy poziom zgonów ogółem
na 1000 ludności. W powiatach tych saldo migracji wewnętrznej przyjmuje zazwyczaj bardzo
wysoką wartość ujemną.
Trzecią grupę stanowi 109 powiatów ciągnących się zdecydowanie wzdłuż granicy
zachodniej, zachodniej części granicy południowej i będących w bezpośrednim położeniu
wokół miast na prawach powiatu. Województwo zachodniopomorskie, lubuskie, dolnośląskie,
opolskie i śląskie obejmuje w 84% powiaty z tej właśnie grupy. Cechą charakterystyczną jest
wysoka gęstość zaludnienia na 1 km2 przy niewielkim poziomie przyrostu naturalnego na
1000 ludności. W powiatach tych występuje w porównaniu z pozostałymi grupami niższy
poziom zawieranych małżeństw na 1000 ludności. Za to są to raczej powiaty o stosunkowo
najwyższym poziomie rozwodów na 1000 ludności. W grupie tej przy dość wysokim
poziomie zgonów niemowląt na 1000 urodzeń żywych, urodzenia żywe na 1000 ludności
należą raczej do najniższych. Saldo migracji wewnętrznej w przeciwieństwie do średniej
krajowej (bez miast na prawach powiatów) przyjmuje w tych powiatach zazwyczaj dość
wysoką wartość dodatnią.
CHARAKTERYSTYKA POWIATÓW
BADANYCH ZE WZGLĘDU NA ZMIENNE EKONOMICZNE
Polska tworzy niewątpliwie złożoną strukturę przestrzenno-ekonomiczną. Występują
obszary, w których w większym bądź mniejszym stopniu następuje pobudzanie rozwoju
gospodarki, często struktura ekonomiczna ma charakter monofunkcyjny a jednocześnie
narastają różnego typu problemy umożliwiające dalszy rozwój. W wielu przypadkach pewne
obszary charakteryzują się nadmierną koncentracją ludności, infrastruktury gospodarczej,
technicznej w przeciwieństwie do obszarów, które nadal cechują się typowo rolniczym
charakterem. Pewne opóźnianie bądź zaniechanie zmian strukturalnych wynika z braku
zdolności do samodzielnej regeneracji, zdeformowaną strukturą zatrudnienia w jednej gałęzi
gospodarki i bardzo niskim udziałem sfery usług, trwałą nierównowagą między podażą
własnych zasobów pracy a zapotrzebowaniem gospodarki. Problemem jest, więc bifurkacja
powiatów polegająca na stałym powiększaniu się zróżnicowań w pozycji ekonomicznej.9
Podobnie jak poprzednio budowano sieci o rozmiarach od 6x6 do 19x19 dla wszystkich
typów funkcji sąsiedztwa. Optymalna sieć miała wymiar 7x7 neuronów z funkcją sąsiedztwa
9
Runge Jerzy, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie województwa
katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996, s. 10 - 19
typu uciętego gaussowskiego. Podobnie przyjęto topologię heksagonalną. Błędy sieci były
następujące :
błąd kwantyzacji
= 0.3167
błąd topograficzny
= 0.2378
błąd dystorsji
= 0.1109
liczba martwych neuronów = 0%
błąd całkowity
= 0.2329
Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi ekonomicznymi
przedstawiona jest na rysunku 5. W wyniku klasyfikacji metodą k-średnich uzyskano podział
powiatów na 5 grup. Klasyfikacja ta pokazana jest na rysunku 6. Przenosząc te informację na
mapę administracyjną uzyskujemy końcowy wynik analizy – Rysunek 7.
Zmienne ekonomiczne:
- zmienna 1 - pracujący na 1000 ludności
-
zmienna 2 - pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w %,
-
zmienna 3 - pracujący: przemysł i budownictwo w %,
-
zmienna 4 - pracujący: usługi rynkowe w %,
-
zmienna 5 - pracujący: usługi nierynkowe w %,
-
zmienna 6 - bezrobotni zarejestrowani ogółem,
-
zmienna 7 - bezrobotne kobiety ogółem,
-
zmienna 8 - przeciętne miesięczne wynagrodzenie brutto w zł,
-
zmienna 9 - stopa bezrobocia w %,
-
zmienna 10 - dochody budżetów gmin na 1 mieszkańca w zł,
-
zmienna 11 - wydatki budżetów gmin inwestycyjne w %,
-
zmienna 12 - nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1
mieszkańca w zł,
-
zmienna 13 - wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w
zł,
-
zmienna 14 - podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby
prawne i jednostki organizacyjne nie mające osobowości prawne.
Rysunek 5.
Pobudzenie neuronów przez poszczególne zmienne ekonomiczne.
Źródło: Opracowanie własne
Rysunek 6. Klasyfikacja powiatów ze względu na zmienne ekonomiczne na bazie
optymalnej sieci.
Źródło: Opracowanie własne
Rysunek 7.
Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze
względu na zmienne ekonomiczne.
Źródło: Opracowanie własne
Pierwszą grupę stanowi 48 powiatów zdecydowanie w większości położonych wokół dużych
miast, takich jak: Warszawa, Katowice, Poznań, Wrocław, Szczecin, Opole, Gdańsk i
Bielsko-Biała. W grupie tej znalazły się powiaty o najniższym udziale pracujących w
rolnictwie 30,7% za to najwyższym w przemyśle i budownictwie 34% i usługach rynkowych
18,2%. Są to powiaty o najwyższym przeciętnym wynagrodzeniu brutto wynoszącym 1959,6
zł i najniższej stopie bezrobocia wynoszącej 13,3%. Ów wysoki poziom płac wynikać może
zarówno z niskich stóp bezrobocia, jak i wysokiego poziomu wydajności pracy. W większości
jest to grupa powiatów charakteryzujących się najwyższymi dochodami budżetów gmin na
jednego mieszkańca, najwyższymi wydatkami budżetów gmin inwestycyjnych w %,
najwyższymi nakładami inwestycyjnymi w przedsiębiorstwach i wartością brutto środków
trwałych w przedsiębiorstwach w przeliczeniu na jednego mieszkańca w zł. Powiaty te
charakteryzują się najwyższą liczbą podmiotów gospodarczych zarejestrowanych w rejestrze
REGON.
Tabela 2.
Średnia badanych cech dla wyodrębnionych pięciu grup powiatów i średnia
krajowa bez powiatu warszawskiego i miast na prawach powiatu*.
Nazwa cechy
Pracujący na 1000 ludności
Pracujący: rolnictwo,
łowiectwo, leśnictwo,
rybołówstwo i rybactwo w
%
Pracujący: przemysł i
budownictwo w %
Pracujący: usługi rynkowe
w%
Pracujący: usługi
nierynkowe w %
Bezrobotni zarejestrowani
ogółem
Bezrobotne kobiety ogółem
Przeciętne miesięczne
wynagrodzenie brutto w zł
Stopa bezrobocia w %
Dochody budżetów gmin
na 1 mieszk. w zł
Wydatki budżetów gmin
inwestycyjne w %
Nakłady inwestycyjne w
przedsiębiorstwach wg
lokalizacji na 1 mieszkańca
w zł
Wartość brutto środków
trwałych w
przedsiębiorstwach na 1
mieszkańca w zł
Podmioty gospodarki
narodowej zarejestrowane
w rejestrze REGON
ogółem
Grupa 1 Grupa 2 Grupa 3 Grupa 4 Grupa 5
Średnia
krajowa*
357, 4
30,7
318,8
42,5
397,9
61,7
302,6
34,6
444,6
70,1
373,3
50,8
34,9
25,9
17,5
30,0
12,1
22,4
18,2
13,7
8,9
16,4
6,8
12,0
16,3
17,9
11,9
19,1
11,0
14,9
5714,8
5292,6
10993,4
10466,8
5039,2
6656,6
3311,8
1959,6
2940,9
1573,3
5861,5
1635,4
5830,1
1626,72
2648,0
1596,2
3645,4
1656,2
13,3
1334,7
22,2
1180,5
17,9
1096,8
25,7
1172,2
15,3
1081,1
18,6
1160,9
23,1
19,7
22,2
19,9
18,9
20,2
2285,5
883,5
827,0
1085,3
644,2
1046,7
25752,4
8299,2
9559,8
10549,8
6498,4
10891,3
862,7
461,2
717,2
789,9
373,6
571,3
Drugą grupę stanowi 75 powiatów zlokalizowanych w większości w Polsce zachodniej.
Powiaty z części centralnej, południowo-wschodniej i wschodniej jedynie w pojedynczych
przypadkach reprezentują tą grupę. Bardzo widoczny jest podział powiatów należących do tej
grupy na zachodnią i wschodnią część Polski. Powiaty te charakteryzują się dość niską liczbą
zarejestrowanych podmiotów gospodarczych w rejestrze REGON, dość wysoką stopą
bezrobocia i niskim udziałem pracujących na 1000 ludności. W grupie tej przeciętne
wynagrodzenie brutto jest na najniższym poziomie gdzie udział pracujących w usługach
nierynkowych jest jednym z wyższych. W powiatach tych wartość brutto środków trwałych w
przedsiębiorstwach w przeliczeniu na jednego mieszkańca jest również dość niski.
Trzecią grupę stanowi 31 powiatów znajdujących się w części centralnej kraju i południowowschodniej. Są to w większości powiaty zlokalizowane w najbliższym sąsiedztwie byłych
mniejszych miast wojewódzkich. Powiaty te charakteryzują się dość wysokim udziałem
pracujących na 1000 ludności, stopą bezrobocia zbliżoną do średniej krajowej gdzie udział
pracujących w rolnictwie jest dość wysoki a w przemyśle i budownictwie dość niski.
Czwartą grupę stanowi 48 powiatów znajdujących się głównie w części północnej Polski.
Powiaty te charakteryzują się najwyższym udziałem pracujących w usługach nierynkowych,
dość wysokim udziałem pracujących w usługach rynkowych, przemyśle i budownictwie i
jednym z niższych w rolnictwie. Można przypuszczać, że przyczyna tego stanu tkwi w dużej
atrakcyjności turystycznej regionów nadmorskich. W grupie tej stopa bezrobocia jest na
najwyższym poziomie gdzie liczba pracujących na 1000 ludności jest najniższa. Jest to rejon,
w którym dokonano likwidacji PGR-ów lub redukcji zatrudnienia w górnictwie (byłe
województwo wałbrzyskie), co doprowadziło do wysokiego bezrobocia strukturalnego.10
Piątą grupę stanowi 105 powiatów znajdujących się w Polsce centralnej i wschodniej. Cechą
charakterystyczną jest wysoki udział pracujących na 1000 ludności przy najniższym poziomie
pracujących w przemyśle, budownictwie, usługach rynkowych i nierynkowych. Liczba
podmiotów gospodarczych zarejestrowanych w rejestrze REGON jest tu najniższa a stopa
bezrobocia jedna z niższych. Ta dość niska stopa bezrobocia wynika raczej z ukrytego
bezrobocia gdzie zdecydowana większość pracujących pracuje w rolnictwie. Tereny te to
obszary z dominacją rolnictwa, w których udział rolnictwa prywatnego jest w granicach
90%.11 Dochody budżetów gmin na jednego mieszkańca, wydatki budżetów gmin
inwestycyjne, nakłady inwestycyjne w przedsiębiorstwach, wartość środków trwałych w
przedsiębiorstwach jest w tej grupie na najniższym poziomie. Jest to rejon słabiej rozwinięty,
mniej uprzemysłowiony, z gorzej rozwiniętą infrastrukturą.
10
Tokarski Tomasz, Rogut Aleksandra [2000], Zróżnicowanie struktury pracujących a odpływy z bezrobocia,
„Wiadomości Statystyczne” nr 3/2000
11
Kaczorowski Paweł, Aleksandra Rogut, Tomasz Tokarski [2001], Sektorowe zmiany strukturalne gospodarki
w ujęciu regionalnym, „Wiadomości Statystyczne” nr 9/2001
PODSUMOWANIE
Uzyskane wyniki wydają się interesujące. Z przeprowadzonej analizy wynika, że
różne czynniki w różnym stopniu wpływają na zróżnicowanie powiatów w Polsce.
Zaproponowana metoda nie wyjaśnia jednak, dlaczego tak się dzieje, że sąsiadujące ze sobą
powiaty są tak odmienne. Autorzy także nie podejmą się takiej interpretacji.
Na podstawie przeprowadzonej analizy można by wysunąć wnioski, które mogłyby
przyczynić się do zmiany polityki regionalnej, rozwojów regionów i zahamowania
pogłębiającej się dysproporcji między powiatami.
LITERATURA
1. Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing
Company ITP 1996
2. Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997,
3. Visual Explorations in Finance with Self-Organizing Maps, G. Deboeck, T. Kohonen,
Springer-Verlag 1998
4. E. Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich,
Wiadomości Statystyczne, Listopad 1998
5. J. Runge, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie
województwa katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996,
6. T. Tokarski, A. Rogut [2000], Zróżnicowanie struktury pracujących a odpływy z
bezrobocia, „Wiadomości Statystyczne” nr 3/2000
7. P. Kaczorowski, A. Rogut, T. Tokarski [2001], Sektorowe zmiany strukturalne
gospodarki w ujęciu regionalnym, „Wiadomości Statystyczne” nr 9/2001
8. Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza
EXIT, Warszawa, 2000

Podobne dokumenty