Na różnorodne skutki procesu przemian systemowych i
Transkrypt
Na różnorodne skutki procesu przemian systemowych i
PRÓBA ZASTOSOWANIA SIECI NEURONOWEJ TYPU SOM W BADANIU PRZESTRZENNEGO ZRÓŻNICOWANIA POWIATÓW W POLSCE. Dr Kamila Migdał Najman Dr Krzysztof Najman Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański [email protected] [email protected] SOPOT 2002 Na różnorodne skutki procesu przemian systemowych i strukturalnych, dokonywanych w Polsce pod koniec XX wieku wskazują liczni autorzy, m.in. Z. Czyżowska (1995), Z. Chojnicki (1996), M. Kałaska i J. Witkowski (1996), M. Szostak (1996). Do pozytywnych następstw przemian zalicza się odzyskanie suwerenności państwowej, powstanie demokratycznego ustroju politycznego, umocnienie samorządu terytorialnego, rozwinięcie innych form samorządności, rozwój gospodarki rynkowej, upodmiotowienie społeczeństwa, zmiana otoczenia międzynarodowego i geopolitycznego Polski. Powstaje nowy porządek polityczny, gospodarczy, społeczny. Wszystko to przyczynia się do stworzenia nowych szans rozwoju społeczno-gospodarczego kraju. Jednak obok pozostających starych zagrożeń pojawiają się nowe, które utrudniają i opóźniają proces przekształcania systemu politycznego i gospodarczego. Zaliczyć do nich możemy przede wszystkim zacofanie cywilizacyjne i techniczne, zagrożenia ekologiczne, pewne przyzwyczajenia i nawyki nie sprzyjające rozwojowi przedsiębiorczości, inicjatywy, innowacyjności i aktywności zawodowej ludności. Do nowych zagrożeń zaliczyć możemy rosnące niezadowolenie ludzi oczekujących szybkiej poprawy, utrzymujący się poziom bezrobocia, wzrost patologii społecznej, trudności mieszkaniowe, stosunkowo niskie dochody ludności.1 Wszystkie te cechy oddziałują z różną siłą w różnych rejonach Polski. Związane jest to ze zróżnicowaniem kraju pod względem warunków historycznych, naturalnych, i społeczno – ekonomicznych. Celem badania, jest próba analizy zróżnicowania przestrzennego powiatów w Polsce 10 lat po transformacji. Analiza prowadzona będzie na podstawie danych statystycznych obejmujących 307 powiatów badanych ze względu na 9 zmiennych demograficznych i 14 zmiennych ekonomicznych według stanu na rok 2000. Obiektem analizy są powiaty Polski. Analiza nie uwzględnia powiatu warszawskiego i miast na prawach powiatu. Zastosowaną metodą analityczną jest sieć neuronowa typu SOM. 1 Eugeniusz Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich, Wiadomości Statystyczne, Listopad 1998 METODA BADAWCZA Mapa Samoorganizująca (Self Organizing Map – SOM) znana również jako sieć neuronowa Kohonena – nazwana tak od jej twórcy, fińskiego profesora Teuvo Kohonen’a jest jednym z bardziej zaawansowanych modeli sieci neuronowych. Oparta jest na nie nadzorowanym uczeniu, co oznacza, że nie jest potrzebna żadna interwencja podczas jej uczenia. Dostarcza topologicznego odwzorowania z przestrzeni wielowymiarowej na dwuwymiarową mapę neuronów. Mapa zazwyczaj uformowana jest jako dwuwymiarowa siatka i dlatego jest odwzorowaniem z przestrzeni wielowymiarowej na płaszczyznę.2 Może być zastosowana w tym samym czasie do wizualizacji skupisk w zbiorze danych i do wizualizacji zbioru wielowymiarowych danych na płaszczyźnie. Zachowuje nieliniowe relacje między jednostkami i lokuje bliskie sobie jednostek bliżej siebie na mapie. Zazwyczaj, neurony na mapie połączone są z sąsiadującymi neuronami przez relacje sąsiedztwa dyktując w ten sposób strukturę (topologię) sieci. Typowa topologia sieci to prostokątna bądź heksagonalna (sześciokątna) siatka albo zamknięty bądź otwarty łańcuch. Na rysunku 1 przedstawione są relacje sąsiedztwa między neuronami.3 Rysunek 1. Różne topologie sieci SOM: prostokątna, heksagonalna, łańcuch otwarty i zamknięty. Prostokątna 2 3 Heksagonalna Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997, s. 85-87 Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing Company ITP 1996, s. 14-12 – 14-14 Łańcuch zamknięty4 Łańcuch otwarty Każdy z tych neuronów połączony jest z wektorem wejściowym obiektu wejściowego za pomocą wag synaptycznych, które są modyfikowane podczas uczenia sieci. Wszystkie wagi łączą się z pojedynczym neuronem na mapie tworząc zbiór nazywany prototypem. Po udanym treningu, prototypy reprezentują utworzone skupiska o podobnych własnościach. Jeśli nie istnieją wyraźne skupiska w zbiorze danych, metoda odwzorowania samoorganizującej mapy ujawnia „pasma gór” i „wąwozów”. Pierwsze są często strefą nieregularnie ukształtowaną z wysoką tendencją do tworzenia skupisk, podczas gdy drugie rozdzielają zbiór danych na obszary, które mają odmienne właściwości. Podczas procesu uczenia, dla każdego neurony na mapie obliczana jest między jego prototypem a wektorem wejściowym odległość Euklidesowa. Neuron, który ma najmniejszą odległość wygrywa współzawodnictwo wraz ze swoim prototypem oraz najbliższymi sąsiadami. Aktualizują one swoje wagi i cała grupa prototypu (wraz z sąsiadami) przesuwa się w kierunku wektorów wejściowych. O intensywności uczenia się neuronów będących w bezpośrednim sąsiedztwie neuronu wygrywającego decyduje przyjęta funkcja sąsiedztwa. Najczęściej stosowanymi są funkcje: gaussowska, ucięta gaussowska, bubble i ep. Ocena jakości mapy wykonywana jest najczęściej na podstawie 4 typów błędów. Jest to: błąd kwantyzacji, błąd topograficzny, błąd dystorsji i liczba martwych neuronów. Błąd kwantyzacji określa poziom specjalizacji neuronów. Błąd topograficzny ocenia jakość „rozciągnięcia” mapy na obiekty wejściowe.5 Błąd dystorsji mierzy zagęszczenie obiektów przy pojedynczym neuronach. Liczba martwych neuronów to stosunek liczby neuronów aktywnych do nieaktywnych. Optymalnie skonstruowana sieć SOM to sieć o wysokiej specjalizacji neuronów, tj. o małym błędzie kwantyzacji. To sieć prawidłowo rozciągnięta na badane obiekty, zajmująca w przestrzeni ten sam obszar, tj. mały błąd topograficzny. Gdy obiekty zajmują przestrzeń na bazie trójkąta to sieć powinna być rozciągnięta w taki właśnie trójkąt. Neurony powinny być w miarę równomiernie „przydzielone” poszczególnym 4 Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2000, s. 183 5 Więcej o roli sąsiedztwa i własnościach poszczególnych funkcji można znaleźć w: Vesanto J., Data Mining Techniques Based on the Self Organizing Map, Thesis for the degree of Master of Science in Engineering, Helsinki University of Technology, 1997, s. 6, 17-18 obiektom. Niski błąd dystorsji będzie świadczył o tym, że wszystkie obiekty mają tę samą liczbę neuronów wyspecjalizowanych do ich rozpoznawania. Sieć nie może być również „nadmiarowa”, czyli posiadać zbyt dużej liczby neuronów. Siatka neuronów powinna zawierać ich tyle, ile potrzeba do rozpoznawania wszystkich obiektów, ale nie więcej. Każdy dodatkowy – „martwy” neuron (neuron, który nie uczestniczy w uczeniu) to jedynie dodatkowy czas analiz, nie zrekompensowany żadną dodatkową wiedzą. Ponieważ każdy rodzaj błędu ma inne znaczenie i wagę w opisie sieci, a także przyjmuje wartości z innego przedziału liczbowego dla celów tej analizy zbudowano syntetyczny wskaźnik, błąd całkowity, jako funkcję czterech powyższych błędów według reguły: Błąd całkowity= 0.4 x błąd kwantyzacji + 0.4 x błąd topologiczny + 0.1 x błąd dystorsji + 0.1 liczba martwych neuronów. Głównym powodem stosowania SOM w analizie danych jest to, że: jest metodą nieparametryczną, nie wymaga a priori żadnych założeń, co do rozkładów analizowanych zmiennych. Jest metodą, która wykrywa niespodziewane układy, struktury czy wzorce podczas uczenia się, bez subiektywnego wpływu analityka.6 Doskonale radzi sobie z różnorodnymi typami danych w pojedynczym zbiorze danych. PRZEBIEG BADANIA Do opisu powiatów wybrano 23 zmienne, z podziałem na zmienne demograficzne i ekonomiczne. Do zmiennych demograficznych zostały wybrane następujące dane statystyczne: - ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym, - ludność na 1 km2, - przyrost naturalny na 1000 ludności, - małżeństwa na 1000 ludności, - rozwody na 1000 ludności, - urodzenia żywe na 1000 ludności, - zgodny ogółem na 1000 ludności, - migracje wewnętrzne ludności: saldo migracji, - zgony niemowląt na 1000 urodzeń żywych. 6 Self-Organizing Maps, T. Kohonen, Sprinder-Verlag, 1997, s. xxx, 162 - 165 Do zmiennych ekonomicznych zostały wybrane następujące dane statystyczne: - pracujący na 1000 ludności, pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w %, - pracujący: przemysł i budownictwo w %, - pracujący: usługi rynkowe w %, - pracujący: usługi nierynkowe w %, - bezrobotni zarejestrowani ogółem, - bezrobotne kobiety ogółem, - przeciętne miesięczne wynagrodzenie brutto w zł, - stopa bezrobocia w %, - dochody budżetów gmin na 1 mieszkańca w zł, - wydatki budżetów gmin inwestycyjne w %, - nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1 mieszkańca w zł, - wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł, - podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby prawne i jednostki organizacyjne nie mające osobowości prawnej. Zbiór danych objął wszystkie powiaty (307) z wyłączeniem powiatu warszawskiego i miast na prawach powiatu7. Zbiór danych pochodzi z publikacji „Powiaty w Polsce” z 2001 roku. WYNIKI BADAŃ CHARAKTERYSTYKA POWIATÓW BADANYCH ZE WZGLĘDU NA ZMIENNE DEMOGRAFICZNE W analizie demograficznego zróżnicowania powiatów budowane były sieci o wymiarach 6x6 do 19x19. Dla każdej z nich stosowano każdą z czterech funkcji sąsiedztwa. Za każdym razem wyznaczano wszystkie miary jakości sieci. Dalszej analizie poddana została sieć o najmniejszym błędzie całkowitym. Optymalna sieć miała wymiar 13x13 7 Powiaty te tak bardzo różnią się od innych, że zawsze stanowią osobna klasę. Dodanie ich do zbioru danych nie wnosi, więc dodatkowego czynnika poznawczego. Zachowanie ich w zbiorze danych powoduje dodatkowo problemy klasyfikacyjne innych powiatów ze względu na duże różnice w aktywizacji neuronów między powiatami miejskimi a innymi. neuronów z funkcją sąsiedztwa typu gaussowskiego. Przyjęto topologię heksagonalną8. Błędy sieci były następujące: błąd kwantyzacji = 0.1509 błąd topograficzny = 0.1726 błąd dystorsji = 0.0294 liczba martwych neuronów = 11% błąd całkowity = 0.1436 Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi przedstawiona jest na rysunku 2. Na podstawie macierzy stanów neuronów dokonana została metodą k-średnich klasyfikacja powiatów na względnie jednorodne grupy. Klasyfikację tą przedstawiono na rysunku 3. Zmienne demograficzne: - zmienna 1 - ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym, - zmienna 2 - ludność na 1 km2, - zmienna 3 - przyrost naturalny na 1000 ludności, - zmienna 4 - małżeństwa na 1000 ludności, - zmienna 5 - rozwody na 1000 ludności, - zmienna 6 - urodzenia żywe na 1000 ludności, - zmienna 7 - zgodny ogółem na 1000 ludności, - zmienna 8 - migracje wewnętrzne ludności: saldo migracji, - zmienna 9 - zgony niemowląt na 1000 urodzeń żywych. 8 Do badania tego typu danych można zastosować schemat połączeń neuronów prostokątny lub heksagonalny. Ze względu na większą liczbę sąsiadów w schemacie heksagonalnym, łatwiej przy jej pomocy analizować bardzo złożone struktury danych. Przyjęto, więc ten schemat a priori we wszystkich analizach. Rysunek 2. Pobudzenie neuronów przez poszczególne zmienne demograficzne. Źródło: Opracowanie własne Rysunek 3. Klasyfikacja powiatów ze względu na zmienne demograficzne na bazie optymalnej sieci. Źródło: Opracowanie własne Z mapy wynika, że przestrzenne zróżnicowanie powiatów badanych ze względu na zmienne demograficzne pogrupować można na trzy grupy powiatów. Przenosząc tak uzyskane informacje na mapę administracyjną Polski uzyskujemy końcowy wynik analizy Rysunek 4. Należy tu dodać, że tak uzyskany podział administracyjny nie dzieli powiatów na „lepsze” i „gorsze”. Wyróżnione zostały jedynie obszary różniące się między sobą. Ocena spoczywa w ręku analityka. Rysunek 4. Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze względu na zmienne demograficzne. Źródło: Opracowanie własne Tabela 1. Średnia badanych cech dla wyodrębnionych trzech grup powiatów i średnia krajowa bez powiatu warszawskiego i miast na prawach powiatu*. Nazwa cechy Ludność w wieku nieprodukcyjnym na 100 osób w wieku produkcyjnym Ludność na 1 km2 Przyrost naturalny na 1000 ludności Małżeństwa na 1000 ludności Rozwody na 1000 ludności Urodzenia żywe na 1000 ludności Zgony ogółem na 1000 ludności Migracje wewnętrzne ludności: saldo migracji Zgony niemowląt na 1000 urodzeń żywych Grupa 1 Grupa 2 Grupa 3 Średnia krajowa* 69,4 74,8 62,6 68,3 89,7 2,9 5,8 0,7 11,7 8,7 -6,5 63,9 -0,7 5,6 0,5 10,5 11,3 -115,9 139,1 0,1 5,3 1,0 9,5 9,4 89 101 1,1 5,6 0,8 10,6 9,6 1,0 7,7 7,8 8,3 8,0 Pierwszą grupę stanowi 124 powiatów występujących w północnej, północno-zachodniej, centralnie zachodniej i południowo-wschodniej części kraju. Aż 80 % powiatów zakwalifikowanych do grupy pierwszej znajduje się w województwie pomorskim, warmińsko-mazurskim, kujawsko-pomorskim, wielkopolskim, małopolskim i podkarpackim. Cechą charakterystyczną tych powiatów jest najbardziej zbliżony poziom liczby ludności na 1 km2 w porównaniu z średnią krajową (bez miast na prawach powiatu). Powiaty te charakteryzują się zdecydowanie wysokim, dodatnim przyrostem naturalnym na 1000 ludności jak i wyższym poziomem zawieranych małżeństw na 1000 ludności. W grupa ta charakteryzuje się niższym poziomem zgonów niemowląt na 1000 urodzeń żywych przy najwyższym poziomie urodzeń żywych na 1000 ludności. Saldo migracji wewnętrznej jest na dość niskim ujemnym poziomie. Drugą grupę stanowią 74 powiaty skoncentrowane głównie w części środkowej i wschodniej kraju. Powiaty te w 60% położone są w województwie łódzkim, mazowieckim, świętokrzyskim, podlaskim i lubelskim. Powiaty, które znalazły się w tej grupie w bardzo ciekawy sposób nałożyły się na administracyjne granice tych województw. Do grupy tej zaliczymy powiaty o dość wysokim ujemnym przyroście naturalnym na 1000 ludności, niskiej gęstości zaludnienia na 1 km2, gdzie liczba zawartych małżeństw jest na poziomie średniej krajowej (bez miast na prawach powiatu). Powiaty te charakteryzuje stosunkowo najniższy poziom rozwodów na 1000 ludności, ale za to najwyższy poziom zgonów ogółem na 1000 ludności. W powiatach tych saldo migracji wewnętrznej przyjmuje zazwyczaj bardzo wysoką wartość ujemną. Trzecią grupę stanowi 109 powiatów ciągnących się zdecydowanie wzdłuż granicy zachodniej, zachodniej części granicy południowej i będących w bezpośrednim położeniu wokół miast na prawach powiatu. Województwo zachodniopomorskie, lubuskie, dolnośląskie, opolskie i śląskie obejmuje w 84% powiaty z tej właśnie grupy. Cechą charakterystyczną jest wysoka gęstość zaludnienia na 1 km2 przy niewielkim poziomie przyrostu naturalnego na 1000 ludności. W powiatach tych występuje w porównaniu z pozostałymi grupami niższy poziom zawieranych małżeństw na 1000 ludności. Za to są to raczej powiaty o stosunkowo najwyższym poziomie rozwodów na 1000 ludności. W grupie tej przy dość wysokim poziomie zgonów niemowląt na 1000 urodzeń żywych, urodzenia żywe na 1000 ludności należą raczej do najniższych. Saldo migracji wewnętrznej w przeciwieństwie do średniej krajowej (bez miast na prawach powiatów) przyjmuje w tych powiatach zazwyczaj dość wysoką wartość dodatnią. CHARAKTERYSTYKA POWIATÓW BADANYCH ZE WZGLĘDU NA ZMIENNE EKONOMICZNE Polska tworzy niewątpliwie złożoną strukturę przestrzenno-ekonomiczną. Występują obszary, w których w większym bądź mniejszym stopniu następuje pobudzanie rozwoju gospodarki, często struktura ekonomiczna ma charakter monofunkcyjny a jednocześnie narastają różnego typu problemy umożliwiające dalszy rozwój. W wielu przypadkach pewne obszary charakteryzują się nadmierną koncentracją ludności, infrastruktury gospodarczej, technicznej w przeciwieństwie do obszarów, które nadal cechują się typowo rolniczym charakterem. Pewne opóźnianie bądź zaniechanie zmian strukturalnych wynika z braku zdolności do samodzielnej regeneracji, zdeformowaną strukturą zatrudnienia w jednej gałęzi gospodarki i bardzo niskim udziałem sfery usług, trwałą nierównowagą między podażą własnych zasobów pracy a zapotrzebowaniem gospodarki. Problemem jest, więc bifurkacja powiatów polegająca na stałym powiększaniu się zróżnicowań w pozycji ekonomicznej.9 Podobnie jak poprzednio budowano sieci o rozmiarach od 6x6 do 19x19 dla wszystkich typów funkcji sąsiedztwa. Optymalna sieć miała wymiar 7x7 neuronów z funkcją sąsiedztwa 9 Runge Jerzy, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie województwa katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996, s. 10 - 19 typu uciętego gaussowskiego. Podobnie przyjęto topologię heksagonalną. Błędy sieci były następujące : błąd kwantyzacji = 0.3167 błąd topograficzny = 0.2378 błąd dystorsji = 0.1109 liczba martwych neuronów = 0% błąd całkowity = 0.2329 Aktywność poszczególnych neuronów pobudzanych kolejnymi zmiennymi ekonomicznymi przedstawiona jest na rysunku 5. W wyniku klasyfikacji metodą k-średnich uzyskano podział powiatów na 5 grup. Klasyfikacja ta pokazana jest na rysunku 6. Przenosząc te informację na mapę administracyjną uzyskujemy końcowy wynik analizy – Rysunek 7. Zmienne ekonomiczne: - zmienna 1 - pracujący na 1000 ludności - zmienna 2 - pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w %, - zmienna 3 - pracujący: przemysł i budownictwo w %, - zmienna 4 - pracujący: usługi rynkowe w %, - zmienna 5 - pracujący: usługi nierynkowe w %, - zmienna 6 - bezrobotni zarejestrowani ogółem, - zmienna 7 - bezrobotne kobiety ogółem, - zmienna 8 - przeciętne miesięczne wynagrodzenie brutto w zł, - zmienna 9 - stopa bezrobocia w %, - zmienna 10 - dochody budżetów gmin na 1 mieszkańca w zł, - zmienna 11 - wydatki budżetów gmin inwestycyjne w %, - zmienna 12 - nakłady inwestycyjne w przedsiębiorstwach według lokalizacji na 1 mieszkańca w zł, - zmienna 13 - wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł, - zmienna 14 - podmioty gospodarki narodowej zarejestrowane w rejestrze REGON: osoby prawne i jednostki organizacyjne nie mające osobowości prawne. Rysunek 5. Pobudzenie neuronów przez poszczególne zmienne ekonomiczne. Źródło: Opracowanie własne Rysunek 6. Klasyfikacja powiatów ze względu na zmienne ekonomiczne na bazie optymalnej sieci. Źródło: Opracowanie własne Rysunek 7. Przestrzenne zróżnicowanie powiatów Polski w 2000 roku badanych ze względu na zmienne ekonomiczne. Źródło: Opracowanie własne Pierwszą grupę stanowi 48 powiatów zdecydowanie w większości położonych wokół dużych miast, takich jak: Warszawa, Katowice, Poznań, Wrocław, Szczecin, Opole, Gdańsk i Bielsko-Biała. W grupie tej znalazły się powiaty o najniższym udziale pracujących w rolnictwie 30,7% za to najwyższym w przemyśle i budownictwie 34% i usługach rynkowych 18,2%. Są to powiaty o najwyższym przeciętnym wynagrodzeniu brutto wynoszącym 1959,6 zł i najniższej stopie bezrobocia wynoszącej 13,3%. Ów wysoki poziom płac wynikać może zarówno z niskich stóp bezrobocia, jak i wysokiego poziomu wydajności pracy. W większości jest to grupa powiatów charakteryzujących się najwyższymi dochodami budżetów gmin na jednego mieszkańca, najwyższymi wydatkami budżetów gmin inwestycyjnych w %, najwyższymi nakładami inwestycyjnymi w przedsiębiorstwach i wartością brutto środków trwałych w przedsiębiorstwach w przeliczeniu na jednego mieszkańca w zł. Powiaty te charakteryzują się najwyższą liczbą podmiotów gospodarczych zarejestrowanych w rejestrze REGON. Tabela 2. Średnia badanych cech dla wyodrębnionych pięciu grup powiatów i średnia krajowa bez powiatu warszawskiego i miast na prawach powiatu*. Nazwa cechy Pracujący na 1000 ludności Pracujący: rolnictwo, łowiectwo, leśnictwo, rybołówstwo i rybactwo w % Pracujący: przemysł i budownictwo w % Pracujący: usługi rynkowe w% Pracujący: usługi nierynkowe w % Bezrobotni zarejestrowani ogółem Bezrobotne kobiety ogółem Przeciętne miesięczne wynagrodzenie brutto w zł Stopa bezrobocia w % Dochody budżetów gmin na 1 mieszk. w zł Wydatki budżetów gmin inwestycyjne w % Nakłady inwestycyjne w przedsiębiorstwach wg lokalizacji na 1 mieszkańca w zł Wartość brutto środków trwałych w przedsiębiorstwach na 1 mieszkańca w zł Podmioty gospodarki narodowej zarejestrowane w rejestrze REGON ogółem Grupa 1 Grupa 2 Grupa 3 Grupa 4 Grupa 5 Średnia krajowa* 357, 4 30,7 318,8 42,5 397,9 61,7 302,6 34,6 444,6 70,1 373,3 50,8 34,9 25,9 17,5 30,0 12,1 22,4 18,2 13,7 8,9 16,4 6,8 12,0 16,3 17,9 11,9 19,1 11,0 14,9 5714,8 5292,6 10993,4 10466,8 5039,2 6656,6 3311,8 1959,6 2940,9 1573,3 5861,5 1635,4 5830,1 1626,72 2648,0 1596,2 3645,4 1656,2 13,3 1334,7 22,2 1180,5 17,9 1096,8 25,7 1172,2 15,3 1081,1 18,6 1160,9 23,1 19,7 22,2 19,9 18,9 20,2 2285,5 883,5 827,0 1085,3 644,2 1046,7 25752,4 8299,2 9559,8 10549,8 6498,4 10891,3 862,7 461,2 717,2 789,9 373,6 571,3 Drugą grupę stanowi 75 powiatów zlokalizowanych w większości w Polsce zachodniej. Powiaty z części centralnej, południowo-wschodniej i wschodniej jedynie w pojedynczych przypadkach reprezentują tą grupę. Bardzo widoczny jest podział powiatów należących do tej grupy na zachodnią i wschodnią część Polski. Powiaty te charakteryzują się dość niską liczbą zarejestrowanych podmiotów gospodarczych w rejestrze REGON, dość wysoką stopą bezrobocia i niskim udziałem pracujących na 1000 ludności. W grupie tej przeciętne wynagrodzenie brutto jest na najniższym poziomie gdzie udział pracujących w usługach nierynkowych jest jednym z wyższych. W powiatach tych wartość brutto środków trwałych w przedsiębiorstwach w przeliczeniu na jednego mieszkańca jest również dość niski. Trzecią grupę stanowi 31 powiatów znajdujących się w części centralnej kraju i południowowschodniej. Są to w większości powiaty zlokalizowane w najbliższym sąsiedztwie byłych mniejszych miast wojewódzkich. Powiaty te charakteryzują się dość wysokim udziałem pracujących na 1000 ludności, stopą bezrobocia zbliżoną do średniej krajowej gdzie udział pracujących w rolnictwie jest dość wysoki a w przemyśle i budownictwie dość niski. Czwartą grupę stanowi 48 powiatów znajdujących się głównie w części północnej Polski. Powiaty te charakteryzują się najwyższym udziałem pracujących w usługach nierynkowych, dość wysokim udziałem pracujących w usługach rynkowych, przemyśle i budownictwie i jednym z niższych w rolnictwie. Można przypuszczać, że przyczyna tego stanu tkwi w dużej atrakcyjności turystycznej regionów nadmorskich. W grupie tej stopa bezrobocia jest na najwyższym poziomie gdzie liczba pracujących na 1000 ludności jest najniższa. Jest to rejon, w którym dokonano likwidacji PGR-ów lub redukcji zatrudnienia w górnictwie (byłe województwo wałbrzyskie), co doprowadziło do wysokiego bezrobocia strukturalnego.10 Piątą grupę stanowi 105 powiatów znajdujących się w Polsce centralnej i wschodniej. Cechą charakterystyczną jest wysoki udział pracujących na 1000 ludności przy najniższym poziomie pracujących w przemyśle, budownictwie, usługach rynkowych i nierynkowych. Liczba podmiotów gospodarczych zarejestrowanych w rejestrze REGON jest tu najniższa a stopa bezrobocia jedna z niższych. Ta dość niska stopa bezrobocia wynika raczej z ukrytego bezrobocia gdzie zdecydowana większość pracujących pracuje w rolnictwie. Tereny te to obszary z dominacją rolnictwa, w których udział rolnictwa prywatnego jest w granicach 90%.11 Dochody budżetów gmin na jednego mieszkańca, wydatki budżetów gmin inwestycyjne, nakłady inwestycyjne w przedsiębiorstwach, wartość środków trwałych w przedsiębiorstwach jest w tej grupie na najniższym poziomie. Jest to rejon słabiej rozwinięty, mniej uprzemysłowiony, z gorzej rozwiniętą infrastrukturą. 10 Tokarski Tomasz, Rogut Aleksandra [2000], Zróżnicowanie struktury pracujących a odpływy z bezrobocia, „Wiadomości Statystyczne” nr 3/2000 11 Kaczorowski Paweł, Aleksandra Rogut, Tomasz Tokarski [2001], Sektorowe zmiany strukturalne gospodarki w ujęciu regionalnym, „Wiadomości Statystyczne” nr 9/2001 PODSUMOWANIE Uzyskane wyniki wydają się interesujące. Z przeprowadzonej analizy wynika, że różne czynniki w różnym stopniu wpływają na zróżnicowanie powiatów w Polsce. Zaproponowana metoda nie wyjaśnia jednak, dlaczego tak się dzieje, że sąsiadujące ze sobą powiaty są tak odmienne. Autorzy także nie podejmą się takiej interpretacji. Na podstawie przeprowadzonej analizy można by wysunąć wnioski, które mogłyby przyczynić się do zmiany polityki regionalnej, rozwojów regionów i zahamowania pogłębiającej się dysproporcji między powiatami. LITERATURA 1. Neural Network Design, M. T. Hagen, H.B. Demuth, M. Beale, PWS Publishing Company ITP 1996 2. Self-Organizing Maps, T. Kohonen, Sprinder-Verlag 1997, 3. Visual Explorations in Finance with Self-Organizing Maps, G. Deboeck, T. Kohonen, Springer-Verlag 1998 4. E. Z. Zdrojewski, Przemiany ludnościowe w województwach nadmorskich, Wiadomości Statystyczne, Listopad 1998 5. J. Runge, Struktura rynku pracy regionu tradycyjnego i jego otoczenia na przykładzie województwa katowickiego, Wydawnictwo Uniwersytetu Śląskiego, Katowice 1996, 6. T. Tokarski, A. Rogut [2000], Zróżnicowanie struktury pracujących a odpływy z bezrobocia, „Wiadomości Statystyczne” nr 3/2000 7. P. Kaczorowski, A. Rogut, T. Tokarski [2001], Sektorowe zmiany strukturalne gospodarki w ujęciu regionalnym, „Wiadomości Statystyczne” nr 9/2001 8. Nałęcz Maciej (red.), Sieci neuronowe, tom 6, Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2000