ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM

Transkrypt

ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM
ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM
DO WYBORU NAJATRAKCYJNIEJSZYCH SPÓŁEK NA WGPW
W OPARCIU O WSKAŹNIKI ANALIZY FUNDAMENTALNEJ
Dr Kamila Migdał Najman
Dr Krzysztof Najman
Katedra Statystyki
Wydział Zarządzania
Uniwersytet Gdański
[email protected]
[email protected]
SOPOT 2001
Na współczesnych rynkach kapitałowych notowanych jest bardzo wiele walorów. Tak
wiele, że staje się niemożliwe monitorowanie rynku jako całości. Przekracza możliwość
ludzkiej percepcji śledzenie notowań setek spółek, dziesiątek funduszy inwestycyjnych
i obligacji. Konieczne staje się poszukiwanie metod analitycznych, które pomogłyby zawęzić
liczbę obserwowanych walorów do tych, które potencjalnie są najatrakcyjniejsze dla
inwestora. Istnieje wiele takich metod i są stosowane od lat. Należą do nich analiza
portfelowa, statystyczne metody klasyfikacji, takie jak metoda dyskryminacyjna, analizy
wielowymiarowe czy metody taksonomiczne (np. metoda Tarczyńskiego). Metody te mają
jednak pewien zbiór wad, które redukują obszar ich stosowania. Najczęściej uwzględniają
wyłącznie dane ilościowe ignorując jakościowe. Są wrażliwe na występowanie wartości
skrajnych, braki danych, współliniowość zmiennych czy korelacje między nimi. Sytuacje
takie występują w praktyce nader często. W otoczeniu rynku pojawia się coraz więcej źródeł
informacji, z których wiele zawiera w sobie powyższe wady. Przykładem takich danych są
dane fundamentalne ze spółek notowanych na WGPW. Zawierają one bardzo wiele
informacji o kondycji firm i potencjalnych możliwościach ich rozwoju. Jednak są one ze
swojej natury publikowane rzadko – kwartalnie, półrocznie lub rocznie. Uniemożliwia to
potraktowanie ich jak szeregów czasowych. Z drugiej strony dane te są często niepełne, co
powoduje przy kompleksowej analizie rynku pojawianie się dużej liczby braków danych.
Jednym z proponowanych rozwiązań może być zastosowanie sieci neuronowych. Z
założenia są one odporne na wszystkie powyższe niedogodności. Badanie tu prezentowane
jest próbą przedstawienia możliwości sieci neuronowej typu SOM (Self Organizing Map,
Mapa Samoorganizująca) w klasyfikacji i wyborze najatrakcyjniejszych spółek na WGPW
przy wykorzystaniu danych fundamentalnych. Przy czym atrakcyjność spółki jest tu
rozumiana jako potencjalna możliwość korzystnej zmiany kursu ( zwyżki ceny rynkowej ) w
średnioterminowym ( nieprzekraczającym 12 miesięcy ze względu na częstotliwość
pojawiania się większości danych fundamentalnych) horyzoncie czasowym.
METODA BADAWCZA
Mapa Samoorganizująca (SOM), rozwinięta przez fińskiego profesora Teuvo
Kohonena, jest jednym z najbardziej zaawansowanych modeli sieci neuronowych. Oparta jest
na nie nadzorowanym uczeniu, co oznacza, że nie jest potrzebna żadna interwencja podczas
jej uczenia. Dostarcza topologicznego odwzorowania z przestrzeni wielowymiarowej na
dwuwymiarową mapę jednostek. Mapa jednostek (neuronów) zazwyczaj uformowana jest
jako dwuwymiarowa siatka i dlatego jest odwzorowaniem z przestrzeni wielowymiarowej na
płaszczyznę. Może być zastosowana w tym samym czasie do wizualizacji skupisk w zbiorze
danych i do wizualizacji zbioru wielowymiarowych danych na płaszczyźnie. Następuje
zachowanie nieliniowych relacji między jednostkami i lokowanie bliskich sobie jednostek
bliżej siebie na mapie. Poza tym, jeżeli nawet nie istnieją wyraźne skupiska w zbiorze danych,
metoda odwzorowania samoorganizującej mapy ujawnia „pasma gór” i „wąwozów”.
Pierwsze są często strefą nieregularnie ukształtowaną z wysoką tendencją do tworzenia
skupisk, podczas gdy drugie rozdzielają zbiór danych na obszary, które mają odmienne
właściwości. Głównym powodem stosowania SOM w analizie danych jest to, że: jest metodą
nieparametryczną, nie wymaga a priori żadnych założeń, co do rozkładów analizowanych
zmiennych. Jest metodą, która wykrywa niespodziewane układy, struktury czy wzorce
podczas uczenia bez subiektywnego wpływu analityka.
Do opisu kondycji spółek na WGPW wybrano 84 wskaźniki analizy fundamentalnej
(zestawienie 1) , z podziałem na 9 bloków. Były to: wskaźniki wielkości firmy, zyskowności,
sprawności działania, zadłużenia, płynności finansowej firmy, obrotu akcjami, wyceny spółki
akcyjnej, wzrostu i wskaźniki rynkowe (branżowe). Zbiór danych objął prawie wszystkie
największe spółki (112 spółek z zestawienia 2) z byłego rynku podstawowego notowane na
WGPW przynajmniej od III kwartału 1999. Zbiór wskaźników został wygenerowany na
podstawie informacji fundamentalnych z IV kwartału 2000. Na podstawie tych wskaźników
została zbudowana kwadratowa sieć SOM, której rozmiar podlegał optymalizacji w zakresie
od 5x5 do 20x20 neuronów. Kryterium wyboru (błąd całkowity) była funkcja czterech miar
jakości sieci: a) błąd kwantyzacji (poziom specjalizacji neuronów), b) błąd topologiczny
(jakość „rozciągnięcia” mapy na obiekty wejściowe), c) błąd dystorsji (zagęszczenie obiektów
przy pojedynczych neuronach) i d) liczba martwych neuronów (stosunek liczby neuronów
aktywnych do nieaktywnych). Błąd całkowity oszacowano jako : BC= 0,4a + 0,4b + 0,1c +
0,1d. Na podstawie optymalnej (w sensie błędu całkowitego) sieci metodą k-średnich
dokonano podziału spółek na względnie jednorodne zespoły. Spółki, które weszły do zbioru o
największej aktywacji neuronów podlegały dalszej analizie (rachunek zysków i strat z
inwestycji w taki portfel).
WYNIKI BADAŃ
Przeprowadzone eksperymenty wykazały, że sieci SOM miały silne tendencje do
wykrywania spółek o najlepszych lub najgorszych wskaźnikach. Nie sprawdziły się w
klasyfikacji, sieci o dużych wymiarach bardzo intensywnie uczone. Oddalały daleko od siebie
badane spółki. Prezentowały one sieci o dużej liczbie skupisk, których w dalszej analizie nie
udawało się rozróżnić. Z kolei sieci o małym wymiarze wykazywały wyższe błędy
kwantyzacji bez znaczącego pogorszenia innych typów błędów. Optymalną siecią w sensie
błędu całkowitego okazała się sieć kwadratowa o wymiarach 9 x 9 z funkcją sąsiedztwa
bubble. (Wykres 1.) Dla tej sieci wykonanych zostało 1000 iteracji uczących. Miary jakości
optymalnej sieci wyniosły: błąd kwantyzacji = 3.5922, błąd topologiczny = 0.1518, błąd
dystorsji = 24.0581 i 31 martwych neuronów. Sieć była uczona krótko, tak aby nie utraciła
„intuicji” na rzecz „wyuczonych szczegółów”. Metodą k-średnich wyodrębnionych zostało 9
jednolitych skupisk. (Wykres 2.) Do zespołu o największej aktywacji neuronów weszło 17
następujących spółek: Bank Amerykański AMERBANK, Bank Handlowy, BIG Bank
Gdański, Nordea Bank Polski, Bank Ochrony Środowiska, Bank Przemysłowo-Handlowy,
BRE Bank, Bank Śląski, Deutsche Bank 24, Fortis Bank, Kredyt Bank, LG Petro Bank,
Powszechny Bank Kredytowy, Bank Polska Kasa Opieki, Towarzystwo Ubezpieczeń
i Reasekuracji WARTA, Wielkopolski Bank Kredytowy, Browary Żywiec. Spółki, które
znalazły się w zespole o najwyższej aktywacji, poddane zostały dalszej analizie. Notowania
tych spółek z 02.01.2001 porównane zostały z ich notowaniami z 23.08.2001 . Badany okres
to czas długiej bessy. Średni spadek analizowanego portfela w badanym okresie wyniósł
9,85% gdy WIG w badanym okresie spadł aż o 29,41%. Tak więc, opierając się na wynikach
uzyskanych przez sieć SOM udało się zminimalizować straty z portfela i wygrać z rynkiem aż
o 66.5% ! Niestety nie udało się jeszcze zweryfikować tej sieci przy podobnej hossie.
PODSUMOWANIE
Wynik uzyskany przez prezentowaną sieć jest zachęcający i wskazuje na dobrą
efektywność metod neuronowych w analizie danych fundamentalnych. Efektywność
rozumianą dwojako. Po pierwsze jako zdolność do poradzenia sobie z „trudnymi” danymi.
Nie wystąpiły bowiem żadne problemy statystyczne ani numeryczne w przeprowadzonej
analizie mimo licznych braków danych, wysokiej korelacji wielu wskaźników dla całych
segmentów rynku a także duże dysproporcje w poziomie typowych wartości wskaźników.
Prezentowana sieć nie wymagała także zastosowania komputerów wielkiej mocy i nawet na
PC czas jej uczenia nie przekraczał kilku godzin. Po drugie dokonana dzięki sieci klasyfikacja
okazała się wysoce skuteczna. Wytypowane spółki rzeczywiście charakteryzowały się
potencjałem wzrostowym. Przy czym analityk nie był zmuszony do zdefiniowania a priori
pojęcia „potencjału wzrostowego” co jest zadaniem trudnym i kontrowersyjnym a w
większości innych metod analitycznych konieczne. Jesteśmy przekonani, że prezentowana tu
metoda może być z powodzeniem stosowana w analizie rynków kapitałowych.
Literatura:
T. Kohonen, „Self-Organizing Maps” 2nd ed. ,Springer-Verlag 1997
G. Deboeck,T. Kohonen, “Visual Explrations in Finance with SOM”,Springer-Verlag,1998
C.M.Bishop, “Neural Networks for Pattern Recognition”,Oxford Univ.Press,1999.
Wykres 1.
Macierz U (macierz ujednoliconych odległości).
U-matrix
47
70
5
22
69
37
90
30
31
32
53
97
26
42
45
48
62
77
87
19
35
111
49
57
63
67
102
91
28
75
93
55
82
101
65
27
99
23
43
108
4
16
18
86
110
100
8
92
34
68
83
89
50
80
25
52
39
64
85
10
78
107
38
71
24
103
7
SPÓŁKI NOTOWANE NA WGPW 2000/2001
14
15
17
112
46
81
40
2
88
72
15
79
106
36
66
94
20
9
1
51
73
59
13
95
98
105
109
58
33
6
25
44
60
61
74
3
11
12
20
41
56
21
54
76
84
96
29
104
10
5
Wykres 2.
Klasyfikacja spółek na bazie optymalnej sieci.
LICZBA SKUPISK = 9
70
47
5
22
69
37
90
30
31
32
53
97
26
42
45
48
62
77
87
19
35
111
49
57
63
67
102
91
28
75
93
55
82
101
65
23
43
108
4
16
18
86
110
100
8
92
27
99
85
38
71
2
88
24
103
7
Najlepsza klasyfikacja na bazie optymalnej sieci
72
3
11
12
20
41
56
6
5
79
14
15
17
112
46
81
40
9
1
51
73
106
36
66
94
8
7
10
78
107
13
95
98
39
64
59
50
80
25
52
105
109
58
33
6
34
68
83
89
9
44
60
61
74
21
54
76
84
96
4
3
29
104
2
1
Zestawienie 1
Wskaźniki analizy fundamentalnej wykorzystane przy uczeniu sieci.
1. Kurs bieżący
2. Kurs maksymalny
3. Kurs minimalny
4. Wartość rynkowa firmy (MV)
5. Wartość księgowa (BV)
6. Zysk netto
7. Cashflow (CF)
8. EBIT
9. Zysk operacyjny
10. Przychody
11. Kapitał obrotowy
12. Majątek płynny
13. Majątek płynny netto
14. Udział majątku płynnego netto w
wartości rynkowej firmy
15. Udział majątku płynnego w wartości
rynkowej firmy
16. Stopa zysku od kapitału własnego
(ROE)
17. Wskaźnik CF /kapitał własny
18. Stopa zyskowności aktywów (ROA)
19. Rentowność sprzedaży netto (marża
zysku netto)
20. Wskaźnik rentowności brutto
21. Wskaźnik rentowności operacyjnej
22. Stopa zysku operacyjnego (OPE)
23. Rentowność (netto) nakładów
24. Rentowność (brutto) nakładów
25. Obracalność aktywów
26. Rotacja majątku obrotowego
27. Rotacja kapitału obrotowego
28. Wskaźnik rotacji środków trwałych
29. Wskaźnik operacyjności
30. Wskaźnik obrotu zapasami w dniach
31. Wskaźnik obrotu należnościami w
dniach
32. Okres płacenia zobowiązań w dniach
33. Cykl środków pieniężnych
34. Dźwignia finansowa
35. Wskaźnik ogólnego zadłużenia
36. Wskaźnik zadłużenia kapitału
własnego
37. Wskaźnik zadłużenia
długoterminowego
38. Wskaźnik pokrycia zobowiązań
odsetkowych
39. Pokrycie zobowiązań nadwyżką
40. Wskaźniki płynności bieżącej
41. Wskaźnik podwyższonej płynności
42. Wskaźnik płynności szybki
43. Liczba akcji spółki
44. Płynność akcji
45. Wartość akcji dop. do obrotu
46. Proc. akcji dopuszczonych do obrotu
47. Proc. akcji u inwest.
instytucjonalnych
48. Wartość akcji bez dużych pakietów
49. Zwrot z akcji za ostatni rok
50. Średni zwrot z akcji
51. Beta
52. Ryzyko
53. Cashflow na jedną akcję
54. Cena/cashflow z jednej akcji
55. Zysk netto na akcję
56. Wskaźnik cena/zysk z jednej akcji
57. Wartość księgowa na jedną akcję
58. Wskaźnik cena do wartości
księgowej przypadającej na jedną
akcję
59. Wskaźnik dywidendy na akcję
60. Udział dywidendy w wartości
rynkowej firmy
61. Wskaźnik zatrzymania
62. Wskaźnik wypłacania
63. Wskaźnik kapitalizacji
64. stopa wzrostu (stopa reinwestycji)
65. Stopa wzrostu zysku netto
66. Średnia stopa wzrostu zysku netto z
ostatnich trzech lat
67. Stopa wzrotu zysku netto na akcję
68. Średnia stopa wzrotu zysku netto na
akcję z ostatnich trzech lat
69. Stopa wzrostu zysku operacyjnego
70. Średnia stopa wzrostu zysku
operacyjnego z ostatnich trzech lat
71. Stopa wzrostu przychodów
72. Średnia stopa wzrostu przychodów z
ostatnich trzech lat
73. P/E względem rynku (branży)
74. P/BV względem rynku (branży)
75. ROE względem rynku (branży)
76. ROA względem rynku (branży)
77. Rentowność sprzedaży względem
rynku (branży)
78. Wskaźnik rentowności operacyjnej
względem rynku (branży)
79. Obracalność aktywów względem
rynku (branży)
80. Wskaźnik operacyjności względem
rynku (branży)
81. Zysk netto na akcję
82. Zysk netto na akcję [nast. rok]
83. Proc. zmiana progn. EPS
84. Proc. zmiana progn. EPS [nast. rok]
Zestawienie 2
Nazwy spółek uwzględnionych w analizie i odpowiadające im numery na wykresach 1 i 2
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
AGORA
AGROS
AMERBANK
AMICA
AMS
ANIMEX
ATLANTIS
BUDIMEX
BELCHATW
HANDLOWY
BIG
NORDEABP
BOS
BPH
BRE
BORYSZEW
BSK
BEST
BYTOM
DB24
COMARCH
COMPLAND
CERSANIT
CENTROZP
DEBICA
DROSED
ECHO
ELBUDOWA
ELEKTRIM
KABLEHOD
ELMONTWR
ELEKTROX
ELZAB
ENERGOPD
ESPEBEPE
EXBUD
FARMACOL
FERRUM
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
SWIECIE
FORTESA
FORTISPL
GPRD
GRAJEWO
HYDROGD
HUTMEN
HOWELL
INDYKPOL
IMPEXMET
IRENA
IZOLACJA
JELFA
JUTRZENA
KABLE
KGHM
KPBPBIK
KREDYTB
KROSNO
KETY
LGPETRO
LENTEX
MENNICA
MORLINY
MOSTALGD
MOSTALPC
MOSTALSL
MOSTALWR
MOSTALEP
MOSTALZB
MITEX
NOVITA
OBORNIKI
OCEAN
OKOCIM
OLAWA
OPTIMUS
ORBIS
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
ORFE
PBK
PEKAO
POLFKUTO
PAGED
PGF
PEKPOL
PROKOM
POLIFARC
POLAR
PEPEES
PROCHNIK
PROCHEM
PROSPER
RAFAKO
RELPOL
REMAK
ROLIMPEX
ROPCZYCE
SOFTBANK
SOKOLOW
SANOK
STOMIL
STALPROD
STALEXP
SWARZEDZ
TONSIL
TPSA
VISTULA
WARTA
BZWBK
WILBO
WOLCZANA
WAWEL
ZEW
ZYWIEC

Podobne dokumenty