ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM
Transkrypt
ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM
ZASTOSOWANIE SIECI NEURONOWEJ TYPU SOM DO WYBORU NAJATRAKCYJNIEJSZYCH SPÓŁEK NA WGPW W OPARCIU O WSKAŹNIKI ANALIZY FUNDAMENTALNEJ Dr Kamila Migdał Najman Dr Krzysztof Najman Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański [email protected] [email protected] SOPOT 2001 Na współczesnych rynkach kapitałowych notowanych jest bardzo wiele walorów. Tak wiele, że staje się niemożliwe monitorowanie rynku jako całości. Przekracza możliwość ludzkiej percepcji śledzenie notowań setek spółek, dziesiątek funduszy inwestycyjnych i obligacji. Konieczne staje się poszukiwanie metod analitycznych, które pomogłyby zawęzić liczbę obserwowanych walorów do tych, które potencjalnie są najatrakcyjniejsze dla inwestora. Istnieje wiele takich metod i są stosowane od lat. Należą do nich analiza portfelowa, statystyczne metody klasyfikacji, takie jak metoda dyskryminacyjna, analizy wielowymiarowe czy metody taksonomiczne (np. metoda Tarczyńskiego). Metody te mają jednak pewien zbiór wad, które redukują obszar ich stosowania. Najczęściej uwzględniają wyłącznie dane ilościowe ignorując jakościowe. Są wrażliwe na występowanie wartości skrajnych, braki danych, współliniowość zmiennych czy korelacje między nimi. Sytuacje takie występują w praktyce nader często. W otoczeniu rynku pojawia się coraz więcej źródeł informacji, z których wiele zawiera w sobie powyższe wady. Przykładem takich danych są dane fundamentalne ze spółek notowanych na WGPW. Zawierają one bardzo wiele informacji o kondycji firm i potencjalnych możliwościach ich rozwoju. Jednak są one ze swojej natury publikowane rzadko – kwartalnie, półrocznie lub rocznie. Uniemożliwia to potraktowanie ich jak szeregów czasowych. Z drugiej strony dane te są często niepełne, co powoduje przy kompleksowej analizie rynku pojawianie się dużej liczby braków danych. Jednym z proponowanych rozwiązań może być zastosowanie sieci neuronowych. Z założenia są one odporne na wszystkie powyższe niedogodności. Badanie tu prezentowane jest próbą przedstawienia możliwości sieci neuronowej typu SOM (Self Organizing Map, Mapa Samoorganizująca) w klasyfikacji i wyborze najatrakcyjniejszych spółek na WGPW przy wykorzystaniu danych fundamentalnych. Przy czym atrakcyjność spółki jest tu rozumiana jako potencjalna możliwość korzystnej zmiany kursu ( zwyżki ceny rynkowej ) w średnioterminowym ( nieprzekraczającym 12 miesięcy ze względu na częstotliwość pojawiania się większości danych fundamentalnych) horyzoncie czasowym. METODA BADAWCZA Mapa Samoorganizująca (SOM), rozwinięta przez fińskiego profesora Teuvo Kohonena, jest jednym z najbardziej zaawansowanych modeli sieci neuronowych. Oparta jest na nie nadzorowanym uczeniu, co oznacza, że nie jest potrzebna żadna interwencja podczas jej uczenia. Dostarcza topologicznego odwzorowania z przestrzeni wielowymiarowej na dwuwymiarową mapę jednostek. Mapa jednostek (neuronów) zazwyczaj uformowana jest jako dwuwymiarowa siatka i dlatego jest odwzorowaniem z przestrzeni wielowymiarowej na płaszczyznę. Może być zastosowana w tym samym czasie do wizualizacji skupisk w zbiorze danych i do wizualizacji zbioru wielowymiarowych danych na płaszczyźnie. Następuje zachowanie nieliniowych relacji między jednostkami i lokowanie bliskich sobie jednostek bliżej siebie na mapie. Poza tym, jeżeli nawet nie istnieją wyraźne skupiska w zbiorze danych, metoda odwzorowania samoorganizującej mapy ujawnia „pasma gór” i „wąwozów”. Pierwsze są często strefą nieregularnie ukształtowaną z wysoką tendencją do tworzenia skupisk, podczas gdy drugie rozdzielają zbiór danych na obszary, które mają odmienne właściwości. Głównym powodem stosowania SOM w analizie danych jest to, że: jest metodą nieparametryczną, nie wymaga a priori żadnych założeń, co do rozkładów analizowanych zmiennych. Jest metodą, która wykrywa niespodziewane układy, struktury czy wzorce podczas uczenia bez subiektywnego wpływu analityka. Do opisu kondycji spółek na WGPW wybrano 84 wskaźniki analizy fundamentalnej (zestawienie 1) , z podziałem na 9 bloków. Były to: wskaźniki wielkości firmy, zyskowności, sprawności działania, zadłużenia, płynności finansowej firmy, obrotu akcjami, wyceny spółki akcyjnej, wzrostu i wskaźniki rynkowe (branżowe). Zbiór danych objął prawie wszystkie największe spółki (112 spółek z zestawienia 2) z byłego rynku podstawowego notowane na WGPW przynajmniej od III kwartału 1999. Zbiór wskaźników został wygenerowany na podstawie informacji fundamentalnych z IV kwartału 2000. Na podstawie tych wskaźników została zbudowana kwadratowa sieć SOM, której rozmiar podlegał optymalizacji w zakresie od 5x5 do 20x20 neuronów. Kryterium wyboru (błąd całkowity) była funkcja czterech miar jakości sieci: a) błąd kwantyzacji (poziom specjalizacji neuronów), b) błąd topologiczny (jakość „rozciągnięcia” mapy na obiekty wejściowe), c) błąd dystorsji (zagęszczenie obiektów przy pojedynczych neuronach) i d) liczba martwych neuronów (stosunek liczby neuronów aktywnych do nieaktywnych). Błąd całkowity oszacowano jako : BC= 0,4a + 0,4b + 0,1c + 0,1d. Na podstawie optymalnej (w sensie błędu całkowitego) sieci metodą k-średnich dokonano podziału spółek na względnie jednorodne zespoły. Spółki, które weszły do zbioru o największej aktywacji neuronów podlegały dalszej analizie (rachunek zysków i strat z inwestycji w taki portfel). WYNIKI BADAŃ Przeprowadzone eksperymenty wykazały, że sieci SOM miały silne tendencje do wykrywania spółek o najlepszych lub najgorszych wskaźnikach. Nie sprawdziły się w klasyfikacji, sieci o dużych wymiarach bardzo intensywnie uczone. Oddalały daleko od siebie badane spółki. Prezentowały one sieci o dużej liczbie skupisk, których w dalszej analizie nie udawało się rozróżnić. Z kolei sieci o małym wymiarze wykazywały wyższe błędy kwantyzacji bez znaczącego pogorszenia innych typów błędów. Optymalną siecią w sensie błędu całkowitego okazała się sieć kwadratowa o wymiarach 9 x 9 z funkcją sąsiedztwa bubble. (Wykres 1.) Dla tej sieci wykonanych zostało 1000 iteracji uczących. Miary jakości optymalnej sieci wyniosły: błąd kwantyzacji = 3.5922, błąd topologiczny = 0.1518, błąd dystorsji = 24.0581 i 31 martwych neuronów. Sieć była uczona krótko, tak aby nie utraciła „intuicji” na rzecz „wyuczonych szczegółów”. Metodą k-średnich wyodrębnionych zostało 9 jednolitych skupisk. (Wykres 2.) Do zespołu o największej aktywacji neuronów weszło 17 następujących spółek: Bank Amerykański AMERBANK, Bank Handlowy, BIG Bank Gdański, Nordea Bank Polski, Bank Ochrony Środowiska, Bank Przemysłowo-Handlowy, BRE Bank, Bank Śląski, Deutsche Bank 24, Fortis Bank, Kredyt Bank, LG Petro Bank, Powszechny Bank Kredytowy, Bank Polska Kasa Opieki, Towarzystwo Ubezpieczeń i Reasekuracji WARTA, Wielkopolski Bank Kredytowy, Browary Żywiec. Spółki, które znalazły się w zespole o najwyższej aktywacji, poddane zostały dalszej analizie. Notowania tych spółek z 02.01.2001 porównane zostały z ich notowaniami z 23.08.2001 . Badany okres to czas długiej bessy. Średni spadek analizowanego portfela w badanym okresie wyniósł 9,85% gdy WIG w badanym okresie spadł aż o 29,41%. Tak więc, opierając się na wynikach uzyskanych przez sieć SOM udało się zminimalizować straty z portfela i wygrać z rynkiem aż o 66.5% ! Niestety nie udało się jeszcze zweryfikować tej sieci przy podobnej hossie. PODSUMOWANIE Wynik uzyskany przez prezentowaną sieć jest zachęcający i wskazuje na dobrą efektywność metod neuronowych w analizie danych fundamentalnych. Efektywność rozumianą dwojako. Po pierwsze jako zdolność do poradzenia sobie z „trudnymi” danymi. Nie wystąpiły bowiem żadne problemy statystyczne ani numeryczne w przeprowadzonej analizie mimo licznych braków danych, wysokiej korelacji wielu wskaźników dla całych segmentów rynku a także duże dysproporcje w poziomie typowych wartości wskaźników. Prezentowana sieć nie wymagała także zastosowania komputerów wielkiej mocy i nawet na PC czas jej uczenia nie przekraczał kilku godzin. Po drugie dokonana dzięki sieci klasyfikacja okazała się wysoce skuteczna. Wytypowane spółki rzeczywiście charakteryzowały się potencjałem wzrostowym. Przy czym analityk nie był zmuszony do zdefiniowania a priori pojęcia „potencjału wzrostowego” co jest zadaniem trudnym i kontrowersyjnym a w większości innych metod analitycznych konieczne. Jesteśmy przekonani, że prezentowana tu metoda może być z powodzeniem stosowana w analizie rynków kapitałowych. Literatura: T. Kohonen, „Self-Organizing Maps” 2nd ed. ,Springer-Verlag 1997 G. Deboeck,T. Kohonen, “Visual Explrations in Finance with SOM”,Springer-Verlag,1998 C.M.Bishop, “Neural Networks for Pattern Recognition”,Oxford Univ.Press,1999. Wykres 1. Macierz U (macierz ujednoliconych odległości). U-matrix 47 70 5 22 69 37 90 30 31 32 53 97 26 42 45 48 62 77 87 19 35 111 49 57 63 67 102 91 28 75 93 55 82 101 65 27 99 23 43 108 4 16 18 86 110 100 8 92 34 68 83 89 50 80 25 52 39 64 85 10 78 107 38 71 24 103 7 SPÓŁKI NOTOWANE NA WGPW 2000/2001 14 15 17 112 46 81 40 2 88 72 15 79 106 36 66 94 20 9 1 51 73 59 13 95 98 105 109 58 33 6 25 44 60 61 74 3 11 12 20 41 56 21 54 76 84 96 29 104 10 5 Wykres 2. Klasyfikacja spółek na bazie optymalnej sieci. LICZBA SKUPISK = 9 70 47 5 22 69 37 90 30 31 32 53 97 26 42 45 48 62 77 87 19 35 111 49 57 63 67 102 91 28 75 93 55 82 101 65 23 43 108 4 16 18 86 110 100 8 92 27 99 85 38 71 2 88 24 103 7 Najlepsza klasyfikacja na bazie optymalnej sieci 72 3 11 12 20 41 56 6 5 79 14 15 17 112 46 81 40 9 1 51 73 106 36 66 94 8 7 10 78 107 13 95 98 39 64 59 50 80 25 52 105 109 58 33 6 34 68 83 89 9 44 60 61 74 21 54 76 84 96 4 3 29 104 2 1 Zestawienie 1 Wskaźniki analizy fundamentalnej wykorzystane przy uczeniu sieci. 1. Kurs bieżący 2. Kurs maksymalny 3. Kurs minimalny 4. Wartość rynkowa firmy (MV) 5. Wartość księgowa (BV) 6. Zysk netto 7. Cashflow (CF) 8. EBIT 9. Zysk operacyjny 10. Przychody 11. Kapitał obrotowy 12. Majątek płynny 13. Majątek płynny netto 14. Udział majątku płynnego netto w wartości rynkowej firmy 15. Udział majątku płynnego w wartości rynkowej firmy 16. Stopa zysku od kapitału własnego (ROE) 17. Wskaźnik CF /kapitał własny 18. Stopa zyskowności aktywów (ROA) 19. Rentowność sprzedaży netto (marża zysku netto) 20. Wskaźnik rentowności brutto 21. Wskaźnik rentowności operacyjnej 22. Stopa zysku operacyjnego (OPE) 23. Rentowność (netto) nakładów 24. Rentowność (brutto) nakładów 25. Obracalność aktywów 26. Rotacja majątku obrotowego 27. Rotacja kapitału obrotowego 28. Wskaźnik rotacji środków trwałych 29. Wskaźnik operacyjności 30. Wskaźnik obrotu zapasami w dniach 31. Wskaźnik obrotu należnościami w dniach 32. Okres płacenia zobowiązań w dniach 33. Cykl środków pieniężnych 34. Dźwignia finansowa 35. Wskaźnik ogólnego zadłużenia 36. Wskaźnik zadłużenia kapitału własnego 37. Wskaźnik zadłużenia długoterminowego 38. Wskaźnik pokrycia zobowiązań odsetkowych 39. Pokrycie zobowiązań nadwyżką 40. Wskaźniki płynności bieżącej 41. Wskaźnik podwyższonej płynności 42. Wskaźnik płynności szybki 43. Liczba akcji spółki 44. Płynność akcji 45. Wartość akcji dop. do obrotu 46. Proc. akcji dopuszczonych do obrotu 47. Proc. akcji u inwest. instytucjonalnych 48. Wartość akcji bez dużych pakietów 49. Zwrot z akcji za ostatni rok 50. Średni zwrot z akcji 51. Beta 52. Ryzyko 53. Cashflow na jedną akcję 54. Cena/cashflow z jednej akcji 55. Zysk netto na akcję 56. Wskaźnik cena/zysk z jednej akcji 57. Wartość księgowa na jedną akcję 58. Wskaźnik cena do wartości księgowej przypadającej na jedną akcję 59. Wskaźnik dywidendy na akcję 60. Udział dywidendy w wartości rynkowej firmy 61. Wskaźnik zatrzymania 62. Wskaźnik wypłacania 63. Wskaźnik kapitalizacji 64. stopa wzrostu (stopa reinwestycji) 65. Stopa wzrostu zysku netto 66. Średnia stopa wzrostu zysku netto z ostatnich trzech lat 67. Stopa wzrotu zysku netto na akcję 68. Średnia stopa wzrotu zysku netto na akcję z ostatnich trzech lat 69. Stopa wzrostu zysku operacyjnego 70. Średnia stopa wzrostu zysku operacyjnego z ostatnich trzech lat 71. Stopa wzrostu przychodów 72. Średnia stopa wzrostu przychodów z ostatnich trzech lat 73. P/E względem rynku (branży) 74. P/BV względem rynku (branży) 75. ROE względem rynku (branży) 76. ROA względem rynku (branży) 77. Rentowność sprzedaży względem rynku (branży) 78. Wskaźnik rentowności operacyjnej względem rynku (branży) 79. Obracalność aktywów względem rynku (branży) 80. Wskaźnik operacyjności względem rynku (branży) 81. Zysk netto na akcję 82. Zysk netto na akcję [nast. rok] 83. Proc. zmiana progn. EPS 84. Proc. zmiana progn. EPS [nast. rok] Zestawienie 2 Nazwy spółek uwzględnionych w analizie i odpowiadające im numery na wykresach 1 i 2 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. AGORA AGROS AMERBANK AMICA AMS ANIMEX ATLANTIS BUDIMEX BELCHATW HANDLOWY BIG NORDEABP BOS BPH BRE BORYSZEW BSK BEST BYTOM DB24 COMARCH COMPLAND CERSANIT CENTROZP DEBICA DROSED ECHO ELBUDOWA ELEKTRIM KABLEHOD ELMONTWR ELEKTROX ELZAB ENERGOPD ESPEBEPE EXBUD FARMACOL FERRUM 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. SWIECIE FORTESA FORTISPL GPRD GRAJEWO HYDROGD HUTMEN HOWELL INDYKPOL IMPEXMET IRENA IZOLACJA JELFA JUTRZENA KABLE KGHM KPBPBIK KREDYTB KROSNO KETY LGPETRO LENTEX MENNICA MORLINY MOSTALGD MOSTALPC MOSTALSL MOSTALWR MOSTALEP MOSTALZB MITEX NOVITA OBORNIKI OCEAN OKOCIM OLAWA OPTIMUS ORBIS 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. ORFE PBK PEKAO POLFKUTO PAGED PGF PEKPOL PROKOM POLIFARC POLAR PEPEES PROCHNIK PROCHEM PROSPER RAFAKO RELPOL REMAK ROLIMPEX ROPCZYCE SOFTBANK SOKOLOW SANOK STOMIL STALPROD STALEXP SWARZEDZ TONSIL TPSA VISTULA WARTA BZWBK WILBO WOLCZANA WAWEL ZEW ZYWIEC