Sieci neuronowe w zagadnieniach klasyfikacji stanu ostrzy narz´dzi
Transkrypt
Sieci neuronowe w zagadnieniach klasyfikacji stanu ostrzy narz´dzi
Sieci neuronowe w zagadnieniach klasyfikacji stanu ostrzy narz´dzi urabiajàcych Neural networks in excavating tools’ blades condition classification JAKUB GAJEWSKI KAMIL JONAK Streszczenie: W artykule zaprezentowano wyniki klasyfikacji stanu ostrzy narz´dzi pracujàcych zespo∏owo na g∏owicy urabiajàcej. Jako narz´dzie do oceny zastosowano sztuczne sieci neuronowe. Badania realizowano dla sieci o radialnych funkcjach bazowych, perceptronu wielowarstwowego oraz sieci rozmytych. Porównano skutecznoÊç klasyfikacji stanu no˝y dla poszczególnych modeli neuronowych. S∏owa kluczowe: sztuczna sieç neuronowa, proces urabiania, g∏owica wielonarz´dziowa Abstract: The paper presents the results of excavating tools’ blades for machines’ combined work on a cutting head classification. Artificial neural networks were used as a rating tool. The research was carried out for basic radial functions networks, multilayer perceptrons and fuzzy networks. The effectiveness of blades condition for particular neural models was compared. Keywords: artificial neural network, rock mining process, multi-tool head Stan ostrzy narz´dzi zamontowanych na g∏owicy wielonarz´dziowej oraz ich geometria majà istotne znaczenie dla energoch∏onnoÊci procesu urabiania. Opisane w publikacji badania majà na celu ustalenie przydatnoÊci wybranych sieci neuronowych do oceny stanu narz´dzi g∏owicy wielonarz´dziowej. Jako zmienne wejÊciowe do sieci zastosowano parametry statystyczne sygna∏ów momentu oporów urabiania. Zmiennymi wyjÊciowymi sieci neuronowych by∏y stany ostrzy no˝y urabiajàcych: narz´dzia technicznie ostre oraz narz´dzia zu˝yte. Badania numeryczne wykonano, pos∏ugujàc si´ pakietami Statistica oraz Matlab. Sieci neuronowe Sieci neuronowe sà to modele matematyczne naÊladujàce biologiczne sieci ˝ywych organizmów. Sk∏adajà si´ one z elementów przetwarzajàcych zwanych neuronami, w których wyjÊcia neuronów po∏àczone sà za pomocà wag z wejÊciami wszystkich neuronów w danej sieci, gdzie wagi sà liczbami rzeczywistymi. Dzi´ki obliczeniom przeprowadzanym przez neurony poszczególnych warstw sieci mo˝na uzyskaç rozwiàzanie zadanego problemu. Odpowiednie wyniki uzyskuje si´ przez wykorzystanie procesów uczenia sieci polegajàcych na zmianie Dr in˝. Jakub Gajewski – Katedra Podstaw Konstrukcji Maszyn, Politechnika Lubelska, ul. Nadbystrzycka 36, 20-618 Lublin, e-mail: [email protected]; in˝. Kamil Jonak – Instytut Technologicznych Systemów Informacyjnych, Politechnika Lubelska, ul. Nadbystrzycka 36, 20-618 Lublin. ROK WYD. LXXIII 앫 ZESZYT 3/2014 wag tych neuronów, które odpowiadajà za b∏àd. Sztuczne sieci neuronowe znajdujà szerokie zastosowanie w technice, w tym w zagadnieniach oceny stanu ostrzy narz´dzi skrawajàcych [1 – 2]. Dzia∏anie poszczególnych neuronów mo˝na zapisaç wg wzoru: n y = f ( ∑wi · xi ) i =1 gdzie: x1, ..., xn – sygna∏y wejÊciowe neuronu; w1, ..., wn – wagi; y – sygna∏ wyjÊciowy. Wyró˝nia si´ nast´pujàce typy sieci neuronowych: jednokierunkowe (dzielàce si´ w swoim obr´bie na jedno- lub wielowarstwowe) oraz rekurencyjne. Sieci jednokierunkowe cechujà si´ budowà jedno- lub wielowarstwowà, dzi´ki czemu przep∏yw sygna∏u w sieci przebiega zawsze w okreÊlonym kierunku: od warstwy wejÊcia do warstwy wyjÊcia. Warstwy znajdujàce si´ pomi´dzy warstwami wejÊciowymi a wyjÊciowymi nazywane sà warstwami ukrytymi (rys. 1). Sieci rekurencyjne cechujà si´ wyst´powaniem sprz´˝eƒ zwrotnych pomi´dzy wejÊciem a wyjÊciem oraz dwukierunkowym przesy∏aniem informacji. Kolejnà cechà wyró˝niajàcà sieci rekurencyjne, którà sieç nabywa po zamkni´ciu p´tli sprz´˝enia zwrotnego, jest wyst´powanie dynamiki na ka˝dym etapie pracy. Jednà z najcz´Êciej stosowanych w praktyce sieci jest jednokierunkowa sieç neuronowa typu RBF (Radial Basis Functions). Cechuje si´ ona budowà 21 Rys. 1. Schemat sieci neuronowej jednokierunkowej z∏o˝onà zawsze z dwóch warstw neuronów: radialnych oraz wyjÊciowych. Funkcjonowanie sieci radialnej oparte jest na interpolacji wielowymiarowej, zadaniem której jest odwzorowanie wektorów wejÊciowych w zbiór liczb rzeczywistych na wyjÊciu. Z tych powodów sieç RBF wykorzystuje o wiele wi´kszà liczb´ neuronów ni˝ sieci neuronowe jednokierunkowe cechujàce si´ sigmoidalnà funkcjà aktywacji. Pomimo wykorzystywania wi´kszej liczby neuronów sieci RBF mogà uczyç si´ o wiele szybciej ni˝ sieci perceptronowe. Zaletà RBF jest równie˝ aproksymacja lokalna, neuron jest jedynie aktywny w ograniczonym obszarze, skupionym dooko∏a centrum funkcji gaussowskiej [3]. przy czym x oraz y sà zmiennymi wejÊciowymi, z zmiennà wyjÊciowà, natomiast Ai i Bi sà zbiorami rozmytymi. Do g∏ównych zalet modelu Sugeno nale˝y zaliczyç, obok dobrej wspó∏pracy z metodami adaptacyjnymi i metodami optymalizacji, przede wszystkim wysokà skutecznoÊç obliczeniowà oraz wydajnoÊç. Uczenie rozmytej sieci przebiega podobnie jak w przypadku klasycznej sztucznej sieci, model sieci jest bowiem przekszta∏cany w równowa˝ny perceptron wielowarstwowy. Polega to na stopniowej zmianie wag sieci, doprowadzajàc do minimum Êredni kwadratowy b∏àd wyjÊcia w stosunku do danych uczàcych. Wagi wyznaczane by∏y za pomocà algorytmu wstecznej propagacji b∏´du. W konkluzji modelu pos∏u˝ono si´ funkcjà sta∏à. Klasyfikacja stanu ostrzy Rys. 2. Schemat sieci neuronowej o radialnych funkcjach bazowych Jednokierunkowe, wielowarstwowe sieci, zwane potocznie sieciami MLP, sà drugà obok RBF najcz´Êciej stosowanà w praktyce siecià neuronowà. W procesie uczenia sieci MLP zastosowano algorytm wstecznej propagacji b∏´du. Charakterystycznà cechà MLP jest to, ˝e w sieci nast´puje aproksymacja globalna, ka˝dy neuron wp∏ywa na wynik ca∏ej przestrzeni danych. Ostatnim rodzajem sieci zastosowanym w badaniach by∏a rozmyta sieç neuronowa. Analizy dla sieci rozmytych oparto na modelu Sugeno z biblioteki Fuzzy Logic Toolbox pakietu MATLAB. Regu∏y rozmyte Sugeno sk∏adajà si´ z przes∏anki JEÂLI i konkluzji TO, przy czym model Sugeno ma w konkluzji funkcj´ lub wartoÊç sta∏à. Typowa regu∏a Sugeno modelu rozmytego przy dwóch wejÊciach ma postaç: jeÊli x jest ai i y jest bi to zi = f(x, y) 22 Badania przeprowadzono dla narz´dzi zamontowanych zespo∏owo na g∏owicy wielonarz´dziowej. Badaniom stanowiskowym, opisanym w oddzielnych publikacjach [ 4 – 8], poddano eksperymentalnà g∏owic´ wielonarz´dziowà. Przeprowadzono pomiary dla no˝y ostrych oraz cz´Êciowo st´pionych, rejestrujàc sygna∏ momentu urabiania (rys. 3). Za narz´dzia st´pione uznano no˝e, których skrócenie wynosi∏o 2 m. Zakres badaƒ laboratoryjnych ograniczony by∏ do eksperymentów majàcych daç odpowiedê, czy sygna∏y momentu urabiania narz´dziami ostrymi i cz´Êciowo st´pionymi b´dà mo˝liwe do sklasyfikowania. Dla zarejestrowanych przebiegów czasowych momentu urabiania wyznaczono parametry statystyczne opisujàce charakter sygna∏u. Jako zmienne wejÊciowe do sieci neuronowych wykorzystano wariancj´, skoÊnoÊç oraz kurtoz´ (rys. 4). Przyj´to za∏o˝enie, i˝ na podstawie tych charakterystycznych zmiennych mo˝liwa b´dzie klasyfikacja sygna∏ów urabiania ze wzgl´du na stan ostrza narz´dzi. W tym celu pos∏u˝ono si´ sztucznymi sieciami neuronowymi: perceptronem wielowarstwowym z 8 neuronami w warstwie ukrytej oraz siecià o radialnych funkcjach bazowych z 6 neuronami. Taki dobór modeli neuronowych podyktowany by∏ doÊwiadczeniem autorów w dotychczasowych badaniach. ROK WYD. LXXIII 앫 ZESZYT 3/2014 Rys. 3. Przebieg momentu urabiania g∏owicà uzbrojonà w narz´dzia ostre oraz st´pione Rys. 4. Rozk∏ad parametrów statystycznych sygna∏u momentu urabiania W tab. I zamieszczone zosta∏y wartoÊci b∏´dów sieci MLP z oÊmioma neuronami w warstwie ukrytej oraz sieci o radialnych funkcjach bazowych 3-6-1. Podano wartoÊci b∏´dów dla danych nale˝àcych do zbioru uczàcego, walidacyjnego oraz testujàceROK WYD. LXXIII 앫 ZESZYT 3/2014 TABELA. I. WartoÊci b∏´dów modelu Sieç B∏àd ucz. B∏àd walid. B∏àd test. MLP 3-8-1 0,41 0,33 0,15 RBF 3-6-1 0,14 0,17 0,20 23 go. Przynale˝noÊç poszczególnych przypadków do okreÊlonych zbiorów wyznaczana by∏a w sposób losowy. Jako zmienne wyjÊciowe, otrzymane z sieci neuronowej, przyj´to stan ostrza narz´dzia, przyporzàdkowany do grupy ostrej lub st´pionej. W tab. II zamieszczono statystyki klasyfikacyjne dla sieci MLP oraz RBF odzwierciedlajàce poprawnoÊç zaklasyfikowanych przypadków. Dla sieci o radialnych funkcjach bazowych wszystkie przypadki zosta∏y zaklasyfikowane prawid∏owo. TABELA II. Statystyki klasyfikacyjne Sieç MLP 3-8-1 Poprawnie (%) Sieç RBF 3-6-1 Poprawnie (%) Narz´dzia ostre Narz´dzia st´pione 92 88 100 100 zostanie zakoƒczone znacznie wczeÊniej ni˝ na poziomie 150 epok. SkutecznoÊç analizowanego modelu sieci neuronowej dla zadania klasyfikacji stanu ostrzy narz´dzi potwierdza przeprowadzona analiza testujàca. Na rys. 6 przedstawiono odpowiedzi sieci rozmytej dla poszczególnych przypadków. Czerwone punkty niemal pokrywajà si´ z niebieskimi punktami reprezentujàcymi grupy narz´dzi ostrych i st´pionych. „Zera” odpowiadajà no˝om o ostrzach zu˝ytych, natomiast przypadki, w których na wyjÊciu otrzymujemy wartoÊç „jeden”, oznaczajà narz´dzia ostre. B∏àd testujàcy dla tej sieci wynosi∏ 0,012. Wnioski W dalszych badaniach pos∏u˝ono si´ modelem sieci rozmytej. Dla analizowanego modelu zaobserwowano ni˝sze, ni˝ w przypadku sieci MPL oraz RBF, wartoÊci b∏´dów we wszystkich zbiorach danych. Jak wynika z rys. 5, wraz ze spadkiem b∏´du dla danych uczàcych, w kolejnych epokach uczenia nast´po- Z przeprowadzonych analiz wynika, ˝e dla narz´dzi promieniowych, przy u˝yciu parametrów statystycznych momentu urabiania g∏owicà wielonarz´dziowà, zagadnienie klasyfikacji stanu ostrzy narz´dzi najlepiej rozwiàzuje rozmyta sieç neuronowa. Dzieje si´ tak, pomimo 100% skutecznoÊci klasyfikacji sieci RBF. O jakoÊci sieci neuronowej najlepiej Êwiadczà bowiem wartoÊci b∏´dów, które zosta∏y pope∏nione w procesie uczenia i testowania sieci. Sieç musi byç zdolna do dzia∏ania z zupe∏nie nowymi danymi, niewykorzystywanymi podczas jej uczenia i walidacji. WartoÊci b∏´dów, zarówno dla danych walidacyjnych, jak równie˝ uczàcych, sà ni˝sze ni˝ dla sieci klasycznych. Zastosowanie sztucznych sieci neuronowych w zagadnieniach klasyfikacji stanu ostrzy narz´dzi urabiajàcych nale˝y uznaç za zasadne. Dla przyj´tego kryterium st´pienia, wyniki badaƒ klasyfikacyjnych z u˝yciem modeli neuronowych nale˝y oceniç pozytywnie. LITERATURA Rys. 5. Wykres b∏´dów uczenia sieci rozmytej podczas 150 epok, dla danych uczàcych (dolna krzywa) oraz danych ze zbioru walidacyjnego (górna krzywa) wa∏ spadek wartoÊci b∏´du dla danych walidacyjnych. W przypadku danych ze zbioru uczàcego, po 150 epokach b∏àd wynosi∏ 0,007. W interfejsie systemu sieci rozmytych ANFIS konieczne jest podanie wartoÊci b∏´du, po osiàgni´ciu którego nast´puje przerwanie uczenia sieci. W rozpatrywanym przypadku, jeÊli zadeklaruje si´ zadowalajàcà dla analizowanego zagadnienia wartoÊç 0,05, uczenie sieci Rys. 6. Kszta∏towanie si´ odpowiedzi sieci neuronowej rozmytej dla danych testujàcych 24 1. Chungchoo C., Saini D.: On-line tool wear estimation in CNC turning operations using fuzzy neural network model. International Journal of Machine Tools & Manufacture 42, 2002, pp. 29 – 40. 2. Dimla E. Dimla Snr: Application of perceptron neural networks to tool-state classification in a metal-turning operation. Engineering Applications of Artificial Intelligence, Vol. 12, No. 4, August 1999, pp. 471 – 477. 3. Mathworks Academia http://www.mathworks.com. 4. Gajewski J., Jonak J.: Utilisation of neural networks to identify the status of the cutting tool point. Tunnelling and Underground Space Technology incorporating Trenchless Technology Research, Vol. 21, Issue 2, March 2006, pp. 180 – 184. 5. Gajewski J., Jonak J.: Towards the identification of worn picks on cutterdrums based on torque and power signals using Artificial Neural Networks. Tunnelling and Underground Space Technology incorporating Trenchless Technology Research, Vol. 26, Issue. 1, January 2011, pp. 22 – 28. 6. Gajewski J.: Ocena stanu ostrzy no˝y g∏owicy wielonarz´dziowej do urabiania w´gla. Rozprawa doktorska, Politechnika Lubelska, 2008. 7. Jonak J., Gajewski J.: Identification of ripping tool types with the use of characteristic statistical parameters of time graphs. Tunnelling and Underground Space Technology incorporating Trenchless Technology Research, Vol. 23, Issue. 1, January 2008, pp. 18 – 24. 8. Litak G., Syta A., Gajewski J., Jonak J.: Detecting and identifying non-stationary courses in the ripping head power consumption by recurrence plots. Meccanica, Vol. 45, Issue. 4, 2010, DOI 10.1007/s11012-009-9265-4, pp. 603 – 608. ROK WYD. LXXIII 앫 ZESZYT 3/2014