Sieci neuronowe w zagadnieniach klasyfikacji stanu ostrzy narz´dzi

Transkrypt

Sieci neuronowe w zagadnieniach klasyfikacji stanu ostrzy narz´dzi
Sieci neuronowe w zagadnieniach klasyfikacji
stanu ostrzy narz´dzi urabiajàcych
Neural networks in excavating tools’
blades condition classification
JAKUB GAJEWSKI
KAMIL JONAK
Streszczenie: W artykule zaprezentowano wyniki klasyfikacji stanu ostrzy narz´dzi pracujàcych zespo∏owo na g∏owicy
urabiajàcej. Jako narz´dzie do oceny zastosowano sztuczne sieci neuronowe. Badania realizowano dla sieci o radialnych
funkcjach bazowych, perceptronu wielowarstwowego oraz sieci rozmytych. Porównano skutecznoÊç klasyfikacji stanu
no˝y dla poszczególnych modeli neuronowych.
S∏owa kluczowe: sztuczna sieç neuronowa, proces urabiania, g∏owica wielonarz´dziowa
Abstract: The paper presents the results of excavating tools’ blades for machines’ combined work on a cutting head
classification. Artificial neural networks were used as a rating tool. The research was carried out for basic radial functions
networks, multilayer perceptrons and fuzzy networks. The effectiveness of blades condition for particular neural models
was compared.
Keywords: artificial neural network, rock mining process, multi-tool head
Stan ostrzy narz´dzi zamontowanych na g∏owicy
wielonarz´dziowej oraz ich geometria majà istotne
znaczenie dla energoch∏onnoÊci procesu urabiania.
Opisane w publikacji badania majà na celu ustalenie
przydatnoÊci wybranych sieci neuronowych do oceny
stanu narz´dzi g∏owicy wielonarz´dziowej.
Jako zmienne wejÊciowe do sieci zastosowano
parametry statystyczne sygna∏ów momentu oporów
urabiania. Zmiennymi wyjÊciowymi sieci neuronowych by∏y stany ostrzy no˝y urabiajàcych: narz´dzia
technicznie ostre oraz narz´dzia zu˝yte. Badania
numeryczne wykonano, pos∏ugujàc si´ pakietami
Statistica oraz Matlab.
Sieci neuronowe
Sieci neuronowe sà to modele matematyczne
naÊladujàce biologiczne sieci ˝ywych organizmów.
Sk∏adajà si´ one z elementów przetwarzajàcych
zwanych neuronami, w których wyjÊcia neuronów
po∏àczone sà za pomocà wag z wejÊciami wszystkich
neuronów w danej sieci, gdzie wagi sà liczbami rzeczywistymi. Dzi´ki obliczeniom przeprowadzanym
przez neurony poszczególnych warstw sieci mo˝na
uzyskaç rozwiàzanie zadanego problemu. Odpowiednie wyniki uzyskuje si´ przez wykorzystanie
procesów uczenia sieci polegajàcych na zmianie
Dr in˝. Jakub Gajewski – Katedra Podstaw Konstrukcji
Maszyn, Politechnika Lubelska, ul. Nadbystrzycka 36,
20-618 Lublin, e-mail: [email protected]; in˝. Kamil
Jonak – Instytut Technologicznych Systemów Informacyjnych, Politechnika Lubelska, ul. Nadbystrzycka 36,
20-618 Lublin.
ROK WYD. LXXIII 앫 ZESZYT 3/2014
wag tych neuronów, które odpowiadajà za b∏àd.
Sztuczne sieci neuronowe znajdujà szerokie zastosowanie w technice, w tym w zagadnieniach oceny
stanu ostrzy narz´dzi skrawajàcych [1 – 2].
Dzia∏anie poszczególnych neuronów mo˝na zapisaç
wg wzoru:
n
y = f ( ∑wi · xi )
i =1
gdzie:
x1, ..., xn – sygna∏y wejÊciowe neuronu;
w1, ..., wn – wagi;
y – sygna∏ wyjÊciowy.
Wyró˝nia si´ nast´pujàce typy sieci neuronowych:
jednokierunkowe (dzielàce si´ w swoim obr´bie na
jedno- lub wielowarstwowe) oraz rekurencyjne. Sieci
jednokierunkowe cechujà si´ budowà jedno- lub
wielowarstwowà, dzi´ki czemu przep∏yw sygna∏u
w sieci przebiega zawsze w okreÊlonym kierunku:
od warstwy wejÊcia do warstwy wyjÊcia. Warstwy
znajdujàce si´ pomi´dzy warstwami wejÊciowymi
a wyjÊciowymi nazywane sà warstwami ukrytymi
(rys. 1).
Sieci rekurencyjne cechujà si´ wyst´powaniem
sprz´˝eƒ zwrotnych pomi´dzy wejÊciem a wyjÊciem
oraz dwukierunkowym przesy∏aniem informacji.
Kolejnà cechà wyró˝niajàcà sieci rekurencyjne, którà
sieç nabywa po zamkni´ciu p´tli sprz´˝enia zwrotnego, jest wyst´powanie dynamiki na ka˝dym etapie
pracy.
Jednà z najcz´Êciej stosowanych w praktyce sieci
jest jednokierunkowa sieç neuronowa typu RBF
(Radial Basis Functions). Cechuje si´ ona budowà
21
Rys. 1. Schemat sieci neuronowej jednokierunkowej
z∏o˝onà zawsze z dwóch warstw neuronów: radialnych oraz wyjÊciowych. Funkcjonowanie sieci radialnej oparte jest na interpolacji wielowymiarowej, zadaniem której jest odwzorowanie wektorów
wejÊciowych w zbiór liczb rzeczywistych na wyjÊciu.
Z tych powodów sieç RBF wykorzystuje o wiele
wi´kszà liczb´ neuronów ni˝ sieci neuronowe jednokierunkowe cechujàce si´ sigmoidalnà funkcjà
aktywacji. Pomimo wykorzystywania wi´kszej liczby
neuronów sieci RBF mogà uczyç si´ o wiele szybciej
ni˝ sieci perceptronowe. Zaletà RBF jest równie˝
aproksymacja lokalna, neuron jest jedynie aktywny
w ograniczonym obszarze, skupionym dooko∏a centrum funkcji gaussowskiej [3].
przy czym x oraz y sà zmiennymi wejÊciowymi,
z zmiennà wyjÊciowà, natomiast Ai i Bi sà zbiorami
rozmytymi.
Do g∏ównych zalet modelu Sugeno nale˝y zaliczyç, obok dobrej wspó∏pracy z metodami adaptacyjnymi i metodami optymalizacji, przede wszystkim wysokà skutecznoÊç obliczeniowà oraz wydajnoÊç.
Uczenie rozmytej sieci przebiega podobnie jak
w przypadku klasycznej sztucznej sieci, model
sieci jest bowiem przekszta∏cany w równowa˝ny perceptron wielowarstwowy. Polega to na
stopniowej zmianie wag sieci, doprowadzajàc do
minimum Êredni kwadratowy b∏àd wyjÊcia w stosunku do danych uczàcych. Wagi wyznaczane
by∏y za pomocà algorytmu wstecznej propagacji b∏´du. W konkluzji modelu pos∏u˝ono si´ funkcjà
sta∏à.
Klasyfikacja stanu ostrzy
Rys. 2. Schemat sieci neuronowej o radialnych funkcjach bazowych
Jednokierunkowe, wielowarstwowe sieci, zwane
potocznie sieciami MLP, sà drugà obok RBF najcz´Êciej stosowanà w praktyce siecià neuronowà. W procesie uczenia sieci MLP zastosowano algorytm
wstecznej propagacji b∏´du. Charakterystycznà cechà
MLP jest to, ˝e w sieci nast´puje aproksymacja
globalna, ka˝dy neuron wp∏ywa na wynik ca∏ej
przestrzeni danych.
Ostatnim rodzajem sieci zastosowanym w badaniach by∏a rozmyta sieç neuronowa. Analizy dla sieci
rozmytych oparto na modelu Sugeno z biblioteki
Fuzzy Logic Toolbox pakietu MATLAB. Regu∏y rozmyte
Sugeno sk∏adajà si´ z przes∏anki JEÂLI i konkluzji TO,
przy czym model Sugeno ma w konkluzji funkcj´ lub
wartoÊç sta∏à. Typowa regu∏a Sugeno modelu rozmytego przy dwóch wejÊciach ma postaç:
jeÊli x jest ai i y jest bi to zi = f(x, y)
22
Badania przeprowadzono dla narz´dzi zamontowanych zespo∏owo na g∏owicy wielonarz´dziowej.
Badaniom stanowiskowym, opisanym w oddzielnych publikacjach [ 4 – 8], poddano eksperymentalnà
g∏owic´ wielonarz´dziowà. Przeprowadzono pomiary
dla no˝y ostrych oraz cz´Êciowo st´pionych, rejestrujàc sygna∏ momentu urabiania (rys. 3). Za narz´dzia
st´pione uznano no˝e, których skrócenie wynosi∏o
2 m. Zakres badaƒ laboratoryjnych ograniczony by∏
do eksperymentów majàcych daç odpowiedê, czy
sygna∏y momentu urabiania narz´dziami ostrymi
i cz´Êciowo st´pionymi b´dà mo˝liwe do sklasyfikowania.
Dla zarejestrowanych przebiegów czasowych
momentu urabiania wyznaczono parametry statystyczne opisujàce charakter sygna∏u. Jako zmienne
wejÊciowe do sieci neuronowych wykorzystano
wariancj´, skoÊnoÊç oraz kurtoz´ (rys. 4). Przyj´to
za∏o˝enie, i˝ na podstawie tych charakterystycznych zmiennych mo˝liwa b´dzie klasyfikacja sygna∏ów urabiania ze wzgl´du na stan ostrza narz´dzi. W tym celu pos∏u˝ono si´ sztucznymi sieciami neuronowymi: perceptronem wielowarstwowym z 8 neuronami w warstwie ukrytej oraz siecià
o radialnych funkcjach bazowych z 6 neuronami.
Taki dobór modeli neuronowych podyktowany by∏
doÊwiadczeniem autorów w dotychczasowych badaniach.
ROK WYD. LXXIII 앫 ZESZYT 3/2014
Rys. 3. Przebieg momentu urabiania g∏owicà uzbrojonà w narz´dzia ostre oraz st´pione
Rys. 4. Rozk∏ad parametrów statystycznych sygna∏u momentu urabiania
W tab. I zamieszczone zosta∏y wartoÊci b∏´dów
sieci MLP z oÊmioma neuronami w warstwie ukrytej
oraz sieci o radialnych funkcjach bazowych 3-6-1.
Podano wartoÊci b∏´dów dla danych nale˝àcych
do zbioru uczàcego, walidacyjnego oraz testujàceROK WYD. LXXIII 앫 ZESZYT 3/2014
TABELA. I. WartoÊci b∏´dów modelu
Sieç
B∏àd ucz.
B∏àd walid.
B∏àd test.
MLP 3-8-1
0,41
0,33
0,15
RBF 3-6-1
0,14
0,17
0,20
23
go. Przynale˝noÊç poszczególnych przypadków do
okreÊlonych zbiorów wyznaczana by∏a w sposób
losowy.
Jako zmienne wyjÊciowe, otrzymane z sieci neuronowej, przyj´to stan ostrza narz´dzia, przyporzàdkowany do grupy ostrej lub st´pionej. W tab. II
zamieszczono statystyki klasyfikacyjne dla sieci MLP
oraz RBF odzwierciedlajàce poprawnoÊç zaklasyfikowanych przypadków. Dla sieci o radialnych funkcjach
bazowych wszystkie przypadki zosta∏y zaklasyfikowane prawid∏owo.
TABELA II. Statystyki klasyfikacyjne
Sieç MLP 3-8-1
Poprawnie (%)
Sieç RBF 3-6-1
Poprawnie (%)
Narz´dzia ostre
Narz´dzia st´pione
92
88
100
100
zostanie zakoƒczone znacznie wczeÊniej ni˝ na poziomie 150 epok.
SkutecznoÊç analizowanego modelu sieci neuronowej dla zadania klasyfikacji stanu ostrzy narz´dzi potwierdza przeprowadzona analiza testujàca.
Na rys. 6 przedstawiono odpowiedzi sieci rozmytej
dla poszczególnych przypadków. Czerwone punkty
niemal pokrywajà si´ z niebieskimi punktami reprezentujàcymi grupy narz´dzi ostrych i st´pionych.
„Zera” odpowiadajà no˝om o ostrzach zu˝ytych, natomiast przypadki, w których na wyjÊciu otrzymujemy
wartoÊç „jeden”, oznaczajà narz´dzia ostre. B∏àd testujàcy dla tej sieci wynosi∏ 0,012.
Wnioski
W dalszych badaniach pos∏u˝ono si´ modelem
sieci rozmytej. Dla analizowanego modelu zaobserwowano ni˝sze, ni˝ w przypadku sieci MPL oraz RBF,
wartoÊci b∏´dów we wszystkich zbiorach danych. Jak
wynika z rys. 5, wraz ze spadkiem b∏´du dla danych
uczàcych, w kolejnych epokach uczenia nast´po-
Z przeprowadzonych analiz wynika, ˝e dla narz´dzi
promieniowych, przy u˝yciu parametrów statystycznych momentu urabiania g∏owicà wielonarz´dziowà, zagadnienie klasyfikacji stanu ostrzy narz´dzi
najlepiej rozwiàzuje rozmyta sieç neuronowa. Dzieje
si´ tak, pomimo 100% skutecznoÊci klasyfikacji sieci
RBF. O jakoÊci sieci neuronowej najlepiej Êwiadczà
bowiem wartoÊci b∏´dów, które zosta∏y pope∏nione
w procesie uczenia i testowania sieci. Sieç musi byç
zdolna do dzia∏ania z zupe∏nie nowymi danymi, niewykorzystywanymi podczas jej uczenia i walidacji.
WartoÊci b∏´dów, zarówno dla danych walidacyjnych, jak równie˝ uczàcych, sà ni˝sze ni˝ dla sieci
klasycznych.
Zastosowanie sztucznych sieci neuronowych w zagadnieniach klasyfikacji stanu ostrzy narz´dzi urabiajàcych nale˝y uznaç za zasadne. Dla przyj´tego
kryterium st´pienia, wyniki badaƒ klasyfikacyjnych
z u˝yciem modeli neuronowych nale˝y oceniç pozytywnie.
LITERATURA
Rys. 5. Wykres b∏´dów uczenia sieci rozmytej podczas
150 epok, dla danych uczàcych (dolna krzywa) oraz danych
ze zbioru walidacyjnego (górna krzywa)
wa∏ spadek wartoÊci b∏´du dla danych walidacyjnych. W przypadku danych ze zbioru uczàcego, po
150 epokach b∏àd wynosi∏ 0,007. W interfejsie systemu sieci rozmytych ANFIS konieczne jest podanie
wartoÊci b∏´du, po osiàgni´ciu którego nast´puje
przerwanie uczenia sieci. W rozpatrywanym przypadku, jeÊli zadeklaruje si´ zadowalajàcà dla analizowanego zagadnienia wartoÊç 0,05, uczenie sieci
Rys. 6. Kszta∏towanie si´ odpowiedzi sieci neuronowej rozmytej
dla danych testujàcych
24
1. Chungchoo C., Saini D.: On-line tool wear estimation in CNC
turning operations using fuzzy neural network model. International Journal of Machine Tools & Manufacture 42, 2002,
pp. 29 – 40.
2. Dimla E. Dimla Snr: Application of perceptron neural networks to tool-state classification in a metal-turning operation. Engineering Applications of Artificial Intelligence,
Vol. 12, No. 4, August 1999, pp. 471 – 477.
3. Mathworks Academia http://www.mathworks.com.
4. Gajewski J., Jonak J.: Utilisation of neural networks to identify the status of the cutting tool point. Tunnelling and Underground Space Technology incorporating Trenchless Technology Research, Vol. 21, Issue 2, March 2006, pp. 180 – 184.
5. Gajewski J., Jonak J.: Towards the identification of worn
picks on cutterdrums based on torque and power signals
using Artificial Neural Networks. Tunnelling and Underground Space Technology incorporating Trenchless Technology Research, Vol. 26, Issue. 1, January 2011, pp. 22 – 28.
6. Gajewski J.: Ocena stanu ostrzy no˝y g∏owicy wielonarz´dziowej do urabiania w´gla. Rozprawa doktorska, Politechnika Lubelska, 2008.
7. Jonak J., Gajewski J.: Identification of ripping tool types with
the use of characteristic statistical parameters of time
graphs. Tunnelling and Underground Space Technology
incorporating Trenchless Technology Research, Vol. 23,
Issue. 1, January 2008, pp. 18 – 24.
8. Litak G., Syta A., Gajewski J., Jonak J.: Detecting and identifying non-stationary courses in the ripping head power consumption by recurrence plots. Meccanica, Vol. 45, Issue. 4,
2010, DOI 10.1007/s11012-009-9265-4, pp. 603 – 608.
ROK WYD. LXXIII 앫 ZESZYT 3/2014