2 - Archives of Foundry Engineering

Transkrypt

2 - Archives of Foundry Engineering
ARCHIWUM ODLEWNICTWA
Rok 2006, Rocznik 6, Nr 19
Archives of Foundry
Year 2006, Volume 6, Book 19
PAN - Katowice PL ISSN 1642-5308
7/19
OCENA MOŻLIWOŚCI WYKORZYSTANIA
SZTUCZNYCH SIECI NEURONOWYCH
W SYNTEZIE SILUMINÓW
E. CZEKAJ1 , J. KROKOSZ2 , R. SAŁAT3
Instytut Odlewnictwa w Krakowie, ul. Zakopiańska 73, 30-418 Kraków
3
SGGW, Katedra Podstaw Inżynierii, ul. Nowoursynows ka 166, 02-787 Warszawa
1, 2
STRESZCZENIE
W artykule dokonano porównania wyników klasycznego matematycznego modelowania i optymalizacji uzyskanych w trakcie syntezy bezniklowych siluminów tłokowych [1], z rezultatami przetwarzania tych samych danych eksperymentalnych przy
wykorzystaniu metodologii sztucznych sieci neuronowych (ang. artificial neural networks) [2].
Prezentowany materiał stanowi fragment szerszego opracowania realizowanego
w 2005 roku w Instytucie Odlewnictwa w Krakowie – w ramach działalności statutowej, na zlecenie (nr 4041/00) Ministerstwa Edukacji i Nauki – pod tytułem: „Wykorzystanie sieci neuronowej do analizy parametrów technologicznych i konstrukcyjnych o dlewów” [2].
Key words: artificial neural net-works, alloy design, silumin
_________________________
dr inż., [email protected]
mgr inż., [email protected]
3
dr inż., [email protected]
1
2
55
1.
WPROWADZENIE
Od wieków (tj. od ok. 5…7 tys. lat p.n.e.) ludzkość korzystała ze znajd owanych przypadkowo metali w postaci rodzimej (początkowo były to: Au, Ag, Cu), a p otem rud metali (na przykład brązów – stopów miedzi wzbogacanych naturalnie przez
Sn, Zn, As i inne pierwiastki). Rozwój alchemii w średniowieczu, a zatem chemii od
XVII w. przyczynił się do coraz powszechniejszego stosowania przez człowieka n owych, sztuczni (syntetycznie) komponowanych tworzyw metalowych metodą „prób
i błędów” (ang. „trial and error”). Zgromadzony przez setki lat materiał badawczy oraz
zdobyte doświadczenie pozwoliły w drugiej połowie XX wieku na dokonanie uogó lnień, i na tej podstawie opracowanie naukowego podejścia do projektowania (ko nstruowania, ang. alloy design) stopów. Ważnym wydarzeniem w tej dziedzinie było zaproponowanie na początku lat 70 XX w. - przez rosyjskiego uczonego, metaloznawcę i
odlewnika prof. B.B. Gulayeva z St. Petersburga - podstaw tzw. syntezy stopów [3].
Rozwijana przez prof. B.B. Gulayeva wraz ze współpracownikami metodologia syntezy
stopów [4-6] znalazła też swoich zwolenników za granicą; w Polsce prace w tym zakresie były prowadzone oraz upowszechniane m.in. przez naukowców Instytutu Odlewnictwa w Krakowie [7-9].
Istota syntezy stopów, opisana w pracach [3-9], sprowadza się głównie do sposobu wyboru składników stopowych – podstawowych i wspomagających dodatków stopowych, zanieczyszczeń, modyfikatorów), itd. – na podstawie rozpatrzenia pewnych
wielkości kryterialnych wynikających z wykresów równowagowych dla układów
osnowa metalowa – składnik stopowy oraz analizy ekonomicznej (cenowej). Zaproponowany przez B.B. Gulayeva system selekcji stanowi tak naprawdę pierwszy etap opracowywania stopów – analizę fizyko-chemiczną i techniczno-ekonomiczną, której efektem jest pewien wyselekcjonowany podzbiór pierwiastków układu okresowego. Po dstawą poszukiwania nowych rozwiązań stopów pozostaje jednak w syntezie, podobnie
jak w metodzie „prób i błędów”, eksperyment [4]; jednak eksperyment nie przypadkowy, tylko zazwyczaj planowany – tj. tak skonstruowany, aby zapewnić uzyskanie maksimum informacji przy możliwie najniższych nakładach finansowych na badania. Ważne etapy syntezy, dotyczące określenia pożądanych zakresów stężeń dla wybranych d odatków stopowych następuje w procesach matematycznego modelowania i optymalizacji. Dlatego też wierniej – zdaniem autorów niniejszej publikacji – cały proces tworzenia stopów należałoby nazwać analizą i syntezą stopów.
Słabą stroną syntezy stopów, na obecnym etapie, jest niedostateczne sformalizowanie procedur matematycznego modelowania i optymalizacji. Problemy związane
z tym etapem opracowywania stopów scharakteryzowano w roz. 2. Niezależnie od o dnotowywanych trudności, doświadczenie autorów [1,10,11] w zakresie ulepszania i projektowania nowych siluminów typu tłokowego pokazuje, iż procedura syntezy na dzień
dzisiejszy nieźle spełnia swoje zadania.
56
ARCHIWUM ODLEWNICTWA
W Europie Zachodniej, USA oraz Japonii do procesów projektowania nowych
stopów metalowych wprzęgane są na szeroką skalę obliczeniowe (przy wykorzystaniu
techniki informatycznej) metody z zakresu termodynamiki, kinet yki procesowej oraz
systemów ekspertowych.
Niedawno grupa japońskich badaczy pod przewodnictwem Takashi Saito –
z Toyota Central Research and Development Laboratories, Inc. Nagakute Aichi – na
przykładzie opracowania wysokoplastycznego stopu tytanowego wy sunęła przypuszczenie (o czym donosił Science z 18 kwietnia 2003 r.), że już w niedalekiej przyszłości
możliwe będzie opracowywanie stopów metalowych o zadanych właściwościach jed ynie na bazie obliczeń wykonywanych przez komputer. Chociaż taka perspektywa wydaje się mało prawdopodobna, czemu wyraz dają m.in. amerykańscy eksperci [12], to nie
ulega jednak żadnej wątpliwości fakt, że udział i pomoc metod informatycznych w procesach opracowywania nowych tworzyw będzie nieprzerwanie wzrastać. Na przykład
nowe możliwości w tej materii powstały od momentu powszechnego wdrażania do b adań i techniki modeli sztucznych sieci neuronowych, jako rezultat prac prowadzonych
w zakresie sztucznej inteligencji [13, 26].
Sieci neuronowe są bardzo dobrym narzędziem dla licznych zastosowań – jak
się wydaje także w metalurgii i inżynierii materiałowej [14]. Oprócz zadań identyfikacji, lokalizacji i prognozowania sieci neuronowe używane są coraz szerzej do zadań
modelowania, sterowania i optymalizacji [15,16]. Praktyczne wykorzystanie sieci neuronowych pozwala dokonywać modelowania i optymalizacji złożonych zjawisk i obie któw bez budowania modeli matematycznych, czy wykonywania skomplikowanych procedur obliczeniowych [2].
Aktualne wykorzystanie „sieci neuronowych” w odlewnictwie - tak krajowym,
jak i zagranicą – jest stosunkowo niewielkie. Autorom niniejszej publikacji wiadomo,
że w Polsce pionierskie prace w tym zakresie prowadzone są od pewnego czasu na Politechnice Warszawskiej pod kierunkiem prof. M. Perzyka [17,18] oraz na AGH in. St.
Staszica w Krakowie z udziałem prof. R. Wrony [31]. W 2004 roku pojawiła się też
pierwsza publikacja, dotycząca wykorzystania sieci neuronowej, w Instytucie Odle wnictwa w Krakowie we współpracy z SGGW w Warszawie [32].
Mając na uwadze zasygnalizowane wyżej oraz szczegółowiej odnotowane
w roz. 2 problemy klasycznego matematycznego modelowania i optymalizacji, autorzy
niniejszej publikacji postanowili sprawdzić na ile rozwiązania otrzymane przy wykorzystaniu metodologii sztucznych sieci neuronowych s ą zbieżne z wynikami uzyskanymi w trakcie syntezy bezniklowych siluminów tłokowych – stosując tradycyjne metody
badawcze [1].
57
2.
SPOSOBY I WYNIKI KLASYCZNEGO MATEMATYCZNEGO
MODELOWANIA ORAZ OPTYMALIZACJ I
W pracy [1], na podstawie rozeznania literaturowego oraz własnego doświadczenia, autorzy wytypowali pięć pierwiastków jako pożądane dodatki stopowe i/lub zanieczyszczenia stanowiące podstawę do opracowania nowych bezniklowych siluminów
stopowych typu tłokowego. Pierwiastkami tymi – oprócz aluminium, jako osnową – były: Si, Cu, Mg, Mn i Fe. Badania doświadczalne prowadzono z wykorzystaniem metod
matematycznego planowania doświadczeń. Do badań wyt ypowano plan Hartley’a
PS/DS-P: Ha5 [1,19]. Realizacja planu doświadczeń wymagała wykonania w sumie 25
wytopów doświadczalnych. Wartości stężeń poszczególnych pierwiastków – zgodnie
z planem eksperymentu, na dolnym, środkowym i górnym poziomie – wynosiły odpowiednio (w % mas.): Si - 8,5/10,5/12,5; Cu - 1,5/ 2,5 /3,5 ; Mg -0,5/1,0/1,5; Mn –
0,3/0,6/0,9; Fe – 0,3/0,7/1,1. Dodatkowo wykonano wytopy dwóch typowych siluminów tłokowych z niklem typu eutektycznego (nr 26 i 27), różniących się zasadniczo
zawartością miedzi - odpowiednio: ok. 1 i 2 % mas.; stężenia pozostałych pierwiastków
jak w stopie typu AK12 (wg nieaktualnych już oznaczeń).
Warto w tym miejscu zauważyć, że realizacja badań zgodnie z wybranym planem eksperymentów nakłada na eksperymentatora szczególne wymagania względem
potrzeby precyzyjnego „wstrzelenia się” w wybrane poziomy stężeń dla poszczegó lnych dodatków stopowych; w przypadku wieloskładnikowych stopów nie jest to zad anie łatwe. Tego typu problemy nie występują przy zastosowaniu techniki sieci neuronowej.
Wyjściowymi parametrami mierzonymi w procesie syntezy były [1]: a) dług o0
C
trwała 1 h twardość na gorąco HB10350/ 250
w temperaturze 350 0 C - jako przyśpieszony
/ 1h
wskaźnik wytrzymałości na pełzanie; b) doraźna wytrzymałość na rozciąganie Rm
0
w MPa, w temperaturze otoczenia; c) plastyczność A5350 C % w podwyższonej 350 0 C
temperaturze, jako pośrednia charakterystyka odporności stopu na powstawanie pęknięć
w warunkach cyklicznych obciążeń cieplnych [20]; d) twardość HB - jako ogólnie wymagany wskaźnik jakości tworzywa tłokowego przez normy materiałowe i konstrukcy jC
... 300 C
ne; e) techniczny  20
i  300
K-1 fizyczny liniowy współczynnik rozszerzalności
fiz .
techn .
0
0
cieplnej K-1 - jako parametr średnich (w zakresie temperatury) i chwilowych odwracal500 0 C
nych zmian wymiarowych; f) trwałe względne odkształcenie (V / V0 )100
% w warunh
kach wygrzewania w temperaturze 500 0 C przez 100 h - jako charakterystyka nieodwracalnych zmian wymiarowych.
Na wstępnym etapie opracowywania wyników badań eksperymentalnych –
w układzie klasycznym – istnieje potrzeba budowy adekwatnych modeli matematycznych (najczęściej typu wielomianowych równań regresji pierwszego, drugiego i wy ższych stopni), które w przypadku szerokich zakresów stężeń badanych dodatków są st osunkowo złożone (co związane jest z efektami interakcji, współczynnikami drugiego
58
ARCHIWUM ODLEWNICTWA
i wyższych stopni). W pracy [1] wybrany został nieliniowy model matematyczny zale żności wielkości wyjściowej Y (fizyko-mechaniczne wyżej zdefiniowanych) od wielkości wejściowych X1 (Si), X2 (Cu), X3 (Mg), X4 (Mn) i X5 (Fe) w ogólnej postaci (1):
Y  B0  B1 X1  B2 X 2  ...  B5 X 5 
 B12 X1 X 2  B13 X1 X 3  ...  B45 X 4 X 5  B12345X1 X 2 X 3 X 4 X 5 
(1)
 B11X  B22 X  ...  B55 X ,
gdzie: B0 – wyraz wolny; B1 , B2 , ..., B5 – współczynniki przy czynnikach liniowych;
2
1
2
2
2
5
B12 , B13 , ..., B45 – współczynniki przy podwójnych efektach; B11 , B22 , ..., B55 –
współczynniki przy efektach drugiego stopnia; B12345 – współczynnik przy prostej multiplikacji wszystkich czynników wejściowych; X1 , X2 , … X5 – to tzw. kodowane wartości badanych wielkości wejściowych.
Powyższy model jest wielomianem drugiego stopnia uzupełnionym o współczynnik X1 X2 X3 X4 X5 , na wprowadzenie którego pozwalała dostępna liczba swobody.
Autorzy [1] stwierdzili, że wprowadzenie tego typu współczynnika znacznie poprawia
stopień dopasowania niektórych zależności wielkości wyjściowych Y od wielkości wejściowych (X1 , X2 , ... ,X5 ). W rozpatrywanym przypadku model w postaci (1) zawiera 21
członów; ma więc stosunkowo złożoną matematycznie postać. Realnie, po odrzuceniu
nieistotnych współczynników, stopień skomplikowania modelu (1) był nieco mnie jszy.
Statystyczną obróbkę eksperymentalnych danych, w celu identyfikacji parametrów (współczynników) modelu (2), wykonywano przy zastosowaniu pakietu „regresja
wielokrotna” programu STATISTICA PL® [21,22].
Istnieją poważne problemy w zakresie odpowiedniej interpretacji stos unkowo
skomplikowanych modeli matematycznych typu (1). Wyjściem z sytuacji jest na przykład wykorzystanie tzw. quasi-jednoczynnikowych modeli (a w ślad za tym wykresów)
[1,10,11]; mają one jednak względny charakter – tj. ich przebieg zależy od poziomu
(„umocowania”, wartości) pozostałych wejściowych czynników bad anych.
Optymalizacja realnych obiektów czy procesów technicznych w wielowymiarowej przestrzeni względem kilku lub kilkunastu kontrolowanych parametrów (wariant
tzw. wieloparametrycznej czy wielokryterialnej optymalizacji) nie jest również obecnie
do końca sformalizowana z matematycznego punktu widzenia i ma zazwyczaj charakter
umowny. Umowny w tym rozumieniu, iż to które z kryteriów będzie funkcją c elu,
a które będą stanowić ograniczenia decyduje – w zasadzie subiektywnie – badacz.
Z drugiej strony, złożone sytuacje optymalizacyjne, kiedy modele matematyczne mają
nieliniowy charakter, trudne są do analitycznego rozwiązania. W takich sytuacjach
szczególnie przydatne są metody optymalizacji dyskretnej (numerycznej), z wykorzystaniem techniki komputerowej.
59
Zadanie optymalizacji stopu, ze względu na kontrolowane wyjściowe parametry pod ane wyżej, w ogólnym matematycznym ujęciu przedstawiono w następując sposób [1,2]
(2):
0
C
MAX
HB10350/ 250
/ 1h

Rm
A5350 C
HB

0
A5350 C (gr.)
HB (gr.)
20... 300 C
(gr.)
 tech .


20... 3000C
tech .

Rm (gr.)

0
C
(gr.)
 300
fiz .

3000C
fiz .
0
500 C
(V / V0 )100
h
(2)
0
0

0
500 C
(gr.)
(V / V0 )100
h
500 C
Dodatkowo kontrolowano także trwałe zmiany długości (l / l 0 )100
, co znalazło odbicie
h
0
w programie komputerowym procedury optymalizacyjnej. Procedurę (2) nie n ależy
traktować jako jedyną; można bowiem formułować inne warunki, w postaci doboru innej funkcji celu czy innych funkcji ograniczających.
Formułowane zadanie optymalizacyjne w postaci (2) wymagało, przy praktycznej
jego realizacji, określenia granicznych wartości na wielkości wyjściowe (tabela 1).
Tabela 1. Graniczne (progowe) – minimalne lub maksymalne – wartości nakładane na wyjściowe
parametry [1]
Table 1. Boundary (threshold) - minimum or maximum - values overlayed on output parameters
[1]
P A R A M ETR Y
Lp.
3500 C
10 / 250/ 1h
HB
(gr.)
3500C
5
Rm (gr.) A
(gr.)
O P TY M A L I Z A C J I
20... 300 C
300 C
500 C
HB (gr.)  tech . (gr.)  fiz . (gr.) (V / V0 )100h (gr.)
0
0
0
1.
12,7
208,9
5,41
95
21,0
24,0
0,1417
2.
11,9
205,5
6,78
92
21,3
23,8
0,6080
3.
-
200,0
-
95 (90)
21,0
-
0,5284
4.
12,0
205,0
6,50
95,0
21,0
24,0
0,2000
Uwaga ! W wierszu 1. i 2. podano wartości parametrów optymalizacji, uzyskane na drodze eksperymentalnej, odpowiednio dla wzorcowych stopów z niklem: Nr 26 i Nr
27 [ ]. W wierszu 3. podano standardowe literaturowe dane dotyczące stopu typu AK12. Wiersz 4. wybrane graniczne (progowe) wartości do optymalizacji zgodnie z (2)
badanych charakterystyk.
60
ARCHIWUM ODLEWNICTWA
Numeryczne rozwiązywania zadania wieloparametrycznej (wielokryterialnej)
syntezy stopów tłokowych przeprowadzane były na bazie metody pełnego przeszukiwania (metody siatek, rys. 1) [23, 24]. W metodzie pełnego przeszukiwania badana
przestrzeń, dla wejściowych czynników niezależnych Xi (-1  Xi  +1), podzielona została przez pewną siatkę, w ogólnym przypadku nierównomierną. W punktach węzłowych tak powstałej wielowymiarowej siatki dokonywano sprawd zania wypełniania warunków (2), z następującym wyborem rozwiązania optymalnego - odpowiadającego
0
C
wybranej funkcji celu Y1 (w danym przypadku HB10350/ 250
).
/ 1h
Rys. 1. Schemat strukturalny algorytmu optymalizacji stopu tłokowego metodą siatek [1, 23, 24]
Fig. 1. Schematic diagram of an algorithm for optimization of piston alloy by the
method of grids [1, 23, 24]
61
Program zadania optymalizacyjnego, odpowiadającego powyższemu algory tmowi, został napisany w języku programowania QuickBASIC [1,11].
Zakres komputerowego poszukiwania optymalnych rozwiązań ograniczono [1] do
dwóch obszarów związanych z zawartością krzemu (w % mas. Si): a) 8,5  10,5; b)
10,5  12,5, jednocześnie przy różnej zawartości żelaza (w obszar zainteresowania aut orów pracy [1] wchodziły również bezniklowe siluminy stopowe z podwyższonym st ężeniem Fe – jako odpowiedniki stopów na bazie surowców wtórnych).
Końcowe wyniki optymalizacji, zgodnie z algorytmem z rys. 1, dla bezniklowych siluminów stopowych pokazuje poniższa tabela 2.
Tabela 2.Zakresy i średnie wartości podstawowych dodatków stopowych i właściwości bezniklowych siluminów tłokowych uzyskane na drodze przeprowadzenia procedur klasycznej
optymalizacyjnych [1]
Table 2. Ranges and mean values of the main alloying elements and of the properties of nickelfree piston silumins obtained by standard optimizing procedures [1]
62
ARCHIWUM ODLEWNICTWA
3.
METODYKA SZTUCZNYCH
WANIE SAMMONA
SIECI
NEURONOWYCH
–
ODWZORO-
Sztuczne sieci neuronowe powstały na bazie wiedzy o działaniu systemu ne rwowego istot żywych i stanowią próbę wykorzystania zjawisk zachodzących w systemach nerwowych przy rozwiązywaniu zagadnień technologicznych [25]. St anowią one
w pewnym zakresie naśladownictwo działania ludzkiego umysłu [26].
Do rozwiązywania rzeczywistych problemów najbardziej przydatne są proste sztuczne
sieci neuronowe o warstwowej strukturze jednokierunkowej (ang. feedforward), jak to
pokazano na rys. 2 [26].
warstwa
neuronów
wejściowych
warstwa
neuronów
ukrytych
warstwa
neuronów
wyjściowych
Rys.2. Ogólny schemat warstwowej struktury sztucznej sieci neuronowej [26]
Fig. 2. General schematic representation of multi-layer structure of an artificial neural
network [26]
Zasadniczo istnieją dwa rodzaje algorytmów stosowanych do uczenia sieci neuron owych: 1) uczenie z nauczycielem i 2) uczenie bez nauczyciela [13-17;25-27]. Częściej
stosowany jest pierwszy sposób uczenia. W rozpatrywanym w pracy [2] przypadku wykorzystywano drugi ich rodzaj, z grupy samooragnizujacych się sieci typu Kohonena
[25, 27]. W szczególności zastosowano ideę odwzorowania Sammona, bardzo przydatnego do rozwiązywania problemu graficznego przekształcenia wielowymiarowych
przestrzeni w obrazy 1., 2., lub 3. wymiarowe czytelne dla użytkownika [25]. Ważne
jest przy tym, aby przekształcone obrazy przestrzeni o małych wymiarach zachowywały
podstawowe cechy rozkładu z przestrzeni wielowymiarowej.
Matematyczną bazą opisu odwzorowań przy użyciu sieci neuronowych jest
współczesna algebra i abstrakcyjne przestrzenie, geometria analityczna, rachunek macierzowy, a także teoria przekształceń (operatorów, odwzorowań) przestrzeni wektorowych [28,29].
63
Odwzorowaniem (przekształceniem) nazywa się zbiór reguł lub zależności
stawiających każdemu k- punktowi (wektorowi) z N–wymiarowej przestrzeni C o
współrzędnych xk1 , xk2 , …, xkN (z bazą B: = {b 1 , b 2 , … , b N}) w odpowiedniość nowy zestaw współrzędnych yk1 , yk2 , …, ykM (z bazą B’: = {b’1 , b’2 , … , b’M }) w przestrzeni C ' M–wymiarowej. Matematyczny zapis dla ogólnego (nieliniowego) przypadku odwzorowania przestrzeni N–wymiarowej w euklidesową (numeryczną) przestrzeń trójwymiarową (M = 3) będzie mieć postać (3) [29]:
y 1k  f 1k ( x 1k , x 2 k , ..., x Nk )
y 2 k  f 2 k ( x 1k , x 2 k , ..., x Nk ) ,
(3)
y 3 k  f 3 k ( x 1k , x 2 k , ..., x Nk )
lub zapisie wektorowym (4):
y  fk (x ) .
k
(4)
k
gdzie: k = 1, 2, …, n (liczba wektorów lub tzw. liczba przypadków); N i /lub M - nazywamy wymiarowością przestrzeni.
Zadanie odwzorowania nieliniowego Sammona polega na takim doborze wekt ora yk, aby zminimalizować funkcję błędu E zdefiniowaną w postaci (5) [25, 27]:
*
2
M
n
1 n d ij  d ij
*
d

y

y
,
przy
czym
,
,
(5)
c

d


 d*
ij
ik
jk
ij
c ij
k 1
i j
ij
gdzie: d * ij = d (x i , x j ) – odległości pomiędzy poszczególnymi wejściowymi wektorami x i
i x j (i  j) w przestrzeni N-wymiarowej; d ij = d (yi , yj ) – odległości pomiędzy wektorami
yi i yj (i  j) w euklidesowej przestrzeni M-wymiarowej (M = 2 lub 3); yi k – oznacza k-tą
składową wektora yi (k = 1 - odwzorowanie na prostą; k = 1, 2 - dla odwzorowania na
płaszczyznę oraz k = 1, 2 i 3 - przy odwzorowaniu na przestrzeń trójwymiarową).
W minimalizacji funkcji E błędu Sammon zastosował metodę optymalizacji Newtona
uproszczoną do postaci (6) [25,27]:
E 

y jk (t  1)  y jk (t )     jk (t ) , w której E / y jk  /  2 E /  2 y jk ,

(6)
gdzie: t – to numer kolejnego kroku iteracyjnego, a  - tzw. współczynnik uczenia wybierany najczęściej do obliczeń z przedziału liczbowego [0.3; 0,4].
W ogólnym przypadku odwzorowanie należy rozpocząć od liniowej przestrzeni wy jściowej C ' . Jeżeli podczas minimalizacji funkcji błędu E nie można zejść poniżej pewniej zakładanej maksymalnej wartości przy rozmiarze M = 1, obliczenia należy powtórzyć dla M = 2, 3, itd.; wówczas jednak każdy wyjściowy wektor sieci Kohonena będzie
miał skojarzony ze sobą wektor M-wymiarowy, a nie pojedynczą wartość (punkt) [27].
64
ARCHIWUM ODLEWNICTWA
Pomiędzy przestrzennymi a płaskimi wynikami odwzorowań istnieje zależność
wynikająca z przyjętej perspektywy. Perspektywa jest najczęściej używanym i najbardziej naturalnym dla człowieka sposobem odwzorowania przestrzeni na powierzchnię.
Jeżeli dane są współrzędne punktu (x3D, y3D, z3D) w trójwymiarowym układzie prostokątnym,
to łatwo można obliczyć współrzędne (x2D, y2D) jego rzutu perspektywicznego na płaszczyznę korzystając ze wzorów (7) [30]:
x2 D 
x3 D
,
z3D
y2D 
y3D
z3D
(7)
W praktycznych odwzorowaniach dotyczących sztucznych sieci neuronowych
pewne klasy obiektów (na przykład grupy czy klasy stopów metalicznych) będą miały
rzeczywiste (mechaniczne, czy fizyko-chemiczne) miary współrzędnych, po przekształceniach zaś - abstrakcyjne (czysto liczbowe). Tak więc nie mamy tutaj do czynienia
z przestrzeniami izomorficznymi; dwie skończone wymiarowo przestrzenie liniowe są
bowiem izomorficzne wtedy i tylko wtedy, gdy ich wymiary są równe [29].
W rozpatrywanym w pracy [2] przypadku zachodziła potrzeba zrzutowania n =
27 wektorów wejściowych {dotyczących 25 doświadczalnych bezn iklowych stopów
wykonanych zgodnie z planem eksperymentu + 2. stopów (Nr 26 i 27) z niklem (jako
0
wzorce)} z przestrzeni 8.-wymiarowej (8. badanych własności: HB10350/ 250C / 1h , Rm , A5350 C ,
0
C
500 C
500 C
20... 300 C
(l / l 0 ) 100
HB, tech
,  300
, (V / V0 )100
- tabela 3) na euklidesową przestrzeń
fiz .
h ,
h
.
0
0
0
0
trójwymiarową (M =3).
W tabeli 3 wyróżniono bezniklowe siluminy w zależności od o zawartości w nich krzemu (w % mas.): ~8,5 Si – stopy Nr 1, 3, …, 13; ~10,5 Si stopy Nr 15,16, …25
i ~12,5 Si Nr 2, 4, …, 14. Dwa ostatnie wiersze dotyczą wzorców Nr 26 i 27. Tabela 3
tworzy n x N wymiarową macierz skalarnych współczynników wektorów wejściowych
xk (o fizyko-mechanicznych miarach). Odpowiednio zdefiniowano też M = 3 wyjściowych numerycznych wektorów yk w przestrzeni 3-wymiarowej o euklidesowej metryce
tworzących kolumnowa macierz rozmiaru n x 3.
Wyjściowe dane do projektowania sztucznych sieci neuronowych typu Koh onena, w rozpatrywanym w niniejszej publikacji praktycznym przypadku, zostały wstępnie zestawione w arkuszu kalkulacyjnym standardowego oprogramowania Microsoft
EXCEL (w układzie pokazanym w powyższej tablicy 3). Poszczególne wiersze tablicy 3
stanowią skalarne wielkości wektorów wejściowych x k sieci, które dla N = 27 przypadków (stopów) tworzyły w sumie macierz rozmiaru 8 x 27. Za pomocą funkcji xlsread,
dane z arkusza kalkulacyjnego były przenoszone do postaci macierzy zrozumiałe dla
programu MATLAB [33]. Właśnie w pakiecie MATLAB, matematycznego wspomagania
badań, dokonywane były obliczenia sieci, wykorzystując w tym celu funkcję oprogramowania oznaczaną jak (8):
xyz = sammon(a) ,
(8)
gdzie: xyz – to symboliczne oznaczenie macierzy wyjściowych wektorów w przestrzeni
trójwymiarowej; a – macierz opisująca badane stopy (odpowiadająca danym tabeli 1).
65
Tabela 3. Fizyko-mechaniczne własności doświadczalnych bezniklowych siluminów zgodnie
z planem doświadczeń (stopy Nr 1 ÷ 25) oraz wzorców odniesienia (stopów typu AK12
z niklem - Nr 26 i Nr 27) [2]
Table 3. Physico-mechanical properties of nickel-free silumins examined according to the plan
of experiments (alloys nos. 1 - 25) and of reference standard alloys (nickel-containing
AK12-type alloys - nos. 26 and 27) [2]
Wynikiem obliczeń - związanych z odwzorowaniem Sammona – był plik
w programu MATLAB, stanowiący ciąg trójek liczb dla N = 27 przypadków (stopów),
odpowiadających skalarnym składowym wektorów wyjściowych w przestrzeni Kart ezjusza X, Y, Z [2]. W odniesieniu do powyżej stosowanych oznaczeń otrzymano wyjściową macierz, rozmiaru 3 x 27, o następujących symbolicznych wartości liczbowych
(9):
66
ARCHIWUM ODLEWNICTWA
Nr stopu
1.
2.
…
k
.…
n = 27
oś X
x1 = y11
x2 = y12
…
xk = y1k
…
xn = y1n
oś Y
y1 = y21
y2 = y22
…
yk = y2k
…
yn = y2n
oś Z
z1 = y31
z2 = y32
…
zk = y3k
…
zn = y3n
(9)
Graficzną prezentację postanowiono przeprowadzić w jednym z programów
typu CAD-owskiego, w szczególności w AutoCAD-dzie. Wymagało to opracowania autorskiego – sposobu przetwarzania zapisu liczbowych danych programu MATLAB do
postaci plików scriptowych o rozszerzeniu *scr. Jednocześnie, wykorzystanie programu
graficznego AutoCAD pozwoliło na łatwe dokonywanie pomiaru odległości pomiędzy
poszczególnymi obiektami (stopami) w przes trzeni X, Y, Z.
4.
WYNIKI SYNTEZY BEZNIKLOWYCH SILUMINÓW TYPU
WEGO PRZY ZASTOSOWANIU SIECI NEURONOWYCH
TŁOKO-
Wyniki rzeczywistego odwzorowanie danych wielowymiarowej matrycy (t ablicy 3) na przestrzeń trójwymiarową M = 3, zgodnie z metodyką opisaną wyżej, pokazane zostało na poniższym rys. 3.
Rys. 3. Fragment rozmieszczenia bezniklowych stopów doświadczalnych tabeli 3 w przestrzeni
trójwymiarowej w pobliżu wzorców [2]
Fig. 3. Fragment of distribution of nickel-free test alloys from Table 3 in 3D space near the reference samples [2]
67
Kryterium oceny poszczególnych bezniklowych siluminów była minimalna odległość
od wzorca. W celu jednoznaczności odniesień co do odległości, utworzono jeden wzorzec wypadkowy o współrzędnych wynikających ze średniej arytmetyczn ej odległości
pomiędzy wzorcami pośrednimi (stopami Nr 26 i Nr 27) - o największej średnicy (rys.
3). Wynika z tego, że im bliżej odległościowo bezniklowy stop (wśród stopów Nr 1 ÷
25 tablicy 3) będzie od wzorca wypadkowego, tym lepszy będzie jego kompleks właściwości – bliski analogicznemu zestawowi charakterystyk dla standardowych tłokowych siluminów z niklem.
Z rys. 3 wynika, że współrzędne dwóch standartowych stopów z niklem typu
AK12 leżą blisko siebie(wzorców); potwierdza to – chociażby częściowo – słuszność
poczynionych założeń badawczych.
Ogólnie należy stwierdzić, iż wzorce mogą być rzeczywiste – jak w rozpatrywanym przypadku (dane określone eksperymentalnie), jak też w postaci życzeniowej (czysto liczbowej) – na przykład określonej a priori przez projektanta (stopu).
Z wykresu rys. 3 wynika , że najbliżej wzorców (oraz wzorca wypadkowego)
znajdują się bezniklowe siluminy stopowe o zawartości ~ 8,5 % mas. Si, a zatem stopy
o koncentracji ~ 10,5 % mas. krzemu. Dotychczas właśnie tego typu bezniklowe siluminy stopowe znajdowały zastosowanie w produkcji tłoków. Bezniklowe siluminy tłokowe typu eutektycznego (~12,5 % mas.) wymagały dopracowania, co było przedmiotem badań autorów pracy [1]; żaden z eksperymentalnych stopów Nr 1  25 nie odpowiadał co do składu chemicznego nowym bezniklowym siluminom tłokowym zsyntet yzowanych klasycznie (tabela 2).
Za rozwiązania optymalne procedury wykorzystującej modele sztucznych sieci
neuronowych przyjęto umownie - zgodnie z propozycją autorów niniejszej publikacji stopy, których skład chemiczny odpowiadał średniej arytmetycznej stężeń poszczegó lnych pierwiastków dla trzech najbliższych wzorcowi wypadkowemu stopom z danej
grupy: 8,5; 10,5 i 12,5 % mas. Si. Wyniki przeprowadzanych obliczeń oraz wykres
przedstawiono na rys. 4.
68
ARCHIWUM ODLEWNICTWA
Optymalne zawartości dodatkówstopowych
uzyskane metodą sztucznych sieci neuronowych,
Zawartość Cu, Mg, Mn i Fe,
w [% mas.]
3,5
Cu
Mg
Mn
Fe
3,0
2,5
2,0
1,5
1,0
0,5
0,0
8,0
9,0
10,0
11,0
12,0
13,0
Zawartość krzemu, w [% mas.]
Rys. 4. Wyniki optymalizacji stopów przy wykorzystaniu metody sztucznych sieci neuronowych
[2]
Fig. 4. Results of alloy optimization done by the method of artificial neural networks [2]
Z porównania wyników opracowania danych eksperymentalny ch przy wykorzystaniu sztucznych sieci neuronowych (rys. 4) z rezultatami klasycznej optymalizacji
(tabela 2) wynika dobra zbieżność obydwu metod. Zauważalne są jedynie niewielkie
odstępstwa dotyczące stężenia krzemu i szczególnie magnezu. Jak pokazała pogłębiona
analiza, jest to następstwem niewielkiej ilości (3.) stopów eksperymentalnych przyjętych do wyznaczenia optymalnego składu chemicznego na drodze uśrednień.
Wokół wyników, wykorzystujących sztuczne sieci neuronowe, uzyskanych na
pierwszym etapie optymalizacji, można wykonać kolejne eksperymenty, które w podobny sposób pozwolą przybliżyć się do rozwiązań pożądanych. W wyjątkowych wypadkach konieczne może się okazać zastosowanie kolejnych etapów. Taka procedura
składa się na nową jakość ewolucyjnej optymalizacji tworzyw (w tym odlewniczych),
o zadanych z góry właściwościach, jako istotnego elementu procedury projektowania
nowych materiałów.
5.
WNIOSKI KOŃCOWE
Na podstawie przeprowadzonego porównania dwóch sposobów optymalizacji
składu chemicznego bezniklowych siluminów typu tłokowego można przedstawić następujące wnioski:

w przypadku złożonych – co do składu chemicznego – stopów jakimi są na
przykład siluminy tłokowe, w stosunku do których wysuwanych jest szereg –
często sprzecznych – wymagań, istnieją określone trudności i złożoność klasycznego matematycznego modelowania oraz optymalizacji,
69

zaletą syntezy stopów, przy wykorzystaniu sztucznych sieci neuronowych, jest
prostota i szybkość oraz brak konieczności ścisłego trzymania się reguł plan owanego eksperymentu,

zarówno klasyczna metoda modelowania i optymalizacji, jak też metodologia
wykorzystująca ideę sztucznych sieci neuronowych pokazała, że możliwe jest
opracowanie bezniklowych siluminów o parametrach zbliżonych, a niekiedy
przewyższających standardowe wzorce z niklem (stopy typu AK12),

mając na uwadze odnotowane tylko przykładowe możliwości, autorzy ninie jszej publikacji uważają za celowe potrzebę szerszego wdrażania do badań
i praktyki odlewniczej metod sztucznej inteligencji - i sieci neuronowych
w szczególności.
LITERATURA
[1] Lech Z., Pietrowski S., Czekaj E. i in.: Synteza i badania bezniklowych siluminów
tłokowych. Sprawozdanie końcowe z projektu badawczego Nr 7 T08B 067 20 realizowanego na zlecenie M N i I (KBN) w latach 2001-2004. Instytut Odlewnictwa,
Kraków 2004.
[2] Krokosz J., Czekaj E., i in.: Wykorzystanie sieci neuronowej do analizy parametrów technologicznych i konstrukcyjnych odlewów. Sprawozdanie końcowe
z działalności statutowej (Zlecenie M E i N, nr 4041/00). Instytut Odlewnictwa,
Kraków 2005.
[3] Gulayev B.B.: Sintiez litiejnych splavov. V knigi,: Osnovy obrazovaniya litieynych
splavov. M.: Nauka, Moskva 1970, s. 25-41.
[4] Gulayev B.B.: Sintiez splavov (Osnovnyje principy. Vybor komponientov) . „Mietallurgiya”. Moskva, 1984.
[5] Gulayev B.B.: Sintiez litieynych splavov. Uchebnoye posobiye. Gosudarstviennyy
Technicheskiy Usniversitiet. L., Leningrad 1991, 80 s.
[6] Gulayev B.B., Zaplatkin J.J.: Sintiez mnogokomponientnych litieynych splavov. Litieynoye Proizvodstvo, Nr 6, s. 4 –6.
[7] Górny Z.: Odlewnicze stopy metali nieżelaznych – przygotowanie ciekłego metalu,
struktura i właściwości odlewów. Wydawnictwa Naukowo-Techniczne. Warszawa
1992.
[8] Sobczak J. Podstawy syntezy stopów. Wyd. Instytut Odlewnictwa. Kraków 1997.
[9] Górny Z., Sobczak J.: Nowoczesne tworzywa odlewnicze na bazie metali nieżelaznych. ZA-PIS, Kraków 2005, 479 s.
[10] Czekaj E. Oszczędnościowe aluminiowo-krzemowe stopy – jako materiał na tłoki.
Praca doktorska. Politechnika Charkowska (Ukraina), Charków 1985.
[11] Lech Z., Czekaj E.: Stabilizacja materiałów i geometrii tłoków silników spalinowych. Sprawozdanie końcowe z projektu badawczego nr PB 370/S6/92/02. Kraków
1994.
70
ARCHIWUM ODLEWNICTWA
[12] Stop na zamówienie. Świat Nauki, sierpień 2003, s.13. (na podstawie artykułu
w Science z 18 kwietnia 2003 r.).
[13] Rutkowski L.: Metody i techniki sztucznej inteligencji. Wydawnictwo Naukowe
PWN, Warszawa 2005.
[14] Tadeusiewicz R.: Wprowadzenie do sieci neuronowych. Materiały Seminarium
NEUROMET’77. AGH, Kraków 1997.
[15] Tadeusiewicz R.: Elementarne wprowadzenie do techniki sieci neuronowych
z przykładowymi programami. Akademicka Oficyna Wydawnicza PLJ. Warszawa
1998.
[16] Świętnicki Z., Wantoch-Rekowski R.: Sieci neuronowe w zastosowaniach wojsk owych. Dom Wydawniczy BELLONA, Warszawa 1998.
[17] Perzyk M., Kochański A., Kozłowski J.: Systemy monitorujące i sterujące produkcją odlewni wykorzystujące sztuczne sieci neuronowe. Archiwum Odlewnictwa,
Rok 2003, Rocznik 3, Nr 8, s. 157-170. Wydawnictwo PAN, Katowice-Gliwice
2003.
[18] Perzyk M., Biernacki R.: Diagnostyka przyczyn powstawania wad w odlewach
z wykorzystaniem metod statystycznych i sieci neuronowych. Archiwum Odlewnictwa, Rok 2004, Rocznik 4, Nr 11. PAN-Katowice, s. 71-76.
[19] Polański Z.: [po2] Polański Z.: Planowanie doświadczeń w technice. Państwowe
Wydawnictwo Naukowe. Warszawa 1984.
[20] Bonderek Z., Czekaj E., Saja K.: Badania powstawania i propagacji pęknięć
w warunkach cyklicznych obciążeń cieplnych w okołoeutektycznych bezniklowych
siluminach tłokowych. Materiały VI Konferencji Naukowo-Technicznej Odlewnictwa Metali Nieżelaznych „Nauka i Technologia”. Zakopane-Kościelisko 2003, s.
83-91.
[21] Stanisz A.: Przystępny kurs statystyki z wykorzystaniem programu STATISTICA
PL na przykładach z medycyny. Tom II. StatSoft Polska. Kraków 2000.
[22] Dobosz M.: Wspomagana komputerowo statystyczna analiza wyników badań . Akademicka Oficyna Wydawnicza EXIT. Warszawa 2001.
[23] Shoup T. E: A practical guide to computer methods for engineers. Prentice-Hall,
Inc., Englewood Cliffs, N.J., 1979.
[24] Stadnicki J.: Teoria i praktyka rozwiązywania zadań optymalizacji – z przykładami
zastosowań technicznych. Wydawnictwa Naukowo-Techniczne. Warszawa 2006.
[25] Osowski S.: Sieci neuronowe do przetwarzania informacji. Oficyna Wydawnicza
Politechniki Warszawskiej. Warszawa 2000.
[26] Wprowadzenie do sieci neuronowych. StatSoft Polska Sp. z o.o., Kraków 2001.
[27] Stateczny A., Praczyk t.: Sztuczne sieci neuronowe w rozpoznawaniu obiektów
morskich. Gdańskie Towarzystwo Naukowe. Gdynia 2002.
[28] Mathematical handbook for scientists and engineers. Definitions, theorems and
formulas for reference and review. Edited by: G.A. Korn & T.M Korn. McGrawHill Book Company. New York, San Francisco, Toronto, London, Sydney, 1968.
[29] Reinhardt F., Soeder H.: Atlas matematyki. Prószyński i S-ka. Warszawa 2006.
[30] http://pl.wikipedia.org/wiki/Perspektywa.
71
[31] Stawowy A., Macioł A., Wrona R.: Sieć neuronowa do predykcji własności wytrzymałościowych odlewu. Archiwum Odlewnictwa, Rok 2004, Rocznik 4, Nr 11.
PAN-Katowice, s. 222-227.
[32] Sałat R., Krokosz J.: Próba interpretacji wyników analizy składu chemicznego pod
kątem lokalizacji odlewów z epoki brązu z wykorzystaniem „odwzorowania Sa mmona”. Odlewnictwo - Nauka i Praktyka, Nr 1/2004, s. 23-31.
[33] Brzózka J., Dorobczyński L.: Matlab. Środowisko obliczeń naukowo-technicznych.
Wydawnictwo MIKOM. Warszawa 2005.
AN ASSESSMENT OF THE POSSIBILITY TO USE ARTIFICIAL NEURAL
NETWORKS IN THE SYNTHES IS OF SILUMINS
SUMMARY
In the article a comparison has been made between the results of standard
mathematical modeling and optimization during synthesis of nickel-free piston silumins
[1] and the results obtained during processing of the same experimental data by the
methods of artificial neural networks [2].
The material presented is a fragment of broader study executed in 2005 by the
Foundry Research Institute in Cracow within its statutory activity. The study
no. 4041/00 commissioned by the Ministry of Science and Education was done under
the heading of "Application of neural networks in analysis of casting design and eng ineering parameters" [2].
Recenzował: prof. zw. dr hab. inż. Stanisław Pietrowski
72

Podobne dokumenty