OBLICZENIA EWOLUCYJNE wykład 4

Transkrypt

www.kwmimkm.polsl.pl
⎣
OBLICZENIA
EWOLUCYJNE
FITNESS F.
COMPUTATION
chromosome
wykład 4
FITNESS F.
COMPUTATION
Ograniczenia:
EVOLUTIONARY OPERATORS
fitness f. value
xk +1 = xk + u, k
MIGRATION PHASE
communication
with other
subpopulations
TERMINATION
CONDITION
gdzie:
NO
END
1
Chromosom ≡ wektor sterowania u
x0 – stan początkowy;
xk ∈ R – stan;
u ∈ RN – poszukiwany wektor sterowania.
Wersja binarna:
binarna:
2
• Każdy element wektora chromosomu zakodowano
za pomocą tej samej liczby bitów;
Dziedzina:
Dziedzina: 〈-200, 200〉
200〉 dla każ
każdego ui.
Optimum:
k = 0, 1,..., N -1
SELECTION
YES
Przyję
Przyjęto:
to: x0=100, N=45
⎦
(charakteryzującej np. wydajność produkcji albo zużycie paliwa)
INITIAL
SUBPOPULATION
SENDING CHROM. TO
COMPUTERS
AND RECEIVING FITNESS F.
VALUE
=0
STEROWANIE OPTYMALNE - sterowanie automatyczne,
w którym następuje ukształtowanie przebiegu sygnału sterującego
powodujące maksymalizację lub minimalizację wartości funkcji celu.
celu.
START
FITNESS F.
COMPUTATION
Test:
Test: poró
porównanie
wnanie wydajnoś
wydajności
kodowania binarnego i zmiennopozycyjnego.
zmiennopozycyjnego.
Zadanie sterowania:
sterowania:
N −1
⎡
⎤
J = min ⎢ x N2 + ∑ ( xk2 + u k2 ) ⎥
k
(u = 〈u0, ..., u44〉).
• Każdy chromosom jest wektorem składającym się
z N słów;
J * = K 0 h02
Nie pozwala na zwiększenie dokładności bez zwiękzwiększenia liczby bitów;
Przy wzroście rozmiarów dziedziny dokładność
maleje przy konieczności zachowania stałej liczby
bitów.
tu:
tu: J* = 16180.4
3
Wersja zmiennopozycyjna:
zmiennopozycyjna:
4
Porównywalność algorytmów:
algorytmów:
• Stała liczebność populacji (60
(60 osobników)
• Każdy chromosom to wektor liczb zmiennopozycyjzmiennopozycyjnych o długości zgodnej z wektorem rozwiązania;
• Stała liczba pokoleń (20
(20 000)
000)
• W reprezentacji binarnej użyto 30 bitów do zakodozakodo-wania
jednej zmiennej, co daje:
30*45=1350
45=1350 bitów w chromosomie.
• Operatory określono tak, by każdy element
chromosomu mieścił się w wymaganym zakresie.
• Mimo użycia różnych operatorów (co wynika ze sposobu
☺ Pozwala uwzględnić bardzo duże dziedziny jak
również przypadki o nieznanych dziedzinach;
kodowania zadania i może powodować różnice w interpretacji)
parametry programu dobrano tak, by wyniki mogły zostać
uczciwie porównane.
☺ Łatwiej jest zaprojektować specjalistyczne narzędzia
ułatwiające postępowanie w przypadku nietrywialnych
ograniczeń.
(np. w przypadku reprezentacji binarnej użyto klasycznych
operatorów, jednak zezwolono na krzyżowanie tylko pomiędzy
elementami).
5
6
1
Wyniki:
L. elementów
(N )
5
15
25
35
45
Czas CPU [s]
zmiennopoz.
binarnie
184
1080
398
3123
611
5137
823
7177
1072
9221
Czas [s]
10000
• Reprezentacja zmiennopozycyjna jest szybsza.
szybsza.
• Reprezentacja zmiennopozycyjna jest stabilniejsza (daje
bardziej zbliżone wyniki w różnych przebiegach).
• Reprezentacja zmiennopozycyjna jest dokładniejsza
(szczególnie w większych dziedzinach).
zmiennopoz.
binarnie
• Działanie algorytmów (szybkość, zbieżność) można
poprawić wprowadzając specjalne operatory.
operatory.
8000
6000
4000
• W przypadku kodowania binarnego dla dużych dziedzin
i wymaganej większej dokładności różnice w czasach
obliczeń powiększają się.
się.
2000
0
5
15
25
35
Wnioski z testów:
l. elem. (N)
45
7
ZADANIE
OPTYMALIZACJI
MODYFIKACJA
PROBLEMU
8
Modyfikacje:
• łańcuchy o zmiennej długości;
• struktury bogatsze od łańcuchów (np. macierze);
MODYFIKACJA
ALGORYTMU
• zmodyfikowane operatory;
• nowe operatory (inwersja, klonowanie, itp.);
ZMODYFIKOWANY
PROBLEM
ALGORYTM
EWOLUCYJNY
• inna niż binarna reprezentacja zadania;
• „pamięć” chromosomu;
• ...
Zastosowanie AE
KLASYCZNY AG
„zmieniony AG”, „ulepszony AG”, „zmodyfikowany AG”,
ROZWIĄZANIE
OPTYMALNE
...
9
Różnorodne programy opierające się na
zasadzie ewolucji mogą się różnić:
10
ALGORYTMY EWOLUCYJNE
Rozwinięcie idei klasycznych AG w kierunku systemów
bardziej skomplikowanych, zawierających:
• odpowiednie struktury danych (kodowanie);
• odpowiednie operatory.
• strukturą danych;
• operatorami;
• metodami tworzenia populacji początkowej;
• sposobami uwzględniania ograniczeń zadania;
• parametrami.
Słabość AE – podstawy teoretyczne:
• tylko dla czystych AG istnieje tw.
tw. o schematach;
• w innych podejściach tylko w niektórych przypadkach
można wykazać teoretycznie ich zbieżność (np. strategie
Zasada działania nie zmienia się:
populacja osobników podlega pewnej transformacji zaś
osobniki starają się przetrwać w procesie ewolucji.
AG
AE
ewolucyjne stosowane do zadań regularnych).
11
Zwykle jednak tylko uzyskujemy interesujące wyniki...
12
2
Równoległość AG i AE:
„W świecie, w którym algorytmy sekwencyjne są przerabiane
na równoległe za pomocą niezliczonych sztuczek i
łamańców, jest niemałą ironią, że AG (algorytmy wysoko
równoległe) są przerabiane na sekwencyjne za pomocą
równie nienaturalnych sztuczek i wykrętów”
START
OPERATORY
EWOLUCYJNE
WARUNEK
ZATRZYMANIA
STOP
f. celu
PROCES
ZARZĄDZAJĄCY
T
komunikacja
z innymi
podpopulacjami
Max liczba procesorów:
(l. podpopulacji)⋅(l. osobników)
14
procedure Algorytm_Ewolucyjny
begin
t:=0
wybierz populację początkową P(t)
oceń P(t)
while (not warunek_zakończenia) do
begin
wybierz T(t) z P(t) (reprodukcja)
utwórz O(t) z T(t) (działanie operatorów ewolucyjnych)
oceń O(t)
utwórz P(t+1) z O(t) i P(t) (sukcesja)
t:=t+1
end
T – temporary - tymczasowy
end
AE to rozwinięcie i uogólnienie AG.
Należy jednoznacznie określić:
• schemat działania AE;
• metodę selekcji;
• sposób kodowania i operatory genetyczne;
• środowisko działania AE.
SUKCESJA
(postselekcja)
chromosom
13
Dla danego problemu można określić wiele sposobów
kodowania i zdefiniować szereg operatorów (np. zadanie
komiwojażera).
+
(F. CELU)
SELEKCJA
N
REPRODUKCJA
(preselekcja)
FEM
FEM
MIGRACJA
Rozproszony AE – znaczące przyspieszenie obliczeń
=
...
FEM
POPULACJA
POCZĄTKOWA
Goldberg,
Goldberg, 1995
SELEKCJA
Rozproszony AE, autor: Wacław KUŚ:
O – offspring - potomny
15
16
procedure Algorytm_Ewolucyjny
begin
t:=0
wybierz populację początkową P(t)
oceń P(t)
while (not warunek_zakończenia) do
begin
wybierz T(t) z P(t) (reprodukcja)
utwórz O(t) z T(t) (operatory)
oceń O(t)
utwórz P(t+1) z O(t) i P(t) (sukcesja)
t:=t+1
end
end
Napór selekcyjny (selektywny nacisk):
nacisk):
Tendencja algorytmu do poprawiania wartości średniej
przystosowania.
Reprodukcja – tworzenie populacji tymczasowej T(t),
która jest poddawana działaniu operatorów genetycznych
tworząc populację potomną O(t).
Sukcesja – tworzenie nowej populacji bazowej P(t+1)
z populacji potomnej O(t) oraz starej populacji
bazowej P(t).
Algorytm charakteryzuje się tym większym naporem
selekcyjnym, im większa jest oczekiwana liczba kopii
lepszego osobnika w porównaniu z oczekiwaną liczbą kopii
osobnika gorszego.
gorszego.
17
18
3
Twarda (brutalna) selekcja – wybór do populacji
potomnej i powielanie tylko najlepszego osobnika
METODY REPRODUKCJI
KOŁ
KOŁO RULETKI
(metoda stochastycznego wzrostu).
Przyjęcie jednakowego prawdopodobieństwa algorytm błądzi przypadkowo (brak
(brak selekcji).
selekcji).
– jak w AG...
AG...
REPRODUKCJA TURNIEJOWA
W AE - metoda pośrednia, zwana „miękką
„miękką
selekcją”.
selekcją”.
• Wybó
ybór k osobnikó
osobników (rozmiar turnieju, zwykle k=2) i selekcja
najlepszego z grupy.
• Powtarzane pop_size razy.
19
REPRODUKCJA RANKINGOWA
20
METODY SUKCESJI
SUKCESJA TRYWIALNA
Szeregowanie osobnikó
osobników według
według wartoś
wartości przystosowania
i selekcja zgodnie z kolejnoś
kolejnością
cią (wg tzw. linii rangi ):
(z cał
całkowitym zastę
zastępowaniem)
Nową populacją bazową staje populacja potomna:
25
25
20
20
15
15
10
10
5
5
0
0
1
2
3
4
5
6
7
8
9
10
P(t+1) = O(t)
(jak w AG).
☺ Najbardziej odporna na przedwczesną zbieżność.
1
2
3
4
5
6
7
8
9
Najwolniej prowadzi do rozwiązania optymalnego.
10
☺ zapobiega powstawaniu superosobnikó
superosobników;
Może prowadzić do sytuacji, w której nie zawsze
najlepsze rozwiązania z populacji P(t) znajdą się
w populacji P(t+1);
+1);
pomija informację
informację
o wzglę
względnych ocenach osobnikó
osobników.
21
SUKCESJA
Z CZĘŚ
CIOWYM ZASTĘ
CZĘŚCIOWYM
ZASTĘPOWANIEM
SUKCESJA ELITARNA
Gwarantuje przeżycie co najmniej najlepszego osobosob-nika
poprzez odpowiedni wybór osobników z P(t) do P(t+1)
W nowej populacji bazowej są osobniki z populacji
potomnej i ze starej populacji bazowej
P(t+1) = O(t) + P(t)
☺ Wzrost wielkości elity powoduje przyspieszenie
zbieżności algorytmu.
☺ Prowadzi zwykle do stabilniejszej pracy AE.
Wzrost wielkości elity powoduje większe prawdoprawdopodobieństwo osiągania ekstremów lokalnych.
Może spowodować tendencję do osiągania maksimów
lokalnych.
Mechanizm usuwania (warianty):
• usuwanie najgorzej przystosowanych osobników;
• usuwanie osobników podobnych do potomnych;
• usuwanie losowo wybranych osobników.
22
Wartość wielkości elity δ decyduje o naporze selekselekcyjnym (δ=0 – sukcesja trywialna).
Najkorzystniej – jeden, ew. kilka osobników).
23
24
4
G – dziedzina funkcji;
funkcji;
X – maksimum lokalne
funkcji przystosowania;
przystosowania;
EKSPLORACJA
I
EKSPLOATACJA
Eksploracja:
Wybranie zbioru G(X*), zawierającego maksimum
globalne X* z rodziny obszarów przyciągania ekstremów
lokalnych.
Eksploatacja:
Przeszukiwanie obszaru przyciągania G(X) w celu
wyznaczenie maksimum lokalnego X (sprowadza się do zadania
25
• Najczęściej informacja o rodzinie obszarów przyciągania
i wartości funkcji przystosowania w maksimach lokalnych
nie jest dostępna,
dostępna, a jej pozyskanie jest bardzo kosztowne.
kosztowne.
• Zadanie optymalizacji globalnej jest nierozwiązywalne
(w ogólnym przypadku, w dokładnym sensie).
• Poszukuje się metod optymalizacji prowadzących do
uzyskania dobrych rozwiązań przybliżonych
z akceptowalnym kosztem – jak algorytmy ewolucyjne.
LOSOWOŚĆ W AE
optymalizacji lokalnej).
26
OCENA
DZIAŁANIA
AE
27
28
• Należy dokonać wielu niezależnych uruchomień dla losowej
próby różnych populacji bazowych P(0).
Różne zachowanie algorytmu w niezależnych
uruchomieniach przy jednakowych ustawieniach
parametrów i identycznych populacjach początkowych…
• W przypadku wielu uruchomień dla tej samej populacji P(0)
można mówić o właściwościach danego algorytmu dla
konkretnej populacji początkowej.
Losowość jest wprowadzana w AE:
• Podczas generowania populacji początkowej.
• Porównywane dwa algorytmy: wskazane jest aby próba ta
była taka sama
• W procesie wyboru populacji potomnej na drodze
reprodukcji (ukierunkowanie działania AE).
(dla każdej losowej populacji początkowej uruchamia się dwa
porównywane algorytmy).
• Podczas działania operatorów ewolucyjnych (próbkowanie
przestrzeni roboczej).
29
30
5
ANALIZA STATYSTYCZNA:
KRZYWE ZBIEŻNOŚCI
• Analiza wartości oczekiwanej i odchylenia standardowego wartości
przystosowania w populacji bazowej.
• Są wykresem zmian wartości rozwiązania roboczego
(średniego, najlepszego, najgorszego) w czasie.
• Uwzględnienie informacji o min. i max.
max. osiąganej wartości.
• Kreśli się je:
- dla pojedynczego uruchomienia algorytmu;
• Uwzględnienie informacji o liczbie przypadków niewiele różnych od
od
najlepszego.
• Prezentacja wyników w postaci
histogramu pozwala ocenić
właściwości rozkładu, które mogą
umknąć przy analizie ograniczonej
jedynie do statystyki liczbowych.
- dla wielu niezależnych uruchomień.
(Uśrednione – bardziej reprezenreprezentatywne,
tatywne, lecz gubi się niektóre
informacje o zachowaniu AE
w pojedynczych uruchomieniach).
częstość
pokolenie:
163
20
15
wartość f. przystosowania
max
śr
min
10
Przykładowe krzywe zbieżności
(dla 1 uruchomienia algorytmu):
5
0
6
8
10
12
32
Szczególna krzywa zbieżności:
pokolenie
14
16
18
20
31
KOSZT SYMULACJI A LICZBA POKOLEŃ
Wykres zmian w kolejnych pokoleniach wartości przysprzystosowania najlepszego osobnika znalezionego
od początku działania AE.
• W wielu metodach optymalizacji koszt jest utożsamiany
z liczbą iteracji metody (przetwarzane jest jedno rozwiązanie).
Po zakończeniu działania AE osobnik ten jest rozwiązaniem
wyznaczonym. przez pojedyncze uruchomienie AE.
• W przypadku algorytmów ewolucyjnych liczba obliczeń
wartości funkcji przystosowania w pojedynczej iteracji
algorytmu ewolucyjnego jest zależna od liczności populacji
potomnej (przetwarzana jest populacja rozwiązań).
200
150
100
Np.:
50
0
10
20
30
40
50
60
70
100 iteracji (pokoleń) i 10 osobników
100 iteracji (pokoleń) 1000 osobników
80
pokolenie
33
34
• Dowody zbieżności są znane jedynie dla pewnych
szczególnych przypadków funkcji przystosowania (takich
jak funkcja kwadratowa).
• Optymalne kryterium - stwierdzenie, że rozwiązanie
wygenerowane przez AE jest dostatecznie dobrym
przybliżeniem maksimum globalnego funkcji celu.
KRYTERIA
ZATRZYMANIA
AE
• To implikuje znajomość tego maksimum jeszcze przed
rozpoczęciem optymalizacji...
optymalizacji...
KRYTERIA ZATRZYMANIA:
• Polegające na monitorowaniu wartości funkcji przyprzystosowania osobników generowanych przez algorytm;
• Monitorujące zdolność algorytmu do eksploracji przestrzeni
genotypów.
genotypów.
35
36
6
MONITOROWANIE
MONITOROWANIE WARTOŚ
WARTOŚCI
FUNKCJI PRZYSTOSOWANIA
Kryterium maksymalnego kosztu
• Algorytm kończy działanie, jeśli koszt algorytmu przekroczy
założoną wartość maksymalną Kmax.
Φ
• Wartość Kmax jest najnajczęściej związana ze
specyfiką zadania.
• Często:
Często: przyjęcie pewpewnej maksymalnej liczby
pokoleń algorytmu.
(Czas działania zależy niejawnie
od liczby nowych osobników generowanych w każdym pokoleniu!
pokoleniu!)
Kryterium min. szybkości poprawy
Zwykle nie jest łatwo (bez
dostatecznie dobrej znajoznajomości funkcji przystosowania)
określić wartość zadowalającą.
Φ
Φs
t
37
Algorytm jest zatrzymywany, jeśli w kolejnych τ obliobliczeniach wartości f. przystosowania nie uda się popo-prawić
wyniku o więcej niż ε.
38
MONITOROWANIE
ZDOLNOŚCI EKSPLORACYJNYCH
• Zdolność algorytmu do eksploracji przestrzeni genogenotypów jest czynnikiem warunkującym odporność
algorytmu na ekstrema lokalne.
Często ε = 0 - AE zatrzymywany, jeśli nie uda się uzyskać
lepszego rozwiązania w kolejnych τ pokoleniach.
Φ
Zatrzymanie działania gdy AE znajdzie rozwiązanie
o wartości funkcji przystosowania Φs określonej przez
użytkownika jako zadowalająca.
AE może działać dowolnie
długo (należy dodatkowo
określić maksymalny koszt
znalezienia rozwiązania).
t
tmax
Kryterium zadowalającego poziomu funkcji
przystosowania
• Zdolność taka wynika zarówno z różnorodności populacji
bazowej,
bazowej, jak również z zasięgu operatora mutacji (jeśli
podlega on samoczynnej adaptacji).
min. szybkość poprawy
ε
τ
t
39
40
Kryterium zaniku różnorodności populacji
Różnorodność:
Kryterium zatrzymania bazujące na różnorodności populacji
wykorzystuje fakt, że obniżenie różnorodności poniżej
pewnego poziomu świadczy o przejściu do etapu
eksploatacji obszaru przyciągania ekstremum.
ekstremum.
• wpływa na odporność algorytmu ewolucyjnego na
ekstrema lokalne;
• sprawia, że krzyżowanie ma duży zasięg;
• powoduje w efekcie, że algorytm dość szybko generuje
nowe rozwiązania.
Algorytm należy wówczas zatrzymać i wykorzystać pewną
metodę lokalną do dokładnego wyznaczenia tego
ekstremum.
Zanik różnorodności – przełączenie się na przeszukiwaprzeszukiwa-nia
ograniczone do niewielkiego obszaru
(zwykle równoważne z eksploatacją obszaru przyciągania jednego
ekstremum – niekoniecznie globalnego).
globalnego).
41
42
7
Kryterium zaniku samoczynnie adaptoadaptowanego zasięgu operatora mutacji
KODOWANIE
I
OPERATORY
GENETYCZNE
• Hipoteza (eksperymentalnie potwierdzona), że jeśli w AE
stosuje się adaptację zasięgu mutacji,
mutacji, to od pewnego
momentu zasięg ten ma trwałą tendencję do zmniejzmniejszania się.
się.
• Ograniczenie zasięgu wiąże się z przełączeniem AE na
eksploatację znalezionego obszaru przyciągania.
• Oblicza się dla populacji bazowej wartość średnią
standardowych odchyleń pamiętanych w genotypach
osobników wykorzystywanych podczas mutacji.
• Spadek tej wartości poniżej pewnego progu
σmin – zakończenie działania.
43
44
DEDYKOWANE OPERATORY GENETYCZNE
DOBÓR SPOSOBU KODOWANIA
• Pozwalają poprawić działanie algorytmu dla pewnej
konkretnej klasy zadań (ścisły związek z rozpatrywanym
Jeśli środowisko jest zdefiniowane na podstawie funkcji
celu i ograniczeń, to wskazane jest dobranie takiego
kodu genetycznego, by:
• Powstałe z ich użyciem AE stają się nierzadko
konkurencją wobec innych metod rozwiązywania tych
zadań;
• każde rozwiązanie zadania dało się reprezentować jako
genotyp;
genotyp;
• kodowanie nie wprowadzało dodatkowych ekstremów
lokalnych funkcji przystosowania.
problemem);
• Cena – utrata ogólności algorytmu (dla zadań innej klasy
może być on bardzo nieefektywny lub niemożliwy do
zastosowania).
DOBÓR OPERATORÓW GENETYCZNYCH
1. Spójność algorytmu ze względu na operacje genetyczne.
Dyskusja o wyższości jednych operatorów nad innymi
sprowadza się najczęściej do przeprowadzenia ekspeeksperymentów porównawczych i analizy ich wyników.
2. Brak obciążeń operatorów.
45
46
Przykłady:
• AG z kodowaniem binarnym, krzyżowaniem
jednopunktowym i bez operatora mutacji nie spełnia
postulatu spójności
SPÓJNOŚĆ ALGORYTMU ZE WZGLĘDU NA
OPERACJE GENETYCZNE
(gdy populacja bazowa zawiera kopie tego samego osobnika, to
niemożliwe jest wygenerowanie jakiegokolwiek innego osobnika).
• Jest to możliwość wygenerowania dowolnego chrochromosomu z dowolnego innego, posługując się jedynie
operatorami genetycznymi.
genetycznymi.
• jeśli jedynym operatorem genetycznym jest mutacja
bitowa,
bitowa, to postulat spójności jest spełniony.
• Spełnienie postulatu spójności wyklucza niebezpieniebezpieczeństwo,
czeństwo, że w wyniku niewłaściwej inicjalizacji populacji
bazowej algorytm ewolucyjny nie ma możliwości
znalezienia optimum globalnego.
BRAK OBCIĄŻEŃ OPERATORÓW
47
Operator jest obciążony,
obciążony, jeżeli przy braku naporu selekselekcyjnego niektóre osobniki będą bardziej uprzywilejowane
w stosunku do innych.
48
8

OBLICZENIA EWOLUCYJNE wykład 4

Transkrypt

Podobne dokumenty

Konsultacje CV.cdr - Biuro Karier Studenckich

Forum Wodne to debata, celem której jest otwarta dyskusja w

kontrola jakości części maszyn pod kątem dokładności wymiarowo

Sposób lutospawania laserowego złącza folia

KONSULTACJI Z DORADCĄ BIZNESOWYM

ebm papst – plakat