WAE Jarosław Arabas Testowanie metod optymalizacji
Transkrypt
WAE Jarosław Arabas Testowanie metod optymalizacji
WAE Jarosław Arabas Testowanie metod optymalizacji Metoda optymalizacji jako generator propozycji rozwiązań Metoda optymalizacji 1. generacja rozwiązań 2. ewaluacja rozwiązań ewaluator Metoda optymalizacji jako generator propozycji rozwiązań Metoda optymalizacji 4. wykorzystanie wartości funkcji celu 3.przypisanie wartości funkcji celu ewaluator Informacyjne sprzężenie zwrotne optymalizator – ewaluator Metoda optymalizacji 1. generacja rozwiązań 4. wykorzystanie wartości funkcji celu 2. ewaluacja rozwiązań 3.przypisanie wartości funkcji celu ewaluator Optymalizacja typu “czarna skrzynka” (black box) Metoda optymalizacji ewaluator Testowanie metod optymalizacji z założeniem “czarnej skrzynki” ● Zadania benchmarkowe CEC 2005 … 2013 Metoda optymalizacji BBOB 2009 … 2013 ● Krzywe “zbieżności” (minimalizacja) 10.2 10 q(xk) 9.8 ewaluator 9.6 9.4 9.2 9 0 50 100 150 200 250 k 300 350 400 450 500 Testowanie metod optymalizacji z założeniem “czarnej skrzynki” ● Zadania benchmarkowe CEC 2005 i następne … CEC2013 BBOB 2009 i 2010 ● Krzywe “zbieżności” 10.2 11 10.8 10 10.6 10.4 9.8 q(xk) q(xk) 10.2 9.6 9.4 10 9.8 9.6 9.4 9.2 9.2 9 9 0 50 100 150 200 250 k 300 350 400 450 500 0 50 100 150 200 250 k 300 350 400 450 500 Testowanie metod optymalizacji ● Porównanie metod losowych 11 11 10.8 10.8 10.6 10.6 10.4 10.4 10.2 q(xk) 10 9.8 9.6 10 9.8 9.6 9.4 9.4 9.2 9.2 9 0 50 100 150 200 250 300 350 400 450 500 k 9 0 50 100 150 200 250 300 350 400 450 k 1.2 1 Dystrybuanta empiryczna rozwiązań uzyskanych po założonym czasie dla dwóch algorytmów 0.8 częstość q(xk) 10.2 0.6 0.4 0.2 0 9 9.5 10 10.5 q(x) 11 11.5 500 Testowanie metod optymalizacji Porównanie algorytmów na podst. dystrybuanty rozwiązań (testy nieparametryczne) 1.2 1.2 1 1 0.8 0.8 częstość częstość ● 0.6 0.4 0.2 0.6 0.4 0.2 0 9 9.5 10 10.5 q(x) Algorytm B jest gorszy niż algorytm A 11 11.5 0 9 9.5 10 10.5 11 q(x) Nie można stwierdzić, że jeden jest lepszy od drugiego 11.5 Testowanie metod optymalizacji Porównanie algorytmów na podst. porównania statystyk (testy parametryczne) 1.2 1 10.57 0.32 9.95 0.35 0.8 częstość ● 0.6 0.4 0.2 0 9 9.5 10 10.5 11 q(x) Algorytm B jest gorszy niż algorytm A Dystrybuanty rozkładu normalnego (idea testu t-Studenta) 11.5 Testowanie hipotez statystycznych ● ● ● ● Stawiamy hipotezę zerową (null hypothesis) Test jest procedurą obliczającą p-wartość, czyli wartość pewnej statystyki, będącej prawdopodobieństwem zaobserwowania danych przy założeniu prawdziwości hipotezy zerowej Jeśli p-wartość jest mniejsza od zakładanej, hipoteza zerowa jest odrzucana Testy statystyczne są obecne w każdym szanującym się pakiecie naukowym Testowanie metod optymalizacji ● Porównanie wielu algorytmów dla jednego zadania A1 A2 A3 A4 A1 A2 A3 A4 . + + . . - + . + . + . Na podstawie porównań w parach ● Porównanie wielu algorytmów dla wielu zadań A1 A2 A3 A4 Z1 2 4 3 1 Z2 3 2 1 1 Z3 1 1 1 1 Z4 1 2 2 3 Z5 średnia 4 2.2 1 2 2 1.8 3 1.8 Wygrywają ex aequo metody A3 i A4 A1 A2 A3 A4 bilans 1 -2 -1 2 ranga 2 4 3 1 Agregacja tabeli porównań Testowanie hipotez statystycznych Figures often beguile me, particularly when I have the arranging of them myself; in which case the remark attributed to Disraeli would often apply with justice and force: "There are three kinds of lies: lies, damned lies and statistics." - Mark Twain's Own Autobiography: The Chapters from the North American Review No Free Lunch Theorem (NFL) ● Nie wiedząc z góry, jakie zadanie optymalizacji przyjdzie nam rozwiązać, nie możemy dobrać efektywnej metody dla niego Effects of accepting a free lunch