Prezentacja programu PowerPoint
Transkrypt
Prezentacja programu PowerPoint
12/5/2013 Prof. Danuta Makowiec Instytut Fizyki Teoretycznej i Astrofizyki p.353, tel.: 58 523 2466 [email protected] Problem przetasowań w genomie Sortowanie przez odwrócenia Algorytmy przybliżone Algorytm zachłanny dla problemu znalezienia motywu Wykład nr 8 BIOINFORMATYKA rok II Algorytm zachłanny: wyznaczanie rozwiązania globalnie optymalnego w oparciu o aktualne (lokalne) krokowo dobierane optymalne warunki Problem plecakowy: Input : zbiór elementów o określonej wadze i wartości oraz plecak o zadanym udźwigu Output: podzbiór elementów taki, że suma wartości jest możliwie największa, a suma wag jest niewiększa niż udźwig plecaka. http://pl.wikipedia.org/wiki/Problem_plecakowy 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [2] 1 12/5/2013 Algorytm zachłanny dla problemu plecakowego 1. Posortuj przedmioty według stosunku wartości do wagi 2. Wybieraj od góry te przedmioty, które mieszczę się w plecaku Złożoność obliczeniowa : wybrano (1) i (3): 11$ Rozwiązanie pełne: Rozwiązanie greedy: O(n log n) i 11 kg O(2n) Optymalny wybór: (1) i (5): 12$ i 14 kg 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [3] Przetasowania w genomie Mitochondrialne genotypy kapusty i rzepy są w 99% identyczne - Jeffrey Palmer (1980) ALE !!! Różne jest uporządkowanie genów w mitochondrialnym DNA 1 -5 1 2 4 3 4 (1,2,3,4,5) 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII -3 -2 5 3 przetasowania (1,-5,4,-3,-2) [4] 2 12/5/2013 Ewolucja ujawnia się poprzez rozbieganie się porządku genów Genom człowieka a genom myszy to tylko około 245 przetasowań Rozmieszczenie genów z ludzkiego genotypu na genotypie myszy 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [5] Rozmieszczenie genów z mysiego genotypu na genotypie człowieka Przetasowania w genomie http://en.wikipedia.org/wiki/Phylogenetic_tree Każdy węzeł drzewa filogenetycznego ma stopień dwa Wiedza i Życie" nr 4/1998 „O pochodzeniu smoków” J.Balerstet 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [6] 3 12/5/2013 Przetasowania w genomie 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [7] Sortowanie przez odwrócenia Odwrócenie: 1 2 3 najprostsza postać przetasowania 9 8 10 4 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 7 1 5 6 2 3 9 8 10 4 1, 2, 3, 8, 7, 6, 5, 4, 9, 10 oznaczenie 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII skąd 7 (4,8) 6 5 dokąd [8] 4 12/5/2013 Sortowanie przez odwrócenia Jeśli s jest identycznością to problem staje się sortowaniem: 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [9] Sortowanie przez odwrócenia Christos Papadimitrou (nauczyciel) i Bill Gates (student) odwracają stos naleśników Pancake Flipping problem: Dany jest stos n naleśników o różnych rozmiarach. Jaka jest minimalna ilość odwróceń tego stosu, aby uzyskać ułożenie uporządkowane przy czym możliwe są odwrócenia poprzez łopatkę, czyli (1, i) Dana permutatacja p, Znaleźć ilość dprefix (p) = minimum odwróceń (1, i) porządkujących p Podejście zachłanne: 2 odwrócenia prefiksowe są potrzebne, aby umieścić naleśnik na swoim miejscu, czyli razem będzie to 2(n – 1) operacji William Gates and Christos Papadimitriou pokazali (1970) , że można problem ten rozwiązać za pomocą co najwyżej 5/3 (n + 1) prefiksowych odwroceń 2013-11-28 Danuta Makowiec: Algorytmika, wykład VIII [10] 5 12/5/2013 Niech dana będzie sekwencja n bloków: p1, p2,…,pn. Odwróceniem (i,j) nazywamy permutację tych bloków polegająca na odwróceniu kolejności bloków od i do j włącznie. Algorytm zachłanny 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [11] Ocena jakości algorytmu zachłannego o p t y m a l i z a c y j n e Gwarancja dla algorytmu przybliżonego błąd najgorszego przypadku 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [12] dla algorytmu minimalizacjnego max p min p A(p ) OPT (p ) wynik z algorytmu aproksymującego prawdziwy wynik dla algorytmu maksymalizacjnego 6 12/5/2013 Gwarancja algorytmu przybliżonego Jeśli A to algorytm minimalizacyjny z gwarancją : max A(p ) π OPT (p ) to wartość rzeczywista minimum znajduje się w przedziale A(p ) OPT (p ) A(p ) Jeśli A to algorytm maksymalizacyjny z gwarancją : 1 min A(p ) π OPT (p ) to wartość rzeczywista maksimum znajduje się w przedziale A(p ) OPT (p ) A(p ) 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [13] Punkty łamiące permutacji Def: Parę sąsiadujących elementów w permutacji p i , p i 1 nazywamy uzgodnioną jeżeli p i , p i 1 są kolejnymi liczbami. W przeciwnym wypadku parę łamiącym Oznaczenie: p i , p i 1nazywamy punktem b(p)= ilość punktów łamiących w p Oznaczenie: b(p)= ilość punktów łamiących w p 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [14] 7 12/5/2013 Taśmy malejące w algorytmie Tw.1 Jeśli permutacja Π zawiera taśmę malejącą, to istnieje odwrócenie ρ takie, które zmniejsza liczbę punktów łamiących, czyli b(p ) b(p ) Tw.2 Powyższy algorytm jest algorytmem aproksymacyjnym z gwarancją wyniku 4 1 (p ) OPT (p ) (p ) 4 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [15] Uwaga podsumowująca 5’ 3’ Przypomnienie: geny w genomie mają zwrot. Algorytmy porządkowania powinny więc dotyczyć permutacji ze znakiem! 1 -1 2 3 2 -3 4 -4 5 -5 Jeśli uporządkowanie genów jest identyczne, ale zwroty genów są inne, to te permutacje są różne 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [16] 8 12/5/2013 Przypomnienie: Score( s, DNA) M P ( s ) ( j ) j 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [17] (n 2l nlt ) Wybór najlepszego motywu na podstawie dwóch pierwszych sekwencji Wyznaczenie pozycji najlepiej dopasowanych l-merow Zadanie Zaprojektuj dane wejściowe tak, aby powyższy algorytm uzyskał zły rezultat – nie znalazł najlepiej dopasowanego l-mera 2013-12-05 Danuta Makowiec: Algorytmika, wykład VIII [18] 9