Prezentacja programu PowerPoint

Transkrypt

Prezentacja programu PowerPoint
12/5/2013
Prof. Danuta Makowiec
Instytut Fizyki Teoretycznej i Astrofizyki
p.353, tel.: 58 523 2466
[email protected]
Problem przetasowań w genomie
Sortowanie przez odwrócenia
Algorytmy przybliżone
Algorytm zachłanny dla problemu znalezienia motywu
Wykład nr 8 BIOINFORMATYKA rok II
Algorytm zachłanny:
wyznaczanie rozwiązania globalnie
optymalnego w oparciu o aktualne
(lokalne) krokowo dobierane
optymalne warunki
Problem plecakowy:
Input :
zbiór elementów o określonej wadze i
wartości oraz plecak o zadanym udźwigu
Output:
podzbiór elementów taki, że suma
wartości jest możliwie największa, a suma
wag jest niewiększa niż udźwig plecaka.
http://pl.wikipedia.org/wiki/Problem_plecakowy
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[2]
1
12/5/2013
Algorytm zachłanny dla problemu plecakowego
1. Posortuj przedmioty
według stosunku wartości
do wagi
2. Wybieraj od góry te
przedmioty, które
mieszczę się w plecaku
Złożoność obliczeniowa :
wybrano (1) i (3): 11$
Rozwiązanie pełne:
Rozwiązanie greedy: O(n log n)
i 11 kg
O(2n)
Optymalny wybór: (1) i (5): 12$ i 14 kg
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[3]
Przetasowania w genomie
Mitochondrialne genotypy kapusty i rzepy są w
99% identyczne
- Jeffrey Palmer (1980)
ALE !!!
Różne jest uporządkowanie genów
w mitochondrialnym DNA
1
-5
1
2
4
3
4
(1,2,3,4,5)
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
-3
-2
5
3 przetasowania
(1,-5,4,-3,-2)
[4]
2
12/5/2013
Ewolucja ujawnia się poprzez
rozbieganie się porządku genów
Genom człowieka
a genom myszy to
tylko około 245
przetasowań
Rozmieszczenie genów z ludzkiego
genotypu na genotypie myszy
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[5]
Rozmieszczenie genów z mysiego
genotypu na genotypie człowieka
Przetasowania w genomie
http://en.wikipedia.org/wiki/Phylogenetic_tree
Każdy węzeł drzewa
filogenetycznego ma
stopień dwa
Wiedza i Życie" nr 4/1998
„O pochodzeniu smoków”
J.Balerstet
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[6]
3
12/5/2013
Przetasowania w genomie
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[7]
Sortowanie przez odwrócenia
Odwrócenie:
1
2
3
najprostsza
postać
przetasowania
9
8
10
4
1, 2, 3, 4, 5, 6, 7, 8, 9, 10
7
1
5
6
2
3
9
8
10
4
1, 2, 3, 8, 7, 6, 5, 4, 9, 10
oznaczenie
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
skąd
7
 (4,8)
6
5
dokąd
[8]
4
12/5/2013
Sortowanie przez odwrócenia
Jeśli s jest
identycznością to
problem staje się
sortowaniem:
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII
[9]
Sortowanie przez odwrócenia
Christos Papadimitrou
(nauczyciel) i
Bill Gates (student)
odwracają stos
naleśników
Pancake Flipping problem:
Dany jest stos n naleśników o różnych rozmiarach.
Jaka jest minimalna ilość odwróceń tego stosu, aby uzyskać ułożenie uporządkowane przy
czym możliwe są odwrócenia poprzez łopatkę, czyli (1, i)
Dana permutatacja p,
Znaleźć ilość dprefix (p) = minimum odwróceń (1, i) porządkujących p
Podejście zachłanne:
2 odwrócenia prefiksowe są potrzebne, aby umieścić naleśnik na swoim miejscu, czyli
razem będzie to 2(n – 1) operacji
William Gates and Christos Papadimitriou pokazali (1970) , że można problem ten rozwiązać za
pomocą co najwyżej 5/3 (n + 1) prefiksowych odwroceń
2013-11-28
Danuta
Makowiec:
Algorytmika, wykład VIII [10]
5
12/5/2013
Niech dana będzie sekwencja n bloków:
p1, p2,…,pn.
Odwróceniem (i,j) nazywamy permutację tych bloków polegająca na
odwróceniu kolejności bloków od i do j włącznie.
Algorytm
zachłanny
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [11]
Ocena jakości algorytmu zachłannego
o
p
t
y
m
a
l
i
z
a
c
y
j
n
e
Gwarancja
dla algorytmu
przybliżonego
błąd najgorszego
przypadku
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [12]
dla algorytmu
minimalizacjnego
max p
min p
A(p )

OPT (p )
wynik z algorytmu aproksymującego
prawdziwy wynik
dla algorytmu
maksymalizacjnego
6
12/5/2013
Gwarancja algorytmu przybliżonego
Jeśli A to algorytm minimalizacyjny z gwarancją :
  max
A(p )
π OPT (p )
to wartość rzeczywista minimum znajduje się w przedziale
A(p )

 OPT (p )  A(p )
Jeśli A to algorytm maksymalizacyjny z gwarancją :
1

 min
A(p )
π OPT (p )
to wartość rzeczywista maksimum znajduje się w przedziale
A(p )  OPT (p )  A(p )
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [13]
Punkty łamiące permutacji
Def:
Parę sąsiadujących elementów w permutacji p i , p i 1
nazywamy uzgodnioną jeżeli p i , p i 1 są kolejnymi liczbami.
W przeciwnym wypadku parę
łamiącym
Oznaczenie:
p i , p i 1nazywamy punktem
b(p)= ilość punktów łamiących w p
Oznaczenie:
b(p)= ilość
punktów
łamiących w p
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [14]
7
12/5/2013
Taśmy malejące w algorytmie
Tw.1
Jeśli permutacja Π zawiera taśmę malejącą, to istnieje odwrócenie ρ takie,
które zmniejsza liczbę punktów łamiących, czyli
b(p )  b(p )
Tw.2
Powyższy algorytm jest algorytmem aproksymacyjnym z gwarancją wyniku 4
1
(p )  OPT (p )  (p )
4
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [15]
Uwaga podsumowująca
5’
3’
Przypomnienie: geny w genomie mają zwrot.
Algorytmy porządkowania powinny więc dotyczyć permutacji ze znakiem!
1
-1
2
3
2
-3
4
-4
5
-5
Jeśli
uporządkowanie
genów jest
identyczne, ale
zwroty genów są
inne, to te
permutacje są
różne
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [16]
8
12/5/2013
Przypomnienie:
Score( s, DNA)   M P ( s ) ( j )
j
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [17]
(n 2l  nlt )
Wybór
najlepszego
motywu na
podstawie
dwóch
pierwszych
sekwencji
Wyznaczenie
pozycji
najlepiej
dopasowanych
l-merow
Zadanie
Zaprojektuj dane wejściowe tak, aby powyższy algorytm uzyskał zły
rezultat – nie znalazł najlepiej dopasowanego l-mera
2013-12-05
Danuta
Makowiec:
Algorytmika, wykład VIII [18]
9