Macierze punktowania
Transkrypt
Macierze punktowania
MACIERZE PUNKTOWANIA JOANNA ŁAPPO MACIERZE PUNKTOWANIA SEKWENCJI NUKLEOTYDOWYCH Założenie: Częstości mutacji są jednakowe dla wszystkich czterech zasad. Wartości: „+” reszty dobrze skojarzone „-” reszty źle skojarzone MACIERZE PUNKTOWANIA AMINOKWASÓW Założenie: Aminokwasy o podobnych właściwościach fizykochemicznych dużo łatwiej ulegają zamianie na siebie nawzajem niż na inne aminokwasy. Substytucje między resztami o odmiennych właściwościach fizykochemicznych mają mniejsze szanse na utrwalenie się w toku ewolucji. Niefunkcjonalne białko MACIERZE PUNKTOWANIA SUBSTYTUCJI AMINOKWASOWYCH Wymienność kodu genetycznego lub właściwości aminokwasów Wyniki badań substytucji aminokwasowych PAM BLOSUM MACIERZE EMPIRYCZNE • Pochodzą z rzeczywistych przyrównań wysoce podobnych sekwencji • System punktacji: Wysoka wartość – substytucje bardziej prawdopodobne Niska wartość – substytucje występujące rzadko „+” • Wartość – substytucje aminokwasowe obserwowane w przyrównaniach sekwencji homologicznych zdarzają się częściej niż wynikałoby to z przypadku „0” – częstość substytucji jest losowa Wartość „-” – częstość substytucji jest niższa od losowej • Wartość • MACIERZE PAM • Pierwsze macierze PAM (Dayhoff PAM) skonstruowała Margaret Dayhoff • Jednostka PAM – 1% pozycji aminokwasowych które w przyrównaniu zostały zamienione/jedna mutacja na 100 reszt. • Macierze PAM opracowano na podstawie dywergencji sekwencji należących do tego samego klastra sekwencji białkowych przy rekonstruowaniu drzew filogenetycznych MACIERZE PAM • Macierz PAM tworzy się po zebraniu wszystkich możliwych prawdopodobieństw substytucji aminokwasowych. • Wymiary macierzy: 20x20 • Wartości „+” – substytucje zdarzające się częściej, niż oczekuje się wśród zastąpień konserwowanych ewolucyjnie. • Wartości „-” – substytucje zdarzające się rzadziej niż oczekiwano. MACIERZE PAM • Macierze z mniejszymi wartościami są bardziej odpowiednie do przyrównywania bliżej spokrewnionych sekwencji • Inne macierze PAM z rosnącą numeracją które odpowiadają sekwencjom o wyższym stopniu dywergencji (rozbieżności) tworzy się przewidując wartości z macierzy PAM1 poprzez jej wymnożenie. • PAM80 mnożymy 80 razy macierz PAM1 przez nią samą MACIERZE BLOSUM • Macierze te skonstruowane są na podstawie analizy bloków (wzorców aminokwasowych) sekwencji białkowych za pomocą obserwacji każdej z możliwych substytucji aminokwasowych. • Podstawą do ich budowy było ponad 2000 wzorców aminokwasowych reprezentujących 500 grup sekwencji białkowych. • Wzorce te to przyrównania pozbawione przerw o długości mniejszej niż 60 aminokwasów. MACIERZE BLOSUM • Macierze BLOSUM zawierają rzeczywiste, wyrażone w procentach, wartości identyczności sekwencji wybranych do ich stworzenia. • BLOSUM 62 - wszystkie sekwencje do jej stworzenia są średnio w 62% identyczne. PORÓWNANIE PAM BLOSUM Dane wyprowadzone z modeli ewolucyjnych Wyniki bezpośrednich obserwacji Globalne przyrównanie sekwencji Lokalne przyrównanie Większe znaczenie ewolucyjne Mniejsze znaczenie ewolucyjne Wartości są mniej realistyczne Są bardziej wiarygodne Podobieństwo sekwencji maleje wraz ze wzrostem indeksu Podobieństwo sekwencji rośnie wraz ze wzrostem sekwencji Wykorzystuje się przy rekonstrukcji drzew filogenetycznych Wykorzystuje się do przeszukiwania baz danych i znajdowania konserwowanych domen białkowych Nie uwzględnia bezpośrednio właściwości fizykochemicznych aminokwasów ani podobieństwa genetycznego Nie uwzględnia bezpośrednio właściwości fizykochemicznych aminokwasów ani podobieństwa genetycznego BIBLOGRAFIA • Jin Xiong „Podstawy Bioinformatyki” Dziękuję za uwagę