Macierze punktowania

Transkrypt

Macierze punktowania
MACIERZE PUNKTOWANIA
JOANNA ŁAPPO
MACIERZE PUNKTOWANIA SEKWENCJI
NUKLEOTYDOWYCH
Założenie: Częstości mutacji są jednakowe dla wszystkich czterech zasad.
Wartości:
„+” reszty dobrze skojarzone
„-” reszty źle skojarzone
MACIERZE PUNKTOWANIA AMINOKWASÓW
Założenie: Aminokwasy o podobnych właściwościach fizykochemicznych dużo łatwiej ulegają zamianie na
siebie nawzajem niż na inne aminokwasy.
Substytucje między resztami o odmiennych właściwościach fizykochemicznych mają mniejsze szanse na
utrwalenie się w toku ewolucji.
Niefunkcjonalne białko
MACIERZE PUNKTOWANIA SUBSTYTUCJI
AMINOKWASOWYCH
Wymienność kodu
genetycznego lub właściwości
aminokwasów
Wyniki badań substytucji
aminokwasowych
PAM
BLOSUM
MACIERZE EMPIRYCZNE
•
Pochodzą z rzeczywistych przyrównań wysoce podobnych sekwencji
• System punktacji:
Wysoka wartość – substytucje bardziej prawdopodobne
Niska wartość – substytucje występujące rzadko
„+”
• Wartość
– substytucje aminokwasowe obserwowane w przyrównaniach sekwencji homologicznych
zdarzają się częściej niż wynikałoby to z przypadku
„0” – częstość substytucji jest losowa
Wartość „-” – częstość substytucji jest niższa od losowej
• Wartość
•
MACIERZE PAM
• Pierwsze macierze PAM (Dayhoff PAM) skonstruowała Margaret Dayhoff
• Jednostka PAM – 1% pozycji aminokwasowych które w przyrównaniu
zostały zamienione/jedna mutacja na 100 reszt.
• Macierze PAM opracowano na podstawie dywergencji sekwencji
należących do tego samego klastra sekwencji białkowych przy
rekonstruowaniu drzew filogenetycznych
MACIERZE PAM
• Macierz PAM tworzy się po zebraniu wszystkich
możliwych prawdopodobieństw substytucji
aminokwasowych.
• Wymiary macierzy: 20x20
• Wartości „+” – substytucje zdarzające się częściej, niż
oczekuje się wśród zastąpień konserwowanych
ewolucyjnie.
• Wartości „-” – substytucje zdarzające się rzadziej niż
oczekiwano.
MACIERZE PAM
• Macierze z mniejszymi wartościami są bardziej odpowiednie do przyrównywania bliżej spokrewnionych
sekwencji
• Inne macierze PAM z rosnącą numeracją które odpowiadają sekwencjom o wyższym stopniu
dywergencji (rozbieżności) tworzy się przewidując wartości z macierzy PAM1 poprzez jej wymnożenie.
• PAM80  mnożymy 80 razy macierz PAM1 przez nią samą
MACIERZE BLOSUM
• Macierze te skonstruowane są na podstawie
analizy bloków (wzorców aminokwasowych)
sekwencji białkowych za pomocą obserwacji
każdej z możliwych substytucji aminokwasowych.
• Podstawą do ich budowy było ponad 2000
wzorców aminokwasowych reprezentujących 500
grup sekwencji białkowych.
• Wzorce te to przyrównania pozbawione przerw o
długości mniejszej niż 60 aminokwasów.
MACIERZE BLOSUM
• Macierze BLOSUM zawierają rzeczywiste, wyrażone w procentach, wartości identyczności sekwencji
wybranych do ich stworzenia.
• BLOSUM 62 - wszystkie sekwencje do jej stworzenia są średnio w 62% identyczne.
PORÓWNANIE
PAM
BLOSUM
Dane wyprowadzone z modeli ewolucyjnych
Wyniki bezpośrednich obserwacji
Globalne przyrównanie sekwencji
Lokalne przyrównanie
Większe znaczenie ewolucyjne
Mniejsze znaczenie ewolucyjne
Wartości są mniej realistyczne
Są bardziej wiarygodne
Podobieństwo sekwencji maleje wraz ze wzrostem
indeksu
Podobieństwo sekwencji rośnie wraz ze wzrostem
sekwencji
Wykorzystuje się przy rekonstrukcji drzew
filogenetycznych
Wykorzystuje się do przeszukiwania baz danych i
znajdowania konserwowanych domen białkowych
Nie uwzględnia bezpośrednio właściwości
fizykochemicznych aminokwasów ani podobieństwa
genetycznego
Nie uwzględnia bezpośrednio właściwości
fizykochemicznych aminokwasów ani podobieństwa
genetycznego
BIBLOGRAFIA
• Jin Xiong „Podstawy Bioinformatyki”
Dziękuję za uwagę