Macierze punktowania (PAM, BLOSUM)

Transkrypt

Macierze punktowania (PAM, BLOSUM)
MACIERZE PUNKTOWANIA
(PAM, BLOSUM)
Robert Jadach
Biologia
Macierze punktowania sekwencji
nukleotydowych:



są stosunkowo proste
wartości dodatnie lub wysokie oceny nadawane
są resztom dobrze skojarzonym, a wartości
ujemne lub niskie oceny są przyznawane
resztom źle skojarzonym
przydzielanie tych wartości opera się na
założeniu, że częstość mutacji są jednakowe dla
wszystkich czterech zasad.
jednakowe
Tranzycje (substytucje puryny na purynę lub
pirymidyny na pirymidynę) zdarzają się znacznie
częściej niż transwersje
MACIERZE PUNKTOWANIA
AMINOKWASÓW
są bardziej skomplikowane
 system punktowania musi odzwierciedlać
właściwości fizykochemiczne reszt
aminokwasowych, a także prawdopodobieństwo
substytucji pewnych reszt między sekwencjami
homologicznymi
 substytucje w obrębie grupy podobnych
aminokwasów przypuszczalnie umożliwiają
zachowanie cech funkcjonalnych białka

MACIERZE PUNKTOWANIA SUBSTYTUCJI
AMINOKWASOWYCH
Macierze mają wymiary 20x20 komórek dzielą się
na dwie główne grupy
 Jedna z nich opiera się na wymienności kodu
genetycznego lub właściwościach aminokwasów,
a druga na wynikach badań substytucji
aminokwasowych
 Macierze PAM oraz BLOSUM, pochodzą z
porównań wysoce podobnych sekwencji
 Analizując podobieństwa substytucji
aminokwasowych w przyrównaniach (sekwencji)
opracowano system punktacji

MACIERZE PAM




Pierwsze macierze skonstruowała Margaret Dayhoff
na postawie przyrównań 71 blisko spokrewnionych
sekwencji białkowych.
W celu zrekonstruowania drzew filogenetycznych
sekwencje białkowe poddano klasteryzacji,
wykorzystując algorytm maksymalnej parsymonii.
Jedna jednostka PAM jest definiowana jako 1%
pozycji aminokwasowych, które w przyrównaniu
zostały zmienione.
Wzrastająca numeracja PAM jest powiązana z
wzrastającymi wartościami jednostek PAM
(odległościami ewolucyjnymi pomiędzy sekwencjami
białkowymi)
Macierz PAM250
•podpowiada
identyczności sekwencji
aminokwasowej równej
20%
• reprezentuje 250
mutacji na 100 reszt
aminokwasowych
MACIERZE BLOSUM
Skonstruowano je na podstawie analizy bloków
sekwencji białkowych (BLOSUM) za pomocą
bezpośredniej obserwacji każdej z możliwych
substytucji aminokwasowych w przyrównaniu
wielu sekwencji.
 Podstawą do budowy tych macierzy było ponad
2000 konserwatywnych wzorców
aminokwasowych reprezentujących 500 grup
sekwencji białkowych.

Zamiast wykorzystania funkcji ekstrapolującej,
macierze BLOSUM zawierają rzeczywiste,
wyrażone w procentach wartości identyczności
sekwencji wybranych do ich stworzenia.
 Numeracja macierzy BLOSUM jest odwrotna niż
numeracja macierzy PAM – macierze BLOSUM o
niższych numerach reprezentują sekwencje o
wyższym stopniu dywergencji.

Macierz substytucji
aminokwasowych
BLOSUM62
BLOSUM
PAM
1) Opracowanie na postawie danych
wyprowadzonych z modeli
ewolucyjnych
2) Większe znaczenie ewolucyjne
3) Częściej wykorzystywane przy
rekonstrukcji drzew filogenetycznych
4) Mniej realistyczne
1) Zawierają wyniki bezpośrednich
obserwacji
2) Mniejsze znaczenie ewolucyjne
3) Pochodzą wyłącznie z analiz
lokalnych przyrównań
konserwatywnych bloków
sekwencji
4) Lepiej nadają się do
przeszukiwania baz danych i
znajdowania konserwatywnych
domen białkowych
5) Bardziej wiarygodne (otrzymano
je z analizy znacznie większego i
bardziej reprezentatywnego
zestawu danych)
BIBLIOGRAFIA:
Jin
Xiong, Postawy
bioinformatyki





http://www.staff.amu.edu.pl/~ewas/pracownia/biomon
o/Bioinformatyka_skrypt4.pdf
https://upload.wikimedia.org/wikipedia/commons/thu
mb/3/35/Transitions-transversions-v3.png/300pxTransitions-transversions-v3.png
https://pl.wikipedia.org/wiki/Tranzycja_(biologia)
http://www.staff.amu.edu.pl/~ewas/pracownia/biomon
o/old08/Bioinformatyka6.pdf
https://pl.wikipedia.org/wiki/Aminokwasy_bia%C5%8
2kowe
Dziękuję
za
uwagę 