Znaczenie podobieństwa sekwencji

Transkrypt

Znaczenie podobieństwa sekwencji
Wstęp do BLAST i FASTA
Podstawową analizą bioinformatyczną związaną z
wykorzystaniem publicznych baz danych sekwencji
nukleotydowych i aminokwasowych jest
poszukiwanie podobieństwa między sekwencjami.
Znaczenie podobieństwa sekwencji
Sekwencja przodka
(ancestralna)
Sekwencje homologiczne
Sekwencje homologiczne mają
wspólnego przodka i pełnią
zbliżoną funkcję biologiczną.
Znaczenie podobieństwa sekwencji
Baza sekwencji
Poszukiwanie podobieństwa
Funkcja nieznana
Sekwencja o znanej funkcji
Ekstrapolacja funkcji
Dwa najczęściej wykorzystywane narzędzia do przeszukiwania baz danych
w celu znalezienia sekwencji podobnych:
BLAST (Basic Local Alignment Search Tool)
https://blast.ncbi.nlm.nih.gov/Blast.cgi
FASTA
http://www.ebi.ac.uk/Tools/sss/fasta/nucleotide.html
Powyższe narzędzia wykorzystują metodę heurystyczną (przybliżoną)
w celu znalezienia sekwencji podobnych.
heuriskein gr. znaleźć, odkryć
Metody heurystyczne mogą drastycznie uprościć lub skrócić proces
rozwiązywania problemu, gdy metoda rozwiązania:
• nie jest znana;
•jest zawiła i czasochłonna.
Witold Beluch „Metody heurystyczne – wykłady”
Narzędzia BLAST i FASTA charakteryzuje wspólna strategia:
- szybki przegląd bazy danych sekwencji
- wyeliminowanie sekwencji niepodobnych
- wygenerowanie najlepszych znalezionych dopasowań
Terminologia:
Query – kwerenda, sekwencja stanowiąca ’zapytanie’ do
bazy danych
Subject – sekwencja podobna do tej stanowiącej kwerendę i
spełniająca kryteria przeszukiwania bazy danych

Podobne dokumenty