Znaczenie podobieństwa sekwencji
Transkrypt
Znaczenie podobieństwa sekwencji
Wstęp do BLAST i FASTA Podstawową analizą bioinformatyczną związaną z wykorzystaniem publicznych baz danych sekwencji nukleotydowych i aminokwasowych jest poszukiwanie podobieństwa między sekwencjami. Znaczenie podobieństwa sekwencji Sekwencja przodka (ancestralna) Sekwencje homologiczne Sekwencje homologiczne mają wspólnego przodka i pełnią zbliżoną funkcję biologiczną. Znaczenie podobieństwa sekwencji Baza sekwencji Poszukiwanie podobieństwa Funkcja nieznana Sekwencja o znanej funkcji Ekstrapolacja funkcji Dwa najczęściej wykorzystywane narzędzia do przeszukiwania baz danych w celu znalezienia sekwencji podobnych: BLAST (Basic Local Alignment Search Tool) https://blast.ncbi.nlm.nih.gov/Blast.cgi FASTA http://www.ebi.ac.uk/Tools/sss/fasta/nucleotide.html Powyższe narzędzia wykorzystują metodę heurystyczną (przybliżoną) w celu znalezienia sekwencji podobnych. heuriskein gr. znaleźć, odkryć Metody heurystyczne mogą drastycznie uprościć lub skrócić proces rozwiązywania problemu, gdy metoda rozwiązania: • nie jest znana; •jest zawiła i czasochłonna. Witold Beluch „Metody heurystyczne – wykłady” Narzędzia BLAST i FASTA charakteryzuje wspólna strategia: - szybki przegląd bazy danych sekwencji - wyeliminowanie sekwencji niepodobnych - wygenerowanie najlepszych znalezionych dopasowań Terminologia: Query – kwerenda, sekwencja stanowiąca ’zapytanie’ do bazy danych Subject – sekwencja podobna do tej stanowiącej kwerendę i spełniająca kryteria przeszukiwania bazy danych