www.theta.edu.pl Podstawy bioinformatyki Lista 4 (27.03.2015) 1
Transkrypt
www.theta.edu.pl Podstawy bioinformatyki Lista 4 (27.03.2015) 1
www.theta.edu.pl Podstawy bioinformatyki Lista 4 (27.03.2015) 1. Przyrównano sekwencje za pomocą macierzy kropkowych. Co możesz wywnioskować z podanych poniżej wizualizacji? Podpisz każdy rysunek i uzasadnij odpowiedź. Jeśli stwierdzisz mutację przyrównaj sekwencje (jedna pod drugą) i wskaż (zaznacz kolorem) zmutowane fragmenty. 2. Poniżej wklejono 2 sekwencje aminokwasowe. Przyrównaj je lokalnie i globalnie programami (Needle, Matcher, Water) dostępnymi na stronie www.ebi.ac.uk/Tools/psa/. Odpowiedz na pytania: a) Czym charakteryzują się wymienione programy? b) Jaki jest procent podobieństwa sekwencji w przypadku przyrównania lokalnego? c) Jaki jest procent podobieństwa sekwencji w przypadku przyrównania globalnego? d) Które przyrównanie ma największy score? e) Która macierz substytucji została domyślnie użyta w przyrównaniach obu sekwencji? f) Wyjaśnij dlaczego domyślnie kara za rozszerzenie przerwy jest mniejsza niż kara za jej wstawienie. MIILWSLIVHLQLTCLHLILQTPNLEALDALEIINYQTTKYTIPEVWKEQPVATIGEDVD DQDTEDEESYLKFGDDAEVRTSVSEGLHEGAFCRRSFDGRSGYCILAYQCLHVIREYRVH GTRIDICTHRNNVPVICCPLADKHVLAQRISATKCQEYNAAARRLHLTDTGRTFSGKQCV PSVPLIVGGTPTRHGLFPHMAALGWTQGSGSKDQDIKWGCGGALVSELYVLTAAHCATSG www.theta.edu.pl SKPPDMVRLGARQLNETSATQQDIKILIIVLHPKYRSSAYYHDIALLKLTRRVKFSEQVR PACLWQLPELQIPTVVAAGWGRTEFLGAKSNALRQVDLDVVPQMTCKQIYRKERRLPRGI IEGQFCAGYLPGGRDTCQGDSGGPIHALLPEYNCVAFVVGITSFGKFCAAPNAPGVYTRL YSYLDWIEKIAFKQH MTLGRRLACLFLACVLPALLLGGTALASEIVGGRRARPHAWPFMVSLQLRGGHFCGATLI APNFVMSAAHCVANVNVRAVRVVLGAHNLSRREPTRQVFAVQRIFENGYDPVNLLNDIVI LQLNGSATINANVQVAQLPAQGRRLGNGVQCLAMGWGLLGRNRGIASVLQELNVTVVTSL CRRSNVCTLVRGRQAGVCFGDSGSPLVCNGLIHGIASFVRGGCASGLYPDAFAPVAQFVN WIDSIIQRSEDNPCPHPRDPDPASRTH 3. Za pomocą programu BLAST (protein) http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSear ch&LINK_LOC=blasthome – dowiedz się do jakich organizmów należą dwie wyżej wymienione sekwencje. Wklej pierwszą sekwencję w okno (Enter Query Sequence) i uruchom program (przycisk BLAST). Poczekaj na wynik. Na podstawie „identyczności” sekwencji wyrażonej w procentach wywnioskuj z jakiego organizmu pochodzi dana sekwencja aminokwasowa. Wykonaj te same polecenia dla drugiej sekwencji. 4. Wyszukaj sekwencje homologiczne za pomocą programu BLAST. 1. Znajdź w bazie nukleotydowej NCBI sekwencję o numerze EF667005.1 2. W menu po prawej stronie znajdź i naciśnij „Run BLAST” 3. Wyszukaj sekwencje, które są blisko spokrewnione („Highly similar sequences”). Sekwencje jakich gatunków znalazłeś? 4. Spróbuj samodzielnie zinterpretować wynik działania programu BLAST. Zwróć uwagę na wartości: score i e-value. Zastanów się w jaki sposób mogą one pomóc Ci wybrać odpowiednie sekwencje do stworzenia drzewa filogenetycznego. 5. Zapisz na dysku kilka sekwencji homologicznych, np. po dwie dla każdego gatunku. 6. Odszukaj opcję “Distance tree of results”. Jaka jest Twoja interpretacja wyniku?