Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST

Transkrypt

Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST
Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST
__________________________________________________________________________
W tym ćwiczeniu nauczysz się:
– podstawowej analizy sekwencji z użyciem programu BLAST
– interpretować podstawowe parametry związane z dopasowaniem sekwencji
– rozróżniać i dobierać właściwy probram BLAST do określonej analizy
Słowa kluczowe: BLASTp, BLASTn, BLASTx, tBLASTx, sekwencja wejściowa (query),
sekwencja referencyjna (subject), pokrycie (coverage), wartość oczekiwana (e-value), baza
nr, ramka odczytu
__________________________________________________________________________
Zadanie 1.
W bazie PubMed znajdź artykuł opublikowany w czasopismie Nature w 2002 roku, którego
autorem jest Enard W. Artykuł opisuje odkrycie genu u naczelnych, który warunkuje zdolność
komunikacji werbalnej. Obecność zaledwie jednej uszkodzonej kopii tego genu u człowieka
prowadzi do poważnych zaburzeń artykulacji wyrazów.
Pytanie 1a. Podaj nazwę tego genu.
Pytanie 1b. Przeszukaj bazę białkową NCBI i odszukaj z bazy RefSeq aminokwasową
sekwencję izoformy X1 tego genu z człowieka. Podaj jej numer dostępu.
Zadanie 2.
Aby poznać ścieżkę ewolucyjną genu (z zadania 1) u zwierząt skorzystaj z programu BLASTp
na serwerze NCBI (użyj przekierowania Run BLAST znajdującego się w prawym panelu w
rekordzie białkowym). Za pomocą znalezionej sekwencji przeszukaj bazę danych RefSeq,
wykluczając sekwencje pochodzące od naczelnych (Primates).
Pytanie 2a. Sekwencja genu z jakiego organizmu jest najbardziej podobna do sekwencji
użytej w zapytaniu (Query)?
---------------------------------------------------------------------------------------------------------------------------Przejdź do znalezionych przez program dopasowań.
Pytanie 2b. Ile wynosi procent identyczności między obiema sekewncjami?
Pytanie 2c. Ile substytucji widzisz w dopasowaniu?
Pytanie 2d. Czy znaleziona sekwencja (Subject) została dopasowana na całej długości?
----------------------------------------------------------------------------------------------------------------------------
Wróć do tabeli wynikowej.
Pytanie 2e. Jaki jest procent pokrycia (Query cover) sekwencji użytej w zapytaniu?
Pytanie 2f. Ile wynosi wartość oczekiwana (E-value) tego dopasowania?
Pytanie 2g. Co wskazuje wartość E-value?
---------------------------------------------------------------------------------------------------------------------------Skorzystaj z zakładki Taxonomy reports.
Pytanie 2h. Gdzie po raz pierwszy w toku ewolucji pojawił się analizowany gen?
Zadanie 3.
Skorzystaj z programu BLASTp na serwerze NCBI.
Pytanie 3a. Czy w bazie aminokwasowej nr z NCBI istnieje białko, którego sekwencje
zawiera motyw GANDALF?
Pytanie 3b. Jaka jest najniższa wartość E-value w wynikach tego wyszukiwania?
Pytanie 3c. Czy jest to wynik istotny statystycznie?
Zadanie 4.
Pytanie 4a. Który program BLAST przeprowadza translację nukleotydowej sekwencji
zapytania i przeszukuje bazę danych sekwencji białkowych?
Pytanie 4b. W ilu ramkach odczytu (reading frame) dokonywana jest ta translacja?
Zadanie 5.
W książce Michaela Crichtona „Jurassic Park” na podstawie fragmentu sekwencji DNA
dinozaura odtworzono cały organizm gada. W pliku dino-jp.fasta znajduje się ta sekwencja.
Pytanie 5a. Czy umieszczony w książce fragment DNA rzeczywiście pochodzi z dinozaura?
Mark Boguski, naukowiec z NCBI został konsultantem w sequelu Jurassic Park, The Lost
World. W pliku dino-lw.fasta znajduje się sekwencja DNA dinozaura użyta w filmie.
Pytanie 5b. Z jakiego organizmu pochodzi ta sekwencja? Co to za sekwencja?
---------------------------------------------------------------------------------------------------------------------------W zaproponowanej przez siebie sekwencji Mark ukrył pewną wiadomość. Aby ją odczytać
należy porównać sekwencję Marka z białkową bazą nr przy pomocy odpowiedniego
programu BLAST, a ukrytej wiadomości szukać w dopasowaniu sekwencji aminokwasowej.
Pytanie 5c. Jakiego programu BLAST należy użyć aby odszyfrować wiadomość? Jaka to
wiadomość?