Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST
Transkrypt
Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST
Ćwiczenie 6 – analiza sekwencji przy użyciu BLAST __________________________________________________________________________ W tym ćwiczeniu nauczysz się: – podstawowej analizy sekwencji z użyciem programu BLAST – interpretować podstawowe parametry związane z dopasowaniem sekwencji – rozróżniać i dobierać właściwy probram BLAST do określonej analizy Słowa kluczowe: BLASTp, BLASTn, BLASTx, tBLASTx, sekwencja wejściowa (query), sekwencja referencyjna (subject), pokrycie (coverage), wartość oczekiwana (e-value), baza nr, ramka odczytu __________________________________________________________________________ Zadanie 1. W bazie PubMed znajdź artykuł opublikowany w czasopismie Nature w 2002 roku, którego autorem jest Enard W. Artykuł opisuje odkrycie genu u naczelnych, który warunkuje zdolność komunikacji werbalnej. Obecność zaledwie jednej uszkodzonej kopii tego genu u człowieka prowadzi do poważnych zaburzeń artykulacji wyrazów. Pytanie 1a. Podaj nazwę tego genu. Pytanie 1b. Przeszukaj bazę białkową NCBI i odszukaj z bazy RefSeq aminokwasową sekwencję izoformy X1 tego genu z człowieka. Podaj jej numer dostępu. Zadanie 2. Aby poznać ścieżkę ewolucyjną genu (z zadania 1) u zwierząt skorzystaj z programu BLASTp na serwerze NCBI (użyj przekierowania Run BLAST znajdującego się w prawym panelu w rekordzie białkowym). Za pomocą znalezionej sekwencji przeszukaj bazę danych RefSeq, wykluczając sekwencje pochodzące od naczelnych (Primates). Pytanie 2a. Sekwencja genu z jakiego organizmu jest najbardziej podobna do sekwencji użytej w zapytaniu (Query)? ---------------------------------------------------------------------------------------------------------------------------Przejdź do znalezionych przez program dopasowań. Pytanie 2b. Ile wynosi procent identyczności między obiema sekewncjami? Pytanie 2c. Ile substytucji widzisz w dopasowaniu? Pytanie 2d. Czy znaleziona sekwencja (Subject) została dopasowana na całej długości? ---------------------------------------------------------------------------------------------------------------------------- Wróć do tabeli wynikowej. Pytanie 2e. Jaki jest procent pokrycia (Query cover) sekwencji użytej w zapytaniu? Pytanie 2f. Ile wynosi wartość oczekiwana (E-value) tego dopasowania? Pytanie 2g. Co wskazuje wartość E-value? ---------------------------------------------------------------------------------------------------------------------------Skorzystaj z zakładki Taxonomy reports. Pytanie 2h. Gdzie po raz pierwszy w toku ewolucji pojawił się analizowany gen? Zadanie 3. Skorzystaj z programu BLASTp na serwerze NCBI. Pytanie 3a. Czy w bazie aminokwasowej nr z NCBI istnieje białko, którego sekwencje zawiera motyw GANDALF? Pytanie 3b. Jaka jest najniższa wartość E-value w wynikach tego wyszukiwania? Pytanie 3c. Czy jest to wynik istotny statystycznie? Zadanie 4. Pytanie 4a. Który program BLAST przeprowadza translację nukleotydowej sekwencji zapytania i przeszukuje bazę danych sekwencji białkowych? Pytanie 4b. W ilu ramkach odczytu (reading frame) dokonywana jest ta translacja? Zadanie 5. W książce Michaela Crichtona „Jurassic Park” na podstawie fragmentu sekwencji DNA dinozaura odtworzono cały organizm gada. W pliku dino-jp.fasta znajduje się ta sekwencja. Pytanie 5a. Czy umieszczony w książce fragment DNA rzeczywiście pochodzi z dinozaura? Mark Boguski, naukowiec z NCBI został konsultantem w sequelu Jurassic Park, The Lost World. W pliku dino-lw.fasta znajduje się sekwencja DNA dinozaura użyta w filmie. Pytanie 5b. Z jakiego organizmu pochodzi ta sekwencja? Co to za sekwencja? ---------------------------------------------------------------------------------------------------------------------------W zaproponowanej przez siebie sekwencji Mark ukrył pewną wiadomość. Aby ją odczytać należy porównać sekwencję Marka z białkową bazą nr przy pomocy odpowiedniego programu BLAST, a ukrytej wiadomości szukać w dopasowaniu sekwencji aminokwasowej. Pytanie 5c. Jakiego programu BLAST należy użyć aby odszyfrować wiadomość? Jaka to wiadomość?