Ćwiczenie 3 A) Wyszukiwanie genów w sekwencji DNA ORF Finder
Transkrypt
Ćwiczenie 3 A) Wyszukiwanie genów w sekwencji DNA ORF Finder
Ćwiczenie 3 Na stronie http://serwisy.umcs.lublin.pl/andrzej.mazur w folderze Podstawy Bioinformatyki/sekwencje znajdują się pliki tekstowe z sekwencjami do analizy na dzisiejszych zajęciach A) Wyszukiwanie genów w sekwencji DNA ORF Finder http://www.ncbi.nlm.nih.gov/gorf/ Narzędzie odnajdujące w zadanej sekwencji wszystkie możliwe ORFy (o wybranej minimalnej długości), wykorzystując standardowy lub inny zadany kod genetyczny. Sekwencję przetłumaczoną na sekwencję aminokwasową można zachować w różnych formatach i wykorzystać do przeszukiwania baz danych z wykorzystaniem serwera BLAST. 1. Uruchomiamy narzędzie ORF Finder i wklejamy sekwencję z pliku 6000.txt. W polu „genetic code” wybieramy odpowiedni kod genetyczny w tym przypadku bakteryjny (11 bacterial code) (jeżeli nie wiemy jakie jest pochodzenie sekwencji najlepiej rozpocząć przeszukiwanie wg standardowego kodu) i uruchamiamy program poleceniem „OrfFind”. 2. Uzyskujemy graficzny obraz potencjalnych ORF-ów z wszystkich możliwych ramek odczytu dłuższych niż podstawowa wartość ustalona na 75 aa. 3. Wybieramy polecenie Smart-BLAST dla najdłuższego ORFa, nasz potencjalny ORF jest porównywany z sekwencjami białkowymi w bazie danych NCBI, uzyskujemy graficzny obraz domen lub rodzin białek, do których nasz ORF jest podobny. Co możesz powiedzieć o dopasowaniu hipotetycznej sekwencji aminokwasowej? 4. Wyszukaj ponownie ORF, których minimalna długość jest większa niż poprzednio, zmieniamy wartość progową np. na 600 nt oraz zadajemy wyszukiwani ORF-ów, które mogą zaczynać się od alternatywnych kodonów (innych niż ATG). 5. Klikamy na najdłuższą z nich i sprawdzamy podobieństwo wybranego hipotetycznego białka do znanych białek zdeponowanych w bazach danych. Jaka jest tym razem różnica w dopasowaniu sekwencji aminokwasowych? 6. Klikając na dowolną z homologicznych domen, uzyskujemy dostęp do rekordów opisujących białka, w których znaleziono podobne domeny. 7. Wykonaj analizę podobieństwa za pomocą narzędzia Smart-BLAST dla jednej z hipotetycznych ORF zlokalizowanych na drugiej nici DNA MapViewer – syntenia i kolinearność The National Center for Biotechnology Information (NCBI) of the U.S. National Institutes of Health (NIH) maintains a database called MapViewer, which allows you to examine the organization of genomes that have been sequenced and annotated. In this exercise, you will examine the region of the human genome surrounding the CFTR gene encoding the cystic fibrosis transmembrane conductance regulator protein. 1. 2. 3. 4. 5. 6. Strona główna NCBI Zakładka na dole MapViewer Uruchomić szarym przyciskiem w lupką ostatnią aktualizację mapy ludzkiego genomu W polu Search for: CFTR Zakładka Quick Filter po prawej stronie: Gene Wybrać pierwszy od góry w kolumnie MapElement z sekwencji referencyjnej ludzkiego genomu NAVIGATION TIPS FOR MAPVIEWER 1. On this entry MapViewer page for CFTR, you should see within the blue area at the left an ideogram (diagram) of the human chromosome containing the CFTR gene. This ideogram shows a pattern of light and dark bands that can be visualized when the chromosome is stained with a dye called Giemsa. The chromosome is divided by the centromere into short (p) and long (q) arms. Each arm is subdivided into major regions, and the bands within these regions are numbered consecutively. For example, 7q36 indicates the sixth band of the third region on the long arm of chromosome 7. This is sufficient information about chromosome banding for the purposes of this exercise. 2. Above the ideogram is a zoom box. By hitting any of the five blue bars in the box, you can focus on smaller or larger regions of the chromosome. 3. In the large white area of the screen, you will see a scale bar with numbered tick marks indicating the positions of the nucleotides you are viewing. Depending on the zoom factor, the numbers may be followed by either K’s (for kilobases) or M’s (for megabases). 4. Just to the right of the scale bar is a long line that is labeled at the top in red as “Genes_seq”; both ends of this line have arrowheads. The line represents the chromosome; the arrows are links that allow you to view parts of the chromosome adjacent to that shown. To the right or left of the Genes_seq line are blue regions indicating the genes, with introns shown as narrow blue lines and exons as wider blue strips. Genes to the left of the line are transcribed in the opposite direction to those shown on the other side of the line. Arrows to the right of the gene name indicate the direction RNA polymerase travels in transcribing the gene. All of the diagrams on this page, including the ideogram, have the same orientation. Polecenia i pytania: 1. (Otworzyć link CFTR w nowej karcie!!!) 2. Czego możemy dowiedzieć się o funkcji białka CFTR, efektów jego uszkodzenia w komórce? (Patrz pole: Summary) 3. Jak długi jest gen CFTR (bp)? Ile ma eksonów? 4. Odszukaj informacje o alternatywnych wariantach mRNA tego genu: użyj opcji format GenBank (najlepiej również otworzyć go w nowej karcie), 5. Biorąc pod uwagę informację o funkcji i lokalizacji białka w komórce jakie elementy strukturalne można w nim znaleźć? (białkowy rekord GenBank, wybierz rekordy z bazy danych sekwencji referencyjnych RefSeq) 6. W jakich jeszcze organizmach są białka podobne funkcjonalnie i strukturalnie do CFTR (zakładka po prawej stronie Related Information Homologene, zwrócić uwagę na modularną strukture białka CFTR) 7. Czy istnieją jakieś publikacje naukowe związane z genem CFTR (zakładka Related Information PubMed (RefSeq) 8. Wybierz ponownie okno z MapViewerem 9. Na którym chromosomie się znajduje CFTR? 10. Na którym ramieniu chromosomu określonego w poprzednim pytaniu jest gen CFTR? 11. Określ prążek, w którym znajduje się gen CFTR. 12. Ile jest genów na chromosomie zawierającym CFTR (See the bottom of the MapViewer page for CFTR.) 13. Czy polimeraza RNA, która transkrybuje gen CFTR porusza się w kierunku do czy od telomeru? 14. Jak nazywają się CDS leżące najbliżej końca 5’ i 3’genu CFTR? 15. Czy geny sąsiadujące z CFTR na końcu 5’ i 3’–zlokalizowane są na tej samej nici genomowego DNA co CFTR, czy różnice orientacji dotyczą większych grup genów 16. Łącze here (jeśli ono nie działa wklej w przeglądarkę adres pokazany poniżej) umożliwia dostęp do MapViewer dla regionów CFTR w genomie człowieka, szczura i myszy. 17. Zoom out do 1/10 wielkości oglądanych chromosomów 18. Na którym chromosomie myszy jest homolog CFTR? Na którym chromosomie szczura jest homolog CFTR? 19. Czy organizacja tego regionu jest zachowana u tych trzech organizmów? Czy można powiedzieć że te chromosomy są w obserwowanym obszarze synteniczne albo kolinearne? Co możesz powiedzieć na temat ewolucji chromosomów tych trzech organizmów http://www.ncbi.nlm.nih.gov/mapview/maps.cgi?taxid=9606&chr=7&MAPS=genes-r-org/ratchr/human%3A7,genes-r-org/mouse-chr/human%3A7,genes-r-org/humanchr7&query=e%3A1080[egene_id]+AND+gene[obj_type]&QSTR=cftr&cmd=focus&fill=10