Ćwiczenie 3 A) Wyszukiwanie genów w sekwencji DNA ORF Finder

Transkrypt

Ćwiczenie 3 A) Wyszukiwanie genów w sekwencji DNA ORF Finder
Ćwiczenie 3
Na stronie http://serwisy.umcs.lublin.pl/andrzej.mazur w folderze Podstawy Bioinformatyki/sekwencje
znajdują się pliki tekstowe z sekwencjami do analizy na dzisiejszych zajęciach
A) Wyszukiwanie genów w sekwencji DNA
ORF Finder
http://www.ncbi.nlm.nih.gov/gorf/
Narzędzie odnajdujące w zadanej sekwencji wszystkie możliwe ORFy (o wybranej minimalnej długości),
wykorzystując standardowy lub inny zadany kod genetyczny. Sekwencję przetłumaczoną na sekwencję
aminokwasową można zachować w różnych formatach i wykorzystać do przeszukiwania baz danych z
wykorzystaniem serwera BLAST.
1. Uruchomiamy narzędzie ORF Finder i wklejamy sekwencję z pliku 6000.txt. W polu „genetic code”
wybieramy odpowiedni kod genetyczny w tym przypadku bakteryjny (11 bacterial code) (jeżeli nie
wiemy jakie jest pochodzenie sekwencji najlepiej rozpocząć przeszukiwanie wg standardowego
kodu) i uruchamiamy program poleceniem „OrfFind”.
2. Uzyskujemy graficzny obraz potencjalnych ORF-ów z wszystkich możliwych ramek odczytu
dłuższych niż podstawowa wartość ustalona na 75 aa.
3. Wybieramy polecenie Smart-BLAST dla najdłuższego ORFa, nasz potencjalny ORF jest
porównywany z sekwencjami białkowymi w bazie danych NCBI, uzyskujemy graficzny obraz
domen lub rodzin białek, do których nasz ORF jest podobny. Co możesz powiedzieć o
dopasowaniu hipotetycznej sekwencji aminokwasowej?
4. Wyszukaj ponownie ORF, których minimalna długość jest większa niż poprzednio, zmieniamy
wartość progową np. na 600 nt oraz zadajemy wyszukiwani ORF-ów, które mogą zaczynać się od
alternatywnych kodonów (innych niż ATG).
5. Klikamy na najdłuższą z nich i sprawdzamy podobieństwo wybranego hipotetycznego białka do
znanych białek zdeponowanych w bazach danych. Jaka jest tym razem różnica w dopasowaniu
sekwencji aminokwasowych?
6. Klikając na dowolną z homologicznych domen, uzyskujemy dostęp do rekordów opisujących białka,
w których znaleziono podobne domeny.
7. Wykonaj analizę podobieństwa za pomocą narzędzia Smart-BLAST dla jednej z hipotetycznych
ORF zlokalizowanych na drugiej nici DNA
MapViewer – syntenia i kolinearność
The National Center for Biotechnology Information (NCBI) of the U.S. National Institutes of Health (NIH)
maintains a database called MapViewer, which allows you to examine the organization of genomes that have
been sequenced and annotated. In this exercise, you will examine the region of the human genome
surrounding the CFTR gene encoding the cystic fibrosis transmembrane conductance regulator protein.
1.
2.
3.
4.
5.
6.
Strona główna NCBI
Zakładka na dole MapViewer
Uruchomić szarym przyciskiem w lupką ostatnią aktualizację mapy ludzkiego genomu
W polu Search for: CFTR
Zakładka Quick Filter po prawej stronie: Gene
Wybrać pierwszy od góry w kolumnie MapElement z sekwencji referencyjnej ludzkiego genomu
NAVIGATION TIPS FOR MAPVIEWER
1. On this entry MapViewer page for CFTR, you should see within the blue area at the left an ideogram
(diagram) of the human chromosome containing the CFTR gene. This ideogram shows a pattern of light and
dark bands that can be visualized when the chromosome is stained with a dye called Giemsa. The
chromosome is divided by the centromere into short (p) and long (q) arms. Each arm is subdivided into
major regions, and the bands within these regions are numbered consecutively. For example, 7q36 indicates
the sixth band of the third region on the long arm of chromosome 7. This is sufficient information about
chromosome banding for the purposes of this exercise. 2. Above the ideogram is a zoom box. By hitting any
of the five blue bars in the box, you can focus on smaller or larger regions of the chromosome.
3. In the large white area of the screen, you will see a scale bar with numbered tick marks indicating the
positions of the nucleotides you are viewing. Depending on the zoom factor, the numbers may be followed
by either K’s (for kilobases) or M’s (for megabases).
4. Just to the right of the scale bar is a long line that is labeled at the top in red as “Genes_seq”; both ends of
this line have arrowheads. The line represents the chromosome; the arrows are links that allow you to view
parts of the chromosome adjacent to that shown.
To the right or left of the Genes_seq line are blue regions indicating the genes, with introns shown as narrow
blue lines and exons as wider blue strips. Genes to the left of the line are transcribed in the opposite direction
to those shown on the other side of the line. Arrows to the right of the gene name indicate the direction RNA
polymerase travels in transcribing the gene. All of the diagrams on this page, including the ideogram, have
the same orientation.
Polecenia i pytania:
1. (Otworzyć link CFTR w nowej karcie!!!)
2. Czego możemy dowiedzieć się o funkcji białka CFTR, efektów jego uszkodzenia w komórce? (Patrz
pole: Summary)
3. Jak długi jest gen CFTR (bp)? Ile ma eksonów?
4. Odszukaj informacje o alternatywnych wariantach mRNA tego genu: użyj opcji format GenBank
(najlepiej również otworzyć go w nowej karcie),
5. Biorąc pod uwagę informację o funkcji i lokalizacji białka w komórce jakie elementy strukturalne
można w nim znaleźć? (białkowy rekord GenBank, wybierz rekordy z bazy danych sekwencji
referencyjnych RefSeq)
6. W jakich jeszcze organizmach są białka podobne funkcjonalnie i strukturalnie do CFTR (zakładka
po prawej stronie Related Information Homologene, zwrócić uwagę na modularną strukture
białka CFTR)
7. Czy istnieją jakieś publikacje naukowe związane z genem CFTR (zakładka Related Information
PubMed (RefSeq)
8. Wybierz ponownie okno z MapViewerem
9. Na którym chromosomie się znajduje CFTR?
10. Na którym ramieniu chromosomu określonego w poprzednim pytaniu jest gen CFTR?
11. Określ prążek, w którym znajduje się gen CFTR.
12. Ile jest genów na chromosomie zawierającym CFTR (See the bottom of the MapViewer page for
CFTR.)
13. Czy polimeraza RNA, która transkrybuje gen CFTR porusza się w kierunku do czy od telomeru?
14. Jak nazywają się CDS leżące najbliżej końca 5’ i 3’genu CFTR?
15. Czy geny sąsiadujące z CFTR na końcu 5’ i 3’–zlokalizowane są na tej samej nici genomowego
DNA co CFTR, czy różnice orientacji dotyczą większych grup genów
16. Łącze here (jeśli ono nie działa wklej w przeglądarkę adres pokazany poniżej) umożliwia dostęp do
MapViewer dla regionów CFTR w genomie człowieka, szczura i myszy.
17. Zoom out do 1/10 wielkości oglądanych chromosomów
18. Na którym chromosomie myszy jest homolog CFTR? Na którym chromosomie szczura jest homolog
CFTR?
19. Czy organizacja tego regionu jest zachowana u tych trzech organizmów? Czy można powiedzieć że
te chromosomy są w obserwowanym obszarze synteniczne albo kolinearne? Co możesz
powiedzieć na temat ewolucji chromosomów tych trzech organizmów
http://www.ncbi.nlm.nih.gov/mapview/maps.cgi?taxid=9606&chr=7&MAPS=genes-r-org/ratchr/human%3A7,genes-r-org/mouse-chr/human%3A7,genes-r-org/humanchr7&query=e%3A1080[egene_id]+AND+gene[obj_type]&QSTR=cftr&cmd=focus&fill=10

Podobne dokumenty