Laboratorium 1 Bazy danych
Transkrypt
Laboratorium 1 Bazy danych
Laboratorium 1 Bazy danych 1. Wybierz jedną spośród poniższych sekwencji, a następnie znajdź informacje na jej temat przy wykorzystaniu EMBL BLAST and FASTA lub NCBI BLAST. W jakich gatunkach została znaleziona, jakie jest jej rozmieszczenie/rozkład w ramach tych gatunków? Jaka jest funkcja wybranej sekwencji? >A AACAAAAUAAUUUACAUUCCAAGGACCGGUAUUAUUGUAGGGGAUUUGUGACUUUCAAGGCAACGUCCUCUCU ACAACCGAGUUCGAGAAUAAGUACAAAUGGCUCUUUUUGUUAUUCGAAAGCUUACAAGUUCUGGUAUAUUCUA UAUACUCACUUAUUACUUUCAAGUACUUCACACGGGCCUGACAUCU >B UAAAUAUACAACACCCAGUAUUUUUGGCUGCCCGUGUCUUUCUCUACCACGGGUAGUCUCUCUAAGCUGGCAG AUAGAUGUUUAUUGAACCGCUUAAGUUCCGUUGUGAAGUUUUCGUCUUUCAGGCUGUAUUUCAUAACACUACU GUAGUUCACACAUAC >C UCGGCCUGUGCCACUCAAACUGUGGGGGCACUUUCUGUUCUAGGUAGGAAAGUGCCGCCAUUUUUUGAGUGUC CCCGGCUGA >D UCCUUAUCCCGUUCGCAAUGGCACUGCAUGAAUUCACGGCUAUGCAUAACGACAGACCGCGGAUCAUACGGUA CCAUAGCGGACGGUGAUGAGGUUAAU >E AUUGCAAUUAACUAAAAUCCCUAUCAGGGAUUGAAAC >F GGUCACGAGUGCCAGCGCUAAACCCCGGUUUGCUGGCCGGCAACCCUCCAUUCGCGGUGGGGUGCCCCGGGUG ACGACCCGGCCGGUCCGGAAUGGAUGCGGCAAGCGCGGAUC >G GUAGAUGCUCAUUCCAUCUCUUAUGUUCGCCUUCGUGCCUCAUAAACUCCGGAAUGAUGCAGAGCCGUUCUUA CGGUGCUUAUCGUCCACUGACAGAUGUCGCAUUUAUGCCUCAUCAAACACCAUGGACAUUACGUUGAGUGAAG CACCCAAUUUGUUGUCAAACAGACCUGUUUUAACGCCUGCCCUGAUuucaGCGCAGGCGUUUUUUU >H GAUACAUAGGAACCUCCUCACAAAGGAUUCUAUGGACAGUCGAUGCAGGGAGGAGAGAACUCCCUGCAUCGGC GAUUUU 2. Wyszukaj informacje dla wybranej wcześniej sekwencji w bazie danych Rfam. W jakich gatunkach została znaleziona, jakie jest jej rozmieszczenie/rozkład w ramach tych gatunków oraz jaką pełnią najprawdopodobniej funkcję jej homologi? Jaka jest funkcja wybranej sekwencji? Czy wybrana sekwencja należy do jakiejś rodziny RNA?, jakiej?, scharakteryzuj tą rodzinę. >A AACAAAAUAAUUUACAUUCCAAGGACCGGUAUUAUUGUAGGGGAUUUGUGACUUUCAAGGCAACGUCCUCUCU ACAACCGAGUUCGAGAAUAAGUACAAAUGGCUCUUUUUGUUAUUCGAAAGCUUACAAGUUCUGGUAUAUUCUA UAUACUCACUUAUUACUUUCAAGUACUUCACACGGGCCUGACAUCU >B UAAAUAUACAACACCCAGUAUUUUUGGCUGCCCGUGUCUUUCUCUACCACGGGUAGUCUCUCUAAGCUGGCAG AUAGAUGUUUAUUGAACCGCUUAAGUUCCGUUGUGAAGUUUUCGUCUUUCAGGCUGUAUUUCAUAACACUACU GUAGUUCACACAUAC >C UCGGCCUGUGCCACUCAAACUGUGGGGGCACUUUCUGUUCUAGGUAGGAAAGUGCCGCCAUUUUUUGAGUGUC CCCGGCUGA >D UCCUUAUCCCGUUCGCAAUGGCACUGCAUGAAUUCACGGCUAUGCAUAACGACAGACCGCGGAUCAUACGGUA CCAUAGCGGACGGUGAUGAGGUUAAU >E AUUGCAAUUAACUAAAAUCCCUAUCAGGGAUUGAAAC >F GGUCACGAGUGCCAGCGCUAAACCCCGGUUUGCUGGCCGGCAACCCUCCAUUCGCGGUGGGGUGCCCCGGGUG ACGACCCGGCCGGUCCGGAAUGGAUGCGGCAAGCGCGGAUC >G GUAGAUGCUCAUUCCAUCUCUUAUGUUCGCCUUCGUGCCUCAUAAACUCCGGAAUGAUGCAGAGCCGUUCUUA CGGUGCUUAUCGUCCACUGACAGAUGUCGCAUUUAUGCCUCAUCAAACACCAUGGACAUUACGUUGAGUGAAG CACCCAAUUUGUUGUCAAACAGACCUGUUUUAACGCCUGCCCUGAUUUCAGCGCAGGCGUUUUUUU >H GAUACAUAGGAACCUCCUCACAAAGGAUUCUAUGGACAGUCGAUGCAGGGAGGAGAGAACUCCCUGCAUCGGC GAUUUU 3. Mając daną następującą sekwencję pre-miRNA odpowiedz na poniższe pytania przy wykorzystaniu wybranych baz danych dla miRNA. Można rozpocząć od miRBase, miR2Disease oraz miRNAmap. Co to jest za miRNA? Z jakich gatunków może pochodzić? Z jakimi (jeśli w ogóle), występującymi u człowieka chorobami jest powiązany? W jakiej tkance rozważany miRNA ulega ekspresji? >mir-Q UGGCCGAUUUUGGCACUAGCACAUUUUUGCUUGUGUCUCUCCGCUCUGAGCAAUCAUGUGCAGUGCCAAUAUG GGAAA 4. Przy wykorzystaniu bazy Rfam sprawdź do jakiej rodziny należy poniższy RNA. Jaka jest funkcja członków tej rodziny? Czy są jakieś inne zasoby sieciowe, które opisują tą rodzinę? Jakie inne rodziny RNA są opisane (mają adnotację) w bazie Rfam dla genomu E. coli? >query1 bacterial RNA GGGGCUGAUUCUGGAUUCGACGGGAUUUGCGAAACCCAAGGUGCAUGCCGAGGGGCGGUU GGCCUCGUAAAAAGCCGCAAAAAAUAGUCGCAAACGACGAAAACUACGCUUUAGCAGCUU AAUAACCUGCUUAGAGCCCUCUCUCCCUAGCCUCCGCUCUUAGGACGGGGAUCAAGAGAG GUCAAACCCAAAAGAGAUCGCGUGGAAGCCCUGCCUGGGGUUGAAGCGUUAAAACUUAAU CAGGCUAGUUUGUUAGUGGCGUGUCCGUCCGCAGCUGGCAAGCGAAUGUAAAGACUGACU AAGCAUGUAGUACCGAGGACGUAGGAAUUUCGGACGCGGGUUCAACUCCCGCCAGCUCCA CCA 5. Wykorzystując bazy danych NCBI opracuj strategie wyszukiwania, które umożliwią znalezienie poprawnych odpowiedzi na poniższe pytania: a. Znajdź sekwencje białkowych ludzkich kinaz zmodyfikowanych lub dodanych do bazy GenBank w ciągu ostatnich 30 dni. b. Znajdź sekwencje genów dehydrogenazy mrówczanowej z Methanobacterium. c. Znajdź publikacje przeglądowe związane z elektrostatycznymi potencjałami białek, których współautorem jest Honig, opublikowane od 1990 roku. d. Znajdź informację na temat liczby egzonów i intronów w genie fitochromu A (phyA) Arabidopsis (wskazówka: użyj [GENE] do zawężenia wyszukiwania). Opisz opracowane strategie oraz uzyskane wyniki. 6. Porównaj struktury drugorzędowe RNA uzyskane w wyniku porównawczej analizy sekwencji oraz na podstawie trzeciorzędowych struktur, dla jednej z poniższych sekwencji przy wykorzystaniu wybranych baz danych. Przykładowo, wykorzystaj bazę Rfam dla uzyskania porównawczej struktury drugorzędowej (z porównawczej analizy sekwencji) oraz FRABASE dla uzyskania struktury drugorzędowej na podstawie struktur trzeciorzędowych. >2GOZ gGAUGUACUACCAGCUGAUGAGUCCCAAAUAGGACGAAACGCCNNNgGCGUcCUGGuAUCCAAuCc query (((.(...(((((((....).((((......))))...(((((NNN))))).)))))).)...))) FRABASE structure ((((((,,,,,,,<<<<______>>>>,,,<<<<.....>>>>,)))))) CM alignment UACCAGCUGAUGAGUCCCAAAUAGGACGAAACGCcnnngGCGUCCUGGUA fragment match >2QUS gGGAGCCCUGUCACCGGAUGUGCUUUCCGGUCUGAUGAGUCCGUGAGGACAAAACAGGGCUCCCGA AUU >3IWN cACGCACAGGGCAAACCAUUCGAAAGAGUGGGACGCAAAGCCUCCGGCCUAAACGGCAUUGCACUCCGCCGUA GGUAGCGGGGUUACCGAUGG >1SJF GaUGGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACACCAUUGCACUCCGGUGGUGAAUGGG ACU >2KFC gGAGAGGUUCUAGUUAUACCCUCUAUAAAAAACUAAg >1T28 gGUCAUCGUUGAGAAAACGAAACAGACGGUGGCC