Laboratorium 1 Bazy danych

Transkrypt

Laboratorium 1 Bazy danych
Laboratorium 1
Bazy danych
1.
Wybierz jedną spośród poniższych sekwencji, a następnie znajdź informacje na jej temat
przy wykorzystaniu EMBL BLAST and FASTA lub NCBI BLAST.
W jakich gatunkach została znaleziona, jakie jest jej rozmieszczenie/rozkład w ramach tych
gatunków?
Jaka jest funkcja wybranej sekwencji?
>A
AACAAAAUAAUUUACAUUCCAAGGACCGGUAUUAUUGUAGGGGAUUUGUGACUUUCAAGGCAACGUCCUCUCU
ACAACCGAGUUCGAGAAUAAGUACAAAUGGCUCUUUUUGUUAUUCGAAAGCUUACAAGUUCUGGUAUAUUCUA
UAUACUCACUUAUUACUUUCAAGUACUUCACACGGGCCUGACAUCU
>B
UAAAUAUACAACACCCAGUAUUUUUGGCUGCCCGUGUCUUUCUCUACCACGGGUAGUCUCUCUAAGCUGGCAG
AUAGAUGUUUAUUGAACCGCUUAAGUUCCGUUGUGAAGUUUUCGUCUUUCAGGCUGUAUUUCAUAACACUACU
GUAGUUCACACAUAC
>C
UCGGCCUGUGCCACUCAAACUGUGGGGGCACUUUCUGUUCUAGGUAGGAAAGUGCCGCCAUUUUUUGAGUGUC
CCCGGCUGA
>D
UCCUUAUCCCGUUCGCAAUGGCACUGCAUGAAUUCACGGCUAUGCAUAACGACAGACCGCGGAUCAUACGGUA
CCAUAGCGGACGGUGAUGAGGUUAAU
>E
AUUGCAAUUAACUAAAAUCCCUAUCAGGGAUUGAAAC
>F
GGUCACGAGUGCCAGCGCUAAACCCCGGUUUGCUGGCCGGCAACCCUCCAUUCGCGGUGGGGUGCCCCGGGUG
ACGACCCGGCCGGUCCGGAAUGGAUGCGGCAAGCGCGGAUC
>G
GUAGAUGCUCAUUCCAUCUCUUAUGUUCGCCUUCGUGCCUCAUAAACUCCGGAAUGAUGCAGAGCCGUUCUUA
CGGUGCUUAUCGUCCACUGACAGAUGUCGCAUUUAUGCCUCAUCAAACACCAUGGACAUUACGUUGAGUGAAG
CACCCAAUUUGUUGUCAAACAGACCUGUUUUAACGCCUGCCCUGAUuucaGCGCAGGCGUUUUUUU
>H
GAUACAUAGGAACCUCCUCACAAAGGAUUCUAUGGACAGUCGAUGCAGGGAGGAGAGAACUCCCUGCAUCGGC
GAUUUU
2.
Wyszukaj informacje dla wybranej wcześniej sekwencji w bazie danych Rfam.
W jakich gatunkach została znaleziona, jakie jest jej rozmieszczenie/rozkład w ramach tych
gatunków oraz jaką pełnią najprawdopodobniej funkcję jej homologi?
Jaka jest funkcja wybranej sekwencji?
Czy wybrana sekwencja należy do jakiejś rodziny RNA?, jakiej?, scharakteryzuj tą
rodzinę.
>A
AACAAAAUAAUUUACAUUCCAAGGACCGGUAUUAUUGUAGGGGAUUUGUGACUUUCAAGGCAACGUCCUCUCU
ACAACCGAGUUCGAGAAUAAGUACAAAUGGCUCUUUUUGUUAUUCGAAAGCUUACAAGUUCUGGUAUAUUCUA
UAUACUCACUUAUUACUUUCAAGUACUUCACACGGGCCUGACAUCU
>B
UAAAUAUACAACACCCAGUAUUUUUGGCUGCCCGUGUCUUUCUCUACCACGGGUAGUCUCUCUAAGCUGGCAG
AUAGAUGUUUAUUGAACCGCUUAAGUUCCGUUGUGAAGUUUUCGUCUUUCAGGCUGUAUUUCAUAACACUACU
GUAGUUCACACAUAC
>C
UCGGCCUGUGCCACUCAAACUGUGGGGGCACUUUCUGUUCUAGGUAGGAAAGUGCCGCCAUUUUUUGAGUGUC
CCCGGCUGA
>D
UCCUUAUCCCGUUCGCAAUGGCACUGCAUGAAUUCACGGCUAUGCAUAACGACAGACCGCGGAUCAUACGGUA
CCAUAGCGGACGGUGAUGAGGUUAAU
>E
AUUGCAAUUAACUAAAAUCCCUAUCAGGGAUUGAAAC
>F
GGUCACGAGUGCCAGCGCUAAACCCCGGUUUGCUGGCCGGCAACCCUCCAUUCGCGGUGGGGUGCCCCGGGUG
ACGACCCGGCCGGUCCGGAAUGGAUGCGGCAAGCGCGGAUC
>G
GUAGAUGCUCAUUCCAUCUCUUAUGUUCGCCUUCGUGCCUCAUAAACUCCGGAAUGAUGCAGAGCCGUUCUUA
CGGUGCUUAUCGUCCACUGACAGAUGUCGCAUUUAUGCCUCAUCAAACACCAUGGACAUUACGUUGAGUGAAG
CACCCAAUUUGUUGUCAAACAGACCUGUUUUAACGCCUGCCCUGAUUUCAGCGCAGGCGUUUUUUU
>H
GAUACAUAGGAACCUCCUCACAAAGGAUUCUAUGGACAGUCGAUGCAGGGAGGAGAGAACUCCCUGCAUCGGC
GAUUUU
3.
Mając daną następującą sekwencję pre-miRNA odpowiedz na poniższe pytania przy
wykorzystaniu wybranych baz danych dla miRNA. Można rozpocząć od miRBase,
miR2Disease oraz miRNAmap.
Co to jest za miRNA? Z jakich gatunków może pochodzić?
Z jakimi (jeśli w ogóle), występującymi u człowieka chorobami jest powiązany?
W jakiej tkance rozważany miRNA ulega ekspresji?
>mir-Q
UGGCCGAUUUUGGCACUAGCACAUUUUUGCUUGUGUCUCUCCGCUCUGAGCAAUCAUGUGCAGUGCCAAUAUG
GGAAA
4.
Przy wykorzystaniu bazy Rfam sprawdź do jakiej rodziny należy poniższy RNA.
Jaka jest funkcja członków tej rodziny?
Czy są jakieś inne zasoby sieciowe, które opisują tą rodzinę?
Jakie inne rodziny RNA są opisane (mają adnotację) w bazie Rfam dla genomu E. coli?
>query1
bacterial RNA
GGGGCUGAUUCUGGAUUCGACGGGAUUUGCGAAACCCAAGGUGCAUGCCGAGGGGCGGUU
GGCCUCGUAAAAAGCCGCAAAAAAUAGUCGCAAACGACGAAAACUACGCUUUAGCAGCUU
AAUAACCUGCUUAGAGCCCUCUCUCCCUAGCCUCCGCUCUUAGGACGGGGAUCAAGAGAG
GUCAAACCCAAAAGAGAUCGCGUGGAAGCCCUGCCUGGGGUUGAAGCGUUAAAACUUAAU
CAGGCUAGUUUGUUAGUGGCGUGUCCGUCCGCAGCUGGCAAGCGAAUGUAAAGACUGACU
AAGCAUGUAGUACCGAGGACGUAGGAAUUUCGGACGCGGGUUCAACUCCCGCCAGCUCCA
CCA
5.
Wykorzystując bazy danych NCBI opracuj strategie wyszukiwania, które umożliwią
znalezienie poprawnych odpowiedzi na poniższe pytania:
a. Znajdź sekwencje białkowych ludzkich kinaz zmodyfikowanych lub dodanych
do bazy GenBank w ciągu ostatnich 30 dni.
b. Znajdź sekwencje genów dehydrogenazy mrówczanowej z Methanobacterium.
c. Znajdź publikacje przeglądowe związane z elektrostatycznymi potencjałami
białek, których współautorem jest Honig, opublikowane od 1990 roku.
d. Znajdź informację na temat liczby egzonów i intronów w genie fitochromu A
(phyA) Arabidopsis (wskazówka: użyj [GENE] do zawężenia wyszukiwania).
Opisz opracowane strategie oraz uzyskane wyniki.
6.
Porównaj struktury drugorzędowe RNA uzyskane w wyniku porównawczej analizy
sekwencji oraz na podstawie trzeciorzędowych struktur, dla jednej z poniższych sekwencji
przy wykorzystaniu wybranych baz danych. Przykładowo, wykorzystaj bazę Rfam dla
uzyskania porównawczej struktury drugorzędowej (z porównawczej analizy sekwencji)
oraz FRABASE dla uzyskania struktury drugorzędowej na podstawie struktur
trzeciorzędowych.
>2GOZ
gGAUGUACUACCAGCUGAUGAGUCCCAAAUAGGACGAAACGCCNNNgGCGUcCUGGuAUCCAAuCc
query
(((.(...(((((((....).((((......))))...(((((NNN))))).)))))).)...)))
FRABASE
structure
((((((,,,,,,,<<<<______>>>>,,,<<<<.....>>>>,))))))
CM
alignment
UACCAGCUGAUGAGUCCCAAAUAGGACGAAACGCcnnngGCGUCCUGGUA
fragment
match
>2QUS
gGGAGCCCUGUCACCGGAUGUGCUUUCCGGUCUGAUGAGUCCGUGAGGACAAAACAGGGCUCCCGA
AUU
>3IWN
cACGCACAGGGCAAACCAUUCGAAAGAGUGGGACGCAAAGCCUCCGGCCUAAACGGCAUUGCACUCCGCCGUA
GGUAGCGGGGUUACCGAUGG
>1SJF
GaUGGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACACCAUUGCACUCCGGUGGUGAAUGGG
ACU
>2KFC
gGAGAGGUUCUAGUUAUACCCUCUAUAAAAAACUAAg
>1T28
gGUCAUCGUUGAGAAAACGAAACAGACGGUGGCC