Ćw. 3 Korzystanie z bioinformatycznych baz danych 1. Bazy

Transkrypt

Ćw. 3 Korzystanie z bioinformatycznych baz danych 1. Bazy
MSB 2016/2017 Bioinformatyka
Marcin Filipecki
Ćw. 3 Korzystanie z bioinformatycznych baz danych
1. Bazy literaturowe (abstraktowe i pełnotekstowe) PubMed i PubMed Central (PMC)– szukanie
narzędziami w NCBI – proste i advanced:
a. Ptasia grypa (avian influenza, H5N1) – co ostatnio w temacie szczepionek (vaccine) wymyślili
chińscy (Affiliation - China) naukowcy. Advaced search. Linki do wydawców i udostępnianych
pełnych tekstów; rozdzielczość w pdf; Biblioteka Główna SGGW, biblioteka jeszcze bardziej
wirtualna.
b. W domu: Czy wiadomo coś o wpływie picia kawy (coffee consumption) na zachorowalność na
raka piersi wywołanego mutacjami w genie BRCA1.
2. Przeszukiwaniu baz nukleotydowych NCBI (GenBank) przy pomocy słów kluczowych.
Wyszukiwanie uproszczone np. baza nukleotydowa i termin BRCA1 (ile trafień? jaki zakres
informacji można wyświetlać – ACC number, definitione, organism, linki literaturowe do PubMed,
Sekcja Summary, czcionka courier, format FASTA i FASTA text. Oglądanie rekordu
nukleotydowego, eksploracja linków do sekwencji – Related Information (NM_007306):
a. Gene – ile wariantów splajsingu?, opis genu, streszczenie i linki)
b. Map viewer,
c. Protein
3. Analogiczne wyszukanie białka AGAMOUS z A.thaliana w baize EMBL na stronie EBI. Oglądanie
rekordu bazy UniPROT. Skopiowanie sekwencji białka w formacie FASTA.
4. Analiza obecności domen i charakterystycznych motywów w wyżej wymienionym białku przy
pomocy skanera z bazy ProSite. Zezwalać na wykrywanie “moifs of high probability of occurrence” –
potencjalne miejsca fosforylacji I glikozylacji. Zapis wzoru (consensus pattern) w baize ProSite.
5. Analiza możliwej lokalizacji subkomórkowej tej samej sekwencji białkowej Narzędziem UniLoc.
6. Baza szlaków biochemicznych KEGG (Kyoto Encyclopedia of Genes and Gemomes) – Data-oriented
entry points: KEGG Pathway: reference pathway/gatunek, linki do innych baz – enzyme, compound,
reaction, sequence (aa/nt).
Ćwiczenia w domu:
7. Narzędzia Swiss Bioinformatics Institute, serwer EXPASY
a. Baza danych UNIPROT/TrEMBL – linki do rekordów (na dole)
b. Narzędzie translate: Pobierz sekwencję nukleotydową AJ555125 i skopiuj ją w formacie
FASTA. Wklej do okna dialogowego TRANSLATE, wybierz ramkę z najdłuższym
kodowanym polipeptydem, wybierz najbardziej prawdopodobny kodon startu, wygeneruj
wirtualne białko, przećwicz generowanie formatu FASTA tego białka, wykonaj porównanie
programem BLASTP w SBI korzystając z linków poniżej wirtualnej sekwencji, obejrzyj
format wyniku
c. Baza danych SWISS-2DPAGE. Poszukiwanie białka w oparciu o masę cząsteczkową i punkt
izoelektryczny na żelach poliakrylamidowych (access by clicking on a spot) – dostęp do
informacji o białku przez cross references – SWISS-PROT.
8. Czy są geny kandydujące i odpowiedzialne za zespół Downa (down syndrome)? (np. przez bazy
białkowe lub przez OMIM).
9. Co można ciekawego powiedzieć o genie odpowiedzialnym za dystrofię mięśniową Duchenne’a
(przez OMIM)?
10. Czy SUPERMAN ma swoje białko (gatunek)? Korzystanie z EBI (EMBL).
11. Skąd pochodzą słonie indyjskie? (PubMed)