Ćw. 3 Korzystanie z bioinformatycznych baz danych 1. Bazy
Transkrypt
Ćw. 3 Korzystanie z bioinformatycznych baz danych 1. Bazy
MSB 2016/2017 Bioinformatyka Marcin Filipecki Ćw. 3 Korzystanie z bioinformatycznych baz danych 1. Bazy literaturowe (abstraktowe i pełnotekstowe) PubMed i PubMed Central (PMC)– szukanie narzędziami w NCBI – proste i advanced: a. Ptasia grypa (avian influenza, H5N1) – co ostatnio w temacie szczepionek (vaccine) wymyślili chińscy (Affiliation - China) naukowcy. Advaced search. Linki do wydawców i udostępnianych pełnych tekstów; rozdzielczość w pdf; Biblioteka Główna SGGW, biblioteka jeszcze bardziej wirtualna. b. W domu: Czy wiadomo coś o wpływie picia kawy (coffee consumption) na zachorowalność na raka piersi wywołanego mutacjami w genie BRCA1. 2. Przeszukiwaniu baz nukleotydowych NCBI (GenBank) przy pomocy słów kluczowych. Wyszukiwanie uproszczone np. baza nukleotydowa i termin BRCA1 (ile trafień? jaki zakres informacji można wyświetlać – ACC number, definitione, organism, linki literaturowe do PubMed, Sekcja Summary, czcionka courier, format FASTA i FASTA text. Oglądanie rekordu nukleotydowego, eksploracja linków do sekwencji – Related Information (NM_007306): a. Gene – ile wariantów splajsingu?, opis genu, streszczenie i linki) b. Map viewer, c. Protein 3. Analogiczne wyszukanie białka AGAMOUS z A.thaliana w baize EMBL na stronie EBI. Oglądanie rekordu bazy UniPROT. Skopiowanie sekwencji białka w formacie FASTA. 4. Analiza obecności domen i charakterystycznych motywów w wyżej wymienionym białku przy pomocy skanera z bazy ProSite. Zezwalać na wykrywanie “moifs of high probability of occurrence” – potencjalne miejsca fosforylacji I glikozylacji. Zapis wzoru (consensus pattern) w baize ProSite. 5. Analiza możliwej lokalizacji subkomórkowej tej samej sekwencji białkowej Narzędziem UniLoc. 6. Baza szlaków biochemicznych KEGG (Kyoto Encyclopedia of Genes and Gemomes) – Data-oriented entry points: KEGG Pathway: reference pathway/gatunek, linki do innych baz – enzyme, compound, reaction, sequence (aa/nt). Ćwiczenia w domu: 7. Narzędzia Swiss Bioinformatics Institute, serwer EXPASY a. Baza danych UNIPROT/TrEMBL – linki do rekordów (na dole) b. Narzędzie translate: Pobierz sekwencję nukleotydową AJ555125 i skopiuj ją w formacie FASTA. Wklej do okna dialogowego TRANSLATE, wybierz ramkę z najdłuższym kodowanym polipeptydem, wybierz najbardziej prawdopodobny kodon startu, wygeneruj wirtualne białko, przećwicz generowanie formatu FASTA tego białka, wykonaj porównanie programem BLASTP w SBI korzystając z linków poniżej wirtualnej sekwencji, obejrzyj format wyniku c. Baza danych SWISS-2DPAGE. Poszukiwanie białka w oparciu o masę cząsteczkową i punkt izoelektryczny na żelach poliakrylamidowych (access by clicking on a spot) – dostęp do informacji o białku przez cross references – SWISS-PROT. 8. Czy są geny kandydujące i odpowiedzialne za zespół Downa (down syndrome)? (np. przez bazy białkowe lub przez OMIM). 9. Co można ciekawego powiedzieć o genie odpowiedzialnym za dystrofię mięśniową Duchenne’a (przez OMIM)? 10. Czy SUPERMAN ma swoje białko (gatunek)? Korzystanie z EBI (EMBL). 11. Skąd pochodzą słonie indyjskie? (PubMed)