Zastosowanie języka Perl i pakietu R w analizie danych biologicznych
Transkrypt
Zastosowanie języka Perl i pakietu R w analizie danych biologicznych
Zastosowanie języka Perl i pakietu R w analizie danych biologicznych 26 – 28 czerwca 2014 BIT Polska, ul. Ostrobramska 101A, Warszawa Wraz ze sekwencjonowaniem kolejnych genomów lawinowo wzrasta liczba dostępnych sekwencji DNA i białek. Wysokowydajna metoda mikromacierzy również dostarcza danych o poziomie i zmianach ekspresji genów w trakcie ontogenezy, adaptacji do środowiska i zmianach chorobowych. Różnorodne metody analizy SNP dostarczają coraz większej ilości danych do wykrycia genetycznego podłoża chorób oraz warunkowania cech ilościowych. Bioinformatyka jest intensywnie rozwijającą się nauką zajmującą się biologicznymi bazami danych i programami do ich analizy. Warsztaty pozwolą uczestnikom przełamać często spotykane wśród biologów obawy przed bioinformatyką i trudnościami programowania. Podczas warsztatów uczestnicy będą prowadzili wiele ćwiczeń korzystając z pakietu R (Freeware) oraz języka programowania Perl (Practical Extraction and Report Language – praktyczny język ekstrakcji i raportowania) (Freeware) na przykładzie danych biologicznych i bioinformatycznych. Efekty kształcenia: • Wiedza. Uczestnik warsztatów: zaznajomi się z możliwościami zastosowań języka Perl i R w analizie danych biologicznych i bioinformatycznych; pozna powszechnie stosowane formaty plików z bazy GenBank przechowujące informacje o sekwencjach białek i kwasów nukleinowych; • Umiejętności. Uczestnik warsztatów będzie potrafił napisać skrypty przetwarzające pliki pochodzące z bazy danych GenBank oraz inne pliki tekstowe zwierające dane biologiczne; przy pisaniu skryptów będzie umiał zastosować pętle, instrukcje warunkowe, podstawowe funkcje oraz operacje na wyrażeniach regularnych; zapozna się także z możliwościami pakietu R w zakresie procedur statystycznych i wyspecjalizowanego pakietu seqinr do analiz bioinformatycznych; • Kompetencje. Uczestnik warsztatów będzie rozumiał idee i potrzebę programowania oraz automatyzację pracy na dużych zbiorach danych bioinformatycznych i biologicznych. Tematyka warsztatów obejmuje wykłady i ćwiczenia dotyczące: - zakresu i celu badań bioinformatyki - poziomów analizy genomiki i bioinformatyki - rodzajów i problemów baz danych - podstaw programowania w języku PERL - podstaw programowania w języku R w tym pakietu seqinr Dzień 1 09:00– 09:15 09:15 - 11:15 11:15 - 11:30 11:30 - 13:00 13:00 - 14:00 Otwarcie warsztatów Bioinformatyka i genomika -wykład Przerwa Nauka programowania w języku PERL – wykład i ćwiczenia Obiad 14:00 – 17:00 Nauka programowania w języku PERL – wykład i ćwiczenia Dzień 2 09:00 - 11:00 11:00 - 11:15 11:15 - 13:15 Nauka programowania w języku PERL – wykład i ćwiczenia 13:15 - 14:15 14:15 – 17.00 Obiad Podstawowe procedury statystyczne w R – wykład i ćwiczenia Przerwa Wprowadzenie do programu R – wykład i ćwiczenia Dzień 3 09:00 - 11:00 11:00 – 11:15 11:15 – 13:00 13:00 Pakiet seqinr do analizy sekwencji – wykład i ćwiczenia Przerwa Pakiet seqinr do analizy sekwencji – wykład i ćwiczenia Zakończenie