MultiSETTER - Uniwersytet Jagielloński
Transkrypt
MultiSETTER - Uniwersytet Jagielloński
„MultiSETTER: web server for multiple RNA structure comparison” Sandra Sobierajska Uniwersytet Jagielloński Wprowadzenie • Budowa RNA: • - struktura pierwszorzędowa – sekwencja nukleotydów w łańcuchu: A, U, G, C • - struktura drugorzędowa – przestrzenne ukształtowanie cząsteczki • - elementy tej struktury mogą być przewidziane za pomocą obliczeń • - struktura trzeciorzędowa • Struktury 3D RNA są znane jako struktury trzeciorzędowe i formowane z długozasięgowych interakcji pomiędzy odległymi pętlami stabilizowanymi przez kanoniczne lub niekanoniczne par zasad, kationy bądź słabe oddziaływania Cel • Duży wpływ struktury trzeciorzędowej i porównanie struktur 3D RNA -> skuteczne narzędzie do badania funkcji RNA i relacji ewolucyjnych Kilka metod ARTS, DIAL, iPARTS, SARA , SARSA, Rclick, R3Dalign, RASS, FRASS, SETTER, czy R3D-BLAST Ale… Żadna z tych metod nie potrafi tego, czego my potrzebujemy, czyli bezpośredniego wielokrotnego dopasowania struktur RNA Tak więc opracowano MultiSETTER! Zalety • Można wykryć motywy niekonserwatywne na poziomie sekwencji • Może być łatwo sprawdzane wizualnie w celu wykrycia wspólnych motywów -> nie wymagają tak wielu cząsteczek jak MSA • Dostępność dla szerokiej publiczności biologów i bioinformatyków • Bezpłatny i otwarty dla wszystkich • Brak wymagań logowania Zalety cd. • Umożliwia wykonanie dopasowania zarówno dla dwóch, jak i więcej struktur oraz porównania między strukturami uzyskanymi z bazy danych PDB lub dostarczonego przez użytkownika • Grafika 3D jak i zbiorcze dane statystyczne -> interpretacja Algorytm SETTER • SEcondary sTructure-based TERtiary superposition • Podział na fragmenty drugorzędowe struktury – GSSU (generalized secondary structure units) Budowa GSSU Algorytm SETTER cd. • Nakładanie dwóch struktur • Algorytm minimalizacji RMSD w celu uzyskania superpozycji strukturalnej • 3 pary punktów: - Dwie poprzez dopasowanie dwóch odpowiednich reszt szyi - Trzecia – identyfikowana poprzez dopasowanie każdej możliwej pary nukleotydów pętlowych (wybór – najmniejsza liczba punktów) Algorytm SETTER cd. • Kolejne porównywanie dwóch struktur poprzez dodatkowe RMSD superpozycji wzajemnych najbliższych sąsiadujących reszt • Punktacja : S-distance Algorytm MultiSETTER • Heurystyczne podejście – dopasowanie progresywne (jak Clustal) • Każda para struktur RNA jest dopasowywana przez SETTER, wyniki S-distance powodują powstanie macierzy odległości • Drzewo prowadzące jest obliczane przy pomocy metody łączenia sąsiadów (neighbor-joining) Algorytm MultiSETTER • Dwie najbliższe sobie struktury -> ‘average structure’ -> średnia pozycja indywidualnych atomów • Dopóki nie dojdziemy do korzenia Paralelizacja 1) Superpozycja struktury par RNA Przetwarzanie wielokrotnych par GSSU (TYLKO ONE!!), niezależnie i każdy z nich przypisany do danej jednostki obliczeniowej 2) Macierz odległości Dla n struktur: n*(n-1)/2 niezależnie Paralelizacja 3) Łączenie RNA Powstawanie „przeciętnej struktury” może być rozłożone na scalone dopasowanie GSSUs. Takie łączenie może zachodzić niezależnie, czyli równolegle Porównanie dopasowania dwóch struktur do wielokrotnego 1NKW i 1S72 (23 S) 1NKW, 1S72, 2AWB, 2Y11 (23 S) ~3000 reszt każdy 4 rdzeniowy z Hyper-V – Intel(R) Core ™ i7-4790 CP. 3.60 GHz, 16GB RAM, Windows 8.1 Ograniczenie liczby nici od 1-4 Wyniki Języki programowania 1) Rdzeń – C++ 2) Aplikacja web – Python, Model-Template-View (MTV), Django version 1.4 Ze strony serweru: Python Dla klienta: jQuery JavaScript version 1.10.4 oraz JavaScript molecular viewer JSmol Połączenia • Dane o strukturze RNA: baza danych SETTER • Relacyjna baza danych MySQL synchronizowana z PDB w każdą środę • SETTER = PDB ID, ID łańcuchów, wzory wiązań wodorowych Input Input Output Reasumując • Pierwsze dostępne publicznie narzędzie do wielokrotnego dopasowania struktury RNA • Wiele dokładnych dopasowań w rozsądnym czasie • Wizualizacja w 3D, która może ujawnić relacje strukturalne i funkcjonalne • W przyszłości łączyć dopasowania sekwencji i struktur z dużą dokładnością Dziękuję za uwagę.