MultiSETTER - Uniwersytet Jagielloński

Transkrypt

MultiSETTER - Uniwersytet Jagielloński
„MultiSETTER: web server for multiple
RNA structure comparison”
Sandra Sobierajska
Uniwersytet Jagielloński
Wprowadzenie
• Budowa RNA:
• - struktura pierwszorzędowa – sekwencja
nukleotydów w łańcuchu: A, U, G, C
• - struktura drugorzędowa – przestrzenne
ukształtowanie cząsteczki
• - elementy tej struktury mogą być przewidziane za
pomocą obliczeń
• - struktura trzeciorzędowa
• Struktury 3D RNA są znane jako struktury
trzeciorzędowe i formowane
z długozasięgowych interakcji
pomiędzy odległymi
pętlami stabilizowanymi przez
kanoniczne lub niekanoniczne
par zasad, kationy
bądź słabe oddziaływania
Cel
• Duży wpływ struktury trzeciorzędowej i porównanie
struktur 3D RNA
-> skuteczne narzędzie do badania funkcji RNA i
relacji ewolucyjnych
Kilka metod
ARTS, DIAL, iPARTS, SARA , SARSA, Rclick, R3Dalign,
RASS, FRASS, SETTER, czy R3D-BLAST
Ale…
Żadna z tych metod nie potrafi tego, czego my
potrzebujemy, czyli bezpośredniego wielokrotnego
dopasowania struktur RNA
Tak więc opracowano MultiSETTER!
Zalety
• Można wykryć motywy niekonserwatywne na
poziomie sekwencji
• Może być łatwo sprawdzane wizualnie w celu
wykrycia wspólnych motywów -> nie wymagają tak
wielu cząsteczek jak MSA
• Dostępność dla szerokiej publiczności biologów i
bioinformatyków
• Bezpłatny i otwarty dla wszystkich
• Brak wymagań logowania
Zalety cd.
• Umożliwia wykonanie dopasowania zarówno dla
dwóch, jak i więcej struktur oraz porównania
między strukturami uzyskanymi z bazy danych PDB
lub dostarczonego przez użytkownika
• Grafika 3D jak i zbiorcze dane statystyczne ->
interpretacja
Algorytm SETTER
• SEcondary sTructure-based TERtiary superposition
• Podział na fragmenty drugorzędowe struktury –
GSSU (generalized secondary structure units)
Budowa GSSU
Algorytm SETTER cd.
• Nakładanie dwóch struktur
• Algorytm minimalizacji RMSD w celu uzyskania
superpozycji strukturalnej
• 3 pary punktów:
- Dwie poprzez dopasowanie dwóch odpowiednich
reszt szyi
- Trzecia – identyfikowana poprzez dopasowanie
każdej możliwej pary nukleotydów pętlowych
(wybór – najmniejsza liczba punktów)
Algorytm SETTER cd.
• Kolejne porównywanie dwóch struktur poprzez
dodatkowe RMSD superpozycji wzajemnych
najbliższych sąsiadujących reszt
• Punktacja : S-distance
Algorytm MultiSETTER
• Heurystyczne podejście – dopasowanie
progresywne (jak Clustal)
• Każda para struktur RNA jest dopasowywana przez
SETTER, wyniki S-distance powodują powstanie
macierzy odległości
• Drzewo prowadzące jest obliczane przy pomocy
metody łączenia sąsiadów (neighbor-joining)
Algorytm MultiSETTER
• Dwie najbliższe sobie struktury -> ‘average
structure’ -> średnia pozycja indywidualnych
atomów
• Dopóki nie dojdziemy do korzenia
Paralelizacja
1) Superpozycja struktury par RNA
Przetwarzanie wielokrotnych par GSSU (TYLKO
ONE!!), niezależnie i każdy z nich przypisany do danej
jednostki obliczeniowej
2) Macierz odległości
Dla n struktur: n*(n-1)/2
niezależnie
Paralelizacja
3) Łączenie RNA
Powstawanie „przeciętnej struktury” może być
rozłożone na scalone dopasowanie GSSUs. Takie
łączenie może zachodzić niezależnie, czyli
równolegle
Porównanie dopasowania dwóch
struktur do wielokrotnego
1NKW i 1S72 (23 S)
1NKW, 1S72, 2AWB, 2Y11 (23 S)
~3000 reszt każdy
4 rdzeniowy z Hyper-V – Intel(R) Core ™ i7-4790 CP.
3.60 GHz, 16GB RAM, Windows 8.1
Ograniczenie liczby nici od 1-4
Wyniki
Języki programowania
1) Rdzeń – C++
2) Aplikacja web – Python, Model-Template-View
(MTV), Django version 1.4
Ze strony serweru: Python
Dla klienta: jQuery JavaScript version 1.10.4 oraz
JavaScript molecular viewer JSmol
Połączenia
• Dane o strukturze RNA: baza danych SETTER
• Relacyjna baza danych MySQL synchronizowana z
PDB w każdą środę
• SETTER = PDB ID, ID łańcuchów, wzory wiązań
wodorowych
Input
Input
Output
Reasumując
• Pierwsze dostępne publicznie narzędzie do
wielokrotnego dopasowania struktury RNA
• Wiele dokładnych dopasowań w rozsądnym czasie
• Wizualizacja w 3D, która może ujawnić relacje
strukturalne i funkcjonalne
• W przyszłości łączyć dopasowania sekwencji i
struktur z dużą dokładnością
Dziękuję za uwagę.