Article (polish) - Koło Naukowe Studentów Biotechnologii "Mygen"

Transkrypt

Article (polish) - Koło Naukowe Studentów Biotechnologii "Mygen"
Projekt Koła Naukowego
MYGENerator - NARZĘDZIE DO ZAUTOMATYZOWANEGO I
UPROSZCZONEGO KORZYSTANIA Z PAKIETU GROMACS
Jan M ajta, M aciej Bąk, Rościsław Krutyhołowa
Koło N aukowe Studentów Biotechnologii „ M ygen”
Wydział Biochemii Biofizyki i Biotechnologii
Uniwersytet Jagielloński
Opiekun Koła: dr hab. Joanna Bereta, prof. UJ
Streszczenie: W obecnych czasach wykorzystywanie informatyki staje się ważną
umiejętnością przydatną do pracy w zakresie biologii molekularnej. Niestety wiele technik
informatycznych pozostaje nadal dostępnych jedynie dla specjalistów w tej dziedzinie.
Jedną z takich metod jest dynamika molekularna (MD). Jest to kompleksowa symulacja
ruchów wszystkich atomów w układzie. Metoda ta jest powszechnie wykorzystywana
wszędzie tam, gdzie podejście laboratoryjne nie jest w stanie dostarczyć odpowiednich
informacji. Dynamika molekularna dzięki swoim niezaprzeczalnym zaletom jest
szczególnie popularna w badaniach strukturalnych. W przeciwieństwie do technik
eksperymentalnych daje możliwość wglądu w oddziaływania w skali atomowej. Dzięki
temu uzyskać można zupełnie inny rodzaj informacji niż podczas pracy doświadczalnej. W
niniejszej pracy zaprezentowano narzędzie upraszczające i automatyzujące proces
generowania dynamiki molekularnej przy użyciu pakietu GROMACS.
Wstęp
Przy prowadzeniu badań metodami eksperymentalnymi często natrafia się na problemy, których rozwiązanie sprawia ogromne trudności.
Jednym z takich zagadnień mogą być problemy
natury strukturalnej, do rozwiązania których coraz częściej stosuje się metody in silico. Coraz
popularniejszą metodą prowadzenia badań strukturalnych są symulacje dynamiki molekularnej
(MD, ang. molecular dynamics). Polegają one na
rozwiązywaniu równań ruchu Newtona, dzięki
czemu można przewidzieć zachowania poszczególnych atomów układu w kolejnych krokach
czasowych. W obliczeniach używa się specjalnie
przygotowanych zestawów parametrów dla
funkcji opisujących energię cząsteczek układu pól siłowych. Dzięki takiemu podejściu dostępne są informacje w skali atomowej, jednocześnie
z możliwością ich analizy w zakresie czasowym z
rozdzielczością femtosekundową.
Głównym ograniczeniem w używaniu symulacji
MD jest moc obliczeniowa komputerów. Jednak
64
w ostatnich latach postęp techniki umożliwił wykonywanie prostych symulacji nawet na komputerach dostępnych podczas codziennej pracy. Na
komputerze z procesorem Intel DualCore o mocy 2× 2GHz w ciągu doby można wygenerować
niemal 1,5 ns symulację dynamiki lizozymu w
wodzie.
Na przestrzeni lat powstało wiele narzędzi pozwalających generować symulacje dynamiki molekularnej. Do najbardziej popularnych należą
AMBER [1], CHARMM [2] czy GROMACS [3,4].
Ten ostatni pakiet zdobył ogromną popularność,
w dużej mierze dzięki wysokiej wydajności oraz
darmowemu rozpowszechnianiu. Składa się on z
wielu narzędzi, które umożliwiają generowanie
plików wsadowych, przeprowadzanie symulacji
oraz analizę ich wyników. Głównym powodem tego, że osoby nieobeznane
z zagadnieniami bioinformatycznymi mają problemy z wykorzystywaniem techniki MD jest
nieumiejętność obsługi narzędzi. Pakiet GROMACS w całości obsługiwany jest z poziomu
Majta J. et al. „MYGENerator - narzędzie do korzystania z pakietu GROMACS” Acta Mygenica nr. 4, lip. 201 3
wiersza poleceń, przy użyciu wielu przełączników oraz opcji. Dodatkowo cały proces generowania symulacji składa się z sekwencji ściśle
powiązanych etapów. Narzędzie, które powstało
w ramach projektu naukowego naszego Koła pozwala osobom bez przygotowania generować
proste symulacje w sposób zautomatyzowany.
Opis narzędzia
Narzędzie MYGENerator to skrypt napisany w
języku Python [5]. Wywoływany jest z wiersza
poleceń pojedynczą komendą wraz z podaniem
nazwy pliku konfiguracji jako argumentu wywołania, a następnie działa na zasadzie odpowiadania na zadawane pytania o podstawowe
parametry (Rys. 1).
atomów w układzie. Kolejne pytanie dotyczy ilości kroków czasowych, które obejmie symulacja.
Standardowe 500 000 kroków odpowiada symulacji o długości 1 nanosekundy (przy kroku pozostawionym na 2 fs). Kolejne pola to pytania o
częstotliwość zapisu danych o układzie. Standardowy zapis co 1000 kroków czasowych to dobry
kompromis między dobrą jakością próbkowania
a niewielkimi rozmiarami plików wyjściowych.
Na koniec można wybrać prowadzenie symulacji
w wodzie lub w próżni; jednak tę drugą opcję
powinno się wybierać tylko w szczególnych sytuacjach. Po procedurze w której MYGENerator
generuje plik protokołu symulacji oraz uruchamia poszczególne składniki pakietu GROMACS
tworzące dalsze pliki wsadowe do symulacji MD
program uruchamia narzędzie "mdrun", które
wyzwala właściwą symulację. Po zakończeniu
obliczeń generowane są pliki z danymi analizy
symulacji. Pierwszym jest plik, który zawiera te
parametry, które wybrano podczas uruchamiania programu. Drugi to zapis całej trajektorii w
formacie .pdb[8], trzecim plikiem jest wykres
zmian parametru RMSD (średniego przemieszczenia wszystkich atomów układu względem stanu początkowego) w czasie symulacji, a ostatni
to dane do wykreślenia diagramów Ramachandrana [9] (wizualizacja kątów torsyjnych ψ i φ
łańcucha aminokwasowego).
Przykładowe zastosowanie
W celu przetestowania działania MYGENeratora
postanowiono wykonać symulację w polu GROMOS 53a6 nieustrukturyzowanego peptydu o
Rys. 1 Zrzut ekranu podczas pracy z narzędziem MYGENerator.
W pierwszej kolejności użytkownik zostaje zapytany o wybór pola siłowego. Do wyboru jest pole
CHARMM27 [6], szczególnie zalecane do symulacji dynamiki i oddziaływań układów zawierających kwasów nukleinowe oraz GROMOS 53a6
[7], które dobrze opisuje właściwości peptydów
w środowisku wodnym. Następnie należy ustalić, w jakiej temperaturze wykonana zostanie symulacja. Kolejne dwa parametry odnoszą się do
rozmiaru symulacji. Pierwszy to rozmiar kroku
czasowego (domyślna wartość to dwie femtosekundy), co jaki przeliczane są wartości energii
65
Majta J. et al. „MYGENerator - narzędzie do korzystania z pakietu GROMACS” Acta Mygenica nr. 4, lip. 201 3
Rys. 3 Wykres zmian RMSD peptydu w czasie symulacji
wyjściowe z przebiegu symulacji dla czasów 0ns,
2ns, 4ns, 6ns (Rys. 2), na których widać wyraźną
ewolucję struktury peptydu. Na wykresie RMSD
widać także wyraźny skok tempa zmian konformacyjnych w okolicach 4,5 ns (Rys. 3). Tempo
obliczeń wyniosło 3,118 nanosekundy na dobę
na procesorze Intel Dual Core 2×2GHz.
Podsumowanie:
Piśmiennictwo:
MYGENerator to proste narzędzie, które pozwala w nieskomplikowany sposób zarządzać pakietem GROMACS. Dzięki pełnej automatyzacji
pracy, po początkowym wprowadzeniu danych
MYGENerator zarządza składnikami pakietu
GROMACS, które nieprzerwanie współpracują
ze sobą aż do wygenerowania ostatecznych wyników. Narzędzie do pobrania ze strony:
http://www.mygen.wbbib.uj.edu.pl/mygenerator
[1] R. Salomon-Ferrer, D.A. Case, R.C.Walker. An overview of the Amber
biomolecular simulation package. WIREs Comput. Mol. Sci. 3, 198-210
(2013).
[2] Bernard R. Brooks et. al, CHARMM: A program for macromolecular
energy, minimization, and dynamics calculations, Journal of
Computational Chemistr Volume 4, Issue 2, pages 187–217, Summer
1983
[3] Van Der Spoel D, Lindahl E, Hess B, Groenhof G, Mark AE, Berendsen
HJ. GROMACS: fast, flexible, and free. J Comput Chem. 2005
Dec;26(16):1701-18
[4] Pronk S et. al, GROMACS 4.5: a high-throughput and highly parallel
open source molecular simulation toolkit. Bioinformatics. 2013 Apr
1;29(7):845-54
[5] G. van Rossum and F.L. Drake (eds), Python Reference Manual,
PythonLabs, Virginia, USA, 2001. Available at http://www.python.org
[6] P v. R. Schleyer et al., CHARMM: The Energy Function and Its
Parameterization with an Overview of the Program, in The Encyclopedia
of Computational Chemistry, 1, 271-277
[7] Chris Oostenbrink et. al, A biomolecular force field based on the free
enthalpy of hydration and solvation: The GROMOS force-field parameter
sets 53A5 and 53A6, Journal of Computational Chemistry
Volume 25, Issue 13, pages 1656–1676, October 2004
[8] http://www.wwpdb.org/documentation/format32/v3.2.html
[9] Ramachandran, G.N.; Ramakrishnan, C.; Sasisekharan, V. (1963).
"Stereochemistry of polypeptide chain configurations". Journal of
Molecular Biology 7: 95–9
Rys. 2 Diagramy Ramachandrana dla klatek 0ns, 2ns, 4ns,
6ns wraz z obrazami struktury peptydu w tym czasie.
długości 35 aminokwasów. Ilość kroków ustalono na 5 000 000, co przy standardowej długości
kroku czasowego (2 fs) daje 10 ns. Częstotliwość
zapisu zwiększono do 2000 dla każdego z parametrów. Zaprezentowano przykładowe dane
66

Podobne dokumenty