Article (polish) - Koło Naukowe Studentów Biotechnologii "Mygen"
Transkrypt
Article (polish) - Koło Naukowe Studentów Biotechnologii "Mygen"
Projekt Koła Naukowego MYGENerator - NARZĘDZIE DO ZAUTOMATYZOWANEGO I UPROSZCZONEGO KORZYSTANIA Z PAKIETU GROMACS Jan M ajta, M aciej Bąk, Rościsław Krutyhołowa Koło N aukowe Studentów Biotechnologii „ M ygen” Wydział Biochemii Biofizyki i Biotechnologii Uniwersytet Jagielloński Opiekun Koła: dr hab. Joanna Bereta, prof. UJ Streszczenie: W obecnych czasach wykorzystywanie informatyki staje się ważną umiejętnością przydatną do pracy w zakresie biologii molekularnej. Niestety wiele technik informatycznych pozostaje nadal dostępnych jedynie dla specjalistów w tej dziedzinie. Jedną z takich metod jest dynamika molekularna (MD). Jest to kompleksowa symulacja ruchów wszystkich atomów w układzie. Metoda ta jest powszechnie wykorzystywana wszędzie tam, gdzie podejście laboratoryjne nie jest w stanie dostarczyć odpowiednich informacji. Dynamika molekularna dzięki swoim niezaprzeczalnym zaletom jest szczególnie popularna w badaniach strukturalnych. W przeciwieństwie do technik eksperymentalnych daje możliwość wglądu w oddziaływania w skali atomowej. Dzięki temu uzyskać można zupełnie inny rodzaj informacji niż podczas pracy doświadczalnej. W niniejszej pracy zaprezentowano narzędzie upraszczające i automatyzujące proces generowania dynamiki molekularnej przy użyciu pakietu GROMACS. Wstęp Przy prowadzeniu badań metodami eksperymentalnymi często natrafia się na problemy, których rozwiązanie sprawia ogromne trudności. Jednym z takich zagadnień mogą być problemy natury strukturalnej, do rozwiązania których coraz częściej stosuje się metody in silico. Coraz popularniejszą metodą prowadzenia badań strukturalnych są symulacje dynamiki molekularnej (MD, ang. molecular dynamics). Polegają one na rozwiązywaniu równań ruchu Newtona, dzięki czemu można przewidzieć zachowania poszczególnych atomów układu w kolejnych krokach czasowych. W obliczeniach używa się specjalnie przygotowanych zestawów parametrów dla funkcji opisujących energię cząsteczek układu pól siłowych. Dzięki takiemu podejściu dostępne są informacje w skali atomowej, jednocześnie z możliwością ich analizy w zakresie czasowym z rozdzielczością femtosekundową. Głównym ograniczeniem w używaniu symulacji MD jest moc obliczeniowa komputerów. Jednak 64 w ostatnich latach postęp techniki umożliwił wykonywanie prostych symulacji nawet na komputerach dostępnych podczas codziennej pracy. Na komputerze z procesorem Intel DualCore o mocy 2× 2GHz w ciągu doby można wygenerować niemal 1,5 ns symulację dynamiki lizozymu w wodzie. Na przestrzeni lat powstało wiele narzędzi pozwalających generować symulacje dynamiki molekularnej. Do najbardziej popularnych należą AMBER [1], CHARMM [2] czy GROMACS [3,4]. Ten ostatni pakiet zdobył ogromną popularność, w dużej mierze dzięki wysokiej wydajności oraz darmowemu rozpowszechnianiu. Składa się on z wielu narzędzi, które umożliwiają generowanie plików wsadowych, przeprowadzanie symulacji oraz analizę ich wyników. Głównym powodem tego, że osoby nieobeznane z zagadnieniami bioinformatycznymi mają problemy z wykorzystywaniem techniki MD jest nieumiejętność obsługi narzędzi. Pakiet GROMACS w całości obsługiwany jest z poziomu Majta J. et al. „MYGENerator - narzędzie do korzystania z pakietu GROMACS” Acta Mygenica nr. 4, lip. 201 3 wiersza poleceń, przy użyciu wielu przełączników oraz opcji. Dodatkowo cały proces generowania symulacji składa się z sekwencji ściśle powiązanych etapów. Narzędzie, które powstało w ramach projektu naukowego naszego Koła pozwala osobom bez przygotowania generować proste symulacje w sposób zautomatyzowany. Opis narzędzia Narzędzie MYGENerator to skrypt napisany w języku Python [5]. Wywoływany jest z wiersza poleceń pojedynczą komendą wraz z podaniem nazwy pliku konfiguracji jako argumentu wywołania, a następnie działa na zasadzie odpowiadania na zadawane pytania o podstawowe parametry (Rys. 1). atomów w układzie. Kolejne pytanie dotyczy ilości kroków czasowych, które obejmie symulacja. Standardowe 500 000 kroków odpowiada symulacji o długości 1 nanosekundy (przy kroku pozostawionym na 2 fs). Kolejne pola to pytania o częstotliwość zapisu danych o układzie. Standardowy zapis co 1000 kroków czasowych to dobry kompromis między dobrą jakością próbkowania a niewielkimi rozmiarami plików wyjściowych. Na koniec można wybrać prowadzenie symulacji w wodzie lub w próżni; jednak tę drugą opcję powinno się wybierać tylko w szczególnych sytuacjach. Po procedurze w której MYGENerator generuje plik protokołu symulacji oraz uruchamia poszczególne składniki pakietu GROMACS tworzące dalsze pliki wsadowe do symulacji MD program uruchamia narzędzie "mdrun", które wyzwala właściwą symulację. Po zakończeniu obliczeń generowane są pliki z danymi analizy symulacji. Pierwszym jest plik, który zawiera te parametry, które wybrano podczas uruchamiania programu. Drugi to zapis całej trajektorii w formacie .pdb[8], trzecim plikiem jest wykres zmian parametru RMSD (średniego przemieszczenia wszystkich atomów układu względem stanu początkowego) w czasie symulacji, a ostatni to dane do wykreślenia diagramów Ramachandrana [9] (wizualizacja kątów torsyjnych ψ i φ łańcucha aminokwasowego). Przykładowe zastosowanie W celu przetestowania działania MYGENeratora postanowiono wykonać symulację w polu GROMOS 53a6 nieustrukturyzowanego peptydu o Rys. 1 Zrzut ekranu podczas pracy z narzędziem MYGENerator. W pierwszej kolejności użytkownik zostaje zapytany o wybór pola siłowego. Do wyboru jest pole CHARMM27 [6], szczególnie zalecane do symulacji dynamiki i oddziaływań układów zawierających kwasów nukleinowe oraz GROMOS 53a6 [7], które dobrze opisuje właściwości peptydów w środowisku wodnym. Następnie należy ustalić, w jakiej temperaturze wykonana zostanie symulacja. Kolejne dwa parametry odnoszą się do rozmiaru symulacji. Pierwszy to rozmiar kroku czasowego (domyślna wartość to dwie femtosekundy), co jaki przeliczane są wartości energii 65 Majta J. et al. „MYGENerator - narzędzie do korzystania z pakietu GROMACS” Acta Mygenica nr. 4, lip. 201 3 Rys. 3 Wykres zmian RMSD peptydu w czasie symulacji wyjściowe z przebiegu symulacji dla czasów 0ns, 2ns, 4ns, 6ns (Rys. 2), na których widać wyraźną ewolucję struktury peptydu. Na wykresie RMSD widać także wyraźny skok tempa zmian konformacyjnych w okolicach 4,5 ns (Rys. 3). Tempo obliczeń wyniosło 3,118 nanosekundy na dobę na procesorze Intel Dual Core 2×2GHz. Podsumowanie: Piśmiennictwo: MYGENerator to proste narzędzie, które pozwala w nieskomplikowany sposób zarządzać pakietem GROMACS. Dzięki pełnej automatyzacji pracy, po początkowym wprowadzeniu danych MYGENerator zarządza składnikami pakietu GROMACS, które nieprzerwanie współpracują ze sobą aż do wygenerowania ostatecznych wyników. Narzędzie do pobrania ze strony: http://www.mygen.wbbib.uj.edu.pl/mygenerator [1] R. Salomon-Ferrer, D.A. Case, R.C.Walker. An overview of the Amber biomolecular simulation package. WIREs Comput. Mol. Sci. 3, 198-210 (2013). [2] Bernard R. Brooks et. al, CHARMM: A program for macromolecular energy, minimization, and dynamics calculations, Journal of Computational Chemistr Volume 4, Issue 2, pages 187–217, Summer 1983 [3] Van Der Spoel D, Lindahl E, Hess B, Groenhof G, Mark AE, Berendsen HJ. GROMACS: fast, flexible, and free. J Comput Chem. 2005 Dec;26(16):1701-18 [4] Pronk S et. al, GROMACS 4.5: a high-throughput and highly parallel open source molecular simulation toolkit. Bioinformatics. 2013 Apr 1;29(7):845-54 [5] G. van Rossum and F.L. Drake (eds), Python Reference Manual, PythonLabs, Virginia, USA, 2001. Available at http://www.python.org [6] P v. R. Schleyer et al., CHARMM: The Energy Function and Its Parameterization with an Overview of the Program, in The Encyclopedia of Computational Chemistry, 1, 271-277 [7] Chris Oostenbrink et. al, A biomolecular force field based on the free enthalpy of hydration and solvation: The GROMOS force-field parameter sets 53A5 and 53A6, Journal of Computational Chemistry Volume 25, Issue 13, pages 1656–1676, October 2004 [8] http://www.wwpdb.org/documentation/format32/v3.2.html [9] Ramachandran, G.N.; Ramakrishnan, C.; Sasisekharan, V. (1963). "Stereochemistry of polypeptide chain configurations". Journal of Molecular Biology 7: 95–9 Rys. 2 Diagramy Ramachandrana dla klatek 0ns, 2ns, 4ns, 6ns wraz z obrazami struktury peptydu w tym czasie. długości 35 aminokwasów. Ilość kroków ustalono na 5 000 000, co przy standardowej długości kroku czasowego (2 fs) daje 10 ns. Częstotliwość zapisu zwiększono do 2000 dla każdego z parametrów. Zaprezentowano przykładowe dane 66