Modelowaniemolekularne2012/13 - E. Dyguda
Transkrypt
Modelowaniemolekularne2012/13 - E. Dyguda
Baza CSD e2 1 01 2/ E. Dyguda-Kazimierowicz 13 BAZA C AMBRIDGE S TRUCTURAL DATABASE M od e lo w an ie m ol e Poszczególne rekordy bazy CSD (czyli struktury krystaliczne) posiadaja˛ unikalne, 6-literowe identyfikatory (CSD Reference Code, refcode) uzupełnione dwoma cyframi informujacymi ˛ o wersji (historii publikacji). Oprócz struktur 3D, rekordy bazy CSD zawieraja˛ dane bibliograficzne, dane eksperymentalne, dane numeryczne opisujace ˛ np. wymiary komórki elementarnej, diagram struktury chemicznej z informacjami nt. rodzajów połaczeń ˛ (wiazań) ˛ mi˛edzy atomami (tzw. struktura 2D). ku la rn Cambridge Structural Database to baza danych strukturalnych obejmujaca ˛ wszystkie opublikowane struktury zwiazków ˛ organicznych i metaloorganicznych (obecnie ponad 500 000 struktur) o czasteczkach ˛ zawierajacych ˛ do ok. 500 atomów (łacznie ˛ z atomami wodoru). Struktury tych zwiazków ˛ uzyskane zostały metodami krystalografii rentgenowskiej i dyfrakcji neutronowej. Zawartość bazy CSD uaktualniana jest co pół roku. Baza dost˛epna w pracowni komputerowej A3/414 jest licencjonowana na Zakład Modelowania Molekularnego PWr. 1 1.1 Inicjalizacja zmiennych środowiskowych 2 PRZESZUKIWANIE BAZY: QUEST Inicjalizacja zmiennych środowiskowych e2 1.1 01 2/ 13 Integralna˛ cz˛eścia˛ bazy CSD jest oprogramowanie służace ˛ do przeszukiwania bazy (Q UEST), wizualizacji wyników przeszukiwań (P LUTO) oraz statystycznej i graficznej analizy znalezionych danych strukturalnych (V ISTA). Dokumentacja bazy CSD oraz wspomnianego oprogramowania dost˛epna jest pod adresem: http://www.ccdc.cam.ac.uk/support/documentation/#csds Krótki opis systemu CSD można znaleźć również tutaj: http://www.cmbi.kun.nl/samsam/tutorials/studs/csd/csd.html 2 Przeszukiwanie bazy: Q UEST ku la rn Przed rozpocz˛eciem pracy z baza˛ CSD należy ustawić dwie zmienne środowiskowe: CSDHOME i PATH. Proponuj˛e w tym celu wczytać odpowiednie polecenia w nast˛epujacy ˛ sposób: source ~edytad/csdrc Powyższa˛ komend˛e należy wydać po każdorazowym zalogowaniu si˛e i otwarciu nowego X-terminala. 2.1 lo w an ie m ol e Zawartość bazy danych CSD przeszukuje si˛e za pomoca˛ programu Q UEST. Korzystanie z tego programu odbywać si˛e może zarówno w trybie tekstowym (polecenia wpisywane w terminalu), jak i z użyciem graficznego menu. Na zaj˛eciach zaprezentowany zostanie ten ostatni sposób. W przypadku komputerów z Windows OS, zdalne korzystanie z bazy CSD wymaga zalogowania si˛e na komputerze osilek.ch.pwr.wroc.pl w trybie graficznym, tzn. uprzedniego zainstalowania oprogramowania typu X Server; np. Xming: http://sourceforge.net/projects/xming/files/Xming/6.9.0.31/Xming-6-9-0-31-setup.exe/download Rozpocz˛ecie pracy z programem Q UEST M od e Program Q UESTwywołuje si˛e poleceniem: quest -j nazwa_zadania W terminalu wyświetlone zostaja˛ wst˛epne informacje na temat bazy CSD. Klawisz Enter pozwala na przejście do trybu interaktywnego. Aby uruchomić graficzne menu, należy wpisać nast˛epujace ˛ polecenia: save 1 2 3 term x menu 2 2.2 Przeszukiwanie bazy CSD 2 PRZESZUKIWANIE BAZY: QUEST ol e ku la rn e2 01 2/ 13 Menu programu Q UEST: 2.2 lo w an ie m Opis wszystkich funkcji dost˛epnych z poziomu menu: http://www.ccdc.cam.ac.uk/support/documentation/quest/started/gs-appendix-1.html Przeszukiwanie bazy CSD M od e Zapytania formułowane w programie Q UEST dotyczyć moga˛ zarówno informacji tekstowych czy numerycznych (np. autor, nazwa zwiazku, ˛ temperatura, g˛estość; menu S EARCH), jak i struktur 2D (atomy i sposób, w jaki sa˛ połaczone ˛ w czasteczce/grupie; ˛ menu B UILD i podmenu 2D-C ONSTRAIN . . . ) i 3D (np. wi˛ezy geometryczne menu B UILD i podmenu 3D-C ONSTRAIN . . . ). Wyszukiwanie rekordów oparte o zadana˛ struktur˛e (fragment czasteczki) ˛ polega na narysowaniu tej czasteczki ˛ w menu B UILD, określeniu parametrów 2D i/lub 3D (opcjonalnie), zatwierdzeniu zapytania przy pomocy przycisku D EFINE -S TRUCTURE i rozpocz˛eciu wyszukiwania za pomoca˛ przycisku FASTQUEST. W ramach ostatniego kroku można też przejść do podmenu Q UEST, które pozwala na ustawienie szeregu opcji dotyczacych ˛ wyszukiwania, m. in. maksymalnej liczby znalezionych rekordów czy rodzaju zapisywanych danych. Przykłady użycia programu Q UEST: http://www.ccdc.cam.ac.uk/support/documentation/quest/started/gs-3-2.html 3 4 3 ANALIZA NUMERYCZNA I STATYSTYCZNA: VISTA Wizualizacja wyników: P LUTO Analiza numeryczna i statystyczna: V ISTA ku la 4 rn e2 01 2/ 13 P LUTO służy do przegladania ˛ wyników uzyskanych podczas przeszukiwania bazy CSD za pomoca˛ programu Q UEST. Wyświetlane sa˛ kolejne struktury odpowiadajace ˛ rekordom zapisanym w pliku _ nazwa zadania.fdat podczas wcześniejszej sesji z programem Q UEST. Program P LUTO wywołuje si˛e poleceniem: pluto -j nazwa_zadania Aby uruchomić graficzne menu, należy nast˛epnie wpisać „x”. Oprócz wizualizacji struktury możliwy jest m. in. pomiar szeregu parametrów geometrycznych (np. odległości mi˛edzy atomami), zapisanie współrz˛ednych kartezjańskich (przycisk C OOR) czy obrazka w formacie postscript (przycisk P OST). M od e lo w an ie m ol e Analizy wyników uzyskanych za pomoca˛ programu Q UEST dokonać można w programie V ISTA. Aby wygenerować wymagany przez ten program plik nazwa_zadania.tab, należy podczas pracy z programem Q UEST zdefiniować wybrane parametry 3D (podmenu 3D-C ONSTRAINTS . . . ). Dane odpowiadajace ˛ znalezionym rekordom wyświetlane sa˛ w formie arkusza. Na jego podstawie można generować wykresy (w tym histogramy) czy dokonywać statystycznej analizy uzyskanych danych (np. analiza korelacji). Uzyskane wykresy moga˛ zostać zapisane w pliku postscript. Program V ISTA wywołuje si˛e poleceniem: vista -j nazwa_zadania Aby uruchomić graficzne menu, należy nast˛epnie wpisać „x11”. 4