Modelowaniemolekularne2012/13 - E. Dyguda

Transkrypt

Modelowaniemolekularne2012/13 - E. Dyguda
Baza CSD
e2
1
01
2/
E. Dyguda-Kazimierowicz
13
BAZA C AMBRIDGE S TRUCTURAL DATABASE
M
od
e
lo
w
an
ie
m
ol
e
Poszczególne rekordy bazy CSD (czyli
struktury krystaliczne) posiadaja˛ unikalne,
6-literowe identyfikatory (CSD Reference Code, refcode) uzupełnione dwoma
cyframi informujacymi
˛
o wersji (historii
publikacji). Oprócz struktur 3D, rekordy
bazy CSD zawieraja˛ dane bibliograficzne,
dane eksperymentalne, dane numeryczne
opisujace
˛ np. wymiary komórki elementarnej,
diagram struktury chemicznej z informacjami
nt. rodzajów połaczeń
˛
(wiazań)
˛
mi˛edzy
atomami (tzw. struktura 2D).
ku
la
rn
Cambridge Structural Database to baza danych strukturalnych obejmujaca
˛ wszystkie opublikowane
struktury zwiazków
˛
organicznych i metaloorganicznych (obecnie ponad 500 000 struktur) o czasteczkach
˛
zawierajacych
˛
do ok. 500 atomów (łacznie
˛
z atomami wodoru). Struktury tych zwiazków
˛
uzyskane
zostały metodami krystalografii rentgenowskiej i dyfrakcji neutronowej. Zawartość bazy CSD uaktualniana jest co pół roku. Baza dost˛epna w pracowni komputerowej A3/414 jest licencjonowana na
Zakład Modelowania Molekularnego PWr.
1
1.1
Inicjalizacja zmiennych środowiskowych
2
PRZESZUKIWANIE BAZY: QUEST
Inicjalizacja zmiennych środowiskowych
e2
1.1
01
2/
13
Integralna˛ cz˛eścia˛ bazy CSD jest oprogramowanie służace
˛ do przeszukiwania bazy (Q UEST), wizualizacji wyników przeszukiwań (P LUTO) oraz statystycznej i graficznej analizy znalezionych danych
strukturalnych (V ISTA). Dokumentacja bazy CSD oraz wspomnianego oprogramowania dost˛epna jest
pod adresem:
http://www.ccdc.cam.ac.uk/support/documentation/#csds
Krótki opis systemu CSD można znaleźć również tutaj:
http://www.cmbi.kun.nl/samsam/tutorials/studs/csd/csd.html
2
Przeszukiwanie bazy: Q UEST
ku
la
rn
Przed rozpocz˛eciem pracy z baza˛ CSD należy ustawić dwie zmienne środowiskowe: CSDHOME
i PATH. Proponuj˛e w tym celu wczytać odpowiednie polecenia w nast˛epujacy
˛ sposób:
source ~edytad/csdrc
Powyższa˛ komend˛e należy wydać po każdorazowym zalogowaniu si˛e i otwarciu nowego X-terminala.
2.1
lo
w
an
ie
m
ol
e
Zawartość bazy danych CSD przeszukuje si˛e za pomoca˛ programu Q UEST. Korzystanie z tego programu odbywać si˛e może zarówno w trybie tekstowym (polecenia wpisywane w terminalu), jak i z użyciem graficznego menu. Na zaj˛eciach zaprezentowany zostanie ten ostatni sposób. W przypadku
komputerów z Windows OS, zdalne korzystanie z bazy CSD wymaga zalogowania si˛e na komputerze
osilek.ch.pwr.wroc.pl w trybie graficznym, tzn. uprzedniego zainstalowania oprogramowania typu
X Server; np. Xming:
http://sourceforge.net/projects/xming/files/Xming/6.9.0.31/Xming-6-9-0-31-setup.exe/download
Rozpocz˛ecie pracy z programem Q UEST
M
od
e
Program Q UESTwywołuje si˛e poleceniem:
quest -j nazwa_zadania
W terminalu wyświetlone zostaja˛ wst˛epne informacje na temat bazy CSD. Klawisz Enter pozwala
na przejście do trybu interaktywnego. Aby uruchomić graficzne menu, należy wpisać nast˛epujace
˛
polecenia:
save 1 2 3
term x
menu
2
2.2
Przeszukiwanie bazy CSD
2
PRZESZUKIWANIE BAZY: QUEST
ol
e
ku
la
rn
e2
01
2/
13
Menu programu Q UEST:
2.2
lo
w
an
ie
m
Opis wszystkich funkcji dost˛epnych z poziomu menu:
http://www.ccdc.cam.ac.uk/support/documentation/quest/started/gs-appendix-1.html
Przeszukiwanie bazy CSD
M
od
e
Zapytania formułowane w programie Q UEST dotyczyć moga˛ zarówno informacji tekstowych czy numerycznych (np. autor, nazwa zwiazku,
˛
temperatura, g˛estość; menu S EARCH), jak i struktur 2D (atomy
i sposób, w jaki sa˛ połaczone
˛
w czasteczce/grupie;
˛
menu B UILD i podmenu 2D-C ONSTRAIN . . . )
i 3D (np. wi˛ezy geometryczne menu B UILD i podmenu 3D-C ONSTRAIN . . . ). Wyszukiwanie rekordów oparte o zadana˛ struktur˛e (fragment czasteczki)
˛
polega na narysowaniu tej czasteczki
˛
w menu
B UILD, określeniu parametrów 2D i/lub 3D (opcjonalnie), zatwierdzeniu zapytania przy pomocy przycisku D EFINE -S TRUCTURE i rozpocz˛eciu wyszukiwania za pomoca˛ przycisku FASTQUEST. W ramach ostatniego kroku można też przejść do podmenu Q UEST, które pozwala na ustawienie szeregu
opcji dotyczacych
˛
wyszukiwania, m. in. maksymalnej liczby znalezionych rekordów czy rodzaju zapisywanych danych.
Przykłady użycia programu Q UEST:
http://www.ccdc.cam.ac.uk/support/documentation/quest/started/gs-3-2.html
3
4
3
ANALIZA NUMERYCZNA I STATYSTYCZNA: VISTA
Wizualizacja wyników: P LUTO
Analiza numeryczna i statystyczna: V ISTA
ku
la
4
rn
e2
01
2/
13
P LUTO służy do przegladania
˛
wyników uzyskanych podczas przeszukiwania bazy CSD za pomoca˛
programu Q UEST. Wyświetlane sa˛ kolejne struktury odpowiadajace
˛ rekordom zapisanym w pliku
_
nazwa zadania.fdat podczas wcześniejszej sesji z programem Q UEST. Program P LUTO wywołuje
si˛e poleceniem:
pluto -j nazwa_zadania
Aby uruchomić graficzne menu, należy nast˛epnie wpisać „x”.
Oprócz wizualizacji struktury możliwy jest m. in. pomiar szeregu parametrów geometrycznych
(np. odległości mi˛edzy atomami), zapisanie współrz˛ednych kartezjańskich (przycisk C OOR) czy obrazka
w formacie postscript (przycisk P OST).
M
od
e
lo
w
an
ie
m
ol
e
Analizy wyników uzyskanych za pomoca˛ programu Q UEST dokonać można w programie V ISTA.
Aby wygenerować wymagany przez ten program plik nazwa_zadania.tab, należy podczas pracy
z programem Q UEST zdefiniować wybrane parametry 3D (podmenu 3D-C ONSTRAINTS . . . ). Dane
odpowiadajace
˛ znalezionym rekordom wyświetlane sa˛ w formie arkusza. Na jego podstawie można
generować wykresy (w tym histogramy) czy dokonywać statystycznej analizy uzyskanych danych
(np. analiza korelacji). Uzyskane wykresy moga˛ zostać zapisane w pliku postscript.
Program V ISTA wywołuje si˛e poleceniem:
vista -j nazwa_zadania
Aby uruchomić graficzne menu, należy nast˛epnie wpisać „x11”.
4

Podobne dokumenty