Wydział Chemii UJ

Transkrypt

Wydział Chemii UJ
PODSTAWOWE METODY OBLICZENIOWE CHEMII KWANTOWEJ
Chemia kwantowa wypracowała szereg metod obliczeniowych, które mogą być wykorzystane
do wyznaczenia struktury elektronowej układów molekularnych. Metody te różnią się
złożonością obliczeniową. Ma to bezpośrednie przełożenie na czas obliczeń i pamięć
komputerową wymaganą w obliczeniach. W niniejszym opracowaniu omówione zostaną
standardowe metody chemii kwantowej: metoda Hartree-Focka (HF) i dwie metody
wykorzystujące obliczenia HF tzn. metoda mieszania konfiguracji i rachunek zaburzeń
Møllera-Plesseta (MP). W celu zaznajomienia się z innymi metodami czytelnik odesłany jest
do podręczników podanych na końcu opracowania.
METODA HARTREE-FOCKA
U podstaw metody Hartree-Focka (HF) leży przybliżenie jednoelektronowe (patrz paczka
II – podstawowe przybliżenia). W niniejszym opracowaniu równanie HF zostanie
wprowadzone dla stanu zamkniętopowłokowego, w którym N-elektronową funkcję
wyznacznikową można przedstawić następującym symbolicznym wyrażeniem:
r r
r
r
r
r
Φ(q1 , q2 , K q N ) = φ1 (q1 ), φ2 (q2 ), Kφ N (q N ) ≡
r
r
r
r
ϕ1 (r1 )α (σ 1 ), ϕ1 (r2 ) β (σ 2 ), K , ϕ p (rN −1 )α (σ N −1 ), ϕ p (rN ) β (σ N ) ≡
+
−
+
−
+
(1)
−
ϕ1 ϕ1 ϕ 2 ϕ 2 K ϕ p ϕ p .
W powyższej funkcji w miejsce N spinorbitali {φi , i = 1,2, K N } wprowadzono p = N/2
podwójnie
obsadzonych
+
orbitali
−
{ϕ i , i = 1,2,K , p} ,
+
+
przy
czym
założono,
że
+
φ1 = ϕ1α ≡ ϕ1 , φ2 = ϕ1β ≡ ϕ1 , φ3 = ϕ 2α ≡ ϕ 2 , φ4 = ϕ 2 β ≡ ϕ 2 , K , φ N −1 = ϕ pα ≡ ϕ p ,
+
φ N = ϕ p β ≡ ϕ p . Wykorzystując funkcję falową (1) i postulat o wartości średniej, można
wyznaczyć energię całkowitą układu:
p
p
p
(
)
(2)
 r r
 ϕi (r 1)dr1 ,

(3)
E = 2∑ hii + ∑∑ 2 J ij − K ij + Vnn ,
i =1
i =1 j =1
gdzie
M
r  1
Z
hii = ∫ ϕi* (r 1) − ∆ rr1 − ∑ α
α =1 r1α
 2
r
J ij = ∫ ∫
r12
r
K ij = ∫ ∫
r
2
ϕ i ( r 1) ϕ j ( r 2 )
r
2
r r
dr1dr2 ,
r
(4)
r
ϕi* (r 1)ϕ j (r 1)ϕ *j (r 2 )ϕi (r 2 ) r r
dr1dr2 .
r12
(5)
Wielkości hii , J ij i K ij oznaczają kolejno: całkę jednoelektronową (całkę rdzenia), całkę
kulombowską i całkę wymienną. Stała Vnn
opisuje oddziaływania pomiędzy jądrami
(przybliżenie Borna-Oppenheimera). W przypadku atomu Vnn jest równe zeru. Zwróć uwagę,
że całki występujące w rów. (2) są niezależne od współrzędnych spinowych elektronów.
Równość całek J ii i K ii gwarantuje znikanie tzw. „samoodziaływania”, w przypadku gdy we
wzorze (2) i = j.W przypadku ogólnym, gdy używamy spinorbitali zamiast orbitali, całki hii i
J ij nie zależą od orientacji współrzędnych spinowych elektronów, natomiast całki K ij zależą
od orientacji współrzędnych spinowych i są różne od zera tylko dla zgodnych orientacji
spinów. Stąd we wzorze (2) występują różne współczynniki przed całkami kulombowskimi i
wymiennymi.
Aby wyznaczyć energię dowolnego N-elektronowego, zamkniętopowłokowego układu,
musimy znać orbitale atomowe (AO, „atomic orbitals”) lub orbitale molekularne (MO,
„molecular orbitals”): E = E[ϕ1 ,K, ϕ p ] . Należy przy tym pamiętać, że orbitale muszą być
ortonormalne,
ϕ i ϕ j = δ ij , dlatego przy minimalizacji energii nie możemy skorzystać
bezpośrednio z rów. (2). Wykorzystując technikę nieoznaczonych czynników Lagrange’a,
tworzymy funkcjonał pomocniczy:
(
)
E = E [ϕ1 ,K, ϕ p ] = E[ϕ1 ,K, ϕ p ] − ∑∑ ε ij ϕ i ϕ j − δ ij ,
i
(6)
j
który uzupełnia energię układu o warunek ortonormalności orbitali, pomnożony przez
odpowiednie nieoznaczone czynniki Lagrange’a. Wariacja (minimalizacja) tego funkcjonału:



p
p
(
r
)



δE [{ϕ i }] = δ  E[{ϕi }] − ∑∑ ε ij ∫ ϕ i*ϕ j dr1 −δ ij  = 0
i =1 j =1
(7)
ze względu na kształt orbitali prowadzi do układu równań Hartree-Focka (HF):
r
r
Fˆϕi' (r1 ) = eiϕi' (r1 ) .
(8)
Po rozwiązaniu równań HF i wstawieniu otrzymanych orbitali do funkcji wyznacznikowej (1)
dostaniemy najlepsze jednowyznacznikowe przybliżenie funkcji N-elektronowej stanu
podstawowego układu. Operator Focka
)
Fˆ = h + ∑ 2 Jˆ j − Kˆ j
(
)
(9)
j
określony jest przez operatory:
)
Z
1
h = − ∆ rr1 − ∑ α ,
2
α r1α
r
Jˆ jϕi' (r1 )
Kˆ
' r
jϕ i ( r1 )
(10)
 ϕ ' (rr ) 2


J 2
r ' r
dr2 ϕi (r1 ) ,
= ∫
r12




(11)
r
r
 ϕ 'j* (r2 )ϕi' (r2 ) r  ' r
= ∫
dq2 ϕ j (r1 ) .


r
12


(12)
Łatwo zauważyć, że całki hii = ϕ i' hˆ ϕ i' ,
J ij = ϕ i' Jˆ j ϕ i'
i K ij = ϕ i' Kˆ j ϕ i'
są
wartościami spodziewanymi tych operatorów. Operator kulombowski, Ĵ j , odpowiada
r
klasycznej energii odpychania wybranego elektronu w punkcie r1 z innym elektronem
opisanym orbitalem ϕ 'j . Operator wymienny, K̂ j , nie ma podobnej interpretacji klasycznej.
Wymienia on funkcję podcałkową ϕ 'j na funkcję ϕ i' . Czytelnika zachęcam do samodzielnego
wyprowadzenia równań HF. Orbitale występujące w równaniach (9), (11) i (12) różnią się od
tych z równania (7) ponieważ powstają przez unitarną transformację wyjściowych MO:
[ϕ1' , ϕ 2' ,K, ϕ 'p ] = [ϕ1 , ϕ 2 ,K, ϕ p ] U .
(13)
Orbitale primowane diagonalizują hermitowską macierz nieoznaczonych czynników
Lagrange’a ( U †εU = e ≡ {ei δ ij } ) i są nazywane orbitalami kanonicznymi. Zauważmy, że
funkcja wyznacznikowa oraz
∑ j Ĵ j i ∑ j K̂ j
są niezmiennicze ze względu na transformację
unitarną.
Operator Focka jest operatorem jednoelektronowym. Wybrany elektron porusza się w
uśrednionym polu pochodzącym od pozostałych N-1 elektronów. Wybrany elektron np.
elektron „1” nie widzi chwilowych położeń pozostałych elektronów. Operator Focka zależy
od orbitali, w konsekwencji równanie HF może być rozwiązane wyłącznie iteracyjnie.
Poniższy ciąg czynności ilustruje sposób rozwiązywania równań HF:
{
} {
} {
}
L → Fˆ [ϕ ' (k) ] ⇒ ϕ ' (k +1 ) → Fˆ [ϕ ' (k +1 ) ] ⇒ ϕ ' (k + 2 ) → Fˆ [ϕ ' (k + 2 ) ] ⇒ ϕ ' (k +3 ) → L .
(14)
Górny indeks w nawiasie numeruje iteracje w procesie uzbieżnienia rozwiązania. Proces
iteracyjny wymaga znajomości startowej postaci orbitali i prowadzony jest tak długo, aż
orbitale otrzymane w kolejnych dwóch iteracjach są identyczne (oczywiście z założoną
dokładnością). Dlatego też metodę HF określa się jako metodę pola samouzgodnionego (SCF,
self-consistent field). Wartości własne w równaniu (8) to energie orbitalne:
p
ei =
ϕ i'
(
)
Fˆ ϕ i' = hii + ∑ 2 J ij − K ij .
(15)
i =1
Zauważ, że suma energii orbitalnych nie jest równa energii całkowitej układu: 2∑i ei ≠ E .
p
Sumowanie powinno przebiegać po spinorbitalach dlatego całość pomnożono przez dwa.
Aby była spełniona równość, należy wyeliminować oddziaływania dwuelektronowe, które są
zliczane podwójnie. Orbitale kanoniczne są często nazywane orbitalami spektroskopowymi.
Nazwę tę można łatwo uzasadnić w oparciu o twierdzenie Koopmansa (paczka 2 –
podstawowe przybliżenia). W dalszej części opisu znak „prim” zostanie pominięty.
Analityczny wariant metody HF – metoda Hartree-Focka-Roothana
Równanie (8) wykorzystuje się wyłącznie do wyznaczenia struktury elektronowej układów o
wysokiej symetrii (atomy i cząsteczki liniowe). Rutynowe zastosowania równań HF do opisu
struktury elektronowej cząsteczek oparte są na rozwinięciu MO w bazie znanych funkcji
χ = ( χ 1 , χ 2 , K, χ s ) :
r
r
ϕi (r1 ) = ∑ Cαi χα (r1 ) .
(16)
α =1
W przypadku użycia orbitali atomowych mówimy o metodzie liniowej kombinacji orbitali
atomowych w przybliżeniu pola samouzgodnionego (LCAO MO, linear combination of
atomic orbitals, molecular orbitals). Funkcje bazy powinny mieć prostą postać, która pozwala
wyprowadzić analityczne wyrażenia na obliczanie całek jedno- i dwuelektronowych. Baza ta
powinna się łatwo rozbudowywać do bazy zupełnej oraz powinna być szybko zbieżna. W
rzeczywistości, trudno jest skonstruować bazę posiadającą te własności. Zbiory
ortonormalnych funkcji nie są szybko zbieżne do dokładnego rozwiązania. Z tego względu, w
obliczeniach SCF dla układów molekularnych wykorzystuje się funkcje nieortogonalne.
Najczęściej wykorzystywane są tzw. bazy gaussowskie mimo iż mają gorsze zachowanie
asymptotyczne (w zerze i w nieskończoności) niż wodoropodobne bazy slaterowskie.
r
r
Po wstawieniu rozwinięcia ϕ i (r1 ) = ∑α Cαi χα (r1 ) do rów. (8), wymnożeniu z lewej
r
strony przez funkcje χ β* (r1 ) (β = 1, 2, …, s) i wycałkowaniu po współrzędnych pierwszego
elektronu dostajemy równanie wiekowe metody SCF dla stanów zamkniętopowłokowych:
FC = SCe
,
(17)
{
r
gdzie F = Fαβ = ∫ χ α* Fˆ χ β dr1
} jest macierzą Focka,
{
}
r
S = Sαβ = ∫ χα* χ β dr1 jest macierzą
całek nakładania, diagonalna macierz e = {ei δ ij } zawiera energie kanonicznych orbitali, a
kolumny macierzy C = {C i } grupują współczynniki rozwinięcia dla kolejnych kanonicznych
MO (CMO, canonical MO) [patrz rów. (16)]. CMO mają charakter zdelokalizowany,
odzwierciedlający symetrię cząsteczki. CMO są symetryczne bądź antysymetryczne
względem operacji symetrii grupy punktowej hamiltonianu elektronowego cząsteczki (paczka
4 – zastosowanie teorii grup w chemii). Indeksy łacińskie odnoszą się do CMO a greckie do
funkcji bazy. Warunek ortonormalności CMO w bazie (16) sprowadza się do równania:
C + SC = 1
(18)
Należy pamiętać, że operator Focka zdefiniowany jest przez orbitale molekularne opisujące
drugi elektron [rów. (9), (11) i (12)]. Uwzględnienie rozwinięcia z rów. (16), pozwala opisać
element macierzy Focka następującym wyrażeniem:
Fαβ = hαβ + ∑∑ Dδγ (gαγβδ − 12 gαγδβ ) ,
γ
(19)
δ
gdzie
r
gαχβδ = (αβ γδ ) = αγ βδ = ∫ ∫
r
r
r
χα* (r1 ) χ γ* (r2 ) χ β (r1 ) χδ (r2 ) r r
r12
dr1dr2
(20)
jest całką dwuelektronową a
zaj.MO
Dδγ =
∑
i =1
zaj.MO
2Cγ*i Cδi =
∑
niCγ*i Cδi
(21)
i =1
to element macierzy gęstości. Zmienna ni to obsadzenie i-tego orbitalu molekularnego. Dla
zajętych CMO ni = 2, natomiast dla wirtualnych CMO ni = 0. Przy zapisie całek
dwuelektronowych użyto dodatkowo dwóch powszechnie stosowanych notacji. W pierwszej,
tzw. notacji fizycznej, funkcje występujące w wektorze „bra” i „ket” odnoszą się do
pierwszego i drugiego elektronu. Druga notacja, tzw. notacja chemiczna”, opisuje w
kolejnych nawiasach, pierwszy (nawias „ (αβ | ”) i drugi (nawias „ | γδ ) ”) elektrony 1 i 2.
Zauważ, że ze względu na nieodróżnialność elektronów permutacja indeksów daje całki
równe co do wartości całkom wyjściowym. Macierz gęstości jest także nazywana macierzą
ładunków i rzędów wiązań. Macierz D spełnia następujący warunek unormowania
tr (DS ) = N
(22)
i warunek idempotentności
DSD = 2 D .
(23)
Obie wprowadzone nazwy macierzy D można łatwo wytłumaczyć. Gęstość elektronowa
wyraża się następującym wzorem:
r
r
r
r
ρ RHF (r ) = ∑ ni ϕi (r ) = ∑∑ Dαβ χα* (r ) χ β (r ) .
2
α
i
(24)
β
Wykorzystując warunek (22) można zdefiniować ładunki cząstkowe na atomach układu
(analiza populacyjna Mullikena):




∑∑ Dαβ S βα = ∑  Dαα + ∑ Dαβ S βα  = ∑  pα + ∑ Dαβ S βα  = ∑ P α = N ,
α
β
α

β ≠α

α

β ≠α

(25)
α
gdzie pα i P α to populacje netto i brutto α-tego AO. Odjęcie od liczby atomowej atomu A
(ZA) odpowiedniej sumy po populacjach brutto, definiuje ładunek cząstkowy na tym atomie:
QA = Z A − ∑ P α .
(26)
α ∈A
Sumując kwadraty modułów odpowiednich elementów macierzy D, dostajemy rząd wiązania
pomiędzy atomami A i B (definicja Wiberga):
w AB =
∑ ∑ Dαβ
2
.
(27)
α∈Aβ ∈B
Suma rzędów wiązań danego atomu definiuje wartościowość danego atomu: V A = ∑ w AB .
B
Tłumaczy to w pełni nazwę macierzy D wprowadzoną przez Coulsona tzn. macierz ładunków
i rzędów wiązań. Należy pamiętać, że nie są to jedyne analizy populacyjne i rzędy wiązań
jakie można spotkać w literaturze ponieważ tak ładunek cząstkowy, jak i rząd wiązania, nie są
obserwablami fizycznymi.
Rozwiązanie równań HF
Pseudo równanie własne, FC = SCe , można rozwiązać iteracyjnie. Zakładając startową
postać orbitali molekularnych w zerowej iteracji C (0) , wyznacza się macierz gęstości D (0) , a
następnie macierz Focka F ( D (0) ) . Przez rozwiązanie równania F ( D (0) )C (1) = SC (1) e (1)
otrzymujemy poprawione wektory własne C (1) i wartości własne e (1) . Proces iteracyjny
można zilustrować następującym ciągiem czynności:
{
→ {F ( D
} {
}→ L
}
C (0) → D ( 0 ) → F ( D ( 0 ) ) ⇒ C (1) ⇒ D (1) → F ( D (1) ) ⇒ C (2) ⇒ D ( 2 ) → K
(i )
) ⇒ C (i+1) ⇒ D (i +1)
(28)
Górne indeksy numerują iteracje. Proces jest przerywany gdy dochodzi do jednoczesnego
uzbieżnienia macierzy gęstości i całkowitej energii układu. Symetryczna ortogonalizacja
Löwdina pozwala sprowadzić równanie wiekowe FC = SCe do zagadnienia własnego:
F 'C' = C'e ,
(29)
gdzie C ' = S 1/ 2C a F `= S −1/ 2 FS −1/ 2 . Macierze S 1/ 2 i S −1/ 2 spełniają następujące równości:
S 1/ 2 S 1/ 2 = S , S 1/ 2 S −1/ 2 = S −1/ 2 S 1/ 2 = 1 i S −1/ 2 S −1/ 2 = S −1 . Diagonalizując macierz F ` ,
znajdujemy wektory i wartości własne. Transformacja odwrotna C = S −1/ 2C ' pozwala
wyznaczyć CMO.
Metoda HF wykorzystuje dwa warianty obliczeń. W pierwszym wariancie, całki jedno- i
dwuelektronowe oblicza się raz na początku obliczeń. Całek jednoelektronowych jest
stosunkowo niewiele i można je przechowywać w pamięci podręcznej, natomiast całki
dwuelektronowe przechowuje się na twardym dysku i wczytuje się wielokrotnie przy
konstrukcji macierzy Focka w trakcie procesu iteracyjnego. Wariant ten wykorzystuje się
wyłącznie dla małych układów molekularnych. Dla większych układów przestrzeń dyskowa
może być niewystarczająca, ponadto operacje „czytania” są dość kosztowne. W drugim
wariancie, całki dwuelektronowe oblicza się w trakcie procesu SCF. Metoda ta jest bardzo
efektywna w przypadku obliczeń na wielu procesorach. Ponadto, wykorzystanie technik
preselekcji pozwala znacznie ograniczyć liczbę całek dwuelektronowych.
Korelacja elektronowa
Energia układu wyznaczona metodą HF obarczona jest systematycznym błędem. Błąd ten
związany jest z kulombowską korelacją elektronową. Nawet użycie nieskończonej bazy
funkcyjnej nie pozwala nam na uwzględnienie tego błędu.
u. W przypadku użycia bazy
nieskończonej uzyskujemy energię w granicy HF, EHFL (HF limit),, która leży powyżej energii
doładnej, uzyskanej w ramach przybliżenia nierelatywistycznego ENREL. Jest to zilustrowane
na rys. 1.
Rysunek 1 Graficzne przedstawienie błędu bazy
funkcyjnej, błędu korelacji elektronowej i błędu
relatywistycznego.
Energia uzyskana w skończonej bazie oznaczona jest jako ESCF. Wartość dokładna energii to
E0. Obszary I, II i III, zaznaczone na rys. 1, związane są z błędem bazy funkcyjnej (EHFL-ESCF
< 0), błędem kulombowskiej korelacji elektronowej (ENREL-EHFL < 0) i błędem energii
relatywistycznej (E0-ENREL < 0).
Takie trendy w zachowaniu ESCF możemy zrozumieć, jeżeli przeanalizujemy równanie
(8). Operator Focka jest operatorem jednoelektronowym, tzn. wybrany elektron porusza się w
uśrednionym polu generowanym przez pozostałe N-1 elektronów. W konsekwencji ruchy
elektronów nie są skorelowane. Można pokazać, że prawdopodobieństwo napotkania dwóch
elektronów o przeciwnych orientacjach współrzędnych spinowych w tym samym punkcie
przestrzeni jest równe iloczynowi niezależnych prawdopodobieństw napotkania każdego z
tych elektronów w tym samym punkcie przestrzeni. Na skutek oddziaływania
kulombowskiego wokół wybranego elektronu powinien znajdować się obszar, w którym
prawdopodobieństwo napotkania drugiego elektronu powinno być obniżone w stosunku do
tego wynikającego z rozkładu HF (dziura korelacyjna). Zwróć uwagę na to, że metoda HF
korelację
wymienną
wynikającą
ze
statystyki
Fermiego-Diraca.
uwzględnia
Prawdopodobieństwo napotkania dwóch elektronów o tej samej orientacji współrzędnej
spinowej w tym samym punkcie przestrzeni jest równe zeru.
Korelację elektronową dzielimy na statyczną i dynamiczną. Korelacja statyczna związana
jest z tym, że pojedyncza funkcja wyznacznikowa nie opisuje poprawnie stanu podstawowego
układu. Sytuacja taka ma miejsce gdy dany stan jest zdegenerowany lub jest bliski
degeneracji. Korelacja dynamiczna związana jest z pojawieniem się osobliwości w
hamiltonianie gdy odległość między elektronami dąży do zera (1/rij ). Korelację statyczną
można łatwo uwzględnić natomiast dynamiczną zdecydowanie trudniej, co wiąże się ściśle z
dokładnością funkcji falowej (elektronowe kryterium wierzchołkowe).
Warianty metody HF
W obliczeniach molekularnych wykorzystuje się trzy warianty równań HF. Przedstawiony
powyżej schemat obliczeniowy nazywamy ograniczoną metodą HF (RHF, restricted HF
metod). W metodzie tej macierze spinowe są identyczne Dα = Dβ = D / 2 . Równość
analogiczna odnosi się także macierzy Focka Fα = Fβ = F / 2 . Funkcja falowa metody RHF,
+
−
+
−
+
−
Φ RHF = ϕ1 ϕ1 ϕ 2 ϕ 2 K ϕ p ϕ p , jest funkcją własną operatorów Ŝ 2 i Ŝ z . Zauważ, że funkcja
Φ RHF nie jest funkcją własną operatora Hamiltona. Jest wyłącznie funkcją własną sumy
r
operatorów Focka:
Fˆ (q ) .
∑i
i
Bardziej ogólna jest nieograniczona metoda HF (UHF, unrestricted HF). Można ją
stosować do układów zamknięto- i otwartopowłokowych. W metodzie tej funkcję falową
+
można
przedstawić
następująco:
−
+
−
+
−
+
+
Φ UHF = ϕ1 ϕ '1 ϕ 2 ϕ '2 K ϕ p ϕ ' p ϕ p +1 Kϕ p+ k .
Kształt
+
−
spinorbitali ϕi jest inny niż kształt spinorbitali ϕ 'i . Można powiedzieć, że funkcja falowa
metody UHF uwzględnia tzw. korelację radialną. Jest to zilustrowane na rysunku 2, który
+
−
pokazuje funkcje 1s i 1s' dla atomu helu (rysunek lewy) i ich gęstości radialne (rysunek
+
prawy). Jak widać, gęstość radialna dla funkcji 1s ma wyższe maksimum i szybciej zanika
−
niż dla funkcji 1s' . Najbardziej prawdopodobna odległość napotkania elektronu ze spinem
skierowanym do góry jest inna niż dla elektronu ze spinem skierowanym do dołu. Elektrony
unikają się radialnie. W konsekwencji, wartość energii E UHF leży poniżej wartości ERHF .
Funkcja falowa metody UHF może uwzględniać także tzw. korelację kątową. Wystarczy
zamiast sferycznych orbitali 1s wykorzystać funkcje mające dobrze zdefiniowane własności
kierunkowe, np. orbitale zhybrydyzowane, w których udział orbitali 2p jest dodatkowym
parametrem wariacyjnym. Zabieg taki jest równoważny z przejściem do funkcji
wielowyznacznikowej. W przypadku metody UHF zabieg ten ma raczej poglądowe znaczenie
na rolę i sposób uwzględnienia korelacji elektronowej.
Rysunek 2 Spinorbitale 1s i 1s’ budujące funkcje falową metody UHF atomu helu (diagram
lewy) i ich gęstości radialne (diagram prawy)
W odróżnieniu od funkcji Φ RHF , funkcja Φ UHF nie jest funkcją własną operatora Ŝ 2 ,
niemniej ciągle pozostaje funkcją własną operatora Ŝ z . Mówimy, że funkcja falowa metody
UHF jest zanieczyszczona spinowo, tzn. posiada domieszkę innych (wyższych) stanów
spinowych, którą należy wyeliminować stosując technikę rzutowania. Jest to cena jaką
płacimy za zmianę kształtu spinorbitali β w stosunku do spinorbitali α.
W metodzie UHF rozwiązujemy dwa równania wiekowe. Jedno dla elektronów α, a
drugie dla elektronów β:
Fα C α = SC α eα
(30a)
Fβ C β = SC β e β .
(30b)
Równanie te nie są od siebie niezależne. Oddziaływania kulombowskie sprzęgają je ze sobą.
W metodzie UHF macierze gęstości i macierze Focka dla obu orientacji współrzędnych
spinowych są różne: Dα ≠ Dβ i Fα ≠ Fβ . Każda z macierzy gęstości spełnia warunki
unormowania:
tr ( Dα S ) = N α
(31a)
i
tr (Dβ S ) = N β ,
(31b)
oraz warunki idempotentności:
Dα SDα = Dα
(32a)
i
Dβ SDβ = Dβ .
(32b)
Pełna macierz gęstości jest równa sumie macierzy Dα i Dβ : D = Dα + Dβ .
Ostatni wariant obliczeń metodą HF to ograniczona, otwartopowłokowa metoda HF
(ROHF, restricted open-shell HF). W metodzie tej kształt spinorbitali typu α i β jest
dokładnie taki sam, przy czym część orbitali może być pojedynczo obsadzona. Funkcję
falową w tej metodzie można przedstawić w następujący symboliczny sposób:
+
−
+
−
+
−
+
+
Φ ROHF = ϕ1 ϕ1 ϕ 2 ϕ 2 K ϕ p ϕ p ϕ p+1 Kϕ p + k . Podobnie jak w metodzie RHF, funkcja falowa
jest funkcją własną operatorów Ŝ 2 , Ŝ z i
r
∑i Fˆ (qi ) . W przypadku gdy k = 0,
Φ ROHF jest
tożsama z Φ RHF . W metodzie ROHF, macierze Focka Fα i Fβ służą do utworzenia
kanonicznej postaci macierzy Focka. Istnieje kilka sposobów konstrukcji tej macierzy. W
granicy SCF dają identyczne rozwiązania. Metoda ta jest rzadziej stosowana, ze względu na
duże problemy ze zbieżnością procesu iteracyjnego.
METODY WYCHODZĄCE POZA PRZYBLIŻENIE JEDNOELEKTRONOWE METODY POST-HF
Metoda HF nie uwzględnia korelacji elektronowej. Pewną wskazówkę jak uwzględnić energię
korelacji otrzymaliśmy przy omawianiu metody UHF (korelacja kątowa). Przejście do orbitali
zhybrydyzowanych, z jednoczesną optymalizacją ich kształtu, jest równoznaczne z
przyjęciem funkcji wielowyznacznikowej. Czytelnikowi pozostawiam to do sprawdzenia w
przypadku atomu helu (hybrydyzacja sp). W niniejszym opracowaniu zostaną przedstawione
dwie metody wychodzące poza przybliżenie jednoelektronowe i wykorzystujące orbitale
metody HF jako podstawę do konstrukcji funkcji wielowyznacznikowych. Pierwsza z metod
będzie oparta na rachunku wariacyjnym a druga na rachunku perturbacyjnym. Obie omawiane
metody są zaliczane do metod post-HF.
Metoda mieszania konfiguracji
W metodzie mieszania konfiguracji (CI, configuration interaction) zakładamy, że Nelektronowa funkcja falowa jest kombinacją liniową wyznaczników Slatera. Wyznaczniki te
budowane są ze spinorbitali otrzymanych w metodzie HF. Funkcję metody CI, opartą na
wcześniejszych obliczeniach RHF, można przedstawić następująco:
Φ CI = C0 Φ 0 +
1
(1!) 2
zaj wirt
zaj zaj wirt wirt
1
∑ ∑ Cir Φ ir + (2!) 2 ∑∑∑ ∑ Cijrs Φ ijrs +
i
r
i
1
(3!) 2
j
r
s
zaj zaj zaj wirt wirt wirt
∑∑∑ ∑∑ ∑ Cijkrst Φ ijkrst
i
j
k
r
s
.
(33)
t
Zakładamy, że indeksy i, j, k, … odnoszą się do orbitali zajętych, natomiast indeksy r, s, t, …
do orbitali wirtualnych. Pierwszy człon w powyższym rozwinięciu to funkcja RHF
wymnożona prze współczynnik wariacyjny C0. Kolejne wyrazy odpowiadają tzw.
konfiguracjom wzbudzonym. Funkcja Φ ir powstaje z funkcji Φ 0 ≡ Φ RHF przez zastąpienie itego orbitalu przez r-ty orbital wirtualny. Oczywiście należy pamiętać, że orbitale zajęte są
podwójnie, natomiast wzbudzany jest tylko jeden z elektronów. Ta jednokrotnie wzbudzona
konfiguracja wymnożona jest przez współczynnik wariacyjny Cir . W przypadku dwukrotnie
wzbudzonych konfiguracji Φ ijrs , orbitale zajęte (i, j) zastąpione są orbitale wirtualne (r, s).
Każdy wyraz wymnożony jest przez współczynnik wariacyjny Cijrs . Oczywiście można
wzbudzić dwa elektrony z tego samego orbitalu molekularnego. Współczynniki przed
sumami wprowadzono po to aby wykluczyć funkcje opisujące te same wzbudzenia, np.
wzbudzenie z i→r i j→s jest tożsame ze wzbudzeniem z i→s i j→r. Funkcje takie są tożsame
z dokładnością do znaku, pod warunkiem, że zachowujemy orientację współrzędnych
spinowych.
Aby znaleźć współczynniki wariacyjne i energię układu należy rozwiązać równanie
wiekowe metody CI:
H CI C CI = S CI C CI E ,
(34)
{
}
gdzie H CI = H IJCI = Φ I Hˆ el Φ J ,
{
S CI = S IJCI = Φ I Φ J
}.
Indeksy I i J oznaczają odpowiednie funkcje konfiguracyjne. Aby rozwiązać układ równań
metody CI musimy umieć wyznaczyć elementy macierzowe H IJCI i S IJCI . Reguły SlateraCondona pozwalają nam to zrobić. Zainteresowane osoby zachęcam do ich wyprowadzenia.
Jeżeli konfiguracje I-ta i J-ta różnią się pojedynczym orbitalem, tzn. i-ty orbital w
konfiguracji I został zastąpiony przez r-ty orbital w konfiguracji J, to: ,
zaj
H IJCI = Φ I Hˆ el Φ J = i hˆ r + ∑ ij gˆ rj − jr , S IJCI = Φ I Φ J = i r
j =1
zaj
∏
j j =0
(35)
j ≠i
gdzie, ij gˆ rj − jr = ij gˆ rj − ij gˆ jr . Gdy zamiana dotyczy dwóch spin orbitali (ij→rs) to:
H IJCI = Φ I Hˆ el Φ J = ij gˆ rt − tr , S IJCI = Φ I Φ J = 0 .
(36)
Gdy konfiguracje różnią się więcej niż dwoma orbitalami to oba elementy macierzowe są
równe zeru
H IJCI = Φ I Hˆ el Φ J = 0 , S IJCI = Φ I Φ J = 0 .
(37)
Widzimy więc, że równanie wiekowe
H CI C CI = C CI E
(38)
upraszcza się. Strukturę macierzy H CI można poznać gdy funkcje falową (33) zastąpimy
symbolicznym rozwinięciem
Φ CI = C0 Φ 0 + CS Φ S + C D Φ D + CT Φ T + CQ Φ Q + L
(39)
Indeksy S, D, T, Q, … , odnoszą się do pojedynczo, podwójnie, potrójnie, poczwórnie , ..,
wzbudzonych konfiguracji elektronowych. Rysunek 3 przedstawia strukturę macierzy energii.
Bloki zaznaczone na niebiesko są równe zeru (reguły Slatera-Condona). Bloki czerwone,
które odpowiadają za sprzęganie się jednokrotnie wzbudzonych konfiuracji z konfiguracją
stanu podstawowego są równe zeru na mocy twierdzenia Brillouina:
. H 0CI,S = Φ 0 Hˆ e ΦS = 0 .
(40)
Bloki białe są w ogólności różne od zera. Oczywiście gdy dwie konfiguracje mają inną
symetrię spinową lub należą do różnych reprezentacji nieredukowalnych grupy punktowej
cząsteczki to wtedy odpowiedni element macierzy energii jest równy zeru.
Rysunek 3 Struktura macierzy energii metody CI.
Mimo, że metoda CI jest stosunkowo prosta koncepcyjnie to napotykamy na dużą złożoność
techniczną ponieważ liczba konfiguracji jest gigantyczna, nawet dla stosunkowo niewielkich
cząsteczek. Z tego względu pełne rozwinięcie (33) stosuje się wyłącznie dla niewielkich
układów. Taki wariant metody CI nazywa się pełną metodą CI (full CI). Najczęściej
wykorzystywanym wariantem metody CI jest metoda CID i CISD. W metodzie CID
rozwinięcie funkcji falowej ogranicza się tylko do wzbudzeń dwukrotnych. Konfiguracje
dwukrotnie wzbudzone sprzęgają się bezpośrednio z konfiguracją podstawową i mają
największy udział w energii korelacyjnej. W wariancie CISD dopuszcza się dodatkowo
konfiguracje pojedynczo wzbudzone. Dzięki sprzęganiu się z konfiguracjami dwukrotnie
wzbudzonymi, funkcje Φ S mają pośredni wpływ na energię korelacji elektronowej.
W zasadzie nie ma ograniczeń przy konstrukcji rozwinięcia (33). Ze względu na dużą
liczbę konfiguracji elektronowych, przy konstrukcji funkcji falowej ograniczamy się do
konfiguracji posiadających odpowiednią symetrię przestrzenną i spinową. Mówiąc o symetrii
przestrzennej chodzi nam o reprezentację nieredukowalną grupy punktowej cząsteczki.
Gdybyśmy takiego ograniczenia nie wprowadzili to H CI byłaby macierzą blokowo
diagonalną. Z algebry liniowej wiadomo, że w takim przypadku można rozwiązać
zagadnienia własne dla każdego bloku z osobna. Sytuację tą zademonstrujemy dla cząsteczki
H2 w bazie minimalnej. W bazie tej mamy do dyspozycji dwa orbitale molekularne
1σ g = N + (1s1 + 1s 2 ) i 1σ u = N − (1s1 − 1s2 ) . Pierwszy jest unormowaną sumą, a drugi
unormowaną różnicą orbitali 1s atomów wodoru (atomy rozróżniono dolnymi indeksami „1” i
„2”). W oparciu o te orbitale można skonstruować trzy stany singletowe i jeden stan
tripletowy (potrójnie zdegenerowany):
+
−
Φ 0g = 1σ g 1σ g
+
(41)
+
Φ uA = 1σ g 1σ u
−
(42)
−
Φ uB = 1σ g 1σ u
Φ uC =
−
+
1  + −
 1σ g 1σ u + 1σ g 1σ u
2
Φ uD =
−
+
1  + −
 1σ g 1σ u − 1σ g 1σ u
2
+
(43)



(44)



(45)
−
Φ Eg = 1σ u 1σ u
(46)
Górny indeks określa symetrię względem inwersji. Orbitale wymieniono zgodnie z kryterium
energetycznym. Funkcje Φ uA , Φ uB i Φ uC mają tę samą energię (stan trypletowy). Macierz
H CI w bazie tych funkcji jest przedstawiona na rysunku 4.
Rysunek 4 Struktura macierzy CI dla cząsteczki H2 w bazie minimalnej.
Jak widać wartość większości elementów tej macierzy jest równa zeru. Bloki niebieskie
wprowadzono aby pokazać zerowanie się elementów macierzowych wynikające z
przynależności funkcji falowej do różnych reprezentacji nieredukowalnych grupy punktowej
D∞h, przy tej samej multipletowości funkcji konfiguracyjnych (stany singletowe). Część
bloków czerwonych zeruje się z obu wzmiankowanych powodów. Przestawienie wierszy i
kolumn macierzy H CI sprowadza ją do macierzy blokowo diagonalnej. Największy blok
(macierz 2×2) to macierz CID, która pozwala obliczyć energię stanu podstawowego i
drugiego wzbudzonego singletu. Metoda CID w bazie minimalnej dla cząsteczki H2 jest
tożsama z metodą CISD i pełną macierzą CI. Innymi słowy domieszka innych stanów nie
poprawi energii stanu podstawowego. W bazach poszerzonych ta uwaga nie jest prawdziwa.
Należy pamiętać, że metoda CI pozwala znaleźć energię stanu podstawowego cząsteczki jak i
stanów wzbudzonych. Wszystkie te energie leżą powyżej dokładnych energii.
Rachunek zaburzeń Møllera-Plesseta
Rachunek perturbacyjny został omówiony w paczce nr 2. W rozdziale tym wykorzystamy
gotowe wyrażenia na wyznaczenie energii i funkcji falowej układu N-elektronowego. Zanim
to zrobimy musimy zdefiniować hamiltonian zerowego-rzędu. Jednym z możliwych wyborów
jest:
r r
r
r
Hˆ (0) (q1 , q2 , K , q N ) = ∑iFˆ (qi ) .
Przy takim wyborze, dowolna funkcja z rozwinięcia (33) jest jego funkcją własną:
(47)
ERROR: stackunderflow
OFFENDING COMMAND: ~
STACK: