Metody obliczeniowe ab initio w fizyce struktur atomowych

Transkrypt

Metody obliczeniowe ab initio w fizyce struktur atomowych
Metody obliczeniowe ab initio w fizyce struktur atomowych
Paweł Scharoch, Jerzy Peisert
(skrypt w opracowaniu)
Spis treści
1
2
2.1
2.2
2.3
2.4
2.5
3
3.1
3.2
3.3
3.4
3.5
3.6
4
5
5.1
5.2
5.3
5.4
5.5
6
7
7.1
7.2
8
8.1
8.2
8.3
9
9.1
9.2
9.3
9.4
9.5
9.6
10
Wstęp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teoria podstawowa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Równanie Schrödingera dla izolowanego układu atomów. . . . . . . . . . . . . .
Przybliżenie Borna-Oppenheimera. . . . . . . . . . . . . . . . . . . . . . . . . .
Powierzchnia energii potencjalnej. . . . . . . . . . . . . . . . . . . . . . . . . . .
Stany równowagi statycznej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana . . . . . . . . . . . .
Podstawy teoretyczne obliczeń it ab initio. . . . . . . . . . . . . . . . . . . . . .
Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT).
Twierdzenie Hohenberga-Kohna. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Równania Kohna-Shama. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Twierdzenie Janaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stany wzbudzone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Przybliżenia energii korelacji-wymiany: LDA i GGA. . . . . . . . . . . . . . . .
Przykład: atom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pseudopotencjał . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Historia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Psudopotencjał zachowujący normę . . . . . . . . . . . . . . . . . . . . . . . . .
Generowanie pseudopotencjału . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Uniwersalność (transferability) i twardość (hardness) pseudopotencjału. . . . . .
Pseudopotencjał jako separowalny operator . . . . . . . . . . . . . . . . . . . . .
Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. . .
Dynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dynamika Molekularna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Przybliżenie harmoniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Termodynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . .
Termodynamika w skali nano . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Koncepcja powierzchni energii swobodnej (FES). . . . . . . . . . . . . . . . . . .
Metody obliczania funkcji rozdziału. . . . . . . . . . . . . . . . . . . . . . . . .
Algorytmy numeryczne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Metoda dynamiki molekularnej Car-Parinello . . . . . . . . . . . . . . . . . . . .
Metoda najszybszego spadku (’Steepest descent’) . . . . . . . . . . . . . . . . .
Metoda gradientów sprzężonych . . . . . . . . . . . . . . . . . . . . . . . . . . .
Algorytmy dynamiki molekularnej . . . . . . . . . . . . . . . . . . . . . . . . . .
Szybka transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Metoda specjalnych punktów k Monkhorsta-Packa . . . . . . . . . . . . . . . . .
Przykłady zastosowania koncepcji PES i FES . . . . . . . . . . . . . . . . . . .
1
2
3
3
4
4
5
5
5
5
6
6
8
8
8
9
11
12
12
12
13
13
14
14
14
14
15
15
16
17
18
18
18
18
18
18
19
21
1 Wstęp.
1
2
Wstęp.
W 1929 roku Paul Dirac pisał [1]: ”...The underlying physical laws necessary for the
mathematical theory of a large part of physics and the whole of chemistry are
thus completely known and the difficulty is only that the exact application of these
laws leads to equations much too complicated to be soluble”, wskazując, że chociaż
matematyczne podstawy mechaniki kwantowej zostały poznane, to jednak techniczne trudności obliczeniowe związane z rozwiązywaniem odpowiednich równań są nie do pokonania. Z
tego powodu, na przestrzeni dziesięcioleci, własności fizyczne układów atomowych były teoretycznie badane głównie w oparciu o podejście modelowe. Podejście takie pozwala zrozumieć
mechanizmy zjawisk, jednak odniesienie do eksperymentu odbywa się zawsze poprzez parametry dopasowania. W dobie rozwoju nowoczesnych technologii informacja uzyskiwana tą drogą
jest niewystarczająca. Nie chodzi bowiem już tylko o jakościowe zrozumienie zjawiska, ale także
o precyzyjne, czysto teoretyczne przewidywania ilościowe. Tendencję taką obserwuje się niemal
we wszystkich dziedzinach nauk przyrodniczych, a zwłaszcza (choć nie tylko) na ich styku z naukami inżynierskimi: zapotrzebowanie na dokładne, teoretyczne dane ilościowe. Czy trajektoria
zauważonej, zbliżającej się do Ziemi asteroidy przetnie się z trajektorią naszej planety? Czy
huragan, który tworzy się nad Wyspami Karaibskimi dotrze do Florydy? Czy amortyzator o
założonej konstrukcji będzie dobrze pracował w superszybkiej kolei? Czy dana konstrukcja anteny nadawczej zapewni odpowiednią charakterystykę promieniowania? Czy pole fali radiowej
rozproszonej przez dźwig budowlany nie stworzy zagrożenia dla ludzi pracujących w sąsiedztwie? Takich przykładów w dzisiejszej nauce i technice znajdziemy dziesiątki. Odpowiedzi na
takie i podobne pytania nie można uzyskać rozwiązując proste modele. Potrzebne są obliczenia
numeryczne dużej skali oparte na podstawowych teoriach fizycznych.
Dziedzina będąca przedmiotem zainteresowania niniejszej pracy to fizyka struktur atomowych, w szczególności struktur wykorzystywanych w nanotechnologiach (nanostruktur). Nanostruktury atomowe są to układy o charakterystycznych rozmiarach rzędu nanometrów, czyli,
powiedzmy od kilku do kilkudziesięciu tysięcy atomów. Własności fizyczne takich układów
są zdeterminowane przez ich konfiguracje geometryczne i elektronowe. W rozważaniach modelowych można zakładać takie czy inne konfiguracje atomów jednak natura narzuca swoje
rozwiązania, uzależnione od budowy pojedynczych cegiełek-atomów oraz skomplikowanych oddziaływań w układzie. Używa się określenia struktury samoorganizujące się (ang.: self assembling structures). W tej sytuacji możliwość teoretycznego przewidywania budowy struktur, bez
odniesień eksperymentalnych (których zresztą często po prostu nie ma) staje się niezbędna.
Po pierwsze dlatego, że eksperyment technologiczny jest bardzo kosztowny i po drugie przewidywania teoretyczne mogą dać odpowiedź na pytanie czy założona struktura może w ogóle
istnieć. Z pomocą przychodzą rozwijające się intensywnie od czterech dziesięcioleci metody
obliczeniowe ab initio [2]. W połowie lat 60-tych, na gruncie mechaniki kwantowej powstaje
Teoria Funkcjonału Gęstości (DFT-Density Functional Theory) [3, 4], która tworzy podstawy numerycznych obliczeń energii całkowitej oraz rozkładu gęstości elektronowej w układach
wieloatomowych. Powstanie teorii splata się z rozwojem techniki komputerowej i tworzeniem
efektywnych algorytmów obliczeniowych, takich jak algorytm szybkiej transformaty Fouriera
(FFT - Fast Fourier Transform) czy iteracyjne metody diagonalizacji macierzy (metoda dynamiki molekularnej Car-Parrinello [5]). Dzięki rozwojowi tych trzech elementów: teorii, metod
obliczeniowych (algorytmów), oraz techniki komputerowej, metody obliczeniowe ab initio stały
się potężnym narzędziem badawczym, odnoszącym wielkie sukcesy. Można obecnie analizować
układy zawierające do kilkuset atomów, co w połączeniu z periodycznymi warunkami brzegowymi i/lub metodami hybrydowymi prowadzi już do bardzo szerokiej klasy układów poddających
się takiej analizie, a otrzymywane wyniki pozostają zwykle w bardzo dobrej zgodności z eksperymentem.
Historycznie najwcześniejszym, wywodzącym się z chemii kwantowej, oraz nadal głównym
1 Wstęp.
3
zastosowaniem metod ab initio są badania strukturalne. Obserwuje się dwa główne nurty takich badań. Są to: badania materiałowe, w szczególności dla warunków ekstremalnych ciśnień
i temperatur (n.p. mineralogia układu słonecznego [6]), oraz badania dla potrzeb nanotechnologii. Obydwa nurty stosują podobne metody badawcze, różnią się jedynie rodzajem badanych
układów. Klasa układów atomowych stosowanych w nanotechnologiach jest bardzo szeroka.
Znajdą się tu zarówno lity kryształ (będący często podłożem dla nanoukładów) jak i granica
faz (stała-próżnia, stała-ciekła, stała-stała), a także obiekty zlokalizowane w kryształach i na
granicach faz (domieszki czy defekty strukturalne). Tematyka obejmuje zatem np. zagadnienia
geometrii równowagowych i przejść fazowych w kryształach litych, czystą powierzchnię kryształu z całym bogactwem zjawisk strukturalnych (rekonstrukcja), zjawiska adsorpcji i dyfuzji
powierzchniowej, zagadnienia wzrostu kryształów i cienkich warstw, oraz wiele innych.
Struktury typowe dla nanontechnologii to cienkie warstwy, druty kwantowe, kropki kwantowe oraz kombinacje tych struktur. W kontekście zastosowań technicznych wyłaniają się dwie
grupy problemów. Pierwszy to technologia wytwarzania takich struktur i drugi ich własności
fizyczne w tym struktura geometryczna i elektronowa (n.p. problem stabilności). Metody obliczeniowe ab initio okazują się być nieocenionym narzędziem na etapie projektowania struktur
oraz projektowania technologii ich wytwarzania. Energia całkowita układu jako funkcja wybranych parametrów geometrycznych nazywana jest powierzchnią energii potencjalnej, E P ES
(PES - ’Potential Energy Surface’). Znajomość tej funkcji oraz jej dwóch kolejnych gradientów względem parametrów geometrycznych okazuje się być kluczowa przy badaniu własności
strukturalnych układów atomowych. Znajomość funkcji E P ES pozwala także badać dynamikę
układów i, w kolejnym kroku, termodynamikę, a więc włączyć temperaturę do badań strukturalnych, wyznaczać charakterystyki termodynamiczne, zależności temperaturowe konfiguracji
geometrycznych, badać strukturalne przejścia fazowe, itp. Wreszcie, jako wynik obliczeń uzyskuje się gęstość elektronową stanu podstawowego, mierzalną wielkość fizyczną, będącą podstawową
wielkością w teorii funkcjonału gęstości (DFT - Density Functional Theory). Znajomość gęstości elektronowej oraz zmian tej gęstości pod wpływem różnych czynników fizycznych pozwala
wniknąć w naturę wiązań w układach i szukać uzasadnienia zjawisk strukturalnych.
Należy dodać, że w ramach DFT i przybliżenia adiabatycznego można także badać odpowiedź
układu na wolnozmienne w czasie (adiabatyczne) pobudzenia zewnętrzne (pole elektromagnetyczne, czynniki mechaniczne itp.). Na przykład kod ABINIT [7], wykorzystywany w części
praktycznej niniejszej pracy, umożliwia obliczanie różnych funkcji odpowiedzi układu, które są
drugimi pochodnymi energii całkowitej ze względu na różne zaburzenia. Obecnie uwzględnione
są zaburzenia nastepujących typów: (1) fonony, (2) statyczne (adiabatyczne) pole elektryczne
i (3) naprężenia mechaniczne. Własności fizyczne związane z zaburzeniami (1) i (2) opisywane
są przez fononową macierz dynamiczną, tensor dielektryczny oraz ładunek efektywny Borna,
natomiast dodatkowe zaburzenie w postaci naprężenia (3), w połączeniu z fononami i polem
elektrycznym prowadzi do stałych sprężystych, naprężeń wewnętrznych oraz parametrów piezoelektrycznych.
W ostatnich latach prowadzone są też intensywne poszukiwania teoretyczne efektywnych
metod badania elektronowych stanów wzbudzonych w ramach DFT. Metody ab initio stosuje się
więc również do badania odpowiedzi układów na wysokoczęstościowe pobudzenia zewnętrzne,
choć są to w chwili obecnej obliczenia wymagające ponadprzeciętnych zasobów komputerowych.
Stosunkowo najwięcej kłopotów sprawia zakres częstości ”średnich”, przy których konieczne jest
wyjście poza przybliżenie adiabatyczne (Borna-Oppenheimera).
Praca niniejsza będzie poświęcona głównie zagadnieniom strukturalnym z uwzględnieniem
niskoczęstościowych czynników zewnętrznych.
2 Teoria podstawowa.
2
4
Teoria podstawowa.
2.1
Równanie Schrödingera dla izolowanego układu atomów.
Jako punkt wyjścia opisu fizyki struktur atomowych przyjmuje się nierelatywistyczny hamiltonian izolowanego układu atomów:
Ĥ = T̂ e + T̂ Z + Û ee + Û eZ + Û ZZ
gdzie:
T̂ e = −
h̄ X 2
∇,
2me i i
Û
eZ
=
X
i,k
T̂ Z = −
X
i
h̄
∇2 ,
2Mi i
2
Zi e
,
|ri − Rk |
Û
ZZ
Û ee =
(1)
1 X e2
,
2 i6=j |ri − rj |
1 X Zi Zk e2
=
,
2 i6=k |Ri − Rk |
to operatory odpowiednio: energii kinetycznej elektronów, energii kinetycznej jąder, oraz
energii potencjalnych oddziaływań elektrostatycznych elektron-elektron, elektron-jądro i jądrojądro, a Mi i Zi oznaczają odpowiednio masy i liczby atomowe atomów tworzących układ.
Stany i energie własne układu są rozwiązaniami stacjonarnego równania Schrödingera:
ĤΨs (r, R) = Es Ψ(r, R),
(2)
gdzie Ψs (r, R) jest wielociałową funkcją falową układu zależną od elektronowych (w tym
spinowych) (r) i jonowych (R) stopni swobody, Es opisuje energię całkowitą tego układu, a s
indeksuje rozwiązania równania.
Ten podstawowy opis jest także punktem wyjścia teoretycznej analiz odpowiedzi układu na
różnego rodzaju oddziaływania zewnętrzne (mechaniczne, elektromagnetyczne, zależne bądź
niezależne od czasu), ponieważ zwykle traktuje się je jako zaburzenie hamiltonianu (1) i stosuje rachunek zaburzeń. Pierwszym przykładem takiego podejścia, a zarazem fundamentalnym
przybliżeniem stosowanym w teorii struktur atomowych jest przybliżenie Borna-Oppenheimera
(adiabatyczne) opisane krótko w następnym rozdziale.
2.2
Przybliżenie Borna-Oppenheimera.
Pierwszym przybliżeniem jakie się stosuje jest przybliżenie Borna-Oppenheimera (adiabatyczne) wykorzystujące fakt dużej różnicy między masą jądra atomowego a masą elektronu (od 3
do 5 rzędów wielkości). W ramach tego przybliżenia równanie Schrödingera (2) separuje się na
dwa równania, które mogą być rozwiązywane niezależnie (choć sprzężone są poprzez jonowe
stopnie swobody). Są to:
Ĥ e ψ(r) = E(R)ψ(r),
(3)
równanie dla układu elektronowego, w którym jonowe stopnie swobody (R) pełnią rolę
parametrów, oraz
Ĥ BO φ(R) = E tot φ(R),
(4)
równanie dla układu jonów. W powyższych równaniach Ĥ e jest hamiltonianem układu elektronowego:
Ĥ e = T̂ e + V̂ ee + V̂ ej
a Ĥ BO hamiltonianem układu jonów:
(5)
2 Teoria podstawowa.
5
Ĥ BO = T̂ j + V̂ jj + E(R),
(6)
do którego, jak widać, wchodzi zależna od R energia układu elektronowego. Elektronowa i
jonowa funkcje falowe to odpowiednio ψ(r) i φ(R).
Opisana wyżej procedura formalnie polega na przedstawieniu funkcji Ψ w równaniu (2) w
postaci iloczynu funkcji ψ(r) i φ(R) oraz pominięciu małych (w sensie wartości oczekiwanej)
składowych energii całkowitej układu. Fizycznie przybliżenie to oznacza, że układ elektronowy
dopasowuje się w sposób natychmiastowy do konfiguracji jonów. Konsekwencją tego przybliżenia jest w szczególności ograniczenie możliwości uwzględniania pobudzeń zewnętrznych tylko
do niskich częstości (porównywalnych z częstościami charakterystycznymi dla układu jonów)
oraz wysokich częstości (przy których układ jonowy nie reaguje na pobudzenie).
2.3
Powierzchnia energii potencjalnej.
Zagadnienie dynamiki układu jonowego można z bardzo dobrym przybliżeniem rozwiązywać
klasycznie, rozwiązując np. równania Newtona. Rolę energii potencjalnej pełnią: energia oddziaływania jon-jon oraz sparametryzowana położeniami jonów energia układu elektronowego
(patrz równie 6). Jest to jednocześnie energia całkowita układu E tot w wyrażeniach (2) i (4),
w sytuacji statycznej (unieruchomionych jonów). Tak określona energia potencjalna jest więc
w ogólności funkcją jonowych stopni swobody. Na poziomie ’mikroskopowym’ będą to współrzędne jonów, istnieje jednak możliwość przesunięcia części stopni swobody układu na poziom
mezoskopowy (i makroskopowy) w postaci np. objętości, pola powierzchni, zmiennych strukturalnych (definiujących komórkę elementarną w krysztale), czy składowych tensora odkształceń.
Funkcja ta nazywana jest powierzchnią energii potencjalnej (PES) i stanowi kluczową charakterystykę układu z punktu widzenia własności strukturalnych i materiałowych. Ważne są także
dwa kolejne gradienty PES ze względu na jonowe stopnie swobody reprezentujące uogólnione
siły oraz uogólnione stałe elastyczne. I tak, na poziomie mikroskopowym:
∂E tot (R)
Fi = −
(7)
∂Ri
to siły działające na jony (indeks i identyfikuje jednocześnie jon i współrzędną, np. kartezjańską). Drugi gradient:
∂Fi
∂ 2 E tot (R)
=−
∂Rj
∂Ri ∂Rj
(8)
określa w tym wypadku macierz stałych siłowych, wykorzystywaną w przybliżeniu harmonicznym (patrz rozdział 7.2).
Na poziomie mezoskopowym, np. przy objętości traktowanej jako stopień swobody, otrzymujemy ciśnienie i moduł sprężystości objętościowej (bulk modulus):
P =−
∂E tot (V )
∂V
(9)
∂P (V )
∂ 2 E tot (V )
B=V
= −V
(10)
∂V
∂V 2
Jeśli stopniem swobody będzie pole powierzchni (lub wymiar liniowy) wówczas kolejne pochodne to napięcie powierzchniowe (liniowe) i moduł sprężystości powierzchniowej (liniowej). Z
kolei jako wynik kolejnych pochodnych energii całkowitej po składowych tensora odkształceń
otrzymamy tensor naprężeń oraz tensor sprężystości.
3 Podstawy teoretyczne obliczeń it ab initio.
2.4
6
Stany równowagi statycznej.
Minima lokalne lub globalne PES wyznaczają stany równowagi układów zwane równowagą
statyczną (static equilibrium). Nie jest to do końca stan odpowiadający temperaturze zera bezwzględnego gdyż nie uwzględnia się tu drgań zerowych atomów. W przykładach podanych w
poprzednim podrozdziale stan równowagi statycznej określa np. położenia atomów, na poziomie
mikroskopowym. Na wyższych poziomach będzie to np. objętość równowagowa, równowagowa
struktura krystaliczna. Jeśli minimum PES ma charakter lokalny wówczas mamy doczynienia
ze stanem metastabilnym a więc możliwe jest przejście układu do minimum globalnego, aktywowane np. temperaturą. Warunkiem równoważnym minimum PES jest warunek zerowania się
sił lub sił uogólnionych (zerowanie pierwszych pochodnych). Zerowanie się drugich pochodnych
oznacza brak dobrze określonego minimum PES, co może oznaczać brak stabilności układu.
Interesującym przypadkiem PES na poziomie mikroskopowym jest atom adsorbatu na powierzchni kryształu. Jeśli płaszczyzna XY kartezjańskiego układu współrzędnych pokrywa się z
płaszczyzną powierzchni wówczas PES jest dwuwymiarową funkcją współrzędnych x i y atomu
(zakłada się, że atom zawsze pozostaje w minimum PES ze względu na trzeci stopień swobody,
współrzędną z). Wyznaczona w ten sposób PES pozwala na określanie położeń stabilnych i metastabilnych atomów na powierzchni, określanie prawdopodobieństw przejść z jednych położeń
do drugich oraz na analizę dyfuzji powierzchniowej.
Bardzo istotnym parametrem, od którego zależą na własności strukturalne układów atomowych, jest temperatura. Jej uwzględnienie wymaga analizy termodynamiki układów. Możliwe
wydaje się uogólnienie koncepcji powierzchni energii potencjalnej na koncepcję powierzchni
energii swobodnej (FES - free energy surface). Zagadnieniu temu będzie poświęcony jeden z
kolejnych rozdziałów.
2.5
Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana
Twierdzenie Hellmanna-Feynmana mówi, że jeśli energia Eλ jest wartością oczekiwaną pewnego
hamiltonianu Hλ , zależnego od parametru λ, to pochodna tej energii po parametrze λ jest równa
wartości oczekiwanej pochodnej hamiltonianu Hλ po tym parametrze:
∂Eλ
∂Hλ
= hψλ |
|ψλ i
∂λ
∂λ
Stąd siła Fi działająca na atom (52):
Fi = −
∂E tot (R)
∂H BO (R)
= −hψ(R)|
|ψ(R)i,
∂Ri
∂Ri
(11)
(12)
i ostatecznie:
Z
Fi = −
n(r, R)
∂V jj (R)
∂V ej (r, R)
dr −
,
∂Ri
∂Ri
(13)
gdzie n, V ej , V jj to odpowiednio: gęstość elektronowa, energia oddziaływania elektron-jon i
energia oddziaływania jon-jon, jak w rozdziale 2.3.
3
3.1
Podstawy teoretyczne obliczeń it ab initio.
Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT).
Jak pokazano w poprzednim rozdziale, w badaniach teoretycznych własności strukturalnych
układów atomowych kluczową rolę odgrywa powierzchnia energii potencjalnej (PES) definiowana jako energia całkowita układu przy zamrożonych jonowych stopniach swobody:
3 Podstawy teoretyczne obliczeń it ab initio.
7
E tot = V jj + E(R)
(14)
Obliczenia numeryczne pierwszego składnika w tym wyrażeniu (energii kulombowskiego oddziaływania jonów) są proste od strony ideowej. Trudności techniczne związane z faktem, że
oddziaływanie kulombowskie jest dalekozasięgowe pokonuje się stosując technikę Ewalda (Ref).
Drugi składnik to energia całkowita układu elektronowego. Jest to znane w mechanice kwantowej zagadnienie układu cząstek identycznych, samo w sobie złożone i będące obiektem oddzielnej dziedziny badań teoretycznych. W przypadku układów atomowych mówimy o niejednorodnym gazie elektronów (fermionów). Podstawy teoretyczne analizy fizyki takich układów były
znane już w końcu lat 20 XX wieku (Ref), jednak rozwiązanie równań okazało się technicznie
niemożliwe (warto przypomnieć, że nawet klasyczny układ tylko trzech cząstek jest w ogólności nierozwiązywalny analitycznie). W latach 50 rozpoczęła się rewolucja w dziedzinie technik
obliczeniowych, która trwa do dzisiaj i wydaje się, że jej końca ciągle nie widać. Jednak i przy
obecnym stanie rozwoju komputerów, przecież imponującym, numeryczne rozwiązanie równania
Schrödingera nawet dla układu 10 elektronów (np. atom neonu) jest niemożliwe. Na przykład
pamięć potrzebna na zapisanie funkcji falowej takiego układu w reprezentacji położeniowej, na
siatce 10-punktowej, jest rzędu 4 × 1030 bytów. Gdyby więc chcieć zapisać taką funkcję na płytkach CD o pojemności 1Gb każda to potrzeba by 1021 takich płytek. Zakładając, że jedna płytka
waży 10 gramów potrzebujemy 1016 ton płytek, a to dopiero początek układu okresowego i każdy
następny atom to o 3 rzędy wielkości więcej potrzebnej pamięci ! Sytuacja wydaje się beznadziejna, jednak z pomocą przychodzi teoria funkcjonału gęstości (DFT - ’Density Functional
Theory’), której podstawy zostały sformułowane w latach 60 poprzedniego stulecia (Ref). Teoria
ta pozwala efektywnie rozwiązywać zagadnienie układu identycznych cząstek kwantowych poprzez rozwiązywanie jednocząstkowego równania typu Schrödingera, a centralnym problemem
teorii jest adekwatna reprezentacja kwantowego oddziaływania korelacji-wymiany.
3.2
Twierdzenie Hohenberga-Kohna.
Podstawą opisu układu cząstek identycznych w zewnętrznym potencjale V ext (niejednorodnego
gazu cząstek) w teorii funkcjonału gęstości jest ich gęstość:
Z
n(r) = N
|ψ(r, r2 , . . . , rN )|2 dr2 . . . drN
(15)
normowana do liczby cząstek:
Z
N=
n(r)dr
(16)
Jest to funkcja rzeczywista współrzędnej przestrzennej (3 zmiennych) zatem znacznie prostsza od funkcji falowej.
Punktem wyjścia teorii jest, sformułowane w 1964 roku, twierdzenie Hohenberga-Kohna
(Ref):
• Energia układu kwantowych cząstek cząstek identycznych jest funkcjonałem gęstości:
Z
E[n] = F [n] +
n(r)V ext (r)dr,
(17)
gdzie
F [n] = hψ|T̂ + Ŵ |ψi,
a Ŵ jest energią kulombowskiego oddziaływania cząstek
(18)
3 Podstawy teoretyczne obliczeń it ab initio.
8
• gęstość stanu podstawowego nG minimalizuje funkcjonał (17):
δE EG [nG ] = min E[n] ⇒
= 0,
n→nG
δn n=nG
(19)
co jest oczywistą konsekwencją zasady wariacyjnej Rayleigha-Ritza
Z twierdzenia tego wynika w szczególności, że funkcjonał F [n] jest uniwersalny, to znaczy,
że nie zależy od potencjału zewnętrznego. Wynika z niego także, że nie jest możliwe aby dwa
nietrywialnie różne potencjały (różniące się bardziej niż o stałą) produkowały taką samą gęstość
stanu podstawowego. W takim sensie potencjał zewnętrzny jest także funkcjonałem gęstości.
Własność ta została wykorzystana przy konstrukcji równań Kohna-Shama, opisanej w kolejnym
rozdziale.
3.3
Równania Kohna-Shama.
Twierdzenie Hohenberga-Kohna nie dostarcza recepty na znajdowanie gęstości n(r). Nie jest
bowiem znana jawna postać funkcjonału F [n] (a nawet są kłopoty ze zdefiniowaniem dziedziny
tego funkcjonału, czyli fizycznie akceptowalnych gęstości (Ref)). Trudności te zostały w znacznym stopniu przezwyciężone w konstrukcji Kohna-Shama polegającej na mapowaniu realnego
układu cząstek na pomocniczy układ cząstek nieoddziałujących, w taki sposób aby gęstości
stanu podstawowego obu układów były identyczne. Zabieg polega na konstrukcji zewnętrznego
potencjału lokalnego dla układu cząstek nieoddziałujących (na mocy tw. Hohenberga-Kohna
istnieje jeden i tylko jeden taki potencjał). Korzyść płynąca z takiego mapowania wiąże się z
faktem, że równanie Schrödingera układu cząstek nieoddziałujących separuje się na równania
jednocząstkowe.
Funkcjonał uniwersalny F [n] układu oddziałującego zapiszemy w postaci:
e2 Z n(r)n(r0 )
F [n] = T0 [n] +
drdr0 + Exc [n],
2
|r − r0 |
(20)
gdzie T0 [n] to energia kinetyczna układu cząstek nieoddziałujących, a Exc [n] jest tzw. energią korelacji-wymiany, zdefiniowaną przez powyższe równanie. Przekształcenie funkcjonału F [n]
ma charakter tożsamościowy (dodanie i odjęcie T0 [n])), pozwala jednak na ulokowanie nieznanej analitycznie części tego funkcjonału w członie Exc [n] mającym charakter energii typowo
kwantowych oddziaływań korelacji i wymiany.
Wariacja funkcjonału energii ze względu na gęstość n[r], z warunkiem ubocznym zachowania liczby cząstek, prowadzi formalnie do takiego samego równania jakie otrzymalibyśmy w
przypadku cząstek nieoddziałujacych:
!
h̄2 ∂ 2
−
+ VSCF (r) ψn (r) = n ψn (r)
2m ∂r2
(21)
z potencjałem efektywnym VSCF (self consistent field):
Z
VSCF (r) = V ext (r) + e2
n(r0 )
dr0 + vxc (r)
|r − r0 |
(22)
gdzie
vxc (r) =
δExc [n]
δn(r)
to potencjał lokalny nazwany potencjałem korelacji-wymiany (eXchange-Correlation).
(23)
3 Podstawy teoretyczne obliczeń it ab initio.
9
Gęstość stanu podstawowego n(r) (będąca gęstością zarówno układu prawdziwego jak i pomocniczego) oraz energia kinetyczna układu nieoddziałującego T0 [n] wyrażają się poprzez obsadzone przez cząstki orbitale Kohna-Shama, ψn (r):
N/2
n(r) = 2
X
|ψn (r)|2
(24)
n=1
XZ
h̄2 N/2
∂ 2 ψn (r)
T0 [n] = −2
ψn∗ (r)
dr
2m n=1
∂r2
(25)
przy czym zakładamy, że układ jest niemagnetyczny i dla elektronów ma miejsce dwukrotna
degeneracja ze względu na spin.
Energię całkowitą układu można obliczać albo z wyrażeń (17) i (20) albo korzystając z
energii własnych Kohna-Shama:
E[n] = 2
n/2
X
n −
n=1
Z
e2 Z n(r)n(r0 )
0
drdr
+
E
[n]
−
n(r)vxc (r)drdr
xc
2
|r − r0 |
(26)
Warto w tym miejscu jeszcze raz zaznaczyć, że choć równania Kohna-Shama są równaniami
typu jednocząstkowego, to ich rozwiązania nie są stanami w sensie przybliżenia cząstek niezależnych. W szczególności, jak widać w powyższym wyrażeniu, energia układu nie jest sumą
energii stanów obsadzonych. Jedynym odniesieniem równań Kohna-Shama do układu rzeczywistego jest uzyskiwana poprzez ich rozwiązanie gęstość stanu podstawowego (oraz energia
całkowita układu, ponieważ przekształcenie hamiltonianu miało charakter tożsamościowy).
Równanie (21) to nieliniowe równanie Schrödingera, w tym sensie, że występujący w równaniu potencjał zależy od jego rozwiązań. Dlatego równie Kohna-Shama rozwiązuje się w sposób samouzgodniony. Od strony formalnej jest to równanie jednocząstkowe co stanowi ogromne
uproszczenie w stosunku do równania wielocząstkowego. Metoda pozwala efektywnie znajdować
gęstość i energię stanu podstawowego układu identycznych cząstek kwantowych, pod warunkiem, że znany jest potencjał korelacji wymiany vxc . Analityczna postać tego potencjału nie
jest znana dlatego stosuje się przybliżenia opisane w rozdziale 3.6.
3.4
Twierdzenie Janaka
Istnieje możliwość rozwiązania zagadnienia wariacyjnego (19) w konstrukcji Kohna-Shama przy
dowolnym wektorze obsadzeń λ. Postać równań Kohna-Shama (21) nie ulega zmianie, jednak
ich rozwiązania (energie i funkcje własne, energia całkowita) stają się funkcjami wektora obsadzeń (n (λ),ψn (λ, r),E(λ)), ponieważ od tegoż wektora zależy gęstość (a zatem i potencjał
samouzgodniony V SCF ):
n(r) =
∞
X
λn |ψn (r)|2
(27)
n=1
gdzie λn przyjmują wartości z zakresu h0, 2i, oraz:
N=
∞
X
λn ,
(28)
n=1
gdzie N jest liczbą cząstek.
Twierdzenie Janaka pokazuje związek pomiędzy energiami własnymi Kohna-Shama przy zadanym wektorze obsadzeń λo a pochodną cząstkową energii całkowitej ze względu na obsadzenia
poziomów:
3 Podstawy teoretyczne obliczeń it ab initio.
10
∂E(λ)
∂λn
n (λo ) =
3.5
!
(29)
λ=λo
Stany wzbudzone
Analiza stanów wzbudzonych w ramach DFT to obszerna dziedzina współczesnych badań teoretycznych (przybliżenie GW, TDDFT - time dependent density functional theory). Teoria zaprezentowana w tym opracowaniu dotyczy przede wszystkim stanu podstawowego niejednorodnego
układu identycznych cząstek kwantowych. Możliwa jest jednak prosta analiza energii wzbudzeń
układu (przynajmniej niektórych) opierająca się na hipotezie, że stanom wzbudzonym odpowiadają całkowite obsadzenia orbitali Kohna-Shama (λn = 1, 2). Jeśli oznaczymy przez λg
wektor obsadzeń stanu podstawowego (λn = 2, dla n = 1, ..., N/2), a przez λe wektor obsadzeń
pewnego stanu wzbudzonego, wówczas energia wzbudzenia:
∆E = E(λe ) − E(λg )
(30)
W szczególności, wzbudzenie jednocząstkowe polegające na inwersji obsadzeń stanów n <
N/2 i m > N/2, reprezentowane przez wektor obsadzeń λmn :
(∆E)mn = E(λmn ) − E(λg )
(31)
Korzystając z twierdzenia Janaka energię takiego wzbudzenia można obliczyć w inny sposób:
Z
(∆E)mn =
=
Z
dE =
∂E
∂E
dλn +
dλm
∂λn
∂λm
Z 1h
n (λ)d(1 − λm ) + m (λ)dλm
0
=
Z 1h
0
!
(32)
i
i
m (λ) − n (λ) dλm
Ostatni wzór jest użyteczny w sytuacji, gdy różnica energii całkowitych jest mniejsza niż
dokładność reprezentacji numerycznej energii całkowitej (czyli w dużych układach) i nie można
zastosować wzoru 31.
3.6
Przybliżenia energii korelacji-wymiany: LDA i GGA.
Historycznie pierwszym i powszechnie stosowanym przybliżeniem energii korelacji-wymiany jest
przybliżenie lokalnej gęstości (LDA - local density approximation). Przyjmuje się, że energia
korelacji-wymiany w układzie niejednorodnym jest lokalnie równa energii korelacji-wymiany
układu jednorodnego, i wyraża się wzorem:
Z
Exc [n] =
xc (n)|n=n(r) n(r)dr,
(33)
gdzie xc (n) jest energią korelacji wymiany na jedną cząstkę w układzie jednorodnym. Potencjał korelacji wymiany przyjmuje wówczas postać:
dxc (n)
vxc [n](r) = xc (n) + n
dn
!
(34)
n=n(r)
Energię xc (n) można podzielić na część korelacyjną i wymienną:
xc (n) = x (n) + c (n).
(35)
4 Przykład: atom.
11
Znana jest dokładna analityczna postać energii wymiany w układzie jednorodnym:
3
(3π 2 n)1/3 ,
(36)
4π
a formuły opisujące energię korelacji c (n) mają charakter przybliżony i opierają się na
parametryzacjach wyników symulacji QMC (Quantum Monte Carlo) (Ref).
Przybliżenie LDA jest najlepsze w granicach dużych gęstości lub gęstości wolno zmiennej
przestrzennie. W praktyce okazało się, że z sukcesem opisuje bardzo szeroką klasę układów, od
pojedynczego atomu do rozmaitych układów wieloatomowych. Znane są obecnie charakterystyczne błędy wyników uzyskiwanych w ramach przybliżenia LDA:
x (n) = −
• znacznie większe (∼ 20%) energie kohezji w kryształach oraz energie wiązań
• zły opis układów silnie skorelowanych, takich jak tlenki metali przejściowych
• mniejsze (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach
• większe (∼ 20%) wielkości związane z własnościami sprężystymi (np. moduły sprężystości
objętościowej w kryształach)
• większe (∼ 5%) częstości oscylacji)
Inne przybliżenie energii korelacji-wymiany to przybliżenie uogólnionych gradientów (GGA
- generalized gradient approximation):
Z
Exc [n] =
xc (n, |∇n(r)|)|n=n(r) n(r)dr,
(37)
w którym zakłada się zależność lokalnej energii korelacji-wymiany xc od gęstości i jej gradientu. Charakterystyczne błędy obserwowane w przybliżeniu GGA to:
• mniejsze od eksperymentalnych (∼ 10%) energie kohezji w kryształach oraz energie wiązań
(∼ 10%)
• większe (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach
• większe (∼ 5%) wielkości związane z własnościami sprężystymi (moduły sprężystości)
4
Przykład: atom.
Atom jest podstawową cegiełką w układach wieloatomowych i jednocześnie najprostszym realnym obiektem fizycznym poddającym się analizie aparatem teoretycznym opisanym w zarysie
w poprzednim rozdziale. Jednocześnie, jego własności fizyczne mają w sposób oczywisty kluczowe wpływ na własności układów złożonych. Bardzo ważny jest więc dobry opis teoretyczny
atomu i dlatego warto poświęcić temu obiektowi nieco uwagi, choć od strony formalnej aparat
zaprezentowany w tym rozdziale ma w dużej części charakter podręcznikowy.
Rozwiązanie numeryczne równań Kohna-Shama dla atomów jest stosunkowo proste. Przy
założeniu symetrii sferycznej układu (spełnionym jedynie w przypadku atomów/jonów o zamknieetych powłokach i beedącym przybliżeniem dla atomów o otwartych powłokach) równania
redukują się do jednego wymiaru (promienia we współrzędnych sferycznych) i mogą być rozwiązywane w reprezentacji położeniowej, poprzez dyskretyzację na siatce radialnej. Poniżej przedstawiony jest sposób rozwiązania dla nierelatywistycznego równania Schrödingera. Rozwiązuje
się także równanie Schrödingera relatywistyczne-skalarne (w przypadku atomów ciężkich,) oraz
relatywistyczne-wektorowe (w przypadku atomów, w których istotne jest oddziaływanie spinorbita).
4 Przykład: atom.
12
W układzie jednostek Hartree (me = h̄ = e = 4π/o = 1) równanie Kohna-Shama ma
postać:
1 2
∇ + V SCF (r) ϕ(r) = εϕ(r)
(38)
2
Jest to zagadnienie własne, którego rozwiązaniem jest zbiór: {ϕi , εi }, a gęstość elektronową
znajdujemy z sumy:
n(r) = Σi λi |ϕi (r)|2 ,
(39)
gdzie liczby obsadzeń {λi = 1, dla i = 1, ..., N ; λi = 0, dla i > N }, a N jest liczbą
elektronów w atomie. Przy założeniu symetrii sferycznej potencjału samouzgodnionego V SCF (r)
równanie (38) można przedstawić we współrzędnych sferycznych:
"
1
− 2
2r
∂
∂
r2
∂r
∂r
!
!
+ L̂
2
#
+V
SCF
(r) ϕ = εϕ,
(40)
gdzie L̂ jest operatorem momentu pędu, zależnym tylko od współrzędnych kątowych, a więc
komutującym z Hamiltonianem. Funkcja falowa ϕ jest iloczynem harmoniki sferycznej Ylm (r̂)
(gdzie r̂ jest kierunkiem w przestrzeni r) będącej funkcją własną operatora momentu pędu,
oraz funkcji radialnej R( r), będącej rozwiązaniem zagadnienia własnego:
"
1 d
d
− 2
r2
2r dr
dr
!
#
l(l + 1)
+
+ V SCF (r) R(r) = εR(r)
r2
(41)
Harmoniki sferyczne indeksowane są liczbami kwantowymi: l - orbitalną, wskazującą na
wartość momentu pędu, oraz m - magnetyczną, określającą rzut momentu pędu na wybraną
oś.
Równanie (41) ulega dalszemu uproszczeniu po dokonaniu podstawienia: R(r) = u(r)/r.
Przyjmuje wówczas postać:
"
#
1 d2
l(l + 1)
−
+
+ V SCF (r) u(r) = εu(r)
2
2 dr
r2
(42)
Jest to formalnie równanie Schrödingera dla cząstki poruszającej się w jednym wymiarze w
potencjale efektywnym: l(l + 1)/r2 + V SCF (r). Nietrudno także pokazać, że z warunku unormowania funkcji ϕ(r) wynika fakt unormowania funkcji u(r). Rozwiązania równania (42): {unl , εnl }
(a więc także {Rnl , εnl }), indeksowane są liczbami kwantowymi: n - główną, określającą energię
własną Kohna-Shama, oraz orbitalną (l), ponieważ od niej zależy efektywny hamiltonian. Jak
widać występuje degeneracja poziomów Kohna-Shama ze względu na liczbę kwantową m. Zakresy zmienności liczb kwantowych n, l, m podlegają znanym regułom: n = 1, 2, ... ; l = 0, ..., (n−1)
; −l ¬ m ¬ l. Liczby kwantowe l nazywa się zwyczajowo, kolejno s, p, d, f, ....
Równanie (42) rozwiązuje się numerycznie, poprzez dyskretyzację na siatce radialnej (stosuje
siee logarytmiczne siatki kilkaset punktów), oraz zastosowanie jednego ze znanych algorytmów
rekurencyjnych, z warunkami brzegowymi u(0) = 0 i R(∞) = 0. Kryterium odnalezienia funkcji
i wartości własnej jest równość pochodnych logarytmicznych rozwiązań uzyskiwanych poprzez
całkowanie rekurencyjne od lewej (u− ) i od prawej (u+ ) strony, w wybranym punkcie rm zwanym
punktem dopasowania (ang. matching point):
d ln(u− )
d ln(u+ )
|r=rm =
|r=rm
(43)
dr
dr
Warunek ten zapewnia gładkie zszycie funkcji u− i u+ w punkcie rm , tzn. równość wartość
funkcji oraz ich pierwszych pochodnych. Rozwiązanie numeryczne równania (38) odbywa się
w sposób samouzgodniony, ponieważ V SCF jest funkcjonałem gęstości. Tzn. po każdym rozwiązaniu zagadnienia własnego (38), według opisanego wyżej schematu, obliczana jest gęstość
5 Pseudopotencjał
13
(39), nowy potencjał V SCF , itd., aż do ustabilizowania się energii całkowitej. Rysunek pokazuje
wyniki obliczeń radialnych funkcji u(r) dla potasu, wykonane programem fhiPP.
Radial Wavefunctions
K 15:58:44 Feb 25 2004 scharoch
2
4s
3p
3s
2p
2s
1s
u(r) (arbitrary scale)
1
0
−1
−2
5
0
1
2
r (bohr)
3
4
Pseudopotencjał
Podstawową ideą pseudopotencjału jest chęć zastąpienia silnego potencjału kulombowskiego
jądra atomowego i silnie związanych z jądrem elektronów rdzenia – słabym (efektywnym) potencjałem jonowym działajacym na elektrony walencyjne.
Potrzeba pseudopotencjału ma naturę techniczną. Wszelkie obliczenia numeryczne (niekoniecznie komputerowe) nieznanej funkcji najczęściej sprowadzają się do rozmaitych metod
przybliżania tejże funkcji poprzez rozwinięcie w szeregi funkcyjne i znalezienie współczynników
rozwinięcia. Wiadomo, że generalnie przybliżenie obciętym szeregiem jest tym lepsze im więcej
jest wyrazów rozwinięcia. Z kolei ilość potrzebnych wyrazów rozwinięcia (dajacych ustalone
odchylenie funkcji aproksymowanej od aproksymującej) jest tym mniejsza im funkcja, aproksymowana szeregiem, jest gładsza. Pole elektrostatyczne generowane przez jądro atomu czyli
energia potencjalna w równaniu Schroedingera jest funkcją osobliwą. Rozwiązania tegoż równania czyli funkcje falowe szybko oscylują w pobliżu jądra i jeśli byśmy chcieli wyrazić je poprzez
wygodne szeregi funkcyjne, musielibyśmy użyć stosunkowo wielu wyrazów rozwinięcia. Odtąd
przyjmiemy, że wszelkie funkcje rozwijamy w szereg trygonometryczny czyli inaczej mówiąc
będziemy operować bazą ”fal płaskich”.
Pseudopotencjał jest konstrukcją, która pozwala ”wygładzić” potencjał kulombowski. Atom
wieloelektronowy, można rzec, składa się z części stałej, która zawsze będzie taka sama i nic
jej, w rozsadnym horyzoncie czasowym, nie ruszy. To jest po pierwsze jądro, ale nie tylko: dochodzą do niego jeszcze tzw. elektrony rdzenia czyli te, które są najbardziej związane z jądrem.
W kontakcie atomu z otoczeniem (czyli w tworzeniu całej różnorodności świata chemicznego
i biologicznego) odgrywają role jedynie elektrony zewnętrzne - walencyjne. Wystarczy więc
zajmować się tylko tymi elektronami zaś resztę atomu traktować jako rdzeń. Jeśli będziemy
w stanie zasymulować działanie rdzenia na elektrony walencyjne i generalnie na wszelkie ob-
5 Pseudopotencjał
14
ce elektrony tak, aby one nie zauważyły że nie mają do czynienia z prawdziwym atomem uzyskamy znaczne uproszczenie zagadnienia obliczeniowego.
Opisywać będziemy elektrony poprzez pseudofunkcje falowe o których zażądamy aby były
identyczne z prawdziwymi funkcjami falowymi na zewnętrz rdzenia atomowego, zaś w obszarze
rdzenia były możliwie gładkie (czyli w całym zakresie zmienności nie miały węzłów). Pseudopotencjał występujący w równaniu Schroedingera i równaniu Poissona powinien dawać właśnie
takie funkcje jako rozwiązania.
5.1
Historia
Pierwsze pseudopotencjały były konstruowane w ramach ideologii o charakterze fenomenologicznym: starano się symulować pewne właściwości rozproszeniowe atomu. Na przykład: zakładano, że pseudopotencjał atomu obcej domieszki w metalu, na zewnątrz pewnej ustalonej kuli
o promieniu rc jest czysto kulombowski, a wewnątrz tej kuli jest po prostu zerem. Następnie
rozwiąywano zagadnienie rozpraszania elektronów przewodnictwa na takich „domieszkach” atomowych i uzyskiwano, w rezultacie złożonych obliczeń, opór elektryczny. Wartość promienia rc
dobierano tak aby otrzymać zgodność obliczonego oporu z wynikiem eksperymentu. Taki pseudopotencjał nazwiemy lokalnym, gdyż pole sił działających na każdy elektron jest takie samo.
Jeśli jednak chcemy, aby pseudopotencjał dawał wartości własne energii (walencyjnych) atomu
takie jak prawdziwy potencjał - to jest to niemożliwe. To znaczy jest niemożliwym zbudowanie
pseudopotencjału lokalnego – funkcji wektora położenia zawierającą pełny opis sił działających
na elektron. Nielokalność pseudopotencjału oznacza, że na to aby wiedzieć jakie pole sił działa
na elektron nie wystarcza znajomość miejsca w którym ten elektron jest, ale potrzebna jest też
pewna inna informacja. Wprowadza się funkcję dwóch zmiennych – pseudopotencjał nielokalny
czyli pewien operator V̂ P S (r, r0 ) zależny od dwóch wektorów położenia.
Jest możliwe zbudowanie pseudopotencjału jako zestawu potencjałów odpowiednio dla każdego typu symetrii funkcji falowych elektronu czyli dla każdej liczby kwantowej l (por. poprzedni
rozdział) – zależnego od jednej zmiennej r i części kątowej drugiej zmiennej Ωr0 . Taki pseudopotencjał, zestaw ”potencjałów”: Vs , Vp , Vd , ..., który jest lokalny względem r = |r| zaś nielokalny
względem zmiennych kątowych będziemy nazywać pseudopotencjałem półlokalnym.
5.2
Psudopotencjał zachowujący normę
Do obliczeń bazujących na teorii funkcjonału gęstości, gdzie gęstość ładunku elektronowego
jest wielkością podstawową, pseudopotencjał zadanego atomu musi być konstruowany dosyć
precyzyjnie:
- wartości własne energii wzorcowego atomu i pseudoatomu muszą się zgadzać,
- funkcje falowe wzorcowego atomu i funkcje pseudofalowe muszą się zgadzać w obszarze na
zewnątrz kuli o zadanym promieniu Rc
- muszą się zgadzać pochodne logarytmiczne w punkcie Rc funkcji falowych wzorcowego
atomu i funkcji pseudofalowych
- całkowity ładunek elektryczny wewnątrz kuli o promieniu Rc musi być jednakowy dla
atomu wzorcowego i pseudoatomu (warunek zachowania normy)
- pochodna po energii pochodnej logarytmicznej w punkcie Rc musi być w obu wypadkach
taka sama
5.3
Generowanie pseudopotencjału
Dla wybranego atomu chcemy skonstruować zestaw funkcji Vs (r), Vp (r), Vd (r), ... który dla walencyjnych stanów s, p, d, ... symulował by tenże atom. W pierwszym kroku rozwiązujemy zagadnienia pojedynczego atomu (patrz poprzedni rozdział). Następnie wydzielamy stany walencyjne,
5 Pseudopotencjał
15
czyli te, które odpowiadają najwyżej położonym poziomom energii. Mając pełnoelektronowy
potencjał efektywny oraz stany walencyjne stosujemy jeden ze schematów konstruowania pośredniego tzw. pseudopotencjału ekranowanego. Tutaj odniesiemy się do schematów Hamanna
[] i Troulliera-Martinsa [].
ps ps
Jeśli wyrazić naszą funkcję pseudofalową jako iloczyn ϕps
lm (r) = [ul (εl ; r)/r]Ylm (Ωr ) to jej
ps ps
część radialna ul (εl ; r) ma być rozwiązaniem (o najniższej energii) równania (42) odpowiadaP S,scr
jącym wartości własnej εps
(r). Jeśli byśmy znali całą
l z pseudopotencjałem ekranowanym Vl
funkcję pseudofalową, to moglibyśmy znależć pseudopotencjał ekranowany poprzez odwrócenie
równania Schrödingera:
Vlps,scr (r) = εps
l −
l(l + 1)
1 d2 ps
+
u .
2 l
r2
2ups
l dr
(44)
Mamy więc pewną dowolność w konstruowaniu pseudopotencjału w obszarze r < rlc . Tutaj
jest miejsce na różne schematy konstruowania. Schemat Hamanna jest schematem „minimalnym” czyli najprostszym spełniajacym wyżej wspomniane wymagania wraz z żądaniem aby
funkcje pseudofalowe nie miały węzłów. Schemat Troulliera-Martinsa wprowadza dodatkowe
wymagania, w szczególności dla zachowania się pseudopotencjału i jego pochodnych w zerze i
w r = rlc . Pseudopotencjał typu Troulliera-Martinsa zgadza się z potencjałem pełnoelektronowym dla r > rlc dokładnie podczas gdy pseudopotencjał Hamanna „zgadza się” w sensie „zbliża
wykładniczo”.
Następnym krokiem konstruowania pseudopotencjału jest tzw. ”odekranowanie”(unscreening)
polegające na tym, że od ekranowanego pseudopotencjału odejmuje się sumę potencjału HarPS
treego i potencjału wymiany-korelacji VHxc
(r) = VHP S (r) + VxcP S (r) określonego dla elektronów
walencyjnych opisanych przez funkcjie pseudofalowe.
Dla dalszych zastosowań wygodnie jest rozdzielić każdy pseudopotencjał Vl na cześć lokalna
(część wspólną, niezależną od l) i składnik nielokalny
(45)
Vl = Vlok + δVl .
Zauważmy że dla r > rlc mamy δVl ≡ 0.
Na koniec zapiszmy nasz pseudopotencjał jako „półlokalny”(semilocal) operator
ps
V̂ SL (r, r0 ) = Vlok
(r)δ(r − r0 ) +
lX
max
l
X
δVlSL (r, r0 )
l=0 m=−l
ps
= Vlok
(r)δ(r − r0 ) +
lX
max
l
X
l=0 m=−l
∗
Ylm
(Ωr )δVlSL (r)
δ(r − r0 )
Ylm (Ωr0 ).
r2
(46)
Powyższe warunki nie determinują „najlepszego” pseudopotencjału dla każdego ustalonego pierwiastke. Jest tu pewna dowolność i ostateczny rezultat zależy od szczegółów jego wykorzystania.
Mamy dwie przeciwne sobie przesłanki: z jednej strony domaganie się dużej dokładności symulacji atomu przez pseudopotencjał i uniwersalności tegoż każe zadawać mały promień obcięcia,
rlc , (wtedy tylko mały obszar w pobliżu rdzenia jest „zafałszowany”). Z drugiej – staramy sie aby
pseudopotencjał był jak najbardziej gładki ponieważ chcemy go przedstawiać poprzez możliwie
mało funkcji bazy (fal płaskich) czyli chcemy jak największego rlc .
Procedura „odekranowania” nie jest całkiem automatyczna. Pseudopotencjał jonowy, który
staramy się skonstruować, to taki, który wraz z dodanym potencjałem Hartreego i potencjałem
wymiany-korelacji da nam pełny pseudopotencjał działający na elektrony walencyjne. Odekranowanie daje nam sumę powyższych trzech potencjałow a także gęstość ładunku i pseudogęstość
walencyjną. Gdyby potencjał wymiany-korelacji był liniową funkcją gęstości elektronowej (a tak
jest w przypadku potencjału Hartreego) wówczas moglibyśmy łatwo wydzielić potencjał jonowy. Niestety potencjał wymiany-korelacji nie jest liniową funkcją ładunku i potrzeba tu korekty
6 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich.
16
zwanej poprawka rdzenia ze względu na nieliniowość – non-linear core-valence correction. Trudność tę omija się zwykle wprowadzając tzw. częściową gęstość rdzenia (partial core density),
typowa postać której jest
(
A sin(Br)
, r < r0 ,
core
r
npartial =
(47)
ncore (r), r > r0 ,
gdzie A i B są określone przez wartość gęstości rdzenia i jej pochodnej w punkcie r0 takim, w
którym ncore jest jeden do dwóch razy większa niż nvalence .
5.4
Uniwersalność (transferability) i twardość (hardness) pseudopotencjału.
Twardym potencjałem określa się sztywny zlokalizowany rdzeń jonowy który można z powodzeniem stosować w rozmaitych otoczeniach innych atomów. Z kolei „zmiękczanie” potencjału
(polegające na zastąpieniu przebiegu o dużej zmienności, np. zawierającego miejsca o dużej
wartości pochodnej – przebiegiem o małej zmienności) pogarszało uniwersalność stosowalności
potencjału czyli pogarszało jego transferability. Te opisowe cechy (pseudo-)potencjału kwantyfikuje się. Twardość opisuje stopień wierności z jaką pseudopotencjał odtwarza zmiany wartości
energii walencyjnych przy zmianach (zaburzeniach) potencjału, ładunku rdzenia czy innych
możliwych do pomyślenia. W sumie tworzenie pseudopotencjału wymaga wielu testów.
5.5
Pseudopotencjał jako separowalny operator
Kleinman i Bylander zauważyli, że można skonstruować separowalny operator pseudopotencjału tzn. taki, że część nielokalna pseudopotencjału δV (46) daje się, z dobrym przybliżeniem,
P
zastąpić przez sumę iloczynów i fi (r)gi (r0 ). Operator zapiszemy w sposób jawny w postaci:
V̂KB = Vlok +
ps
X | ϕps
lm δVl ihδVl ϕlm |
.
(48)
= dr δVl (r)ϕps
lm (r)ψ(r).
(49)
lm
ps
hϕps
lm | δVl |ϕlm i
Funkcja hδVl ϕps
lm | jest operatorem rzutowania:
hδVl ϕps
lm |ψi
Z
Działanie części nielokalnej takiego takiego operatora przedstawia formuła na jego element
macierzowy:
X
1
ps
hψi | δVKB |ψj i =
hψi |δVl ϕps
(50)
ps
ps hδVl ϕlm |ψj i.
lm i
hϕlm | δVl |ϕlm i
lm
ps −1
Korzyść jaką osiągamy w takim ujęciu polega na tym, że współczynniki ElKB = hϕps
lm | δVl |ϕlm i
możemy policzyć raz na początku obliczeń samouzgodnionych; poza tym dla N -elementowej bazy funkcji ψi dla obliczeń (i przechowania w pamięci) elementów macierzowych w przypadku
pseudopotencjału półlokalnego potrzeba około N 2 /2 elementów macierzowych hψi | δ V̂ SL |ψj i
zaś dla postaci separowalnej potrzebna jest ilość operacji rzutowania hδVl ϕps
lm |ψi rzędu N oraz
zwykłe mnożenia. Taki pseudopotencjał w działaniu na stany atomowe (pierwotne rozwiązania
atomowego równania Schrödingera) zachowuje się prawidłowo lecz na stany o innych energiach
może działać gorzej, mianowicie mogą wystąpić fałszywe stany własne hamiltonianu, tzw. „zjawy” (ghost states) co kompletnie psuje prawidłowość obliczeń. Wypracowano procedurę modyfikowania pseudopotencjału taką, która eliminuje „zjawy” a sprowadzająca sie do odpowiedniego
wyboru składnika lokalnego oraz odpowiednich wartości promieni obcięcia rdzenia.
6
Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich.
(W opracowaniu)
7 Dynamika układów atomowych.
7
17
Dynamika układów atomowych.
W rozdziale 2.3 przedstawiono koncepcję powierzchni energii swobodnej. Jest to energia całkowita układu jako funkcja wybranych geometrycznych stopni swobody. Minima tej funkcji
odpowiadają stanom równowagi statycznej, stabilnym (minimum globalne) lub matastabilnym
(minimum lokalne). Jest to podstawowy krok w określeniu możliwych konfiguracji równowagowych. Jednak sytuacja może się zmienić jeśli uwzględni się temperaturę układu. Jak wiadomo
układ minimalizuje wówczas energię swobodną. Potrzebna jest zatem analiza termodynamiki, a ta z kolei musi być poprzedzona analizą dynamiki na poziomie mikro czyli dynamiki
atomów. W przybliżeniu adiabatycznym atomy poruszają się w polu PES, a zatem wyznaczanie sił sprowadza się do obliczania gradientów PES. Wykorzystuje się przy tym twierdzenie
Hellmanna-Feynmana.
7.1
Dynamika Molekularna
Znajomość sił pozwala na symulację dynamiki molekularnej (MD - ’Molecular Dynamics’) poprzez numeryczne rozwiązanie zagadnienia wartości początkowej, i obserwację ewolucji trajektorii atomów w przestrzeni fazowej. Choć od strony ideowej proste, są to obliczenia wymagające
bardzo dużych mocy obliczeniowych. Alternatywą jest opisane dalej przybliżenie harmoniczne.
7.2
Przybliżenie harmoniczne
W przybliżeniu harmonicznym zakłada się, że siły są liniowymi funkcjami wychyleń atomów z
położeń równowagi. Dynamika układu w takim przybliżeniu jest zawsze superpozycją niezależnych oscylacji harmonicznych (modów normalnych). Wektory polaryzacji oraz odpowiadające
im częstości tych oscylacji {An , ωn } znajduje się z rozwiązania zagadnienia własnego:
Φ̂A = ω 2 A
(51)
gdzie

1
2
tot

∂ E (R) 
Mi Mj ∂Ri ∂Rj
Φ̂ = [Φij ] =  q
(52)
jest macierzą dynamiczną układu. Liczba modów normalnych jest równa 3 × NA , gdzie
NA jest liczbą atomów w układzie. W przypadku układów periodycznych, jak kryształ, macierz
dynamiczna redukuje się, dzięki symetrii translacyjnej, do wymiaru 3x liczba atomów w komórce
elementarnej, jednak elementy macierzy (a także jej wektory i wartości własne) są funkcjami
wektora falowego k z I strefy Brillouina (BZ - ’Brillouin Zone’). Mody normalne w takim
przypadku są falami płaskimi charakteryzowanymi przez związki dyspersyjne ω(k).
Wykorzystując twierdzenie Hellmanna-Feynmana uzyskuje się formułę na drugie pochodne
cząstkowe energii całkowitej, potrzebne do konstrukcji macierzy dynamicznej:
Z
∂ 2 E tot (R)
∂Fi
∂n(r, R) ∂V ej (r, R)
=−
=
∂Ri ∂Rj
∂Rj
∂Rj
∂Ri
Z
(53)
∂ 2 V ej (r, R)
∂ 2 V jj (R)
+ n(r, R)
dr +
∂Ri ∂Rj
∂Ri ∂Rj
W formule tej występuje pochodna cząstkowa gęstości elektronowej po współrzędnej atomu ∂n(r, R)/∂Rj , której obliczanie już nie jest niestety tak łatwe jak obliczanie sił. Do jej
wyznaczania w ramach DFT stosuje się teorię liniowej odpowiedzi lub rachunku zaburzeń.
Istnieje też inna metoda wyznaczania macierzy dynamicznej Φ̂, wykorzystująca fakt, że
macierz ta wiąże siły działające na atomy z wychyleniami:
8 Termodynamika układów atomowych.
Fi =
18
X ∂ 2 E tot (R)
j
∂Ri ∂Rj
4(Rj ) =
Xq
Mi Mj Φij 4(Rj )
(54)
j
Wykonując obliczenia ab initio sił działających na atomy dla odpowiedniego zestawu wychyleń i wykorzystując powyższy związek można zbudować układ równań, w którym niewiadomymi
będą elementy macierzy dynamicznej. Uwzględnienie symetrii zwykle znacznie redukuje liczbę
różnych elementów tej macierzy i tak np. dla kryształów o symetrii kubicznej potrzebne jest
tylko jedno wychylenie atomu w wybranym kierunku. Metoda zwana jest metodą bezpośrednią
(Ref).
8
Termodynamika układów atomowych.
8.1
Termodynamika w skali nano
Rozważania prowadzone w tym rozdziale oparte będą na koncepcji zespołu kanonicznego. W ramach tej koncepcji układ będący w równowadze termicznej z termostatem realizuje mikrostany
z prawdopodobieństwem P zależnym tylko od ich energii:
P ∼ exp(−βE)
(55)
gdzie β = 1/(kB T ), kB jest stałą Boltzmana a T temperaturą układu (i termostatu). Czynnikiem normującym prawdopodobieństwa jest 1/Z, gdzie
Z=
X
exp(−βE)
(56)
E
to tzw. funkcja rozdziału (lub suma statystyczna). Jest to podstawowa wielkość w termodynamice statystycznej. Korzystając z relacji:
F =−
ln(Z)
β
(57)
(58)
gdzie F jest energią układu, poprzez związki termodynamiczne można wyznaczyć wszystkie
inne charakterystyki. Można także obliczać wartości średnie pewnych parametrów zależnych od
energii (x(E)), jako wartości oczekiwane (x̂), uzyskując w ten sposób ich zależności temperaturowe (uśrednianie po zespole kanonicznym):
x̂(T ) = hxi = −
1X
x(E) exp(−βE)
Z E
(59)
Często mamy doczynienia z sytuacją gdy z różnych powodów energię w wyrażeniu (56)
można rozseparować, tzn. przedstawić jako sumę pewnych niezależnych składowych. Energię
można rozseparować np. ze względu na stopnie swobody, np.:
• pędowe i konfiguracyjne stopnie swobody w układach klasycznych,
• translacyjne oraz rotacyjne i oscylacyjne stopnie swobody w cząsteczkach,
• oscylacyjne mody normalne w układach wieloatomowych w przybliżeniu harmonicznym,
• w sytuacji, gdy potencjał jest superpozycją potencjału, np. dla 3 kierunków kartezjańskich.
8 Termodynamika układów atomowych.
19
Szczególnym przypadkiem jest sytuacja, gdy układ można podzielić na słabo oddziałujące
podukłady, tzn. gdy ich energia oddziaływania jest mała w porównaniu z energią wzbudzeń
samych podukładów. Przykładem jest tu gaz doskonały, który jest układem słabo oddziałujących identycznych podukładów. Do dalszych rozważań przyjmiemy, że energia separuje się na
pewien składnik Ei i resztę Er :
E = Ei + Er
(60)
Wówczas funkcja rozdziału staje się iloczynem:
Z = Zi Zr
(61)
gdzie
Zi =
X
exp(−βEi )
(62)
exp(−βEr )
(63)
Ei
Zr =
X
Er
oraz, definiując Fi(r) = −
ln(Zi(r) )
,:
β
F = Fi + Fr
(64)
Nietrudno pokazać, że jeśli jakiś parametr układu zależy tylko od energii Ei wówczas uśrednianie po całym zespole kanonicznym upraszcza się do uśredniania po składowej energii Ei :
x̂i (T ) = −
1 X
xi (E) exp(−βEi )
Zi E i
(65)
W takim sensie możemy mówić o termodynamice pojedynczej cząstki w gazie doskonałym (np. o rozszerzalności cieplnej pojedynczego dimera gazu doskonałego) lub termodynamice
pewnego, wybranego stopnia swobody (np. zależności temperaturowej amplitudy wybranego
modu normalnego w krysztale). W takim też sensie można mówić o termodynamice układów
atomowych o rozmiarach rzędu nanometrów, istotnych w nanotechnologiach.
Im mniejszy jest układ, którego termodynamikę w wyżej opisanym sensie chcemy badać,
tym istotniejsze są fluktuacje czyli odchylenia od wartości średniej. Jedną z możliwych miar
fluktuacji jest odchylenie standardowe:
δ(x̂) = [h(x − hxi)2 i]1/2
(66)
W przypadku układów atomowych w nanoskali fluktuacje mają szczególnie istotne znaczenie.
8.2
Koncepcja powierzchni energii swobodnej (FES).
W rozdziale 2.3 opisano koncepcję powierzchni energii potencjalnej (PES) jako funkcji pewnych wybranych geometrycznych stopni swobody, zawierającej informację o stanach równowagi
statycznej a także dynamice układu. Uwzględnienie temperatury może istotnie zmienić własności strukturalne i termodynamiczne układów. Energia swobodna jest wielkością, którą układ
minimalizuje przy braku fizycznych więzów geometrycznych, a także jest punktem wyjścia w
obliczeniach charakterystyk termodynamicznych. Ta funkcja powinna więc być punktem wyjścia wszelkich badań. Wydaje się możliwe uogólnienie koncepcji PES na powierzchnię energii
swobodnej (FES - ’Free Energy Surface’).
Przypuśćmy, że wektor X charakteryzuje uogólnione współrzędne pewnego zestawu zamrożonych (zewnętrznych, usztywnionych, związanych, unieruchomionych) stopni swobody układu.
Mogą to być np.:
8 Termodynamika układów atomowych.
20
• zmienne strukturalne w krysztale (np. długości wektorów prymitywnych i kąty pomiędzy
nimi)
• składowe tensora odkształceń
• wybrane współrzędne atomów, np. kartezjańskie lub wzdłuż wektora polaryzacji wybranego modu normalnego
• wybrane odległości międzyatomowe na powierzchni
• współrzędne planarne atomu adsorbatu na powierzchni
• odległości pomiędzy wybranymi atomami w złożonej cząsteczce
przy czym założymy, że liczba zamrożonych stopni swobody jest znacznie mniejsza od liczby
wszystkich stopni swobody. Energia układu jest sumą energii statycznej Es (X), czyli energii
na powierzchni PES oraz energii związanej z dynamiką względem uwolnionych stopni swobody
Ed (X):
E = Es (X) + Ed (X).
(67)
Funkcja rozdziału przyjmie postać:
Z=
X
exp(−β[Es + Ed )] = exp(−βEs )Zd ,
(68)
Ed
w której wydzielono wkład dynamiczny do funkcji rozdziału Zd .
Energia swobodna, oprócz tego, że jest funkcją temperatury, staje się też funkcją uogólnionych współrzędnych X:
F (T, X) = Es (X) −
1
ln[Zd (T, X)],
β
(69)
którą nazwiemy powierzchnią energii swobodnej (FES). Dwa kolejne gradienty FES względem współrzędnych uogólnionych X:
Pi (T, X) =
∂F (T, X)
∂Xi
(70)
Kij (T, X) =
∂ 2 F (T, X)
∂Xi ∂Xj
(71)
oraz
mają sens odpowiednio uogólnionych sił (naprężeń) oraz stałych sprężystości.
Powierzchnia energii swobodnej wyznaczona z zasad pierwszych może być podstawowym
źródłem informacji o układach z punktu widzenia ich własności strukturalnych. Jej minima
wyznaczają (zależne od temperatury) stany równowagi układów, znikanie drugich pochodnych
może wskazywać na przemianę fazową (utrata stabilności).
Możliwa jest taka sytuacja, że występuje fizyczna przyczyna zamrożenia pewnego stopnia
swobody w układzie, np. powierzchnia kryształu lub cienka warstwa może być naprężona przez
podłoże (kryształ lity). W takim przypadku w stanie równowagi układ minimalizuje energią
swobodną Gibbsa, którą w przypadku uogólnionych współrzędnych X można zdefiniować jako:
G=F−
X
i
Xi Pi
(72)
9 Algorytmy numeryczne.
8.3
21
Metody obliczania funkcji rozdziału.
Znanych jest kilka metod obliczania funkcji rozdziału ab initio lub z wykorzystaniem potencjałów empirycznych. Są to:
• dynamika molekularna
• metoda Monte Carlo (całkowanie po konfiguracyjnych stopniach swobody)
• przybliżenie harmoniczne
W przybliżeniu harmonicznym układ wieloatomowy jest termodynamicznie równoważny
układowi niezależnych oscylatorów harmonicznych, tzn. funkcja rozdziału jest iloczynem funkcji
rozdziału pojedynczego oscylatora:
Z=
Y
Zi
(73)
i
gdzie Zi dla oscylatora kwantowego ma postać:
Zi =
exp(−βh̄ωi /2)
1 − exp(−βh̄ωi )
(74)
a energia swobodna jest sumą energii pojedynczych oscylatorów i energii statycznej całego
kryształu.
F =
X
Fi + Es
(75)
i
9
9.1
Algorytmy numeryczne.
Metoda dynamiki molekularnej Car-Parinello
(w opracowaniu)
9.2
Metoda najszybszego spadku (’Steepest descent’)
(w opracowaniu)
9.3
Metoda gradientów sprzężonych
(w opracowaniu)
9.4
Algorytmy dynamiki molekularnej
(w opracowaniu)
9.5
Szybka transformata Fouriera
Wiemy, że każdą funkcję f (x) ciągłą na odcinku [0, 2π] spełniającą warunek f (0) = f (2π)
można przedstawić jako szereg trygonometryczny:
∞
ao X
+
ak cos kx + bk sin kx
f (x) =
2
k=1
(76)
9 Algorytmy numeryczne.
22
to znaczy pomiędzy funkcją f (x) a ciągiem wspólczynników ak , bk istnieje wzajemnie jednoznaczna odpowiedniość. W jedną stronę określa ją powyższe równanie, zaś w drugą formuły
Eulera-Fouriera:
1 Z 2π
1 Z 2π
ak =
f (x) cos kxdx,
bk =
f (x) sin kxdx.
(77)
π 0
π 0
Funkcje trygonometryczne 1, cos x, sin x, cos 2x, sin 2x, ... cos kx, sin kx, ... tworzą bazę ortogonalną przestrzeni wektorowej funkcyjnej funkcji ciągłych na odcinku [0, 2π] gdzie iloczyn skalarny dwóch funkcji definiuje się jako
(f1 , f2 ) =
Z 2π
0
f1 (x)f2 (x)dx.
(78)
W praktyce obliczeniowej mamy do czynienia raczej z funkcjami określonymi na dyskretnym
zbiorze punktów. Załóżmy, że funkcja f (x) jest zadana poprzez wartości fi w równoodległych
punktach, których jest parzysta ilość równa n:
xj =
2jπ
,
n
fj = f (xj ), j = 0, 1, ...n − 1.
(79)
Można łatwo sprawdzić, że ortogonalność całkowa (78) ma swój odpowiednik w ortogonalności
na dyskretnym zbiorze {xj }, co ostatecznie pozwala przybliżyć naszą stablicowaną funkcję w
postaci wielomianu trygonometrycznego
X
ao n/2−1
wn (x) =
+
(ak cos kx + bk sin kx) + an/2 cos mx
2
k=1
(80)
ze wspólczynnikami
ak =
X
X
2 n−1
2 n−1
f (xj ) cos kxj , bk =
f (xj ) sin kxj .
n j=0
n j=0
(81)
W postaci zespolonej powyższe wzory są następujące:
wn (x) =
n−1
X
ck exp(ikx),
i =+
√
−1
(82)
k=0
X
1 n−1
ck =
f (xj ) exp(−ikxj ).
n j=0
(83)
Metoda szybkiej transformaty Fouriera (FFT,fast Fourier transform) polega na zredukowaniu ilości wykonywanych operacji wyliczania wartości funkcji (w tym wypadku funkcji wykładniczej). Metodę tę przedstawimy dla szczególnego przypadku, tak jak to uczynili jej wynalazcy,
Cooley i Tukey. Rozważmy sytuację w której nasza funkcja oryginalna jest zadana w n punktach
i n jest potęgą dwójki czyli n = 2p . Jeśli oznaczymy
w = exp(−
2πi
),
n
aj =
1 2πj
f(
)
n
n
(84)
to wzór (83) przyjmie postać
ck =
n−1
X
aj wk·j .
(85)
j=0
Widać że po pierwsze wystarczy tylko raz obliczyć wartość funkcji wykładniczej zaś po drugie
– odpowiednie przeprowadzenie operacji wyliczania współczynników grupujące parzyste i nieparzyste wskażniki j pozwala na obliczenie transformaty Fouriera (metodą szybką) przy użyciu
9 Algorytmy numeryczne.
23
2n log2 n działań na liczbach zespolonych co ogromnie zmniejsza czas obliczeń. Obecne algorytmy FFT są nieco bardziej wyrafinowane i obsługują nie tylko przypadek Cooleya-Tukeya, ale
najczęściej przypadek n = 2p × 3q × 5r . Warunkiem zastosowania FFT jest możliwość wyboru
n w postaci iloczynu potęg małych liczb pierwszych.
9.6
Metoda specjalnych punktów k Monkhorsta-Packa
Metoda specjalnych punktów k Monkhorsta-Packa jest metodą całkowania funkcji posiadającej
periodyczność nieskończonej sieci po komórce elementarnej. W obliczeniach ’ab initio’ stosuje
się ją do znajdowania gęstości elektronowej w układach periodycznych. Wyznaczanie gęstosci
wymaga całkowania po I strefie Brillouina kwadratów modułów obsadzonych stanów KohnaShama (oraz sumowania po pasmach energetycznych).
Rozważamy sieć zdefiniowaną poprzez prymitywne translacje:
~ = R1~a1 + R2~a2 + R3~a3
R
(86)
Odpowiadająca jej sieć odwrotna rozpięta jest na wektorach:
~b1 = 2π ~a2 × ~a3 ,
Ω
~b2 = 2π ~a3 × ~a1 ,
Ω
~b3 = 2π ~a1 × ~a2
Ω
(87)
gdzie
Ω = ~a1 · (~a2 × ~a3 )
(88)
jest objętością komórki elementarnej.
Definiujemy ciąg liczb:
2r − q − 1
2q
ur =
r = 1, 2, 3, . . . , q
(89)
gdzie q (naturalne) będzie determinowało liczbę specjalnych punktów k. Wyjściowy zbiór punktów k definiujemy następująco:
~kprs = up~b1 + up~r2 + up~s3
(90)
Otrzymuje się w ten sposów q 3 różnych punktów k, rozmieszczonych równomiernie w strefie
Brillouina.
Definiujemy także:
−1 X
~ ~
eik·R
Am (~k) = Nm 2
(91)
~
|R|=C
m
gdzie sumowanie przebiega po wektorach sieci należących do tej samej gwiazdy (przechodzących
w siebie poprzez operacje symetrii grupy punktowej kryształu), Cm oznacza długość wektorów
z danej gwiazdy i zmienia się w sposów rosnący od C1 = 0, a Nm oznacza liczbę wektorów
należących do danej gwiazdy. Należy zauważyć, że Am (k) są niezmiennicze względem operacji
symetrii grupy punktowej kryształu. Stanowią one także ortogonalną bazę w przestrzeni k :
Z
8π 3
d~kA∗m (~k)A∗n (~k =
δmn
Ω
BZ
(92)
Tak, że dowolną funkcję f (~k), posiadającą symetrię sieci odwrotnej można przedstawić w bazie
Am (~k):
f (~k) =
∞
X
m=1
fm Am (~k)
(93)
9 Algorytmy numeryczne.
24
gdzie
fm =
Ω Z
d~kA∗m (~k)f (~k)
8π 3 BZ
(94)
q
1 X
A∗ (~kprs )A∗n (~kprs )
q 3 p,r,s=1 m
(95)
Rozważmy następującą wielkość:
Smn (q) =
Po podstawieniu do powyższego wyrażenia definicji (??) można je przekształcić do postaci:
1
Smn (q) = (Nm Nn )− 2
Nn Y
Nm X
3
X
Wjab (q)
(96)
a=1 b=1 j=1
gdzie:
Wjab (q)
q
π
b
a
1X
=
e( q )(2r−q−1)(Rj −Rj )
q r=1
(97)
We wzorze (96) sumowanie po a i b odbywa się po wszystkich wektorach należących do
gwiazd odpowiednio m i n. Wyrażenie Wjab może przyjmować następujące wartości:
Wjab (q)
=


 1


q+1
(−1)
0
dla |Rjb − Rja | = 0, 2q, 4q, . . .
dla |Rjb − Rja | = q, 3q, 5q, . . .
dla |Rjb − Rja |
inne
(98)
Należy pamiętać, że q oraz Rja to liczby całkowite. Nałożymy następnie ograniczenie:
q
|Rja | < ,
2
Co prowadzi do:
q
|Rjb | < ,
2
j = 1, 2, 3
(99)
Wjab (q) = δ(Rja , Rjb )
(100)
Smn = δmn
(101)
a z zależności (96):
Oznacza to, że wszystkie funkcje Am (~k), które spełniają warunek (99) są ortonormalne na
dyskretnym zbiorze punktów kprs w I strefie Brillouina. Liczba tych funkcji jest tym większa
im większa jest liczba q.
Wykorzystanie symetrii punktowej sieci prowadzi do znacznego zredukowania sumy we wzorze (95):
(q)
1 PX
Smn (q) = 3
wj A∗m (~kj )An (~kj )
(102)
q j=1
gdzie P (q) jest zależną od symetrii liczbą punktów kj , ze zbioru {kprs } znajdujących się w nieredukowalnej części strefy Brillouina, a wj jest współczynnikiem wagowym równym stosunkowi
rzędu pełnej grupy symetrii do rzędu grupy wektora falowego kj . Inaczej mówiąc, ponieważ
operacje symetrii punktowej nie zmieniają wartości wyrazów w szeregu (95), sumowanie po
wektorach ze zbioru {kprs }, różnych lecz związanych operacjami symetrii punktowej, można
zastąpić mnożeniem przez czynnik wj .
Przypuśćmy, że chcemy całkować pewną funkcję f (~k), która jest całkowicie symetryczna
i periodyczna w przestrzeni k. Jak pokazano już wcześniej może ona być formalnie rozwinięta
w bazie Am (~k):
f (~k) =
∞
X
m=1
fm Am (~k)
(103)
10 Przykłady zastosowania koncepcji PES i FES
25
gdzie, z powodu ortogonalności Am (~k) w strefie Brillouina,
fm =
Ω Z
d~kA∗m (~k)f (~k)
8π 3 BZ
(104)
Całka f (~k) po całej strefie Brillouina jest związana z pierwszym współczynnikiem rozwinięcia:
Z
8π 3
d~kA∗m f (~k) =
f1
Ω
BZ
(105)
Jeśli rozwinięcie (103) ograniczymy do gwiazd spełniających warunek (99), czyli reprezentację funkcji f (~k) ograniczymy do jej rzutu na przestrzeń rozpietą na gwiazdach spełniających
warunek (99), to wartości współczynników fm dane są znacznie prostszą zależnością:
(q)
1 PX
f¯m =
wj f (~kj )Am (~kj )
q j=1
(106)
Współczynniki te oczywiście różnią się od dokładnych, z powodu ograniczenia przestrzeni.
Otrzymujemy w ten sposób przybliżoną reprezentację funkcji f (~k):
f¯(~k) =
NG
X
f¯m Am (~k)
(107)
m=1
gdzie NG jest liczbą gwiazd spełniających warunek (99).
Całkowanie po I strefie Brillouina funkcji f (~k), jak w (105), z wykorzystaniem reprezentacji
(107) będzie obarczone błędem:
Z
εBZ =
gdzie
(
Sm1 (q) =
10
BZ
d~k[f (~k) − f¯(~k)] =
(−1)
0
X
1
fm Nm2 Sm1 (q)
(108)
m>1
q−1
(R1 +R2 +R3 )
q
3
dla R1 −R
= integer
q
dla innych
(109)
Przykłady zastosowania koncepcji PES i FES
A. Kryształ.
Najprostszym i znanym przypadkiem zastosowania koncepcji powierzchni energii swobodnej
jest przybliżenie kwaziharmoniczne dla kryształu, w którym związanym stopniem swobody jest
objętość, a dynamika i termodynamika układu traktowana jest w przybliżeniu harmonicznym.
Ciśnienie jest uogólnioną siłą a moduł sprężystości objętościowej uogólnioną stałą sprężystości.
Położenie minimum FES zależy od temperatury i opisuje rozszerzalność termiczną kryształu.
Z kolei znikanie drugiej pochodnej po objętości (moduł sprężystości objętościowej dążący do
zera) oznacza utratę stabilności mechanicznej (przegrzanie, stan bliski topnieniu).
B. Powierzchnia.
Przykłady PES.
C. Atom adsorbatu.
Dyskusja.
Literatura
[1] P. A. M. Dirac. Proc.Roy.Soc (London), 123:714.
10 Przykłady zastosowania koncepcji PES i FES
26
[2] M. C. Payne, M. P. Teter, D. C. Allan, T. A. Arias, and J. D. Joannopoulos. Rev. Mod.
Phys., 64:1045, 1992.
[3] P. Hohenberg and W. Kohn. Phys.Rev.Lett., 48:1425, 1965.
[4] W. Kohn and L. J. Sham. Phys. Rev., 140:A1133, 1965.
[5] R. Car and M. Parrinello. Phys. Rev. Lett., 55:2471, 1985.
[6] A.Oganov. http://olivine.ethz.ch/, 2004.
[7] X. Gonze, J.-M. Beuken, R. Caracas, F. Detraux, M. Fuchs, G.-M. Rignanese, L. Sindic,
M. Verstraete, G. Zerah, F. Jollet, M. Torrent, A. Roy, M. Mikami, Ph. Ghosez, J.-Y. Raty,
and D.C. Allan. Computational Materials Science, 25:478–492, 2002.