Metody obliczeniowe ab initio w fizyce struktur atomowych
Transkrypt
Metody obliczeniowe ab initio w fizyce struktur atomowych
Metody obliczeniowe ab initio w fizyce struktur atomowych Paweł Scharoch, Jerzy Peisert (skrypt w opracowaniu) Spis treści 1 2 2.1 2.2 2.3 2.4 2.5 3 3.1 3.2 3.3 3.4 3.5 3.6 4 5 5.1 5.2 5.3 5.4 5.5 6 7 7.1 7.2 8 8.1 8.2 8.3 9 9.1 9.2 9.3 9.4 9.5 9.6 10 Wstęp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teoria podstawowa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Równanie Schrödingera dla izolowanego układu atomów. . . . . . . . . . . . . . Przybliżenie Borna-Oppenheimera. . . . . . . . . . . . . . . . . . . . . . . . . . Powierzchnia energii potencjalnej. . . . . . . . . . . . . . . . . . . . . . . . . . . Stany równowagi statycznej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana . . . . . . . . . . . . Podstawy teoretyczne obliczeń it ab initio. . . . . . . . . . . . . . . . . . . . . . Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT). Twierdzenie Hohenberga-Kohna. . . . . . . . . . . . . . . . . . . . . . . . . . . . Równania Kohna-Shama. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Twierdzenie Janaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stany wzbudzone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Przybliżenia energii korelacji-wymiany: LDA i GGA. . . . . . . . . . . . . . . . Przykład: atom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pseudopotencjał . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Historia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Psudopotencjał zachowujący normę . . . . . . . . . . . . . . . . . . . . . . . . . Generowanie pseudopotencjału . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uniwersalność (transferability) i twardość (hardness) pseudopotencjału. . . . . . Pseudopotencjał jako separowalny operator . . . . . . . . . . . . . . . . . . . . . Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. . . Dynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . . . . . Dynamika Molekularna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Przybliżenie harmoniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Termodynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . . Termodynamika w skali nano . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koncepcja powierzchni energii swobodnej (FES). . . . . . . . . . . . . . . . . . . Metody obliczania funkcji rozdziału. . . . . . . . . . . . . . . . . . . . . . . . . Algorytmy numeryczne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Metoda dynamiki molekularnej Car-Parinello . . . . . . . . . . . . . . . . . . . . Metoda najszybszego spadku (’Steepest descent’) . . . . . . . . . . . . . . . . . Metoda gradientów sprzężonych . . . . . . . . . . . . . . . . . . . . . . . . . . . Algorytmy dynamiki molekularnej . . . . . . . . . . . . . . . . . . . . . . . . . . Szybka transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . Metoda specjalnych punktów k Monkhorsta-Packa . . . . . . . . . . . . . . . . . Przykłady zastosowania koncepcji PES i FES . . . . . . . . . . . . . . . . . . . 1 2 3 3 4 4 5 5 5 5 6 6 8 8 8 9 11 12 12 12 13 13 14 14 14 14 15 15 16 17 18 18 18 18 18 18 19 21 1 Wstęp. 1 2 Wstęp. W 1929 roku Paul Dirac pisał [1]: ”...The underlying physical laws necessary for the mathematical theory of a large part of physics and the whole of chemistry are thus completely known and the difficulty is only that the exact application of these laws leads to equations much too complicated to be soluble”, wskazując, że chociaż matematyczne podstawy mechaniki kwantowej zostały poznane, to jednak techniczne trudności obliczeniowe związane z rozwiązywaniem odpowiednich równań są nie do pokonania. Z tego powodu, na przestrzeni dziesięcioleci, własności fizyczne układów atomowych były teoretycznie badane głównie w oparciu o podejście modelowe. Podejście takie pozwala zrozumieć mechanizmy zjawisk, jednak odniesienie do eksperymentu odbywa się zawsze poprzez parametry dopasowania. W dobie rozwoju nowoczesnych technologii informacja uzyskiwana tą drogą jest niewystarczająca. Nie chodzi bowiem już tylko o jakościowe zrozumienie zjawiska, ale także o precyzyjne, czysto teoretyczne przewidywania ilościowe. Tendencję taką obserwuje się niemal we wszystkich dziedzinach nauk przyrodniczych, a zwłaszcza (choć nie tylko) na ich styku z naukami inżynierskimi: zapotrzebowanie na dokładne, teoretyczne dane ilościowe. Czy trajektoria zauważonej, zbliżającej się do Ziemi asteroidy przetnie się z trajektorią naszej planety? Czy huragan, który tworzy się nad Wyspami Karaibskimi dotrze do Florydy? Czy amortyzator o założonej konstrukcji będzie dobrze pracował w superszybkiej kolei? Czy dana konstrukcja anteny nadawczej zapewni odpowiednią charakterystykę promieniowania? Czy pole fali radiowej rozproszonej przez dźwig budowlany nie stworzy zagrożenia dla ludzi pracujących w sąsiedztwie? Takich przykładów w dzisiejszej nauce i technice znajdziemy dziesiątki. Odpowiedzi na takie i podobne pytania nie można uzyskać rozwiązując proste modele. Potrzebne są obliczenia numeryczne dużej skali oparte na podstawowych teoriach fizycznych. Dziedzina będąca przedmiotem zainteresowania niniejszej pracy to fizyka struktur atomowych, w szczególności struktur wykorzystywanych w nanotechnologiach (nanostruktur). Nanostruktury atomowe są to układy o charakterystycznych rozmiarach rzędu nanometrów, czyli, powiedzmy od kilku do kilkudziesięciu tysięcy atomów. Własności fizyczne takich układów są zdeterminowane przez ich konfiguracje geometryczne i elektronowe. W rozważaniach modelowych można zakładać takie czy inne konfiguracje atomów jednak natura narzuca swoje rozwiązania, uzależnione od budowy pojedynczych cegiełek-atomów oraz skomplikowanych oddziaływań w układzie. Używa się określenia struktury samoorganizujące się (ang.: self assembling structures). W tej sytuacji możliwość teoretycznego przewidywania budowy struktur, bez odniesień eksperymentalnych (których zresztą często po prostu nie ma) staje się niezbędna. Po pierwsze dlatego, że eksperyment technologiczny jest bardzo kosztowny i po drugie przewidywania teoretyczne mogą dać odpowiedź na pytanie czy założona struktura może w ogóle istnieć. Z pomocą przychodzą rozwijające się intensywnie od czterech dziesięcioleci metody obliczeniowe ab initio [2]. W połowie lat 60-tych, na gruncie mechaniki kwantowej powstaje Teoria Funkcjonału Gęstości (DFT-Density Functional Theory) [3, 4], która tworzy podstawy numerycznych obliczeń energii całkowitej oraz rozkładu gęstości elektronowej w układach wieloatomowych. Powstanie teorii splata się z rozwojem techniki komputerowej i tworzeniem efektywnych algorytmów obliczeniowych, takich jak algorytm szybkiej transformaty Fouriera (FFT - Fast Fourier Transform) czy iteracyjne metody diagonalizacji macierzy (metoda dynamiki molekularnej Car-Parrinello [5]). Dzięki rozwojowi tych trzech elementów: teorii, metod obliczeniowych (algorytmów), oraz techniki komputerowej, metody obliczeniowe ab initio stały się potężnym narzędziem badawczym, odnoszącym wielkie sukcesy. Można obecnie analizować układy zawierające do kilkuset atomów, co w połączeniu z periodycznymi warunkami brzegowymi i/lub metodami hybrydowymi prowadzi już do bardzo szerokiej klasy układów poddających się takiej analizie, a otrzymywane wyniki pozostają zwykle w bardzo dobrej zgodności z eksperymentem. Historycznie najwcześniejszym, wywodzącym się z chemii kwantowej, oraz nadal głównym 1 Wstęp. 3 zastosowaniem metod ab initio są badania strukturalne. Obserwuje się dwa główne nurty takich badań. Są to: badania materiałowe, w szczególności dla warunków ekstremalnych ciśnień i temperatur (n.p. mineralogia układu słonecznego [6]), oraz badania dla potrzeb nanotechnologii. Obydwa nurty stosują podobne metody badawcze, różnią się jedynie rodzajem badanych układów. Klasa układów atomowych stosowanych w nanotechnologiach jest bardzo szeroka. Znajdą się tu zarówno lity kryształ (będący często podłożem dla nanoukładów) jak i granica faz (stała-próżnia, stała-ciekła, stała-stała), a także obiekty zlokalizowane w kryształach i na granicach faz (domieszki czy defekty strukturalne). Tematyka obejmuje zatem np. zagadnienia geometrii równowagowych i przejść fazowych w kryształach litych, czystą powierzchnię kryształu z całym bogactwem zjawisk strukturalnych (rekonstrukcja), zjawiska adsorpcji i dyfuzji powierzchniowej, zagadnienia wzrostu kryształów i cienkich warstw, oraz wiele innych. Struktury typowe dla nanontechnologii to cienkie warstwy, druty kwantowe, kropki kwantowe oraz kombinacje tych struktur. W kontekście zastosowań technicznych wyłaniają się dwie grupy problemów. Pierwszy to technologia wytwarzania takich struktur i drugi ich własności fizyczne w tym struktura geometryczna i elektronowa (n.p. problem stabilności). Metody obliczeniowe ab initio okazują się być nieocenionym narzędziem na etapie projektowania struktur oraz projektowania technologii ich wytwarzania. Energia całkowita układu jako funkcja wybranych parametrów geometrycznych nazywana jest powierzchnią energii potencjalnej, E P ES (PES - ’Potential Energy Surface’). Znajomość tej funkcji oraz jej dwóch kolejnych gradientów względem parametrów geometrycznych okazuje się być kluczowa przy badaniu własności strukturalnych układów atomowych. Znajomość funkcji E P ES pozwala także badać dynamikę układów i, w kolejnym kroku, termodynamikę, a więc włączyć temperaturę do badań strukturalnych, wyznaczać charakterystyki termodynamiczne, zależności temperaturowe konfiguracji geometrycznych, badać strukturalne przejścia fazowe, itp. Wreszcie, jako wynik obliczeń uzyskuje się gęstość elektronową stanu podstawowego, mierzalną wielkość fizyczną, będącą podstawową wielkością w teorii funkcjonału gęstości (DFT - Density Functional Theory). Znajomość gęstości elektronowej oraz zmian tej gęstości pod wpływem różnych czynników fizycznych pozwala wniknąć w naturę wiązań w układach i szukać uzasadnienia zjawisk strukturalnych. Należy dodać, że w ramach DFT i przybliżenia adiabatycznego można także badać odpowiedź układu na wolnozmienne w czasie (adiabatyczne) pobudzenia zewnętrzne (pole elektromagnetyczne, czynniki mechaniczne itp.). Na przykład kod ABINIT [7], wykorzystywany w części praktycznej niniejszej pracy, umożliwia obliczanie różnych funkcji odpowiedzi układu, które są drugimi pochodnymi energii całkowitej ze względu na różne zaburzenia. Obecnie uwzględnione są zaburzenia nastepujących typów: (1) fonony, (2) statyczne (adiabatyczne) pole elektryczne i (3) naprężenia mechaniczne. Własności fizyczne związane z zaburzeniami (1) i (2) opisywane są przez fononową macierz dynamiczną, tensor dielektryczny oraz ładunek efektywny Borna, natomiast dodatkowe zaburzenie w postaci naprężenia (3), w połączeniu z fononami i polem elektrycznym prowadzi do stałych sprężystych, naprężeń wewnętrznych oraz parametrów piezoelektrycznych. W ostatnich latach prowadzone są też intensywne poszukiwania teoretyczne efektywnych metod badania elektronowych stanów wzbudzonych w ramach DFT. Metody ab initio stosuje się więc również do badania odpowiedzi układów na wysokoczęstościowe pobudzenia zewnętrzne, choć są to w chwili obecnej obliczenia wymagające ponadprzeciętnych zasobów komputerowych. Stosunkowo najwięcej kłopotów sprawia zakres częstości ”średnich”, przy których konieczne jest wyjście poza przybliżenie adiabatyczne (Borna-Oppenheimera). Praca niniejsza będzie poświęcona głównie zagadnieniom strukturalnym z uwzględnieniem niskoczęstościowych czynników zewnętrznych. 2 Teoria podstawowa. 2 4 Teoria podstawowa. 2.1 Równanie Schrödingera dla izolowanego układu atomów. Jako punkt wyjścia opisu fizyki struktur atomowych przyjmuje się nierelatywistyczny hamiltonian izolowanego układu atomów: Ĥ = T̂ e + T̂ Z + Û ee + Û eZ + Û ZZ gdzie: T̂ e = − h̄ X 2 ∇, 2me i i Û eZ = X i,k T̂ Z = − X i h̄ ∇2 , 2Mi i 2 Zi e , |ri − Rk | Û ZZ Û ee = (1) 1 X e2 , 2 i6=j |ri − rj | 1 X Zi Zk e2 = , 2 i6=k |Ri − Rk | to operatory odpowiednio: energii kinetycznej elektronów, energii kinetycznej jąder, oraz energii potencjalnych oddziaływań elektrostatycznych elektron-elektron, elektron-jądro i jądrojądro, a Mi i Zi oznaczają odpowiednio masy i liczby atomowe atomów tworzących układ. Stany i energie własne układu są rozwiązaniami stacjonarnego równania Schrödingera: ĤΨs (r, R) = Es Ψ(r, R), (2) gdzie Ψs (r, R) jest wielociałową funkcją falową układu zależną od elektronowych (w tym spinowych) (r) i jonowych (R) stopni swobody, Es opisuje energię całkowitą tego układu, a s indeksuje rozwiązania równania. Ten podstawowy opis jest także punktem wyjścia teoretycznej analiz odpowiedzi układu na różnego rodzaju oddziaływania zewnętrzne (mechaniczne, elektromagnetyczne, zależne bądź niezależne od czasu), ponieważ zwykle traktuje się je jako zaburzenie hamiltonianu (1) i stosuje rachunek zaburzeń. Pierwszym przykładem takiego podejścia, a zarazem fundamentalnym przybliżeniem stosowanym w teorii struktur atomowych jest przybliżenie Borna-Oppenheimera (adiabatyczne) opisane krótko w następnym rozdziale. 2.2 Przybliżenie Borna-Oppenheimera. Pierwszym przybliżeniem jakie się stosuje jest przybliżenie Borna-Oppenheimera (adiabatyczne) wykorzystujące fakt dużej różnicy między masą jądra atomowego a masą elektronu (od 3 do 5 rzędów wielkości). W ramach tego przybliżenia równanie Schrödingera (2) separuje się na dwa równania, które mogą być rozwiązywane niezależnie (choć sprzężone są poprzez jonowe stopnie swobody). Są to: Ĥ e ψ(r) = E(R)ψ(r), (3) równanie dla układu elektronowego, w którym jonowe stopnie swobody (R) pełnią rolę parametrów, oraz Ĥ BO φ(R) = E tot φ(R), (4) równanie dla układu jonów. W powyższych równaniach Ĥ e jest hamiltonianem układu elektronowego: Ĥ e = T̂ e + V̂ ee + V̂ ej a Ĥ BO hamiltonianem układu jonów: (5) 2 Teoria podstawowa. 5 Ĥ BO = T̂ j + V̂ jj + E(R), (6) do którego, jak widać, wchodzi zależna od R energia układu elektronowego. Elektronowa i jonowa funkcje falowe to odpowiednio ψ(r) i φ(R). Opisana wyżej procedura formalnie polega na przedstawieniu funkcji Ψ w równaniu (2) w postaci iloczynu funkcji ψ(r) i φ(R) oraz pominięciu małych (w sensie wartości oczekiwanej) składowych energii całkowitej układu. Fizycznie przybliżenie to oznacza, że układ elektronowy dopasowuje się w sposób natychmiastowy do konfiguracji jonów. Konsekwencją tego przybliżenia jest w szczególności ograniczenie możliwości uwzględniania pobudzeń zewnętrznych tylko do niskich częstości (porównywalnych z częstościami charakterystycznymi dla układu jonów) oraz wysokich częstości (przy których układ jonowy nie reaguje na pobudzenie). 2.3 Powierzchnia energii potencjalnej. Zagadnienie dynamiki układu jonowego można z bardzo dobrym przybliżeniem rozwiązywać klasycznie, rozwiązując np. równania Newtona. Rolę energii potencjalnej pełnią: energia oddziaływania jon-jon oraz sparametryzowana położeniami jonów energia układu elektronowego (patrz równie 6). Jest to jednocześnie energia całkowita układu E tot w wyrażeniach (2) i (4), w sytuacji statycznej (unieruchomionych jonów). Tak określona energia potencjalna jest więc w ogólności funkcją jonowych stopni swobody. Na poziomie ’mikroskopowym’ będą to współrzędne jonów, istnieje jednak możliwość przesunięcia części stopni swobody układu na poziom mezoskopowy (i makroskopowy) w postaci np. objętości, pola powierzchni, zmiennych strukturalnych (definiujących komórkę elementarną w krysztale), czy składowych tensora odkształceń. Funkcja ta nazywana jest powierzchnią energii potencjalnej (PES) i stanowi kluczową charakterystykę układu z punktu widzenia własności strukturalnych i materiałowych. Ważne są także dwa kolejne gradienty PES ze względu na jonowe stopnie swobody reprezentujące uogólnione siły oraz uogólnione stałe elastyczne. I tak, na poziomie mikroskopowym: ∂E tot (R) Fi = − (7) ∂Ri to siły działające na jony (indeks i identyfikuje jednocześnie jon i współrzędną, np. kartezjańską). Drugi gradient: ∂Fi ∂ 2 E tot (R) =− ∂Rj ∂Ri ∂Rj (8) określa w tym wypadku macierz stałych siłowych, wykorzystywaną w przybliżeniu harmonicznym (patrz rozdział 7.2). Na poziomie mezoskopowym, np. przy objętości traktowanej jako stopień swobody, otrzymujemy ciśnienie i moduł sprężystości objętościowej (bulk modulus): P =− ∂E tot (V ) ∂V (9) ∂P (V ) ∂ 2 E tot (V ) B=V = −V (10) ∂V ∂V 2 Jeśli stopniem swobody będzie pole powierzchni (lub wymiar liniowy) wówczas kolejne pochodne to napięcie powierzchniowe (liniowe) i moduł sprężystości powierzchniowej (liniowej). Z kolei jako wynik kolejnych pochodnych energii całkowitej po składowych tensora odkształceń otrzymamy tensor naprężeń oraz tensor sprężystości. 3 Podstawy teoretyczne obliczeń it ab initio. 2.4 6 Stany równowagi statycznej. Minima lokalne lub globalne PES wyznaczają stany równowagi układów zwane równowagą statyczną (static equilibrium). Nie jest to do końca stan odpowiadający temperaturze zera bezwzględnego gdyż nie uwzględnia się tu drgań zerowych atomów. W przykładach podanych w poprzednim podrozdziale stan równowagi statycznej określa np. położenia atomów, na poziomie mikroskopowym. Na wyższych poziomach będzie to np. objętość równowagowa, równowagowa struktura krystaliczna. Jeśli minimum PES ma charakter lokalny wówczas mamy doczynienia ze stanem metastabilnym a więc możliwe jest przejście układu do minimum globalnego, aktywowane np. temperaturą. Warunkiem równoważnym minimum PES jest warunek zerowania się sił lub sił uogólnionych (zerowanie pierwszych pochodnych). Zerowanie się drugich pochodnych oznacza brak dobrze określonego minimum PES, co może oznaczać brak stabilności układu. Interesującym przypadkiem PES na poziomie mikroskopowym jest atom adsorbatu na powierzchni kryształu. Jeśli płaszczyzna XY kartezjańskiego układu współrzędnych pokrywa się z płaszczyzną powierzchni wówczas PES jest dwuwymiarową funkcją współrzędnych x i y atomu (zakłada się, że atom zawsze pozostaje w minimum PES ze względu na trzeci stopień swobody, współrzędną z). Wyznaczona w ten sposób PES pozwala na określanie położeń stabilnych i metastabilnych atomów na powierzchni, określanie prawdopodobieństw przejść z jednych położeń do drugich oraz na analizę dyfuzji powierzchniowej. Bardzo istotnym parametrem, od którego zależą na własności strukturalne układów atomowych, jest temperatura. Jej uwzględnienie wymaga analizy termodynamiki układów. Możliwe wydaje się uogólnienie koncepcji powierzchni energii potencjalnej na koncepcję powierzchni energii swobodnej (FES - free energy surface). Zagadnieniu temu będzie poświęcony jeden z kolejnych rozdziałów. 2.5 Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana Twierdzenie Hellmanna-Feynmana mówi, że jeśli energia Eλ jest wartością oczekiwaną pewnego hamiltonianu Hλ , zależnego od parametru λ, to pochodna tej energii po parametrze λ jest równa wartości oczekiwanej pochodnej hamiltonianu Hλ po tym parametrze: ∂Eλ ∂Hλ = hψλ | |ψλ i ∂λ ∂λ Stąd siła Fi działająca na atom (52): Fi = − ∂E tot (R) ∂H BO (R) = −hψ(R)| |ψ(R)i, ∂Ri ∂Ri (11) (12) i ostatecznie: Z Fi = − n(r, R) ∂V jj (R) ∂V ej (r, R) dr − , ∂Ri ∂Ri (13) gdzie n, V ej , V jj to odpowiednio: gęstość elektronowa, energia oddziaływania elektron-jon i energia oddziaływania jon-jon, jak w rozdziale 2.3. 3 3.1 Podstawy teoretyczne obliczeń it ab initio. Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT). Jak pokazano w poprzednim rozdziale, w badaniach teoretycznych własności strukturalnych układów atomowych kluczową rolę odgrywa powierzchnia energii potencjalnej (PES) definiowana jako energia całkowita układu przy zamrożonych jonowych stopniach swobody: 3 Podstawy teoretyczne obliczeń it ab initio. 7 E tot = V jj + E(R) (14) Obliczenia numeryczne pierwszego składnika w tym wyrażeniu (energii kulombowskiego oddziaływania jonów) są proste od strony ideowej. Trudności techniczne związane z faktem, że oddziaływanie kulombowskie jest dalekozasięgowe pokonuje się stosując technikę Ewalda (Ref). Drugi składnik to energia całkowita układu elektronowego. Jest to znane w mechanice kwantowej zagadnienie układu cząstek identycznych, samo w sobie złożone i będące obiektem oddzielnej dziedziny badań teoretycznych. W przypadku układów atomowych mówimy o niejednorodnym gazie elektronów (fermionów). Podstawy teoretyczne analizy fizyki takich układów były znane już w końcu lat 20 XX wieku (Ref), jednak rozwiązanie równań okazało się technicznie niemożliwe (warto przypomnieć, że nawet klasyczny układ tylko trzech cząstek jest w ogólności nierozwiązywalny analitycznie). W latach 50 rozpoczęła się rewolucja w dziedzinie technik obliczeniowych, która trwa do dzisiaj i wydaje się, że jej końca ciągle nie widać. Jednak i przy obecnym stanie rozwoju komputerów, przecież imponującym, numeryczne rozwiązanie równania Schrödingera nawet dla układu 10 elektronów (np. atom neonu) jest niemożliwe. Na przykład pamięć potrzebna na zapisanie funkcji falowej takiego układu w reprezentacji położeniowej, na siatce 10-punktowej, jest rzędu 4 × 1030 bytów. Gdyby więc chcieć zapisać taką funkcję na płytkach CD o pojemności 1Gb każda to potrzeba by 1021 takich płytek. Zakładając, że jedna płytka waży 10 gramów potrzebujemy 1016 ton płytek, a to dopiero początek układu okresowego i każdy następny atom to o 3 rzędy wielkości więcej potrzebnej pamięci ! Sytuacja wydaje się beznadziejna, jednak z pomocą przychodzi teoria funkcjonału gęstości (DFT - ’Density Functional Theory’), której podstawy zostały sformułowane w latach 60 poprzedniego stulecia (Ref). Teoria ta pozwala efektywnie rozwiązywać zagadnienie układu identycznych cząstek kwantowych poprzez rozwiązywanie jednocząstkowego równania typu Schrödingera, a centralnym problemem teorii jest adekwatna reprezentacja kwantowego oddziaływania korelacji-wymiany. 3.2 Twierdzenie Hohenberga-Kohna. Podstawą opisu układu cząstek identycznych w zewnętrznym potencjale V ext (niejednorodnego gazu cząstek) w teorii funkcjonału gęstości jest ich gęstość: Z n(r) = N |ψ(r, r2 , . . . , rN )|2 dr2 . . . drN (15) normowana do liczby cząstek: Z N= n(r)dr (16) Jest to funkcja rzeczywista współrzędnej przestrzennej (3 zmiennych) zatem znacznie prostsza od funkcji falowej. Punktem wyjścia teorii jest, sformułowane w 1964 roku, twierdzenie Hohenberga-Kohna (Ref): • Energia układu kwantowych cząstek cząstek identycznych jest funkcjonałem gęstości: Z E[n] = F [n] + n(r)V ext (r)dr, (17) gdzie F [n] = hψ|T̂ + Ŵ |ψi, a Ŵ jest energią kulombowskiego oddziaływania cząstek (18) 3 Podstawy teoretyczne obliczeń it ab initio. 8 • gęstość stanu podstawowego nG minimalizuje funkcjonał (17): δE EG [nG ] = min E[n] ⇒ = 0, n→nG δn n=nG (19) co jest oczywistą konsekwencją zasady wariacyjnej Rayleigha-Ritza Z twierdzenia tego wynika w szczególności, że funkcjonał F [n] jest uniwersalny, to znaczy, że nie zależy od potencjału zewnętrznego. Wynika z niego także, że nie jest możliwe aby dwa nietrywialnie różne potencjały (różniące się bardziej niż o stałą) produkowały taką samą gęstość stanu podstawowego. W takim sensie potencjał zewnętrzny jest także funkcjonałem gęstości. Własność ta została wykorzystana przy konstrukcji równań Kohna-Shama, opisanej w kolejnym rozdziale. 3.3 Równania Kohna-Shama. Twierdzenie Hohenberga-Kohna nie dostarcza recepty na znajdowanie gęstości n(r). Nie jest bowiem znana jawna postać funkcjonału F [n] (a nawet są kłopoty ze zdefiniowaniem dziedziny tego funkcjonału, czyli fizycznie akceptowalnych gęstości (Ref)). Trudności te zostały w znacznym stopniu przezwyciężone w konstrukcji Kohna-Shama polegającej na mapowaniu realnego układu cząstek na pomocniczy układ cząstek nieoddziałujących, w taki sposób aby gęstości stanu podstawowego obu układów były identyczne. Zabieg polega na konstrukcji zewnętrznego potencjału lokalnego dla układu cząstek nieoddziałujących (na mocy tw. Hohenberga-Kohna istnieje jeden i tylko jeden taki potencjał). Korzyść płynąca z takiego mapowania wiąże się z faktem, że równanie Schrödingera układu cząstek nieoddziałujących separuje się na równania jednocząstkowe. Funkcjonał uniwersalny F [n] układu oddziałującego zapiszemy w postaci: e2 Z n(r)n(r0 ) F [n] = T0 [n] + drdr0 + Exc [n], 2 |r − r0 | (20) gdzie T0 [n] to energia kinetyczna układu cząstek nieoddziałujących, a Exc [n] jest tzw. energią korelacji-wymiany, zdefiniowaną przez powyższe równanie. Przekształcenie funkcjonału F [n] ma charakter tożsamościowy (dodanie i odjęcie T0 [n])), pozwala jednak na ulokowanie nieznanej analitycznie części tego funkcjonału w członie Exc [n] mającym charakter energii typowo kwantowych oddziaływań korelacji i wymiany. Wariacja funkcjonału energii ze względu na gęstość n[r], z warunkiem ubocznym zachowania liczby cząstek, prowadzi formalnie do takiego samego równania jakie otrzymalibyśmy w przypadku cząstek nieoddziałujacych: ! h̄2 ∂ 2 − + VSCF (r) ψn (r) = n ψn (r) 2m ∂r2 (21) z potencjałem efektywnym VSCF (self consistent field): Z VSCF (r) = V ext (r) + e2 n(r0 ) dr0 + vxc (r) |r − r0 | (22) gdzie vxc (r) = δExc [n] δn(r) to potencjał lokalny nazwany potencjałem korelacji-wymiany (eXchange-Correlation). (23) 3 Podstawy teoretyczne obliczeń it ab initio. 9 Gęstość stanu podstawowego n(r) (będąca gęstością zarówno układu prawdziwego jak i pomocniczego) oraz energia kinetyczna układu nieoddziałującego T0 [n] wyrażają się poprzez obsadzone przez cząstki orbitale Kohna-Shama, ψn (r): N/2 n(r) = 2 X |ψn (r)|2 (24) n=1 XZ h̄2 N/2 ∂ 2 ψn (r) T0 [n] = −2 ψn∗ (r) dr 2m n=1 ∂r2 (25) przy czym zakładamy, że układ jest niemagnetyczny i dla elektronów ma miejsce dwukrotna degeneracja ze względu na spin. Energię całkowitą układu można obliczać albo z wyrażeń (17) i (20) albo korzystając z energii własnych Kohna-Shama: E[n] = 2 n/2 X n − n=1 Z e2 Z n(r)n(r0 ) 0 drdr + E [n] − n(r)vxc (r)drdr xc 2 |r − r0 | (26) Warto w tym miejscu jeszcze raz zaznaczyć, że choć równania Kohna-Shama są równaniami typu jednocząstkowego, to ich rozwiązania nie są stanami w sensie przybliżenia cząstek niezależnych. W szczególności, jak widać w powyższym wyrażeniu, energia układu nie jest sumą energii stanów obsadzonych. Jedynym odniesieniem równań Kohna-Shama do układu rzeczywistego jest uzyskiwana poprzez ich rozwiązanie gęstość stanu podstawowego (oraz energia całkowita układu, ponieważ przekształcenie hamiltonianu miało charakter tożsamościowy). Równanie (21) to nieliniowe równanie Schrödingera, w tym sensie, że występujący w równaniu potencjał zależy od jego rozwiązań. Dlatego równie Kohna-Shama rozwiązuje się w sposób samouzgodniony. Od strony formalnej jest to równanie jednocząstkowe co stanowi ogromne uproszczenie w stosunku do równania wielocząstkowego. Metoda pozwala efektywnie znajdować gęstość i energię stanu podstawowego układu identycznych cząstek kwantowych, pod warunkiem, że znany jest potencjał korelacji wymiany vxc . Analityczna postać tego potencjału nie jest znana dlatego stosuje się przybliżenia opisane w rozdziale 3.6. 3.4 Twierdzenie Janaka Istnieje możliwość rozwiązania zagadnienia wariacyjnego (19) w konstrukcji Kohna-Shama przy dowolnym wektorze obsadzeń λ. Postać równań Kohna-Shama (21) nie ulega zmianie, jednak ich rozwiązania (energie i funkcje własne, energia całkowita) stają się funkcjami wektora obsadzeń (n (λ),ψn (λ, r),E(λ)), ponieważ od tegoż wektora zależy gęstość (a zatem i potencjał samouzgodniony V SCF ): n(r) = ∞ X λn |ψn (r)|2 (27) n=1 gdzie λn przyjmują wartości z zakresu h0, 2i, oraz: N= ∞ X λn , (28) n=1 gdzie N jest liczbą cząstek. Twierdzenie Janaka pokazuje związek pomiędzy energiami własnymi Kohna-Shama przy zadanym wektorze obsadzeń λo a pochodną cząstkową energii całkowitej ze względu na obsadzenia poziomów: 3 Podstawy teoretyczne obliczeń it ab initio. 10 ∂E(λ) ∂λn n (λo ) = 3.5 ! (29) λ=λo Stany wzbudzone Analiza stanów wzbudzonych w ramach DFT to obszerna dziedzina współczesnych badań teoretycznych (przybliżenie GW, TDDFT - time dependent density functional theory). Teoria zaprezentowana w tym opracowaniu dotyczy przede wszystkim stanu podstawowego niejednorodnego układu identycznych cząstek kwantowych. Możliwa jest jednak prosta analiza energii wzbudzeń układu (przynajmniej niektórych) opierająca się na hipotezie, że stanom wzbudzonym odpowiadają całkowite obsadzenia orbitali Kohna-Shama (λn = 1, 2). Jeśli oznaczymy przez λg wektor obsadzeń stanu podstawowego (λn = 2, dla n = 1, ..., N/2), a przez λe wektor obsadzeń pewnego stanu wzbudzonego, wówczas energia wzbudzenia: ∆E = E(λe ) − E(λg ) (30) W szczególności, wzbudzenie jednocząstkowe polegające na inwersji obsadzeń stanów n < N/2 i m > N/2, reprezentowane przez wektor obsadzeń λmn : (∆E)mn = E(λmn ) − E(λg ) (31) Korzystając z twierdzenia Janaka energię takiego wzbudzenia można obliczyć w inny sposób: Z (∆E)mn = = Z dE = ∂E ∂E dλn + dλm ∂λn ∂λm Z 1h n (λ)d(1 − λm ) + m (λ)dλm 0 = Z 1h 0 ! (32) i i m (λ) − n (λ) dλm Ostatni wzór jest użyteczny w sytuacji, gdy różnica energii całkowitych jest mniejsza niż dokładność reprezentacji numerycznej energii całkowitej (czyli w dużych układach) i nie można zastosować wzoru 31. 3.6 Przybliżenia energii korelacji-wymiany: LDA i GGA. Historycznie pierwszym i powszechnie stosowanym przybliżeniem energii korelacji-wymiany jest przybliżenie lokalnej gęstości (LDA - local density approximation). Przyjmuje się, że energia korelacji-wymiany w układzie niejednorodnym jest lokalnie równa energii korelacji-wymiany układu jednorodnego, i wyraża się wzorem: Z Exc [n] = xc (n)|n=n(r) n(r)dr, (33) gdzie xc (n) jest energią korelacji wymiany na jedną cząstkę w układzie jednorodnym. Potencjał korelacji wymiany przyjmuje wówczas postać: dxc (n) vxc [n](r) = xc (n) + n dn ! (34) n=n(r) Energię xc (n) można podzielić na część korelacyjną i wymienną: xc (n) = x (n) + c (n). (35) 4 Przykład: atom. 11 Znana jest dokładna analityczna postać energii wymiany w układzie jednorodnym: 3 (3π 2 n)1/3 , (36) 4π a formuły opisujące energię korelacji c (n) mają charakter przybliżony i opierają się na parametryzacjach wyników symulacji QMC (Quantum Monte Carlo) (Ref). Przybliżenie LDA jest najlepsze w granicach dużych gęstości lub gęstości wolno zmiennej przestrzennie. W praktyce okazało się, że z sukcesem opisuje bardzo szeroką klasę układów, od pojedynczego atomu do rozmaitych układów wieloatomowych. Znane są obecnie charakterystyczne błędy wyników uzyskiwanych w ramach przybliżenia LDA: x (n) = − • znacznie większe (∼ 20%) energie kohezji w kryształach oraz energie wiązań • zły opis układów silnie skorelowanych, takich jak tlenki metali przejściowych • mniejsze (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach • większe (∼ 20%) wielkości związane z własnościami sprężystymi (np. moduły sprężystości objętościowej w kryształach) • większe (∼ 5%) częstości oscylacji) Inne przybliżenie energii korelacji-wymiany to przybliżenie uogólnionych gradientów (GGA - generalized gradient approximation): Z Exc [n] = xc (n, |∇n(r)|)|n=n(r) n(r)dr, (37) w którym zakłada się zależność lokalnej energii korelacji-wymiany xc od gęstości i jej gradientu. Charakterystyczne błędy obserwowane w przybliżeniu GGA to: • mniejsze od eksperymentalnych (∼ 10%) energie kohezji w kryształach oraz energie wiązań (∼ 10%) • większe (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach • większe (∼ 5%) wielkości związane z własnościami sprężystymi (moduły sprężystości) 4 Przykład: atom. Atom jest podstawową cegiełką w układach wieloatomowych i jednocześnie najprostszym realnym obiektem fizycznym poddającym się analizie aparatem teoretycznym opisanym w zarysie w poprzednim rozdziale. Jednocześnie, jego własności fizyczne mają w sposób oczywisty kluczowe wpływ na własności układów złożonych. Bardzo ważny jest więc dobry opis teoretyczny atomu i dlatego warto poświęcić temu obiektowi nieco uwagi, choć od strony formalnej aparat zaprezentowany w tym rozdziale ma w dużej części charakter podręcznikowy. Rozwiązanie numeryczne równań Kohna-Shama dla atomów jest stosunkowo proste. Przy założeniu symetrii sferycznej układu (spełnionym jedynie w przypadku atomów/jonów o zamknieetych powłokach i beedącym przybliżeniem dla atomów o otwartych powłokach) równania redukują się do jednego wymiaru (promienia we współrzędnych sferycznych) i mogą być rozwiązywane w reprezentacji położeniowej, poprzez dyskretyzację na siatce radialnej. Poniżej przedstawiony jest sposób rozwiązania dla nierelatywistycznego równania Schrödingera. Rozwiązuje się także równanie Schrödingera relatywistyczne-skalarne (w przypadku atomów ciężkich,) oraz relatywistyczne-wektorowe (w przypadku atomów, w których istotne jest oddziaływanie spinorbita). 4 Przykład: atom. 12 W układzie jednostek Hartree (me = h̄ = e = 4π/o = 1) równanie Kohna-Shama ma postać: 1 2 ∇ + V SCF (r) ϕ(r) = εϕ(r) (38) 2 Jest to zagadnienie własne, którego rozwiązaniem jest zbiór: {ϕi , εi }, a gęstość elektronową znajdujemy z sumy: n(r) = Σi λi |ϕi (r)|2 , (39) gdzie liczby obsadzeń {λi = 1, dla i = 1, ..., N ; λi = 0, dla i > N }, a N jest liczbą elektronów w atomie. Przy założeniu symetrii sferycznej potencjału samouzgodnionego V SCF (r) równanie (38) można przedstawić we współrzędnych sferycznych: " 1 − 2 2r ∂ ∂ r2 ∂r ∂r ! ! + L̂ 2 # +V SCF (r) ϕ = εϕ, (40) gdzie L̂ jest operatorem momentu pędu, zależnym tylko od współrzędnych kątowych, a więc komutującym z Hamiltonianem. Funkcja falowa ϕ jest iloczynem harmoniki sferycznej Ylm (r̂) (gdzie r̂ jest kierunkiem w przestrzeni r) będącej funkcją własną operatora momentu pędu, oraz funkcji radialnej R( r), będącej rozwiązaniem zagadnienia własnego: " 1 d d − 2 r2 2r dr dr ! # l(l + 1) + + V SCF (r) R(r) = εR(r) r2 (41) Harmoniki sferyczne indeksowane są liczbami kwantowymi: l - orbitalną, wskazującą na wartość momentu pędu, oraz m - magnetyczną, określającą rzut momentu pędu na wybraną oś. Równanie (41) ulega dalszemu uproszczeniu po dokonaniu podstawienia: R(r) = u(r)/r. Przyjmuje wówczas postać: " # 1 d2 l(l + 1) − + + V SCF (r) u(r) = εu(r) 2 2 dr r2 (42) Jest to formalnie równanie Schrödingera dla cząstki poruszającej się w jednym wymiarze w potencjale efektywnym: l(l + 1)/r2 + V SCF (r). Nietrudno także pokazać, że z warunku unormowania funkcji ϕ(r) wynika fakt unormowania funkcji u(r). Rozwiązania równania (42): {unl , εnl } (a więc także {Rnl , εnl }), indeksowane są liczbami kwantowymi: n - główną, określającą energię własną Kohna-Shama, oraz orbitalną (l), ponieważ od niej zależy efektywny hamiltonian. Jak widać występuje degeneracja poziomów Kohna-Shama ze względu na liczbę kwantową m. Zakresy zmienności liczb kwantowych n, l, m podlegają znanym regułom: n = 1, 2, ... ; l = 0, ..., (n−1) ; −l ¬ m ¬ l. Liczby kwantowe l nazywa się zwyczajowo, kolejno s, p, d, f, .... Równanie (42) rozwiązuje się numerycznie, poprzez dyskretyzację na siatce radialnej (stosuje siee logarytmiczne siatki kilkaset punktów), oraz zastosowanie jednego ze znanych algorytmów rekurencyjnych, z warunkami brzegowymi u(0) = 0 i R(∞) = 0. Kryterium odnalezienia funkcji i wartości własnej jest równość pochodnych logarytmicznych rozwiązań uzyskiwanych poprzez całkowanie rekurencyjne od lewej (u− ) i od prawej (u+ ) strony, w wybranym punkcie rm zwanym punktem dopasowania (ang. matching point): d ln(u− ) d ln(u+ ) |r=rm = |r=rm (43) dr dr Warunek ten zapewnia gładkie zszycie funkcji u− i u+ w punkcie rm , tzn. równość wartość funkcji oraz ich pierwszych pochodnych. Rozwiązanie numeryczne równania (38) odbywa się w sposób samouzgodniony, ponieważ V SCF jest funkcjonałem gęstości. Tzn. po każdym rozwiązaniu zagadnienia własnego (38), według opisanego wyżej schematu, obliczana jest gęstość 5 Pseudopotencjał 13 (39), nowy potencjał V SCF , itd., aż do ustabilizowania się energii całkowitej. Rysunek pokazuje wyniki obliczeń radialnych funkcji u(r) dla potasu, wykonane programem fhiPP. Radial Wavefunctions K 15:58:44 Feb 25 2004 scharoch 2 4s 3p 3s 2p 2s 1s u(r) (arbitrary scale) 1 0 −1 −2 5 0 1 2 r (bohr) 3 4 Pseudopotencjał Podstawową ideą pseudopotencjału jest chęć zastąpienia silnego potencjału kulombowskiego jądra atomowego i silnie związanych z jądrem elektronów rdzenia – słabym (efektywnym) potencjałem jonowym działajacym na elektrony walencyjne. Potrzeba pseudopotencjału ma naturę techniczną. Wszelkie obliczenia numeryczne (niekoniecznie komputerowe) nieznanej funkcji najczęściej sprowadzają się do rozmaitych metod przybliżania tejże funkcji poprzez rozwinięcie w szeregi funkcyjne i znalezienie współczynników rozwinięcia. Wiadomo, że generalnie przybliżenie obciętym szeregiem jest tym lepsze im więcej jest wyrazów rozwinięcia. Z kolei ilość potrzebnych wyrazów rozwinięcia (dajacych ustalone odchylenie funkcji aproksymowanej od aproksymującej) jest tym mniejsza im funkcja, aproksymowana szeregiem, jest gładsza. Pole elektrostatyczne generowane przez jądro atomu czyli energia potencjalna w równaniu Schroedingera jest funkcją osobliwą. Rozwiązania tegoż równania czyli funkcje falowe szybko oscylują w pobliżu jądra i jeśli byśmy chcieli wyrazić je poprzez wygodne szeregi funkcyjne, musielibyśmy użyć stosunkowo wielu wyrazów rozwinięcia. Odtąd przyjmiemy, że wszelkie funkcje rozwijamy w szereg trygonometryczny czyli inaczej mówiąc będziemy operować bazą ”fal płaskich”. Pseudopotencjał jest konstrukcją, która pozwala ”wygładzić” potencjał kulombowski. Atom wieloelektronowy, można rzec, składa się z części stałej, która zawsze będzie taka sama i nic jej, w rozsadnym horyzoncie czasowym, nie ruszy. To jest po pierwsze jądro, ale nie tylko: dochodzą do niego jeszcze tzw. elektrony rdzenia czyli te, które są najbardziej związane z jądrem. W kontakcie atomu z otoczeniem (czyli w tworzeniu całej różnorodności świata chemicznego i biologicznego) odgrywają role jedynie elektrony zewnętrzne - walencyjne. Wystarczy więc zajmować się tylko tymi elektronami zaś resztę atomu traktować jako rdzeń. Jeśli będziemy w stanie zasymulować działanie rdzenia na elektrony walencyjne i generalnie na wszelkie ob- 5 Pseudopotencjał 14 ce elektrony tak, aby one nie zauważyły że nie mają do czynienia z prawdziwym atomem uzyskamy znaczne uproszczenie zagadnienia obliczeniowego. Opisywać będziemy elektrony poprzez pseudofunkcje falowe o których zażądamy aby były identyczne z prawdziwymi funkcjami falowymi na zewnętrz rdzenia atomowego, zaś w obszarze rdzenia były możliwie gładkie (czyli w całym zakresie zmienności nie miały węzłów). Pseudopotencjał występujący w równaniu Schroedingera i równaniu Poissona powinien dawać właśnie takie funkcje jako rozwiązania. 5.1 Historia Pierwsze pseudopotencjały były konstruowane w ramach ideologii o charakterze fenomenologicznym: starano się symulować pewne właściwości rozproszeniowe atomu. Na przykład: zakładano, że pseudopotencjał atomu obcej domieszki w metalu, na zewnątrz pewnej ustalonej kuli o promieniu rc jest czysto kulombowski, a wewnątrz tej kuli jest po prostu zerem. Następnie rozwiąywano zagadnienie rozpraszania elektronów przewodnictwa na takich „domieszkach” atomowych i uzyskiwano, w rezultacie złożonych obliczeń, opór elektryczny. Wartość promienia rc dobierano tak aby otrzymać zgodność obliczonego oporu z wynikiem eksperymentu. Taki pseudopotencjał nazwiemy lokalnym, gdyż pole sił działających na każdy elektron jest takie samo. Jeśli jednak chcemy, aby pseudopotencjał dawał wartości własne energii (walencyjnych) atomu takie jak prawdziwy potencjał - to jest to niemożliwe. To znaczy jest niemożliwym zbudowanie pseudopotencjału lokalnego – funkcji wektora położenia zawierającą pełny opis sił działających na elektron. Nielokalność pseudopotencjału oznacza, że na to aby wiedzieć jakie pole sił działa na elektron nie wystarcza znajomość miejsca w którym ten elektron jest, ale potrzebna jest też pewna inna informacja. Wprowadza się funkcję dwóch zmiennych – pseudopotencjał nielokalny czyli pewien operator V̂ P S (r, r0 ) zależny od dwóch wektorów położenia. Jest możliwe zbudowanie pseudopotencjału jako zestawu potencjałów odpowiednio dla każdego typu symetrii funkcji falowych elektronu czyli dla każdej liczby kwantowej l (por. poprzedni rozdział) – zależnego od jednej zmiennej r i części kątowej drugiej zmiennej Ωr0 . Taki pseudopotencjał, zestaw ”potencjałów”: Vs , Vp , Vd , ..., który jest lokalny względem r = |r| zaś nielokalny względem zmiennych kątowych będziemy nazywać pseudopotencjałem półlokalnym. 5.2 Psudopotencjał zachowujący normę Do obliczeń bazujących na teorii funkcjonału gęstości, gdzie gęstość ładunku elektronowego jest wielkością podstawową, pseudopotencjał zadanego atomu musi być konstruowany dosyć precyzyjnie: - wartości własne energii wzorcowego atomu i pseudoatomu muszą się zgadzać, - funkcje falowe wzorcowego atomu i funkcje pseudofalowe muszą się zgadzać w obszarze na zewnątrz kuli o zadanym promieniu Rc - muszą się zgadzać pochodne logarytmiczne w punkcie Rc funkcji falowych wzorcowego atomu i funkcji pseudofalowych - całkowity ładunek elektryczny wewnątrz kuli o promieniu Rc musi być jednakowy dla atomu wzorcowego i pseudoatomu (warunek zachowania normy) - pochodna po energii pochodnej logarytmicznej w punkcie Rc musi być w obu wypadkach taka sama 5.3 Generowanie pseudopotencjału Dla wybranego atomu chcemy skonstruować zestaw funkcji Vs (r), Vp (r), Vd (r), ... który dla walencyjnych stanów s, p, d, ... symulował by tenże atom. W pierwszym kroku rozwiązujemy zagadnienia pojedynczego atomu (patrz poprzedni rozdział). Następnie wydzielamy stany walencyjne, 5 Pseudopotencjał 15 czyli te, które odpowiadają najwyżej położonym poziomom energii. Mając pełnoelektronowy potencjał efektywny oraz stany walencyjne stosujemy jeden ze schematów konstruowania pośredniego tzw. pseudopotencjału ekranowanego. Tutaj odniesiemy się do schematów Hamanna [] i Troulliera-Martinsa []. ps ps Jeśli wyrazić naszą funkcję pseudofalową jako iloczyn ϕps lm (r) = [ul (εl ; r)/r]Ylm (Ωr ) to jej ps ps część radialna ul (εl ; r) ma być rozwiązaniem (o najniższej energii) równania (42) odpowiadaP S,scr jącym wartości własnej εps (r). Jeśli byśmy znali całą l z pseudopotencjałem ekranowanym Vl funkcję pseudofalową, to moglibyśmy znależć pseudopotencjał ekranowany poprzez odwrócenie równania Schrödingera: Vlps,scr (r) = εps l − l(l + 1) 1 d2 ps + u . 2 l r2 2ups l dr (44) Mamy więc pewną dowolność w konstruowaniu pseudopotencjału w obszarze r < rlc . Tutaj jest miejsce na różne schematy konstruowania. Schemat Hamanna jest schematem „minimalnym” czyli najprostszym spełniajacym wyżej wspomniane wymagania wraz z żądaniem aby funkcje pseudofalowe nie miały węzłów. Schemat Troulliera-Martinsa wprowadza dodatkowe wymagania, w szczególności dla zachowania się pseudopotencjału i jego pochodnych w zerze i w r = rlc . Pseudopotencjał typu Troulliera-Martinsa zgadza się z potencjałem pełnoelektronowym dla r > rlc dokładnie podczas gdy pseudopotencjał Hamanna „zgadza się” w sensie „zbliża wykładniczo”. Następnym krokiem konstruowania pseudopotencjału jest tzw. ”odekranowanie”(unscreening) polegające na tym, że od ekranowanego pseudopotencjału odejmuje się sumę potencjału HarPS treego i potencjału wymiany-korelacji VHxc (r) = VHP S (r) + VxcP S (r) określonego dla elektronów walencyjnych opisanych przez funkcjie pseudofalowe. Dla dalszych zastosowań wygodnie jest rozdzielić każdy pseudopotencjał Vl na cześć lokalna (część wspólną, niezależną od l) i składnik nielokalny (45) Vl = Vlok + δVl . Zauważmy że dla r > rlc mamy δVl ≡ 0. Na koniec zapiszmy nasz pseudopotencjał jako „półlokalny”(semilocal) operator ps V̂ SL (r, r0 ) = Vlok (r)δ(r − r0 ) + lX max l X δVlSL (r, r0 ) l=0 m=−l ps = Vlok (r)δ(r − r0 ) + lX max l X l=0 m=−l ∗ Ylm (Ωr )δVlSL (r) δ(r − r0 ) Ylm (Ωr0 ). r2 (46) Powyższe warunki nie determinują „najlepszego” pseudopotencjału dla każdego ustalonego pierwiastke. Jest tu pewna dowolność i ostateczny rezultat zależy od szczegółów jego wykorzystania. Mamy dwie przeciwne sobie przesłanki: z jednej strony domaganie się dużej dokładności symulacji atomu przez pseudopotencjał i uniwersalności tegoż każe zadawać mały promień obcięcia, rlc , (wtedy tylko mały obszar w pobliżu rdzenia jest „zafałszowany”). Z drugiej – staramy sie aby pseudopotencjał był jak najbardziej gładki ponieważ chcemy go przedstawiać poprzez możliwie mało funkcji bazy (fal płaskich) czyli chcemy jak największego rlc . Procedura „odekranowania” nie jest całkiem automatyczna. Pseudopotencjał jonowy, który staramy się skonstruować, to taki, który wraz z dodanym potencjałem Hartreego i potencjałem wymiany-korelacji da nam pełny pseudopotencjał działający na elektrony walencyjne. Odekranowanie daje nam sumę powyższych trzech potencjałow a także gęstość ładunku i pseudogęstość walencyjną. Gdyby potencjał wymiany-korelacji był liniową funkcją gęstości elektronowej (a tak jest w przypadku potencjału Hartreego) wówczas moglibyśmy łatwo wydzielić potencjał jonowy. Niestety potencjał wymiany-korelacji nie jest liniową funkcją ładunku i potrzeba tu korekty 6 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. 16 zwanej poprawka rdzenia ze względu na nieliniowość – non-linear core-valence correction. Trudność tę omija się zwykle wprowadzając tzw. częściową gęstość rdzenia (partial core density), typowa postać której jest ( A sin(Br) , r < r0 , core r npartial = (47) ncore (r), r > r0 , gdzie A i B są określone przez wartość gęstości rdzenia i jej pochodnej w punkcie r0 takim, w którym ncore jest jeden do dwóch razy większa niż nvalence . 5.4 Uniwersalność (transferability) i twardość (hardness) pseudopotencjału. Twardym potencjałem określa się sztywny zlokalizowany rdzeń jonowy który można z powodzeniem stosować w rozmaitych otoczeniach innych atomów. Z kolei „zmiękczanie” potencjału (polegające na zastąpieniu przebiegu o dużej zmienności, np. zawierającego miejsca o dużej wartości pochodnej – przebiegiem o małej zmienności) pogarszało uniwersalność stosowalności potencjału czyli pogarszało jego transferability. Te opisowe cechy (pseudo-)potencjału kwantyfikuje się. Twardość opisuje stopień wierności z jaką pseudopotencjał odtwarza zmiany wartości energii walencyjnych przy zmianach (zaburzeniach) potencjału, ładunku rdzenia czy innych możliwych do pomyślenia. W sumie tworzenie pseudopotencjału wymaga wielu testów. 5.5 Pseudopotencjał jako separowalny operator Kleinman i Bylander zauważyli, że można skonstruować separowalny operator pseudopotencjału tzn. taki, że część nielokalna pseudopotencjału δV (46) daje się, z dobrym przybliżeniem, P zastąpić przez sumę iloczynów i fi (r)gi (r0 ). Operator zapiszemy w sposób jawny w postaci: V̂KB = Vlok + ps X | ϕps lm δVl ihδVl ϕlm | . (48) = dr δVl (r)ϕps lm (r)ψ(r). (49) lm ps hϕps lm | δVl |ϕlm i Funkcja hδVl ϕps lm | jest operatorem rzutowania: hδVl ϕps lm |ψi Z Działanie części nielokalnej takiego takiego operatora przedstawia formuła na jego element macierzowy: X 1 ps hψi | δVKB |ψj i = hψi |δVl ϕps (50) ps ps hδVl ϕlm |ψj i. lm i hϕlm | δVl |ϕlm i lm ps −1 Korzyść jaką osiągamy w takim ujęciu polega na tym, że współczynniki ElKB = hϕps lm | δVl |ϕlm i możemy policzyć raz na początku obliczeń samouzgodnionych; poza tym dla N -elementowej bazy funkcji ψi dla obliczeń (i przechowania w pamięci) elementów macierzowych w przypadku pseudopotencjału półlokalnego potrzeba około N 2 /2 elementów macierzowych hψi | δ V̂ SL |ψj i zaś dla postaci separowalnej potrzebna jest ilość operacji rzutowania hδVl ϕps lm |ψi rzędu N oraz zwykłe mnożenia. Taki pseudopotencjał w działaniu na stany atomowe (pierwotne rozwiązania atomowego równania Schrödingera) zachowuje się prawidłowo lecz na stany o innych energiach może działać gorzej, mianowicie mogą wystąpić fałszywe stany własne hamiltonianu, tzw. „zjawy” (ghost states) co kompletnie psuje prawidłowość obliczeń. Wypracowano procedurę modyfikowania pseudopotencjału taką, która eliminuje „zjawy” a sprowadzająca sie do odpowiedniego wyboru składnika lokalnego oraz odpowiednich wartości promieni obcięcia rdzenia. 6 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. (W opracowaniu) 7 Dynamika układów atomowych. 7 17 Dynamika układów atomowych. W rozdziale 2.3 przedstawiono koncepcję powierzchni energii swobodnej. Jest to energia całkowita układu jako funkcja wybranych geometrycznych stopni swobody. Minima tej funkcji odpowiadają stanom równowagi statycznej, stabilnym (minimum globalne) lub matastabilnym (minimum lokalne). Jest to podstawowy krok w określeniu możliwych konfiguracji równowagowych. Jednak sytuacja może się zmienić jeśli uwzględni się temperaturę układu. Jak wiadomo układ minimalizuje wówczas energię swobodną. Potrzebna jest zatem analiza termodynamiki, a ta z kolei musi być poprzedzona analizą dynamiki na poziomie mikro czyli dynamiki atomów. W przybliżeniu adiabatycznym atomy poruszają się w polu PES, a zatem wyznaczanie sił sprowadza się do obliczania gradientów PES. Wykorzystuje się przy tym twierdzenie Hellmanna-Feynmana. 7.1 Dynamika Molekularna Znajomość sił pozwala na symulację dynamiki molekularnej (MD - ’Molecular Dynamics’) poprzez numeryczne rozwiązanie zagadnienia wartości początkowej, i obserwację ewolucji trajektorii atomów w przestrzeni fazowej. Choć od strony ideowej proste, są to obliczenia wymagające bardzo dużych mocy obliczeniowych. Alternatywą jest opisane dalej przybliżenie harmoniczne. 7.2 Przybliżenie harmoniczne W przybliżeniu harmonicznym zakłada się, że siły są liniowymi funkcjami wychyleń atomów z położeń równowagi. Dynamika układu w takim przybliżeniu jest zawsze superpozycją niezależnych oscylacji harmonicznych (modów normalnych). Wektory polaryzacji oraz odpowiadające im częstości tych oscylacji {An , ωn } znajduje się z rozwiązania zagadnienia własnego: Φ̂A = ω 2 A (51) gdzie 1 2 tot ∂ E (R) Mi Mj ∂Ri ∂Rj Φ̂ = [Φij ] = q (52) jest macierzą dynamiczną układu. Liczba modów normalnych jest równa 3 × NA , gdzie NA jest liczbą atomów w układzie. W przypadku układów periodycznych, jak kryształ, macierz dynamiczna redukuje się, dzięki symetrii translacyjnej, do wymiaru 3x liczba atomów w komórce elementarnej, jednak elementy macierzy (a także jej wektory i wartości własne) są funkcjami wektora falowego k z I strefy Brillouina (BZ - ’Brillouin Zone’). Mody normalne w takim przypadku są falami płaskimi charakteryzowanymi przez związki dyspersyjne ω(k). Wykorzystując twierdzenie Hellmanna-Feynmana uzyskuje się formułę na drugie pochodne cząstkowe energii całkowitej, potrzebne do konstrukcji macierzy dynamicznej: Z ∂ 2 E tot (R) ∂Fi ∂n(r, R) ∂V ej (r, R) =− = ∂Ri ∂Rj ∂Rj ∂Rj ∂Ri Z (53) ∂ 2 V ej (r, R) ∂ 2 V jj (R) + n(r, R) dr + ∂Ri ∂Rj ∂Ri ∂Rj W formule tej występuje pochodna cząstkowa gęstości elektronowej po współrzędnej atomu ∂n(r, R)/∂Rj , której obliczanie już nie jest niestety tak łatwe jak obliczanie sił. Do jej wyznaczania w ramach DFT stosuje się teorię liniowej odpowiedzi lub rachunku zaburzeń. Istnieje też inna metoda wyznaczania macierzy dynamicznej Φ̂, wykorzystująca fakt, że macierz ta wiąże siły działające na atomy z wychyleniami: 8 Termodynamika układów atomowych. Fi = 18 X ∂ 2 E tot (R) j ∂Ri ∂Rj 4(Rj ) = Xq Mi Mj Φij 4(Rj ) (54) j Wykonując obliczenia ab initio sił działających na atomy dla odpowiedniego zestawu wychyleń i wykorzystując powyższy związek można zbudować układ równań, w którym niewiadomymi będą elementy macierzy dynamicznej. Uwzględnienie symetrii zwykle znacznie redukuje liczbę różnych elementów tej macierzy i tak np. dla kryształów o symetrii kubicznej potrzebne jest tylko jedno wychylenie atomu w wybranym kierunku. Metoda zwana jest metodą bezpośrednią (Ref). 8 Termodynamika układów atomowych. 8.1 Termodynamika w skali nano Rozważania prowadzone w tym rozdziale oparte będą na koncepcji zespołu kanonicznego. W ramach tej koncepcji układ będący w równowadze termicznej z termostatem realizuje mikrostany z prawdopodobieństwem P zależnym tylko od ich energii: P ∼ exp(−βE) (55) gdzie β = 1/(kB T ), kB jest stałą Boltzmana a T temperaturą układu (i termostatu). Czynnikiem normującym prawdopodobieństwa jest 1/Z, gdzie Z= X exp(−βE) (56) E to tzw. funkcja rozdziału (lub suma statystyczna). Jest to podstawowa wielkość w termodynamice statystycznej. Korzystając z relacji: F =− ln(Z) β (57) (58) gdzie F jest energią układu, poprzez związki termodynamiczne można wyznaczyć wszystkie inne charakterystyki. Można także obliczać wartości średnie pewnych parametrów zależnych od energii (x(E)), jako wartości oczekiwane (x̂), uzyskując w ten sposób ich zależności temperaturowe (uśrednianie po zespole kanonicznym): x̂(T ) = hxi = − 1X x(E) exp(−βE) Z E (59) Często mamy doczynienia z sytuacją gdy z różnych powodów energię w wyrażeniu (56) można rozseparować, tzn. przedstawić jako sumę pewnych niezależnych składowych. Energię można rozseparować np. ze względu na stopnie swobody, np.: • pędowe i konfiguracyjne stopnie swobody w układach klasycznych, • translacyjne oraz rotacyjne i oscylacyjne stopnie swobody w cząsteczkach, • oscylacyjne mody normalne w układach wieloatomowych w przybliżeniu harmonicznym, • w sytuacji, gdy potencjał jest superpozycją potencjału, np. dla 3 kierunków kartezjańskich. 8 Termodynamika układów atomowych. 19 Szczególnym przypadkiem jest sytuacja, gdy układ można podzielić na słabo oddziałujące podukłady, tzn. gdy ich energia oddziaływania jest mała w porównaniu z energią wzbudzeń samych podukładów. Przykładem jest tu gaz doskonały, który jest układem słabo oddziałujących identycznych podukładów. Do dalszych rozważań przyjmiemy, że energia separuje się na pewien składnik Ei i resztę Er : E = Ei + Er (60) Wówczas funkcja rozdziału staje się iloczynem: Z = Zi Zr (61) gdzie Zi = X exp(−βEi ) (62) exp(−βEr ) (63) Ei Zr = X Er oraz, definiując Fi(r) = − ln(Zi(r) ) ,: β F = Fi + Fr (64) Nietrudno pokazać, że jeśli jakiś parametr układu zależy tylko od energii Ei wówczas uśrednianie po całym zespole kanonicznym upraszcza się do uśredniania po składowej energii Ei : x̂i (T ) = − 1 X xi (E) exp(−βEi ) Zi E i (65) W takim sensie możemy mówić o termodynamice pojedynczej cząstki w gazie doskonałym (np. o rozszerzalności cieplnej pojedynczego dimera gazu doskonałego) lub termodynamice pewnego, wybranego stopnia swobody (np. zależności temperaturowej amplitudy wybranego modu normalnego w krysztale). W takim też sensie można mówić o termodynamice układów atomowych o rozmiarach rzędu nanometrów, istotnych w nanotechnologiach. Im mniejszy jest układ, którego termodynamikę w wyżej opisanym sensie chcemy badać, tym istotniejsze są fluktuacje czyli odchylenia od wartości średniej. Jedną z możliwych miar fluktuacji jest odchylenie standardowe: δ(x̂) = [h(x − hxi)2 i]1/2 (66) W przypadku układów atomowych w nanoskali fluktuacje mają szczególnie istotne znaczenie. 8.2 Koncepcja powierzchni energii swobodnej (FES). W rozdziale 2.3 opisano koncepcję powierzchni energii potencjalnej (PES) jako funkcji pewnych wybranych geometrycznych stopni swobody, zawierającej informację o stanach równowagi statycznej a także dynamice układu. Uwzględnienie temperatury może istotnie zmienić własności strukturalne i termodynamiczne układów. Energia swobodna jest wielkością, którą układ minimalizuje przy braku fizycznych więzów geometrycznych, a także jest punktem wyjścia w obliczeniach charakterystyk termodynamicznych. Ta funkcja powinna więc być punktem wyjścia wszelkich badań. Wydaje się możliwe uogólnienie koncepcji PES na powierzchnię energii swobodnej (FES - ’Free Energy Surface’). Przypuśćmy, że wektor X charakteryzuje uogólnione współrzędne pewnego zestawu zamrożonych (zewnętrznych, usztywnionych, związanych, unieruchomionych) stopni swobody układu. Mogą to być np.: 8 Termodynamika układów atomowych. 20 • zmienne strukturalne w krysztale (np. długości wektorów prymitywnych i kąty pomiędzy nimi) • składowe tensora odkształceń • wybrane współrzędne atomów, np. kartezjańskie lub wzdłuż wektora polaryzacji wybranego modu normalnego • wybrane odległości międzyatomowe na powierzchni • współrzędne planarne atomu adsorbatu na powierzchni • odległości pomiędzy wybranymi atomami w złożonej cząsteczce przy czym założymy, że liczba zamrożonych stopni swobody jest znacznie mniejsza od liczby wszystkich stopni swobody. Energia układu jest sumą energii statycznej Es (X), czyli energii na powierzchni PES oraz energii związanej z dynamiką względem uwolnionych stopni swobody Ed (X): E = Es (X) + Ed (X). (67) Funkcja rozdziału przyjmie postać: Z= X exp(−β[Es + Ed )] = exp(−βEs )Zd , (68) Ed w której wydzielono wkład dynamiczny do funkcji rozdziału Zd . Energia swobodna, oprócz tego, że jest funkcją temperatury, staje się też funkcją uogólnionych współrzędnych X: F (T, X) = Es (X) − 1 ln[Zd (T, X)], β (69) którą nazwiemy powierzchnią energii swobodnej (FES). Dwa kolejne gradienty FES względem współrzędnych uogólnionych X: Pi (T, X) = ∂F (T, X) ∂Xi (70) Kij (T, X) = ∂ 2 F (T, X) ∂Xi ∂Xj (71) oraz mają sens odpowiednio uogólnionych sił (naprężeń) oraz stałych sprężystości. Powierzchnia energii swobodnej wyznaczona z zasad pierwszych może być podstawowym źródłem informacji o układach z punktu widzenia ich własności strukturalnych. Jej minima wyznaczają (zależne od temperatury) stany równowagi układów, znikanie drugich pochodnych może wskazywać na przemianę fazową (utrata stabilności). Możliwa jest taka sytuacja, że występuje fizyczna przyczyna zamrożenia pewnego stopnia swobody w układzie, np. powierzchnia kryształu lub cienka warstwa może być naprężona przez podłoże (kryształ lity). W takim przypadku w stanie równowagi układ minimalizuje energią swobodną Gibbsa, którą w przypadku uogólnionych współrzędnych X można zdefiniować jako: G=F− X i Xi Pi (72) 9 Algorytmy numeryczne. 8.3 21 Metody obliczania funkcji rozdziału. Znanych jest kilka metod obliczania funkcji rozdziału ab initio lub z wykorzystaniem potencjałów empirycznych. Są to: • dynamika molekularna • metoda Monte Carlo (całkowanie po konfiguracyjnych stopniach swobody) • przybliżenie harmoniczne W przybliżeniu harmonicznym układ wieloatomowy jest termodynamicznie równoważny układowi niezależnych oscylatorów harmonicznych, tzn. funkcja rozdziału jest iloczynem funkcji rozdziału pojedynczego oscylatora: Z= Y Zi (73) i gdzie Zi dla oscylatora kwantowego ma postać: Zi = exp(−βh̄ωi /2) 1 − exp(−βh̄ωi ) (74) a energia swobodna jest sumą energii pojedynczych oscylatorów i energii statycznej całego kryształu. F = X Fi + Es (75) i 9 9.1 Algorytmy numeryczne. Metoda dynamiki molekularnej Car-Parinello (w opracowaniu) 9.2 Metoda najszybszego spadku (’Steepest descent’) (w opracowaniu) 9.3 Metoda gradientów sprzężonych (w opracowaniu) 9.4 Algorytmy dynamiki molekularnej (w opracowaniu) 9.5 Szybka transformata Fouriera Wiemy, że każdą funkcję f (x) ciągłą na odcinku [0, 2π] spełniającą warunek f (0) = f (2π) można przedstawić jako szereg trygonometryczny: ∞ ao X + ak cos kx + bk sin kx f (x) = 2 k=1 (76) 9 Algorytmy numeryczne. 22 to znaczy pomiędzy funkcją f (x) a ciągiem wspólczynników ak , bk istnieje wzajemnie jednoznaczna odpowiedniość. W jedną stronę określa ją powyższe równanie, zaś w drugą formuły Eulera-Fouriera: 1 Z 2π 1 Z 2π ak = f (x) cos kxdx, bk = f (x) sin kxdx. (77) π 0 π 0 Funkcje trygonometryczne 1, cos x, sin x, cos 2x, sin 2x, ... cos kx, sin kx, ... tworzą bazę ortogonalną przestrzeni wektorowej funkcyjnej funkcji ciągłych na odcinku [0, 2π] gdzie iloczyn skalarny dwóch funkcji definiuje się jako (f1 , f2 ) = Z 2π 0 f1 (x)f2 (x)dx. (78) W praktyce obliczeniowej mamy do czynienia raczej z funkcjami określonymi na dyskretnym zbiorze punktów. Załóżmy, że funkcja f (x) jest zadana poprzez wartości fi w równoodległych punktach, których jest parzysta ilość równa n: xj = 2jπ , n fj = f (xj ), j = 0, 1, ...n − 1. (79) Można łatwo sprawdzić, że ortogonalność całkowa (78) ma swój odpowiednik w ortogonalności na dyskretnym zbiorze {xj }, co ostatecznie pozwala przybliżyć naszą stablicowaną funkcję w postaci wielomianu trygonometrycznego X ao n/2−1 wn (x) = + (ak cos kx + bk sin kx) + an/2 cos mx 2 k=1 (80) ze wspólczynnikami ak = X X 2 n−1 2 n−1 f (xj ) cos kxj , bk = f (xj ) sin kxj . n j=0 n j=0 (81) W postaci zespolonej powyższe wzory są następujące: wn (x) = n−1 X ck exp(ikx), i =+ √ −1 (82) k=0 X 1 n−1 ck = f (xj ) exp(−ikxj ). n j=0 (83) Metoda szybkiej transformaty Fouriera (FFT,fast Fourier transform) polega na zredukowaniu ilości wykonywanych operacji wyliczania wartości funkcji (w tym wypadku funkcji wykładniczej). Metodę tę przedstawimy dla szczególnego przypadku, tak jak to uczynili jej wynalazcy, Cooley i Tukey. Rozważmy sytuację w której nasza funkcja oryginalna jest zadana w n punktach i n jest potęgą dwójki czyli n = 2p . Jeśli oznaczymy w = exp(− 2πi ), n aj = 1 2πj f( ) n n (84) to wzór (83) przyjmie postać ck = n−1 X aj wk·j . (85) j=0 Widać że po pierwsze wystarczy tylko raz obliczyć wartość funkcji wykładniczej zaś po drugie – odpowiednie przeprowadzenie operacji wyliczania współczynników grupujące parzyste i nieparzyste wskażniki j pozwala na obliczenie transformaty Fouriera (metodą szybką) przy użyciu 9 Algorytmy numeryczne. 23 2n log2 n działań na liczbach zespolonych co ogromnie zmniejsza czas obliczeń. Obecne algorytmy FFT są nieco bardziej wyrafinowane i obsługują nie tylko przypadek Cooleya-Tukeya, ale najczęściej przypadek n = 2p × 3q × 5r . Warunkiem zastosowania FFT jest możliwość wyboru n w postaci iloczynu potęg małych liczb pierwszych. 9.6 Metoda specjalnych punktów k Monkhorsta-Packa Metoda specjalnych punktów k Monkhorsta-Packa jest metodą całkowania funkcji posiadającej periodyczność nieskończonej sieci po komórce elementarnej. W obliczeniach ’ab initio’ stosuje się ją do znajdowania gęstości elektronowej w układach periodycznych. Wyznaczanie gęstosci wymaga całkowania po I strefie Brillouina kwadratów modułów obsadzonych stanów KohnaShama (oraz sumowania po pasmach energetycznych). Rozważamy sieć zdefiniowaną poprzez prymitywne translacje: ~ = R1~a1 + R2~a2 + R3~a3 R (86) Odpowiadająca jej sieć odwrotna rozpięta jest na wektorach: ~b1 = 2π ~a2 × ~a3 , Ω ~b2 = 2π ~a3 × ~a1 , Ω ~b3 = 2π ~a1 × ~a2 Ω (87) gdzie Ω = ~a1 · (~a2 × ~a3 ) (88) jest objętością komórki elementarnej. Definiujemy ciąg liczb: 2r − q − 1 2q ur = r = 1, 2, 3, . . . , q (89) gdzie q (naturalne) będzie determinowało liczbę specjalnych punktów k. Wyjściowy zbiór punktów k definiujemy następująco: ~kprs = up~b1 + up~r2 + up~s3 (90) Otrzymuje się w ten sposów q 3 różnych punktów k, rozmieszczonych równomiernie w strefie Brillouina. Definiujemy także: −1 X ~ ~ eik·R Am (~k) = Nm 2 (91) ~ |R|=C m gdzie sumowanie przebiega po wektorach sieci należących do tej samej gwiazdy (przechodzących w siebie poprzez operacje symetrii grupy punktowej kryształu), Cm oznacza długość wektorów z danej gwiazdy i zmienia się w sposów rosnący od C1 = 0, a Nm oznacza liczbę wektorów należących do danej gwiazdy. Należy zauważyć, że Am (k) są niezmiennicze względem operacji symetrii grupy punktowej kryształu. Stanowią one także ortogonalną bazę w przestrzeni k : Z 8π 3 d~kA∗m (~k)A∗n (~k = δmn Ω BZ (92) Tak, że dowolną funkcję f (~k), posiadającą symetrię sieci odwrotnej można przedstawić w bazie Am (~k): f (~k) = ∞ X m=1 fm Am (~k) (93) 9 Algorytmy numeryczne. 24 gdzie fm = Ω Z d~kA∗m (~k)f (~k) 8π 3 BZ (94) q 1 X A∗ (~kprs )A∗n (~kprs ) q 3 p,r,s=1 m (95) Rozważmy następującą wielkość: Smn (q) = Po podstawieniu do powyższego wyrażenia definicji (??) można je przekształcić do postaci: 1 Smn (q) = (Nm Nn )− 2 Nn Y Nm X 3 X Wjab (q) (96) a=1 b=1 j=1 gdzie: Wjab (q) q π b a 1X = e( q )(2r−q−1)(Rj −Rj ) q r=1 (97) We wzorze (96) sumowanie po a i b odbywa się po wszystkich wektorach należących do gwiazd odpowiednio m i n. Wyrażenie Wjab może przyjmować następujące wartości: Wjab (q) = 1 q+1 (−1) 0 dla |Rjb − Rja | = 0, 2q, 4q, . . . dla |Rjb − Rja | = q, 3q, 5q, . . . dla |Rjb − Rja | inne (98) Należy pamiętać, że q oraz Rja to liczby całkowite. Nałożymy następnie ograniczenie: q |Rja | < , 2 Co prowadzi do: q |Rjb | < , 2 j = 1, 2, 3 (99) Wjab (q) = δ(Rja , Rjb ) (100) Smn = δmn (101) a z zależności (96): Oznacza to, że wszystkie funkcje Am (~k), które spełniają warunek (99) są ortonormalne na dyskretnym zbiorze punktów kprs w I strefie Brillouina. Liczba tych funkcji jest tym większa im większa jest liczba q. Wykorzystanie symetrii punktowej sieci prowadzi do znacznego zredukowania sumy we wzorze (95): (q) 1 PX Smn (q) = 3 wj A∗m (~kj )An (~kj ) (102) q j=1 gdzie P (q) jest zależną od symetrii liczbą punktów kj , ze zbioru {kprs } znajdujących się w nieredukowalnej części strefy Brillouina, a wj jest współczynnikiem wagowym równym stosunkowi rzędu pełnej grupy symetrii do rzędu grupy wektora falowego kj . Inaczej mówiąc, ponieważ operacje symetrii punktowej nie zmieniają wartości wyrazów w szeregu (95), sumowanie po wektorach ze zbioru {kprs }, różnych lecz związanych operacjami symetrii punktowej, można zastąpić mnożeniem przez czynnik wj . Przypuśćmy, że chcemy całkować pewną funkcję f (~k), która jest całkowicie symetryczna i periodyczna w przestrzeni k. Jak pokazano już wcześniej może ona być formalnie rozwinięta w bazie Am (~k): f (~k) = ∞ X m=1 fm Am (~k) (103) 10 Przykłady zastosowania koncepcji PES i FES 25 gdzie, z powodu ortogonalności Am (~k) w strefie Brillouina, fm = Ω Z d~kA∗m (~k)f (~k) 8π 3 BZ (104) Całka f (~k) po całej strefie Brillouina jest związana z pierwszym współczynnikiem rozwinięcia: Z 8π 3 d~kA∗m f (~k) = f1 Ω BZ (105) Jeśli rozwinięcie (103) ograniczymy do gwiazd spełniających warunek (99), czyli reprezentację funkcji f (~k) ograniczymy do jej rzutu na przestrzeń rozpietą na gwiazdach spełniających warunek (99), to wartości współczynników fm dane są znacznie prostszą zależnością: (q) 1 PX f¯m = wj f (~kj )Am (~kj ) q j=1 (106) Współczynniki te oczywiście różnią się od dokładnych, z powodu ograniczenia przestrzeni. Otrzymujemy w ten sposób przybliżoną reprezentację funkcji f (~k): f¯(~k) = NG X f¯m Am (~k) (107) m=1 gdzie NG jest liczbą gwiazd spełniających warunek (99). Całkowanie po I strefie Brillouina funkcji f (~k), jak w (105), z wykorzystaniem reprezentacji (107) będzie obarczone błędem: Z εBZ = gdzie ( Sm1 (q) = 10 BZ d~k[f (~k) − f¯(~k)] = (−1) 0 X 1 fm Nm2 Sm1 (q) (108) m>1 q−1 (R1 +R2 +R3 ) q 3 dla R1 −R = integer q dla innych (109) Przykłady zastosowania koncepcji PES i FES A. Kryształ. Najprostszym i znanym przypadkiem zastosowania koncepcji powierzchni energii swobodnej jest przybliżenie kwaziharmoniczne dla kryształu, w którym związanym stopniem swobody jest objętość, a dynamika i termodynamika układu traktowana jest w przybliżeniu harmonicznym. Ciśnienie jest uogólnioną siłą a moduł sprężystości objętościowej uogólnioną stałą sprężystości. Położenie minimum FES zależy od temperatury i opisuje rozszerzalność termiczną kryształu. Z kolei znikanie drugiej pochodnej po objętości (moduł sprężystości objętościowej dążący do zera) oznacza utratę stabilności mechanicznej (przegrzanie, stan bliski topnieniu). B. Powierzchnia. Przykłady PES. C. Atom adsorbatu. Dyskusja. Literatura [1] P. A. M. Dirac. Proc.Roy.Soc (London), 123:714. 10 Przykłady zastosowania koncepcji PES i FES 26 [2] M. C. Payne, M. P. Teter, D. C. Allan, T. A. Arias, and J. D. Joannopoulos. Rev. Mod. Phys., 64:1045, 1992. [3] P. Hohenberg and W. Kohn. Phys.Rev.Lett., 48:1425, 1965. [4] W. Kohn and L. J. Sham. Phys. Rev., 140:A1133, 1965. [5] R. Car and M. Parrinello. Phys. Rev. Lett., 55:2471, 1985. [6] A.Oganov. http://olivine.ethz.ch/, 2004. [7] X. Gonze, J.-M. Beuken, R. Caracas, F. Detraux, M. Fuchs, G.-M. Rignanese, L. Sindic, M. Verstraete, G. Zerah, F. Jollet, M. Torrent, A. Roy, M. Mikami, Ph. Ghosez, J.-Y. Raty, and D.C. Allan. Computational Materials Science, 25:478–492, 2002.