Streszczenie pracy - PL-Grid

Transkrypt

Streszczenie pracy - PL-Grid
Streszczenie pracy magisterskiej pt.
„Implementacja i analiza wydajności zrównoleglonej procedury samouzgodnionego pola”
Głównym celem pracy było zaproponowanie schematu metody Hartree-Focka w efektywny
sposób wykorzystującego architektury silnie równoległe. Nacisk został położony na sformułowanie
obliczeń umożliwiające optymalne wykorzystanie własności procesorów graficznych ogólnego
zastosowania (General Purpose Graphics Processing Units , GPGPU). Takie podejście uzasadnione
jest dużą wydajnością i relatywnie niską ceną tych układów, co powoduje ich coraz szersze
stosowanie w nowoczesnych superkomputerach. Trend ten jest odnosi się również do infrastruktury
konsorcjum PL-Grid.
Praca składa się z trzech części. W pierwszej z nich umotywowano potrzebę stosowania
architektury GPGPU w obliczeniach kwantowochemicznych. Ponadto przedstawiono krótką
charakterystykę współczesnych architektur obliczeniowych ze szczególny naciskiem na opis
architektury i modelu programowania procesorów graficznych.
Druga, zasadnicza część pracy poświęcona jest analizie efektywnych metod konstrukcji
macierzy Focka na GPGPU. Zaczyna się ona od opisu baz funkcyjnych stosowanych
w obliczeniach. Zagadnienie to jest o tyle istotne, że wybór bazy i sposób jej organizacji ma
znaczny wpływ na wydajość obliczeń. Następnie szczegółowo przeanalizowano właściwości
transformacyjne wielkości tensorowych pojawiających się w sformułowaniu metody Hartree-Focka
(HF). Przeprowadzona analiza uzasadniona jest koniecznością zmiany bazy w rozpatrywanej w
obliczeniach HF przestrzeni funkcyjnej w celu uzyskania równomiernego rozłożenia obliczeń na
multiprocesory GPU. Dalej opisano przyjęty schemat wstępnej eliminacji, kluczowy dla uzyskania
dobrego skalowania czasu obliczeń z rozmiarem układu. Przedstawiono również metodę
przyspieszenia obliczeń przez prowadzenie części obliczeń w pojedynczej precyzji. Szczegółowo
opisano zaimplementowany algorytm konstrukcji macierzy Focka. Na zakończenie rozdziału
przedstawiono czasy testowych obliczeń i ich porównanie z popularnym programem do obliczeń
kwantowochemicznych (GAMESS), wykazujące kilkunastokrotne przyspieszenie obliczeń
prowadzonych na GPU stworzonym przeze mnie programem względem obliczeń prowadzonych na
CPU przy wykorzystaniu standardowego oprogramowania. Wyniki pokazują poprawność
przyjętego schematu wstępnej eliminacji oraz skuteczność prowadzenia obliczeń w obniżonej
precyzji. Tworzenie programu oraz wykonanie testów odbywało się z wykorzystaniem
infrastruktury PL-Grid. Dzięki konsorcjum możliwe było również przeprowadzenie testów na
różnych modelach procesorów graficznych.
Ostatnia, trzecia część pracy poświęcona jest analizie i wstępnej implementacji
alternatywnego sformułowanie metody HF w którym diagonalizacja macierzy Focka zastąpiona jest
przez minimalizację energii względem macierzy gęstości. Podejście to, w przeciwieństwie do
standardowego, umożliwia efektywne wykorzystanie architektur silnie równoległych, w tym
GPGPU. Implementacja wykorzystująca macierze gęste okazała się niewystarczająco efektywna.
W pracy naszkicowano możliwość przyszłej implementacji korzystającej z rzadkości macierzy
pojawiających się w metodzie HF. Takie podejście powinno dać asymptotycznie liniowe
skalowanie.

Podobne dokumenty