Streszczenie pracy - PL-Grid
Transkrypt
Streszczenie pracy - PL-Grid
Streszczenie pracy magisterskiej pt. „Implementacja i analiza wydajności zrównoleglonej procedury samouzgodnionego pola” Głównym celem pracy było zaproponowanie schematu metody Hartree-Focka w efektywny sposób wykorzystującego architektury silnie równoległe. Nacisk został położony na sformułowanie obliczeń umożliwiające optymalne wykorzystanie własności procesorów graficznych ogólnego zastosowania (General Purpose Graphics Processing Units , GPGPU). Takie podejście uzasadnione jest dużą wydajnością i relatywnie niską ceną tych układów, co powoduje ich coraz szersze stosowanie w nowoczesnych superkomputerach. Trend ten jest odnosi się również do infrastruktury konsorcjum PL-Grid. Praca składa się z trzech części. W pierwszej z nich umotywowano potrzebę stosowania architektury GPGPU w obliczeniach kwantowochemicznych. Ponadto przedstawiono krótką charakterystykę współczesnych architektur obliczeniowych ze szczególny naciskiem na opis architektury i modelu programowania procesorów graficznych. Druga, zasadnicza część pracy poświęcona jest analizie efektywnych metod konstrukcji macierzy Focka na GPGPU. Zaczyna się ona od opisu baz funkcyjnych stosowanych w obliczeniach. Zagadnienie to jest o tyle istotne, że wybór bazy i sposób jej organizacji ma znaczny wpływ na wydajość obliczeń. Następnie szczegółowo przeanalizowano właściwości transformacyjne wielkości tensorowych pojawiających się w sformułowaniu metody Hartree-Focka (HF). Przeprowadzona analiza uzasadniona jest koniecznością zmiany bazy w rozpatrywanej w obliczeniach HF przestrzeni funkcyjnej w celu uzyskania równomiernego rozłożenia obliczeń na multiprocesory GPU. Dalej opisano przyjęty schemat wstępnej eliminacji, kluczowy dla uzyskania dobrego skalowania czasu obliczeń z rozmiarem układu. Przedstawiono również metodę przyspieszenia obliczeń przez prowadzenie części obliczeń w pojedynczej precyzji. Szczegółowo opisano zaimplementowany algorytm konstrukcji macierzy Focka. Na zakończenie rozdziału przedstawiono czasy testowych obliczeń i ich porównanie z popularnym programem do obliczeń kwantowochemicznych (GAMESS), wykazujące kilkunastokrotne przyspieszenie obliczeń prowadzonych na GPU stworzonym przeze mnie programem względem obliczeń prowadzonych na CPU przy wykorzystaniu standardowego oprogramowania. Wyniki pokazują poprawność przyjętego schematu wstępnej eliminacji oraz skuteczność prowadzenia obliczeń w obniżonej precyzji. Tworzenie programu oraz wykonanie testów odbywało się z wykorzystaniem infrastruktury PL-Grid. Dzięki konsorcjum możliwe było również przeprowadzenie testów na różnych modelach procesorów graficznych. Ostatnia, trzecia część pracy poświęcona jest analizie i wstępnej implementacji alternatywnego sformułowanie metody HF w którym diagonalizacja macierzy Focka zastąpiona jest przez minimalizację energii względem macierzy gęstości. Podejście to, w przeciwieństwie do standardowego, umożliwia efektywne wykorzystanie architektur silnie równoległych, w tym GPGPU. Implementacja wykorzystująca macierze gęste okazała się niewystarczająco efektywna. W pracy naszkicowano możliwość przyszłej implementacji korzystającej z rzadkości macierzy pojawiających się w metodzie HF. Takie podejście powinno dać asymptotycznie liniowe skalowanie.