superkomputer zeus po raz trzeci

Transkrypt

superkomputer zeus po raz trzeci
Historia sukcesu
HP Business Journal
10
Superkomputer
Zeus po raz trzeci
w pierwszej setce rankingu Top500
Karol Krawentek
Zastępca Dyrektora ds. Infrastruktury Informatycznej Cyfronetu
Zuzanna Matyjak
Gdy w 2004 r. pracownicy Akademickiego Centrum Komputerowego Cyfronet krakowskiej AGH
zaczęli tworzyć superkomputer Zeus, nie przypuszczali, że po kilku latach stanie się on
najsilniejszą maszyną w Polsce i jedną z najwydajniejszych na świecie.
N
a listę Top500 – najpotężniejszych komputerów
świata – Zeus trafił po raz pierwszy w listopadzie
2009 r., wówczas ulokował się na 331. pozycji.
Rok później był już w pierwszej setce, z której do
tej pory nie wypadł. W ostatnim zestawieniu, z listopada 2011 r.,
zajmuje 88. miejsce. Krakowski klaster Zeus wykorzystywany jest
do najbardziej wymagających obliczeń z dziedziny chemii, biologii, nanotechnologii, astrofizyki (projekt CTA), fizyki kwantowej,
energetyki, farmakologii, a także skomplikowanych i wymagających wielkich zasobów obliczeń z innych dziedzin nauki. Zeus
jest także częścią infrastruktury obliczeniowej w prestiżowym, międzynarodowym projekcie LHC, koordynowanym przez Centrum
Badań Fizyki Jądrowej CERN w Szwajcarii, w którym udział biorą
fizycy z wielu polskich instytutów naukowych i uczelni (m.in. ponad 40 osób z Akademii Górniczo-Hutniczej). Superkomputer Zeus stanowi część ogólnopolskiej infrastruktury obliczeniowej, utworzonej w ramach projektu Infrastruktura
Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni
Badawczej PL-Grid, która daje łatwy, darmowy dostęp polskiego
środowiska naukowego do mocy obliczeniowej.
Ewolucja kluczem do sukcesu
Misją Cyfronetu, od początku jego istnienia, jest udostępnianie
mocy obliczeniowej oraz innych usług informatycznych podmiotom realizującym badania naukowe. Pierwszym komputerem
dużej mocy, w który wyposażono Cyfronet, był zainstalowany w 1975 r. komputer CDC Cyber 72. Teoretyczna maksymalna
moc obliczeniowa tego dużego i nowoczesnego w tamtych
czasach komputera wynosiła 0,5 MFlops.
Obecność na liście służy polskiej nauce
Krakowskim superkomputerem zarządzają jego twórcy – pracownicy Akademickiego Centrum Komputerowego Cyfronet AGH. Cyfronet założony w 1973 r. jest autonomiczną jednostką Akademii Górniczo-Hutniczej w Krakowie, która dziś jest jednym z największych centrów superkomputerowych i sieciowych w Polsce.
– Obecność na liście Top500 wyraźnie przekłada się na liczbę
polskich naukowców korzystających z mocy obliczeniowej Zeusa
– mówi Karol Krawentek, Zastępca Dyrektora ds. Infrastruktury
Informatycznej Cyfronetu. Po każdej publikacji rankingu Top500,
w którym notowany jest Zeus, zauważalny jest skokowy wzrost
liczby użytkowników oraz zadań naukowych zadawanych
Zeusowi. W ramach samego tylko projektu PL-Grid z mocy Zeusa
skorzystało już ok. 900 naukowców.
Stała obecność Zeusa na liście Top500 ma jeszcze jeden wymiar
– świadczy o jego ciągłym rozwoju i rozbudowie. – A to bardzo
ważna wiadomość dla środowiska naukowego. Daje naukowcom korzystającym z zasobów Zeusa gwarancję stabilności ich
badań. Wiedzą, że mogą je kontynuować bez ryzyka, że za
chwilę będą zmuszeni przenieść się z obliczeniami w zupełnie
inne środowisko obliczeniowe – podkreśla Karol Krawentek.
– Naukowcy coraz intensywniej korzystają z naszych usług. Wiemy jednak, że to wciąż czubek góry lodowej potrzeb polskiej nauki – mówi prof. Kazimierz Wiatr, Dyrektor Naczelny Cyfronetu. Zeus jest niezwykle zajęty – w każdej chwili pracuje
nad 3-5 tysiącami zadań. W tym samym czasie już następne
500 do 1000 zadań czeka w kolejce na wolne moce obliczeniowe. Średnie wykorzystanie krakowskiego klastra wynosi
88 procent, co w praktyce oznacza, że jego obciążenie jest
maksymalne.
O mocy Zeusa może świadczyć jeden z przykładów: w miesiąc
poradził sobie z przeprowadzeniem symulacji działania nowego
antybiotyku. Gdyby spróbować wykonać tę pracę na komputerze
PC, trwałaby ona 165 lat.
88. miejsce na liście Top500 to nie tylko wielki
sukces Cyfronetu, ale także niewątpliwa
promocja polskiej nauki.
Teoretyczna moc najsilniejszego obecnie superkomputera Cyfronetu – klastra Zeus – wynosi 162,41 TFlops (moc rzeczywista 128,79 TFlops). Wyposażony jest on w 22 TB (terabajty)
pamięci operacyjnej RAM oraz pamięć dyskową o pojemności
1,8 PB (petabajta). Zbudowano go z ponad 1200 pojedynczych
serwerów typu „blade” dostarczonych przez firmę Hewlett-Packard, połączonych ze sobą za pomocą superszybkiej sieci Infiniband o prędkości 40 Gb/s. Część serwerów została wyposażona
w karty z procesorami graficznymi GPGPU firmy Nvidia, które
umożliwiają przyśpieszenie niektórych algorytmów używanych
w aplikacjach naukowych. Klaster pracuje pod kontrolą systemu
operacyjnego Scientific Linux. Zeus wraz z infrastrukturą administracyjną i techniczną zajmuje blisko 100-metrowe pomieszczenie
w przestrzeni Cyfronetu. Krakowski superkomputer podlega
ciągłej ewolucji. Od momentu powstania w 2004 r. jego moc
wzrosła ponadstukrotnie. O sukcesie Zeusa zadecydowało kilka
elementów, ale przede wszystkim elastyczność zastosowanych
rozwiązań, które mogą być nieustannie rozwijane.
– Tu nic nie jest implementowane raz na zawsze. Każdy element
infrastruktury może być wymieniony na bardziej zaawansowany
i wydajniejszy, Zeus podlega więc ciągłej rozbudowie i staje się
coraz silniejszy – mówi dr Maciej Twardy, Zastępca Dyrektora ds. bezpieczeństwa danych i informacji Cyfronetu. Historia sukcesu
HP Business Journal
12
Prof. dr hab. inż. Kazimierz Wiatr
Dyrektor Naczelny Akademickiego Centrum
Komputerowego Cyfronet Akademii Górniczo-Hutniczej
Naszym celem jest wspieranie polskiej nauki. Pomaga
nam w tym obecność na liście Top500. Od paru lat
jesteśmy już na swoistej liście Top100, czyli mieścimy
się w pierwszej setce rankingu 500 najmocniejszych
komputerów świata. Udało nam się to już trzykrotnie.
Wysoka lokata w tym rankingu bardzo pomaga nam w realizacji naszej misji. Wielu polskich naukowców
wciąż dokonuje swoich obliczeń poza krajem, nie
wiedząc, że mogą liczyć w Polsce.
Moją idèe fixe jest to, żeby myśl naukowa, patenty i licencje stały się polskim towarem eksportowym. A działalność Cyfronetu jest jednym z trybików, które
nas do takiego stanu zbliżają. Nasza rola jest służebna
wobec polskiej nauki i realizując ją stajemy się
współodpowiedzialni za sukcesy naszych naukowców.
Zeus – uniwersalny, ergonomiczny,
wygodny
Zeus jest też wyjątkowy ze względu na swoją uniwersalność – to
komputer, który zaspokaja potrzeby obliczeniowe badaczy pracujących w bardzo wielu dziedzinach naukowych. Inżynierom z Cyfronetu udało się dokonać rzeczy niemożliwej, czyli zbudować komputer „do wszystkiego”. W ramach Zeusa istnieje kilka
grup zasobów obliczeniowych: po pierwsze – klasyczny klaster
obliczeniowy, po drugie – zestaw serwerów wyposażonych w karty GPGPU Nvidia, czyli akceleratory graficzne, dzięki którym uzyskuje się znaczny przyrost mocy obliczeniowych, po trzecie – zainstalowane w zeszłym roku dodatkowe oprogramowanie
vSMP, czyli system pozwalający zbudować wirtualny komputer
SMP posiadający dużo pamięci współdzielonej. Technologia ta
pozwala efektywnie wykorzystywać i skalować pakiety obliczeniowe i oprogramowanie, które nie było projektowane z myślą
o środowiskach klastrowych. Olbrzymia pojemność pamięci
umożliwia użytkownikom wykonywanie obliczeń wymagających
błyskawicznego dostępu do dużej ilości danych.
Taka struktura Zeusa powoduje, że naukowiec, który chce liczyć
w Cyfronecie ma do dyspozycji szereg rozwiązań sprzętowych
dedykowanych do różnych celów obliczeniowych. Dopełnieniem
części klastrowej Zeusa, służącej obliczeniom, są też zasoby
dyskowe z różnego rodzaju pamięcią masową. Użytkownik widzi
jednak jeden system obliczeniowy i często nie jest świadomy,
że jest on aż tak skomplikowany i rozbudowany. I nie musi tego
wiedzieć. Z punktu widzenia naukowca, korzystanie z Zeusa jest
bardzo proste. To też jeden z elementów sukcesu superkomputera
z Krakowa – ergonomia i wygoda prowadzenia obliczeń.
– O sukcesie Zeusa zadecydowała perspektywiczna wizja
rozwoju oraz konsekwencja w budowie tej infrastruktury – podsumowuje dr Maciej Twardy. Zwraca też uwagę na to, że budując
Zeusa zadbano o wybór rozwiązań wysokiej jakości, spójnych
pod kątem administrowania. To sprawia, że tak skomplikowanym i rozbudowanym superkomputerem zarządza dziś zaledwie 3-osobowy zespół administratorów.
Bezpieczeństwo przede wszystkim
Kolejnym wyjątkowym dla Zeusa aspektem jest przyjęta od
początku koncepcja jego budowy – na wszelkich możliwych poziomach zadbano o redundancję, czyli nadmiarowość rozwiązań w stosunku do tego, co w takich systemach jest konieczne. Chodzi o zapewnienie użytkownikom maksymalnego bezpieczeństwa ich badań. Zeusa wyposażono m.in. w podwójne
tory zasilające oraz specjalną klimatyzację, dedykowaną do tak
wysokiej gęstości systemów obliczeniowych. Zeus dzięki temu jest
praktycznie bezawaryjny.
Uzasadnieniem tak wysokiego poziomu ochrony jest skrajnie
wysoka temperatura, generowana przez Zeusa, która bez tych
zabezpieczeń mogłaby zagrozić wynikom pracy naukowców.
Jeden Zeus generuje bowiem temperaturę porównywalną z temperaturą wydzielaną przez kilkaset pracujących na pełnej mocy
piekarników.
– Systemy zabezpieczeń zostały tak zaprojektowane, by w przypadku awarii zasilania klimatyzacji zareagowały w ciągu
3 minut. To maksymalny dopuszczalny czas reakcji – mówi Karol
Krawentek.
Wkład naukowców w rozwój Zeusa
Tak jak Zeus pomaga naukowcom w ich sukcesach badawczych,
tak sami naukowcy pomagają Zeusowi rozwijać się w miarę ich
potrzeb.
– Nieustannie słuchamy naszych użytkowników i zastanawiamy
się, jak kształtować infrastrukturę Zeusa, by zaspokoić rosnące
i coraz bardziej zróżnicowane potrzeby obliczeniowe. Wręcz
zachęcamy użytkowników do uczestniczenia w pracach konfiguracyjnych Zeusa – mówi prof. Kazimierz Wiatr. W tym celu
zainicjowano kolejny program – PL-Grid Plus – w którym rola
użytkowników w konfigurowaniu infrastruktury będzie podmiotowa
i jeszcze większa.
Wymagania ze strony środowisk naukowych w odniesieniu do
infrastruktury informatycznej są zróżnicowane i w dużej mierze
zależą od dziedziny naukowej. Różnice mogą dotyczyć wydajności i typu infrastruktury obliczeniowej, zasobów programistycznych i baz danych, jak również unikalnego sprzętu pomiarowo-badawczego, stanowiącego element infrastruktury. Dlatego
konieczne jest dopasowanie cech infrastruktury informatycznej do
problemów stanowiących przedmiot badań naukowych. Celem
programu PL-Grid Plus jest więc przygotowanie specyficznych
środowisk obliczeniowych – tzw. gridów dziedzinowych – dostosowanych do potrzeb różnych grup naukowców. Najważniejsze
gridy dziedzinowe już wyselekcjonowano – są to biologia i nanotechnologie, chemia kwantowa i fizyka molekularna, fizyka
wysokich energii, astronomia i astrofizyka, akustyka, problemy life
science, zdrowie, bioinformatyka, ekologia, energetyka, materiały, badania synchrotronowe, metalurgia. Lista nie jest jednak
zamknięta i wciąż pojawiają się na niej kolejne grupy o specyficznych, zróżnicowanych potrzebach informatycznych.
– Jak wiadomo największe sukcesy naukowe powstają na styku
różnych dziedzin. W Cyfronecie mamy nadzieję, że to zderzenie
zaawansowanych badań naukowych z najnowszymi technologiami informatycznymi, które tu ma miejsce, przyniesie polskiej nauce
wiele niezwykle ważnych odkryć – mówi prof. Kazimierz Wiatr.
Krzysztof Góźdź
Konsultant ds. Systemów Obliczeniowych Wielkiej Mocy, HP Polska
Przykład Cyfronetu pokazuje, że nawet nie dysponując budżetem, na jaki
mogą sobie pozwolić największe ośrodki obliczeniowe w Stanach
Zjednoczonych, Japonii czy Chinach, można zbudować system
spełniający najwyższe parametry techniczne. Konieczne jest
tutaj wizjonerstwo, właściwa strategia oraz konsekwencja przy jej
realizacji. Wart podkreślenia jest również fakt, iż Zeus jest w stanie
obsłużyć różnorodne typy obliczeń, to znaczy rozproszone w gridzie,
zrównoleglone na wielu tysiącach CPU, z akceleracją na GPU czy
też korzystające z dużej pamięci współdzielonej (architektura typu
SMP) przy zastosowaniu tej samej architektury procesorów, systemu
operacyjnego czy zunifikowanego podejścia do zasobów dyskowych.
Patrząc szerzej na listę Top500 cieszy nas także to, że produkty
oferowane przez HP znajdują zastosowanie zarówno w wielu wiodących
ośrodkach naukowych, jak i wśród firm komercyjnych potrzebujących
dużej mocy przetwarzania danych.
Ranking Top500
Organizacja Top500 od 1993 r. prowadzi ranking 500
najwydajniejszych komputerów na świecie i aktualizuje go
dwa razy w roku – w czerwcu i w listopadzie. Ostatnią listę
ogłoszono 14 listopada 2011 r. w Seattle podczas konferencji Supercomputing 11. Na stronie top500.org publikowane są także historyczne zestawienia superkomputerów wraz
ze statystykami ukazującymi m.in. położenie geograficzne
superkomputerów, ich producentów, używane technologie,
architekturę oraz przeznaczenie. Statystyki te pozwalają
śledzić trendy w rozwoju superkomputerów, ułatwiają
nawiązywanie kontaktów w środowisku informatycznym,
wymianę danych i oprogramowania, a także zapewniają
lepsze zrozumienie rynku komputerów dużej mocy.
Główną miarą wydajności, stosowaną dla superkomputerów, jest FLOPS, czyli liczba wykonywanych w ciągu sekundy operacji na liczbach zmiennoprzecinkowych. Podaje się
je z odpowiednim przedrostkiem SI, np. teraflops (TFlops) to 10¹² Flops, a petaflops (PFlops) to 10¹5 Flops. Wydajność
superkomputerów mierzy się za pomocą testów wzorcowych, z których najpopularniejszym jest LINPACK. Mierzy
on szybkość rozwiązywania gęstych układów równań liniowych. Superkomputery trafiające na listę Top500, testowane
są właśnie tą metodą. Najszybszym superkomputerem na
świecie jest japoński "K" zbudowany przez Fujitsu, którego
moc przekroczyła 10 PFlops. Na liście Top500 dominują
superkomputery z USA – stanowią ponad połowę wszystkich superkomputerów uwzględnionych w rankingu (263 maszyny). Na kolejnych miejscach znajdują się Chiny (74 komputery) i Japonia (30 jednostek). Polskie maszyny na liście Top500
Na ostatniej liście Top500 znalazło się sześć superkomputerów z Polski, co daje nam 6. miejsce pod względem liczby
notowanych na Top500 systemów.
Na miejscu 88. sklasyfikowany jest klaster Zeus pracujący w krakowskim Cyfronecie, który dysponuje 15 264 rdzeniami i ma wydajność 128 TFlops.
Miejsce 279. zajmuje gdański klaster Galera Plus, będący
częścią Centrum Informatycznego Trójmiejskiej Akademickiej
Sieci Komputerowej (CI TASK). Przy 10 384 rdzeniach ma
wydajność 65,6 TFlops.
Klaster Boreas o wydajności 64 TFlops, pracujący w Interdyscyplinarnym Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego
(ICM), sklasyfikowano na miejscu 296.
Maszyna z Poznańskiego Centrum Superkomputerowo-Sieciowego (PCSS) o wydajności 63 TFlops znajduje się na miejscu 298.
Farma serwerów grupy Allegro o wydajności 59 TFlops
trafiła na 348. miejsce rankingu. Superkomputer Supernova o wydajności 57 TFlops z Wrocławskiego Centrum Sieciowo-Superkomputerowego znalazł się na miejscu 360.

Podobne dokumenty