Polska obliczeniowa, AD 2010

Transkrypt

Polska obliczeniowa, AD 2010
Polska obliczeniowa,
AD 2010
Paweł Gepner, Intel
Krzysztof Góźdź, HP
© 2008 Hewlett-Packard Development Company, L.P.
The information contained herein is subject to change without notice
Agenda
1.
Architektury
Projekty
3. Nasze zasoby
4. Świat
2.
5.
Wyzwania i narzędzia
1. Architektury
Klaster
(MPP)
(Konstelacja)
SMP
PC
GP GPU
Pamięć
Procesor
We/Wy
Pamięć
Magistrala systemowa
•
•
Klaster
SMP
GP
GPU
Procesory
FPGA
Komputer wektorowy
Zunifikowan
e
zarządzanie
Ten sam
system
operacyjny
Wspólna architektura
CPU
2. Projekty
Otwarta, ogólnoPoLska infrastruktura
gridowa wspierająca badania naukowe
•
•
•
•
•
•
5 KDM-ów: Cyfronet, ICM, PCSS, TASK i
WCSS
Koordynowany przez Cyfronet
Cyfronet, ICM, i PCSS
Koordynowany przez ICM
5 KDM-ów i 20 innych ośrodków, głównie
MAN-ów
Koordynowany przez PCSS
Program Obliczeń WIElkich Wyzwań
Nauki i Techniki
Celem projektu jest udostępnienie w
polskich centrach Komputerów Dużej
Mocy nowych architektur obliczeniowych
PLATforma Obsługi Nauki, usługi:
1. wideokonferencji
2. eduroam
3. kampusowe
4. powszechnej archiwizacji
5. naukowej interaktywnej telewizji HD
3. Nasze zasoby
1.
2.
3.
4.
5.
6.
FLOPS – liczba elementarnych operacji arytmetycznych w ciągu 1 s
Największe superkomputery świata – pojedyncze/4.7 PetaFLOPS =
bilardy (1015), w Polsce – kilkadziesiąt/sto TeraFLOPS = bilionów
(1014)
To oznacza, że najsilniejszy system w Polsce ma 2% wydajności
największego systemu w świecie i 8% - w Europie
W praktyce komunikacja pomiędzy procesorami/węzłami obniża
wydajność
Test LINPACK
Lista TOP500 ogłaszana 2 razy w roku podczas ISC w Niemczech
oraz SC w USA
3. Nasze zasoby
Ośrodek/firma
Cyfronet („Zeus”)
Nasza Klasa
QXL (Allegro, …)
TASK („Galera”)
PCSS („Reef”)
WCSS („Supernova”)
•
•
•
TFLOPS Pozycja Producent
88
84 HP/Intel
47
185 HP/Intel
41
249 HP/Intel
38
297 Action/Intel
37
313 HP/Intel
35
372 HP/Intel
Z 6 superkomputerami Polska jest 8. krajem w świecie i 5. w Europie
(za Niemcami, Francją, Wielką Brytanią i Rosją)
Wynosząca 285 TFLOPS Łączna wydajność wszystkich polskich
systemów stanowi 0.6% łącznej wydajności wszystkich
superkomputerów z listy
Brak publikacji z Polski na ISC 2010 i SC’10
4. Świat
•
•
•
•
•
•
•
•
•
HPC rozwija się szybciej niż rynek serwerowy
Eksplozja Chin (#1 i #3) z 0 do 41 systemów w ciągu 3 lat
Architektury wielordzeniowe
Klastry zdominowały rynek
Brak maszyn SMP
Brak maszyn wektorowych
Linux zdominował praktycznie rynek
GP GPU stanowi 1% instalacji na TOP500 (tyle co MS Windows
HPC Server 2008), bardzo duża wydajność teoretyczną, ale nawet w
LINPACK’u degradacja na poziomie 50%
Inwestycje w R&D w wielu krajach spowodują rozwój HPC i zmianę
topografii dużych systemów LRZ, HLRZ, CEA –Tera 100, TUO,
NIFF, CIŚ)
5. Wyzwania …
1.
2.
3.
4.
5.
Skalowalność aplikacji oraz brak nowego modelu i
algorytmów dla zadań Exascale’owych
Środowisko programistyczne nienadążające za
rozwojem sprzętu
Większe moce obliczeniowe = wyższe wymagania
środowiskowe (wielkość, waga, pobór prądu,
wydzielania ciepła)
Szybsza pamięć masowa do obróbki danych
Pojemniejsza pamięć masowa do przechowywania
Petascale’owych ilości danych
5. … i narzędzie Intel’a dla HPC
1.
2.
3.
4.
5.
6.
Sandy Bridge i AVX – 2011, Haswell i FMA - 2013
GP GPU: MIC ”Knights Corner”, 22nm, > 50 cores, x86
Dyski SSD
Software - Cilk++
ExaTec Lab, Paris
ExaCluster Lab, Jülich
5. … i narzędzia HP dla HPC
1.
2.
3.
4.
Serwery BL i SL
POD, garage, szafa chłodzona wodą
Zrównoleglony system plików
Rozwiązania dyskowe o bardzo dużej gęstości
(PB/szafa)
Podsumowanie
1.
Architektury
Projekty
3. Nasze zasoby
4. Świat
2.
5.
Wyzwania i narzędzia
Dziękujemy za uwagę!
© 2008 Hewlett-Packard Development Company, L.P.
The information contained herein is subject to change without notice