Polska obliczeniowa, AD 2010
Transkrypt
Polska obliczeniowa, AD 2010
Polska obliczeniowa, AD 2010 Paweł Gepner, Intel Krzysztof Góźdź, HP © 2008 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice Agenda 1. Architektury Projekty 3. Nasze zasoby 4. Świat 2. 5. Wyzwania i narzędzia 1. Architektury Klaster (MPP) (Konstelacja) SMP PC GP GPU Pamięć Procesor We/Wy Pamięć Magistrala systemowa • • Klaster SMP GP GPU Procesory FPGA Komputer wektorowy Zunifikowan e zarządzanie Ten sam system operacyjny Wspólna architektura CPU 2. Projekty Otwarta, ogólnoPoLska infrastruktura gridowa wspierająca badania naukowe • • • • • • 5 KDM-ów: Cyfronet, ICM, PCSS, TASK i WCSS Koordynowany przez Cyfronet Cyfronet, ICM, i PCSS Koordynowany przez ICM 5 KDM-ów i 20 innych ośrodków, głównie MAN-ów Koordynowany przez PCSS Program Obliczeń WIElkich Wyzwań Nauki i Techniki Celem projektu jest udostępnienie w polskich centrach Komputerów Dużej Mocy nowych architektur obliczeniowych PLATforma Obsługi Nauki, usługi: 1. wideokonferencji 2. eduroam 3. kampusowe 4. powszechnej archiwizacji 5. naukowej interaktywnej telewizji HD 3. Nasze zasoby 1. 2. 3. 4. 5. 6. FLOPS – liczba elementarnych operacji arytmetycznych w ciągu 1 s Największe superkomputery świata – pojedyncze/4.7 PetaFLOPS = bilardy (1015), w Polsce – kilkadziesiąt/sto TeraFLOPS = bilionów (1014) To oznacza, że najsilniejszy system w Polsce ma 2% wydajności największego systemu w świecie i 8% - w Europie W praktyce komunikacja pomiędzy procesorami/węzłami obniża wydajność Test LINPACK Lista TOP500 ogłaszana 2 razy w roku podczas ISC w Niemczech oraz SC w USA 3. Nasze zasoby Ośrodek/firma Cyfronet („Zeus”) Nasza Klasa QXL (Allegro, …) TASK („Galera”) PCSS („Reef”) WCSS („Supernova”) • • • TFLOPS Pozycja Producent 88 84 HP/Intel 47 185 HP/Intel 41 249 HP/Intel 38 297 Action/Intel 37 313 HP/Intel 35 372 HP/Intel Z 6 superkomputerami Polska jest 8. krajem w świecie i 5. w Europie (za Niemcami, Francją, Wielką Brytanią i Rosją) Wynosząca 285 TFLOPS Łączna wydajność wszystkich polskich systemów stanowi 0.6% łącznej wydajności wszystkich superkomputerów z listy Brak publikacji z Polski na ISC 2010 i SC’10 4. Świat • • • • • • • • • HPC rozwija się szybciej niż rynek serwerowy Eksplozja Chin (#1 i #3) z 0 do 41 systemów w ciągu 3 lat Architektury wielordzeniowe Klastry zdominowały rynek Brak maszyn SMP Brak maszyn wektorowych Linux zdominował praktycznie rynek GP GPU stanowi 1% instalacji na TOP500 (tyle co MS Windows HPC Server 2008), bardzo duża wydajność teoretyczną, ale nawet w LINPACK’u degradacja na poziomie 50% Inwestycje w R&D w wielu krajach spowodują rozwój HPC i zmianę topografii dużych systemów LRZ, HLRZ, CEA –Tera 100, TUO, NIFF, CIŚ) 5. Wyzwania … 1. 2. 3. 4. 5. Skalowalność aplikacji oraz brak nowego modelu i algorytmów dla zadań Exascale’owych Środowisko programistyczne nienadążające za rozwojem sprzętu Większe moce obliczeniowe = wyższe wymagania środowiskowe (wielkość, waga, pobór prądu, wydzielania ciepła) Szybsza pamięć masowa do obróbki danych Pojemniejsza pamięć masowa do przechowywania Petascale’owych ilości danych 5. … i narzędzie Intel’a dla HPC 1. 2. 3. 4. 5. 6. Sandy Bridge i AVX – 2011, Haswell i FMA - 2013 GP GPU: MIC ”Knights Corner”, 22nm, > 50 cores, x86 Dyski SSD Software - Cilk++ ExaTec Lab, Paris ExaCluster Lab, Jülich 5. … i narzędzia HP dla HPC 1. 2. 3. 4. Serwery BL i SL POD, garage, szafa chłodzona wodą Zrównoleglony system plików Rozwiązania dyskowe o bardzo dużej gęstości (PB/szafa) Podsumowanie 1. Architektury Projekty 3. Nasze zasoby 4. Świat 2. 5. Wyzwania i narzędzia Dziękujemy za uwagę! © 2008 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice