Grid komputerowy - Edukacja.Info.PL
Transkrypt
Grid komputerowy - Edukacja.Info.PL
Grid komputerowy System rozproszony nie ma sÅ‚abych punktÃłw. Wielokrotne kopie danych i automatyczne wyznaczanie zadaÅ„ komputerowych dla dostÄ™pnych zasobÃłw zapewnia ich szerokie zrÃłwnowaÅźenie i uÅ‚atwia dostÄ™p do danych wszystkim uczestnikom projektu, niezaleÅźnie od szerokoÅ›ci geograficznej. GRID KOMPUTEROWY - NOWE NARZĘDZIE W NAUCE Budowany w CERN koÅ‚o Genewy Large Hadron Collider LHC jest najwiÄ™kszym na Å›wiecie urzÄ…dzeniem badawczym. Kiedy zostanie uruchomiony w 2007 roku, jego wielkie detektory ATLAS, CMS, LHCb oraz ALICE, otaczajÄ…ce miejsca zderzeÅ„ rozpÄ™dzonych do ogromnych energii przeciwbieÅźnych wiÄ…zek protonÃłw (lub jonÃłw oÅ‚owiu), bÄ™dÄ… produkować 10-15 petabajtÃłw (milionÃłw gigabajtÃłw) danych rocznie. Dane te bÄ™dÄ… szczegÃłÅ‚owo analizowane i porÃłwnywane z symulacjami komputerowymi obliczeÅ„ teoretycznych. W miarÄ™ upÅ‚ywu czasu ich liczba jeszcze bÄ™dzie rosÅ‚a. SYSTEMY ROZPROSZONE W eksperymentach na LHC uczestniczy 5 tysiÄ™cy naukowcÃłw z okoÅ‚o 500 instytutÃłw badawczych i uniwersytetÃłw na caÅ‚ym Å›wiecie. Wszyscy oni muszÄ… mieć zapewniony peÅ‚ny dostÄ™p do danych przez caÅ‚y czas pracy LHC, ktÃłry przewiduje siÄ™ na 15-20 lat. Uaktualnianie, analiza i przechowywanie danych wymagajÄ… olbrzymich pamiÄ™ci i mocy obliczeniowej rzÄ™du 100 tys. CPU-s (Central Processing Units). Zcentralizowanie tych urzÄ…dzeÅ„ w jednym miejscu, w pobliÅźu eksperymentu w CERN, pozornie naturalne, w rzeczywistoÅ›ci jednak byÅ‚oby organizacyjnie bardzo trudne. Postanowiono zastosować inny, bardziej optymalny, sposÃłb: globalny Grid, czyli model rozproszonych mocy obliczeniowych. (Nazwa Grid pochodzi z analogii z sieciÄ… elektrycznÄ…: kiedykolwiek uÅźytkownik podÅ‚Ä…czy siÄ™ do tej sieci, nie musi siÄ™ zastanawiać, gdzie jest źrÃłdÅ‚o zasilania. Inaczej mÃłwiÄ…c uÅźytkownicy mogÄ… traktować Grid jako urzÄ…dzenie, z ktÃłrego na ÅźÄ…danie mogÄ… czerpać moc obliczeniowÄ… i przechowywać dane.) OznaczaÅ‚o to potrzebÄ™ zbudowania sprawnego systemu pozwalajÄ…cego przesyÅ‚ać dane czy programy do rozmieszczonych na caÅ‚ym globie elementÃłw komputerowych, na ktÃłrych bÄ™dÄ… wykonywane obliczenia i analizowane wyniki. Koszty utrzymania i uaktualniania koniecznych mocy obliczeniowych do takiego komputerowego wyzwania sÄ… znacznie Å‚atwiejsze do poniesienia w Å›rodowisku rozproszonym. PoszczegÃłlne instytuty i organizacje narodowe uczestniczÄ…ce w projekcie mogÄ… znaleźć lokalne zasoby komputerowe i przejąć za nie odpowiedzialność, przyczyniajÄ…c siÄ™ w ten sposÃłb do osiÄ…gniÄ™cia celu globalnego. Ponadto, system rozproszony nie ma sÅ‚abych punktÃłw. Wielokrotne kopie danych i automatyczne wyznaczanie zadaÅ„ komputerowych dla dostÄ™pnych zasobÃłw zapewnia ich szerokie zrÃłwnowaÅźenie i uÅ‚atwia dostÄ™p do danych wszystkim uczestnikom projektu, niezaleÅźnie od szerokoÅ›ci geograficznej. Podstawy systemÃłw gridowych opracowano juÅź w poÅ‚owie lat 90. w Stanach Zjednoczonych. ByÅ‚y to systemy Condor i Globus. W Europie Grid pojawiÅ‚ siÄ™ nieco pÃłÅºniej, jednym z systemÃłw byÅ‚ http://edukacja.info.pl - Edukacja.Info.PL Powered by Mambo Generated: 2 March, 2017, 06:10 DataGrid, stworzony w celu opracowania danych fizyki, biologii i obserwacji Ziemi, zorganizowany przez CERN. UczestniczyÅ‚y w nim przede wszystkim duÅźe instytuty Francji, Wielkiej Brytanii i WÅ‚och. W ramach tego projektu stworzono podstawy oprogramowania pozwalajÄ…cego na wykonywanie obliczeÅ„ fizycznych w rozproszonym systemie komputerowym oraz sprawdzono jego pracÄ™. Pokrewnym projektem byÅ‚ projekt Unii Europejskiej CrossGrid, ktÃłry kontynuowaÅ‚ prace rozpoczÄ™te przez DataGrid i rozszerzaÅ‚ je na aplikacje niezwiÄ…zane z fizykÄ…. UczestniczyÅ‚y w nim instytucje z 11 krajÃłw, w tym pięć z Polski, a koordynatorem byÅ‚ ACK CYFRONET AGH (zespÃłÅ‚ pod kierunkiem dr. M. Bubaka z KI AGH i prof. MichaÅ‚a TuraÅ‚y z IFJ PAN). Oprogramowanie stworzone przez DataGrid oraz infrastruktura gridowa pozwoliÅ‚y na uruchomienie we wrzeÅ›niu 2003 Å›wiatowego Gridu do fizyki pod nazwÄ… "LCG-LHC Computing Grid". Pierwsza instalacja skupiaÅ‚a 14 oÅ›rodkÃłw z Europy, w tym i krakowski klaster kilkudziesiÄ™ciu procesorÃłw Intel z oprogramowaniem Linux. ORGANIZACJE WIRTUALNE Koncepcja Å›wiatowego Gridu jest prosta, jednak jej realizacja stanowi ogromne wyzwanie, tak pod wzglÄ™dem technicznym, jak i organizacyjnym. Zadania projektu LCG polegajÄ… na rozwiniÄ™ciu infrastruktury i utrzymaniu bazy sÅ‚uÅźb komputerowych w rozproszonym modelu oraz stworzeniu programÃłw do scalenia tych urzÄ…dzeÅ„ w jeden sprawny i wydajny system obliczeniowy - Grid. NaleÅźy opracować sposÃłb zarzÄ…dzania uÅźytkownikami i ich prawami w miÄ™dzynarodowym, niejednorodnym i rozproszonym Å›rodowisku. SÅ‚uÅźy temu koncepcja "organizacji wirtualnych" (VO). Osobnym zadaniem jest opracowanie zarzÄ…dzania akwizycjÄ…, instalacjÄ… i planowaniem pojemnoÅ›ci do duÅźej liczby skÅ‚adowych sprzÄ™towych (hardwarowych) tworzÄ…cych fizycznÄ… pÅ‚aszczyznÄ™ LCG. Dane z eksperymentÃłw na LHC bÄ™dÄ… rozprowadzane po caÅ‚ym Å›wiecie zgodnie z modelem czterowÄ™zÅ‚owym. Pierwotny zapis danych na taÅ›mach, dokonywany w CERN, bÄ™dzie stanowić wÄ™zeÅ‚ zerowy LCG - Tier-0. Dane te zostanÄ… skopiowane do serii wÄ™zÅ‚Ãłw Tier-1 - wielkich centrÃłw komputerowych, o duÅźych zasobach pamiÄ™ciowych - gdzie bÄ™dÄ… wstÄ™pnie opracowywane i kompresowane w mniejsze obiekty. Centra Tier-1 udostÄ™pniÄ… dane wÄ™zÅ‚om Tier2, z ktÃłrych kaÅźdy skÅ‚ada siÄ™ z wielu wspÃłÅ‚pracujÄ…cych urzÄ…dzeÅ„ liczÄ…cych, posiadajÄ…cych dostatecznÄ… moc obliczeniowÄ… do analizy przypadkÃłw fizycznych oraz duÅźych pamiÄ™ci do przechowywania rezultatÃłw. System gridowy Tier-0, Tier-1 i Tier-2 bÄ™dzie do dyspozycji eksperymentÃłw poprzez odpowiednie "organizacje wirtualne". Indywidualni fizycy bÄ™dÄ… mieli dostÄ™p do danych przez liczÄ…ce centra Tier-3, ktÃłre mogÄ… siÄ™ skÅ‚adać z lokalnych klasterÃłw na wydziaÅ‚ach uniwersyteckich lub nawet z indywidualnych pecetÃłw, i ktÃłre mogÄ… być wÅ‚Ä…czone do regularnej bazy LCG. OPERACJE, POWODZIE, SKAÅ»ENIA http://edukacja.info.pl - Edukacja.Info.PL Powered by Mambo Generated: 2 March, 2017, 06:10 Analiza przypadkÃłw fizycznych nie jest jedynym zastosowaniem Gridu. MoÅźliwość uzyskania wyniku w bardzo krÃłtkim czasie, w szczegÃłlnoÅ›ci "uczenie" jak w sieciach neuronowych, rozproszonej infrastruktury obliczeniowej oraz dostÄ™p do odlegÅ‚ych mocy obliczeniowych "na Åźyczenie" w trakcie przebiegu eksperymentu, doskonale siÄ™ nadajÄ… do wykorzystania Gridu w rÃłÅźnych aplikacjach. Wspomniany wyÅźej projekt CrossGrid obejmuje na przykÅ‚ad moÅźliwość zastosowania Gridu w medycynie lub sytuacjach kryzysowych na ogÃłÅ‚ wymagajÄ…cych "natychmiastowych" (tzn. bardzo szybkich) decyzji. W 2005 aplikacje te zostaÅ‚y uznane za jedne z najlepszych przykÅ‚adÃłw wykorzystania Gridu. W przypadku medycyny chodzi o wspomaganie komputerowe lekarza z dowolnie odlegÅ‚ego miejsca na kuli ziemskiej, w trakcie podejmowania decyzji, dotyczÄ…cych niektÃłrych zabiegÃłw chirurgicznych, jak np. optymalizacja by-passÃłw. Oprogramowanie powinno pomÃłc w wybraniu najlepszego rozwiÄ…zania, jeÅ›li idzie o inwazyjność - minimalizowanie czasu trwania i rozlegÅ‚oÅ›ci operacji, i konsekwencje - ciÅ›nienie krwi w krwioobiegu po zabiegu. Wspomaganie przez rozproszonÄ… sieć gridowÄ… sztabu kryzysowego w sytuacjach zbliÅźajÄ…cej siÄ™ powodzi pozwoli z duÅźym prawdopodobieÅ„stwem przewidzieć realne zagroÅźenie. Konieczna jest wtedy natychmiastowa, dogÅ‚Ä™bna, na szerokim obszarze, analiza opadÃłw, pogody, ukÅ‚adu geologicznego i hydrogeologicznego, oraz wykorzystanie informacji o przebiegu podobnych wydarzeÅ„ w przeszÅ‚oÅ›ci, co wymaga mocy obliczeniowych przekraczajÄ…cych dziesiÄ…tki razy dostÄ™pne w typowym oÅ›rodku komputerowym. Prowadzone z wykorzystaniem rozproszonej infrastruktury gridowej badania przewidywaÅ„ skaÅźeÅ„ Å›rodowiska powstajÄ…cych w okreÅ›lonych sytuacjach pogodowych pozwolÄ… zminimalizować efekty uboczne (np. elektrownia moÅźe dobierać jakość wÄ™gla w zaleÅźnoÅ›ci od kierunkÃłw wiatrÃłw i roznoszenia pyÅ‚Ãłw) - i ten przypadek wymaga szybkich decyzji, w sytuacji zmiennych warunkÃłw atmosferycznych. Obecnie ACK CYFRONET AGH i IFJ PAN naleÅźÄ… do grona doÅ›wiadczonych partnerÃłw i uczestniczÄ… w kilku nowych inicjatywach gridowych, w tym nowych projektach europejskich: KWfGrid, EGEE, ViroLab czy BalticGrid, w ktÃłrych czÄ™sto odgrywajÄ… role wiodÄ…ce. http://edukacja.info.pl - Edukacja.Info.PL Powered by Mambo Generated: 2 March, 2017, 06:10