Projekty przetwarzania rozproszonego

Transkrypt

Projekty przetwarzania rozproszonego
Projekty przetwarzania
rozproszonego
Czyli o pie iądza h, przewidywaniu
oraz lekach
Agenda
•
•
•
•
•
•
•
SETI – zyli po zątki
BOINC
O iałka h słów kilka
Rosetta@home
Folding@home
Polskie projekty
Q&A
Czym jest system rozproszony?
SETI
• Projekt powstał w
• Celem jest poszukiwanie w kosmicznym
szu ie radiowy syg ałów od ywiliza ji
pozaziemskich.
SETI
• Po ijają pro le y teleko u ika yj e jakie
kodowa ie i odula ję syg ałów wykorzystują
kosmici?) oraz lokalizacyjne (z której strony
asłu hiwać? pozostaje pro le jak odróż ić
syg ały, które ogły zostać przez kos itów
wysła e
SETI
• Po zątkowo syg ał ył agrywa y a taś y
ag etofo owe i odsłu hiwa y a
magnetofonie.
• W lata h SETI używało radzie ki h a te
• W
NASA posta owiła fi a sować te
projekt.
Radioteleskop w Arecibo (Portoryko)
Allen Telescope Array w Kalifornii
SETI@home
• Powstało w
• Głów e ele:
roku
– Szukać syg ału od kos itów
– Udowod ić, że oż a wykorzystać volunteer
computing do elów aukowy h
SETI@home
• Radioteleskop w Arecibo nagrywa szum z
kosmosu.
• Każdego d ia powstaje około TB agrań,
które są wysyła e do Berkley.
SETI@home
• Ta
agra ia są dzielo e a pa zki pod
względe zasu i zęstotliwoś i po około
seku d . MB i wysyła e u zest iko .
• Software na komputerach uczestników
wyszukuje pewnych cech w nagraniach i
odsyła wy iki z powrote
a serwer.
Wyniki
• Kos itów jesz ze ie usłysza o
• Zlokalizowano kilka ciekawych gwiazd
• …
Udowod io o, że się da!
• Po ad .
ilio ów u zest ików a ały
świe ie,
• Ko putery wyko ały po ad
ilio y lat
pracy
• Rekord Guinessa: 1021 FLOP jednego dnia
BOINC
• Berkeley Open Infrastructure for Network
Computing
• Rozwijany przez Uniwersytet Kalifornijski w
Berkeley
• Wspiera y fi a sowo przez a erykańską
rządową i stytu ję Natio al S ie e Foudation
BOINC
• Obecnie prawie 70 aktywnych projektów z
róż y h dziedzi , a przykład:
– Astronomia (kolizje)
– Genetyka
– Kryptografia szuka ie sła oś i szyfrowa ia
– Sza hy pro le oś iu het a ów
– Me ha ika pły ów
– Auto aty z e tłu a ze ia
Ile?
• Aktywnych: 289,445 wolontariuszy, 559,027
komputerów.
Śred ia z h: .
TeraFLOPS.
• Czyli 8 301 * 1012 operacji
z ie opozy yj y h a seku dę
Wymagania
• Pentium 233 MHz (Recommended: Pentium
500 MHz or greater)
• 64 MB RAM (Recommended: 128 MB RAM or
greater)
• 20 MB disk space
Scheduler
• )aj uje się dystry u ją frag e tów da y h
do o li zeń po iędzy klie tów
• A alizuje o ko puterów oraz dostęp ość
wolontariuszy
• Mi i alizuje o iąże ie sła y h aszy ,
wykorzystują ardziej o e
Proces
•
•
•
•
•
Serwer generuje porcje danych (work unit)
Jest ona dzielona na próbki
Pró ki są wysyła e do u zest ików
U zest i y o li zają pró ki i wysyłają wy iki
Na podstawie wyników walidator tworzy wynik
kanoniczny, który zapisuje do bazy danych
• Użytkow i y, który odesłali wy iki z liżo e do
wy iku ka o i z ego otrzy ują pu kty
Punkty (credits)
• Pu kty są przyz awa e za popraw e
obliczenia
• I h ilość zależy od zasu potrze ego do
przeliczenia próbki oraz mocy procesora i GPU
Białka
Białka
• Fu k ja iałka i to jak reaguje z i y i
olekuła i w większoś i są deter i owa e
przez i h kształt trójwy iarowa struktura
• Białka są sy tezowa e jako długie łań u hy
a i okwasów, ale większość z i h usi się
ajpierw ułożyć w ko kret e struktury
Białka
• Zrozumienie i przewidywanie procesu
układa ia jest jed y z głów y h pro le ów
biologii.
• Wiedzą jak iałka układają się i reagują oraz
poz a ie i h fu k ji oże ostate z ie
doprowadzić do odkry ia leków a ludzkie
choroby.
Białka
• Pew e a i okwasy przy iągają się do sie ie,
i e się odpy hają, i h róż e ułoże ie
powoduje z ia y e ergii układu.
• Fi al e złoże ie iałka, to takie które ędzie
iało aj iejsza e ergię.
Białka
• Struktura trze iorzędowa iałka oże yć
ustalo a ekspery e tal ie a przykład za
po o ą rezo a su ag ety z ego.
• Ale jest to etoda wol a dla owy h iałek
oże zająć awet iesią e i droga około
000$)
• Na
iałek w NCBI a y tylko
struktur trze iorzędowy h
Białka
• Jeśli to ogło y yć zro io e o li ze iowo,
z a z ie zredukowało y koszty i
zrewolu jo izowało y iologie struktural ą.
A
oże y tak zasy ulować?
• Na jed y współ zes y ko puterze
potrze a ałego d ia, a y zasy ulować
a oseku d składa ia
• Pro es składa ia iektóry h iałek zaj uje
milisekundy (106 nanosekundy)
Rosetta@home
• Zrozumienie sposo u, w jaki iałka za howują
się w aturze.
• Odtworzenie struktury trze iorzędowej iałek,
dla których ta struktura jest znana
• Przewidywanie kształtu iałek, dla który h ie
znamy tej struktury
• Wiedza ta oże przydać się do projektowa ia
iałek speł iają y h określo e fu k je, a
przykład wal zą y h z horo a i.
Rosetta@home
• Aktual ie dostar za ajdokład iejszego
przewidywa ia struktury trze iorzędowej
Magenta – przewidzia y kształt
Niebieski – rze zywisty kształt
Rosetta@home
1. ‘ozpo zy a y od ałkowi ie wyprostowa ego
łań u ha takiego jak etalowy łań u h
iąg ięty za o a koń e ,
2. Przesuwa y zęść łań u ha, a y stworzyć owy
kształt,
3. O li za y e ergię owego kształtu,
4. Ak eptuje y lu odrzu a y owy kształt w
zależ oś i od z ia y e ergii,
5. Powtarza y kroki od do , tak długo, aż każda
zęść łań u ha zosta ie przesu ięta wiele razy.
Rosetta@home
• W trak ie pra y z jed ą jed ostką, ko puter
wolontariusza wykonuje zazwyczaj od 5 do 20
razy algoryt , po zy odsyła kształty o
aj iższej e ergii z alezio e w każdej z i h.
• Póź iej kształty przesła e przez wszystki h
u zest ików są przegląda e i wy iera y jest
te o aj iższej e ergii.
Rosetta@home
• http://www43.atpages.jp/~boinc/img/1ubi_c
opyright.wmv
Malaria
• Jest wywoływa a przez pasożyta, który spędza
większość ży ia wew ątrz ko ara i przedostaje
się do orga iz u złowieka przy ukąsze iu
• Jed y po ysłe jest uodpor ie ie ko arów a
tego pasożyta poprzez eli i a ję pew y h ge ów
• Rosetta jest wykorzystywa a, a y z aleźć
odpowied ie e zy y, które ędą dezaktywować
te geny
Wąglik
• Rosetta pra uje, a y z udować odel toksy y
wąglika
• Dzięki te u pra e ad etoda i le ze ia
ędą łatwiejsze
HIV
• HIV jest wiruse , który „ au zył się” oszukiwać
układ i
u ologi z y.
• Rosetta jest wykorzystywa a, a y zaprojektować
ałe iałka, które są podo e do pew y h
o szarów w iałkowej oto z e wirusa i pozwalają
a wytworzyć odpowied ie prze iw iała.
• Do elowo te iałka ają yć produkowa e
ały koszte i rozprowadza e po ały
świe ie.
Nowotwory
• Choro y wywoła e uta ja i w ge a h
• Ideą jest przy ię ie DNA w określo y h,
zmutowanych miejscach genotypu, a
astęp ie przekopiowa ie tej zęś i z ko órki,
która nie jest zmutowana
Folding@home
• Projekt ma na celu zbadanie procesu zwijania
iałek
• Niewłaś iwie zwi ięte iałka ogą
powodować takie horo y jak horo a
Alzheimera, Parkinsona lub BSE
• ‘ezultate tego projektu są pu lika je
poświę o e ww. horo o oraz ukrzy y,
malarii i nowotworom
Folding@home vs superkomputery
• http://upload.wikimedia.org/wikipedia/comm
ons/0/0c/Folding%40home_and_Supercompu
ter_Computational_Powers.png
Folding vs Rosetta
• O a projekty zaj ują się składa ie
ale:
iałek,
– Rosetta skupia się a koń owy kształ ie iałka
– Folding skupia się a sa y pro esie składa ia
Nagrzewanie stali@home
• Pierwszy polski projekt w BOINC
• Powstał w ra a h pra y agisterskiej a
Polite h i e Często howskiej
• Dosyć szy ko za k ięty
Enigma@home
• Trzy wiado oś i zaszyfrowa e E ig ą
prze hwy o e a pół o y Atla tyku w
1942
• Przez ały zas uważa o, że i h rozszyfrowa ie
ie jest ożliwe
• W aju
zła a o pierwszy ko u ikat, a
w czerwcu 2013 drugi
Enigma@home
• Leitungvvvuuustuetzpktxwwwhavenxxfffttte
unszwozwovierhuermitvrrhhhvvvgeloest
• "[To] Control from Submarine Base
Wilhelmshaven: Radio message 1224 solved
with RHV"
Radioactive@home
• Bada rozkład pro ie iowa ia ga
a a
świe ie
• Na potrzebny projektu zaprojektowano licznik
Geigera, e hują y się iski koszte
produk ji oż a go też z udować w
warunkach domowych)
• W fazie alfa
Filmik o Folding@home
• https://www.youtube.com/watch?v=7sJx9z1u
B9k
Q&A