Aspekty dotyczce projektu ukadu chodzenia w serwerowni
Transkrypt
Aspekty dotyczce projektu ukadu chodzenia w serwerowni
Aspekty, które należy uwzględnić w projekcie układu chłodzenia w Data Center pod kątem klasyfikacji TIER – przykłady rozwiązań Andrzej Różycki, Prokurent „SAR PW Sp. z o.o.” Sp. k., certyfikat ATS Uptime Institute nr 922 Paweł Wróbel, certyfikat ATS Uptime Institute nr 736 1 SŁOWNIK POJĘĆ TO GWARANCJA ZROZUMIENIA OCZEKIWAŃ INWESTORA, JAKOŚCI PROJEKTU, RZETELNEJ I ODPOWIEDZIALNEJ REALIZACJI, EKSPLOATACJI NA POZIOMIE BEZPIECZEŃSTWA FUNKCJONALNOŚCI Funkcjonalność - zespół optymalnych/ustalonych/użytkowych/technologicznych parametrów środowiska wewnętrznego serwerowni, które muszą być zapewnione przez pracę urządzeń, instalacji i systemów oraz przez pracę personelu serwisu odpowiedzialnego za utrzymanie ruchu; Funkcjonalność Infrastruktury Technicznej – ciągła i bezawaryjna praca urządzeń i systemów zapewniająca zespół wymaganych w miernikach funkcjonalności optymalnych parametrów technicznych środowiska wewnętrznego serwerowni, tj. parametry powietrza i mediów zasilających; Infrastruktura krytyczna lub techniczna infrastruktura krytyczna – ta część Infrastruktury technicznej, której działanie jest niezbędne do utrzymania ciągłości działania serwerowni. Infrastruktura sanitarna – infrastruktura techniczna, w skład której wchodzą systemy klimatyzacji precyzyjnej (HPAC), systemy chłodnicze, systemy automatyki dedykowane tym systemom i pozostałe systemy sanitarne, tj. ciepła technologicznego, wodnokanalizacyjne. Zespół urządzeń i instalacji połączonych technologicznie w określonej konfiguracji w jedną funkcjonalną całość i przeznaczony do zapewnienia wymaganych parametrów klimatyzacyjnych środowiska wewnętrznego o zdefiniowanych wartościach, tj. temperatura, wilgotność, nadciśnienie, ilość wymian, objętości, prędkości przepływu powietrza i jego czystość, poziomu głośności; 2 SŁOWNIK POJĘĆ TO GWARANCJA ZROZUMIENIA OCZEKIWAŃ INWESTORA, JAKOŚCI PROJEKTU, RZETELNEJ I ODPOWIEDZIALNEJ REALIZACJI, EKSPLOATACJI NA POZIOMIE BEZPIECZEŃSTWA FUNKCJONALNOŚCI Klasyfikacja TIER – wytyczne Uptime Institute w stosunku do projektowania, stosowania i serwisowania rozwiązań technicznych dla infrastruktury krytycznej i infrastruktury w odniesieniu do poziomu niezawodności. Mierniki funkcjonalności - zespół parametrów środowiska wewnętrznego serwerowni, określonych wartościami granicznymi niekrytycznymi (minimalne i maksymalne) oraz wartościami krytycznymi (minimalne i maksymalne); SLA (Service Level Agreement) – parametry określające wymagany poziom realizacji Usługi utrzymania ciągłości działania serwerowni w ramach świadczenia usługi utrzymaniowej, na poziomie bezpieczeństwa funkcjonalności; Specjalistyczna usługa serwisowa – Specjalistyczny przegląd okresowy lub specjalistyczna naprawa awaryjna elementu Infrastruktury świadczona przez firmę serwisową lub podwykonawcę serwisowego posiadającego wymagane świadectwa kwalifikacji i wymagane prawem certyfikaty wydane przez producentów danych urządzeń bądź ich autoryzowanych przedstawicieli lub dystrybutorów w Polsce; 3 CO TO JEST UTRATA FUNKCJONALNOŚCI? Zatrzymanie dostępu do usług danego obiektu (np. szpitala, serwerowni, lotniska, itp) w wyniku zdarzeń generujących zakłócenia w pracy Infrastruktury technicznej, do których należy zaliczyć: • • • • • • • przekroczenie wartości parametrów środowiska; zbyt szybki przyrost gradientu temperatury lub lokalne przegrzania; zalanie lub zapylenie lub zadymienie; zakłócenia przełączeń z układów podstawowych na układy rezerwowe; brak zasilania podstawowego wraz z odstawieniem zasilania rezerwowego; złe parametry zasilania; awarie urządzeń będące następstwem zaniechań lub zaniedbań, itp. Utrata funkcjonalności ma miejsce jedynie wtedy, gdy zawiodą wszystkie zabezpieczenia techniczne, a struktury firmy świadczącej usługę utrzymaniową i procedury, którymi się posługuje nie są przygotowane lub wystarczająco dobrze wdrożone aby zapewnić właściwą reakcję na wystąpienie danej sytuacji. 4 JAK MOŻNA OPISAĆ FUNKCJONALNOŚĆ? • Poprzez SLA (Service Level Agreement) Są to spisane parametry i czynności określające wymagany poziom usługi świadczonej na rzecz Zamawiającego przez Usługodawcę / Dostawcę w oparciu o zapisy umowy zawartej przez strony w celu zapewnienia funkcjonalności. SLA najczęściej stanowi załącznik do umowy na świadczenie usługi utrzymania ruchu. Zamawiający zawierając umowę dla utrzymania w sposób ciągły wymaganej funkcjonalności, określa je za pomocą mierników funkcjonalności oraz czasów podjęcia i realizacji czynności związanych ze skutecznym zapewnieniem ciągłości ruchu infrastruktury technicznej, czyli określa specyficzne dla tego stanu parametry SLA w których uznaje się, że jest zapewniona funkcjonalność. • Poprzez Mierniki Funkcjonalności Jest to zespół parametrów środowiska danego Pomieszczenia, określonych wartościami granicznymi niekrytycznymi (górną i dolną) oraz wartościami granicznymi krytycznymi (górną i dolną), po przekroczeniu których stwierdza się wystąpienie odpowiednio: Awarii niekrytycznej lub Awarii krytycznej. 5 PRZYKŁADY WYMAGAŃ SLA Czas wykonania naprawy awaryjnej Czas reakcji Rodzaje urządzeń (kategorie krytyczności) Serwisu gwarancyjnego Dostawcy Usługi Utrzymaniowej Urządzenia o krytycznej ważności dla utrzymania funkcjonalności 4h – cały rok 5 min. – cały rok Urządzenia o krytycznej ważności posiadające redundancję 6h – cały rok 15 min. – cały Urządzenia ważne dla utrzymania ruchu 12h – cały rok Serwisu gwarancyjnego 8h / cały rok Dostawcy Usługi Utrzymaniowej 4h / cały rok Czas wykonania naprawy ostatecznej Serwisu gwarancyjnego 24h / 12h / cały rok 8h / cały rok 24h / cały rok 24h / cały rok cały rok 4d / cały rok Dostawcy Usługi Utrzymaniowej 24h / cały rok 7d / cały rok rok 30 min. – cały 8d / cały rok 14d / cały rok rok Poziom eksploatacji Obszar Pomieszczenia o znaczeniu krytycznym Wartość odchyłki Parametr o o o o o o o Pomieszczenia ważne o o o o o o o Pomieszczenia pozostałe o o o o o o o Pomieszczenia o znaczeniu krytycznym Zasilanie gwarantowane Zasilanie gwarantowane Zasilanie gwarantowane DC 6 ZALECENIA PROJEKTANTA ZAWARTE W PROJEKCIE NA POZIOMIE FUNKCJONALNOŚCI OKREŚLONEJ WYMAGANIAMI SLA – ETAP ROZRUCHÓW I ODBIORÓW • Końcowym etapem procesu budowlanego jest prawidłowo wykonamy commissioning rozumiany jako: rozruch instalacji, a następnie testy funkcjonalne prowadzące do udokumentowania, że funkcjonalność i wydajność systemów jest zgodna z zaprojektowaną (wymaganą) dla uzyskania końcowej akceptacji procesu budowlanego przez zamawiającego. W zapisach projektu proces commissioningu powinien zawierać wymagania w zakresie: • • • • • testów funkcjonalnych wydajnościowych infrastruktury technicznej ze wszystkimi próbami rozruchu pod obciążeniem eksploatacyjnym (tymczasowym, cząstkowym oraz docelowym); testów funkcjonalnych sekwencji pracy i współdziałania urządzeń i systemów w stanie eksploatacyjnym oraz awaryjnym, w których zostaną sprawdzone wszystkie procesy i procedury w przewidywanych zakresach operacyjnych dla udowodnienia osiągania zakładanych mierników funkcjonalności, zgodnie z pożądanym TIER; Commissioning powinien być zlecony zewnętrznym specjalistom posiadającym odpowiednie kompetencje i doświadczenie (commissioning agent – ca). CA może być także odpowiedzialny za wykonanie procedur eksploatacyjnych oraz awaryjnych. W testach odbiorowych powinny brać czynny udział służby odpowiedzialne następnie za utrzymanie ruchu. dobrze wykonany commissioning może zminimalizować lub nawet wyeliminować część błędów popełnionych na wcześniejszych etapach inwestycji, wtedy gdy koszty naprawy tych błędów będą jeszcze minimalne. 7 Klasyfikacje TIER zostały stworzone, aby kompleksowo opisywać infrastrukturę obiektu, wymaganą do nieprzerwanego działania centrów przetwarzania danych. Standard TIER opiera się na fakcie, że serwerownie są zależne od sprawnego i zintegrowanego działania kilku oddzielnych podsystemów infrastruktury obiektowej, których liczba zależy od poszczególnych technologii (np. wytwarzanie energii, chłodnictwo, awaryjne źródła zasilania, itp.) użytych do zapewnienia ciągłości działania. Każdy podsystem i system musi spełniać te same kryteria niezawodności, aby spełnić poszczególne wymogi ogólnej klasyfikacji TIER. TIER całego obiektu wynika z oceny najsłabszego podsystemu, który będzie miał wpływ na działanie obiektu. TIER III TIER IV ASPEKTY, KTÓRE NALEŻY UWZGLĘDNIĆ W PROJEKCIE INSTALACJI CHŁODZENIA SERWEROWNI POD KĄTEM KLASYFIKACJI TIER Podejście odpowiednie dla serwerowni, to oczekiwanie niezakłóconej ciągłej pracy w trybie 24/365 przez kolejne 10-15 lat. Dlatego należy brać to pod uwagę przy obliczeniach: • mocy urządzeń chłodniczych • doborze jednostek spełniających te obliczenia • doborze jednostek redundantnych. Bilans zysków ciepła na które wpływ mają: • wymagania wewnętrzne (środowisko dla poprawnej pracy urządzeń IT) • otoczenie zewnętrzne przy uwzględnieniu skrajnych warunków klimatycznych lato/zima 14 BILANS ZYSKÓW CIEPŁA PYTANIA, NA KTÓRE MUSI ODPOWIEDZIEĆ PROJEKTANT: 1. 2. 3. Co powinniśmy schładzać: pomieszczenia / urządzenia? Jak powinniśmy schładzać? Szybkość schładzania ∆T w jednostce czasu Warunki zewnętrzne – jakie? • • • • 4. Należy przyjmować maksymalne temperatury w odniesieniu do wilgotności względnej Zasady eksploatacji w ekstremalnych warunkach. Procedury naprawcze Wpływ urządzeń na otoczenie i otoczenia na urządzenie – pyły, brud, zadymienie, zanieczyszczenia, śnieg na dachu, ulewy Głośność pracy jednostek zewnętrznych i wewnętrznych. Wilgotność – czym ją zapewniamy? Jakie są zagrożenia? 15 PROJEKTOWE WARTOŚCI TEMPERATURY NA POTRZEBY DOBORU URZĄDZEŃ CHŁODZENIA Efektywną ilości wymaganych mediów zapewnionych przez infrastrukturę serwerowni określa się dla następujących parametrów: 1. temperatury powietrza na powrocie do CRAC a) Temperatura w serwerowni 1827°C, b) Wilgotność w serwerowni górna granica 60%RH 2. Parametry powietrza zewnętrznego Zgodnie z wymaganiami ASHRAE projektant powinien przyjąć maksymalne wartości temperatury dla danego regionu, gdzie będzie serwerownia, która wystąpiła w okresie ostatnich 20 lat, np.: we Wrocławiu w 2015: +37,9 °C w Warszawie (Wawer) w 2015: 39,5 °C W Łodzi w 2013: +38,0 °C W Krakowie w 2013: +37,3 °C 2004 Version Low End eT mperature iH gh End eT mperature 20 25 Low End o M isture iH gh End o M isture °C (68 °C (7 40 5 % RH % RH 2008 Version ° F) ° F) 18 27 °C (64. °C (80.6 5. 60 (59 ° F) ° F) °C DP (41.9 ° F) % RH & 15 ° F DP) °C DP 16 ZASADY SCHŁADZANIA URZĄDZEŃ W SERWEROWNI 1. Pośrednie - powietrzem a) Poprzez schładzanie całego pomieszczenia serwerowni b) Poprzez schładzanie zimnego korytarza c) Poprzez dedykowane schładzanie gorącego korytarza i wynikowe schładzanie pozostałej przestrzeni serwerowni 2. Bezpośrednie a) schładzanie racków medium chłodniczym 17 PRZYJĘTE ROZWIĄZANIE UKŁADU CHŁODZENIA I UWARUNKOWANIA Najczęściej stosowane rozwiązania. Kiedy stosować jakie rozwiązania? woda lodowa (chillery z freecoolingiem) czynniki chłodzące grupy HFC, tzn. „freony” z bezpośrednim odparowaniem (szafy precyzyjnej klimatyzacji ze skraplaczami zewnętrznymi i systemy IN ROW) powietrze zewnętrzne + schładzanie adiabatyczne (KyotoCooling / System EFC / DFC2 układ pośredni - drycoolery ze zraszaniem (szafy precyzyjne ze skraplaczami wewnętrznymi i „pompy freonowe”) Sposoby dystrybucji powietrza w serwerowni Podwójna podłoga Wyporowe Nawiew uzyskiwany przez wentylatory podłogowe Systemy kanałowe Bezpośredni nawiew w rejonie rack’a Powrót powietrza do CRAC Bezpośredni powrót powietrza do szaf Powrót powietrza do szaf przez strop podwieszony 18 LOKALIZACJA URZĄDZEŃ KLIMATYZACYJNYCH I - Jednostki wewnętrzne podstawowe i redundantne a) W odniesieniu do „wysp ciepła” b) W odniesieniu do zbilansowanej dystrybucji chłodu w odniesieniu do kompleksowej pracy serwerowni w następujących trybach pracy: • Praca podstawowa • Praca turnusu • Praca redundancji c) Skuteczność schładzania d) Efektywność energetyczna e) Niezawodność / funkcjonalność Konfiguracja „mocy” podstawowej i „mocy” redundantnej a niezawodność na poziomie TIER II - Lokalizacja jednostek zewnętrznych (zagrożenia fizyczne i dostęp serwisowy) 19 RECYRKULACJA ZEWNĘTRZNA 21 RECYRKULACJA ZEWNĘTRZNA 22 RECYRKULACJA WEWNĘTRZNA Bezpośrednie zasysanie gorącego powietrza przez wentylatory chłodzące rack’i 23 PODŁOGA PODWÓJNA JAKO NAJLEPSZY DYSTRYBUTOR POWIETRZA ZALETY WADY • plenum nawiewne o maksymalnej wydajności • łatwość zapewnienia nawiewu powietrza w każdym miejscu serwerowni • elastyczność – możliwość łatwej dyspozycji objętością plenum nawiewnego w zależności od wysokości podwójnej podłogi • możliwość dostępu w każde miejsce do przestrzeni podpodłogowej • możliwość prowadzenia okablowania strukturalnego i instalacji zasilających, itp. • łatwe czyszczenie • tłumienie głośności pracy szaf CRAC • brak możliwości precyzyjnego wyliczenia wartości nawiewu w wytypowanym miejscu • nieszczelności zwiększające się wraz ze wzrostem nadciśnienia podpodłogowego; • zbyt niska wysokość podłogi wymuszona niskimi pomieszczeniami • dużo niekontrolowanych strat nadciśnienia w przestrzeni podpodłogowej, wynikających z wielu dodatkowych niepotrzebnych otworów: instalacyjnych, montażowych, niestaranności montażu płyt (stepowanie), słabe zabezpieczenia przejść przez podłogę instalacji okablowania strukturalnego • zakłócenia przepływów podpodłogowych wynikające z niekontrolowanych strumieni przepływu powietrza (ciśnienie dynamiczne) • zakłóceń spowodowanych przez okablowania strukturalne i inne instalacje prowadzone pod podłogą • powstawanie zjawiska kondensacji przy niskich temperaturach nawiewu • Zagrożenie niestarannym montażem podłogi i powstawanie nieszczelności na styku zespolenia jej ze ścianami serwerowni • Zagrożenie nieodpowiedniego przygotowania podłoża betonowego pod podłogą (zapylenie) • trudności szybkiej lokalizacji przecieku 24 CO DODATKOWO PROJEKTANT POWINIEN UWZGLĘDNIĆ W PROJEKCIE HVAC&R 1. Oczekiwania po stronie użytkownika i projektanta to chęć posiadania dodatkowej rezerwy mocy chłodniczej – „tak na wszelki wypadek” 2. FAZY DOCIĄŻANIA SERWEROWNI W ODNIESIENIU DO EMISJI ZYSKÓW CIEPŁA Z URZĄDZEŃ ELEKTRONICZNYCH: a) faza rozruchu – próby, testy, procedury rozruchowe itp. b) faza osiągnięcia mocy nominalnej: • Od 30% do 50% obciążeń ciepl. • 50% do 90% c) faza osiągnięcia mocy maksymalnej • 90 do 120% 3. Proces osiągnięcia maksymalnej mocy chłodniczej w serwerowni jako wynik planowany sukcesywnego obciążania serwerów i podnoszenia gęstości mocy 4. Zakłócenia pracy klimatyzacji w niedociążonej emisją zysków ciepła serwerowni (faza rozruchu) 25 PODSUMOWANIE • Odpowiedzialność projektanta za projekt z perspektywy strat wynikających z braku dostępu do usług świadczonych przez serwerownię, a będących następstwem awaryjnego odstawienia systemów chłodzących. Są to wielomilionowe straty materialne i zagrożenie utraty wiarygodności właściciela, która jest podstawą ich pozycji rynkowych. • W okresie użytkowania serwerowni Inwestorzy i Użytkownicy nie dopuszczają możliwości wystąpienia awarii infrastruktury krytycznej na poziomie całkowitego wyłączenia systemu utraty funkcjonalności. Dlatego też: Projektowanie serwerowni w zakresie klimatyzacji precyzyjnej jest jednym z najtrudniejszych zadań dla projektantów HVAC&R. Wiedza, doświadczenie, odpowiedzialność czyli profesjonalizm to miara świadomości, że instalacje i systemy chłodzenia w serwerowni powinny pracować bezawaryjnie przez 1015 lat. Dobrze zaprojektowane systemy chłodzenia serwerowni w konfiguracji redundantnej gwarantują niezawodność na poziomie bezpieczeństwa funkcjonalnego i dotrzymanie SLA w granicach opisanych miernikami funkcjonalności. Profesjonalista projektując funkcjonalność na poziomie SLA i musi jednoznacznie określić precyzyjne wymagania nie tylko dla urządzeń, instalacji i systemów, ale również określić wymagania dla wykonawcy i serwisu oraz przekazać je użytkownikowi w formie szczegółowego dokumentu chroniącego interesy inwestora. 26 BIBLIOGRAFIA 1. Commissioning Process for Buildings and Systems – ANSI/ASHRAE/IES Standard 202-2013 2. The Commissioning Process – ASHRAE Guideline 0-2013 3. HVAC&R Technical Requirements for The Commissioning Process – ASHRAE Guideline 1.1-2007 4. 2008 ASHRAE Environmental Guidelines for Datacom Equipment 5. Uptime Institute – Data Center Site Infrastucture Tier Stardard: Topology 6. Uptime Institute – Data Center Site Infrastructure Tier Standard: Operational Sustainability 7. ANSI/CSA/EIA/TIA TIA-942 (PN PN-3-0092) Datacenter Infrastructure Standards 8. Artykuły „Chłodnictwo i Klimatyzacja”, autorzy: T. Kruczek / M. Żuk / J. Kot / B. Biernacki / P. Kowalski 27