Strategia zarządzania fizyczną infrastrukturą sieciową o znaczeniu

Transkrypt

Strategia zarządzania fizyczną infrastrukturą sieciową o znaczeniu
Strategia zarządzania
fizyczną infrastrukturą
sieciową o znaczeniu
krytycznym
White Paper 100
Streszczenie
Wybierając rozwiązanie do zarządzania fizyczną infrastrukturą sieci informatycznych, należy
uwzględnić zarządzanie pojedynczymi urządzeniami w celu zapewnienia widoczności wielu punktów
danych wymaganych do niezawodnego działania kluczowej dla sieci infrastruktury fizycznej.
Optymalny sposób to rozwiązania do zarządzania elementami, ponieważ pozwalają one zarządzać
poszczególnymi typami urządzeń i dają możliwość asymilacji oraz, co ważniejsze, ułatwiają
zarządzanie dużą ilością danych wymaganych do zapewnienia dostępności sieci.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
2
Wstęp
Obecne tendencje zmierzające ku większej dostępności zasobów obliczeniowych i sieciowych doprowadziły do
skoncentrowania działań na infrastrukturze fizycznej, od której zależą zasoby. Obecnie wiadomo, że optymalizacja
działania warstwy infrastruktury fizycznej wymaga odpowiedniego zarządzania tą warstwą. Przy wyborze rozwiązania
do zarządzania warstwą infrastruktury fizycznej należy uwzględnić następujące kluczowe czynniki: koszt
rozmieszczenia i konserwacji, możliwość adaptacji do zmieniających się potrzeb biznesowych, funkcjonalność
i łatwość integracji.
Odpowiednie rozwiązanie powinno być zgodne z ogólną strukturą zarządzania i oferować korzyści płynące
z udostępniania informacji dotyczących problemów mających wpływ na dostępność systemu. Wybór takiego
rozwiązania pozwoli zredukować nakłady przeznaczone na zarządzanie systemem, zmniejszy ryzyko przestojów
i zwiększy wydajność personelu działu IT.
Fizyczna Infrastruktura Sieciowa o Znaczeniu Krytycznym
Fizyczna Infrastruktura Sieciowa o Znaczeniu Krytycznym (NCPI - Network-Critical Physical Infrastructure) stanowi
fundament, na którym opierają się technologia informatyczna (IT) oraz sieci telekomunikacyjnych, co przedstawiono
na rysunku 1. Obejmuje ona:
•
Zasilanie
•
Chłodzenie
•
Szafy i strukturę fizyczną
•
Zabezpieczenia i ochronę przeciwpożarową
•
Okablowanie
•
Systemy zarządzania
•
Serwis
Na pierwszy rzut oka komponenty te wydają się być podobne do tych, które występują w systemach do zarządzania
budynkami. Prawie wszystkie systemy do zarządzania budynkami mają zasilanie, chłodzenie, monitoring warunków
otoczenia oraz infrastrukturę zabezpieczeń. Od infrastruktury NCPI odróżnia je nacisk na dostępność zasobów
obliczeniowych. Podstawowym zadaniem systemów do zarządzania budynkami jest zapewnienie optymalnych
warunków użytkownikom budynku oraz udostępnienie tradycyjnych udogodnień, takich jak automatyzacja budynku.
Potrzeby tych dwóch systemów znacznie się różnią. Znormalizowana i zintegrowana infrastruktura NCPI
z możliwością adaptacji jest kluczem do zapewnienia wysokiej dostępności sieci i ułatwienia zarządzania nimi.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
3
Rysunek 1 – Warstwa infrastruktury NCPI
Infrastruktura NCPI łączy w sobie tradycyjne zarządzanie obiektem i sterowanie działem IT danej organizacji. Za
infrastrukturę NCPI może być odpowiedzialny dział ds. utrzymania obiektu, dział IT lub oba te działy. Ta zbieżność
interesów tworzy nowe problemy i stawia nowe wyzwania związane z zarządzaniem infrastrukturą fizyczną.
Wyzwania dla strategii zarządzania infrastrukturą NCPI
Istnieją dwa podstawowe wyzwania, które należy uwzględnić podczas omawiania strategii zarządzania infrastrukturą
NCPI.
Architektura zarządzania infrastrukturą NCPI
Po pierwsze, w wielu działach IT i obiektach zainstalowano konkretne pakiety do zarządzania określonymi
urządzeniami. Wiele działów IT dysponuje zarówno specyficznymi dla urządzeń menedżerami elementów
zarządzającymi serwerami, pamięciami masowymi i urządzeniami sieciowymi, jak również systemem do zarządzania
przedsiębiorstwem (np. HP OpenView czy IBM Tivoli). Poszczególne działy często wykorzystują systemy do
zarządzania budynkami (np. Johnson Controls Metasys).
Biorąc pod uwagę fakt, że zadania działu ds. obiektu oraz działu IT są zbieżne pod względem wykorzystania
infrastruktury NCPI, każdy z działów będzie z pewnością zainteresowany wykorzystaniem obecnie używanego pakietu
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
4
do zarządzania. Dlatego też każda strategia zarządzania infrastrukturą NCPI musi uwzględniać te aplikacje
i umożliwiać integrację z nimi.
Architektura systemów zarządzania przedsiębiorstwem
Projekty systemów zarządzania różnią się pod względem architektury. Pakiety IT (Enterprise Management Systems
lub EMS) są oparte na urządzeniu i wykorzystują istniejącą sieć IT. System oparty na urządzeniach to taki, w którym
podstawową funkcję pełnią adresy IP wykorzystywane do uzyskiwania dostępu do całościowych informacji na temat
urządzenia. Na przykład jeden adres IP może określać jeden serwer, urządzenie sieciowe lub urządzenie pamięci
masowej. Alarmy i informacje są zazwyczaj gromadzone na poziomie urządzenia, a następnie przesyłane do
sumującego pakietu zarządzania za pośrednictwem istniejącej sieci IT. Za pakiety zarządzania należące do tej
kategorii uważa się HP OpenView i IBM Tivoli.
Architektura systemów zarządzania budynkami
Systemy do zarządzania budynkami (BMS) bardzo często stają się systemami opartymi na punktach danych
i zazwyczaj wykorzystują inną sieć niż sieć IT. System oparty na punktach danych można zdefiniować jako taki,
w którym są monitorowane pojedyncze punkty danych z określonego urządzenia. Dlatego też w takich systemach
kluczowym elementem nie jest zarządzanie urządzeniem jako jednostką, ale konkretna informacja, którą to
urządzenie może zgłosić. Sieci te są często oparte na komunikacji szeregowej wykorzystującej własne protokoły lub
odpowiednią wersją standardowych protokołów, takich jak MODBUS. Różnice te podsumowano w poniższej tabeli:
Tabela 1 – Porównanie architektury BMS i EMS
Typ pakietu
„Punkt
widzenia”
Używana sieć
System EMS (Enterprise
Management System)
Oparte na
urządzeniu
Sieć IT
System BMS (Building
Management System)
Oparte na
punkcie danych
Sieć dedykowana
Konsekwencje tych różnic stanowią poważne wyzwanie przy opracowywaniu kompleksowej strategii infrastruktury
NCPI. Bardzo trudno jest zintegrować dwie odmienne architektury zarządzania — jedną opartą na urządzeniu, a drugą
na punktach danych. Każda strategia zarządzania powinna udostępniać informacje podsumowujące na poziomie
urządzenia dotyczące pakietu IT, jednocześnie zapewniając odpowiedni poziom rozdrobnienia punktów danych w celu
umożliwienia integracji z pakietem obiektu.
Standardy zarządzania infrastrukturą NCPI
Drugim głównym wyzwaniem, które stoi przed kompleksowym zarządzaniem infrastrukturą NCPI, jest proces
gromadzenia większej ilości danych niż ma to miejsce podczas tradycyjnego monitorowania. Kompleksowa strategia
powinna obejmować informacje na poziomie szafy w celu zapewnienia niezawodnego działania sprzętu IT. Poprzednie
takie rozwiązanie było niewykonalne.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
5
Monitorowanie urządzeń i punktów danych kluczem do dostępności
Niezwykle ważne jest, aby zapewnić monitorowanie wszystkie kluczowych urządzeń i punktów danych. Dotyczy to
wszystkich urządzeń należących do warstwy infrastruktury NCPI oraz otaczającego je środowiska. Najlepszym
rozwiązaniem jest monitorowanie następującej listy urządzeń na poziomie szafy:
•
Pojedyncze obwody
•
Dwa punkty danych dotyczących temperatury (minimum)
•
Przełączniki źródeł zasilania
•
Urządzenia chłodzące
•
Systemy zasilaczy UPS
Monitorowanie urządzeń, takich jak montowane w szafach przełączniki źródeł zasilania, zasilacze UPS i urządzenia
chłodzące, jest powszechnie stosowaną praktyką. Jednak monitorowanie obwodów i temperatury w szafie jest
względnie nowym rozwiązaniem w zarządzaniu infrastrukturą NCPI.
Monitorowanie pojedynczych obwodów zwiększa dostępność, umożliwiając administratorom odbieranie powiadomień
zanim nastąpi przeciążenie obwodu. Badania pokazały, że w znacznym stopniu czas przestoju centrum przetwarzania
danych wynika z awarii obwodów. Dlatego też aktywne zarządzanie tymi obwodami może znacznie wpłynąć na
zwiększenie dostępności.
Konieczna jest identyfikacja szaf pracujących w temperaturze wyższej niż normalna, ponieważ podwyższone
temperatury znacznie skracają oczekiwaną żywotność urządzeń IT. Tendencje do uzyskiwania większej gęstości
sprzętu IT pogłębiają ten problem, ponieważ większa gęstość mocy jest bezpośrednio powiązana z większymi
potrzebami odnośnie chłodzenia. Monitorowanie tych urządzeń pozwala administratorom zrozumieć problemy
z samymi urządzeniami lub ze środowiskiem, które je otacza.
Wydajne zarządzanie zasobami
Zaletą scentralizowanego zarządzania jest generowanie odpowiednich, szybko dostępnych informacji. Aby
zoptymalizować wydajność zasobów, informacje muszą być dostępne w łatwo zrozumiałej formie, minimalizując lub
eliminując potrzebę przeprowadzania szkoleń. Przydatna może być również możliwość całościowego skonfigurowania
i zautomatyzowania odpowiedzi na znane problemy. Krótko mówiąc, systemy powinny być łatwe we rozmieszczeniu
i obsłudze.
Ostrzeżenia o krytycznych zdarzeniach
Awarie zasilania i podwyższone temperatury są przykładami zdarzeń, które, jeżeli nie zostaną pojęte żadne działania
zaradcze, mają wpływ na dostępność sieci. Uzyskane w odpowiednim czasie informacje pozwalają podejmować
działania naprawcze przed uszkodzeniem lub awarią sprzętu i są krytycznym czynnikiem wpływającym na
bezproblemowe działanie systemu zarządzania infrastrukturą fizyczną sieci. Na przykład administrator może odebrać
powiadomienie wygenerowane w momencie, gdy napięcie prądu pobieranego przez obwód wzrosło o ponad 1 A,
dzięki czemu może kontrolować próby nieuprawnionego dodawania sprzętu do obwodu.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
6
Analiza wydajności i przewidywanie awarii
Aby można było przeprowadzić analizę wydajności, należy przechowywać przynajmniej dzienniki zdarzeń i danych.
Skuteczne narzędzia do analizy zapobiegają występowaniu problemów, określając obszary, na które należy zwrócić
uwagę, i wskazując podstawową przyczynę potencjalnych problemów. Przykłady powyższych funkcji to identyfikacja
starszych baterii oraz punktów dostępowych szafy i definiowanie stałych problemów z linią zasilania, takich jak częste
zaniki zasilania.
Możliwość łatwej adaptacji wraz ze zmianą potrzeb biznesowych
Strategie wymiany i modernizacji należy opracowywać w odpowiednim czasie, aby uniknąć nieoczekiwanego,
nieplanowanego i kosztownego przestoju. Uniwersalne systemy dopuszczają możliwość wprowadzania zmian
w konfiguracji, minimalizując czasy przestoju. Przykłady przewidywalnych modyfikacji to zmiana wymagań
dotyczących zasilania, nadmiarowości oraz czasu działania, jak również dodawanie obsługi dla oddziałów lub innych
węzłów sieci.
Odpowiednie zarządzanie infrastrukturą NCPI wymaga przedstawienia dużej ilości danych w formie łatwo zrozumiałej
dla administratora.
Zarządzanie infrastrukturą NCPI
Menedżery elementów
W ostatniej dekadzie można było zaobserwować gwałtowny wzrost wykorzystywania systemów IT do pilnych potrzeb
biznesowych przy zastosowaniu wielopunktowych rozwiązań. W wyniku tego w wielu instalacjach działy IT dążyły do
zarządzania sprzętem przy użyciu „menedżerów elementów” dla różnych kategorii sprzętu. Na rysunku 2 poniżej
przedstawiono schemat zarządzania różnymi elementami systemów: do zarządzania pamięciami masowymi
powszechnie stosuje się „menedżera pamięci masowych” (np. EMC ControlCenter), do zarządzania urządzeniami
sieciowymi — „menedżera sieciowego” (np. CiscoWorks), a do zarządzania serwerami — menedżera serwerów (np.
HP Insight Manager).
Zaletą zastosowania „menedżerów elementów” jest generalnie łatwość ich rozmieszczania i używania, ponieważ służą
one głównie do zarządzania jedną kategorią urządzeń — w wielu przypadkach urządzeniami specyficznymi dla
danego dostawcy. Ograniczeniem tej strategii jest brak koordynacji różnych menedżerów elementów.
Menedżery elementów i systemy EMS
Aby uzyskać lepszą kontrolę całej sieci, należy w razie potrzeby użyć systemu EMS (Enterprise Management
System), takiego jak Tivoli lub HP OpenView. Narzędzia te ułatwiają koordynację różnych typów urządzeń
i udostępniają szczegółowe informacje dotyczące wszystkich operacji w sieci.
Jednak ani menedżery elementów ani system EMS nie łączą w sobie zarządzania warstwą infrastruktury fizycznej
krytycznej dla sieci.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
7
Punkty danych i systemy BMS
Podobnie, do zarządzania niektórymi punktami danych infrastruktury NCPI często używa się systemów BMS. Jednak
ich architektura oraz ilości wymaganych informacji sprawiają, że systemom tym brakuje zalet skutecznych rozwiązań
do zarządzania infrastrukturą NCPI, przez co nie nadają się do zarządzania fizyczną infrastrukturą sieciową o
znaczeniu krytycznym.
Integracja zarządzania infrastrukturą NCPI
Pozostaje więc pytanie — jak zintegrować infrastrukturę NCPI z istniejącymi systemami BMS i EMS? Typowe
podejście może wymagać integracji każdego pojedynczego urządzenia lub punktu danych w celu utworzenia jednego
systemu zarządzania wysokiego poziomu. Na rysunek 2 przedstawiono ścieżki integracji pojedynczych urządzeń przy
wykorzystaniu tradycyjnego podejścia.
Rysunek 2 – Tradycyjna integracja infrastruktury NCPI z systemami BMS i EMS
Wadą tego rozwiązania jest znaczny koszt związany z integracją każdego z tych urządzeń i/lub punktów danych. Ten
schemat może również prowadzić do dostarczenia użytkownikowi nadmiaru informacji, ponieważ wiele urządzeń lub
pojedynczych punktów danych przesyła raporty do jednego centrum. W przypadku tego modelu użytkownicy muszą
zakupić lub opracować unikatowe reguły obsługi tych informacji w swoich systemach BMS lub EMS.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
8
Menedżer elementów infrastruktury NCPI
Rozwiązaniem opisywanego problemu może być menedżer elementów dla urządzeń infrastruktury NCPI, co
przedstawiono na rysunku 3. Odpowiednio zaprojektowany menedżer elementów infrastruktury NCPI powinien
ograniczyć punkty integracji niezbędne w systemach EMS i BMS, udostępniając informacje podsumowujące na tych
platformach. Szczegółowe informacje można uzyskać, łącząc się bezpośrednio z menedżerem elementów
infrastruktury NCPI, podobnie jak w przypadku menedżerów elementów serwerów, pamięci masowych i sieci.
Zaletą menedżerów elementów jest również niższy koszt instalacji. Menedżer elementów nie wymaga integracji
z każdym urządzeniem, tylko automatycznie łączy te informacje. Menedżer elementów ma jeden cel, dlatego też
został zaprogramowany za pomocą konkrentych reguł i zaleceń, przez co posiada odpowiednią charakterystykę
niezbędną do zarządzania infrastrukturą NCPI.
Używając menedżera elementów infrastruktury NCPI, można zastosować bardziej uniwersalny schemat zarządzania.
Informacje na poziomie agregacji można w razie potrzeby integrować z systemami EMS i/lub BMS. Menedżera
elementów infrastruktury NCPI można także używać jako autonomiczne narzędzie do zarządzania, jak to często ma
miejsce w przypadku menedżerów elementów serwerów, pamięci masowych i sieci.
Rysunek 3 — Integracja menedżera elementów infrastruktury NCPI z systemami BMS i EMS
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
9
Przykład menedżera elementów infrastruktury NCPI
Przykładem narzędzia do zarządzania spełniającym kryteria menedżera elementów infrastruktury NCPI jest kontroler
InfraStruXure Manager firmy APC. To dedykowane urządzenie zajmuje 1U w szafie 19" i umożliwia zarządzanie
infrastrukturą fizyczną. Udostępnia informacje podsumowujące dotyczące alarmów dla systemów BMS, jak i systemów
EMS. Działa on również jako menedżer elementów.
Kontroler InfraStruXure Manager firmy APC
Wnioski
Najlepszy w swojej klasie model do zarządzania fizyczną infrastrukturą sieciową o znaczeniu krytycznym (NCPI)
powinien wykorzystywać menedżera elementów infrastruktury NCPI. Zalety używania menedżera elementów
infrastruktury NCPI:
1.
Efektywne pod względem kosztów zarządzanie wieloma punktami danych wymaganych w celu
odpowiedniego zarządzania infrastrukturą NCPI.
2.
Zoptymalizowana funkcjonalność odpowiednia dla infrastruktury NCPI.
3.
Łatwa integracja z istniejącymi systemami BMS i EMS.
4.
Niskie koszty instalacji i konserwacji.
2003 American Power Conversion. Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być używana, powielana, kopiowana, przesyłana
ani przechowywana w jakiegokolwiek rodzaju systemie udostępniania informacji bez pisemnej zgody właściciela praw autorskich. www.apc.com
Wer. 2003-0
10