Ukulturalniać monitoring sieci

Transkrypt

Ukulturalniać monitoring sieci
Ukulturalniać monitoring sieci
Rozmowa z Tomaszem Habigerem, dyrektorem działu technicznego, oraz Adamem Bychowcem,
business development managerem, na temat Uptime24 - nowej marki na rynku monitoringu
infrastruktury IT.
Redaktor W jaki sposób na rynku postrzegany jest problem monitoringu infrastruktury urządzeń
sieciowych?
Tomasz Habiger Monitoring infrastruktury IT to jest ciągły proces uczenia się co i w jaki sposób należy
monitorować. Na podstawie kolejnej awarii czy jakiegoś nieprzychylnego nam zdarzenia, możemy
dowiedzieć się, że nasze podejście i zestaw monitorowanych parametrów nie były kompletne i należy
je rozszerzyć.
Adam Bychowiec Monitoring infrastruktury jest uważany przez administratorów IT w firmach za bardzo
ważny. Natomiast kadra menedżerska wyższego szczebla jeszcze nie do końca uświadamia sobie, jak
duży jest obecnie wpływ prawidłowego działania urządzeń teleinformatycznych na procesy biznesowe
w firmie. Widzimy jednak, że ta świadomość powoli się zwiększa.
Redaktor Skąd pomysł na realizację systemu do monitorowania przez SSK SA?
Tomasz Habiger Świadczymy usługi serwisowe dla innych firm. Mieliśmy tutaj kilka problemów do
rozwiązania. Po pierwsze pracujemy w bardzo rozproszonym środowisku i w bardzo trudnej
konfiguracji sieci. Jest to spowodowane tym, że w stosunku do naszych klientów posiadamy odrębną
sieć, a mimo to musimy posiadać ciągły wgląd do ich zasobów, możliwości ich monitorowania i
świadczenia klientom obsługi serwisowej. Po drugie mamy ogromną ilość urządzeń do konfiguracji w
celu ich monitorowania. Do tego dochodzi jeszcze rozliczenie umów serwisowych i poziomu ich
wykonania. Próbowaliśmy wykorzystać do tego celu różne narzędzia od otwartych i darmowych po
komercyjne. W końcu napisaliśmy własne narzędzie do monitoringu.
Adam Bychowiec Głównym celem stworzenia własnego systemu monitoringu infrastruktury było jak
najbardziej optymalne gospodarowanie zasobami ludzkimi w IT, zapobieganie awariom oraz szybka
reakcja w przypadku awarii i przywrócenie funkcjonowania procesów biznesowych w firmie. Chodziło
o szybkość parametryzacji nowych urządzeń do monitoringu, mniejsze obciążenie pracownika ciągłym
śledzeniem monitorowanych parametrów, trafną diagnostykę i możliwość zdalnego usuwania awarii.
W pewnym momencie ktoś zauważył, że gdzieś tam na rynku są inne działy IT, które we własnym
zakresie prowadzą monitoring infrastruktury IT i poszukują tych samych wartości. I tak powstał
komercyjny system Uptime24. Można powiedzieć, że zrobiliśmy Uptime24 bazując na realnych
potrzebach i własnych doświadczeniach.
Redaktor O płatnych narzędziach nie będziemy mówić, ale przecież jest otwarte rozwiązanie Nagios.
Czy Nagios także nie spełnił waszych oczekiwań??
1
Tomasz Habiger Nagios był naszym pierwszym wyborem. Niestety w żaden sposób nie spełnił wymogu
sprawnej konfiguracji systemu. Uciążliwa konfiguracja wykonywana w plikach tekstowych. Słaba
warstwa wizualizacji. Właściwie brak ustandaryzowanej odpowiedzi na problem monitorowania
rozproszonego. Owszem można umieścić i skonfigurować serwery w lokalizacjach. Można jakoś
przesyłać te informacje, ale nie było standardu dotyczącego budowania takiej architektury, który
mówiłby jak to zrobić. Zawsze coś trzeba było sobie dokonfigurować. To coś wymagało zawsze czasu.
Adam Bychowiec Nie chcemy powiedzieć, że Nagios jest złym rozwiązaniem. To narzędzie posiadające
ogromne możliwości konfiguracyjne. Wielu administratorów uważa, że jego zaletą jest właśnie
otwartość. Z drugiej strony te możliwości konfiguracyjne sprawiają, że trzeba to środowisko żmudnie
konfigurować. To z kolei pochłania czas, który może być przydatny dla innych obszarów
funkcjonowania działu IT. Uptime24 działa trochę inaczej. Skanujemy sieć i dla wykrytych urządzeń
klient otrzymuje gotową konfigurację. Udostępniamy także zintegrowane monitorowanie środowiska
serwerowni, w które wchodzi kontrola temperatury, wilgotności, zabezpieczenie przed zalaniem, czy
kontrola dostępu do serwerowni.
Tomasz Habiger W stosunku do Nagiosa wprowadziliśmy na dzień dzisiejszy ponad 100 różnych
ulepszeń, choć to dopiero wierzchołek góry lodowej. Nawet jeśli nasi klienci zauważą choćby 10 z
nich, to i tak efekt powinien być odczuwalny.
Redaktor Jaką architekturę ma Uptime24?
Tomasz Habiger Jest serwer centralny, oraz są urządzenia sond. Sonda to jednopłytkowy komputer,
inaczej komputer przemysłowy. Urządzenia sond odpytują w sieciach lokalnych monitorowane
urządzenia. To odpytywanie odbywa się w harmonogramach, które są zdefiniowane w konfiguracji
serwera centralnego. Serwer centralny zarządza też wszystkimi konfiguracjami tych urządzeń. Mówi
co ma być odpytywane w sieciach lokalnych, w jakim interwale czasowym itd. Te pytania są zadawane
do systemów lokalnych. Kiedy sonda już posiada odpowiedzi na te pytania, przesyła je do serwera
centralnego, gdzie są przetwarzane, podejmowane są ewentualnie akcje typu rejestracja zgłoszeń w
systemach helpdeskowych, powiadomienie e-mail, sms itd.
Redaktor Z jakiego łącza korzysta sonda?
Tomasz Habiger Wszystkie operacje w trybie normalnym są wykonywane z użyciem podstawowego
łącza klienta w danej lokalizacji. W przypadkach, kiedy to łącze zawiedzie, podnoszone jest zapasowe
łącze GSM. Można też wysłać do sondy rozkaz, aby na żądanie przełączyła się na łącze zapasowe.
Redaktor Czy system Uptime24 może funkcjonować bez sondy?
Tomasz Habiger Tak. Dodam tylko, że pojawienie się sondy w tym rozwiązaniu przynosi wiele korzyści,
które w innych systemach tego typu nie są zwyczajowo dostępne. Warto poważnie rozważyć, czy
chcemy z tych funkcji zrezygnować?
Adam Bychowiec Podczas analizy potrzeb w firmie zawsze rozpoznajemy na ile sonda może być
wartością dodaną dla klienta. Klient ostatecznie sam decyduje jaką architekturę rozwiązania wybiera
dla siebie.
Redaktor Czy jest jakiś szczególny wyróżnik systemu Uptime24 w stosunku do innych systemów do
monitorowania infrastruktury IT?
2
Adam Bychowiec Poza takim elementem jak sonda, o której już wspominaliśmy, ciekawym
wyróżnikiem może być to, że wyszliśmy poza dział informatyki jeśli chodzi o komunikację systemu z
pracownikami. Obecnie menedżerowie wyższego i średniego szczebla w firmach mogą obserwować,
czy procesy biznesowe, za które odpowiadają w firmie, nie są zagrożone ze strony problemów
związanych z infrastrukturą teleinformatyczną w ich przedsiębiorstwie.
Redaktor A co z otwartością systemu w Uptime24 ?
Tomasz Habiger System rozszerzeń, czyli tzw. wtyczek jest przystępny i otwarty- podobnie jak w
Nagiosie. W obecnej wersji systemu, każdy może taką wtyczkę doinstalować. Jeśli klient przechodzi z
Nagiosa na Uptime24, może wykorzystać zdefiniowane wcześniej wtyczki. Nasi klienci jednak nie
muszą tego robić, ponieważ całą tę mądrość dostarczamy już gotową w postaci zestawów
monitorujących.
Podczas gdy same wtyczki monitorują szczegółowe parametry, istotną zmianą w Uptime24 jest
wprowadzenie zestawów monitorujących całe procesy dziedzinowe. Znosi to konieczność posiadania
wiedzy eksperckiej dotyczącej szczegółów działania każdego używanego systemu.
Redaktor Z jakimi innymi przydatnymi funkcjonalnościami, czy systemami w firmie możemy
skonfigurować Uptime24?
Tomasz Habiger Istotne jest to, że możemy się zintegrować z systemami, które posiadają interfejsy
programistyczne. Systemy zewnętrzne możemy zasilić bezpośrednio informacją, jak również
integrować się z nimi przy użyciu interfejsów programistycznych.
Adam Bychowiec Najbardziej popularnymi funkcjonalnościami, z którymi łączy się Uptime24 jest m.in.
monitoring środowiska serwerowni, monitoring urządzeń chłodniczych, kamer. Łączymy się także z
systemami helpdeskowymi do ewidencji zgłoszeń o awarii. Możemy wprowadzić u klienta platformę
SIEM (ang. security information and event management), czyli stałe monitorowanie logów i następnie
konfigurować alerty w programie Uptime24.
3