Ukulturalniać monitoring sieci
Transkrypt
Ukulturalniać monitoring sieci
Ukulturalniać monitoring sieci Rozmowa z Tomaszem Habigerem, dyrektorem działu technicznego, oraz Adamem Bychowcem, business development managerem, na temat Uptime24 - nowej marki na rynku monitoringu infrastruktury IT. Redaktor W jaki sposób na rynku postrzegany jest problem monitoringu infrastruktury urządzeń sieciowych? Tomasz Habiger Monitoring infrastruktury IT to jest ciągły proces uczenia się co i w jaki sposób należy monitorować. Na podstawie kolejnej awarii czy jakiegoś nieprzychylnego nam zdarzenia, możemy dowiedzieć się, że nasze podejście i zestaw monitorowanych parametrów nie były kompletne i należy je rozszerzyć. Adam Bychowiec Monitoring infrastruktury jest uważany przez administratorów IT w firmach za bardzo ważny. Natomiast kadra menedżerska wyższego szczebla jeszcze nie do końca uświadamia sobie, jak duży jest obecnie wpływ prawidłowego działania urządzeń teleinformatycznych na procesy biznesowe w firmie. Widzimy jednak, że ta świadomość powoli się zwiększa. Redaktor Skąd pomysł na realizację systemu do monitorowania przez SSK SA? Tomasz Habiger Świadczymy usługi serwisowe dla innych firm. Mieliśmy tutaj kilka problemów do rozwiązania. Po pierwsze pracujemy w bardzo rozproszonym środowisku i w bardzo trudnej konfiguracji sieci. Jest to spowodowane tym, że w stosunku do naszych klientów posiadamy odrębną sieć, a mimo to musimy posiadać ciągły wgląd do ich zasobów, możliwości ich monitorowania i świadczenia klientom obsługi serwisowej. Po drugie mamy ogromną ilość urządzeń do konfiguracji w celu ich monitorowania. Do tego dochodzi jeszcze rozliczenie umów serwisowych i poziomu ich wykonania. Próbowaliśmy wykorzystać do tego celu różne narzędzia od otwartych i darmowych po komercyjne. W końcu napisaliśmy własne narzędzie do monitoringu. Adam Bychowiec Głównym celem stworzenia własnego systemu monitoringu infrastruktury było jak najbardziej optymalne gospodarowanie zasobami ludzkimi w IT, zapobieganie awariom oraz szybka reakcja w przypadku awarii i przywrócenie funkcjonowania procesów biznesowych w firmie. Chodziło o szybkość parametryzacji nowych urządzeń do monitoringu, mniejsze obciążenie pracownika ciągłym śledzeniem monitorowanych parametrów, trafną diagnostykę i możliwość zdalnego usuwania awarii. W pewnym momencie ktoś zauważył, że gdzieś tam na rynku są inne działy IT, które we własnym zakresie prowadzą monitoring infrastruktury IT i poszukują tych samych wartości. I tak powstał komercyjny system Uptime24. Można powiedzieć, że zrobiliśmy Uptime24 bazując na realnych potrzebach i własnych doświadczeniach. Redaktor O płatnych narzędziach nie będziemy mówić, ale przecież jest otwarte rozwiązanie Nagios. Czy Nagios także nie spełnił waszych oczekiwań?? 1 Tomasz Habiger Nagios był naszym pierwszym wyborem. Niestety w żaden sposób nie spełnił wymogu sprawnej konfiguracji systemu. Uciążliwa konfiguracja wykonywana w plikach tekstowych. Słaba warstwa wizualizacji. Właściwie brak ustandaryzowanej odpowiedzi na problem monitorowania rozproszonego. Owszem można umieścić i skonfigurować serwery w lokalizacjach. Można jakoś przesyłać te informacje, ale nie było standardu dotyczącego budowania takiej architektury, który mówiłby jak to zrobić. Zawsze coś trzeba było sobie dokonfigurować. To coś wymagało zawsze czasu. Adam Bychowiec Nie chcemy powiedzieć, że Nagios jest złym rozwiązaniem. To narzędzie posiadające ogromne możliwości konfiguracyjne. Wielu administratorów uważa, że jego zaletą jest właśnie otwartość. Z drugiej strony te możliwości konfiguracyjne sprawiają, że trzeba to środowisko żmudnie konfigurować. To z kolei pochłania czas, który może być przydatny dla innych obszarów funkcjonowania działu IT. Uptime24 działa trochę inaczej. Skanujemy sieć i dla wykrytych urządzeń klient otrzymuje gotową konfigurację. Udostępniamy także zintegrowane monitorowanie środowiska serwerowni, w które wchodzi kontrola temperatury, wilgotności, zabezpieczenie przed zalaniem, czy kontrola dostępu do serwerowni. Tomasz Habiger W stosunku do Nagiosa wprowadziliśmy na dzień dzisiejszy ponad 100 różnych ulepszeń, choć to dopiero wierzchołek góry lodowej. Nawet jeśli nasi klienci zauważą choćby 10 z nich, to i tak efekt powinien być odczuwalny. Redaktor Jaką architekturę ma Uptime24? Tomasz Habiger Jest serwer centralny, oraz są urządzenia sond. Sonda to jednopłytkowy komputer, inaczej komputer przemysłowy. Urządzenia sond odpytują w sieciach lokalnych monitorowane urządzenia. To odpytywanie odbywa się w harmonogramach, które są zdefiniowane w konfiguracji serwera centralnego. Serwer centralny zarządza też wszystkimi konfiguracjami tych urządzeń. Mówi co ma być odpytywane w sieciach lokalnych, w jakim interwale czasowym itd. Te pytania są zadawane do systemów lokalnych. Kiedy sonda już posiada odpowiedzi na te pytania, przesyła je do serwera centralnego, gdzie są przetwarzane, podejmowane są ewentualnie akcje typu rejestracja zgłoszeń w systemach helpdeskowych, powiadomienie e-mail, sms itd. Redaktor Z jakiego łącza korzysta sonda? Tomasz Habiger Wszystkie operacje w trybie normalnym są wykonywane z użyciem podstawowego łącza klienta w danej lokalizacji. W przypadkach, kiedy to łącze zawiedzie, podnoszone jest zapasowe łącze GSM. Można też wysłać do sondy rozkaz, aby na żądanie przełączyła się na łącze zapasowe. Redaktor Czy system Uptime24 może funkcjonować bez sondy? Tomasz Habiger Tak. Dodam tylko, że pojawienie się sondy w tym rozwiązaniu przynosi wiele korzyści, które w innych systemach tego typu nie są zwyczajowo dostępne. Warto poważnie rozważyć, czy chcemy z tych funkcji zrezygnować? Adam Bychowiec Podczas analizy potrzeb w firmie zawsze rozpoznajemy na ile sonda może być wartością dodaną dla klienta. Klient ostatecznie sam decyduje jaką architekturę rozwiązania wybiera dla siebie. Redaktor Czy jest jakiś szczególny wyróżnik systemu Uptime24 w stosunku do innych systemów do monitorowania infrastruktury IT? 2 Adam Bychowiec Poza takim elementem jak sonda, o której już wspominaliśmy, ciekawym wyróżnikiem może być to, że wyszliśmy poza dział informatyki jeśli chodzi o komunikację systemu z pracownikami. Obecnie menedżerowie wyższego i średniego szczebla w firmach mogą obserwować, czy procesy biznesowe, za które odpowiadają w firmie, nie są zagrożone ze strony problemów związanych z infrastrukturą teleinformatyczną w ich przedsiębiorstwie. Redaktor A co z otwartością systemu w Uptime24 ? Tomasz Habiger System rozszerzeń, czyli tzw. wtyczek jest przystępny i otwarty- podobnie jak w Nagiosie. W obecnej wersji systemu, każdy może taką wtyczkę doinstalować. Jeśli klient przechodzi z Nagiosa na Uptime24, może wykorzystać zdefiniowane wcześniej wtyczki. Nasi klienci jednak nie muszą tego robić, ponieważ całą tę mądrość dostarczamy już gotową w postaci zestawów monitorujących. Podczas gdy same wtyczki monitorują szczegółowe parametry, istotną zmianą w Uptime24 jest wprowadzenie zestawów monitorujących całe procesy dziedzinowe. Znosi to konieczność posiadania wiedzy eksperckiej dotyczącej szczegółów działania każdego używanego systemu. Redaktor Z jakimi innymi przydatnymi funkcjonalnościami, czy systemami w firmie możemy skonfigurować Uptime24? Tomasz Habiger Istotne jest to, że możemy się zintegrować z systemami, które posiadają interfejsy programistyczne. Systemy zewnętrzne możemy zasilić bezpośrednio informacją, jak również integrować się z nimi przy użyciu interfejsów programistycznych. Adam Bychowiec Najbardziej popularnymi funkcjonalnościami, z którymi łączy się Uptime24 jest m.in. monitoring środowiska serwerowni, monitoring urządzeń chłodniczych, kamer. Łączymy się także z systemami helpdeskowymi do ewidencji zgłoszeń o awarii. Możemy wprowadzić u klienta platformę SIEM (ang. security information and event management), czyli stałe monitorowanie logów i następnie konfigurować alerty w programie Uptime24. 3