Siła powiązań – jak narzędzia IT rysują obraz naszego biznesu
Transkrypt
Siła powiązań – jak narzędzia IT rysują obraz naszego biznesu
Siła powiązań – jak narzędzia IT rysują obraz naszego biznesu Kamil Góral, Bartosz Kolasa, PiLab SA W firmowych silosach kryją się ogromne pokłady danych. Dziś przechowywanie informacji nie jest problemem, wyzwaniem natomiast jest umiejętność wykorzystania, połączenia i przekształcenia danych w przydatną wiedzę. Pierwotnie dane prezentowano w naturalny sposób, na grafach, pokazujących zarówno dane, jak i relacje pomiędzy nimi. Jednakże trudno wykorzystać graf, w którym jest 10000 wzajemnie powiązanych obiektów. Dlatego ten sposób organizacji danych był ograniczony pod względem użyteczności i wydajności. Ponadto stale rosnąca liczba danych i parametrów, czyli innymi słowy atrybutów opisujących rzeczywistość, doprowadziła do powstania baz relacyjnych, ale zgubiony został przy okazji, zrozumiały dla osób nietechnicznych, kontekst danych. Użytkownicy biznesowi nieznający SQL, nie mogli już dowolnie wykorzystać relacji przechowywanych w bazie bez pomocy specjalistów. Połączenia tworzą obraz W języku angielskim istnieje idiom „connect the dots” (połączenie kropek/punktów), oznaczający przeanalizowanie kilku różnych informacji i wyciągnięcie wniosków. W biznesie jest podobnie. Analizy dokonuje się łącząc różne dane, ale problem polega na tym, że często nie ma jasnej kolejności, ani hierarchii. Nawiązując do wspominanego idiomu, aby zobaczyć pełen obraz rzeczywistości biznesowej, trzeba połączyć wiele kropek w sposób bezpośredni, jak i pośredni. W przypadku przedsiębiorstw kropki to dane z różnych źródeł tj. bazy CRM, ERP, logi ze strony internetowej lub ogólnodostępne bazy danych (KRS, CEIDG, GUS). Połączenia to relacje, jakie 41 mają miejsce pomiędzy dowolnymi obiektami, o których zbieramy dane. Dla przykładu: tysiące osób pozornie niezwiązanych ze sobą, mieszkających w różnych miastach, nieznających się wzajemnie, może być powiązanych poprzez korzystanie z tego samego modelu samochodu, objętego procedurą wymiany wadliwych części, za sprawą tej samej usterki i zgłoszenia reklamacyjnego. To jest tylko jeden wymiar relacji: połączenia bezpośrednie, które są powszechnie wykorzystywane. Jednakże jak mawiał założyciel firmy Nest Labs Michale „Tony” Fadell „łatwo rozwiązać problemy znane każdemu, lecz trudno rozwiązywać problemy niewidoczne, znane niewielu”. Dopasowując powyższe zdanie do naszego przykładu można stwierdzić, że dziś przewagę zyskuje się dzięki umiejętności wykorzystania nieoczywistych połączeń do rozszerzenia swojej perspektywy poznawczej. Wykorzystanie kilku stopni relacji pośrednich, powiązań w kilku krokach, pozwala nam zaglądnąć do zupełnie innej galaktyki. Powiązania pośrednie rozszerzają naszą rzeczywistość i pokazują rzeczy wcześniej niewidoczne. Posłużmy się prostym przykładem instytucji finansowej. Bank posiadając dane na temat przelewów swoich klientów, może stworzyć listę potencjalnych klientów wykorzystując informację o tym, z kim klienci tego banku realizowali transakcje. Jeżeli dodamy do tego dane na temat osób uprawnionych do obsługi konta, dane z KRS czy domu maklerskiego, tworzy nam się obraz sieci relacji transakcyjnobiznesowych. Okazuje się, że zamiast inwestować w „losowe” pozyskiwanie potencjalnych klientów, lepiej adresować pana Jana Kowalskiego, który jest prezesem firmy będącej klientem banku, ale jednocześnie członkiem rady nadzorczej w 4 innych firmach, które nie są klientami banku i posiada znaczące udziały w 5 kolejnych firmach, które powinny stać się obiektem zainteresowań działu marketingu czy sprzedaży. O ile narzędzia potrafiące to robić są nowe, o tyle sama koncepcja podążania za powiązaniami już nie. Przykładem może być tutaj metoda dobrze znana w firmach produkcyjnych 5W, wprowadzona po raz pierwszy w Toyocie. Sztandarowym przykładem jest analiza dlaczego pracownik złamał nogę na hali produkcyjnej. 1Why: ponieważ na podłodze był rozlany olej. 2Why: ponieważ jednej z maszyn wyciekał olej. 3Why: jedna z podkładek była zużyta. 4Why: ponieważ była słabej jakości. 5Why: ponieważ głównym parametrem zakupowym była cena. Tym sposobem w Toyocie złamanie nogi przez pracownika doprowadziło do zmiany polityki zakupowej. Złamana noga pracownika na hali produkcyjnej nie jest bezpośrednio połączona z procedurą zakupów. Aby odkryć tę relację trzeba przejść po kolejnych poziomach połączeń. Przejście od analizy kto średnio pije najwięcej piwa i gdzie, do analizy kto z kim najwięcej pije i kogo najlepiej zapraszać, żeby również być najczęściej zapraszanym, jest obecnie przełomem w myśleniu o narzędziach klasy Business Intelligence. Około roku 2000 firma Google, zaczęła zyskiwać na znaczeniu tylko dlatego, że miała naprawdę dobrą wyszukiwarkę. Sekret Googla? Wykorzystali algorytm zwany „PageRank”, który odnosi się do stron internetowych i bazuje na połączeniach pomiędzy stronami. Im więcej dobrych stron było połączonych z daną stroną, tym lepiej strona była oceniana, a tym samym zyskiwała lepszą pozycję w wynikach wyszukiwania Google. Tak więc Google stworzył najlepszą wyszukiwarkę na świecie, właśnie poprzez analizę połączeń. Inni mocarze internetowi, tacy jak LinkedIn czy Facebook, jeszcze wyraźniej korzystają z połączeń. Jednym z klejnotów koronnych Facebooka jest Social Graph. Jest to graf wskazujący połączenia ludzi, ich przyjaciół, rzeczy, które lubią, na których się znają, itd. LinkedIn z kolej pozwala wskazać osoby, które ktoś inny może znać. Dlaczego w takim razie nie jest to powszechne podejście w systemach analitycznych? Idąc tą drogą trafia się na ścianę w postaci zapytań SQL, konieczności budowy kostek OLAP, a także niepołączonych źródeł informacji i konieczności znajomości pytania przed jego zadaniem. W przypadku podążania za połączeniami nie można się ograniczać do jednej interpretacji, do jednej ścieżki. Na każdym etapie możliwych jest kilka odpowiedzi. Ważna jest elastyczność i rozważenie wielu scenariuszy. Sprawdzając potencjalne przyczyny, na każdym poziomie „Why” pojawiają się różne możliwości. Inna interpretacja tego samego przypadku (złamanej nogi) mogłaby być taka: „dlaczego nikt nie posprzątał plamy?” i doprowadzić nas do wniosku, że tryb pracy ekipy sprzątającej należy zmienić i przesunąć o 15 minut. Możliwości jest nieskończenie wiele, tym samym gotowe, predefiniowane, sztywne ścieżki analizy nie są w stanie opisać pełnej rzeczywistości biznesowej. Analitycy potrzebują narzędzia, które nie będzie ich ograniczać poprzez napisane, gotowe scenariusze. Żeby znaleźć skarb nie poruszamy się utartymi ścieżkami, tam już wszystko zostało znalezione przez konkurencję. Aby się wyróżnić i stworzyć przewagę, należy zejść ze znanych wszystkim szlaków. 42 Połączenia tworzą wzorce Połączenia umożliwiają wyszukiwanie wzorców i na ich bazie tworzenie wielowymiarowych segmentów. Dane rozpatrywane w kontekście dwuwymiarowego modelu wierszy i kolumn wymagają wykorzystania matematyki, statystyki czy ekonometrii. Specjaliści z tych dziedzin potrafią dzielić klientów na segmenty i stwierdzać z określonym prawdopodobieństwem, gdzie znajduje się grupa docelowa. Analizie poddawane są zmienne przechowywane w systemach, wybiera się najbardziej istotne i na tej podstawie tworzone są modele ekonometryczne. Nie zawsze efekt jest zgodny z oczekiwaniami, a nakład pracy nie zawsze przynosi wymierne korzyści. W jednej z instytucji finansowych zaproszono do współpracy zewnętrzną firmę specjalizującą się w statystyce. Celem projektu było przeanalizowanie portfolia inwestycyjnego i wskazanie najlepszych strategii. Po 6 miesiącach pracy, wykorzystaniu ok. 80 zmiennych i wydaniu ogromnych pieniędzy, efekty był taki, że model ekonometryczny był niemal identyczny jak strategia, którą „na nosa”, bez setek operacji statystycznych, wykorzystywała firma wcześniej, na podstawie swoich doświadczeń. Można przyjąć, że potwierdzenie hipotezy nie jest bezcelowe, jednakże prawdą jest, że przez to operacja stała się jednorazowa i już nikt w tej organizacji nie miał motywacji powtórzenia za jakiś czas zadania, nie mówiąc już o cyklicznym badaniu segmentów. 43 Nowe podejście eliminuje w wielu przypadkach konieczność używania narzędzi statystycznych. Bazując na połączeniach, mając dostęp do wszystkich miar i wymiarów, bardzo łatwo jest stworzyć dynamiczny model pokazujący kluczowe czynniki mające wpływ na zachowanie klientów. Poprzez „rozszerzoną perspektywę”, do opracowania segmentów można użyć nietypowych wymiarów, co pozwala na elastyczne wyszukiwanie nieoczywistych zależności. W standardowych systemach IT mamy do czynienia z już opracowanym szeregiem wzorców, modeli czy parametrów. Na bazie doświadczeń w innych firmach, dostawcy w ramach systemu oferują gotowe sposoby, np. wyszukania zdarzeń niepożądanych. Razem z systemem przekazywany jest szereg zdefiniowanych raportów do wykorzystania. Tak działają wszyscy najwięksi dostawcy na rynku. Minusem takiego rozwiązania jest jego liniowość i brak elastyczności. Jeśli analizujemy nadużycia za pomocą nawet 250 już opracowanych algorytmów, to mamy kilka wyzwań. Pierwsze jest takie, że osoby odpowiedzialne za sprzeniewierzenie majątku najpewniej też znają większość z tych 250 sposobów. Mając wiedzę, jakie narzędzie wykorzystuje się do szukania sprawcy, łatwiej się ukryć. Po drugie zmieniając swój model biznesowy, np. tworząc nowe produkty, otwierają się ścieżki do kolejnych płaszczyzn nadużyć. Nawet minimalne zmiany modelu biznesowego powodują, że mechanizmy opracowane do tej pory przestają być efektywne. Ponadto, co jest również istotne, korzystanie z gotowych algorytmów powoduje, że nie jesteśmy nawet o milimetr lepsi niż konkurencja. Zawsze możliwe jest stworzenie nowych wzorców. Jednak koszty i nakład pracy jest tutaj ogromny. Opracowanie nowych mechanizmów wymaga też wiele czasu i znajomości minimum SQL, a często takich narzędzi jak R, Statistica czy SPSS. Jest to wiedza na tyle specjalistyczna, że konieczne jest stworzenie specjalnej grupy, gdzie zaangażowani będą analitycy biznesowi, razem z działem IT i konsultantami dostawcy rozwiązania. Jest to jednak podejście post factum. Reagowanie na to, co już się wydarzyło. Jest to wyścig, w którym nie ma szans na pierwsze miejsce. Oddać użytkownikom biznesowym farby, pędzle i sztalugę Aby stworzyć nowy wzorzec, należy przede wszystkim wiedzieć, czego się szuka. Z góry założyć, jakimi ścieżkami będziemy się poruszać. Analitycy muszą wiedzieć czego szukają, aby przygotować raport, który im to pokaże. Znaczącą barierą przy tworzeniu niestandardowych raportów jest swoisty głuchy telefon. Analitycy mają wiedzę biznesową, często brak im jednak znajomości relacyjnych baz danych, SQL, struktury systemów źródłowych, wreszcie nie każdy system pozwala na tworzenie niestandardowych raportów przez klienta. Biznes definiuje niestandardowa potrzebę czy też nową hipotezę analityczną, a następnie przedstawia swoje potrzeby ekspertom znającym język SQL. Pierwszą trudnością jest rozmowa tymi samymi kategoriami. Klient – kategoria jednoznaczna dla działu marketingu, nie jest jednoznaczna dla działu IT, który zarządza 3 systemami (dedykowanymi dla sprzedaży, marketingu i księgowości), w każdym z nich zdefiniowany jest klient, ale te definicje nie pokrywają się. Po przejściu etapu uzgodnień semantycznych, tworzony jest raport. W zależności jak złożone jest zapytanie, trwa to krócej (godziny), dłużej (dni) lub bardzo długo (nawet miesiące). Otrzymana pierwsza wersja raportu trafia do zleceniodawców. Biznes na podstawie wyników modyfikuje potrzebę lub zainspirowany wynikami chce sprawdzić kolejną hipotezę. Łańcuch komunikacji się powtarza. Taki sposób dochodzenia do raportów jest długi, bardzo kosztowny, pochłaniający zaangażowanie i czas wielu działów. Brakuje tutaj interakcji – sytuacji, gdzie biznes sam może zapytać o dowolne rzeczy i w czasie rzeczywistym otrzymać wynik. Konieczne jest rozwiązanie elastyczne, praktycznie samoobsługowe, które pozwoli płynnie poruszać się po hipotezach w dowolny sposób, bez konieczności wykonywania prac programistycznych czy tworzenia zapytań SQL. Główną cechą narzędzi tego typu jest swoboda przechodzenia pomiędzy połączonymi klasami obiektów. Jeśli patrzymy na klienta połączonego z X obiektami, to mamy Y możliwych przejść. Pełna swoboda pozwala nam iść w dowolnym kierunku. Jeśli nie patrzymy na cechy obiektu, ale na to z kim jest połączony, możemy przeprowadzać analizy w dowolnym kierunku, nie ograniczając się do gotowych scenariuszy. W zakresie technologii analiza danych zatoczyła koło i ponownie koncentruje się na połączeniach. Przyszłość narzędzi BI służących do analizy, którą wyraźnie należy oddzielić od raportowania – to elastyczne środowisko, gdzie nie ma narzuconych ścieżek analizy i dowolnie można korzystać z połączeń. Narzędzia tego typu muszą pozwalać na analizę przez użytkowników biznesowych, którzy rozumiejąc relacje biznesowe są w pełni niezależni. Nie muszą uczyć się SQL czy struktury bazy danych. Dzięki szybkości działania wynikającej z elastyczności, możemy odpowiedzieć na pytania szybciej, niż zada je konkurencja. Uzyskać przewagę konkurencyjną dzięki sile połączeń. 44 PiLab/BI jest platformą Business Intelligence (BI) nowej generacji, służącą do zaawansowanych analiz, umożliwiającą odkrywanie ukrytych relacji pomiędzy danymi. Łatwa identyfikacja i analiza połączonych danych PiLab/BI zapewnia bezprecedensową możliwość wizualizacji danych pod każdym kątem i pozwala na obserwację zarówno danych, jak i relacji pomiędzy nimi. Dane mogą być najpierw zbadane za pomocą Universe Viewer – jest to narzędzie, które umożliwia wizualizację wszystkich danych obecnych w systemie oraz połączeń pomiędzy poszczególnymi zbiorami. Universe Viewer umożliwia łatwą identyfikację obszarów, którymi warto się zainteresować, a następnie pozwala na szczegółowe badanie wybranych elementów na wykresach, tabelach przestawnych oraz dynamicznych grafach. Wizualizowanie danych na wykresach grafowych odbywa się na zasadzie „connect the dots” (dosłownie: połącz kropki). Pozwala to tworzyć aplikacje służące m. in. do wykrywania działań niepożądanych, zarządzania ryzykiem, analizy przyczyn źródłowych i analiz każdego typu sieci: społecznościowych lub fizycznych. Przeszukiwanie danych PiLab/BI pozwala nie tylko drążyć i filtrować każdego typu dane, ale za pomocą Universe Viewer umożliwia także przeszukiwanie, czyli płynne „surfowanie” pomiędzy połączonymi zbiorami. Ponieważ nie ma z góry zaprogramowanej ścieżki, którą użytkownik musi podążać, można drążyć lub przemieszczać się pomiędzy zbiorami danych dokładnie tak, jak się chce. Zadawanie dowolnych pytań, testowanie hipotez ad-hoc PiLab/BI umożliwia ciągłe, interaktywne i ad-hoc testowanie dowolnych hipotez, przy użyciu powszechnie znanych pojęć. Dzięki przeszukiwaniu danych za pomocą PiLab/BI można lepiej zrozumieć zadawane pytania, a błyskawiczna, wielowymiarowa analiza natychmiast dostarcza wyczerpujących odpowiedzi. Wiarygodne wyniki W tradycyjnym podejściu zadawane jest pytanie, specjalista przygotowuje zapytanie SQL i nie ma żadnej pewności, czy otrzymane wyniki są właściwe. W PiLab/BI pośrednie wyliczenia są cały czas widoczne, co pozwala rozumieć ostateczny wynik i jego poprawność. Firma PiLab prowadzi bezpłatne projekty pilotażowe na następujących zasadach: •Zgłoś swój udział za pomocą formularza na stronie pilab.pl •Jeżeli zostaniesz zakwalifikowany, Twój projekt pilotażowy będzie zupełnie bezpłatny. •Twoje dane posłużą do rozwiązania Twojego problemu. •Otrzymasz i zatrzymasz wyniki. •Projekt, od momentu rozpoczęcia, trwa zazwyczaj kilka tygodni. 45 PiLab to polska spółka hi-tech, która znajduje się w centrum najważniejszej części segmentu infrastruktury IT. Rewolucjonizuje zarządzanie informacją w przedsiębiorstwach w taki sam sposób, jak wyszukiwarka Google zrewolucjonizowała wyszukiwanie informacji w Internecie. Misją firmy jest odkrywanie i dostarczanie kompleksowej wiedzy, ukrytej w miliardowych, odseparowanych zbiorach danych, gromadzonych przez przedsiębiorstwa i instytucje. Spółka rozwinęła unikalną na skalę światową technologię, na którą zostały złożone 4 patenty w USA i w Europie. Rozwiązania PiLab zostały zweryfikowane przez praktyków high-tech z Krzemowej Doliny, amerykańskie legendy branży IT zaangażowały się biznesowo i kapitałowo w rozwój polskiej spółki. Firma uruchomiła pierwsze biuro w Palo Alto (California). www.pilab.pl Kamil Góral Solution Marketing Manager for Poland, PiLab SA Absolwent Wydziału Zarządzania i Marketingu Uniwersytetu Ekonomicznego we Wrocławiu. Posiada ponad 8-letnie doświadczenie w branży IT. W PiLab odpowiada za wprowadzanie rozwiązania PiLab/BI na rynek Polski. Realizował liczne projekty z obszaru nowych technologii m.in. jako dyrektor centrum rozwoju biznesu w firmie Comarch odpowiedzialny był za wprowadzanie nowych produktów na rynek tj. systemy ERP, e-commerce, mobile. Doradza firmom w zakresie marketingu i rozwoju biznesu. Bartosz Kolasa Business Development Manager, PiLab SA Posiada wszechstronne wykształcenie ekonomiczne. Ukończył Wydział Nauk Społecznych Uniwersytetu Wrocławskiego, ekonomię na wydziale Prawa, Administracji i Ekonomii Uniwersytetu Wrocławskiego. Równolegle studiował Zarządzanie na Wydziale Zarządzania, Informatyki i Finansów Uniwersytetu Ekonomicznego we Wrocławiu. W PiLab od 2012 roku, odpowiada za relację z partnerami oraz kluczowymi klientami. Specjalizuje się w definiowaniu potrzeb biznesowych klientów. 46