Siła powiązań – jak narzędzia IT rysują obraz naszego biznesu

Transkrypt

Siła powiązań – jak narzędzia IT rysują obraz naszego biznesu
Siła powiązań – jak narzędzia IT rysują
obraz naszego biznesu
Kamil Góral, Bartosz Kolasa, PiLab SA
W firmowych silosach kryją się ogromne pokłady danych. Dziś przechowywanie informacji
nie jest problemem, wyzwaniem natomiast jest umiejętność wykorzystania, połączenia
i przekształcenia danych w przydatną wiedzę.
Pierwotnie dane prezentowano w naturalny
sposób, na grafach, pokazujących zarówno dane,
jak i relacje pomiędzy nimi. Jednakże trudno
wykorzystać graf, w którym jest 10000 wzajemnie
powiązanych obiektów. Dlatego ten sposób
organizacji danych był ograniczony pod względem
użyteczności i wydajności. Ponadto stale rosnąca
liczba danych i parametrów, czyli innymi słowy
atrybutów opisujących rzeczywistość, doprowadziła
do powstania baz relacyjnych, ale zgubiony
został przy okazji, zrozumiały dla osób
nietechnicznych, kontekst danych. Użytkownicy
biznesowi nieznający SQL, nie mogli już dowolnie
wykorzystać relacji przechowywanych w bazie
bez pomocy specjalistów.
Połączenia tworzą obraz
W języku angielskim istnieje idiom „connect
the dots” (połączenie kropek/punktów),
oznaczający przeanalizowanie kilku różnych
informacji i wyciągnięcie wniosków. W biznesie
jest podobnie. Analizy dokonuje się łącząc różne
dane, ale problem polega na tym, że często nie
ma jasnej kolejności, ani hierarchii. Nawiązując
do wspominanego idiomu, aby zobaczyć
pełen obraz rzeczywistości biznesowej, trzeba
połączyć wiele kropek w sposób bezpośredni,
jak i pośredni.
W przypadku przedsiębiorstw kropki to dane
z różnych źródeł tj. bazy CRM, ERP, logi ze strony
internetowej lub ogólnodostępne bazy danych
(KRS, CEIDG, GUS). Połączenia to relacje, jakie
41
mają miejsce pomiędzy dowolnymi obiektami,
o których zbieramy dane. Dla przykładu:
tysiące osób pozornie niezwiązanych ze sobą,
mieszkających w różnych miastach, nieznających
się wzajemnie, może być powiązanych
poprzez korzystanie z tego samego modelu
samochodu, objętego procedurą wymiany
wadliwych części, za sprawą tej samej usterki
i zgłoszenia reklamacyjnego. To jest tylko
jeden wymiar relacji: połączenia bezpośrednie,
które są powszechnie wykorzystywane.
Jednakże jak mawiał założyciel firmy Nest Labs
Michale „Tony” Fadell „łatwo rozwiązać problemy
znane każdemu, lecz trudno rozwiązywać problemy
niewidoczne, znane niewielu”.
Dopasowując powyższe zdanie do naszego
przykładu można stwierdzić, że dziś przewagę
zyskuje się dzięki umiejętności wykorzystania
nieoczywistych połączeń do rozszerzenia swojej
perspektywy poznawczej. Wykorzystanie kilku
stopni relacji pośrednich, powiązań w kilku
krokach, pozwala nam zaglądnąć do zupełnie
innej galaktyki. Powiązania pośrednie rozszerzają
naszą rzeczywistość i pokazują rzeczy wcześniej
niewidoczne. Posłużmy się prostym przykładem
instytucji finansowej. Bank posiadając dane na
temat przelewów swoich klientów, może stworzyć
listę potencjalnych klientów wykorzystując
informację o tym, z kim klienci tego banku
realizowali transakcje. Jeżeli dodamy do tego
dane na temat osób uprawnionych do obsługi
konta, dane z KRS czy domu maklerskiego,
tworzy nam się obraz sieci relacji transakcyjnobiznesowych. Okazuje się, że zamiast inwestować
w „losowe” pozyskiwanie potencjalnych klientów,
lepiej adresować pana Jana Kowalskiego, który
jest prezesem firmy będącej klientem banku,
ale jednocześnie członkiem rady nadzorczej
w 4 innych firmach, które nie są klientami banku
i posiada znaczące udziały w 5 kolejnych firmach,
które powinny stać się obiektem zainteresowań
działu marketingu czy sprzedaży.
O ile narzędzia potrafiące to robić są nowe, o tyle
sama koncepcja podążania za powiązaniami
już nie. Przykładem może być tutaj metoda
dobrze znana w firmach produkcyjnych 5W,
wprowadzona po raz pierwszy w Toyocie.
Sztandarowym przykładem jest analiza dlaczego
pracownik złamał nogę na hali produkcyjnej.
1Why: ponieważ na podłodze był rozlany olej.
2Why: ponieważ jednej z maszyn wyciekał olej.
3Why: jedna z podkładek była zużyta. 4Why:
ponieważ była słabej jakości. 5Why: ponieważ
głównym parametrem zakupowym była cena.
Tym sposobem w Toyocie złamanie nogi przez
pracownika doprowadziło do zmiany polityki
zakupowej. Złamana noga pracownika na hali
produkcyjnej nie jest bezpośrednio połączona
z procedurą zakupów. Aby odkryć tę relację
trzeba przejść po kolejnych poziomach połączeń.
Przejście od analizy kto średnio pije najwięcej
piwa i gdzie, do analizy kto z kim najwięcej
pije i kogo najlepiej zapraszać, żeby również
być najczęściej zapraszanym, jest obecnie
przełomem w myśleniu o narzędziach klasy
Business Intelligence.
Około roku 2000 firma Google, zaczęła zyskiwać
na znaczeniu tylko dlatego, że miała naprawdę
dobrą wyszukiwarkę. Sekret Googla? Wykorzystali
algorytm zwany „PageRank”, który odnosi się
do stron internetowych i bazuje na połączeniach
pomiędzy stronami. Im więcej dobrych stron było
połączonych z daną stroną, tym lepiej strona
była oceniana, a tym samym zyskiwała lepszą
pozycję w wynikach wyszukiwania Google.
Tak więc Google stworzył najlepszą wyszukiwarkę
na świecie, właśnie poprzez analizę połączeń.
Inni mocarze internetowi, tacy jak LinkedIn czy
Facebook, jeszcze wyraźniej korzystają z połączeń.
Jednym z klejnotów koronnych Facebooka jest
Social Graph. Jest to graf wskazujący połączenia
ludzi, ich przyjaciół, rzeczy, które lubią, na których
się znają, itd. LinkedIn z kolej pozwala wskazać
osoby, które ktoś inny może znać.
Dlaczego w takim razie nie jest to powszechne
podejście w systemach analitycznych? Idąc tą
drogą trafia się na ścianę w postaci zapytań SQL,
konieczności budowy kostek OLAP, a także
niepołączonych źródeł informacji i konieczności
znajomości pytania przed jego zadaniem.
W przypadku podążania za połączeniami nie
można się ograniczać do jednej interpretacji,
do jednej ścieżki. Na każdym etapie możliwych
jest kilka odpowiedzi. Ważna jest elastyczność
i rozważenie wielu scenariuszy. Sprawdzając
potencjalne przyczyny, na każdym poziomie
„Why” pojawiają się różne możliwości.
Inna interpretacja tego samego przypadku
(złamanej nogi) mogłaby być taka: „dlaczego
nikt nie posprzątał plamy?” i doprowadzić nas
do wniosku, że tryb pracy ekipy sprzątającej
należy zmienić i przesunąć o 15 minut.
Możliwości jest nieskończenie wiele, tym samym
gotowe, predefiniowane, sztywne ścieżki analizy
nie są w stanie opisać pełnej rzeczywistości
biznesowej. Analitycy potrzebują narzędzia,
które nie będzie ich ograniczać poprzez napisane,
gotowe scenariusze. Żeby znaleźć skarb nie
poruszamy się utartymi ścieżkami, tam już
wszystko zostało znalezione przez konkurencję.
Aby się wyróżnić i stworzyć przewagę, należy
zejść ze znanych wszystkim szlaków.
42
Połączenia tworzą wzorce
Połączenia umożliwiają wyszukiwanie wzorców
i na ich bazie tworzenie wielowymiarowych
segmentów. Dane rozpatrywane w kontekście
dwuwymiarowego modelu wierszy i kolumn
wymagają wykorzystania matematyki, statystyki
czy ekonometrii. Specjaliści z tych dziedzin
potrafią dzielić klientów na segmenty i stwierdzać
z określonym prawdopodobieństwem, gdzie
znajduje się grupa docelowa. Analizie poddawane
są zmienne przechowywane w systemach, wybiera
się najbardziej istotne i na tej podstawie tworzone
są modele ekonometryczne. Nie zawsze efekt jest
zgodny z oczekiwaniami, a nakład pracy nie zawsze
przynosi wymierne korzyści. W jednej z instytucji
finansowych zaproszono do współpracy zewnętrzną
firmę specjalizującą się w statystyce. Celem projektu
było przeanalizowanie portfolia inwestycyjnego
i wskazanie najlepszych strategii. Po 6 miesiącach
pracy, wykorzystaniu ok. 80 zmiennych i wydaniu
ogromnych pieniędzy, efekty był taki, że model
ekonometryczny był niemal identyczny jak
strategia, którą „na nosa”, bez setek operacji
statystycznych, wykorzystywała firma wcześniej,
na podstawie swoich doświadczeń. Można przyjąć,
że potwierdzenie hipotezy nie jest bezcelowe,
jednakże prawdą jest, że przez to operacja stała
się jednorazowa i już nikt w tej organizacji nie miał
motywacji powtórzenia za jakiś czas zadania,
nie mówiąc już o cyklicznym badaniu segmentów.
43
Nowe podejście eliminuje w wielu przypadkach
konieczność używania narzędzi statystycznych.
Bazując na połączeniach, mając dostęp
do wszystkich miar i wymiarów, bardzo łatwo
jest stworzyć dynamiczny model pokazujący
kluczowe czynniki mające wpływ na zachowanie
klientów. Poprzez „rozszerzoną perspektywę”,
do opracowania segmentów można użyć
nietypowych wymiarów, co pozwala na elastyczne
wyszukiwanie nieoczywistych zależności.
W standardowych systemach IT mamy do
czynienia z już opracowanym szeregiem wzorców,
modeli czy parametrów. Na bazie doświadczeń
w innych firmach, dostawcy w ramach systemu
oferują gotowe sposoby, np. wyszukania zdarzeń
niepożądanych. Razem z systemem przekazywany
jest szereg zdefiniowanych raportów do
wykorzystania. Tak działają wszyscy najwięksi
dostawcy na rynku. Minusem takiego rozwiązania
jest jego liniowość i brak elastyczności. Jeśli
analizujemy nadużycia za pomocą nawet 250 już
opracowanych algorytmów, to mamy kilka wyzwań.
Pierwsze jest takie, że osoby odpowiedzialne
za sprzeniewierzenie majątku najpewniej też
znają większość z tych 250 sposobów. Mając
wiedzę, jakie narzędzie wykorzystuje się do
szukania sprawcy, łatwiej się ukryć. Po drugie
zmieniając swój model biznesowy, np. tworząc
nowe produkty, otwierają się ścieżki do kolejnych
płaszczyzn nadużyć. Nawet minimalne zmiany
modelu biznesowego powodują, że mechanizmy
opracowane do tej pory przestają być efektywne.
Ponadto, co jest również istotne, korzystanie
z gotowych algorytmów powoduje, że nie jesteśmy
nawet o milimetr lepsi niż konkurencja.
Zawsze możliwe jest stworzenie nowych wzorców.
Jednak koszty i nakład pracy jest tutaj ogromny.
Opracowanie nowych mechanizmów wymaga też
wiele czasu i znajomości minimum SQL, a często
takich narzędzi jak R, Statistica czy SPSS. Jest to
wiedza na tyle specjalistyczna, że konieczne jest
stworzenie specjalnej grupy, gdzie zaangażowani
będą analitycy biznesowi, razem z działem IT
i konsultantami dostawcy rozwiązania. Jest to jednak
podejście post factum. Reagowanie na to, co już się
wydarzyło. Jest to wyścig, w którym nie ma szans
na pierwsze miejsce.
Oddać użytkownikom biznesowym farby,
pędzle i sztalugę
Aby stworzyć nowy wzorzec, należy przede
wszystkim wiedzieć, czego się szuka. Z góry założyć,
jakimi ścieżkami będziemy się poruszać. Analitycy
muszą wiedzieć czego szukają, aby przygotować
raport, który im to pokaże. Znaczącą barierą przy
tworzeniu niestandardowych raportów jest swoisty
głuchy telefon. Analitycy mają wiedzę biznesową,
często brak im jednak znajomości relacyjnych baz
danych, SQL, struktury systemów źródłowych,
wreszcie nie każdy system pozwala na tworzenie
niestandardowych raportów przez klienta.
Biznes definiuje niestandardowa potrzebę
czy też nową hipotezę analityczną, a następnie
przedstawia swoje potrzeby ekspertom znającym
język SQL. Pierwszą trudnością jest rozmowa
tymi samymi kategoriami. Klient – kategoria
jednoznaczna dla działu marketingu, nie jest
jednoznaczna dla działu IT, który zarządza
3 systemami (dedykowanymi dla sprzedaży,
marketingu i księgowości), w każdym z nich
zdefiniowany jest klient, ale te definicje nie
pokrywają się. Po przejściu etapu uzgodnień
semantycznych, tworzony jest raport. W zależności
jak złożone jest zapytanie, trwa to krócej
(godziny), dłużej (dni) lub bardzo długo (nawet
miesiące). Otrzymana pierwsza wersja raportu
trafia do zleceniodawców. Biznes na podstawie
wyników modyfikuje potrzebę lub zainspirowany
wynikami chce sprawdzić kolejną hipotezę.
Łańcuch komunikacji się powtarza. Taki sposób
dochodzenia do raportów jest długi, bardzo
kosztowny, pochłaniający zaangażowanie i czas
wielu działów. Brakuje tutaj interakcji – sytuacji,
gdzie biznes sam może zapytać o dowolne
rzeczy i w czasie rzeczywistym otrzymać wynik.
Konieczne jest rozwiązanie elastyczne, praktycznie
samoobsługowe, które pozwoli płynnie poruszać
się po hipotezach w dowolny sposób, bez
konieczności wykonywania prac programistycznych
czy tworzenia zapytań SQL. Główną cechą narzędzi
tego typu jest swoboda przechodzenia pomiędzy
połączonymi klasami obiektów. Jeśli patrzymy na
klienta połączonego z X obiektami, to mamy Y
możliwych przejść. Pełna swoboda pozwala nam iść
w dowolnym kierunku. Jeśli nie patrzymy na cechy
obiektu, ale na to z kim jest połączony, możemy
przeprowadzać analizy w dowolnym kierunku,
nie ograniczając się do gotowych scenariuszy.
W zakresie technologii analiza danych zatoczyła
koło i ponownie koncentruje się na połączeniach.
Przyszłość narzędzi BI służących do analizy,
którą wyraźnie należy oddzielić od raportowania –
to elastyczne środowisko, gdzie nie ma narzuconych
ścieżek analizy i dowolnie można korzystać
z połączeń. Narzędzia tego typu muszą pozwalać
na analizę przez użytkowników biznesowych,
którzy rozumiejąc relacje biznesowe są w pełni
niezależni. Nie muszą uczyć się SQL czy struktury
bazy danych. Dzięki szybkości działania wynikającej
z elastyczności, możemy odpowiedzieć na pytania
szybciej, niż zada je konkurencja. Uzyskać przewagę
konkurencyjną dzięki sile połączeń.
44
PiLab/BI jest platformą Business Intelligence (BI) nowej generacji, służącą do
zaawansowanych analiz, umożliwiającą odkrywanie ukrytych relacji pomiędzy danymi.
Łatwa identyfikacja i analiza połączonych danych
PiLab/BI zapewnia bezprecedensową możliwość wizualizacji danych pod każdym kątem i pozwala
na obserwację zarówno danych, jak i relacji pomiędzy nimi.
Dane mogą być najpierw zbadane za pomocą Universe Viewer – jest to narzędzie, które umożliwia
wizualizację wszystkich danych obecnych w systemie oraz połączeń pomiędzy poszczególnymi
zbiorami. Universe Viewer umożliwia łatwą identyfikację obszarów, którymi warto się
zainteresować, a następnie pozwala na szczegółowe badanie wybranych elementów na wykresach,
tabelach przestawnych oraz dynamicznych grafach.
Wizualizowanie danych na wykresach grafowych odbywa się na zasadzie „connect the dots”
(dosłownie: połącz kropki). Pozwala to tworzyć aplikacje służące m. in. do wykrywania działań
niepożądanych, zarządzania ryzykiem, analizy przyczyn źródłowych i analiz każdego typu sieci:
społecznościowych lub fizycznych.
Przeszukiwanie danych
PiLab/BI pozwala nie tylko drążyć i filtrować każdego typu dane, ale za pomocą Universe Viewer
umożliwia także przeszukiwanie, czyli płynne „surfowanie” pomiędzy połączonymi zbiorami.
Ponieważ nie ma z góry zaprogramowanej ścieżki, którą użytkownik musi podążać, można drążyć
lub przemieszczać się pomiędzy zbiorami danych dokładnie tak, jak się chce.
Zadawanie dowolnych pytań, testowanie hipotez ad-hoc
PiLab/BI umożliwia ciągłe, interaktywne i ad-hoc testowanie dowolnych hipotez, przy użyciu
powszechnie znanych pojęć. Dzięki przeszukiwaniu danych za pomocą PiLab/BI można lepiej
zrozumieć zadawane pytania, a błyskawiczna, wielowymiarowa analiza natychmiast dostarcza
wyczerpujących odpowiedzi.
Wiarygodne wyniki
W tradycyjnym podejściu zadawane jest pytanie, specjalista przygotowuje zapytanie SQL i nie ma
żadnej pewności, czy otrzymane wyniki są właściwe. W PiLab/BI pośrednie wyliczenia są cały czas
widoczne, co pozwala rozumieć ostateczny wynik i jego poprawność.
Firma PiLab prowadzi bezpłatne projekty pilotażowe na następujących zasadach:
•Zgłoś swój udział za pomocą formularza na stronie pilab.pl
•Jeżeli zostaniesz zakwalifikowany, Twój projekt pilotażowy będzie zupełnie bezpłatny.
•Twoje dane posłużą do rozwiązania Twojego problemu.
•Otrzymasz i zatrzymasz wyniki.
•Projekt, od momentu rozpoczęcia, trwa zazwyczaj kilka tygodni.
45
PiLab to polska spółka hi-tech, która znajduje się w centrum najważniejszej części segmentu
infrastruktury IT. Rewolucjonizuje zarządzanie informacją w przedsiębiorstwach w taki sam sposób,
jak wyszukiwarka Google zrewolucjonizowała wyszukiwanie informacji w Internecie. Misją firmy
jest odkrywanie i dostarczanie kompleksowej wiedzy, ukrytej w miliardowych, odseparowanych
zbiorach danych, gromadzonych przez przedsiębiorstwa i instytucje. Spółka rozwinęła unikalną
na skalę światową technologię, na którą zostały złożone 4 patenty w USA i w Europie. Rozwiązania
PiLab zostały zweryfikowane przez praktyków high-tech z Krzemowej Doliny, amerykańskie
legendy branży IT zaangażowały się biznesowo i kapitałowo w rozwój polskiej spółki.
Firma uruchomiła pierwsze biuro w Palo Alto (California).
www.pilab.pl
Kamil Góral
Solution Marketing Manager for Poland, PiLab SA
Absolwent Wydziału Zarządzania i Marketingu Uniwersytetu Ekonomicznego we Wrocławiu. Posiada ponad 8-letnie
doświadczenie w branży IT. W PiLab odpowiada za wprowadzanie rozwiązania PiLab/BI na rynek Polski. Realizował liczne
projekty z obszaru nowych technologii m.in. jako dyrektor centrum rozwoju biznesu w firmie Comarch odpowiedzialny był
za wprowadzanie nowych produktów na rynek tj. systemy ERP, e-commerce, mobile. Doradza firmom w zakresie marketingu
i rozwoju biznesu.
Bartosz Kolasa
Business Development Manager, PiLab SA
Posiada wszechstronne wykształcenie ekonomiczne. Ukończył Wydział Nauk Społecznych Uniwersytetu Wrocławskiego,
ekonomię na wydziale Prawa, Administracji i Ekonomii Uniwersytetu Wrocławskiego. Równolegle studiował Zarządzanie
na Wydziale Zarządzania, Informatyki i Finansów Uniwersytetu Ekonomicznego we Wrocławiu. W PiLab od 2012 roku,
odpowiada za relację z partnerami oraz kluczowymi klientami. Specjalizuje się w definiowaniu potrzeb biznesowych klientów.
46