BIG Data - BIG-u
Transkrypt
BIG Data - BIG-u
Scoring w oparciu o Big Data 8 kwietnia 2014 roku „Od początków ludzkości do roku 2003 wygenerowano 5 eksabajtów informacji… …tyle samo ludzkość generuje dziś co dwa dni”. - Eric Schmidt, Google CEO 2 Dlaczego Big Data jest tak ważna? Amazon, dzięki wykorzystaniu BIG Data, podsuwa Ci te produkty, które byłbyś skłonny kupić. Zarówno system rekomendacji jak i proces przygotowywania ofert indywidualnych wykorzystywany przez Tesco działają w oparciu o BIG Data. BIG Data przyczynił się do schwytania Osamy Bin Ladena przez CIA. Wyniki wyszukiwania w Google oraz wskaźnik PageRank* działają w oparciu o BIG Data. Analiza ogromnej ilości komentarzy klientów w czasie rzeczywistym zapewnia firmie Hertz przewagę konkurencyjną. *metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej ich jakość. 3 Źródło danych • Portale społecznościowe (Facebook, LinkedIn, Twitter, Google, blogs, Amazon, ZDNet, itp.) • Dane generowane na podstawie aktywności użytkowników (rejestr aktywności komputerów oraz urządzeń mobilnych alias “Internet Wszechrzeczy”) • Publiczne zbiory danych (World Bank, SEC/Edgar, Wikipedia, IMDb, itp..) • Hurtownie danych • Dane historyczne (formularze elektroniczne - również te archiwalne, np. formularze ubezpieczeniowe, dokumentacja medyczna, a także korespondencja z klientem. • Użytkownicy serwisu YouTube w każdej minucie dnia przesyłają 48 godzin nowych materiałów wideo. • Facebook przyjmuje codziennie 100 terabajtów danych. • Każdego dnia na Twitterze pojawia się około175 milionów tweetów a na samym portalu jest już 465 milionów kont. • Każdego miesiąca na Facebooku użytkownicy publikują 30 miliardów postów oraz komentarzy. 4 Dane z Facebooka dają Ci przewagę Przeciętny profil na Facebooku zawiera od 5 do 10 tysięcy informacji z czego 100 z nich jest użytecznych w scoringu kredytowym. Dodatkowo, dane pochodzące z przeglądarki mówią wiele o sprzęcie komputerowym zgłaszającego zapytanie oraz oprogramowaniu z którego korzysta. Możemy również śledzić w jaki sposób użytkownik porusza się na stronie internetowej i jak długo wypełnia określone pola. Źródło: Facebook Dzięki temu poznajemy użytkownika od środka począwszy od hobby, lajków, edukacji, miejsca pracy (w zależności od dynamiki aktywności na Facebooku), położenia geograficznego oraz gier w które gra. 5 Jak działa scoring kredytowy online? Większość pożyczkodawców opiera swoje kredytowe decyzje na danych pochodzących z formularzy o przyznanie pożyczki (wiek, PESEL, adres, dochód) oraz biur informacji gospodarczej (np. BIG InfoMonitor). Standardowy formularz o przyznanie pożyczki W sumie są jednak w stanie zgromadzić jedynie od 20 do 30 informacji. Naukowa analiza regresji jest wykorzystywana bardzo rzadko. Zazwyczaj, są to proste narzędzia w Excelu do badania korelacji lub tworzenia drzewa decyzyjnego. Chociaż każde istotne badanie dowodzi, iż metody oparte na analizie regresji są zawsze nadrzędne w stosunku do bardziej uproszczonych narzędzi, firmom nadal brakuje wykwalifikowanych kadr w tym obszarze. 6 Wartość dodana scoringu wykorzystującego BIG Data (Big Data Scoring - BDS) Scoring wykorzystujący BIG Data sprawił, że media społecznościowe oraz inne dane pozyskiwane drogą online są dzisiaj ważnym elementem przy podejmowaniu decyzji kredytowych zwiększając tym samym jakość kredytów oraz podnosząc wskaźnik udzielonych pożyczek (wskaźnik akceptacji). Nasze algorytmy opierają się na wieloletnim doświadczeniu w gromadzeniu danych oraz ich modelowaniu. Aktualne informacje o płatnościach otrzymywane z banków umożliwiają nam wykrywanie korelacji oraz wzorów zachowań w mediach społecznościowych, które prowadzą do złych decyzji kredytowych. W rezultacie możemy dokładnie przewidzieć jaki będzie wskaźnik niewywiązywania się ze zobowiązań każdego kto korzysta z Facebooka. Nasze modele pomagają pożyczkodawcą oszczędzać pieniądze przy stratach kredytowych oraz zarabiać jednocześnie przy zwiększonym wskaźniku udzielonych pożyczek (wskaźnik akceptacji). 7 Tablica grup jakości kredytowej na podstawie Facebooka W przypadku „10” istnieje 4% prawdopodobieństwo że osoba z taką punktacją opóźnieni się ze spłatą kredytu więcej niż 90 dni. Jednocześnie jeśli ktoś otrzymał “1” istnieje 80% prawdopodobieństwo nie spłacenia zobowiązania na czas (lub nie spłacenia zobowiązania w ogóle). 8 Przykłady Pewien paneuropejski specjalista ds. pożyczek konsumenckich osiągnął wskaźnik strat kredytowych na poziomie 3,3% oraz współczynnik akceptacji który wyniósł 40% korzystając z tradycyjnych metod scoringowych (dane z biura informacji kredytowej oraz formularza o przyznanie pożyczki). Pożyczkodawca wykorzystywał wyrafinowaną metodę regresji opartą na scoringu odnotowując jednocześnie lepsze wyniki we wszystkich grupach jakości kredytowej – wszystko dzięki Facebookowi oraz innym danym pochodzącym z Internetu. Za sprawą połączenia mediów społecznościowych z Big Data Score, straty kredytowe spadły do 2.9% and wskaźnik udzielonych pożyczek (akceptacji) pożyczek wzrósł do 53%. 9 Dziękuję za uwagę! Erki Kert +372 5680 0458 [email protected] Skype: erki_kert 10