BIG Data - BIG-u

Transkrypt

BIG Data - BIG-u
Scoring w oparciu o Big Data
8 kwietnia 2014 roku
„Od początków ludzkości do roku 2003
wygenerowano 5 eksabajtów informacji…
…tyle samo ludzkość generuje
dziś co dwa dni”.
- Eric Schmidt, Google CEO
2
Dlaczego Big Data jest tak ważna?
Amazon, dzięki wykorzystaniu BIG Data, podsuwa Ci
te produkty, które byłbyś skłonny kupić.
Zarówno system rekomendacji jak i proces
przygotowywania ofert indywidualnych
wykorzystywany przez Tesco działają w oparciu o BIG
Data.
BIG Data przyczynił się do schwytania Osamy Bin
Ladena przez CIA.
Wyniki wyszukiwania w Google oraz wskaźnik
PageRank* działają w oparciu o BIG Data.
Analiza ogromnej ilości komentarzy klientów w czasie
rzeczywistym zapewnia firmie Hertz przewagę
konkurencyjną.
*metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej ich jakość.
3
Źródło danych
• Portale społecznościowe
(Facebook, LinkedIn, Twitter,
Google, blogs, Amazon, ZDNet, itp.)
• Dane generowane na podstawie
aktywności użytkowników (rejestr
aktywności komputerów oraz
urządzeń mobilnych alias “Internet
Wszechrzeczy”)
• Publiczne zbiory danych (World
Bank, SEC/Edgar, Wikipedia, IMDb,
itp..)
• Hurtownie danych
• Dane historyczne (formularze
elektroniczne - również te
archiwalne, np. formularze
ubezpieczeniowe, dokumentacja
medyczna, a także korespondencja
z klientem.
• Użytkownicy serwisu YouTube w
każdej minucie dnia przesyłają 48
godzin nowych materiałów wideo.
• Facebook przyjmuje codziennie
100 terabajtów danych.
• Każdego dnia na Twitterze pojawia
się około175 milionów tweetów a
na samym portalu jest już 465
milionów kont.
• Każdego miesiąca na Facebooku
użytkownicy publikują 30 miliardów
postów oraz komentarzy.
4
Dane z Facebooka dają Ci przewagę
Przeciętny profil na Facebooku zawiera od 5 do
10 tysięcy informacji z czego 100 z nich jest
użytecznych w scoringu kredytowym.
Dodatkowo, dane pochodzące z przeglądarki
mówią wiele o sprzęcie komputerowym
zgłaszającego zapytanie oraz oprogramowaniu z
którego korzysta. Możemy również śledzić w jaki
sposób użytkownik porusza się na stronie
internetowej i jak długo wypełnia określone pola.
Źródło: Facebook
Dzięki temu poznajemy użytkownika od środka
począwszy od hobby, lajków, edukacji, miejsca
pracy (w zależności od dynamiki aktywności na
Facebooku), położenia geograficznego oraz gier
w które gra.
5
Jak działa scoring kredytowy online?
Większość pożyczkodawców opiera swoje
kredytowe decyzje na danych pochodzących z
formularzy o przyznanie pożyczki (wiek,
PESEL, adres, dochód) oraz biur informacji
gospodarczej (np. BIG InfoMonitor).
Standardowy formularz o
przyznanie pożyczki
W sumie są jednak w stanie zgromadzić
jedynie od 20 do 30 informacji.
Naukowa analiza regresji jest wykorzystywana
bardzo rzadko. Zazwyczaj, są to proste
narzędzia w Excelu do badania korelacji lub
tworzenia drzewa decyzyjnego.
Chociaż każde istotne badanie dowodzi, iż
metody oparte na analizie regresji są zawsze
nadrzędne
w
stosunku
do
bardziej
uproszczonych narzędzi, firmom nadal brakuje
wykwalifikowanych kadr w tym obszarze.
6
Wartość dodana scoringu wykorzystującego
BIG Data (Big Data Scoring - BDS)
Scoring wykorzystujący BIG Data sprawił, że media
społecznościowe oraz inne dane pozyskiwane
drogą online są dzisiaj ważnym elementem przy
podejmowaniu decyzji kredytowych zwiększając
tym samym jakość kredytów oraz podnosząc
wskaźnik udzielonych pożyczek (wskaźnik
akceptacji).
Nasze algorytmy opierają się na wieloletnim
doświadczeniu w gromadzeniu danych oraz ich
modelowaniu. Aktualne informacje o płatnościach
otrzymywane z banków umożliwiają nam
wykrywanie korelacji oraz wzorów zachowań w
mediach społecznościowych, które prowadzą do
złych decyzji kredytowych.
W rezultacie możemy dokładnie przewidzieć jaki
będzie wskaźnik niewywiązywania się ze
zobowiązań każdego kto korzysta z Facebooka.
Nasze modele pomagają
pożyczkodawcą
oszczędzać pieniądze przy
stratach kredytowych oraz
zarabiać jednocześnie przy
zwiększonym wskaźniku
udzielonych pożyczek
(wskaźnik akceptacji).
7
Tablica grup jakości kredytowej na
podstawie Facebooka
W przypadku „10” istnieje 4%
prawdopodobieństwo że osoba z
taką punktacją opóźnieni się ze
spłatą kredytu więcej niż 90 dni.
Jednocześnie jeśli ktoś
otrzymał “1” istnieje 80%
prawdopodobieństwo nie
spłacenia zobowiązania na
czas (lub nie spłacenia
zobowiązania w ogóle).
8
Przykłady
Pewien paneuropejski specjalista ds.
pożyczek konsumenckich osiągnął
wskaźnik strat kredytowych na poziomie
3,3% oraz współczynnik akceptacji który
wyniósł 40% korzystając z tradycyjnych
metod scoringowych (dane z biura
informacji kredytowej oraz formularza o
przyznanie pożyczki).
Pożyczkodawca wykorzystywał
wyrafinowaną metodę regresji opartą na
scoringu odnotowując jednocześnie lepsze
wyniki we wszystkich grupach jakości
kredytowej – wszystko dzięki
Facebookowi oraz innym danym
pochodzącym z Internetu.
Za sprawą połączenia mediów
społecznościowych z Big Data Score,
straty kredytowe spadły do 2.9% and
wskaźnik udzielonych pożyczek
(akceptacji) pożyczek wzrósł do 53%.
9
Dziękuję za uwagę!
Erki Kert
+372 5680 0458
[email protected]
Skype: erki_kert
10

Podobne dokumenty