IBS Usługi

Transkrypt

IBS Usługi
O mnie




Cele sesji



Cele sesji






Dlaczego?





http://www.zdnet.com/article/microsofts-r-strategy/
Źródło: https://azure.microsoft.com/enus/blog/forrester-names-microsoft-azurea-leader-in-big-data-hadoop-cloudsolutions/
http://www.photos-public-domain.com/2011/09/11/simple/
Przypadek #1: big data… lub nie


Przypadek #1: Rezultaty





Przypadek #2: PaaS kontra IaaS



Przypadek #2: Rezultaty





Przypadek #3: Spróbuj zamiast narzekać









Dane
źródłowe
(xlsx)
Machine
Translation
API
Sentiment
Analysis
API
Key phrase
detection
API
Cortana Intelligence Suite
Data
Sources
Apps
Information
Management
Big Data Stores
Machine Learning
and Analytics
Intelligence
People
Data Factory
Data Lake Store
Machine
Learning
Cognitive
Services
Data Catalog
SQL Data
Warehouse
Data Lake
Analytics
Bot
Framework
Web
HDInsight
(Hadoop and
Spark)
Cortana
Mobile
Event Hubs
Apps
Bots
Stream Analytics
Dashboards &
Visualizations
Sensors
and
devices
Data
Power BI
Intelligence
Automated
Systems
Action
https://commons.wikimedia.org/wiki/File:Bedtime_story_-_Madeline.JPG
http://business901.com/blog1/the-misnomer-of-thinking-out-of-the-box/
Przypadek #4: Swoboda działań







Analiza ruchu godzinowego
Przypadek #4: Rezultaty



https://commons.wikimedia.org/wiki/File:A_screwdriver_tip.jpg
Przypadek #5: Think big



Architektura pilotażowa
HDInsight cluster
Custom UDFs (Streaming
and/or Java)
Azure VM
SQL DB
Revolution R VM
Hive
RStudio
JDBC/Sqoop
Log Ops
Table
HCatalog
rxODBC
MRS
HDFS
Scalable ETL
Large-scale data analysis
Wykrywanie anomalii za pomocą segmentacji
„Skrajni” użytkownicy
SYSTEM_IDENTITY1
SYSTEM_IDENTITY2
ANON1
ANON2
ANON3
Rozmiar klastra
Cluster #1
126 204
Cluster #2
15 040
Położenie klastra
Cluster #
avgopsperday
avgsessionperday
Acgopspersession
Ipcnt
1
7.97499
2.380711
3.560209
1.227963
2
36.81413
6.414342
7.823085
1.640691
3 segmenty użytkowników [po usunięciu anomalii, bez normalizacji]
3 segmenty użytkowników [po usunięciu anomalii, z normalizacją]
Rozmiar klastra
Cluster #1
72820
Cluster #2
19956
Cluster #3
33487
Położenie klastra
Avgopsperday
Avgsessionperday
Avgopspersession
Ipcnt
Segmenty
Cluster #1
0.1302338
0.01241954
0.1521433
0.04084386
Light users
Cluster #2
0.6132861
0.04294849
0.3558698
0.17688916
Active+mobile users
Cluster #3
0.3472406
0.01084593
0.5794566
0.02338967
Active+static users
Klasyfikacja użytkowników
Rezultaty (w oparciu o drzewa decyzyjne):
1
1
.52 .13 .35
100%
avgopsperday < 7.1
Confusion Matrix
no
Reference
2
3
1
.98 .00 .02
53%
3
.00 .28 .72
47%
avgopspersession < 6.9
avgopsperday >= 16
4
7
1
1.00 .00 .00
52%
3
.00 .01 .99
34%
avgopspersession < 4.6
Prediction
yes
14
1
.97 .00 .03
3%
3
.00 .30 .70
0%
ipcnt < 1.5
avgsessionperday >= 4.2
2
3
1
19 684
0
128
2
3
4 933
25
3
1
24
13 080
Accuracy: 0.9952
avgopsperday >= 15
9
1
8
18
19
5
6
28
29
15
1
1.00 .00 .00
49%
1
1.00 .00 .00
3%
3
.49 .00 .51
0%
3
.11 .00 .89
1%
2
.00 1.00 .00
13%
2
.00 .98 .02
0%
3
.00 .00 1.00
0%
3
.00 .00 1.00
33%
… z wykorzystaniem Azure ML
Przypadek #5: Rezultaty



http://www.freeimageslive.co.uk/files/images006/undo_key.jpg
Przypadek #6: Plaża
?
Najczęstsza przyczyna porażek
http://pauldunay.com/your-testing-program-smart-ways-to-get-your-team-on-board/
Przypadek #7: Arbuz
IBS
Użytkownik
Usługi
Customer
Support
Manager
Sprzedaż
CIO
Dbanie o satysfakcję klienta już wkrótce
Centralizacja
danych
Wspólny zbiór danych
pozwoli zunifikować
sposób patrzenia na
klientów
Modele
analityczne
Krótszy czas potrzebny na
zmianę
Synchronizacja
z biznesem
Nawiązanie dialogu
pomiędzy różnymi
interesariuszami
Satysfakcja klienta w przyszłości
Bogatszy arsenał
narzędzi do
zbierania danych
Opinie zbierane i
analizowane na
bieżąco
Jednolity
wizerunek firmy
Machine Learning University



Ciągłe doszkalanie




OneML
•
Cykliczne, praktyczne
wyzwania dla chętnych
•
Scenariusze mocno
osadzone w
rzeczywistości
•
Interdyscyplinarne
zespoły
7 zasad zwiększających prawdopodobieństwo
sukcesu







Co dalej?
 Advanced Analytics Labs (2 dni)

 R Labs (1-2 dni)

 (Bezpłatne) zaangażowanie w indywidualne projekty
Pytania?

Podobne dokumenty