Pobierz program

Transkrypt

Pobierz program
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
Strona 1
DATA+ Big Data & Business Analytics program
1. dzień konferencji - czwartek, 26 listopada 2015
08.30–09.00
Rejestracja Uczestników. Poranny poczęstunek.
Plenarna sesja poranna.
09.00–09.40
Data-Driven Storytelling.
Analysts can use data visualization in the form of maps, charts, and other
visual displays to discover important patterns in their data. These patterns can
then be used to optimize business practices in areas such as staffing levels,
customer service, and marketing engagement. We will examine time and
geography based data that will illustrate how to build visualizations that are
rich with information while also being highly flexible and responsive.
Ken Cherven, Senior Analyst and Data Visualization Specialist,
General Motors
09.40–10.20
Next Step in Big Data: State-of-the-art Open
Source Data Science Platform.
●
Enterprise Big Data / Data Science Maturity Model – a multi-dimential DataInformation-Knowledge-Intelligence matrix
●
Successful Big Data / Data Science Use Cases (mapped to the maturity
model)
●
Big Data / Machine Learning Operational Consideration
●
Big Data Security / Guaranteed Privacy with IoT, BlockChain
CASE STUDY: PETROL SECTOR
Charles Cai, Head of Data Science Technology, BP (Trading Division)
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
10.20–10.40
Przerwa na kawę. Networking.
10.40–11.10
Why Data Modeling is essential in a Big Data
environment.
Strona 2
Learn the tips and tricks how to handle Data Modeling in your Big Data
environment. Mark will show how modeling will add value to the business and
how to make your Big Data landscape transparent across the organization. You
will see the latest modeling techniques for Big Data and different types of
modeling notations. Also you will learn how to integrate Data Modeling into
your BI environment.
Mark Barringer, Product Line Manager, Enterprise Data Management,
Tools, EMEA & LATAM Embarcadero
11.10–11.25
Big Data w Polsce i za granicą.
W trakcie prezentacji pokazane zostaną wyniki badania ankietowego,
przeprowadzonego w polskich i zagranicznych przedsiębiorstwach w okresie
kwiecień-maj 2015. Miało ono miało na celu zgromadzenie informacji na temat
używanych obecnie narzędzi Big Data do analizy danych rozproszonych o
konsumencie, sprawdzeniu, jakie dane są obecnie poddawane analizie oraz
jakie analizy firmy zamierzają przeprowadzić w tym obszarze w najbliższym
czasie.
Aleksandra Woźniak, Research Analyst w funduszu private equity
11.25–12.00
Współpraca europejskich badawczych centrów
danych z biznesem.
Maciej Remiszewski, Zastępca Dyrektora ICM ds. Rozwoju i
Współpracy, ICM UW
12.00–13.00
Lunch
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
DATA+ Biznes
13.00–13.40
Strona 3
DATA+ Technologie
13.00–13.40
Data Scientist - wyzwania i rola
w organizacji.
Data Science w środowisku
korporacyjnym.
Jaka powinna być rola analityka – Data Scientist w
Klastry obliczeniowe wykorzystujące technologię
organizacji i jakie zadnia oraz problemy wiążą się z
Apache Hadoop na dobre zadomowiły się w
jego pracą? Czy posiadanie zespołu BIG DATA
ostatnim czasie w zestawie narzędzi analityków
stanowi wartość dodaną dla organizacji? Podczas
danych. Ze względu na niewielkie doświadczenia
prezentacji rozważymy kompetencje członków
w stosowaniu narzędzi takich jak Spark i Impala w
zespołu analitycznego oraz jego położenie w
naturalnym środowisku (nie eksperymentalnym)
strukturze firmy, a także korzyści płynące z pracy
należy je traktować z ostrożnością. Wdrożenie ich
zespołu dedykowanego pracy nad big data. Dzięki
w środowisku korporacyjnym może wiązać się z
prelekcji znajdą Państwo odpowiedź na pytania:
pewnymi trudnościami. Bezpieczeństwo i
integralność danych, integracja z istniejącymi
●
Jak budować i jak zarządzać takimi zespołami?
systemami hurtowni danych czy narzędziami BI -
●
Kto w organizacji może zajmować się
nietrywialna w środowiskach korporacyjnych,
przetwarzaniem dużych wolumenów danych ?
wreszcie szczególnie istotna w przypadku
Jakich efektów działania zespołu BIG DATA
instytucji finansowych ochrona danych osobowych
możemy się spodziewać?
i wymogi narzucane przez KNF, to kwestie które
●
mogą istotnie utrudnić wdrożenie inicjatyw „big
data” i prowadzenie analiz danych. Nie bez
Michał Janusz, Data Scientist, Grupa
Wirtualna Polska
znaczenia jest tu także kultura organizacyjna,
zwykle zorientowana na „wsadowe” przetwarzanie
informacji i sztywne procesy biznesowe. Dlatego
tak ważne jest stworzenie odpowiednich
mechanizmów pozwalających na bezpieczne
13.40–14.20
Zasady wizualizacji danych,
które powinieneś znać Ty i Twój
dostawca BI.
Na rynku Business Intelligence trwa wyścig
wykorzystywanie tego typu narzędzi. Nie może
być tu mowy o pośpiechu czy bezkrytycznej
implementacji gotowych rozwiązań.
Piotr Gawrysiak, Chief Data Scientist,
mBank
technologiczny. Choć większa część jego
uczestników skupia się na przetwarzaniu danych,
warto zwrócić uwagę na ostatni element służący
do podejmowania decyzji - ich wizualizację. Choć
zasady rządzące wizualizacją danych są stałe,
niewielu analityków jest ich świadoma. Podobnie
jest zresztą u dostawców oprogramowania. Na
jakie 3 elementy warto zwrócić uwagę, projektując
13.40–14.20
Przetwarzanie danych – nowe
metody i procesy
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
Strona 4
dashboard i co odróżnia dobry software od
Mnogość źródeł informacji jakie posiadamy dzięki
wybitnego w aspekcie prezentacji danych?
rozwojowi Internetu, technologii mobilnych,
urządzeń typu wearables etc. otwiera przed nami
ogromne możliwości. Jednocześnie stanowi jednak
wyzwanie, w jaki sposób mamy przetworzyć i
Bartosz Czapiewski, Trener i konsultant,
założyciel, SkuteczneRaporty.pl
wykorzystać te dane aby miały realny wpływ na
nasz biznes. W dzisiejszym świecie e-commerce,
gdzie konieczna jest reakcja w czasie
rzeczywistym na zachowania użytkowników i
pojawiające się na rynku trendy, jest to wyraźnie
widoczne. W trakcie prezentacji pokazane zostaną
doświadczenia z nowoczesnymi metodami
przetwarzania wielkich zbiorów danych
pochodzących z różnorodnych źródeł.
Dominik Ryżko, Chief Data Scientist, Grupa
Allegro
14.20–14.40
Przerwa na kawę. Networking.
14.40–15.20
14.40–15.20
CX w służbie poprawy
konwersji, retencji
użytkowników i budowaniu
spójnego doświadczenia.
Dlaczego Spark? Co wnosi nowy
silnik przetwarzania danych w
Hadoop?
Podczas prelekcji poruszone zostaną zagadnienia:
Na przykładzie działań marketingowych w
Audiotece oraz nowej odsłony strony internetowej
●
Audioteka 2.0 pokażę jak CX wpływa na sprzedaż i
konwersję. Następnie zastanowimy się czy i jak
streaming z zastosowaniem Spark.
●
budować spójne CX w środowisku
wielokanałowym/wieloplatformowym.
Architektura Lambda. Analiza batch oraz
Hive, Hive on Spark, SparkSQL czy HiveContext
w Spark - jak się w tym wszystkim odnaleźć?
●
Hadoop i dalej. Co mogą zaoferować nam inne
rozwiązania - Elasticsearch, Cassandra
Jarosław Trybuchowicz, Business
Intelligence Analyst, Audioteka
15.20–16.00
Krzysztof Adamski, Team lead w zespole
Hadoop, ING Services Polska
15.20–16.00
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
Nowa era Social Business
Intelligence - jakie tajemnice
pozwoli Ci odkryć analiza
społecznościowa.
Strona 5
Analityka predykcyjna skuteczne narzędzie, czy
wróżenie z fusów?
Narzędzia predykcyjne obiecują możliwość
Podczas prelekcji poruszone zostaną zagadnienia:
przewidzenia przyszłych zachowań klienta na
podstawie historycznych danych. Kto nie chciałby
●
●
●
●
●
●
Jaka może być wartość informacji i kontaktów
wiedzieć z wyprzedzeniem jaki produkt najlepiej
społecznościowych dla firmy.
spełni oczekiwania odbiorcy, a może jaka jest
Co mógłbyś wiedzieć i zbierać o swoim kliencie -
maksymalna cena jaką będzie skłonny za niego
Analiza Focus on Social Customer
zapłacić. Z roku na rok rośnie zainteresowanie
Wykorzystaj Social Contact Center, aby uzyskać
tego typu narzędziami, jednak metody te mają
zaangażowanie klienta i polepszyć z nim
również gorących przeciwników, którzy uważają,
kontakt.
że pokładane w nich nadzieje nie mogą być
Monitorowanie konkurencji, aktywności,
spełnione. Przedstawimy próbę i efekty
profilowanie, targetowanie, analizy sentymentu.
zastosowania analityki predykcyjnej do
Analiza zachowań - Konwersja z fanów / followers
automatyzacji procesów marketingu i sprzedaży w
na kupujących.
kanale online największego biura podróży w
Czy docierasz do swoich klientów w miejsca
Polsce.
gdzie oni przebywają i socjalizują się?
Dawid Pawłowski, Chief Digital Officer,
Aforti Holding S.A.
16.00–16.20
Arkadiusz Olchawa, IT Director, ITAKA
Zakończenie 1. dnia konferencji. Zebranie ankiet
od Uczestników i losowanie upominków.
2. dzień konferencji - INTERAKTYWNE SESJE WARSZTATOWE
08.30–09.00
Rejestracja Uczestników. Poranny poczęstunek i
networking.
09.00–12.30
09.00–12.30
Warsztat I - Failing >> fast
forward. How data drives lean
innovation (UX, Agile, Tools)
Warsztat III - Data Science praktyczne warsztaty z analizy
danych.
Profil: business
UWAGA: Brak wolnych miejsc.
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
Abstract:
Strona 6
Profil warsztatów: biznesowy
“If we have data, let’s look at data. If all we have
are opinions, let’s go with mine.”
Każdego dnia w firmie gromadzone są terabajty
Jim Barksdale, former CEO of Netscape
danych. Jak wyciągnąć z nich wiedzę i wykorzystać
ją do podejmowania decyzji biznesowych?
As a manager or executive you are most probably
aware of this imperative of change, many of the
Na warsztatach:
attempts to start new digital products or improve
existing ones fail. In most cases because
●
Będziesz pracować na praktycznym przykładzie
companies try to tackle new problems with the
●
Poznasz warsztat pracy Data Scientist
same old tools (organizational structures,
●
Dowiesz się jakich narzędzi i technik możesz
methods, processes) that created the problems in
the first place. How to avoid such and other traps
użyć do analizy danych
●
and provide valuable experiences? In order to
Zobaczysz, jak odkrywać wiedzę ukrytą w
zbiorach danych
build a product that stands even a chance for
survival or even success, quick steps, permanent
analysis of relevant data and constant iterative
W programie warsztatów:
feedback loops are needed.
●
analizy danych
During our more than a decade-long experience
with digital projects in corporate and start-up
●
●
Zobaczysz, jak przeprowadzać analizy danych w
ogólnodostępnych narzędziach
based on the principles of Lean UX and Agile
methodologies, data-driven, pragmatic and
Dowiesz się, jak zebrać dobrej jakości dane do
analizy
contexts, we have identified a toolset that we
consider essential for product innovation. It is
Poznasz sposób na przejście od raportowania do
●
Nauczysz się przygotowywać dobre wizualizacje
danych
straight-forward. half-day-day workshop,
entertaining, playful, hands-on, tangible results,
learning by doing, less theory, more practice.
Mile widziane:
Programme:
●
Posiadanie komputera z zainstalowaną
przegladarką internetową
●
The importance of data in user experience
●
Essential tools and methods for lean innovation
●
Insights to how data drives the agile innovation
process
●
How to implement these in your work
environment
Wolfram Knelangen, Coach, Consultant
Agnieszka M. Walorska, Creative
Construction Heroes GmbH
12.30–13.30
Lunch
●
Podstawowa znajomość arkusza kalkulacyjnego
Michał Bryś, Data Scientist, Grupa Allegro
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
13.30–17.00
Warsztat II - Budowa modeli
predykcyjnych w praktyce.
Strona 7
13.30–17.00
Warsztat IV - Interaktywna
eksploracja i wizualizacja
danych przy użyciu Apache
Spark.
Profil warsztatów: technologiczny
Modele predykcyjne wykorzystuje się w
Profil warsztatów: technologiczny
optymalizacji działań firm od lat. Najbardziej
powszechne zastosowania to modele
Spotkanie dla osób, które chciałby zacząć
prognozujące zachowanie klientów (application
przetwarzać dane przechowywane na klastrze
scoring, behavioral scoring, churn). Jest wiele
Hadoop w interaktywny i produktywny sposób.
mniej standardowych zastosowań, choćby
przewidywanie na podstawie scenariusza, ile
Hadoop wciąż kojarzy się głównie z offline’owym
zarobi nakręcony na jego podstawie film.
przetwarzaniem olbrzymich zbiorów danych za
pomocą Map-Reduce. Implementujemy naszą
Niezależnie od przewidywanego zjawiska, sposób
aplikację, zgłaszamy ją do wykonania i… idziemy
budowy modeli jest podobny. Próbując
na kawę albo lunch, gdyż obliczenia trwają zbyt
prognozować zjawiska z wykorzystaniem modeli
długo. Na szczęście coraz większą popularność
predykcyjnych, spotykamy się jednak z wieloma
zdobywa narzędzie, które pozwala nam
trudnościami. Uczestnicy dowiedzą się, jakie to
efektywniej wykorzystać cenny czas! Spark
trudności, jak je pokonać oraz co jest ważne w
wprowadził istną rewolucję w modelu pracy z
modelowaniu predykcyjnym.
dużymi danymi. Odejście od sztywnego
paradygmatu Map-Reduce i wprowadzenie
Przynajmniej od dekady darmowe
interaktywnego shell’a otworzyło zupełnie nowe
oprogramowanie wykorzystywane jest coraz
możliwości przed każdym kto chce szybko i
chętniej w biznesie. Często wypiera też drogie
wydajnie pracować z danymi na klastrze.
rozwiązania komercyjne. Użyjemy właśnie
darmowego oprogramowania KNIME. Zdobyte
Na potrzeby warsztatu przygotowaliśmy starannie
wiedza i umiejętności będą wartościowe,
dobry miks teorii, ćwiczeń, demonstracji, Q&A oraz
niezależnie od wykorzystywanego w firmie
zabawy. Po szybkim omówieniu architektury
oprogramowania.
Sparka, przejdziemy do praktycznej części. Każdy
uczestnik wcieli się w rolę analityka, którego
Warsztaty będą przeprowadzone w sposób
zadaniem będzie eksploracja zbiorów danych
interaktywny, a uczestnicy dzięki pracy na
przechowywanych na HDFS przy użyciu Sparka i
własnych komputerach będą mogli wypróbować
wizualizacja wyników.
różne możliwości. Skorzystamy z ciekawych
rzeczywistych danych.
Uczestnicy
O ile szkolenie jest techniczne, wcześniejsze
Uczestnicy dowiedzą się:
doświadczenie z Hadoop-em czy Sparkiem nie jest
wymagane. Rekomendowana jest znajomość w
●
●
●
Co jest najważniejsze w modelowaniu
stopniu przynajmniej podstawowym jednego z
predykcyjnym.
języków programowania: Java, Scala, Python.
Jakie są typowe trudności w modelowaniu i
Każdy uczestnik powinien przyjść z własnym
sposoby ich omijania.
laptopem, z którego będzie używał podczas
Jakie są etapy procesu budowy modelu
wykonywania ćwiczeń. Będziemy korzystać z
26-27 listopada 2015 * DATA+ Big Data & Business Analytics
●
Strona 8
predykcyjnego: od zebrania danych, poprzez
wielowęzłowego klastra Hadoop zainstalowanego
wybór cech, ocenę jakości, aż do zastosowania
w publicznej chmurze. Laptop nie musi posiadać
modelu.
żadnego dedykowanego oprogramowania –
Jak przygotowywać dane do budowy modeli
wystarczy przeglądarka internetowa i terminal.
predykcyjnych.
●
Jak wybrać cechy, zbudować model i ocenić jego
jakość.
●
Poznają wybrane metody statystyczne.
●
Jak zrobić to wszystko z wykorzystaniem
Radosław Kita, Ekspert Data Scientist,
GetinData
darmowego oprogramowania KNIME.
W programie warsztatów
●
Cykl życia modelu
●
Proces budowy modelu predykcyjnego
●
Praca z KNIME
●
Przygotowanie danych
●
Określenie targetu dla modelowania
●
Metody wyboru cech
●
Sposób budowy wybranych modeli
klasyfikacyjnych
●
Ocena jakości modeli
Wymagania
Jakiekolwiek doświadczenie w pracy z danymi, w
dowolnym narzędziu. Warsztaty będą
interaktywne, dlatego zapraszamy do zabrania ze
sobą laptopa z zainstalowaną najnowszą wersją
KNIME (KNIME + all free extensions) https://www.knime.org/downloads/overview?quickt
abs_knimed=1#quicktabs-knimed (do ściągnięcia
bezpłatnie).
dr inż. Artur Suchwałko, data scientist,
założyciel i właściciel firmy QuantUp.pl
Organizatorzy dołożą wszelkich starań, aby konferencja odbyła się zgodnie z prezentowanym programem, jednak
zastrzega się możliwość częściowych zmian.
x

Podobne dokumenty