Pobierz program
Transkrypt
Pobierz program
26-27 listopada 2015 * DATA+ Big Data & Business Analytics Strona 1 DATA+ Big Data & Business Analytics program 1. dzień konferencji - czwartek, 26 listopada 2015 08.30–09.00 Rejestracja Uczestników. Poranny poczęstunek. Plenarna sesja poranna. 09.00–09.40 Data-Driven Storytelling. Analysts can use data visualization in the form of maps, charts, and other visual displays to discover important patterns in their data. These patterns can then be used to optimize business practices in areas such as staffing levels, customer service, and marketing engagement. We will examine time and geography based data that will illustrate how to build visualizations that are rich with information while also being highly flexible and responsive. Ken Cherven, Senior Analyst and Data Visualization Specialist, General Motors 09.40–10.20 Next Step in Big Data: State-of-the-art Open Source Data Science Platform. ● Enterprise Big Data / Data Science Maturity Model – a multi-dimential DataInformation-Knowledge-Intelligence matrix ● Successful Big Data / Data Science Use Cases (mapped to the maturity model) ● Big Data / Machine Learning Operational Consideration ● Big Data Security / Guaranteed Privacy with IoT, BlockChain CASE STUDY: PETROL SECTOR Charles Cai, Head of Data Science Technology, BP (Trading Division) 26-27 listopada 2015 * DATA+ Big Data & Business Analytics 10.20–10.40 Przerwa na kawę. Networking. 10.40–11.10 Why Data Modeling is essential in a Big Data environment. Strona 2 Learn the tips and tricks how to handle Data Modeling in your Big Data environment. Mark will show how modeling will add value to the business and how to make your Big Data landscape transparent across the organization. You will see the latest modeling techniques for Big Data and different types of modeling notations. Also you will learn how to integrate Data Modeling into your BI environment. Mark Barringer, Product Line Manager, Enterprise Data Management, Tools, EMEA & LATAM Embarcadero 11.10–11.25 Big Data w Polsce i za granicą. W trakcie prezentacji pokazane zostaną wyniki badania ankietowego, przeprowadzonego w polskich i zagranicznych przedsiębiorstwach w okresie kwiecień-maj 2015. Miało ono miało na celu zgromadzenie informacji na temat używanych obecnie narzędzi Big Data do analizy danych rozproszonych o konsumencie, sprawdzeniu, jakie dane są obecnie poddawane analizie oraz jakie analizy firmy zamierzają przeprowadzić w tym obszarze w najbliższym czasie. Aleksandra Woźniak, Research Analyst w funduszu private equity 11.25–12.00 Współpraca europejskich badawczych centrów danych z biznesem. Maciej Remiszewski, Zastępca Dyrektora ICM ds. Rozwoju i Współpracy, ICM UW 12.00–13.00 Lunch 26-27 listopada 2015 * DATA+ Big Data & Business Analytics DATA+ Biznes 13.00–13.40 Strona 3 DATA+ Technologie 13.00–13.40 Data Scientist - wyzwania i rola w organizacji. Data Science w środowisku korporacyjnym. Jaka powinna być rola analityka – Data Scientist w Klastry obliczeniowe wykorzystujące technologię organizacji i jakie zadnia oraz problemy wiążą się z Apache Hadoop na dobre zadomowiły się w jego pracą? Czy posiadanie zespołu BIG DATA ostatnim czasie w zestawie narzędzi analityków stanowi wartość dodaną dla organizacji? Podczas danych. Ze względu na niewielkie doświadczenia prezentacji rozważymy kompetencje członków w stosowaniu narzędzi takich jak Spark i Impala w zespołu analitycznego oraz jego położenie w naturalnym środowisku (nie eksperymentalnym) strukturze firmy, a także korzyści płynące z pracy należy je traktować z ostrożnością. Wdrożenie ich zespołu dedykowanego pracy nad big data. Dzięki w środowisku korporacyjnym może wiązać się z prelekcji znajdą Państwo odpowiedź na pytania: pewnymi trudnościami. Bezpieczeństwo i integralność danych, integracja z istniejącymi ● Jak budować i jak zarządzać takimi zespołami? systemami hurtowni danych czy narzędziami BI - ● Kto w organizacji może zajmować się nietrywialna w środowiskach korporacyjnych, przetwarzaniem dużych wolumenów danych ? wreszcie szczególnie istotna w przypadku Jakich efektów działania zespołu BIG DATA instytucji finansowych ochrona danych osobowych możemy się spodziewać? i wymogi narzucane przez KNF, to kwestie które ● mogą istotnie utrudnić wdrożenie inicjatyw „big data” i prowadzenie analiz danych. Nie bez Michał Janusz, Data Scientist, Grupa Wirtualna Polska znaczenia jest tu także kultura organizacyjna, zwykle zorientowana na „wsadowe” przetwarzanie informacji i sztywne procesy biznesowe. Dlatego tak ważne jest stworzenie odpowiednich mechanizmów pozwalających na bezpieczne 13.40–14.20 Zasady wizualizacji danych, które powinieneś znać Ty i Twój dostawca BI. Na rynku Business Intelligence trwa wyścig wykorzystywanie tego typu narzędzi. Nie może być tu mowy o pośpiechu czy bezkrytycznej implementacji gotowych rozwiązań. Piotr Gawrysiak, Chief Data Scientist, mBank technologiczny. Choć większa część jego uczestników skupia się na przetwarzaniu danych, warto zwrócić uwagę na ostatni element służący do podejmowania decyzji - ich wizualizację. Choć zasady rządzące wizualizacją danych są stałe, niewielu analityków jest ich świadoma. Podobnie jest zresztą u dostawców oprogramowania. Na jakie 3 elementy warto zwrócić uwagę, projektując 13.40–14.20 Przetwarzanie danych – nowe metody i procesy 26-27 listopada 2015 * DATA+ Big Data & Business Analytics Strona 4 dashboard i co odróżnia dobry software od Mnogość źródeł informacji jakie posiadamy dzięki wybitnego w aspekcie prezentacji danych? rozwojowi Internetu, technologii mobilnych, urządzeń typu wearables etc. otwiera przed nami ogromne możliwości. Jednocześnie stanowi jednak wyzwanie, w jaki sposób mamy przetworzyć i Bartosz Czapiewski, Trener i konsultant, założyciel, SkuteczneRaporty.pl wykorzystać te dane aby miały realny wpływ na nasz biznes. W dzisiejszym świecie e-commerce, gdzie konieczna jest reakcja w czasie rzeczywistym na zachowania użytkowników i pojawiające się na rynku trendy, jest to wyraźnie widoczne. W trakcie prezentacji pokazane zostaną doświadczenia z nowoczesnymi metodami przetwarzania wielkich zbiorów danych pochodzących z różnorodnych źródeł. Dominik Ryżko, Chief Data Scientist, Grupa Allegro 14.20–14.40 Przerwa na kawę. Networking. 14.40–15.20 14.40–15.20 CX w służbie poprawy konwersji, retencji użytkowników i budowaniu spójnego doświadczenia. Dlaczego Spark? Co wnosi nowy silnik przetwarzania danych w Hadoop? Podczas prelekcji poruszone zostaną zagadnienia: Na przykładzie działań marketingowych w Audiotece oraz nowej odsłony strony internetowej ● Audioteka 2.0 pokażę jak CX wpływa na sprzedaż i konwersję. Następnie zastanowimy się czy i jak streaming z zastosowaniem Spark. ● budować spójne CX w środowisku wielokanałowym/wieloplatformowym. Architektura Lambda. Analiza batch oraz Hive, Hive on Spark, SparkSQL czy HiveContext w Spark - jak się w tym wszystkim odnaleźć? ● Hadoop i dalej. Co mogą zaoferować nam inne rozwiązania - Elasticsearch, Cassandra Jarosław Trybuchowicz, Business Intelligence Analyst, Audioteka 15.20–16.00 Krzysztof Adamski, Team lead w zespole Hadoop, ING Services Polska 15.20–16.00 26-27 listopada 2015 * DATA+ Big Data & Business Analytics Nowa era Social Business Intelligence - jakie tajemnice pozwoli Ci odkryć analiza społecznościowa. Strona 5 Analityka predykcyjna skuteczne narzędzie, czy wróżenie z fusów? Narzędzia predykcyjne obiecują możliwość Podczas prelekcji poruszone zostaną zagadnienia: przewidzenia przyszłych zachowań klienta na podstawie historycznych danych. Kto nie chciałby ● ● ● ● ● ● Jaka może być wartość informacji i kontaktów wiedzieć z wyprzedzeniem jaki produkt najlepiej społecznościowych dla firmy. spełni oczekiwania odbiorcy, a może jaka jest Co mógłbyś wiedzieć i zbierać o swoim kliencie - maksymalna cena jaką będzie skłonny za niego Analiza Focus on Social Customer zapłacić. Z roku na rok rośnie zainteresowanie Wykorzystaj Social Contact Center, aby uzyskać tego typu narzędziami, jednak metody te mają zaangażowanie klienta i polepszyć z nim również gorących przeciwników, którzy uważają, kontakt. że pokładane w nich nadzieje nie mogą być Monitorowanie konkurencji, aktywności, spełnione. Przedstawimy próbę i efekty profilowanie, targetowanie, analizy sentymentu. zastosowania analityki predykcyjnej do Analiza zachowań - Konwersja z fanów / followers automatyzacji procesów marketingu i sprzedaży w na kupujących. kanale online największego biura podróży w Czy docierasz do swoich klientów w miejsca Polsce. gdzie oni przebywają i socjalizują się? Dawid Pawłowski, Chief Digital Officer, Aforti Holding S.A. 16.00–16.20 Arkadiusz Olchawa, IT Director, ITAKA Zakończenie 1. dnia konferencji. Zebranie ankiet od Uczestników i losowanie upominków. 2. dzień konferencji - INTERAKTYWNE SESJE WARSZTATOWE 08.30–09.00 Rejestracja Uczestników. Poranny poczęstunek i networking. 09.00–12.30 09.00–12.30 Warsztat I - Failing >> fast forward. How data drives lean innovation (UX, Agile, Tools) Warsztat III - Data Science praktyczne warsztaty z analizy danych. Profil: business UWAGA: Brak wolnych miejsc. 26-27 listopada 2015 * DATA+ Big Data & Business Analytics Abstract: Strona 6 Profil warsztatów: biznesowy “If we have data, let’s look at data. If all we have are opinions, let’s go with mine.” Każdego dnia w firmie gromadzone są terabajty Jim Barksdale, former CEO of Netscape danych. Jak wyciągnąć z nich wiedzę i wykorzystać ją do podejmowania decyzji biznesowych? As a manager or executive you are most probably aware of this imperative of change, many of the Na warsztatach: attempts to start new digital products or improve existing ones fail. In most cases because ● Będziesz pracować na praktycznym przykładzie companies try to tackle new problems with the ● Poznasz warsztat pracy Data Scientist same old tools (organizational structures, ● Dowiesz się jakich narzędzi i technik możesz methods, processes) that created the problems in the first place. How to avoid such and other traps użyć do analizy danych ● and provide valuable experiences? In order to Zobaczysz, jak odkrywać wiedzę ukrytą w zbiorach danych build a product that stands even a chance for survival or even success, quick steps, permanent analysis of relevant data and constant iterative W programie warsztatów: feedback loops are needed. ● analizy danych During our more than a decade-long experience with digital projects in corporate and start-up ● ● Zobaczysz, jak przeprowadzać analizy danych w ogólnodostępnych narzędziach based on the principles of Lean UX and Agile methodologies, data-driven, pragmatic and Dowiesz się, jak zebrać dobrej jakości dane do analizy contexts, we have identified a toolset that we consider essential for product innovation. It is Poznasz sposób na przejście od raportowania do ● Nauczysz się przygotowywać dobre wizualizacje danych straight-forward. half-day-day workshop, entertaining, playful, hands-on, tangible results, learning by doing, less theory, more practice. Mile widziane: Programme: ● Posiadanie komputera z zainstalowaną przegladarką internetową ● The importance of data in user experience ● Essential tools and methods for lean innovation ● Insights to how data drives the agile innovation process ● How to implement these in your work environment Wolfram Knelangen, Coach, Consultant Agnieszka M. Walorska, Creative Construction Heroes GmbH 12.30–13.30 Lunch ● Podstawowa znajomość arkusza kalkulacyjnego Michał Bryś, Data Scientist, Grupa Allegro 26-27 listopada 2015 * DATA+ Big Data & Business Analytics 13.30–17.00 Warsztat II - Budowa modeli predykcyjnych w praktyce. Strona 7 13.30–17.00 Warsztat IV - Interaktywna eksploracja i wizualizacja danych przy użyciu Apache Spark. Profil warsztatów: technologiczny Modele predykcyjne wykorzystuje się w Profil warsztatów: technologiczny optymalizacji działań firm od lat. Najbardziej powszechne zastosowania to modele Spotkanie dla osób, które chciałby zacząć prognozujące zachowanie klientów (application przetwarzać dane przechowywane na klastrze scoring, behavioral scoring, churn). Jest wiele Hadoop w interaktywny i produktywny sposób. mniej standardowych zastosowań, choćby przewidywanie na podstawie scenariusza, ile Hadoop wciąż kojarzy się głównie z offline’owym zarobi nakręcony na jego podstawie film. przetwarzaniem olbrzymich zbiorów danych za pomocą Map-Reduce. Implementujemy naszą Niezależnie od przewidywanego zjawiska, sposób aplikację, zgłaszamy ją do wykonania i… idziemy budowy modeli jest podobny. Próbując na kawę albo lunch, gdyż obliczenia trwają zbyt prognozować zjawiska z wykorzystaniem modeli długo. Na szczęście coraz większą popularność predykcyjnych, spotykamy się jednak z wieloma zdobywa narzędzie, które pozwala nam trudnościami. Uczestnicy dowiedzą się, jakie to efektywniej wykorzystać cenny czas! Spark trudności, jak je pokonać oraz co jest ważne w wprowadził istną rewolucję w modelu pracy z modelowaniu predykcyjnym. dużymi danymi. Odejście od sztywnego paradygmatu Map-Reduce i wprowadzenie Przynajmniej od dekady darmowe interaktywnego shell’a otworzyło zupełnie nowe oprogramowanie wykorzystywane jest coraz możliwości przed każdym kto chce szybko i chętniej w biznesie. Często wypiera też drogie wydajnie pracować z danymi na klastrze. rozwiązania komercyjne. Użyjemy właśnie darmowego oprogramowania KNIME. Zdobyte Na potrzeby warsztatu przygotowaliśmy starannie wiedza i umiejętności będą wartościowe, dobry miks teorii, ćwiczeń, demonstracji, Q&A oraz niezależnie od wykorzystywanego w firmie zabawy. Po szybkim omówieniu architektury oprogramowania. Sparka, przejdziemy do praktycznej części. Każdy uczestnik wcieli się w rolę analityka, którego Warsztaty będą przeprowadzone w sposób zadaniem będzie eksploracja zbiorów danych interaktywny, a uczestnicy dzięki pracy na przechowywanych na HDFS przy użyciu Sparka i własnych komputerach będą mogli wypróbować wizualizacja wyników. różne możliwości. Skorzystamy z ciekawych rzeczywistych danych. Uczestnicy O ile szkolenie jest techniczne, wcześniejsze Uczestnicy dowiedzą się: doświadczenie z Hadoop-em czy Sparkiem nie jest wymagane. Rekomendowana jest znajomość w ● ● ● Co jest najważniejsze w modelowaniu stopniu przynajmniej podstawowym jednego z predykcyjnym. języków programowania: Java, Scala, Python. Jakie są typowe trudności w modelowaniu i Każdy uczestnik powinien przyjść z własnym sposoby ich omijania. laptopem, z którego będzie używał podczas Jakie są etapy procesu budowy modelu wykonywania ćwiczeń. Będziemy korzystać z 26-27 listopada 2015 * DATA+ Big Data & Business Analytics ● Strona 8 predykcyjnego: od zebrania danych, poprzez wielowęzłowego klastra Hadoop zainstalowanego wybór cech, ocenę jakości, aż do zastosowania w publicznej chmurze. Laptop nie musi posiadać modelu. żadnego dedykowanego oprogramowania – Jak przygotowywać dane do budowy modeli wystarczy przeglądarka internetowa i terminal. predykcyjnych. ● Jak wybrać cechy, zbudować model i ocenić jego jakość. ● Poznają wybrane metody statystyczne. ● Jak zrobić to wszystko z wykorzystaniem Radosław Kita, Ekspert Data Scientist, GetinData darmowego oprogramowania KNIME. W programie warsztatów ● Cykl życia modelu ● Proces budowy modelu predykcyjnego ● Praca z KNIME ● Przygotowanie danych ● Określenie targetu dla modelowania ● Metody wyboru cech ● Sposób budowy wybranych modeli klasyfikacyjnych ● Ocena jakości modeli Wymagania Jakiekolwiek doświadczenie w pracy z danymi, w dowolnym narzędziu. Warsztaty będą interaktywne, dlatego zapraszamy do zabrania ze sobą laptopa z zainstalowaną najnowszą wersją KNIME (KNIME + all free extensions) https://www.knime.org/downloads/overview?quickt abs_knimed=1#quicktabs-knimed (do ściągnięcia bezpłatnie). dr inż. Artur Suchwałko, data scientist, założyciel i właściciel firmy QuantUp.pl Organizatorzy dołożą wszelkich starań, aby konferencja odbyła się zgodnie z prezentowanym programem, jednak zastrzega się możliwość częściowych zmian. x