Hurtownie danych i business inteligence

Transkrypt

Hurtownie danych i business inteligence
Hurtownie danych
i business intelligence
Paweł Skrobanek, C-3 pok. 321
[email protected]
Wrocław 2005-2012
Plan na „dziś” :
1. Wprowadzenie do przedmiotu
(co będzie omawiane oraz jak będę
weryfikował zdobytą wiedzę
i umiejętności)
2. Hurtownie danych
3. Przykłady systemów
2/14
Wprowadzenie do przedmiotu
• strona WWW z informacjami:
http://pawel.skrobanek.staff.ict.pwr.wroc.pl
• ocena końcowa:
– kolokwium/egzamin – zestaw pytań do opracowania
(będzie dostępny w Internecie)
– przewiduję dwa terminy zaliczenia,
– ocena końcowa (na podstawie wyniku egzaminu, przy
czym wynik może wynosić 0, 0.5, 1, …, 5.5)
– ocena końcowa na podstawie wyniku egzaminu (jeśli
wynik poniżej 3.0, ocena ndst, potem zgodnie
z wynikiem); ocena z laboratorium będzie uwzględniana
3/14
na zasadzie podniesienia wyniku max o 1.
1
Wprowadzenie do przedmiotu
Bibliografia:
• R. Kimball, The Data Warehouse Toolkit, John Wiley & Sons, 1996
• M.Jarke, M.Lenzerini, Y.Vassiliou, P.Vassiliadid HURTOWNIE
DANYCH. Podstawy organizac ji i funkcjonowania, WSiP,
Warszawa2003
• S.Kozielski, B.Małysiak, P.Kasprowski, D.Mrozka, BAZY DANYCH.
Modele, technologie, narzędzia , WKŁ 2005
• Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT,
Warszawa 2000.
• http://www. dw inf oc ent er. org /
Źródła Internet ow e oraz uzupełnienie – będą podawane.
4/14
Hurtownie danych
5/14
Hurtownia danych (ang. data warehouse)
1) jako wyższy stopień abstrakcji niż relacyjna baza
danych,
2) jako platforma integrująca dane pochodzące
z różnych źródeł, przy czym:
- dane mogą być w postaci zagregowanej lub
wybiórcze,
- architektura optymalizowana pod kątem
określonych kryteriów, np. szybkości dostępu do
informacji (przetwarzania), analizy zawartości
3) zestaw danych i narzędzi do wspomagania decyzji
biznesowych
Hurtownie danych
PRZETWARZANIE
OLTP
(Online Transaction Processing)
- przetwarzanie transakcyjne
OLAP
(Online Analytical Processing)
- przetwarzanie analityczne
6/14
2
Hurtownie danych
Eksploracja danych (ang. data mining)
• zautomatyzowany proces odkrywania wiedzy oraz
zależności występujących w danych,
• konstrukcja tego procesu z wykorzystaniem:
– metod statystycznych,
– sieci neuronowych,
– sztucznej inteligencji,
– algorytmów ewolucyjnych,
– logiki rozmytej, itd.
• problem: właściwe zaplanowanie oraz ocena jakości
7/14
Hurtownie danych
Eksploracja danych (ang. data mining)
• Zastosowania:
– wspomaganie diagnostyki medycznej,
– wspomaganie sprzedaży (np. odkrywanie zależności typu:
jeśli klient kupuje szampana, to często także bombonierkę
lub jeśli kupi pampersy i jest mężczyzną, to kupi piwo),
– analiza operacji bankowych – dostosowanie oferty do
określonych grup klientów,
– ustalanie profilu np. nieuczciwego klienta
(np. energetyka),
8/14
Hurtownie danych
Bussines intelligence
„Oprogramowanie wspomagające procesy
podejmowania decyzji poprzez analizę danych
zgromadzonych w systemach informatycznych .
Służy do ekstrapolacji przyszłości i estymacji stanu
obecnego.”
[źródło: http://pl.wikipedia.org/wiki/Business_intelligence]
9/14
3
Hurtownie danych
Typowe problemy podczas tworzenia HD:
• właściwe i dogłębne zrozumienie problemu
i celu analizy (analiz)
• zrozumienie modelowanej rzeczywistości
(m.in. zrozumienie dostępnych danych,
właściwa identyfikacja potrzeb, budowa
modelu),
• dobór narzędzi,
10
/14
Hurtownie danych
11
/14
Typowe problemy podczas tworzenia HD:
• różnorodność źródeł informacji (zarówno
baz danych, jak i sprzętu, parametrów
transmisji itp.),
• opracowanie właściwej architektury
(np. opracowanie wielopoziomowych
agregacji, właściwe zasilanie HD, kontrola
nadmiarowości i/lub brakujących danych,
problemy z ograniczeniami czasowymi)
Hurtownie danych
Typowe problemy podczas tworzenia HD:
• opracowanie mechanizmów oraz formy
prezentacji wyników – często dla osób nie
będących informatykami
12
/14
4
Hurtownie danych
13
/14
Wybrane zastosowania:
• prezentacja bieżącego stanu firmy,
• wspomaganie decyzji biznesowych – dostarczanie
danych oraz mechanizmów do szybkiego
pozyskiwania informacji oraz podejmowania
działań,
• wykrywanie oszustw,
• przewidywanie zachowań rynku (np. zarządzanie
zapasami),
• Lepsze dostosowanie oferty do klienta,
• Analiza ryzyka, np. kredytowego.
Przykłady systemów
1) MTERIAŁY na CD.
2) Strony do przejrzenia
http://www.comarch.pl/files_pl/file_1867/2pgs_Efektywny_system_wspomagania
_decyzji_oparty_o_controllingowa_hurtownie_danych_2008_06_2065.pdf
http://intelligententerprise.informationweek.com/info_centers/data_warehousing/showArticle.jhtm
l?articleID=171000647
http://etl-tools.info/pl/
http://docs.oracle.com/cd/B10501_01/server.920/a96520/c oncept.htm
14
/14
PRZYKŁADY ZASTOSOWAŃ
Inne
ZAGADNIENIE
Piwo najlepiej umieszczać obok pampersów
(supermarkety), szczególnie w weekend.
Dlaczego?
PRZYKŁAD
Ponieważ mężczyźni kupujący pampersy są
skłonni zakupić również piwo (zwiększenie
sprzedaży piwa).
d1/3
5
PRZYKŁADY ZASTOSOWAŃ
Inne
ZAGADNIENIE
Do czego może przydać się wiedza o tym, że 5%
segment klientów dostarcza 60% odpowiedzi na
zapytania firmy?
PRZYKŁAD
Do tego, żeby tylko do tej grupy kierować
w przyszłości pytania (redukcja kosztów).
d2/3
PRZYKŁADY ZASTOSOWAŃ
Inne
ZAGADNIENIE
Do czego może przydać się analizowanie danych
z portali społecznościowych?
PRZYKŁAD
Do szybkich reakcji oddelegowanych pracowników
na „złe opinie o produktach lub firmie”.
d3/3
6