1 Hurtownie danych i business intelligence Plan na „dziś

Transkrypt

1 Hurtownie danych i business intelligence Plan na „dziś
Hurtownie danych
i business intelligence
Paweł Skrobanek, C-3 pok. 321
[email protected]
Wrocław 2005-2007
Plan na „dziś” ☺:
1. Wprowadzenie do przedmiotu
(co będzie omawiane oraz jak będę
weryfikował zdobytą wiedzę i
umiejętności)
2. Hurtownie danych
3. Przykłady systemów
Wprowadzenie do przedmiotu
• Strona WWW z informacjami:
http://pawel.skrobanek.staff.ict.pwr.wroc.pl
(kopia: http://www.equus.wroc.pl/studia.html)
• Zaliczenie:
– kolokwium/egzamin – zestaw pytań do opracowania
(będzie zmodyfikowany do końca października)
– (oprócz terminu podstawowego będzie dodatkowy)
– ocena z laboratorium moŜe podnieść o jeden stopień
ocenę końcową (jeśli jest wyŜsza od otrzymanej z
egzaminu)
UWAGA: z egzaminu moŜna otrzymać umowne „0”.
1
Wprowadzenie do przedmiotu
Bibliografia:
• R. Kimball, The Data Warehouse Toolkit, John Wiley & Sons, 1996
• M.Jarke, M.Lenzerini, Y.Vassiliou, P.Vassiliadid HURTOWNIE
DANYCH. Podstawy organizacji i funkcjonowania, WSiP,
Warszawa2003
• S.Kozielski, B.Małysiak, P.Kasprowski, D.Mrozka, BAZY DANYCH.
Modele, technologie, narzędzia, WKŁ 2005
• Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT,
Warszawa 2000.
• http://www.dwinfocenter.org/
Źródła Internetowe oraz uzupełnienie – będą podawane.
Hurtownie danych
Hurtownia danych (ang. data warehouse)
warehouse)
1) jako wyŜszy stopień abstrakcji niŜ relacyjna baza
danych,
2) jako platforma integrująca dane pochodzące
z róŜnych źródeł, przy czym:
- dane mogą być w postaci zagregowanej lub
wybiórcze,
- architektura optymalizowana pod kątem
określonych kryteriów, np. szybkości dostępu do
informacji (przetwarzania), analizy zawartości
3) zestaw danych i narzędzi do wspomagania decyzji
biznesowych
Hurtownie danych
PRZETWARZANIE
OLTP
(Online Transaction Processing)
- przetwarzanie transakcyjne
OLAP
(Online Analytical Processing)
- przetwarzanie analityczne
2
Hurtownie danych
Eksploracja danych (ang. data mining)
mining)
• zautomatyzowany proces odkrywania wiedzy oraz
zaleŜności występujących w danych,
• konstrukcja tego procesu z wykorzystaniem:
–
–
–
–
–
metod statystycznych,
sieci neuronowych,
sztucznej inteligencji,
algorytmów ewolucyjnych,
logiki rozmytej, itd.
• problem: właściwe zaplanowanie oraz ocena jakości
Hurtownie danych
Eksploracja danych (ang. data mining)
mining)
• Zastosowania:
– wspomaganie diagnostyki medycznej,
– wspomaganie sprzedaŜy (np. odkrywanie zaleŜności typu:
jeśli klient kupuje szampana, to często takŜe bombonierkę
lub jeśli kupi pampersy i jest męŜczyzną, to kupi piwo),
– analiza operacji bankowych – dostosowanie oferty do
określonych grup klientów,
– ustalanie profilu np. nieuczciwego klienta
(np. energetyka),
Hurtownie danych
Bussines intelligence
„Oprogramowanie wspomagające procesy
podejmowania decyzji poprzez analizę danych
zgromadzonych w systemach informatycznych.
informatycznych.
SłuŜy do ekstrapolacji przyszłości i estymacji stanu
obecnego.”
obecnego.”
[źródło: http://pl.wikipedia.org
http://pl.wikipedia.org//wiki/
wiki/Business_intelligence]
Business_intelligence]
3
Hurtownie danych
Typowe problemy podczas tworzenia HD:
• właściwe i dogłębne zrozumienie problemu
i celu analizy (analiz)
• zrozumienie modelowanej rzeczywistości
(m.in. zrozumienie dostępnych danych,
właściwa identyfikacja potrzeb, budowa
modelu),
• dobór narzędzi,
Hurtownie danych
Typowe problemy podczas tworzenia HD:
• róŜnorodność źródeł informacji (zarówno
baz danych, jak i sprzętu, parametrów
transmisji itp.),
• opracowanie właściwej architektury
(np. opracowanie wielopoziomowych
agregacji, właściwe zasilanie HD, kontrola
nadmiarowości i/lub brakujących danych,
problemy z ograniczeniami czasowymi)
Hurtownie danych
Typowe problemy podczas tworzenia HD:
• opracowanie mechanizmów oraz formy
prezentacji wyników – często dla osób nie
będących informatykami
4
Hurtownie danych
Wybrane zastosowania:
• prezentacja bieŜącego stanu firmy,
• wspomaganie decyzji biznesowych – dostarczanie
danych oraz mechanizmów do szybkiego
pozyskiwania informacji oraz podejmowania
działań,
• wykrywanie oszustw,
• przewidywanie zachowań rynku (np. zarządzanie
zapasami),
• Lepsze dostosowanie oferty do klienta,
• Analiza ryzyka, np. kredytowego.
Przykłady systemów
MTERIAŁY na CD.
5