1 Hurtownie danych i business intelligence Plan na „dziś
Transkrypt
1 Hurtownie danych i business intelligence Plan na „dziś
Hurtownie danych i business intelligence Paweł Skrobanek, C-3 pok. 321 [email protected] Wrocław 2005-2007 Plan na „dziś” ☺: 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę i umiejętności) 2. Hurtownie danych 3. Przykłady systemów Wprowadzenie do przedmiotu • Strona WWW z informacjami: http://pawel.skrobanek.staff.ict.pwr.wroc.pl (kopia: http://www.equus.wroc.pl/studia.html) • Zaliczenie: – kolokwium/egzamin – zestaw pytań do opracowania (będzie zmodyfikowany do końca października) – (oprócz terminu podstawowego będzie dodatkowy) – ocena z laboratorium moŜe podnieść o jeden stopień ocenę końcową (jeśli jest wyŜsza od otrzymanej z egzaminu) UWAGA: z egzaminu moŜna otrzymać umowne „0”. 1 Wprowadzenie do przedmiotu Bibliografia: • R. Kimball, The Data Warehouse Toolkit, John Wiley & Sons, 1996 • M.Jarke, M.Lenzerini, Y.Vassiliou, P.Vassiliadid HURTOWNIE DANYCH. Podstawy organizacji i funkcjonowania, WSiP, Warszawa2003 • S.Kozielski, B.Małysiak, P.Kasprowski, D.Mrozka, BAZY DANYCH. Modele, technologie, narzędzia, WKŁ 2005 • Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000. • http://www.dwinfocenter.org/ Źródła Internetowe oraz uzupełnienie – będą podawane. Hurtownie danych Hurtownia danych (ang. data warehouse) warehouse) 1) jako wyŜszy stopień abstrakcji niŜ relacyjna baza danych, 2) jako platforma integrująca dane pochodzące z róŜnych źródeł, przy czym: - dane mogą być w postaci zagregowanej lub wybiórcze, - architektura optymalizowana pod kątem określonych kryteriów, np. szybkości dostępu do informacji (przetwarzania), analizy zawartości 3) zestaw danych i narzędzi do wspomagania decyzji biznesowych Hurtownie danych PRZETWARZANIE OLTP (Online Transaction Processing) - przetwarzanie transakcyjne OLAP (Online Analytical Processing) - przetwarzanie analityczne 2 Hurtownie danych Eksploracja danych (ang. data mining) mining) • zautomatyzowany proces odkrywania wiedzy oraz zaleŜności występujących w danych, • konstrukcja tego procesu z wykorzystaniem: – – – – – metod statystycznych, sieci neuronowych, sztucznej inteligencji, algorytmów ewolucyjnych, logiki rozmytej, itd. • problem: właściwe zaplanowanie oraz ocena jakości Hurtownie danych Eksploracja danych (ang. data mining) mining) • Zastosowania: – wspomaganie diagnostyki medycznej, – wspomaganie sprzedaŜy (np. odkrywanie zaleŜności typu: jeśli klient kupuje szampana, to często takŜe bombonierkę lub jeśli kupi pampersy i jest męŜczyzną, to kupi piwo), – analiza operacji bankowych – dostosowanie oferty do określonych grup klientów, – ustalanie profilu np. nieuczciwego klienta (np. energetyka), Hurtownie danych Bussines intelligence „Oprogramowanie wspomagające procesy podejmowania decyzji poprzez analizę danych zgromadzonych w systemach informatycznych. informatycznych. SłuŜy do ekstrapolacji przyszłości i estymacji stanu obecnego.” obecnego.” [źródło: http://pl.wikipedia.org http://pl.wikipedia.org//wiki/ wiki/Business_intelligence] Business_intelligence] 3 Hurtownie danych Typowe problemy podczas tworzenia HD: • właściwe i dogłębne zrozumienie problemu i celu analizy (analiz) • zrozumienie modelowanej rzeczywistości (m.in. zrozumienie dostępnych danych, właściwa identyfikacja potrzeb, budowa modelu), • dobór narzędzi, Hurtownie danych Typowe problemy podczas tworzenia HD: • róŜnorodność źródeł informacji (zarówno baz danych, jak i sprzętu, parametrów transmisji itp.), • opracowanie właściwej architektury (np. opracowanie wielopoziomowych agregacji, właściwe zasilanie HD, kontrola nadmiarowości i/lub brakujących danych, problemy z ograniczeniami czasowymi) Hurtownie danych Typowe problemy podczas tworzenia HD: • opracowanie mechanizmów oraz formy prezentacji wyników – często dla osób nie będących informatykami 4 Hurtownie danych Wybrane zastosowania: • prezentacja bieŜącego stanu firmy, • wspomaganie decyzji biznesowych – dostarczanie danych oraz mechanizmów do szybkiego pozyskiwania informacji oraz podejmowania działań, • wykrywanie oszustw, • przewidywanie zachowań rynku (np. zarządzanie zapasami), • Lepsze dostosowanie oferty do klienta, • Analiza ryzyka, np. kredytowego. Przykłady systemów MTERIAŁY na CD. 5