Projektowanie, implementacja i eksploatacja hurtowni danych
Transkrypt
Projektowanie, implementacja i eksploatacja hurtowni danych
WyŜsza Szkoła Biznesu w Dąbrowie Górniczej Kierunek studiów: Informatyka, studia II stopnia Przedmiot: Projektowanie, implementacja i eksploatacja hurtowni danych Tryb: Specjalność: Projektowanie systemów gromadzenia, przetwarzania i eksploracji danych Liczba godzin w semestrze 1 I 2 II ECTS WYKŁADOWCA Dr inŜ. Małgorzata Bach FORMA ZAJĘĆ Wykład, ćwiczenia, laboratorium CELE PRZEDMIOTU EFEKTY KSZTAŁCENIA III 12w, 16ćw 20lab 8 3 IV V VI Celem przedmiotu jest przekazanie wiedzy niezbędnej do projektowania, implementacji, a następnie efektywnej eksploatacji hurtowni danych. Wiedza: : Student zdobywa wiedzę niezbędną do projektowania i zarządzania hurtowniami danych. Kompetencje: Po zakończeniu nauki w ramach przedmiotu „Projektowanie, implementacja i eksploatacja hurtowni danych” student powinien wykazać się: • wiedzą na temat sposobów rozwiązywania problemów związanych z integracją i transformacją danych pochodzących z róŜnorodnych źródeł, • umiejętnością projektowania hurtowni danych oraz zdolnością doboru architektury hurtowni do konkretnych potrzeb zleceniodawcy • umiejętnością projektowania wielowymiarowych struktur danych, • zdolnością posługiwania się językiem MDX (MultiDimensional eXpressions), • znajomością technik zwiększania efektywności przetwarzania typu OLAP, • umiejętnością doboru metody eksploracji danych do konkretnych potrzeb, • wiedzą na temat nowych trendów w przetwarzaniu analitycznym. Postawy: Celem przedmiotu jest kształtowanie twórczej postawy. W trakcie ćwiczeń punktowana jest aktywność i zaangaŜowanie w realizację postawionych zadań. Niektóre zadania realizowane są w dwu-, trzyosobowych grupach, co sprzyja doskonaleniu postawy (umiejętności) współpracy. WARUNKI WSTĘPNE Znajomość treści prezentowanych w ramach przedmiotu „Bazy i hurtownie danych” TREŚĆ PRZEDMIOTU Projektowanie i implementacja hurtowni danych Przedstawienie problemów pojawiających się na etapie projektowania – dobór architektury w zaleŜności od specyfiki organizacji, dla której tworzona jest hurtownia. Prezentacja narzędzi ETL dostępnych w systemie Microsoft SQL Server 2008. Wykorzystanie SQL Server Integration Services do: • integracji danych z niejednorodnych źródeł np. plików CSV, XML, czy róŜnych DBMS • aktualizacji danych w hurtowniach danych • czyszczenia i standaryzacji danych • uwzględniania logiki biznesowej w procesie transformacji danych Poszerzenie zagadnień związanych z analizą wielowymiarową i eksploracją danych (częściowo zagadnienia te były omawiane w ramach przedmiotu „Bazy i hurtownie danych”) Prezentacja moŜliwości SQL Server 2008 Data Mining Add-ins for Office 2007 Wprowadzenie do zagadnień związanych z tworzeniem raportów Prezentacja moŜliwości SQL Server Reporting Services oraz moŜliwości wykorzystania arkusza kalkulacyjnego Excel do prezentacji wyników przetwarzania danych Przedstawienie nowych trendów w dziedzinie przetwarzania analitycznego Prezentacja moŜliwości systemu QlikView jako przykład rozwiązania przedstawianego jako Business Intelligence In-memory (odejście od tradycyjnych kostek OLAP) Prezentacja rozwiązania firmy Sybase o nazwie IQ bazującego na kolumnowych bazach danych. Przedstawienie idei asocjacyjnych baz danych. . LITERATURA • W. H. Inmon, R. D. Hackathorn:„Using a Data Warehouse” OBOWIAZKOWA • D. Hand, H. Mannila, P. Smyth: „Eksploracja danych”, Wydaw. NaukowoTechniczne, Warszawa, 2005 • E. Veerman: Microsoft SQL Server 2008 Integration, Wrox Press Inc. LITERATURA • V. Poe, P. Klauer, S. Brobst: „Tworzenie hurtowni danych”, WNT, 2000Pablo UZUPEŁNIAJĄCA Guzman, Satoshi Iizuka, Scott Cameron, Joe Kasprzak, Paul Turley: “Microsoft SQL Server 2005 Integration Services. Krok po kroku”, Promise • B. Larson, Brian Larson: “Microsoft SQL Server 2005 Reporting Services”, McgrawHill Publ.Comp. • T. Morzy „Eksploracja danych” http://wazniak.mimuw.edu.plT. Pankowski „Eksploracja danych” www.staff.amu.edu.pl/~tpankow/data-mining.pdfD.T. Larose: „Odkrywanie wiedzy z danych, Wprowadzenie do eksploracji danych”, PWN, Warszawa, 2006. METODY Prezentacje multimedialne. Ćwiczenia z uŜyciem MS SQL Server NAUCZANIA W ramach ćwiczeń studenci zapoznają się dokładnie z moŜliwościami jakie daje SQL Server Integration Services oraz SQL Server 2008 Data Mining Add-ins for Office 2007. POMOCE Prezentacje multimedialne NAUKOWE PRZYKŁADOWE TEMATY PROJEKTÓW SPOSÓB I Zaliczenie ćwiczeń oraz egzamin pisemny w postaci testu wielokrotnego wyboru oraz WARUNKI krótkich pytań opisowych.. ZALICZENIA PRZEDMIOTU 1. Definiując przypływ danych usług SSIS zawsze trzeba wskazać: PRZYKŁADOWE ZAGADNIENIA • obiekt typu źródło danych (ew. pytania) • obiekt typu przekształcenie danych EGZAMINU/ • obiekt typu miejsce docelowe danych ZALICZENIA 2. Czym róŜni się technologia in-memory (zastosowana miedzy innymi w systemu QlikView) od tradycyjnego podejścia opartego o kostki OLAP * Proszę zacieniować odpowiedni rok i semestr