Zadanie1
Transkrypt
Zadanie1
OPIS ZADANIA Nasza firma zajmuje się sprzedaŜą na duŜą skalę (w kraju i za granicą). Chcemy mieć moŜliwość wyszukiwania trendów i zaleŜności w sprzedaŜy, obserwacji przychodów w róŜnych okresach czasu, itp. W związku z powyŜszym zdecydowaliśmy, Ŝe zrobimy sobie hurtownię danych (nudzimy się, nie mamy nic do roboty bo zrobiliśmy porządną bazę danych i wszystko działa, to „co nam zaleŜy” ☺). Niestety nasza firma początkowo prowadziła rejestrację FVAT w Excelu (zanim powstała nasza piękna baza w Access’ie), zatem dane będziemy pobierać z Excel’a i Access’a. HD 1 /Integracja danych z róŜnych źródeł/ Pierwszym naszym zadaniem będzie Ekstrakcja danych, transformacja i ładowanie do hurtowni. Dobrze byłoby taką hurtownię utworzyć (lub skorzystać z bazy istniejącej AdventureWorksDW). WSTĘP (tylko, jak ktoś chce, jak nie chce to nie musi ☺): Proszę wykonać z „tutoriala” LEKCJĘ 1 (Creating simple ETL Package). Zad.1. Proszę zaprojektować pobieranie danych z pliku. Zad.2. Proszę zaprojektować pobieranie danych z Access’a. 1. Tworzenie nowego projektu (SQL Server Business Intelligence Development Studio): • File > New > Project > Integration Services Project • ustalamy nazwę (ewentualnie folder dla projektu) i OK • zmieniamy nazwę pakietu na (okno sprawej strony ekranu, tytuł: Solution Explorer, prawym przyciskiem na nazwie pliku *.dtsx i rename). 2. Dodajemy manager'y: a) korzystamy z pliku • do łączenia z plikiem .xls ( Okno na dole kranu, tytuł: Connection Managers, prawy przycisk myszy > New Flat File Connection; wpisujemy nazwę i odnajdujemy plik BROWSE) • ustalamy podstawowe parametry: nazwę, nazwy kolumn (zaawansowane Advanced) oraz typy elementów (UWAGA: automatycznie ustawiane są domyślne typy i nie zawsze odpowiadają rzeczywistości) b) korzystamy z pliku bazy danych • do pobierania danych z MS ACCESS 3. Dodajemy zadanie, które będzie realizowało pobieranie danych z pliku: • do zakładki Control Flow „przeciągamy” z przybornika (pasek z lewej) Data Flow Task, • zmieniamy nazwę na sensowną. 4. Dodajemy i opisujemy (np. typy komponentów, strukturę) źródło danych dla naszego zadania: • • • • dwa razy klikamy na zadaniu (utworzonym w punkcie wcześniejszym, z przybornika „przeciągamy” typ źródła danych do projektowanego obszaru, ustalamy sensowną nazwę (np. ekstrakcja danych z pliku .xls), a następnie wskazujemy na fizyczny plik na dysku, sprawdzamy, czy nazwy kolumn są poprawne i OK. 5. Definiujemy transformacje (np. jeśli błędy) Lookup Transformations: • opis w tutorialu lub wydruk u mnie na biurku 6. Definiujemy miejsce składowania danych: • • • • • • z przybornika (zakładka Data Flow Destination) „przeciągamy” OLE DB Destination, zmieniamy nazwę na sensowną, przeciągamy zieloną strzałkę z ostatniej transformacji do utworzonego elementu, dwa razy klikamy na utworzonym celu i sprawdzamy, czy jest ustalona baza danych na serwerze, ustalamy (w Name of table or the view) na [dbo].[FactCurrencyRate], przechodzimy do Mapping I sprawdzamy, czy wszystko OK 7. Testujemy nasze zadanie (uruchamiamy „debug’owania”). 8. To samo (od punktu 3) dla pobrania danych z bazy ACCESS’a.