Zadanie1

Transkrypt

Zadanie1
OPIS ZADANIA
Nasza firma zajmuje się sprzedaŜą na duŜą skalę (w kraju i za granicą). Chcemy mieć
moŜliwość wyszukiwania trendów i zaleŜności w sprzedaŜy, obserwacji przychodów w róŜnych
okresach czasu, itp.
W związku z powyŜszym zdecydowaliśmy, Ŝe zrobimy sobie hurtownię danych (nudzimy
się, nie mamy nic do roboty bo zrobiliśmy porządną bazę danych i wszystko działa, to „co nam
zaleŜy” ☺).
Niestety nasza firma początkowo prowadziła rejestrację FVAT w Excelu (zanim powstała
nasza piękna baza w Access’ie), zatem dane będziemy pobierać z Excel’a i Access’a.
HD 1
/Integracja danych z róŜnych źródeł/
Pierwszym naszym zadaniem będzie Ekstrakcja danych, transformacja i ładowanie do hurtowni.
Dobrze byłoby taką hurtownię utworzyć (lub skorzystać z bazy istniejącej AdventureWorksDW).
WSTĘP (tylko, jak ktoś chce, jak nie chce to nie musi ☺):
Proszę wykonać z „tutoriala” LEKCJĘ 1 (Creating simple ETL Package).
Zad.1. Proszę zaprojektować pobieranie danych z pliku.
Zad.2. Proszę zaprojektować pobieranie danych z Access’a.
1. Tworzenie nowego projektu (SQL Server Business Intelligence Development Studio):
• File > New > Project > Integration Services Project
• ustalamy nazwę (ewentualnie folder dla projektu) i OK
• zmieniamy nazwę pakietu na (okno sprawej strony ekranu, tytuł: Solution Explorer, prawym
przyciskiem na nazwie pliku *.dtsx i rename).
2. Dodajemy manager'y:
a) korzystamy z pliku
• do łączenia z plikiem .xls ( Okno na dole kranu, tytuł: Connection Managers, prawy przycisk
myszy > New Flat File Connection; wpisujemy nazwę i odnajdujemy plik BROWSE)
• ustalamy podstawowe parametry: nazwę, nazwy kolumn (zaawansowane Advanced) oraz typy
elementów (UWAGA: automatycznie ustawiane są domyślne typy i nie zawsze odpowiadają
rzeczywistości)
b) korzystamy z pliku bazy danych
• do pobierania danych z MS ACCESS
3. Dodajemy zadanie, które będzie realizowało pobieranie danych z pliku:
• do zakładki Control Flow „przeciągamy” z przybornika (pasek z lewej) Data Flow Task,
• zmieniamy nazwę na sensowną.
4. Dodajemy i opisujemy (np. typy komponentów, strukturę) źródło danych dla naszego zadania:
•
•
•
•
dwa razy klikamy na zadaniu (utworzonym w punkcie wcześniejszym,
z przybornika „przeciągamy” typ źródła danych do projektowanego obszaru,
ustalamy sensowną nazwę (np. ekstrakcja danych z pliku .xls), a następnie wskazujemy na
fizyczny plik na dysku,
sprawdzamy, czy nazwy kolumn są poprawne i OK.
5. Definiujemy transformacje (np. jeśli błędy) Lookup Transformations:
•
opis w tutorialu lub wydruk u mnie na biurku
6. Definiujemy miejsce składowania danych:
•
•
•
•
•
•
z przybornika (zakładka Data Flow Destination) „przeciągamy” OLE DB Destination,
zmieniamy nazwę na sensowną,
przeciągamy zieloną strzałkę z ostatniej transformacji do utworzonego elementu,
dwa razy klikamy na utworzonym celu i sprawdzamy, czy jest ustalona baza danych na serwerze,
ustalamy (w Name of table or the view) na [dbo].[FactCurrencyRate],
przechodzimy do Mapping I sprawdzamy, czy wszystko OK
7. Testujemy nasze zadanie (uruchamiamy „debug’owania”).
8. To samo (od punktu 3) dla pobrania danych z bazy ACCESS’a.