Hurtownie i eksploracja danych

Transkrypt

Hurtownie i eksploracja danych
Politechnika Gdańska, międzywydziałowy kierunek „INŻYNIERIA BIOMEDYCZNA”
KONSPEKT PRZEDMIOTU
PIERWSZEGO POZIOMU STUDIÓW STACJONARNYCH
Nazwa przedmiotu Hurtownie i eksploracja danych
Skrót:
Semestry:
Punkty ECTS:
VI
Rodzaj przedmiotu:
Liczba godzin w semestrze:
Wykład
Semestr VI
15
Strumień/profil:
chemia w medycynie
kierunkowy w strumieniu IWM
Ćwiczenia
Laboratorium
elektronika w medycynie
Osoba odpowiedzialna za przedmiot:
Imię:
Jacek
E-mail: [email protected]
Projekt
15
Seminarium
fizyka w medycynie
Nazwisko:
Telefon:
HIED
4
Łącznie
30
informatyka w medycynie
X
Rumiński
0583472678
Lokal:
102 WETI
Cele przedmiotu:
Celem przedmiotu jest zapoznanie studentów z metodami modelowania i wykorzystania hurtowni danych oraz
podstawami eksploracji danych. Ważnym celem szczegółowym jest ukazanie możliwości zastosowania eksploracji danych
do różnych typów i form danych, m.in. danych multimedialnych. Zakłada się, że przedstawiane treści kształcenia w zakresie
tego przedmiotu powinny zachęcać do samodzielnego poszerzania wiedzy z wykorzystaniem udostępnionych w ramach
przedmiotu elementów edukacji na odległość jak i innych zasobów elektronicznych.
Spodziewane efekty kształcenia - umiejętności i kompetencje:
- zamodelowania wielowymiarowej hurtowni danych,
- konwersji danych źródłowych i przeniesienia ich do hurtowni danych,
- analizy danych wielowymiarowych i formułowania wniosków,
- przygotowania danych do eksploracji danych,
- doboru metody, algorytmu i oprogramowania eksploracji danych,
- wizualizacji wiedzy uzyskanej z eksploracji danych,
- oceny ilościowej uzyskanych reguł.
Karta zajęć - wykład
Lp.
Zagadnienie
Poziom
wiedzy
A
B
C
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
Bazy danych a hurtownie – podstawowe pojęcia
Hurtownie: modele danych
Hurtownie: operacje na danych
OLAP
Przykłady systemów i rozwiązań
Bazy danych dokumentów - XML
Transformacje struktur i danych
Wyszukiwanie danych
Podstawy eksploracji danych – znaczenie i metody
Przygotowanie danych
Reguły asocjacyjne
Drzewa decyzyjne i klasyfikacja danych
Formułowanie wiedzy, filtracja i wizualizacja
Przykłady systemów i aplikacji
X
X
X
X
X
X
X
X
X
X
X
X
X
X
umiejętności
D
E
Liczba
godzin
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Politechnika Gdańska, międzywydziałowy kierunek „INŻYNIERIA BIOMEDYCZNA”
15.
Wydobywanie informacji z danych multimedialnych. SQL/MM i
MPEG7.
1
X
Razem: 15
Karta zajęć - projekt
Lp.
Zagadnienie
Poziom
wiedzy
A
B
C
1.
2.
3.
4.
5.
Projekt hurtowni danych lub systemu eksploracji danych:
specyfikacja wymagań, wybór źródeł danych (lub gromadzenie
danych)
Analiza możliwych metod/algorytmów, dobór lub wypracowanie
narzędzi
Przeprowadzenie eksperymentów analiz danych/generacji wiedzy
Opracowanie/wybór miar oceny uzyskanych wyników, ocena
wyników
Dokumentacja wyników.
Próg zaliczenia:
Semestr: VI
z wykładu
20/40
z ćwiczeń
X
3
X
3
X
X
3
3
X
Warunki zaliczenia przedmiotu
z laboratorium z projektu
31/60
Liczba
godzin
umiejętności
D
E
z seminarium
3
Razem: 15
Z CAŁOŚCI
51/100
Opis form zaliczenia
Wykład (semestr VI)
Id
Termin
1
Sesja
egzaminacyjna
Punkty
40
Zakres
Egzamin z materiału teoretycznego
Razem: 40
Projekt (semestr VI)
Id
Termin
1
Spotkanie nr 2
2
Spotkanie nr 3
3
Spotkanie nr 4
4
Spotkanie nr 4
5
Spotkanie nr 5
Punkty
6
6
12
18
18
Razem: 60
Zakres
Prezentacja z zakresu wybranego tematu projektowego
Prezentacja z zakresu opracowanych ogólnych ram aplikacji/systemu
Ocena podsystemy zbierania/generacji danych
Ocena opracowanego zadania
Ocena dokumentacji, w tym dokumentacji kodu jak i wyników testowania.
Uwagi dotyczące kryteriów zaliczenia:
Student musi uzyskać pozytywny wynik z egzaminu oraz zajęć projektowych. W ramach tego przedmiotu najbardziej
istotne jest zdobycie umiejętności praktycznych w zakresie budowania nowych struktur danych i odkrywania wiedzy,
dlatego większość punktów przydzielono za projekt. Po uzyskaniu wymaganej liczby punktów za projekt student
przystępuje do egzaminu.
Lp.
1.
Przedmiot
Technologie
informacyjne
2.
Metody i techniki
programowania
Przedmioty wyprzedzające wraz z wymaganiami wstępnymi
Zakres
1. Uruchamianie aplikacji.
1.1. Uruchamianie aplikacji z linii poleceń (terminal).
1.2. Uruchamianie aplikacji z poziomu interfejsu graficznego systemu operacyjnego.
2. Konfiguracja komputera.
2.1. Instalowanie oprogramowania.
2.2. Ustawianie zmiennych środowiska.
1. Budowa programu w programowaniu strukturalnym.
1.1. Zmienne, typy danych, funkcje.
Projekt „Przygotowanie i realizacja kierunku inżynieria biomedyczna – studia międzywydziałowe”
współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.
Politechnika Gdańska, międzywydziałowy kierunek „INŻYNIERIA BIOMEDYCZNA”
3.
Bazy danych
1.2. Instrukcje sterujące.
1.3. Kompilacja i wykonywanie programów.
1.4. Podstawowe struktury danych.
1.5. Umiejętność przejścia od pomysły, przez algorytm do programu.
2. Budowa programu w programowaniu obiektowym.
2.1. Projektowanie i zapis klas.
2.2. Tworzenie i wykorzystywanie obiektów.
2.3. Elementy paradygmatu obiektowego (abstrakcja, hermetyzacja, dziedziczenie,
polimorfizm).
2.4. Wykorzystywanie bibliotek klas.
1. Modele danych.
1.1. Model hierarchiczny, podstawy.
1.2. Model relacyjny, podstawy.
1.4. Model obiektowy, podstawy.
2. Projektowanie baz danych.
2.1. Diagramy związków encji.
2.2. Diagramy relacyjne.
2.3. Normalizacja bazy relacyjnej.
3. Model relacyjny.
3.1. Tabele, pola, typy danych, klucze, związki, algebra relacji.
3.2. SQL – DDL, DML.
Metody dydaktyczne:
Wykład prowadzony będzie z wykorzystaniem projektora, za pomocą którego, nauczyciel zaprezentuje slajdy, ukazujące
treści przedmiotu. Ważniejsze problemy ilustrowane będą pokazami tworzonych i uruchamianych programów. Część
wykładów (około 30%) zostanie zrealizowana z wykorzystaniem metod i technik edukacji na odległość. Edukacja na
odległość prowadzona będzie poprzez interaktywny materiał dydaktyczny w połączeniu ze śledzeniem jego przyswajania
przez studentów. Jednocześnie wykładowca będzie do dyspozycji studentów w ramach forum tematycznego, jak również
poprzez komunikator (chat). Wraz ze studentami tworzyć będzie wirtualną grupę roboczą. Studenci po przejściu procesu
interaktywnej edukacji (przedstawianie interaktywnego materiału i testów) powinni wziąć udział w dyskusjach
tematycznych prowadzonych w ramach forum jak i komunikatora (przebieg dyskusji widoczny przez wszystkich członków
grupy). Nauczyciel jest zobowiązany poświęcić i udokumentować czas spędzony na prowadzeniu edukacji na odległość (w
wymiarze co najmniej równym liczbie godzin poświęconym na realizację danych treści wykładu w formie tradycyjnej).
W ramach zajęć projektowych studenci zrealizują proces zbierania danych oraz realizacji metod analizy danych (z hurtowni
lub w ramach eksploracji danych). Na pierwszym spotkaniu projektowym nauczyciel przedstawi zasady realizacji projektu
(m.in. dostępność szablonów dokumentów, harmonogram spotkań projektowych, godziny konsultacji) oraz rozdzieli
tematy zadań. Kolejne spotkania przeznaczone zostaną na zaprezentowanie poszczególnych etapów realizacji projektu
przez studenta. W czasie spotkań prowadzący udzielał będzie studentom wskazówek dotyczących zalecanych zmian w
danej fazie projektu. Dwa tygodnie przed końcem zajęć w danym semestrze studenci przygotują kompletne rozwiązanie
wraz z dokumentacją i prześlą je na platformę edukacji na odległość. W czasie ostatnich dwóch tygodni zajęć wszyscy
studenci przedstawiać będą efekty swoich prac (w ramach spotkań projektowych). Zajęcia projektowe rozpoczną się w
piątym tygodniu wykładów.
Wykaz literatury podstawowej:
1. Skrypt z materiałami do przedmiotu „Hurtownie i eksploracja danych”
2. Materiały do przedmiotu opracowane w formie edukacji na odległość, dostęp: http://uno.biomed.gda.pl
3. Daniel T. Larose, Odkrywanie wiedzy z danych Wprowadzenie do eksploracji danych, PWN, 2006
4. Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan-Kaufmann, 2006
5. Matthias Jarke, Maurizio Lenzerini, Yannis Vassiliou, Panos Vassiliadis, Hurtownie danych. Podstawy
organizacji i funkcjonowania, WAiP, 2003.
6. W3C, Rekomendacje XML i HTML, www.w3.org
Wykaz literatury uzupełniającej:
1. Oracle, dokumentacja produktów OLAP/eksploracji danych
2. Microsoft, dokumentacja produktów OLAP/eksploracji danych
3. IBM, dokumentacja produktów OLAP/eksploracji danych
Projekt „Przygotowanie i realizacja kierunku inżynieria biomedyczna – studia międzywydziałowe”
współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.