Konspekt przedmiotu

Transkrypt

Konspekt przedmiotu
Wydział Matematyki i Nauk Informacyjnych PW
ZGŁOSZENIE PRZEDMIOTU OBIERALNEGO
w roku akademickim 2015/2016
Przedmiot
Przetwarzanie i analiza danych w języku Python
Python for Data Processing and Analysis
Kierunek/Semestr
STUDIA STACJONARNE MAGISTERSKIE
kierunek Matematyka
semestr zimowy
Prowadzący
dr Marek Gągolewski
Zakład Procesów Stochastycznych MiNI PW
[email protected]
Tyg. wymiar godz.
W:2, Ćw:0, Lab:2, Proj:0
Sposób zaliczenia
zaliczenie
Kod przedmiotu
PADR
ECTS
5
Maks. liczba grup lab.
1 (maks. 20 osób)
Podstawowe cele kształcenia
Kurs poświęcony jest wprowadzeniu do programowania w języku Python 2.7 (bądź 3.4 – do ustalenia). Uczestnicy kursu mają możliwość dogłębnego poznania technik programowania w języku Python oraz najbardziej
popularnych i użytecznych bibliotek tegoż języka.
Szczególny nacisk kładziony jest na omówienie i ćwiczenie technik programowania i użycia narzędzi przydatnych w pracy matematyka-praktyka,
m.in. na stanowiskach: analityk danych, statistical programmer, oraz junior
data scientist.
Założone efekty kształcenia
Po ukończeniu kursu student nabędzie umiejętność dość biegłego programowania w języku Python, przeprowadzania obliczeń naukowych, przetwarzania obrazów i sygnałów audio, świadomego doboru adekwatnych dla danego zagadnienia problemowego algorytmów maszynowego uczenia się (machine learning) oraz zbierania, czyszczenia i analizy dużych zbiorów danych.
1
Przedmioty poprzedzające
Przynajmniej jeden semestr kursu programowania w języku C lub C++,
znajomość podstaw metod numerycznych i analizy danych. Zalecana umiejętność programowa w R.
Program przedmiotu
1.
2-3.
4-5.
6.
7-8.
9-10.
11.
12.
13-14.
15.
Wprowadzenie do języka Python 2.7 (3.4) i środowiska IPython
Biblioteka standardowa języka Python. Podstawowe struktury danych
Przygotowywanie danych do analizy (pandas, csvkit)
Wizualizacja danych (matplotlib, Seaborn)
Obliczenia numeryczne, przetwarzanie obrazow i sygnałów audio (numpy,
scipy)
Algorytmy maszynowego uczenia sie (scikit-learn, statsmodels, Shogun,
PyBrain)
Dostęp do serwerów bazodanowych (SQL i noSQL)
Ekstrakcja danych ze stron WWW, parsowanie XML i json (scrapy)
Przetwarzanie języka naturalnego (NLTK) oraz wielkich zbiorow danych (Hadoopy)
Łączenie Pythona z R, tworzenie własnych API
Literatura podstawowa
1. W.McKinney, Python for Data Analysis. Data Wrangling with Pandas,
NumPy, and IPython, O’Reilly Media, 2012
2. W.Richert, L.P.Coelho, Building Machine Learning Systems with Python, Packt Publishing, 2013
3. M.Lutz, Learning Python, O’Reilly Media, 2013
4. E.Bressert, SciPy and NumPy, O’Reilly Media, 2012
Sposób zaliczenia przedmiotu
Na zaliczenie składają się oceny zdobyte podczas laboratoriów (praktyczne projekty w grupach) i rozwiązywania prac domowych.
Warszawa, 3 marca 2015 r.
2

Podobne dokumenty