Konspekt przedmiotu
Transkrypt
Konspekt przedmiotu
Wydział Matematyki i Nauk Informacyjnych PW ZGŁOSZENIE PRZEDMIOTU OBIERALNEGO w roku akademickim 2015/2016 Przedmiot Przetwarzanie i analiza danych w języku Python Python for Data Processing and Analysis Kierunek/Semestr STUDIA STACJONARNE MAGISTERSKIE kierunek Matematyka semestr zimowy Prowadzący dr Marek Gągolewski Zakład Procesów Stochastycznych MiNI PW [email protected] Tyg. wymiar godz. W:2, Ćw:0, Lab:2, Proj:0 Sposób zaliczenia zaliczenie Kod przedmiotu PADR ECTS 5 Maks. liczba grup lab. 1 (maks. 20 osób) Podstawowe cele kształcenia Kurs poświęcony jest wprowadzeniu do programowania w języku Python 2.7 (bądź 3.4 – do ustalenia). Uczestnicy kursu mają możliwość dogłębnego poznania technik programowania w języku Python oraz najbardziej popularnych i użytecznych bibliotek tegoż języka. Szczególny nacisk kładziony jest na omówienie i ćwiczenie technik programowania i użycia narzędzi przydatnych w pracy matematyka-praktyka, m.in. na stanowiskach: analityk danych, statistical programmer, oraz junior data scientist. Założone efekty kształcenia Po ukończeniu kursu student nabędzie umiejętność dość biegłego programowania w języku Python, przeprowadzania obliczeń naukowych, przetwarzania obrazów i sygnałów audio, świadomego doboru adekwatnych dla danego zagadnienia problemowego algorytmów maszynowego uczenia się (machine learning) oraz zbierania, czyszczenia i analizy dużych zbiorów danych. 1 Przedmioty poprzedzające Przynajmniej jeden semestr kursu programowania w języku C lub C++, znajomość podstaw metod numerycznych i analizy danych. Zalecana umiejętność programowa w R. Program przedmiotu 1. 2-3. 4-5. 6. 7-8. 9-10. 11. 12. 13-14. 15. Wprowadzenie do języka Python 2.7 (3.4) i środowiska IPython Biblioteka standardowa języka Python. Podstawowe struktury danych Przygotowywanie danych do analizy (pandas, csvkit) Wizualizacja danych (matplotlib, Seaborn) Obliczenia numeryczne, przetwarzanie obrazow i sygnałów audio (numpy, scipy) Algorytmy maszynowego uczenia sie (scikit-learn, statsmodels, Shogun, PyBrain) Dostęp do serwerów bazodanowych (SQL i noSQL) Ekstrakcja danych ze stron WWW, parsowanie XML i json (scrapy) Przetwarzanie języka naturalnego (NLTK) oraz wielkich zbiorow danych (Hadoopy) Łączenie Pythona z R, tworzenie własnych API Literatura podstawowa 1. W.McKinney, Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython, O’Reilly Media, 2012 2. W.Richert, L.P.Coelho, Building Machine Learning Systems with Python, Packt Publishing, 2013 3. M.Lutz, Learning Python, O’Reilly Media, 2013 4. E.Bressert, SciPy and NumPy, O’Reilly Media, 2012 Sposób zaliczenia przedmiotu Na zaliczenie składają się oceny zdobyte podczas laboratoriów (praktyczne projekty w grupach) i rozwiązywania prac domowych. Warszawa, 3 marca 2015 r. 2