Załącznik B do zaproszenia OPIS PRZEDMIOTU ZAMÓWIENIA
Transkrypt
Załącznik B do zaproszenia OPIS PRZEDMIOTU ZAMÓWIENIA
Załącznik B do zaproszenia OPIS PRZEDMIOTU ZAMÓWIENIA Przedmiotem zamówienia jest zorganizowanie 2 szkoleń obejmujących analizę danych biologicznych z wykorzystaniem narzędzi w R Szkolenie 1: Celem szkolenia jest zdobycie wiedzy i opanowanie narzędzi w R pozwalających na zrozumienie podstaw analizy statystycznej. Szkolenie powinno objąć 13 osób i jego głównym rezultatem ma być rozpoczęcie używania R przez uczestników. Dodatkowo oczekujemy, że uczestnicy otrzymają materiały szkoleniowe i skrypty pozwalające na późniejsze powtórzenie analiz, np. na innych danych. Szkolenie powinno obejmować 16 godzin zegarowych brutto oraz odbyć się w dniach: 16-17 maja 2016. Od prowadzącego wymagane jest doświadczenie w pracy naukowej, w tym doświadczenie w pracy w R z danymi biologicznymi. Zamawiający zapewnia salę konferencyjną z wyposażeniem oraz komputery dla uczestników. Zakres merytoryczny szkolenia: podstawy wnioskowania statystycznego, przedziały ufności, podstawowe testy statystyczne, analiza wariancji, regresja liniowa i nieliniowa, dopasowanie modelu i prognozowanie, przekształcenia zmiennych, diagnostyka, wybór zmiennych. Szkolenie 2: Celem szkolenia jest zdobycie zaawansowanej wiedzy z zakresu zagadnień modeli liniowych. Szkolenie powinno być przeprowadzone w środowisku R, częściowo na „własnych” danych zamawiającego. Szkolenie ma objąć 10 osób, powinno trwać 32 godziny zegarowe brutto. Powinno odbyć się w siedzibie zamawiającego w terminach: 20-21 maja oraz 24-25 czerwca br. Dodatkowo oczekujemy, że uczestnicy otrzymają materiały szkoleniowe i skrypty pozwalające na późniejsze powtórzenie analiz, np. na innych danych. Od prowadzącego wymagane jest doświadczenie w pracy naukowej, w tym doświadczenie w pracy w R z danymi biologicznymi, wieloletnia praktyka dydaktyczna oraz minimum stopień doktora nauk matematycznych. Zamawiający zapewnia salę konferencyjną z wyposażeniem oraz komputery dla uczestników. Zakres merytoryczny szkolenia: A. regresja liniowa: 1. estymacja; 2. kryteria oceny jakości modelu: a. ocena jakości zmiennych (współczynniki beta, R2, AIC, BIC, VIF, reszty cząstkowe), b. ocena jakości przypadków (punkty wpływu, punkty odstające, wykres diagnostyczny); 3. korekta modelu: a. wybór zmiennych, regresja krokowa, kryteria: R2, AIC/BIC, kryterium Mallowsa, b. regresja składowych głównych; 4. regresje obciążone: regresja grzbietowa, regresja typu lasso, regresja odporna; 5. transformowalna regresja liniowa: Box Cox. B. GLM 1. założenia GLM: a. funkcja łącząca, predyktor liniowy, składowa losowa, rozkład błędów, Strona 1 z 2 2. b. estymacja średniokwadratowa a estymacja największej wiarygodności, c. kryteria jakości modelu GLM: deviance, reszty Pearsona, reszty standaryzowane modele: normalny, logitowy, Poissonowski, zero-inflated C. GAM 1. Założenia GAM: a. sterowanie gładkością modelu, b. estymacja modelu, metoda najmniejszych kwadratów z funkcją kary 2. uogólnione modele GAM 3. T‐GAMs (Non Additive Threshold GAMs) D. GLMM oraz GAMM 1. modele stałe a modele mieszane 2. testy dla efektów stałych i losowych 3. modele z jednym komponentem wariancyjnym Dodatkowo kurs ma pozwolić na pozyskanie takich umiejętności jak radzenie sobie z niejednorodnością, kolinearnością, naddyspersją, niezależnością danych. Uczestnicy otrzymają skrypty pozwalające na późniejsze powtórzenie analiz ze szkolenia, np. na innych danych. Strona 2 z 2