Załącznik B do zaproszenia OPIS PRZEDMIOTU ZAMÓWIENIA

Transkrypt

Załącznik B do zaproszenia OPIS PRZEDMIOTU ZAMÓWIENIA
Załącznik B do zaproszenia
OPIS PRZEDMIOTU ZAMÓWIENIA
Przedmiotem zamówienia jest zorganizowanie 2 szkoleń obejmujących analizę danych
biologicznych z wykorzystaniem narzędzi w R
Szkolenie 1:
Celem szkolenia jest zdobycie wiedzy i opanowanie narzędzi w R pozwalających na zrozumienie
podstaw analizy statystycznej. Szkolenie powinno objąć 13 osób i jego głównym rezultatem ma być
rozpoczęcie używania R przez uczestników. Dodatkowo oczekujemy, że uczestnicy otrzymają
materiały szkoleniowe i skrypty pozwalające na późniejsze powtórzenie analiz, np. na innych danych.
Szkolenie powinno obejmować 16 godzin zegarowych brutto oraz odbyć się w dniach: 16-17 maja
2016. Od prowadzącego wymagane jest doświadczenie w pracy naukowej, w tym doświadczenie w
pracy w R z danymi biologicznymi. Zamawiający zapewnia salę konferencyjną z wyposażeniem oraz
komputery dla uczestników.
Zakres merytoryczny szkolenia: podstawy wnioskowania statystycznego, przedziały ufności,
podstawowe testy statystyczne, analiza wariancji, regresja liniowa i nieliniowa, dopasowanie modelu
i prognozowanie, przekształcenia zmiennych, diagnostyka, wybór zmiennych.
Szkolenie 2:
Celem szkolenia jest zdobycie zaawansowanej wiedzy z zakresu zagadnień modeli liniowych.
Szkolenie powinno być przeprowadzone w środowisku R, częściowo na „własnych” danych
zamawiającego. Szkolenie ma objąć 10 osób, powinno trwać 32 godziny zegarowe brutto. Powinno
odbyć się w siedzibie zamawiającego w terminach: 20-21 maja oraz 24-25 czerwca br. Dodatkowo
oczekujemy, że uczestnicy otrzymają materiały szkoleniowe i skrypty pozwalające na późniejsze
powtórzenie analiz, np. na innych danych. Od prowadzącego wymagane jest doświadczenie w pracy
naukowej, w tym doświadczenie w pracy w R z danymi biologicznymi, wieloletnia praktyka
dydaktyczna oraz minimum stopień doktora nauk matematycznych. Zamawiający zapewnia salę
konferencyjną z wyposażeniem oraz komputery dla uczestników.
Zakres merytoryczny szkolenia:
A. regresja liniowa:
1. estymacja;
2. kryteria oceny jakości modelu:
a. ocena jakości zmiennych (współczynniki beta, R2, AIC, BIC, VIF, reszty cząstkowe),
b. ocena jakości przypadków (punkty wpływu, punkty odstające, wykres diagnostyczny);
3. korekta modelu:
a. wybór zmiennych, regresja krokowa, kryteria: R2, AIC/BIC, kryterium Mallowsa,
b. regresja składowych głównych;
4. regresje obciążone: regresja grzbietowa, regresja typu lasso, regresja odporna;
5. transformowalna regresja liniowa: Box Cox.
B. GLM
1. założenia GLM:
a. funkcja łącząca, predyktor liniowy, składowa losowa, rozkład błędów,
Strona 1 z 2
2.
b. estymacja średniokwadratowa a estymacja największej wiarygodności,
c. kryteria jakości modelu GLM: deviance, reszty Pearsona, reszty standaryzowane
modele: normalny, logitowy, Poissonowski, zero-inflated
C. GAM
1. Założenia GAM:
a. sterowanie gładkością modelu,
b. estymacja modelu, metoda najmniejszych kwadratów z funkcją kary
2. uogólnione modele GAM
3. T‐GAMs (Non Additive Threshold GAMs)
D. GLMM oraz GAMM
1. modele stałe a modele mieszane
2. testy dla efektów stałych i losowych
3. modele z jednym komponentem wariancyjnym
Dodatkowo kurs ma pozwolić na pozyskanie takich umiejętności jak radzenie sobie z
niejednorodnością, kolinearnością, naddyspersją, niezależnością danych. Uczestnicy otrzymają
skrypty pozwalające na późniejsze powtórzenie analiz ze szkolenia, np. na innych danych.
Strona 2 z 2