Laboratorium 1 - 17 maja 2014 (Metody regresji) Tematy: 1. Model

Transkrypt

Laboratorium 1 - 17 maja 2014 (Metody regresji) Tematy: 1. Model
Laboratorium 1 - 17 maja 2014 (Metody regresji)
Tematy:
1. Model Regresji liniowej
• interpretacja modelu
• sprawdzanie dopasowania modelu
• testy istotności zmiennych
• transformacje zmiennych (metoda Boxa-Coxa)
• selekcja zmiennych
• predykcja
• zmienne nominalne
2. Drzewa regresyjne
• konstrukcja drzewa
• interpretacja modelu
• predykcja
3. Lasy Losowe
• konstrukcja lasu losowego
• predykcja
• miary istotności oparte na lasach losowych
4. Analiza składowych głównych (PCA)
5. Regresja składowych głównych (PCR)
6. Regresja częściowych najmmniejszych kwadratów (PLSR)
7. Metoda najbliższego sąsiada
Zadanie do samodzielnego wykonania:
• Porównaj działanie metod (regresja liniowa, drzewa, lasy losowe, metoda PCR, metoda
PLSR, metoda najbliższego sąsiada) na zbiorze danych Housing używając metod:
– podziału na zbiór treningowy (służący do budowy modelu) i zbiór testowy (służący
do oceny modelu)
– wielokrotnego podziału na zbiór treningowy i testowy lub kroswalidacji (pakiet R
cvTools).
• W przypadku regresji liniowej warto dokonać selekcji zmiennych; w przypadku PCR/PLSR
wyboru liczby składowych głównych; w przypadku metody najbliższego sąsiada warto zbadać jaki jest wpływ liczby sąsiadów na jakość predykcji.

Podobne dokumenty