rednie, odchylenia standardowe, macierz korelacji

Transkrypt

rednie, odchylenia standardowe, macierz korelacji
1. Elementarna wizualizacja danych / podstawowe statystyki (analiza opisowa)
• ±rednie, odchylenia standardowe, macierz korelacji
• histogram, wykres pudeªkowy
• wykresy rozrzutu (scatterplots)
Zinterpretuj wyniki.
2. Dane symulowane. Wygeneruj próby z np. dwuwymiarowego rozkªadu normalnego dla
ró»nych parametrów ±redniej, wariancji, korelacji. Porównaj statystyki próbkowe z
prawdziwymi parametrami. Wyci¡gnij wnioski.
3. Analiza danych pod k¡tem klasykacji.
• przeprowad¹ analizy jak w zad. 1
• które zmienne / zestawy zmiennych charakteryzuj¡ si¦ lepszymi zdolno±ciami
dyskryminacyjnymi?
• przetestuj wybrane techniki klasykacji na ró»nych podzbiorach cech (czy jest optymalny podzbiór, czy raz jeden raz inny jest lepszy)
4. Eksperymenty z drzewami decyzyjnymi.
• dokonaj selekcji zmiennych jak w zad. 3
• zbuduj drzewo decyzyjne, zacytuj / skomentuj dost¦pne wªasno±ci drzewa-klasykatora
• przetestuj klasykatory uzyskane dla ró»nych parametrów
• eksperymenty z przycinaniem drzewa
• wizualizacja dla dwóch zmiennych decyzyjnych: obszary decyzyjne
5. Grupowanie.
• potestuj ró»ne metody grupowania, w tym hierarchiczne
• przedstaw wyniki na wykresach, oznaczaj¡c ró»ne grupy ró»nymi kolorami (w razie
potrzeby u»yj PCA, lub innej metody redukcji wymiarowo±ci)
• zbadaj wpªyw standaryzacji na grupowanie
• spróbuj rozstrzygn¡¢, wszelkimi dost¦pnymi sposobami, jaka liczba klastrów jest
najlepsza
• u»yj metody hierarchicznej do systematyzacji danych w rodzaju gatunki zwierz¡t
6. Reguªy asocjacyjne
1

Podobne dokumenty