rednie, odchylenia standardowe, macierz korelacji
Transkrypt
rednie, odchylenia standardowe, macierz korelacji
1. Elementarna wizualizacja danych / podstawowe statystyki (analiza opisowa) • ±rednie, odchylenia standardowe, macierz korelacji • histogram, wykres pudeªkowy • wykresy rozrzutu (scatterplots) Zinterpretuj wyniki. 2. Dane symulowane. Wygeneruj próby z np. dwuwymiarowego rozkªadu normalnego dla ró»nych parametrów ±redniej, wariancji, korelacji. Porównaj statystyki próbkowe z prawdziwymi parametrami. Wyci¡gnij wnioski. 3. Analiza danych pod k¡tem klasykacji. • przeprowad¹ analizy jak w zad. 1 • które zmienne / zestawy zmiennych charakteryzuj¡ si¦ lepszymi zdolno±ciami dyskryminacyjnymi? • przetestuj wybrane techniki klasykacji na ró»nych podzbiorach cech (czy jest optymalny podzbiór, czy raz jeden raz inny jest lepszy) 4. Eksperymenty z drzewami decyzyjnymi. • dokonaj selekcji zmiennych jak w zad. 3 • zbuduj drzewo decyzyjne, zacytuj / skomentuj dost¦pne wªasno±ci drzewa-klasykatora • przetestuj klasykatory uzyskane dla ró»nych parametrów • eksperymenty z przycinaniem drzewa • wizualizacja dla dwóch zmiennych decyzyjnych: obszary decyzyjne 5. Grupowanie. • potestuj ró»ne metody grupowania, w tym hierarchiczne • przedstaw wyniki na wykresach, oznaczaj¡c ró»ne grupy ró»nymi kolorami (w razie potrzeby u»yj PCA, lub innej metody redukcji wymiarowo±ci) • zbadaj wpªyw standaryzacji na grupowanie • spróbuj rozstrzygn¡¢, wszelkimi dost¦pnymi sposobami, jaka liczba klastrów jest najlepsza • u»yj metody hierarchicznej do systematyzacji danych w rodzaju gatunki zwierz¡t 6. Reguªy asocjacyjne 1