Zajęcia nr 12: Wzor kolokwium
Transkrypt
Zajęcia nr 12: Wzor kolokwium
Przykładowe zadania na kolokwium z przedmiotu „podstawy eksploracji danych” Zadanie 1 Z biblioteki MASS użyjesz zbioru o nazwie „survey”. Jest tam atrybut „Height” dla którego przedstaw informacje dotyczące wartośd min, max, średniej. Narysuj wykres typu pudełkowego dla tej danych. Dodatkowo wywołaj komendy w R które są niezbędne by sprawdzid czy punkty zaznaczone na wykresie są prawidłowe. Podpowiedź. Ładowanie biblioteki libr ary(MASS) Obliczenie średniej: mean(survey$Height) Wykres: poszukaj wywołania – boxplot() Zadanie 2 Dla danych z zadania 1, w środowisku R wyznacz 95% przedział ufności dla wartości „Height”. Zadanie 3 Zainteresuj się zbiorem: http://archive.ics.uci.edu/ml/machine-learning-databases/space-shuttle/ Opisz go w kilku zdaniach. W tym celu użyj albo Excela, albo R do wczytania pliku z danymi i przedstawienia charakterystyki danych. Zadanie 4 Dla danych z zadania 3 znormalizuj metodą min-max dane z kolumny 3, tak by zamiast zakresu 50200 dane miały zakres 0-10. Narzędzie: dowolne: R albo Excel, albo inne. Zadanie 5 Sprawdź w środowisku R korelację cechy 2 i 3 dla danych z pliku http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data i porównaj wyniki z wynikami w Excelu. Zinterpretuj wyniki. Zadanie 6 Wczytaj zbiór http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data Zamieo pierwszą wartośd „5.1” na 51 i w Excelu napisz formuły do wykrywania odchyleo w danych metodą zarówno z rozstępu międzykwartylowego jak i z odchylenia standardowego. Porównaj rezultaty.