Zajęcia nr 12: Wzor kolokwium

Transkrypt

Zajęcia nr 12: Wzor kolokwium
Przykładowe zadania na kolokwium z przedmiotu „podstawy eksploracji
danych”
Zadanie 1
Z biblioteki MASS użyjesz zbioru o nazwie „survey”. Jest tam atrybut „Height” dla którego przedstaw
informacje dotyczące wartośd min, max, średniej. Narysuj wykres typu pudełkowego dla tej danych.
Dodatkowo wywołaj komendy w R które są niezbędne by sprawdzid czy punkty zaznaczone na
wykresie są prawidłowe.
Podpowiedź.
Ładowanie biblioteki libr ary(MASS)
Obliczenie średniej: mean(survey$Height)
Wykres: poszukaj wywołania – boxplot()
Zadanie 2
Dla danych z zadania 1, w środowisku R wyznacz 95% przedział ufności dla wartości „Height”.
Zadanie 3
Zainteresuj się zbiorem:
http://archive.ics.uci.edu/ml/machine-learning-databases/space-shuttle/
Opisz go w kilku zdaniach. W tym celu użyj albo Excela, albo R do wczytania pliku z danymi i
przedstawienia charakterystyki danych.
Zadanie 4
Dla danych z zadania 3 znormalizuj metodą min-max dane z kolumny 3, tak by zamiast zakresu 50200 dane miały zakres 0-10. Narzędzie: dowolne: R albo Excel, albo inne.
Zadanie 5
Sprawdź w środowisku R korelację cechy 2 i 3 dla danych z pliku
http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data
i porównaj wyniki z wynikami w Excelu. Zinterpretuj wyniki.
Zadanie 6
Wczytaj zbiór http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data
Zamieo pierwszą wartośd „5.1” na 51 i w Excelu napisz formuły do wykrywania odchyleo w danych
metodą zarówno z rozstępu międzykwartylowego jak i z odchylenia standardowego. Porównaj
rezultaty.