laboratorium 1
Transkrypt
laboratorium 1
ANALIZA DANYCH - LABORATORIUM 1 ZADANIE 1.1 Wczytać zbiór pima znajduja̧cy siȩ w bibliotece faraway. Uzyskać bezpośredni dostȩp do zmiennych w tym zbiorze. (a) Dla zmiennej diastolic wyznaczyć i zinterpretować podstawowe miary polożenia, rozproszenia i ksztaltu. (b) Obejrzeć opis zbioru pima by sprawdzić jakie informacje zawieraja̧ jego zmienne. Wyznaczyć podstawowe miary liczbowe dla wszystkich tych zmiennych i przyjrzeć siȩ czy wśród badanych danych nie ma blȩdów i rzeczy nietypowych. W szczególnści zauważyć, że zmienna test, bȩda̧ca zmienna̧ jakościowa̧, zostala zapisana jako zmienna ilościowa. Wprowadzić stosowne poprawki. (c) Powtórzyć analizȩ z punktu (a), teraz przeprowadzaja̧c ja̧ świadomie i poprawnie. (d) Wyznaczyć średnie rozkurczowe ciśnienie krwi oraz jego odchylenie standardowe dla kobiet, u których zaobserwowano objawy cukrzycy. (e) Dla zmiennej pregnant sporza̧dzić i opisać wykres skrzynkowy. (f ) Odczytać, u ilu spośród wszystkich badanych kobiet, stwierdzono objawy cukrzycy. (g) Wiedza̧c, że dla osób doroslych wskaźnik bmi interpretuje siȩ nastȩpuja̧co: • bmi < 18, 5 =⇒ niedowaga, • 18, 5 ≤ bmi < 25 =⇒ waga prawidlowa, • bmi ≥ 25 =⇒ nadwaga, utworzyć nowa̧ zmienna̧ wyjaśniaja̧ca̧ czy badana osoba ma niedowagȩ, wagȩ prawidlowa̧ czy nadwagȩ. Dla zmiennej tej sporza̧dzić wykres slupkowy i kolowy. (h) Dla zmiennej diastolic sporza̧dzić histogram czȩstości oraz narysować ja̧drowy estymator gȩstości. (i) Sporza̧dzić wykres rozrzutu bmi w zależności od wieku. Obliczyć wspólczynnik korelacji pomiȩdzy bmi i wiekiem. (j) Na jednym rysunku sporza̧dzić wykresy skrzynkowe dla zmiennej bmi, osobno dla kobiet z objawami cukrzycy i bez objawów. ZADANIE 1.2 Zbiór Cars93, znajduja̧cy siȩ w bibliotece MASS, zawiera dane dotycza̧ce różnych modeli samochodów osobowych. (a) Wczytać ten zbiór i uzyskać bezpośredni dostȩp do jego zmiennych. Sprawdzić jakie informacje zawarte sa̧ w nastȩpuja̧cych kolumnach: Min.Price, MPG.city, MPG.highway, Weight, Origin, Type. (b) Utworzyć nowe zmienne opisuja̧ce: zużycie paliwa (mierzone w litrach na 100 km) podczas jazdy samochodu w mieście, zużycie paliwa podczas jazdy samochodu na autostradzie, wagȩ samochodu w kg oraz cenȩ wersji podstawowej modelu samochodu w tys. PLN. Przyja̧ć, że 1 mila to 1,6 km; 1 US gallon to 3,8 litra; 1 funt to 0,4536 kg; 1 $ to 3,95 PLN. (c) Wyznaczyć podstawowe statystyki próbkowe dla danych opisuja̧cych cenȩ wersji podstawowej samochodu. Obliczyć kwantyl rzȩdu 0,95 dla tych danych. (d) Wypisać ceny wersji podstawowej samochodów, które byly wyższe od kwantyla wyznaczonego w punkcie (c). Jakich modeli te ceny dotycza̧? (e) Narysować wykres slupkowy i kolowy dla zmiennej Type. Ile, spośród badanych samochodów, zaliczono do kategorii sportowe? (f ) Sporza̧dzić i opisać wykresy skrzynkowe dla zużycia benzyny podczas jazdy w mieście osobno dla samochodów amerykńskich i nieamerykańskich. Wycia̧gna̧ć wnioski. (g) Sporza̧dzić wykres rozrzutu ceny podstawowej wersji samochodu od jego zużycia benzyny w mieście oraz wykres rozrzutu zużycia benzyny w mieście w funkcji zużycia benzyny na autostradzie. Umieścić oba te wykresy w jednym oknie. Wykresy uzupelnić odpowiednimi wspólczynnikami korelacji. (h) Narysować histogram czȩstości dla danych dotycza̧cych wagi samochodu. W tym samym oknie wykreślić ja̧drowy estymator gȩstości. 1