laboratorium 1

Transkrypt

laboratorium 1
ANALIZA DANYCH - LABORATORIUM 1
ZADANIE 1.1 Wczytać zbiór pima znajduja̧cy siȩ w bibliotece faraway. Uzyskać bezpośredni dostȩp
do zmiennych w tym zbiorze.
(a) Dla zmiennej diastolic wyznaczyć i zinterpretować podstawowe miary polożenia, rozproszenia i ksztaltu.
(b) Obejrzeć opis zbioru pima by sprawdzić jakie informacje zawieraja̧ jego zmienne. Wyznaczyć podstawowe miary liczbowe dla wszystkich tych zmiennych i przyjrzeć siȩ czy wśród badanych danych nie
ma blȩdów i rzeczy nietypowych. W szczególnści zauważyć, że zmienna test, bȩda̧ca zmienna̧ jakościowa̧,
zostala zapisana jako zmienna ilościowa. Wprowadzić stosowne poprawki.
(c) Powtórzyć analizȩ z punktu (a), teraz przeprowadzaja̧c ja̧ świadomie i poprawnie.
(d) Wyznaczyć średnie rozkurczowe ciśnienie krwi oraz jego odchylenie standardowe dla kobiet, u których
zaobserwowano objawy cukrzycy.
(e) Dla zmiennej pregnant sporza̧dzić i opisać wykres skrzynkowy.
(f ) Odczytać, u ilu spośród wszystkich badanych kobiet, stwierdzono objawy cukrzycy.
(g) Wiedza̧c, że dla osób doroslych wskaźnik bmi interpretuje siȩ nastȩpuja̧co:
• bmi < 18, 5 =⇒ niedowaga,
• 18, 5 ≤ bmi < 25 =⇒ waga prawidlowa,
• bmi ≥ 25 =⇒ nadwaga,
utworzyć nowa̧ zmienna̧ wyjaśniaja̧ca̧ czy badana osoba ma niedowagȩ, wagȩ prawidlowa̧ czy nadwagȩ.
Dla zmiennej tej sporza̧dzić wykres slupkowy i kolowy.
(h) Dla zmiennej diastolic sporza̧dzić histogram czȩstości oraz narysować ja̧drowy estymator gȩstości.
(i) Sporza̧dzić wykres rozrzutu bmi w zależności od wieku. Obliczyć wspólczynnik korelacji pomiȩdzy
bmi i wiekiem.
(j) Na jednym rysunku sporza̧dzić wykresy skrzynkowe dla zmiennej bmi, osobno dla kobiet z objawami
cukrzycy i bez objawów.
ZADANIE 1.2 Zbiór Cars93, znajduja̧cy siȩ w bibliotece MASS, zawiera dane dotycza̧ce różnych
modeli samochodów osobowych.
(a) Wczytać ten zbiór i uzyskać bezpośredni dostȩp do jego zmiennych. Sprawdzić jakie informacje
zawarte sa̧ w nastȩpuja̧cych kolumnach: Min.Price, MPG.city, MPG.highway, Weight, Origin, Type.
(b) Utworzyć nowe zmienne opisuja̧ce: zużycie paliwa (mierzone w litrach na 100 km) podczas jazdy
samochodu w mieście, zużycie paliwa podczas jazdy samochodu na autostradzie, wagȩ samochodu w kg
oraz cenȩ wersji podstawowej modelu samochodu w tys. PLN. Przyja̧ć, że 1 mila to 1,6 km; 1 US gallon
to 3,8 litra; 1 funt to 0,4536 kg; 1 $ to 3,95 PLN.
(c) Wyznaczyć podstawowe statystyki próbkowe dla danych opisuja̧cych cenȩ wersji podstawowej samochodu. Obliczyć kwantyl rzȩdu 0,95 dla tych danych.
(d) Wypisać ceny wersji podstawowej samochodów, które byly wyższe od kwantyla wyznaczonego
w punkcie (c). Jakich modeli te ceny dotycza̧?
(e) Narysować wykres slupkowy i kolowy dla zmiennej Type. Ile, spośród badanych samochodów,
zaliczono do kategorii sportowe?
(f ) Sporza̧dzić i opisać wykresy skrzynkowe dla zużycia benzyny podczas jazdy w mieście osobno dla
samochodów amerykńskich i nieamerykańskich. Wycia̧gna̧ć wnioski.
(g) Sporza̧dzić wykres rozrzutu ceny podstawowej wersji samochodu od jego zużycia benzyny w mieście
oraz wykres rozrzutu zużycia benzyny w mieście w funkcji zużycia benzyny na autostradzie. Umieścić
oba te wykresy w jednym oknie. Wykresy uzupelnić odpowiednimi wspólczynnikami korelacji.
(h) Narysować histogram czȩstości dla danych dotycza̧cych wagi samochodu. W tym samym oknie
wykreślić ja̧drowy estymator gȩstości.
1

Podobne dokumenty