Zajęcia 7. Bootstrap Ćwiczenia Zadania

Transkrypt

Zajęcia 7. Bootstrap Ćwiczenia Zadania
Zajęcia 7. Bootstrap
Ćwiczenia
(1) Zapoznaj się ze składnią i działaniem następujących funkcji w pakiecie
R: sample() ,rnorm() , replicate() , boot (pakiet boot) , boot.ci (pakiet
boot).
(2) Wygeneruj ciąg losowo wybranych liczb z zakresu od 1 do 10. Zastosuj losowanie ze zwracaniem i bez zwracania.
(3) Wygeneruj macierz y o 5 kolumnach i elementach będących losowo
wybranymi (ze zwracaniem) liczbami z zakresu od 1 do 25. Spośród elementów macierzy wybierz losowo 5 z nich i utwórz z nich wektor. Stwórz macierz
x, której wierszami będą trzy losowo wybrane wiersze wyjściowej macierzy y.
(4) Wygeneruj 100 wektorów długości 5, których elementami są losowo
wybrane liczby z zakresu od 1 do 100.
Zadania
Zadanie 12. Estymacja błędu standardowego średniej próbkowej
metodą bootstrap.
Załóżmy, że chcemy badać populację o rozkładzie normalnym ze średnią 3 i
odchyleniem standardowym 1.
i) Wygeneruj przykładową populację liczności 25 o takim rozkładzie (funkcja
rnorm()).
ii) Wygeneruj 1000 prób o liczności 25 z otrzymanych danych (funkcja
replicate()).
iii) Oblicz średnią każdej z 1000 wylosowanych prób bootstrapowych oraz
przedstaw histogram rozkładu tych średnich. Porównaj ten rozkład z rozkładem cechy (rozkładem normalnym N (3, 1)). Oceń czy przybliżenie rozkładu
metodą bootstrap jest adekwatne (czy kształty obu rozkładów są podobne)
iv) Porównaj średnią wygenerowanej próby wyjściowej ze średnią wektora
średnich z prób bootstrapowych. Oceń ich różnicę.
v) Przy użyciu funkcji boot (pakiet boot) wyznacz błąd standardowy dla
średniej ∗ .
1
Zadanie 13. Estymacja błędu standardowego mediany metodą
bootstrap.
Dla zmiennej Petal.Length ze zbioru danych iris podobnie jak w powyższym
zadaniu oceń błąd standardowy mediany i średniej próbkowej:
i) Wygeneruj 1000 prób o liczności równej liczności obserwacji zmiennej
Petal.Length, losując z tych obserwacji ze zwracaniem.
ii) Oblicz medianę każdej z 1000 wylosowanych prób bootstrapowych oraz
przedstaw histogram rozkładu tych median.
iii) Porównaj medianę zmiennej Petal.Length ze średnią median z prób
bootstrapowych. Oceń ich różnicę. Czy próby bootstrapowe prowadzą do
uzyskania dobrego oszacowania mediany?
iv) Przy użyciu funkcji boot (pakiet boot) wyznacz błędy standardowe dla
średniej i mediany zmiennej Petal.Length ∗∗
iv) Przy użyciu funkcji boot.ci (pakiet boot) wyznacz 95% przedziały
ufności dla średniej i mediany zmiennej Petal.Length ∗∗
∗
Dla wyznaczenia błędu średniej w argumencie statistic funkcji boot
użyj funkcji
mean_fun <- function(x, indices) mean(x[indices]) .
∗∗
Dla wyznaczenia błędu mediany w argumencie statistic funkcji boot
użyj funkcji
median_fun <- function(x, indices) median(x[indices]) .
2

Podobne dokumenty