Statystyczna Analiza Danych
Transkrypt
Statystyczna Analiza Danych
Statystyczna Analiza Danych - Zadania 5 Aleksander Adamowski (s1869) Zadanie 1 Liczba nie zdanych egzaminów w ciągu semestru przez losowo wybranego studenta pewnej uczelni jest zmienną losową X o funkcji prawdopodobieństwa danej tabelą x 0 1 2 p(x) 0, 7 0,25 0,05 (a) Oblicz wartość średnią i wariancję liczby nie zdanych egzaminów przez studenta tej uczelni. (b) Oblicz prawdopodobieństwo warunkowe, że losowo wybrany student nie zda 2 egzaminów, jeśli wiadomo, że nie zdał co najmniej jednego egzaminu. (a) Rozw. Wartość średnia: X =0 ⋅0,7 1 ⋅0,25 2 ⋅0,05 =0,35 Sprawdzenie w R: > wartosci<-c(0,1,2) > prawdopodobienstwa<-c(0.8,0.25,0.05) > weighted.mean(wartosci, prawdopodobienstwa) [1] 0.35 Wariancja: 2X =0−0,352 ⋅0,7 1−0,352 ⋅0,25 2−0,352 ⋅0,05 =0,3275 Sprawdzenie w R: > sum(((wartosci-weighted.mean(wartosci, prawdopodobienstwa))^2) *prawdopodobienstwa) [1] 0.3275 (b) Rozw. Niech A oznacza nie zdanie 2 egzaminów, B oznacza nie zdanie co najmniej jednego egzaminu. P(A) = 0,05 P(B) = 0,25 + 0,05 = 0,3 P A∩B=0,05 P A∣B= P A∩B 0,05 = ≈0,1667 P B 0,3 Zadanie 2 Firma zakupiła 4 nowe monitory tej samej marki. Prawdopodobieństwo, że monitor tej marki ulegnie awarii w okresie gwarancji wynosi 0,05. Oblicz prawdopodobieństwo, że (a) dwa monitory ulegną awarii w okresie gwarancji, (b) nie wszystkie monitory ulegną awarii w okresie gwarancji, (c) co najmniej jeden monitor ulegnie awarii w okresie gwarancji. Jaka jest wartość średnia i wariancja liczby komputerów, które ulegną awarii w okresie gwarancji? (a) Rozw. Niech zmienna losowa X oznacza liczbę monitorów, które uległy awarii. Zmienna ma rozkład dwumianowy z n = 4 i p = 0,05. 2 2 4 Zatem P X=2=b2 ;4, 0 ,05= ⋅0,05 ⋅0,95 =0,0135375 2 (b) Rozw. P X4=b0 ;4, 0 ,05b1 ;4, 0 ,05b2 ;4, 0 ,05b3 ; 4, 0 ,05 P X4= 4 ⋅0,050 ⋅0,95 4 4 ⋅0,051 ⋅0,95 3 4 ⋅0,052 ⋅0,95 2 4 ⋅0,053 ⋅0,95 0 1 2 3 P X4=0,9999937 1 (c) Rozw. P X1=1−b0 ;4, 0 ,05 0 4 P X1=1− 4 ⋅0,1 ⋅0,9 =0,1854938 0 Wartość średnia i wariancja: a) Obliczenie wszystkich wartości funkcji prawdopodobieństwa: P X=0=b0 ;4, 0 ,05= 4 ⋅0,10 ⋅0,9 4 =0,8145062 0 P X=1=b1 ; 4, 0 ,05= 4 ⋅0,11 ⋅0,9 3 =0,171475 1 P X=2=b2 ;4, 0 ,05= 4 ⋅0,12 ⋅0,9 2 =0,0135375 2 P X=3=b3 ;4, 0 ,05= 4 ⋅0,13 ⋅0,9 1 =0,000475 3 P X=4=b4 ; 4, 0 ,05= 4 ⋅0,14 ⋅0,9 0 =0,00000625 4 b) wartość średnia: 0 ⋅0,81450625 1 ⋅0,171475 2 ⋅0,0135375 3 ⋅0,000475 4 ⋅0,00000625 =0,2 c) wariancja: 2 2 2 2 2 0−0,2 ⋅0,81450625 1−0,2 ⋅0,171475 2−0,2 ⋅0,0135375 3−0,2 ⋅0,000475 4−0,2 ⋅0,00000625 =0,19 Sprawdzenie w R: Pomocniczy program zadania5_2.R: # Pomocnicza funkcja wyliczajaca b(k; n, p): rDwumianFunkcjaP<-function(k, n, p) { if(!missing(k) & !missing(n) & !missing(p)) { return(choose(n,k)*p^k*(1-p)^(n-k)) } return(NA); } options(digits=7) num<-4 prob<-0.05 # Wyliczenia dla zadania nr. 2: zad2X<-(0:4) zad2Prawdopodobienstwa = sapply(zad2X, rDwumianFunkcjaP, n=num, p=prob) print("Prawdopodobienstwa:") print(zad2Prawdopodobienstwa) # Czy prawdopodobienstwa sumuja sie do jednego? print(paste("Prawdopodobienstwa sumuja sie do:", sum(zad2Prawdopodobienstwa))) # Wartosc srednia: # Wartosc srednia: mi<-weighted.mean(zad2X, zad2Prawdopodobienstwa) print(paste("Wartosc srednia:", mi)) # Wariancja: war<-sum(((zad2X-mi)^2)*zad2Prawdopodobienstwa) print(paste("Wariancja:", war)) Wynik działania: > source("zadania5_2.R") [1] "Prawdopodobienstwa:" [1] 0.81450625 0.17147500 0.01353750 0.00047500 0.00000625 [1] "Prawdopodobienstwa sumuja sie do: 1" [1] "Wartosc srednia: 0.2" [1] "Wariancja: 0.19" Zadanie 3 Liczba huraganów w ciągu roku w pewnym rejonie USA jest zmienną losową o rozkładzie Poissona ze średnią 2. Oblicz prawdopodobieństwo zdarzenia, że w ciągu roku w tym rejonie (a) wystąpią 3 huragany, (b) będzie co najmniej 1 huragan, (c) nie będzie huraganu. Niech zmienna losowa X oznacza liczbę huraganów. (a) Rozw. P X=3=p3 ;2= e−2 ⋅23 4 = ≈0,1804 3! 3 ⋅e2 Sprawdzenie w R: > dpois(3,2) [1] 0.1804470 (b) Rozw. e−2 ⋅20 1 P X0=1 −P X=0=1 −p0 ;2=1− =1− 2 ≈0,8647 0! e Sprawdzenie w R: > ppois(0, 2, lower.tail = FALSE) [1] 0.8646647 (c) Rozw. e−2 ⋅20 1 P X=0=p0 ;2= = 2 ≈0,1353 0! e Sprawdzenie w R: > dpois(0,2) [1] 0.1353353 Zadanie 4 Liczba zamówień na usługi informatyczne, które otrzymuje w ciągu miesiąca pewna firma komputerowa jest zmienną losową o rozkładzie Poissona ze średnią 49. Korzystając z przybliżenia rozkładem normalnym oblicz przybliżone prawdopodobieństwo, że firma otrzyma w ciągu miesiąca (a) co najmniej 40 zamówień, (b) mniej niż 55 zamówień. Niech zmienna losowa X oznacza liczbę zamówień. (a) Rozw. P X39=P X−49 39 −49 10 10 10 ≈P Z− =1−P Z≤− =1 − − 7 7 7 49 49 10 10 P X39≈1 − 1 − = ≈0,9222 7 7 Ostatnia wartość wzięta z tablic w książce KM. . (b) Rozw. X−49 54 −49 5 5 ≤ ≈P Z≤ = ≈0,7611 . Ostatnia wartość 7 7 49 49 wzięta z tablic w książce KM. P X≤54=P Sprawdzenie w R: Pomocniczy program zadania5_4.R: print("prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca co najmniej 40 zamowien:") print("wg rozkladu Poissona:") print(ppois(39, 49, lower.tail = FALSE)) print("wg rozkladu normalnego:") print(pnorm(39, 49, sqrt(49), lower.tail = FALSE)) print("prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca mniej niz 55 zamowien:") print("wg rozkladu Poissona:") print(ppois(54, 49, lower.tail = TRUE)) print("wg rozkladu normalnego:") print(pnorm(54, 49, sqrt(49), lower.tail = TRUE)) Wynik działania: > source("zadania5_4.R") [1] "prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca co najmniej 40 zamowien:" [1] "wg rozkladu Poissona:" [1] 0.9162444 [1] "wg rozkladu normalnego:" [1] 0.9234363 [1] "prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca mniej niz 55 zamowien:" [1] "wg rozkladu Poissona:" [1] 0.7867218 [1] "wg rozkladu normalnego:" [1] 0.7624747