Statystyczna Analiza Danych

Transkrypt

Statystyczna Analiza Danych
Statystyczna Analiza Danych - Zadania 5
Aleksander Adamowski (s1869)
Zadanie 1
Liczba nie zdanych egzaminów w ciągu semestru przez losowo
wybranego studenta pewnej uczelni jest zmienną losową X o funkcji
prawdopodobieństwa danej tabelą
x
0
1
2
p(x)
0, 7
0,25
0,05
(a) Oblicz wartość średnią i wariancję liczby nie zdanych egzaminów
przez studenta tej uczelni.
(b) Oblicz prawdopodobieństwo warunkowe, że losowo wybrany
student nie zda 2 egzaminów, jeśli wiadomo, że nie zdał co najmniej
jednego egzaminu.
(a)
Rozw. Wartość średnia:
 X =0 ⋅0,7 1 ⋅0,25 2 ⋅0,05 =0,35
Sprawdzenie w R:
> wartosci<-c(0,1,2)
> prawdopodobienstwa<-c(0.8,0.25,0.05)
> weighted.mean(wartosci, prawdopodobienstwa)
[1] 0.35
Wariancja:
 2X =0−0,352 ⋅0,7 1−0,352 ⋅0,25 2−0,352 ⋅0,05 =0,3275
Sprawdzenie w R:
> sum(((wartosci-weighted.mean(wartosci, prawdopodobienstwa))^2)
*prawdopodobienstwa)
[1] 0.3275
(b)
Rozw. Niech A oznacza nie zdanie 2 egzaminów, B oznacza nie zdanie co
najmniej jednego egzaminu.
P(A) = 0,05
P(B) = 0,25 + 0,05 = 0,3
P  A∩B=0,05
P  A∣B=
P  A∩B 0,05
=
≈0,1667
P B
0,3
Zadanie 2
Firma zakupiła 4 nowe monitory tej samej marki.
Prawdopodobieństwo, że monitor tej marki ulegnie awarii w okresie
gwarancji wynosi 0,05. Oblicz prawdopodobieństwo, że
(a) dwa monitory ulegną awarii w okresie gwarancji,
(b) nie wszystkie monitory ulegną awarii w okresie gwarancji,
(c) co najmniej jeden monitor ulegnie awarii w okresie gwarancji.
Jaka jest wartość średnia i wariancja liczby komputerów, które ulegną
awarii w okresie gwarancji?
(a)
Rozw. Niech zmienna losowa X oznacza liczbę monitorów, które uległy awarii.
Zmienna ma rozkład dwumianowy z n = 4 i p = 0,05.

2
2
4
Zatem P  X=2=b2 ;4, 0 ,05= ⋅0,05 ⋅0,95 =0,0135375
2
(b)
Rozw.
P  X4=b0 ;4, 0 ,05b1 ;4, 0 ,05b2 ;4, 0 ,05b3 ; 4, 0 ,05
P  X4= 4 ⋅0,050 ⋅0,95 4  4 ⋅0,051 ⋅0,95 3  4 ⋅0,052 ⋅0,95 2  4 ⋅0,053 ⋅0,95
0
1
2
3
P  X4=0,9999937




1
(c)
Rozw.
P  X1=1−b0 ;4, 0 ,05
0
4
P  X1=1− 4 ⋅0,1 ⋅0,9 =0,1854938
0

Wartość średnia i wariancja:
a) Obliczenie wszystkich wartości funkcji prawdopodobieństwa:





P  X=0=b0 ;4, 0 ,05= 4 ⋅0,10 ⋅0,9 4 =0,8145062
0
P  X=1=b1 ; 4, 0 ,05= 4 ⋅0,11 ⋅0,9 3 =0,171475
1
P  X=2=b2 ;4, 0 ,05= 4 ⋅0,12 ⋅0,9 2 =0,0135375
2
P  X=3=b3 ;4, 0 ,05= 4 ⋅0,13 ⋅0,9 1 =0,000475
3
P  X=4=b4 ; 4, 0 ,05= 4 ⋅0,14 ⋅0,9 0 =0,00000625
4
b) wartość średnia:
0 ⋅0,81450625 1 ⋅0,171475 2 ⋅0,0135375 3 ⋅0,000475 4 ⋅0,00000625 =0,2
c) wariancja:
2
2
2
2
2
0−0,2 ⋅0,81450625 1−0,2 ⋅0,171475 2−0,2 ⋅0,0135375 3−0,2 ⋅0,000475 4−0,2 ⋅0,00000625 =0,19
Sprawdzenie w R:
Pomocniczy program zadania5_2.R:
# Pomocnicza funkcja wyliczajaca b(k; n, p):
rDwumianFunkcjaP<-function(k, n, p) {
if(!missing(k) & !missing(n) & !missing(p)) {
return(choose(n,k)*p^k*(1-p)^(n-k))
}
return(NA);
}
options(digits=7)
num<-4
prob<-0.05
# Wyliczenia dla zadania nr. 2:
zad2X<-(0:4)
zad2Prawdopodobienstwa = sapply(zad2X, rDwumianFunkcjaP, n=num, p=prob)
print("Prawdopodobienstwa:")
print(zad2Prawdopodobienstwa)
# Czy prawdopodobienstwa sumuja sie do jednego?
print(paste("Prawdopodobienstwa sumuja sie do:", sum(zad2Prawdopodobienstwa)))
# Wartosc srednia:
# Wartosc srednia:
mi<-weighted.mean(zad2X, zad2Prawdopodobienstwa)
print(paste("Wartosc srednia:", mi))
# Wariancja:
war<-sum(((zad2X-mi)^2)*zad2Prawdopodobienstwa)
print(paste("Wariancja:", war))
Wynik działania:
> source("zadania5_2.R")
[1] "Prawdopodobienstwa:"
[1] 0.81450625 0.17147500 0.01353750 0.00047500 0.00000625
[1] "Prawdopodobienstwa sumuja sie do: 1"
[1] "Wartosc srednia: 0.2"
[1] "Wariancja: 0.19"
Zadanie 3
Liczba huraganów w ciągu roku w pewnym rejonie USA jest zmienną
losową o rozkładzie Poissona ze średnią 2. Oblicz
prawdopodobieństwo zdarzenia, że w ciągu roku w tym rejonie
(a) wystąpią 3 huragany,
(b) będzie co najmniej 1 huragan,
(c) nie będzie huraganu.
Niech zmienna losowa X oznacza liczbę huraganów.
(a)
Rozw.
P  X=3=p3 ;2=
e−2 ⋅23
4
=
≈0,1804
3!
3 ⋅e2
Sprawdzenie w R:
> dpois(3,2)
[1] 0.1804470
(b)
Rozw.
e−2 ⋅20
1
P  X0=1 −P  X=0=1 −p0 ;2=1−
=1− 2 ≈0,8647
0!
e
Sprawdzenie w R:
> ppois(0, 2, lower.tail = FALSE)
[1] 0.8646647
(c)
Rozw.
e−2 ⋅20 1
P  X=0=p0 ;2=
= 2 ≈0,1353
0!
e
Sprawdzenie w R:
> dpois(0,2)
[1] 0.1353353
Zadanie 4
Liczba zamówień na usługi informatyczne, które otrzymuje w ciągu
miesiąca pewna firma komputerowa jest zmienną losową o rozkładzie
Poissona ze średnią 49. Korzystając z przybliżenia rozkładem
normalnym oblicz przybliżone prawdopodobieństwo, że firma
otrzyma w ciągu miesiąca
(a) co najmniej 40 zamówień,
(b) mniej niż 55 zamówień.
Niech zmienna losowa X oznacza liczbę zamówień.
(a)
Rozw.
P  X39=P


 
X−49 39 −49
10
10
10

≈P  Z−
=1−P  Z≤−
=1 − −
7
7
7
49
 49
    
10
10
P  X39≈1 − 1 −
=
≈0,9222
7
7
Ostatnia wartość wzięta z tablic w książce KM.
.
(b)
Rozw.



X−49 54 −49
5
5
≤
≈P  Z≤ =
≈0,7611 . Ostatnia wartość
7
7
49
 49
wzięta z tablic w książce KM.
P  X≤54=P
Sprawdzenie w R:
Pomocniczy program zadania5_4.R:
print("prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca co najmniej 40
zamowien:")
print("wg rozkladu Poissona:")
print(ppois(39, 49, lower.tail = FALSE))
print("wg rozkladu normalnego:")
print(pnorm(39, 49, sqrt(49), lower.tail = FALSE))
print("prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca mniej niz 55
zamowien:")
print("wg rozkladu Poissona:")
print(ppois(54, 49, lower.tail = TRUE))
print("wg rozkladu normalnego:")
print(pnorm(54, 49, sqrt(49), lower.tail = TRUE))
Wynik działania:
> source("zadania5_4.R")
[1] "prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca co najmniej 40
zamowien:"
[1] "wg rozkladu Poissona:"
[1] 0.9162444
[1] "wg rozkladu normalnego:"
[1] 0.9234363
[1] "prawdopodobienstwo, ze firma otrzyma w ciagu miesiaca mniej niz 55
zamowien:"
[1] "wg rozkladu Poissona:"
[1] 0.7867218
[1] "wg rozkladu normalnego:"
[1] 0.7624747

Podobne dokumenty