Wstep do statystyki praktycznej Lista nr 10

Transkrypt

Wstep do statystyki praktycznej Lista nr 10
Wstȩp do statystyki praktycznej
Lista nr 10
Zadania pochodza̧ m.in. z “Statistics for the Life Sciences” M. L. Samuels, J. A.
Witmer, wyd. II, i ”Introduction to the Practice of Statistics”, D. S. More, G. P.
McCabe, wyd. IV.
1. Badaja̧c żyja̧ca̧ na wolności populacjȩ muszek Drosophila subobscura, badacze
umieścili pulapki w dwóch miejscach na terenie zalesionym i jednym na terenie otwartym. Liczba samców i samic zlapanych w cia̧gu jednego dnia jest
zestawiona w tabeli:
pleć
las I
samiec 89
samica 31
polożenie
las II teren otwarty
34
74
20
136
Zastosuj test chi-kwadrat na poziomie istotności α = 0.05 do weryfikacji
hipotezy, że stosunek liczby samców do liczby samic nie zależy od środowiska.
2. Porównujemy dzialanie dwóch leków lecza̧cych epilepsjȩ. 37 pacjentów losowo
podzielono na dwie grupy: 20 bralo valporate a 17 phenytoinȩ. W każdej z
obu grup bylo sześciu pacjentów, którzy w cia̧gu roku nie mieli ataku epilepsji.
Porównaj dzialanie obu lekarstw za pomoca̧ odpowiedniego testu chi-kwadrat
na poziomie istotności α = 0.1.
3. Rozważmy fikcyjna̧ populacjȩ myszy. Każda myszka może być czarna (C) lub
szara (S) i może mieć futro gladkie (G) lub “faluja̧ce” (F). Wyraź nastȩpuja̧ce
twierdzenia za pomoca̧ p-stw warunkowych.
a) Gladkie futro wystȩpuje czȩściej u myszek czarnych niż u szarych.
b) Gladkie futro czȩściej wystȩpuje u czarnych myszek niż futro faluja̧ce.
c) Gladkie futra sa̧ czȩściej czarne niż futra faluja̧ce.
d) Gladkie futra sa̧ czȩściej czarne niż szare.
e) Gladkie futra wystȩpuja̧ czȩściej niż faluja̧ce.
4. Przeprowadzono zrandomizowany eksperyment porównuja̧cy dwa zabiegi A
i B stosowane w leczeniu choroby wieńcowej. W tabeli zestawiono czȩstość
wystȩpowania bólu piersi piȩć lat po zabiegu:
ból
Tak
Nie
zabieg
A
B
111 74
402 441
a) Oszacuj P(Tak|A), P(Tak|B), P(A|Tak) i P(A|Nie).
b) Porównaj oba zabiegi za pomoca̧ odpowiedniego testu chi-kwadrat na
poziomie istotności α = 0.05.
5. Wiȩkszość salamander z gatunku P. cinereus ma czerwone paski, ale niektóre
osobniki sa̧ jednolicie czerwone. Przypuszcza siȩ, że formy czerwone powstaja̧
w wyniku naśladownictwa salamandry N. viridescens, która jest toksyczna
dla ptaków. Aby sprawdzić, czy formy czerwone sa̧ faktycznie lepiej przystosowane, 161 salamander w paski i 41 czerwonych wypuszczono w środowisku
zamieszkanym przez liczna̧ populacjȩ ptaków. Po dwóch godzinach przeliczono
salamandry i okazalo siȩ, że przeżylo 65 osobników w paski i 23 czerwone.
a) Czy dane potwierdzaja̧ hipotezȩ, że kolor czerwony daje wiȩksza̧ szansȩ
na przeżycie? Użyj poziomu istotności α = 0.05.
b) Wyznacz 95% przedzial ufności na różnicȩ p-stw przeżycia dla salamander
“pasiastych” i “czerwonych”.
6. Pochylanie siȩ wieży w Pizie (Wlochy) bylo szczególowo badane. Oto dane
opisuja̧ce jej stopniowe odchylanie siȩ od pionu:
Rok
Odchylenie
75
642
76
644
77
656
78
667
79
673
80
688
81 82
696 698
83
713
84
717
85
725
Legenda: 75 i 642 oznaczaja̧ rok 1975 i odchylenie wierzcholka wieży od pionu
o 2, 9642 metra.
(a) Narysuj wykres punktowy (scatterplot) dla tych danych.
(b) Oblicz prosta̧ regresji gdy x = 81, y = 693, 692, sx = 3, 894, sy = 36, 511,
r = 0, 994.
(c) Podaj 99% przedzial ufności dla średniego odchylenia na rok.
(d) Przetestuj hipotezȩ statystyczna̧ o wzroście odchylenia z czasem.
(e) Jaka czȩść zmienności odchylenia jest wyjaśniona przez uplyw czasu?
(f) Jakie inne czynniki/zmienne objaśniaja̧ce Twoim zdaniem mogly też mieć
wpyw na pochylanie siȩ wieży?
(g) Czy pochylenie wieży jest dodatnio skorelowane z liczba̧ mieszkańców
Wloch? Czy istnieje zwiazek przyczynowy?
(g) W 1918 roku odchylenie wynosilo 2, 9071 metra. Czy nasza linia regresji
dobrze przewiduje ten wynik? Skomentuj.
(h) Użyj oprogramowania i danych w tabelce, by zweryfikowac (a)-(e).
7. W wyniku analizy regresji dopasowano do danych prosta̧ ŷ = 25 + 2x.
(a) Wyznacz przewidywana̧ wartość y dla x = 15.
(b) Wyznacz wartość resztowa̧ odpowiadaja̧ca̧ punktowi x = 15 i y = 58.
8. Wyjaśnij różnicȩ miȩdzy dwoma równaniami:
Ŷ = b0 + b1 x,
Y = β0 + β1 x + .
9. Rozważmy model regresji linowej Y = 20 + 5x + , gdzie x jest mierzone w
stopniach Fahrenheita. Wykorzystaj ten model do opisania zależności miȩdzy
Y a x? , gdzie x? jest temperatura̧ wyrażona̧ w stopniach Celsjusza.
M. i K. Bogdan
86
742
87
757