Elementarne metody statystyczne 8

Transkrypt

Elementarne metody statystyczne 8
Elementarne metody statystyczne 8
Wybrane testy nieparametryczne
Test Kruskalla-Wallisa
Test ten służy do weryfikacji hipotezy H0 o równości rozkładów pewnej cechy X typu
ciągłego w k różnych populacjach. Weryfikację przeprowadza się na podstawie pobranych prób
losowych o licznościach n1 , n2 , ..., nk odpowiednio za pomocą następującej statystyki:
h
i2
k 12 R − ni (n+1)
X
i
2
2
χ =
i=1 ni (n − ni )(n + 1)
H0
∼ χ2k−1 ,
k > 3.
W szczególnym przypadku, gdy k = 3, korzystamy z następującej statystyki:
χ2 =
3
X
12
Ri2
∼ χ22 .
− 3(n + 1)
n(n + 1) i=1 ni
H0
Gdy n1 = n2 = ... = nk , wówczas stosujemy tzw. statystykę Friedmana postaci:
χ2 =
k
X
12
Ri2 − 3n1 (k + 1)
∼ χ2k−1 .
n1 k(k + 1) i=1
H0
We wszystkich powyższych statystykach symbol Ri oznacza sumę rang elementów uporządkowanej połączonej próby (ze wszystkich populacji) należących do i-tej populacji.
Test U Manna-Whitneya
Testem tym weryfikujemy hipotezę o równości rozkładów cechy X w dwóch populacjach.
Jeśli X1 , X2 , ..., Xn1 i Y1 , Y2 , ..., Yn2 są próbami losowymi pochodzącymi z obu populacji, wówczas statystyka testowa U oznacza liczbę takich par (i, j), dla których Yj − Xi > 0. W teście U
Manna-Whitneya dobre wyniki osiąga się przy n1 , n2 ­ 4 oraz n1 + n2 ­ 20.
Test Wilcoxona
Zastosowanie tego testu jest takie samo, jak testu U Manna-Whitneya. Statystykę testową
W stanowi suma rang obserwacji Y1 , Y2 , ..., Yn2 w uporządkowanej niemalejąco łącznej próbie
pochodzącej z obu populacji. Można pokazać, że:
1
EW = n2 (n1 + n2 + 1),
2
D2 W =
1
n1 n2 (n1 + n2 + 1),
12
−EW
a dla dużych n1 , n2 mamy P{ WDW
< x} ≈ Φ(x).
Można także wykazać następującą zależność: U = W − 12 n2 (n2 + 1).
Test Wilcoxona dla par obserwacji (dla zmiennych zależnych)
Weryfikacji podlega hipoteza o identyczności rozkładów badanej cechy X w dwóch różnych
warunkach dokonywania obserwacji, np. przed i po podaniu leku, przed i po eliminacji pewnego
czynnika itp. Statystyka testowa W + jest sumą rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim pomiędzy wynikami w pierwszej i drugiej próbie. Gdy cecha X
jest ciągła, wówczas rozkłąa statystyki W + nie zależy od rozkładu cechy X i ma własności:
EW
+
n(n + 1)
,
=
4
2
DW
+
n(n + 1)(2n + 1)
=
,
24
1
W + − EW +
P
< x ≈ Φ(x),
DW +
gdy n1 , n2 są duże.
Test van der Waerdena
Wykorzystujemy go do weryfikacji hipotezy o identyczności rozkładów cechy X w dwóch
populacjach. Elementy obu prób porządkujemy w jeden szereg wariacyjny niemalejący, nadając
im rangi. Niech Ri dla i = 1, ..., n1 będą rangami cechy X w pierwszej próbie. Statystyka
testowa ma postać:
n1
X
Ri
V =
Φ−1
.
n1 + n2 + 1
i=1
Można pokazać, że statystyka q
V
n1 n2
Q
n1 +n2 −1
, gdzie Q =
n1P
+n2 h
i=1
i2
Φ−1 ( n1 +ni 2 −1 )
ma asymptotyczny
rozkład N (0, 1).
1. Mamy następujące dane dotyczące wysokości sadzonek pewnej rośliny uzyskanych w 3 różnych warunkach termicznych (w cm):
Warunki I: 28.5, 28.7, 28.9, 29.1, 29.2, 29.4, 29.7, 29.9, 30.0, 30.1, 30.4, 30.5;
Warunki II: 27.6, 27.7, 28.0, 28.2, 28.4, 28.7, 29.0, 29.1, 29.2, 29.4, 29.6, 29.9, 30.2;
Warunki III: 25.4, 25.6, 25.7, 25.8, 25.9, 26.7, 26.8, 26.9, 27.0, 27.1, 27.2, 27.8, 27.9, 28.0, 28.4.
Czy na poziomie istotności α = 0.05 można uważać, że rozkład wysokości sadzonek jest identyczny we wszystkich populacjach ? Wykorzystaj test Kruskalla-Wallisa.
2. Dysponujemy danymi z 5 krajów, w których reprezentatywne grupy chorych poddano leczeniu pewnym lekiem przeciw chorobie X. Po 2 tygodniach przyjmowania leku poziom pewnego
czynnika w surowicy krwi wynosił:
Austria : 13.2, 13.3, 14.0, 15.1, 16.2, 16.4, 17.5, 18.0, 18.2, 18.6;
Belgia : 12.8, 12.9, 13.0, 13.2, 13.4, 13.6, 14.0, 14.2, 14.6, 14.7, 15.0, 15.4;
Chorwacja : 14.0, 14.0, 14.3, 14.5, 14.6, 14.8, 15.7, 16.8, 17.0, 17.2, 17.4;
Dania : 14.5, 14.6, 14.8, 15.0, 15.5, 15.6, 15.8, 16.0, 16.3, 16.5;
Francja : 14.7, 14.9, 15.3, 15.8, 16.2, 16.5, 16.8, 17.5, 18.8, 18.9, 19.2, 19.8.
Na poziomie istotności α = 0.01 zweryfikuj hipotezę o jednakowym rozkładzie badanej cechy
we wszystkich populacjach.
3. Mamy dane dotyczące zawartości witaminy C w dwóch gatunkach owoców, uzyskane na
podstawie prób losowych:
Gatunek I: 123, 130, 133, 134, 135, 140, 141, 141, 142, 149, 150, 153, 154;
Gatunek II: 120, 121, 129, 134, 135, 135, 139, 146, 147, 149, 152, 154, 158, 160, 161, 162.
Wykorzystaj test Wilcoxona i test U Manna-Whitneya do weryfikacji hipotezy o jednakowej
zawartości witaminy C w obu gatunkach owoców. Przyjmij α = 0.05.
4. Uzyskano następujące dane dotyczące poziomu cechy X w dwóch populacjach:
Próba I: 120, 121, 122, 123, 125, 126, 127, 127, 129, 130, 132, 137;
Próba II: 124, 125, 127, 129, 130, 131, 132, 132, 134, 135, 136, 136, 139, 142.
2
Testem Wilcoxona zweryfikuj hipotezę o identyczności rozkładów badanej cechy. Przyjmij α =
0.01.
5. Mamy dane dotyczące wysokości tętna mierzonego przed i w godzinę po wypiciu filiżanki
kawy pewnego gatunku:
(65, 69), (68, 76), (70, 73), (72, 86), (75, 88), (79, 80), (80, 69), (81, 79), (82, 83), (85, 80), (88, 105).
Testem Wilcoxona zweryfikuj hipotezę o braku wpływu kawy na wysokość tętna, przyjmując
poziom istotności równy 0.05.
6. Zbadano stopień koncentracji 20 losowo wybranych osób przed i po wypoczynku. Wyniki
odpowiedniego testu były następujące:
(90, 100), (87, 90), (80, 92), (78, 68), (70, 69), (69, 75), (66, 70), (60, 45), (59, 44), (56, 67).
Przyjmując α = 0.02 zweryfikuj hipotezę o jednakowym rozkładzie cechy w obu warunkach.
7. Wykorzystaj test van der Waerdena, by na poziomie istotności α = 0.05 zweryfikować hipotezę o identyczności rozkładu wzrostu osiemnastolatków w dwóch populacjach, jeśli dostępne
są następująće próby losowe:
Populacja I: 159, 162, 163, 165, 167, 169, 172, 177, 178, 180, 186, 188;
Populacja II: 158, 160, 168, 169, 174, 175, 176, 177, 186, 189, 190, 193, 194.
3

Podobne dokumenty