Elementarne metody statystyczne 8
Transkrypt
Elementarne metody statystyczne 8
Elementarne metody statystyczne 8 Wybrane testy nieparametryczne Test Kruskalla-Wallisa Test ten służy do weryfikacji hipotezy H0 o równości rozkładów pewnej cechy X typu ciągłego w k różnych populacjach. Weryfikację przeprowadza się na podstawie pobranych prób losowych o licznościach n1 , n2 , ..., nk odpowiednio za pomocą następującej statystyki: h i2 k 12 R − ni (n+1) X i 2 2 χ = i=1 ni (n − ni )(n + 1) H0 ∼ χ2k−1 , k > 3. W szczególnym przypadku, gdy k = 3, korzystamy z następującej statystyki: χ2 = 3 X 12 Ri2 ∼ χ22 . − 3(n + 1) n(n + 1) i=1 ni H0 Gdy n1 = n2 = ... = nk , wówczas stosujemy tzw. statystykę Friedmana postaci: χ2 = k X 12 Ri2 − 3n1 (k + 1) ∼ χ2k−1 . n1 k(k + 1) i=1 H0 We wszystkich powyższych statystykach symbol Ri oznacza sumę rang elementów uporządkowanej połączonej próby (ze wszystkich populacji) należących do i-tej populacji. Test U Manna-Whitneya Testem tym weryfikujemy hipotezę o równości rozkładów cechy X w dwóch populacjach. Jeśli X1 , X2 , ..., Xn1 i Y1 , Y2 , ..., Yn2 są próbami losowymi pochodzącymi z obu populacji, wówczas statystyka testowa U oznacza liczbę takich par (i, j), dla których Yj − Xi > 0. W teście U Manna-Whitneya dobre wyniki osiąga się przy n1 , n2 4 oraz n1 + n2 20. Test Wilcoxona Zastosowanie tego testu jest takie samo, jak testu U Manna-Whitneya. Statystykę testową W stanowi suma rang obserwacji Y1 , Y2 , ..., Yn2 w uporządkowanej niemalejąco łącznej próbie pochodzącej z obu populacji. Można pokazać, że: 1 EW = n2 (n1 + n2 + 1), 2 D2 W = 1 n1 n2 (n1 + n2 + 1), 12 −EW a dla dużych n1 , n2 mamy P{ WDW < x} ≈ Φ(x). Można także wykazać następującą zależność: U = W − 12 n2 (n2 + 1). Test Wilcoxona dla par obserwacji (dla zmiennych zależnych) Weryfikacji podlega hipoteza o identyczności rozkładów badanej cechy X w dwóch różnych warunkach dokonywania obserwacji, np. przed i po podaniu leku, przed i po eliminacji pewnego czynnika itp. Statystyka testowa W + jest sumą rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim pomiędzy wynikami w pierwszej i drugiej próbie. Gdy cecha X jest ciągła, wówczas rozkłąa statystyki W + nie zależy od rozkładu cechy X i ma własności: EW + n(n + 1) , = 4 2 DW + n(n + 1)(2n + 1) = , 24 1 W + − EW + P < x ≈ Φ(x), DW + gdy n1 , n2 są duże. Test van der Waerdena Wykorzystujemy go do weryfikacji hipotezy o identyczności rozkładów cechy X w dwóch populacjach. Elementy obu prób porządkujemy w jeden szereg wariacyjny niemalejący, nadając im rangi. Niech Ri dla i = 1, ..., n1 będą rangami cechy X w pierwszej próbie. Statystyka testowa ma postać: n1 X Ri V = Φ−1 . n1 + n2 + 1 i=1 Można pokazać, że statystyka q V n1 n2 Q n1 +n2 −1 , gdzie Q = n1P +n2 h i=1 i2 Φ−1 ( n1 +ni 2 −1 ) ma asymptotyczny rozkład N (0, 1). 1. Mamy następujące dane dotyczące wysokości sadzonek pewnej rośliny uzyskanych w 3 różnych warunkach termicznych (w cm): Warunki I: 28.5, 28.7, 28.9, 29.1, 29.2, 29.4, 29.7, 29.9, 30.0, 30.1, 30.4, 30.5; Warunki II: 27.6, 27.7, 28.0, 28.2, 28.4, 28.7, 29.0, 29.1, 29.2, 29.4, 29.6, 29.9, 30.2; Warunki III: 25.4, 25.6, 25.7, 25.8, 25.9, 26.7, 26.8, 26.9, 27.0, 27.1, 27.2, 27.8, 27.9, 28.0, 28.4. Czy na poziomie istotności α = 0.05 można uważać, że rozkład wysokości sadzonek jest identyczny we wszystkich populacjach ? Wykorzystaj test Kruskalla-Wallisa. 2. Dysponujemy danymi z 5 krajów, w których reprezentatywne grupy chorych poddano leczeniu pewnym lekiem przeciw chorobie X. Po 2 tygodniach przyjmowania leku poziom pewnego czynnika w surowicy krwi wynosił: Austria : 13.2, 13.3, 14.0, 15.1, 16.2, 16.4, 17.5, 18.0, 18.2, 18.6; Belgia : 12.8, 12.9, 13.0, 13.2, 13.4, 13.6, 14.0, 14.2, 14.6, 14.7, 15.0, 15.4; Chorwacja : 14.0, 14.0, 14.3, 14.5, 14.6, 14.8, 15.7, 16.8, 17.0, 17.2, 17.4; Dania : 14.5, 14.6, 14.8, 15.0, 15.5, 15.6, 15.8, 16.0, 16.3, 16.5; Francja : 14.7, 14.9, 15.3, 15.8, 16.2, 16.5, 16.8, 17.5, 18.8, 18.9, 19.2, 19.8. Na poziomie istotności α = 0.01 zweryfikuj hipotezę o jednakowym rozkładzie badanej cechy we wszystkich populacjach. 3. Mamy dane dotyczące zawartości witaminy C w dwóch gatunkach owoców, uzyskane na podstawie prób losowych: Gatunek I: 123, 130, 133, 134, 135, 140, 141, 141, 142, 149, 150, 153, 154; Gatunek II: 120, 121, 129, 134, 135, 135, 139, 146, 147, 149, 152, 154, 158, 160, 161, 162. Wykorzystaj test Wilcoxona i test U Manna-Whitneya do weryfikacji hipotezy o jednakowej zawartości witaminy C w obu gatunkach owoców. Przyjmij α = 0.05. 4. Uzyskano następujące dane dotyczące poziomu cechy X w dwóch populacjach: Próba I: 120, 121, 122, 123, 125, 126, 127, 127, 129, 130, 132, 137; Próba II: 124, 125, 127, 129, 130, 131, 132, 132, 134, 135, 136, 136, 139, 142. 2 Testem Wilcoxona zweryfikuj hipotezę o identyczności rozkładów badanej cechy. Przyjmij α = 0.01. 5. Mamy dane dotyczące wysokości tętna mierzonego przed i w godzinę po wypiciu filiżanki kawy pewnego gatunku: (65, 69), (68, 76), (70, 73), (72, 86), (75, 88), (79, 80), (80, 69), (81, 79), (82, 83), (85, 80), (88, 105). Testem Wilcoxona zweryfikuj hipotezę o braku wpływu kawy na wysokość tętna, przyjmując poziom istotności równy 0.05. 6. Zbadano stopień koncentracji 20 losowo wybranych osób przed i po wypoczynku. Wyniki odpowiedniego testu były następujące: (90, 100), (87, 90), (80, 92), (78, 68), (70, 69), (69, 75), (66, 70), (60, 45), (59, 44), (56, 67). Przyjmując α = 0.02 zweryfikuj hipotezę o jednakowym rozkładzie cechy w obu warunkach. 7. Wykorzystaj test van der Waerdena, by na poziomie istotności α = 0.05 zweryfikować hipotezę o identyczności rozkładu wzrostu osiemnastolatków w dwóch populacjach, jeśli dostępne są następująće próby losowe: Populacja I: 159, 162, 163, 165, 167, 169, 172, 177, 178, 180, 186, 188; Populacja II: 158, 160, 168, 169, 174, 175, 176, 177, 186, 189, 190, 193, 194. 3