Test t-Studenta dla jednej średniej

Transkrypt

Test t-Studenta dla jednej średniej
Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a0 (a = a0 ).
Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest różna od określonej wartości a0 (a 6= a0 ).
Hipoteza alternatywna 2.: Średnia wartość zmiennej w populacji jest
mniejsza od określonej wartości a0 (a < a0 ).
Hipoteza alternatywna 3.: Średnia wartość zmiennej w populacji jest
większa od określonej wartości a0 (a > a0 ).
Założenia: Zmienna ma rozkład normalny o nieznanej wariancji σ 2 .
Statystyka testowa:
√ x̄ − a0
Tn = n
s
ma rozkład t-Studenta z n − 1 stopniami swobody (dla dużych n (n 30)
rozkład ten jest zbliżony do standardowego rozkładu normalnego).
n−1
Obszar krytyczny 1.: K = (−∞, −tn−1
1−α/2 ) ∪ (t1−α/2 , +∞)
n−1
Obszar krytyczny 2.: K = (−∞, −t1−α
)
n−1
Obszar krytyczny 3.: K = (t1−α , +∞)
gdzie tn−1
1−α jest kwantylem rzędu 1 − α rozkładu t-Studenta z n − 1 stopniami
swobody.
p-wartość 1.: α̃ = 2 (1 − F n−1 (|Tn |))
p-wartość 2. i 3.: α̃ = 1 − F n−1 (|Tn |)
gdzie F n−1 jest dystrybuantą rozkładu t-Studenta z n−1 stopniami swobody.
Uwagi:
• Ponieważ przy n → ∞, niezależnie od wyjściowego rozkładu badanej
zmiennej, statystyka Tn ma standardowy rozkład normalny i jest to
rozkład graniczny rozkładu t-Studenta, to test t-Studenta może być
stosowany dla zmiennych o dowolnym rozkładzie (dla którego istnieje
wariancja), jeśli tylko próba jest dość liczna (n 30 i rozkład jest
w przybliżeniu jednomodalny i symetryczny lub n 40, gdy rozkład
jest wyraźnie skośny [3], choć czasami podawany jest warunek n 25
[7]). W próbie nie powinny występować wartości odstające.
• W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która
przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1−p,
wartość średnia wynosi
EX = 1 · p + 0 · (1 − p) = p,
jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że testem t-Studenta można testować hipotezę dotyczącą odsetka elementów
1
populacji posiadających pewną własność. Zaleca się stosować ten test,
jeśli np̂ 5 i n(1 − p̂) 5 (gdzie p̂ oznacza prawdopodobieństwo obserwowane), czyli liczba elementów, które mają pewną własność i liczba
tych, które jej nie mają, wynoszą co najmniej 5. [3]
Test t-Studenta dla dwóch średnich i prób niezależnych
Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych
populacjach (a1 = a2 ).
Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych
populacjach (a1 6= a2 ).
Hipoteza alternatywna 2.: Średnia wartość zmiennej w pierwszej populacji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a1 < a2 ).
Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej populacji jest większa od średniej wartości zmiennej w drugiej populacji (a1 > a2 ).
Założenia: Zmienna ma w obu populacjach rozkład normalny o nieznanych
wariancjach.
a) Zmienna ma w obu populacjach rozkład normalny o nieznanych, ale równych wariancjach.
Statystyka testowa:
Tn = s
x¯1 − x¯2
(n1 − 1)s21 + (n2 − 1)s22 n1 + n2
·
n1 + n2 − 2
n1 n2
ma rozkład t-Studenta z n1 + n2 − 2 stopniami swobody.
n1 +n2 −2
n1 +n2 −2
) ∪ (t1−α/2
, +∞)
Obszar krytyczny 1.: K = (−∞, −t1−α/2
n1 +n2 −2
Obszar krytyczny 2.: K = (−∞, −t1−α
)
1 +n2 −2
Obszar krytyczny 3.: K = (tn1−α
, +∞)
1 +n2 −2
gdzie tn1−α
oznacza kwantyl rzędu 1 − α z rozkładu t-Studenta
z n1 + n2 − 2 stopniami swobody.
p-wartość 1.: α̃ = 2 (1 − F n1 +n2 −2 (|Tn |))
p-wartość 2. i 3.: α̃ = 1 − F n1 +n2 −2 (|Tn |)
gdzie F n1 +n2 −2 jest dystrybuantą rozkładu t-Studenta z n1 + n2 − 2 stopniami swobody.
2
b) Zmienna ma w obu populacjach rozkład normalny o nieznanych i różnych
wariancjach.
Statystyka testowa:
x¯1 − x¯2
Cn = s 2
s1
s2
+ 2
n1 n2
(statystyka Cochrana i Coxa).
1 ,n2
1 ,n2
Obszar krytyczny 1.: K = (−∞, −cn1−α/2
) ∪ (cn1−α/2
, +∞)
1 ,n2
Obszar krytyczny 2.: K = (−∞, −cn1−α
)
1 ,n2
Obszar krytyczny 3.: K = (cn1−α
, +∞)
gdzie
!
1 ,n2
cn1−α
≈
s21 n1 −1 s22 n2 −1
t
+ t1−α :
n1 1−α
n2
!
s21
s2
+ 2 .
n1 n2
Uwagi:
• Test t-Studenta dla dwóch średnich i prób niezależnych może być również używany w przypadku zmiennej, która nie posiada w badanych
populacjach rozkładu normalnego. Wymagana jest wówczas duża liczebność obu prób (co najmniej po 30 obserwacji), symetria i brak
obserwacji odstających.
• W idealnych warunkach obiekty powinny być losowo przypisane do dwóch
grup, tak aby każda różnica ich reakcji była wynikiem oddziaływania (lub
braku oddziaływania) tylko jednego czynnika. Nie jest tak w przypadku
porównywania średniego dochodu mężczyzn i kobiet. Płeć badanych nie
jest przypisywana losowo. W takich przypadkach należy zadbać o to,
żeby różnice innych czynników nie pomniejszały, ani nie powiększały,
znaczącej różnicy średnich. Na różnice średniego dochodu mogą mieć
także wpływ takie czynniki jak wykształcenie (a nie tylko płeć). [Pomoc
IBM SPSS Statistics]
Test t-Studenta dla dwóch średnich i prób zależnych
Hipoteza zerowa: Dwie zmienne zależne mają jednakowe średnie (inaczej:
różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią
równą 0).
Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej:
różnica D = X − Y odpowiadających sobie wartości zmiennych ma średnią
różną od 0).
3
Hipoteza alternatywna 2.: Pierwsza ze zmiennych ma średnią mniejszą
niż druga (inaczej: różnica D = X − Y odpowiadających sobie wartości
zmiennych ma średnią ujemną).
Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą
niż druga (inaczej: różnica D = X − Y odpowiadających sobie wartości
zmiennych ma średnią dodatnią).
Statystyka testowa:
d¯ √
n
Tn =
sd
ma rozkład t-Studenta z n − 1 stopniami swobody.
n−1
n−1
Obszar krytyczny 1.: K = (−∞, −t1−α/2
) ∪ (t1−α/2
, +∞)
n−1
Obszar krytyczny 2.: K = (−∞, −t1−α )
Obszar krytyczny 3.: K = (tn−1
1−α , +∞)
n−1
gdzie t1−α jest kwantylem rzędu 1 − α rozkładu t-Studenta z n − 1 stopniami
swobody.
p-wartość 1.: α̃ = 2 (1 − F n−1 (|Tn |))
p-wartość 2. i 3.: α̃ = 1 − F n−1 (|Tn |)
gdzie F n−1 jest dystrybuantą rozkładu t-Studenta z n−1 stopniami swobody.
Uwagi: Ponieważ test ten jest w praktyce testem t-Studenta dla jednej średniej (dla zmiennej D = X − Y ), to należy sprawdzić, czy różnica zmiennych
spełnia wymagania testu dla jednej średniej, tj. ma rozkład normalny lub
ma rozkład odbiegający od normalnego (ale bez wartości odstających), ale
liczebność próby jest odpowiednio duża.
Test chi-kwadrat zgodności
Założenia: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l1 , . . . , lk
z prawdopodobieństwami odpowiednio p1 , . . . , pk , które nie są znane.
Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdopodobieństwami p01 , . . . , p0k .
Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobieństwami niż zadane.
Statystyka testowa:
χ2 =
k
X
k
(ni − np0i )2
(ni − n0i )2 X
=
,
n0i
np0i
i=1
i=1
gdzie ni oznaczają liczebności obserwowane, n0i – oczekiwane, ma w przybliżeniu
rozkład chi-kwadrat z k − 1 stopniami swobody.
Obszar krytyczny: K = (uk−1
1−α , +∞),
4
gdzie uk−1
1−α oznacza kwantyl rzędu 1−α rozkładu chi-kwadrat z k−1 stopniami
swobody.
2
p-wartość: α̃ = 1 − Fχk−1
2 (χ ),
gdzie Fχk−1
jest dystrybuantą rozkładu chi-kwadrat z k − 1 stopniami swobo2
dy.
Uwagi:
• Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to parametry te wyznaczamy metodą największej wiarogodności, a liczbę
stopni swobody zmniejszamy o d.
• Statystyka χ2 ma tylko w przybliżeniu (asymptotycznie) rozkład chikwadrat. Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczalne, gdy np0i 5, i = 1, . . . , k, a za dobre, gdy np0i 10, i = 1, . . . , k.
Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przybliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch
kategorii 1 ¬ np0i < 5 [3]. Mało liczne kategorie można również łączyć
z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni
swobody.
• W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupujemy w k (10k ¬ n) klas. Prawdopodobieństwa teoretyczne wyliczamy
z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa
znalezienia się w klasie były równe 1/k, a liczebności teoretyczne były
co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma
rozkład o podanej dystrybuancie.
Łatwo zauważyć, że testowanie zgodności z zadanym rozkładem ciągłym
za pomocą testu chi-kwadrat jest przedsięwzięciem kontrowersyjnym,
ponieważ punktem wyjścia do konstrukcji testu jest świadoma utrata
informacji związana z koniecznością dokonania dyskretyzacji. Dlatego,
gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stosowania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i histogram sporządzony na jej podstawie przypomina gładki rozkład ciągły,
zastosowanie testu chi-kwadrat przestaje być ryzykowne. Inna sprawa,
że test ten może być jedynym dającym się zastosować w danej konkretnej sytuacji. Tak jest np. wtedy, gdy dane, którymi dysponujemy,
pochodzą wprawdzie z rozkładu ciągłego, ale są już zdyskretyzowane. [3,
str. 372]
• Jeśli założenia testu nie są spełnione, można wykonać tzw. test dokładny, który nie korzysta z rozkładu granicznego statystyki testowej tylko
z jej właściwego rozkładu.
5
Test chi-kwadrat niezależności
Hipoteza zerowa: Zmienne losowe X i Y są niezależne.
Hipoteza alternatywna: X i Y są zależne.
Założenia: Cechy X, Y są jakościowe (nominalne lub o wartościach uporządkowanych).
Statystyka testowa:
(nij − n0ij )2
,
χ =
n0ij
j=1 i=1
2
k X
r
X
gdzie
r — liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji),
k — liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji),
nij — liczba wystąpień w próbie par obserwacji (xi , yj ),
k
P
n0ij
=
n=
nij ·
j=1
r
P
i=1
n
k
r X
X
nij
,
nij .
i=1 j=1
Dla zmiennych X i Y przyjmujących tylko po 2 wartości stosuje się statystykę
(|nij − n0ij | − 1/2)2
χ =
,
n0ij
j=1 i=1
2
r
k X
X
co zawiera tzw. poprawkę Yatesa na ciągłość poprawiającą jakość przybliżenia. [6]
(r−1)(k−1)
Obszar krytyczny: K = (u1−α
, +∞),
(r−1)(k−1)
gdzie u1−α
jest kwantylem rzędu 1 − α rozkładu chi-kwadrat
z (r − 1)(k − 1) stopniami swobody.
(r−1)(k−1)
p-wartość: α̃ = 1 − Fχ2
(χ2 ),
(r−1)(k−1)
gdzie Fχ2
jest dystrybuantą rozkładu chi-kwadrat z (r − 1)(k − 1)
stopniami swobody.
Uwagi:
• Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki
testowej rozkładem chi-kwadrat stosujemy, gdy liczebności teoretyczne
prób w wierszach (kolumnach) są stosunkowo duże (n0ij 5).
6
• Gdy tablica kontyngencji ma rozmiar 2 × 2 i liczebności próby w wierszach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym
teście Fishera.
• W przypadku pary cech o uporządkowanych kategoriach test niezależności może okazać się zwodniczy. Może wówczas zajść potrzeba wprowadzenia odpowiedniej miary zależności między cechami.
– Miara gamma – miara zależności monotonicznej, dodatniej, gdy
γ > 0 i ujemnej, gdy γ < 0. Zasadniczo γ ∈ [−1, 1]. p-wartość podawana przy tym współczynniku dotyczy testu hipotezy zerowej
o niezależności zmiennych przy hipotezie alternatywnej orzekającej ich dodatnią (lub ujemną) zależność.
– d Sommersa i τ −b Kendalla – używane, gdy liczba par związanych
jest duża.
Test Kołmogorowa
Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F .
Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystrybuancie.
+
Statystyka testowa: Dn = max{D
, Dn− }
n
i
i − 1 gdzie Dn+ = max1¬i¬n − F (x(i) ), Dn− = max1¬i¬n F (x(i) ) −
n
n Obszar krytyczny: (dn (1 − α), 1]
odczytujemy z tablic kwantyli statystyki Kołmogorowa, jest to taka wartość,
dla której P (Dn dn (1 − α)) = α).
Uwagi:
• W przypadku danych zgrupowanych w klasy bierzemy pod uwagę prawy koniec każdej z klas i zamiast podanych statystyk wyznaczamy wartość maksymalną statystyki |Fn (xi )−F (xi )|, gdzie Fn jest dystrybuantą
empiryczną.
√
• Dla dużych prób (n > 100) używa się statystyki nDn , a obszar krytyczny wyznacza, używając kwantyli granicznego rozkładu Kołmogorowa.
• W przypadku testowania zgodności z rozkładem normalnym zaleca się
stosowanie testu Kołmogorowa z poziomem istotności Lillieforsa oraz
testu Shapiro-Wilka (najbardziej polecany dla prób o liczebności nieprzekraczającej 2000).
7
Test Wilcoxona znakowanych rang
Założenia: Dysponujemy ciągiem par obserwacji: (X1 , Y1 ), . . . , (Xn , Yn ). Pary zmiennych losowych są niezależne, natomiast Xi , Yi mogą być zależne. Definiujemy niezależne różnice Zi = Yi − Xi , i = 1 . . . , n. Każda zmienna Zi ,
i = 1, . . . , n pochodzi z tego samego rozkładu ciągłego o dystrybuancie Fi ,
symetrycznego względem wspólnej mediany θ (może być ona interpretowana
jako „efekt kuracji”).
Hipoteza zerowa: θ = 0 (brak „efektu kuracji”)
Hipoteza alternatywna 1.: θ 6= 0 (jest jakiś „efekt kuracji”).
Hipoteza alternatywna 2.: θ > 0 („efekt kuracji” jest dodatni).
Hipoteza alternatywna 3.: θ < 0 („efekt kuracji” jest ujemny).
Statystyka testowa: Jest to statystyka znakowanych rang Wilcoxona, czyli
suma rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim:
X
T+ =
r(|Zi |),
Zi >0
gdzie
r(|Zi |) — ranga |Zi |, i = 1, . . . , n, (r(Xi ) = j ∈ {1, . . .#, n} ⇐⇒ Xi = Xj:n ).
h
n(n + 1)
− w1−α/2 ∪ w1−α/2 , ∞ ,
Obszar krytyczny 1.: K = −∞,
2
Obszar krytyczny 2.: K = [w1−α , +∞)
#
n(n + 1)
− w1−α
Obszar krytyczny 3.: K = −∞,
2
gdzie wa jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona
(przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach).
Uwagi:
• Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą
dla testu t-Studenta w przypadku dwóch próbek dających się połączyć
w pary. Różnica między tymi testami jest taka, że test t-Studenta testuje równość średnich arytmetycznych, a test Wilcoxona testuje mediany.
Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może
być więc używany, gdy założenia testu t-Studenta nie są spełnione.
• Test dla jednej próby jest odpowiednikiem testu dla dwóch prób, w którym drugą z prób zastąpiono stałą równą wartości testowanej mediany.
• Jeżeli n jest duże (w praktyce dla n 25), stosuje się tzw. test asymptotyczny, tj. używa się statystyki testowej postaci
∗
T =q
T+ −
n(n+1)
4
n(n + 1)(2n + 1)/24
8
,
i obszarów krytycznych
i
h
Obszar krytyczny 1.: K = −∞, −z1−α/2 ∪ z1−α/2 , ∞
Obszar krytyczny 2.: K = [z1−α , +∞)
Obszar krytyczny 3.: K = (−∞, −z1−α ]
gdzie z1−α jest kwantylem rzędu 1−α standardowego rozkładu normalnego.
• W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli
grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie
w przypadku, gdy
1. n < 25
- odrzucamy wszystkie Zi takie, że Zi = 0 i odpowiednio zmniejszamy n,
- uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite),
- stosujemy test dokładny ze zmodyfikowanymi rangami;
2. n 25
- odrzucamy wszystkie Zi takie, że Zi = 0 i odpowiednio zmniejszamy n,
- uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite),
- stosujemy test asymptotyczny ze modyfikowaną statystyką testową T ∗ :
T+ −
T˜∗ = T ∗ = s
n(n+1)
4
n(n + 1)(2n + 1)/24 −
1
48
N
P
,
(t2j − 1)tj
j=1
gdzie:
N — liczba grup węzłów (również jednoelementowych),
tj — liczba węzłów w j-tej grupie, j = 1, . . . , N .
9
Bibliografia
[1] Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.: Statystyka w zadaniach. Część II: Statystyka matematyczna. Warszawa, Wydawnictwa Naukowo-Techniczne, 2001.
[2] Harnett D. L., Soni A. K.: Statistical Methods for Business and
Economics. Addison-Wesley Publishing Company, 1991.
[3] Koronacki J., Mielniczuk J.: Statystyka dla studentów kierunków
technicznych i przyrodniczych. Warszawa, WNT, 2006.
[4] Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M.: Rachunek prawdopodobieństwa i statystyka matematyczna
w zadaniach. Część II: Statystyka matematyczna. Warszawa, PWN, wyd.
VIII, 2006.
[5] Plucińska A., Pluciński E.: Probabilistyka. Warszawa, Wydawnictwa Naukowo-Techniczne, 2000.
[6] Rees D.G.: Essential Statistics. London, Chapman&Hall, 1995.
[7] Sheskin D.J.: Handbook of Parametric and Nonparametric Statistical
Procedures. Boca Raton, Chapman&Hall/CRC, 2000.
10

Test t-Studenta dla jednej średniej

Transkrypt

Podobne dokumenty

Statystyka i eksploracja danych

Testy statystyczne — teoria

Starcraft II: punkt krytyczny już 22 lutego!

STATYSTYKA NIELEGALNA ADOPCJA (ART.211A)

statystyka eutanazja (art. 150)

statystyka kazirodztwo (art. 201)

Testowanie hipotez

R. 11 Krytyczne spojrzenie na Nurt Krytyczny Wprowadzenie

Słowniczek pojęć statystycznych

Statystyka opisowa - Wydział Geologii UW