Zapisz jako PDF

Transkrypt

Zapisz jako PDF
Wnioskowanie_Statystyczne_-_wykład
Rozkład Studenta
W poprzednim rozdziale rozważaliśmy rzadki w praktyce przypadek, w którym dokładną postać
rozkładu, któremu podlega statystyka testowa, mogliśmy uznać za znaną.[1] W praktyce częściej
zdarza się sytuacja, w której informacje musimy czerpać bezpośrednio z testowanych danych.
Załóżmy, że nie mamy możliwości niezależnej oceny rozrzutu prawidłowych wyników, ale za to każdy
student przynosi wyniki kilku ( ) pomiarów. Na podstawie tej próby możemy estymować wariancję
wyników dla danego układu, czyli populacji wszystkich możliwych wyników. Według wzorów na
estymator wartości oczekiwanej (wartość średnią) i estymator wariancji wartości średniej jej
estymatą będzie:
a estymatą wariancji wartości średniej próby
Jaką funkcję wybrać na statystykę testową? Tak jak poprzednio zakładamy, że wyniki pochodzą z
rozkładu normalnego o średniej równej tablicowej wartości przyspieszenia ziemskiego (9,81), jednak
nie znamy jego wariancji.
Jako miarę rozbieżności możemy wybrać ponownie różnicę między wartością oczekiwaną według
hipotezy zerowej i wartością otrzymaną w wyniku eksperymentu (w tym przypadku weźmiemy
średnią otrzymanych wyników), ale podzieloną tym razem przez estymowaną wariancję wartości
średniej próby. W poprzednim przypadku wariancję populacji prawidłowo przeprowadzanych
eksperymentów uznaliśmy za znaną, np. wyznaczoną w niezależnie przeprowadzonym
eksperymencie. Tym razem wariancję będziemy estymować z tej samej próby, która podlega ocenie
w przeprowadzanym teście.
Przypomnijmy, że gdy dysponujemy "prawdziwą" wartością wariancji, transformacja zmiennej
losowej pochodzącej z rozkładu Gaussa o średniej i wariancji
daje zmienną ze standardowego rozkładu Gaussa o
i
. Jednak jeśli w miejsce wariancji
wartości średniej wstawimy jej estymatę, dostaniemy zmienną :
Przy założeniu normalnego rozkładu populacji, z której losowano
Studenta[3] o
gdzie
— funkcja Eulera;
, zmienna podlega[2] rozkładowi
stopniach swobody[4]:
;
dla
Cóż, nie udało się "dojść" do rozkładu Gaussa, ale rozkład dany równaniem (2) możemy równie
dobrze wykorzystywać do weryfikacji hipotez, używając wciąż tego samego schematu. Statystykę
testową będziemy obliczać według wzoru (1), a obszar akceptacji testu dla tej statystyki będziemy
wyznaczać z rozkładu danego równaniem (2).
Mimo zupełnie różnego wzoru, rozkład Studenta dla dużej liczby stopni swobody
asymptotycznie do rozkładu Gaussa; zbieżność tę ilustruje rysunek (1).
Rozkład Studenta (linia ciągła) dla różnej liczby stopni
swobody . Na każdym rysunku w tej samej skali linią
przerywaną narysowano standardowy rozkład Gaussa.
dąży
Test (Studenta) różnicy średnich
W praktyce najczęściej występuje sytuacja, w której nie znamy żadnego z parametrów rozkładów
określających hipotezę zerową. Wprowadzony w poprzednim rozdziale rozkład Studenta najczęściej
wykorzystujemy w sytuacji, gdy mamy dwie próby (grupy wyników) i pytamy, czy pochodzą z tej
samej populacji. Wartości średnie prób oznaczymy
i , a ich wariancje, zgodnie ze wzorem na
estymator wariancji, estymujemy przez
dla
lub . Estymatą wariancji populacji
(jeśli próby pochodzą z jednej populacji) będzie suma
kwadratów odchyleń od średniej w każdej próbie, czyli
, podzielona przez liczbę stopni
swobody, czyli sumę liczb elementów w obu próbach minus dwa, gdyż wyliczamy dwie średnie w
próbach:
Przy założeniu losowania obu grup z tej samej populacji, wariancje średnich będą wynosić
(według wzoru na estymator wariancji wartości średniej), więc estymatą wariancji różnicy wartości
średnich będzie suma tych wariancji:
Wielkość
podlega rozkładowi Studenta z liczbą stopni swobody
.
Ta właśnie statystyka liczona jest w popularnym teście różnicy wartości średnich dwóch grup (
). Do obliczania granic obszaru akceptacji użyjemy oczywiście wzoru (2)), któremu w świetle
hipotezy zerowej podlega wielkość z równania (3).
i
Podobnie jak inne testy parametryczne[5], wyprowadzony powyżej test podlega zasadniczemu
ograniczeniu. Otóż rozumowanie, które doprowadziło nas do wyprowadzenia postaci rozkładu
statystyki testowej opiera się na założeniu, że zmienne pochodzą z populacji o rozkładzie
gaussowskim. Jeśli nie jest ono spełnione,[6] różnica średnich nie będzie podlegać rozkładowi
Studenta. Nawet jeśli równość ta nie jest spełniona, to według wzoru (3) większa wartość
odpowiada większej różnicy średnich grup, niezależnie od rozkładu populacji, z której grupy
pochodzą. Jednak dla innych niż gaussowski rozkładów zmiennych wejściowych nie możemy obliczać
poziomów istotności według wzoru (2), który wyprowadzono w oparciu o założenie losowania prób z
rozkładu normalnego. Jeśli założenia nie będą spełnione, otrzymamy nieprawdziwe wyniki. Obliczony
w ten (błędny) sposób poziom istotności dla akceptacji hipotezy zerowej nie będzie odpowiadał
rzeczywistości, co może prowadzić np. do odrzucenia zamiast przyjęcia hipotezy.
Jest to podstawowy problem, z którym stykamy się używając testów statystycznych opartych o
założenie normalnego rozkładu populacji. Alternatywą są oczywiście opisane w części pierwszej testy
permutacyjne, lub — pozostając w ramach statystyki klasycznej — testy nieparametryczne. Jednak
jeśli założenie o normalności rozkładu jest spełnione (uzasadnione), test parametryczny oferuje
większą moc (dzięki wykorzystaniu dodatkowej informacji o rozkładzie).
Przykład
Zastosujmy test do danych z przykladu — przypomnijmy:
liczby braków w kolejnych dniach przed remontem lini produkcyjnej
wynosiły: 12, 9, 21, 14, 7 i 17, a po remoncie: 5, 9, 3, 11, 8, 19, 7,
5, 9, 12, 5, 11, 9, 6, 8, 17, 9 i 12. Pytamy, czy remont zmienił
średnią ilość braków na dzień.
Przede wszystkim zastanówmy się, czy w ogóle możemy zastosować do tych danych test ?
Musielibyśmy wtedy przyjąć odpowiedzialność za założenie, że dane pochodzą z populacji o
rozkładzie normalnym.[7] Jednak w tym przypadku trudno znaleźć a priori uzasadnienie dla takiego
założenia, a samych danych mamy za mało, żeby zastosować np. sprawdzian proponowany w
rozdziale o teście
Pearsona. Tak więc w przypadku braku dodatkowych informacji należy
stwierdzić, że nie ma wystarczającego uzasadnienia dla zastosowania testu i należy skorzystać np.
z testu permutacyjnego lub nieparametrycznego testu Manna-Whitney'a-Wilcoxona, który również
nie wymaga spełnienia założenia o normalności rozkładów.
Załóżmy jednak, że po przeprowadzeniu dodatkowych badań (tj. zebraniu większej ilości danych lub
badaniach istoty samego procesu) uzyskaliśmy wyniki uzasadniające przyjęcie założenia o
normalności.[8] Wtedy obliczona według wzoru (3). wartość statystyki wyniesie 2,0185. Porównywać
ją będziemy z rozkładem (wzór (2)) dla 22 stopni swobody, gdyż mamy 6+18 liczb i dwa więzy
(średnie w dwóch grupach). Wartość krytyczna poziomu istotności dla testu jednostronnego
(testujemy hipotezę o zmniejszeniu liczby braków) wyniesie 2,8%, czyli na poziomie istotności 5%
morzemy odrzucić hipotezę o braku różnic między grupami, co sugeruje istotne zmniejszenie liczby
braków po remoncie.
Zwróćmy uwagę, że zastosowany dla tych samych danych test permutacyjny dał tę samą odpowiedź,
jednak przy większej wartości krytycznej poziomu istotności (3,8%). Świadczy to o większej mocy
(por. rys 3 z poprzedniego rozdziału) testu ( ) opartego na dodatkowych założeniach, czyli
wykorzystującego więcej informacji (znajomość postaci rozkładu).
1. ↑ Założyliśmy postać rozkładu normalnego i oba określające go parametry — wariancję
średnią .
i
2. ↑ Dowód tego faktu można znaleźć w książce "Probabilistyka. Rachunek Prawdopodobieństwa.
Statystyka matematyczna. Procesy stochastyczne" Agnieszki i Edmunda Plucińskich.
3. ↑ Rozkład ten wprowadził do statystyki w roku 1908 William S. Gosset — chemik z browaru
Guinessa, posługujący się pseudonimem "Student".
4. ↑ Liczba stopni swobody to w skrócie liczba zmiennych niezależnych pomniejszona o liczbę
wyznaczanych na ich podstawie wielkości; w tym przypadku mamy
zmiennych i korzystamy
z wyznaczonej na ich podstawie jednej wielkości — wartości średniej , czyli
.
5. ↑ Czyli oparte na założeniu normalności rozkładu populacji, z których pochodzą badane próby.
6. ↑ W tym przypadku dodatkowym wymogiem jest równość (w praktyce podobna wartość)
wariancji obu prób — założyliśmy ją wyprowadzając statystykę testową.
7. ↑ Oraz o równości wariancji, lecz w tym przypadku wydają się one wystarczająco podobne.
8. ↑ W przypadku danych określających liczby zliczeń bardziej uzasadnione będzie zwykle
założenie rozkładu Poissona. Jednak dla dużych wartości parametru rozkład Poissona
przechodzi w rozkład Gaussa — załóżmy, że mamy do czynienia właśnie z takim przypadkiem.