DWA RODZAJE TESTÓW STATYSTYCZNYCH
Transkrypt
DWA RODZAJE TESTÓW STATYSTYCZNYCH
Weryfikacja hipotez statystycznych 8 95 8. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH – DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI 8.1. Rodzaje testów oraz etapy badań statystycznych Badanie interesującej nas cechy statystycznej populacji generalnej może się odbywać w dwóch różnych sytuacjach: znanego oraz nieznanego rozkładu prawdopodobieństwa. W pierwszym przypadku szukamy tylko wartości pewnych parametrów rozkładu i konieczne są odpowiednie testy parametryczne. W drugim przypadku, gdy poszukiwany jest rozkład prawdopodobieństwa, konieczne są testy zgodności rozkładów prawdopodobieństwa. Jak już niejednokrotnie podkreślano badanie każdej cechy statystycznej odbywa się w dwóch etapach: stawianie hipotezy statystycznej na podstawie zebranego materiału statystycznego, a następnie zebranie nowego, niezależnego materiału statystycznego dla przeprowadzenia sprawdzenia, a więc testu-weryfikacji postawionej hipotezy statystycznej. Wykorzystywanie tego samego materiału statystycznego do formułowania i weryfikowania hipotezy jest niedopuszczalne, bowiem nie powinno nam zależeć na jak najszybszym przyjęciu każdej hipotezy, jak to czasem bywa podczas testowania, gdy testującemu, w gruncie rzeczy, nie zależy na obiektywnej prawdzie statystycznej, a zależy na przemyceniu pewnych hipotez statystycznych, które uważa za pożyteczne. Są to niestety sytuacje manipulowania materiałem statystycznym dla uzyskania z góry założonego rezultatu badań statystycznych. W zdrowej sytuacji praktycznej, nie powinno się z góry nigdy niczego zakładać i odrzucanie hipotezy powinno występować jeszcze częściej, niż przyjmowanie. A więc normalna sytuacja praktyczna to taka, w której badający poszukuje obiektywnej prawdy statystycznej i nie jest zainteresowany jakimś z góry określonym wynikiem badań. Tak więc postawiona hipoteza statystyczna, aby można ją traktować jako sprawdzoną hipotezę, musi również być potwierdzona przez niezależny materiał statystyczny. Jest to podstawowy kanon sztuki statystycznej. Co zatem robić, gdy nie możemy, ze względów kosztowych lub technicznych, zebrać niezależnego materiału weryfikacyjnego? Należy losowo (nie tendencyjnie) podzielić zebrany materiał na Weryfikacja hipotez statystycznych 8 96 dwie części: jedną do stawiania, a drugą do weryfikacji badanej hipotezy, na przykład za pomocą generatora liczb pseudolosowych lub tablic statystycznych. Drugim kanonem sztuki statystycznej jest specyficzny język określający badane hipotezy statystyczne, który powinien nam uświadamiać, że nasze wnioski z przeprowadzonych badań mają bardzo specyficzny, warunkowy charakter, co pozwala nam na ostrożne formułowanie ogólnych wniosków płynących z badań statystycznych. W języku potocznym nie stosuje się na ogół tak ostrożnego wyrażania sądów ogólnych, jakim są zweryfikowane hipotezy statystyczne. Język wniosków z weryfikacji hipotez statystycznych wyraża tę niepewną sytuację, jaką jest nasza znajomość badanej rzeczywistości. Trzecim kanonem sztuki statystycznej jest bardzo duża ostrożność podczas zbierania i przetwarzania danych statystycznych. Dzisiejsza technika obliczeniowa stwarza duże możliwości w zakresie obliczeń statystycznych. Z drugiej strony, stwarza również możliwości popełnienia błędów przenoszenia danych statystycznych, gdy uczestniczy w tym omylny, a czasem nieświadomie tendencyjny obserwator procesów transportowych. Łatwość stosowania narzędzi weryfikacji hipotez statystycznych w postaci programów komputerowych stwarza również możliwości wykorzystania przez użytkowników niewtajemniczonych w narzędzia statystyczne i ułatwia manipulację przez użytkowników zainteresowanych sfałszowaniem badań. Innymi słowy, dzisiejsza technika komputerowa w zakresie statystyki matematycznej obok wspaniałych możliwości obliczeniowych, stwarza również duże możliwości manipulacji statystycznej opatrzonej etykietą: badania naukowe. Poprzednio zajmowaliśmy się metodami najlepszego, w określonym sensie, oszacowania wartości nieznanych parametrów interesującej nas cechy elementów populacji generalnej. Obecnie zajmiemy się zupełnie innym zagadnieniem. Mianowicie, będziemy się starali dysponując informacjami z próbki, jak również czasami informacjami spoza próbki zaklasyfikować nieznany lub częściowo nieznany rozkład interesującej nas cechy elementów populacji do jednej z dwóch rozłącznych podklas. Mówiąc dokładniej, będziemy się starali odpowiedzieć na pytanie, do której z dwóch podklas pewnej klasy rozkładów należy wybrany z tej klasy rozkład. Dobrym wprowadzeniem do tej tematyki jest rozdział 5.11 książki Plucińskich (1990), który w dalszym ciągu przytacza się po małej zmianie terminologicznej. Wspomniane informacje spoza próbki mogą pozwolić na ograniczenie rozważań do pewnej rodziny rozkładów, np. normalnych, Poissona, gamma itp. Będziemy wtedy mówili, że znana jest postać rozkładu. Inne informacje mogą dotyczyć znajomości niektórych parametrów lub niezależności pewnych zdarzeń. Informacje tego typu pochodzą bądź z Weryfikacja hipotez statystycznych 8 97 poprzednio przeprowadzonych badań statystycznych, bądź wynikają w sposób oczywisty z charakteru czy własności elementów populacji. I tak na przykład, przyjmuje się na ogół, że błędy pomiarów, cechy elementów pochodzących z masowej produkcji mają rozkłady normalne. W tym przypadku informacja spoza próbki polega na znajomości rozkładu. Nieznane są natomiast parametry tego rozkładu i dlatego w tym przypadku możemy ograniczyć rozważania do klasy rozkładów normalnych o nieznanych parametrach. Przystępując do badań statystycznych w mniejszym lub większym stopniu nie znamy interesującej nas cechy X elementów populacji. Możemy jednak na ogół ustalić klasę P rozkładów, które mogą być brane pod uwagę jako ewentualne rozkłady cechy X. Może to być np. zbiór rozkładów normalnych o nieznanej wartości przeciętnej, zbiór rozkładów o ciągłej dystrybuancie, zbiór rozkładów, w których cecha X jest typu skokowego i przyjmuje wartości z pewnego skończonego przedziału itp. Jeśli elementy klasy P są wyznaczone przez podanie wartości parametru θ , gdzie θ może być wektor, to klasę P wygodnie jest zapisywać w postaci P = {Pθ :θ ∈Θ} . Zadaniem statystyka jest odpowiedź na pytanie: czy wskazany rozkład należący do klasy P może być uznany za rozkład cechy X? W najbliższych paragrafach będziemy się starali odpowiedzieć na powyższe pytania w różnych aspektach. Hipotezą statystyczną nazywamy każdy niepusty podzbiór klasy P. Hipotezą statystyczną jest na przykład wybranie z klasy P konkretnego rozkładu. Jeżeli hipoteza statystyczna polega na wyborze rozkładu PΘ ∈ P wskazanego przez podanie numerycznej wartości Θ 0 parametru Θ , to taką hipotezę nazywamy parametryczną. Używać będziemy przy tym zapisu H (Θ = Θ 0 ) . Klasę P nazywamy zbiorem możliwych (dopuszczalnych) hipotez. Ze zbioru wszystkich możliwych w danym zagadnieniu hipotez wyróżniamy, ze względu na aspekt praktyczny, tę hipotezę, która podlega weryfikacji. Tę wyróżnioną hipotezę nazywać będziemy hipotezą zerową i oznaczać symbolem H 0 . Wszystkie pozostałe hipotezy nazywać będziemy alternatywnymi i oznaczać symbolem H1 . Jeżeli hipoteza dotyczy nieznanej wartości parametru, to zbiór możliwych hipotez jest wyznaczany przez zbiór wszystkich możliwych wartości parametru. W dalszych rozważaniach Weryfikacja hipotez statystycznych 8 98 te dwa zbiory będziemy utożsamiać. Ten zbiór możliwych wartości parametru nazywamy przestrzenią parametrów i oznaczamy symbolem Θ. Przestrzeń parametrów Θ przedstawiamy w postaci sumy dwóch niepustych zbiorów rozłącznych H 0 i H1 = Θ − H 0 . Zbiór H 0 nazywamy hipotezą zerową, zbiór H1 hipotezą alternatywną. Jeżeli H 0 jest zbiorem jednoelementowym będziemy mówić że jest hipotezą prostą. Jeżeli H 0 jest zbiorem wieloelementowym będziemy mówić, że jest hipotezą złożoną. Podobnie o hipotezie alternatywnej mówić będziemy, że jest prosta lub złożona w zależności od tego czy H1 jest zbiorem jednoelementowym czy wieloelementowym. Zanim sprecyzujemy co znaczy z w e r y f i k o w a ć hipotezę H 0 rozważmy następujący przykład: PRZYKŁAD 8.1 (Plucińscy, 1990) Wyprodukowano nowy materiał izolacyjny używany w określonym rodzaju kondensatorów. Chcemy zbadać, czy nowy materiał jest bardziej wytrzymały na przebicie od dotychczas używanego. W tym celu przeprowadźmy następujące doświadczenie. Z bieżącej produkcji kondensatorów wybieramy losowo parę kondensatorów: jeden z dotychczas stosowanym izolatorem, drugi z nowym izolatorem. Włączamy je równocześnie w obwód i obserwujemy napięcia, przy których następują przebicia. Oznaczmy zaobserwowane napięcia przez x1 i y1 . Powtórzmy doświadczenie n razy. W wyniku obserwacji otrzymamy n par liczb (x 1 , y1 ) , ( x 2 , y 2 ) ,..., ( x n , y n ) . Opisana metoda postępowania gwarantuje jednakowe warunki przeprowadzania doświadczenia. Ponieważ kondensatory pobierane są z bieżącej produkcji, więc na ich jakość ma wpływ wiele czynników losowych, takich jak: grubość izolatora, odległość okładzin, wilgotność itp. Te czynniki losowe powodują, że zaobserwowane przez nas wartości x1 , x 2 ,..., x n będą różne w różnych doświadczeniach. To samo dotyczy wartości y1 , y 2 ,..., y n . Wspomniane czynniki losowe spowodują także, że w przypadku pobrania do badania innych n par kondensatorów otrzymamy inny układ zaobserwowanych wartości. W wyniku przeprowadzonego doświadczenia chcemy odpowiedzieć na pytanie, czy nowy izolator jest lepszy od starego. Weryfikacja hipotez statystycznych 8 99 Przyjmijmy, że na podstawie poprzednich badań wiemy, że x1 , x 2 ,..., x n są wartościami zmiennej losowej X o rozkładzie normalnym o znanej wariancji. Ze względu na identyczny proces produkcji analogiczne założenie możemy przyjąć o wartościach y1 , y 2 ,..., y n . Rozważmy różnice y1 − x1 = z1 , y 2 − x 2 = z 2 ,..., y n − x n = z n . Wartości z1 , z 2 ,..., z n możemy zaobserwować jako zaobserwowane wartości zmiennej losowej o rozkładzie normalnym o znanej wariancji σ 2 . Gdyby obydwa izolatory miały jednakową wytrzymałość na przebicie, wówczas z1 , z 2 ,..., z n byłyby zaobserwowanymi wartościami zmiennej losowej o rozkładzie normalnym N ( 0, σ ) . Wartość zn = 1 n ∑z n i =1 i byłaby wtedy zaobserwowaną wartością zmiennej losowej Z n o rozkładzie normalnym ( N 0, σ ) n . Gdybyśmy opisane doświadczenie powtarzali wielokrotnie, to w poszczególnych doświadczeniach otrzymać możemy różne wartości z n . Niektóre z nich mogą się dość znacznie różnić od zera. Oczywiście, im większą wartość z n zaobserwujemy, tym bardziej skłonni jesteśmy sądzić, że nowy izolator jest lepszy od starego. Ale niewielkie odchylenia wartości z n są nieuniknione ze względu na losowy charakter doświadczenia. Powstaje zasadnicze pytanie: jak duże odchylenia wartości z n od zera należy uważać za dopuszczalne odchylenia losowe, a jak duże za istotną wskazówkę, że nowy izolator jest lepszy od starego? Musimy przyjąć umownie jakąś granicę. Wybór tej umownej granicy uzasadniamy w sposób następujący. Wartość z n jest zaobserwowaną wartością zmiennej losowej Z n mającą rozkład normalny o nieznanej wartości oczekiwanej m i znanej wariancji σ 2 n . Stawiamy hipotezę dotyczącą nieznanej wartości parametru m. Mamy tu więc do czynienia z hipotezą Weryfikacja hipotez statystycznych 8 100 parametryczną. Przestrzenią parametrów jest tu zbiór {m: 0 ≤ m < ∞} . Wykluczamy możliwość, że nowy izolator jest gorszy od starego. Zbiór ten przedstawiamy w postaci sumy dwóch zbiorów rozłącznych {m: m = 0} ∪ {m: m > 0} . Pierwszy z nich będzie hipotezą zerową H 0 , drugi hipotezą alternatywną H1 . Hipoteza zerowa orzeka, że m = 0 , tzn. że obydwa izolatory mają tę samą wytrzymałość na przebicie. Jest to hipoteza wyróżniona ze zbioru możliwych hipotez wyłącznie ze względu na aspekt praktyczny. Jeżeli hipoteza H 0 jest prawdziwa, to zaobserwowanie dużych odchyleń wartości z n od zera jest zdarzeniem mało prawdopodobnym. Określenie takie jest mało precyzyjne. Dlatego też musimy ustalić, jakie prawdopodobieństwo w rozważanym przypadku uznamy za małe lub inaczej, zdarzenia o jakim prawdopodobieństwie uznajemy za przeczące hipotezie zerowej. Oznaczmy to prawdopodobieństwo przez α . Jako wspomnianą wyżej umowną granicę odchylenia wartości zaobserwowanej z n od hipotetycznej m = 0 przyjmijmy taką liczbę ε α , dla której Zn − 0 P > εα = α , σ n gdzie α jest znaną liczbą. Liczbę ε α odczytujemy z tablic rozkładu normalnego. Spełnienie warunku z n > εα σ n interpretujemy jako wystąpienie zdarzenia o małym prawdopodobieństwie (mniejszym od α ) i uznajemy za zaprzeczenie hipotezie zerowej, tzn. za zaprzeczenie zdania: obydwa izolatory mają tę samą wytrzymałość na przebicie, lub inaczej nieprawdą jest, że zmienna losowa Z n Weryfikacja hipotez statystycznych 8 101 ma rozkład normalny o wartości oczekiwanej m = 0 . Mówić wtedy będziemy: o d r z u c a m y hipotezę zerową H 0 . Jeżeli spełniona jest nierówność zn ≤ εα σ n , to będziemy uważać, że zaobserwowana wartość z n nie przeczy hipotezie zerowej, a więc możemy przyjąć, że obydwa izolatory mają tę samą wytrzymałość na przebicie lub inaczej, że zmienna losowa Z n ma rozkład normalny o wartości oczekiwanej m = 0 . Mówić wtedy będziemy: p r z y j m u j e m y hipotezę zerową H 0 . Zwroty „odrzucamy hipotezę zerową” i „przyjmujemy hipotezę zerową” są bardzo wygodne i przyjęte w literaturze statystycznej. Należy jednak przy tym pamiętać, że nie oznaczają one naszego całkowitego przekonania o nieprawdziwości czy prawdziwości hipotezy zerowej. Naszym zadaniem była jedynie odpowiedź na pytanie: czy na podstawie zaobserwowanych wartości zmiennej losowej Z n uznać, że rozkład zmiennej losowej Z n jest rozkładem normalnym o wartości oczekiwanej m = 0 czy też raczej o wartości m > 0 ? Przytoczony przykład upoważnia nas do stwierdzenia, że z formalnego punktu widzenia weryfikacja hipotez polega na określeniu na przestrzeni próbkowej funkcji, której wartościami jest jedno z dwóch orzeczeń: „przyjąć hipotezę zerową” lub „odrzucić hipotezę zerową”. Mówiąc bardziej poglądowo weryfikacja hipotezy zerowej polega na: 10 wyborze odpowiedniej statystyki U, której rozkład (dokładny lub asymptotyczny) jest znany, 2 0 ustaleniu zbioru W tych wartości statystyki U, których wystąpienie uważamy za zaprzeczenie hipotezy zerowej. Statystykę U nazywamy testem hipotezy H 0 przeciw hipotezie alternatywnej H1 , a zbiór W zbiorem krytycznym testu. W przykładzie 8.1 statystyką U była statystyka Z n , a zbiorem W zbiór σ ( x1 , y1 , x 2 , y 2 ,..., x n , y n ): z n > ε α . n Weryfikacja hipotez statystycznych 8 102 Prawdopodobieństwo ( ) P U ∈W H 0 = α , (8.1) tzn. prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona prawdziwa, nazywamy poziomem istotności testu. Wybór liczby α jest w zasadzie dość dowolny. W praktyce przyjmuje się na ogół jedną z liczb: 0.05, 0.02, 0.01, 0.001. Ustalając liczbę α należy przede wszystkim mieć na uwadze konsekwencje praktyczne, jakie się z tym wiążą. Testy służące do weryfikowania hipotez parametrycznych nazywamy testami parametrycznymi, testy służące do weryfikowania hipotez nieparametrycznvh - testami nieparametrycznymi lub testami zgodności. 8.2. Testy parametryczne W niniejszym rozdziale ograniczymy się do przedstawienia testów do weryfikacji hipotez dotyczących wartości oczekiwanej, wariancji, współczynnika korelacji i współczynnika regresji. 10 Weryfikacja hipotezy o wartości oczekiwanej przy znanym σ Niech cecha X elementów populacji ma rozkład normalny N ( m, σ ) , w którym σ jest znane. Pobrano n-elementową próbkę i zaobserwowano wartości x1 , x 2 ,..., x n . Przyjmując poziom istotności α chcemy zweryfikować hipotezę H 0 ( m = m0 ) przeciw hipotezie alternatywnej H1 ( m ≠ m0 ) . Wykorzystując fakt, że średnia arytmetyczna X n z n niezależnych ( zmiennych losowych o rozkładach normalnych N ( m, σ ) ma rozkład normalny N m, σ jako test przyjmujemy statystykę X n . Zbiorem krytycznym jest w tym przypadku zbiór ) n , Weryfikacja hipotez statystycznych 8 103 x n − m0 W = ( x1 , x 2 ,..., x n ): > εα , σ n (8.2) gdzie ε α wyznaczone jest z równości X n − m0 X n − m0 P ∈W H 0 = P > εα = α σ n σ n Zatem hipotezę H 0 odrzucamy, gdy x n − m0 > εα σ (8.3) n i przyjmujemy, gdy x n − m0 ≤ εα σ n . (8.4) PRZYKŁAD 8.2 (Plucińscy, 1990). Wiadomo, że dla oporników pochodzących z masowej produkcji odchylenie wartości rezystancji od wartości znamionowej ma rozkład normalny o znanym odchyleniu standardowym σ = 0.2 kΩ . Celem zweryfikowania hipotezy H 0 ( m = 0) , tzn. że wartość oczekiwana rezystancji jest równa wartości znamionowej (nie występują systematyczne odchylenia) pobrano próbkę o liczności n = 9 i otrzymano wyniki w kΩ . k 1 2 3 4 5 6 7 8 9 xk -1.8 0.9 -1.0 4.5 -3.5 1.9 2.7 -0.8 -2.0 ∑x k Przyjmujemy poziom istotności α = 0.05 . Z tablic statystycznych rozkładu normalnego odczytujemy, że εα = 1.96 . Zatem = 0.9 Weryfikacja hipotez statystycznych 8 104 σ εα n = 1.96 ⋅ 0.2 = 0.13 . 3 Uwzględniając, że x n = 0.1 otrzymujemy x n − m0 = 0.1 − 0 = 0.1 ≤ 0.13 . Ponieważ spełniona jest nierówność (8.4), więc hipotezę H 0 przyjmujemy na poziomie istotności α = 0.05 . 20 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a n e j w rozkładzie normalnym przy nieznanym σ Wiadomo, że cecha X elementów populacji ma rozkład normalny N ( m, σ ) , w którym m i σ są nieznane. Na podstawie n-elementowej próbki chcemy zweryfikować hipotezę H 0 ( m = m0 ) przeciw hipotezie alternatywnej H1 ( m ≠ m0 ) . Niech poziom istotności będzie α . Korzystając z twierdzenia o rozkładzie Studenta jako test przyjmiemy t u statystykę tn = X n − m0 Sn n − 1, o której wiemy, że ma rozkład niezależny od σ , a mianowicie, rozkład Studenta o n − 1 stopniach swobody. Zbiorem krytycznym jest zbiór { } W = ( x1 , x 2 ,..., x n ): t n > tα , gdzie tα jest wartością odczytaną z tablicy rozkładu Studenta spełniającą warunek X n − m0 P t n ∈W H 0 = P > tα = α . Sn ( ) Weryfikacja hipotez statystycznych 8 105 Hipotezę H 0 ( m = m0 ) odrzucamy, gdy sn x n − m0 > tα (8.5) n−1 i przyjmujemy, gdy sn x n − m0 ≤ tα n−1 . (8.6) PRZYKŁAD 8.3 (Plucińscy, 1990) Niech w warunkach przykładu 8.2 odchylenie standardowe σ będzie nieznane. Po sn2 = obliczeniu 1 9 26 2 xk − xn ) = ( ∑ 9 k =1 9 i odczytaniu tα = 2.306 z tablicy rozkładu Studenta otrzymujemy x n − m0 = 0.1 − 0 ≤ tα sn n−1 = 2.306 ⋅ 26 3 8 = 1.38 . Ponieważ jest spełniona nierówność (8.6), więc hipotezę H 0 ( m = m0 ) przyjmujemy. Porównując wyniki w przykładach 8.2 i 8.3 warto zwrócić uwagę na fakt, że nieznajomość σ , a więc posiadanie mniejszej ilości informacji, powoduje ostrożniejsze podejmowanie decyzji o przyjęciu hipotezy zerowej. 30 W e r y f i k a c j a h i p o t e z y o w a r i a n c j i w r o z k ł a d z i e n o r m a l n y m Wiemy, że cecha X elementów populacji ma rozkład normalny N ( m, σ ) o nieznanych parametrach m i σ . Na podstawie n-elementowej próbki chcemy zweryfikować hipotezę H 0 (σ 2 ≤ σ 02 ) , tzn. że wariancja nie przekracza pewnej liczby. Hipotezą alternatywną jest tu hipoteza H1 (σ 2 > σ 02 ) . Przyjmijmy poziom istotności α . Pamiętajmy, że statystyka nS n2 σ 2 ma rozkład chikwadrat o n − 1 stopniach swobody. Wykorzystamy tę statystykę jako test do weryfikacji hipotezy H 0 (σ 2 ≤ σ 02 ) . Zbiorem krytycznym będzie tu zbiór Weryfikacja hipotez statystycznych 8 106 nsn2 W = ( x1 , x 2 ,..., x n ): 2 > χ α2 , σ0 gdzie χα2 jest liczbą odczytaną z tablicy rozkładu chi-kwadrat, spełniającą warunek nS n2 nS n2 P 2 ∈W H 0 = P 2 > χα2 = α . σ0 σ0 Hipotezę H o (σ 2 ≤ σ 02 ) odrzucamy, gdy nsn2 σ 2 0 > χα2 (8.7) ≤ χ α2 . (8.8) i przyjmujemy, gdy nsn2 σ 2 0 PRZYKŁAD 8.4 (Plucińscy, 1990) Błąd pomiaru odległości za pomocą radaru ma rozkład normalny. Przeprowadzono 10 pomiarów tej samej odległości i otrzymano następujące wartości błędów (w km): k 1 2 3 4 5 6 7 8 9 10 x k 0.115 -0.25 0.18 -0.06 -0.12 0.01 -0.05 0.075 -0.15 -0.25 Σx k = −0.5 Przyjmując poziom istotności α = 0.02 zweryfikować hipotezę H 0 (σ 2 ≤ 0.0125) . Z danych liczbowych wynika, że x n = −0.05 , nsn2 = 0.29435 . Z tablicy rozkładu chi-kwadrat dla danych n i α , odczytujemy χα2 = 19.679 . Weryfikacja hipotez statystycznych 8 107 Zatem nsn2 σ 2 0 = 0.29435 = 23.448 > 19.679 . 0.0125 Oznacza to, że spełniona jest nierówność (8.7) i hipotezę H 0 (σ 2 ≤ 0.0125) należy odrzucić. 40 W e r y f i k a c j a h i p o t e z y o r ó w n o ś c i w a r t o ś c i oczekiwanych o rozkładach normalnych z jednakową nieznaną wariancją Dane są dwie populacje, w których cecha X ma odpowiednio rozkład normalny N ( m1 , σ ) i N ( m2 , σ ) , przy czym parametry m1 , m2 i σ są nieznane. Pobrano z obu populacji próbki o licznościach odpowiednio n1 i n2 i otrzymano następujące wyniki: x1 , x 2 ,..., x n dla próbki z pierwszej populacji i y1 , y 2 ,..., y n dla próbki z drugiej populacji. Przyjmując poziom istotności α chcemy zweryfikować hipotezę H 0 ( m1 = m2 ) przeciw hipotezie alternatywnej H1 (m1 ≠ m2 ) . Żadna z poznanych dotąd statystyk nie nadaje się do weryfikowania hipotezy H 0 . Dlatego wprowadzamy tu nową statystykę określoną wzorem T= X n1 − Yn2 n1 + n 2 n1 S n21 + n 2 S n22 n1 n 2 ( n1 + n 2 − 2 (8.9) ) Jeśli hipoteza H 0 jest prawdziwa, to statystyka T ma rozkład Studenta o n1 + n 2 − 2 stopniach swobody. Nie trudno to uzasadnić, jeżeli tylko (8.9) zapiszemy w nieco innej postaci, a mianowicie: (X T= n1 − Yn2 ) σ2 n1 + σ2 n2 1 n1 S n21 σ 2 + n 2 S n22 σ 2 n1 + n 2 − 2 [( ) ( (8.10) )] Weryfikacja hipotez statystycznych 8 108 Jeżeli hipoteza H 0 jest prawdziwa, to wobec niezależności zmiennych losowych X 1 , X 2 ,..., X n , Y1 , Y2 ,..., Yn i twierdzenia o rozkładzie chi-kwadrat, tak podany licznik i nawias kwadratowy w mianowniku wzoru (8.10) są niezależnymi zmiennymi losowymi o rozkładach odpowiednio N ( 0,1) i chi-kwadrat o n1 + n 2 − 2 stopniach swobody, a zatem w myśl definicji rozkładu Studenta zmienna losowa T ma rozkład Studenta o n1 + n 2 − 2 stopniach swobody. Statystykę T określoną wzorem (8.9) możemy wykorzystać jako test do weryfikacji hipotezy H 0 ( m1 = m2 ) . Przyjmijmy poziom istotności α . Zbiorem krytycznym jest tu zbiór x n1 − y n2 W = x1 , x 2 ,..., x 1 , y1 , y 2 ,..., y n2 : > tα , 2 2 n1 + n 2 n1 S n1 + n 2 S n2 ⋅ n1 n 2 n1 + n 2 − 2 ( ) gdzie tα jest liczbą odczytaną z tablicy rozkładu Studenta spełniającą warunek P(T ∈W H 0 ) = P( T > tα ) = α . Hipotezę H 0 o równości wartości oczekiwanych odrzucamy, gdy x n1 − y n2 2 2 n1 + n 2 n1 S n1 + n 2 S n2 ⋅ n1 n 2 n1 + n 2 − 2 > tα (8.11) ≤ tα . (8.12) i przyjmujemy, gdy x n1 − y n2 2 2 n1 + n 2 n1 S n1 + n 2 S n2 ⋅ n1 n 2 n1 + n 2 − 2 Weryfikacja hipotez statystycznych 8 109 PRZYKŁAD 8.5 (Plucińscy, 1990) Wałek główny samochodowej skrzynki biegów obrabiany jest na obrabiarce automatycznej. Rozkład średnic wałków jest rozkładem normalnym. W celu sprawdzenia, czy poziom nastawienia obrabiarki nie zmienia się w czasie pracy, pobrano dwie próbki wałków o licznościach 8 i 10 sztuk, jedną próbkę z produkcji przedpołudniowej, drugą z popołudniowej i otrzymano następujące dane dla długości średnic wałków (w mm): k xk 1 2 3 4 5 6 7 8 19.8 20.1 19.9 20.0 19.8 20.1 19.8 19.7 j 1 2 3 4 5 6 7 8 9 10 yk 19.9 20.2 20.0 20.3 20.1 19.8 20.1 19.9 19.8 19.9 Zakładamy, że zmiana warunków w ciągu odstępu czasu między pobieraniem próbek może wpłynąć tylko na średni rozmiar, a nie zmienia wariancji. Przyjmując poziom istotności α = 0.05 , zweryfikować hipotezę o niewystępowaniu zmian poziomu nastawienia obrabiarki w czasie. Z danych liczbowych znajdujemy x8 = 19.9 , s82 = 0.02 , y10 = 20.0 , s102 = 0.026 . Z tablic rozkładu Studenta dla α = 0.05 i 8+10-2=16 stopni swobody odczytujemy tα = 2.120 . Obliczając wartość statystyki (8.9) znajdujemy 19.9 − 20.0 8 + 10 − 2 = 137 . < 2.120 . 8 + 10 ( 016 . + 0.26) 8 ⋅ 10 Ponieważ spełniona jest nierówność (8.12) więc przyjmujemy hipotezę o niewystępowaniu zmian poziomu nastawienia obrabiarki. 50 W e r y f k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a n e j n a podstawie próbek o dużej liczebności Weryfikacja hipotez statystycznych 8 110 W punktach 10 − 4 0 niniejszego rozdziału zakładaliśmy, że znana jest postać badanej cechy populacji, nie przyjmowaliśmy żadnych założeń odnośnie do liczności próbki. Przy tak mocnym założeniu, jakim jest znajomość postaci rozkładu, założenie o liczności próbki nie było potrzebne. Rozważmy teraz przypadek, gdy postać rozkładu interesującej nas cechy elementów populacji jest nieznana. Aby móc zweryfikować hipotezę o nieznanej wartości oczekiwanej cechy X, musimy znać rozkład jakiejś statystyki, która może służyć za test. Tylko wtedy bowiem potrafimy zbudować zbiór krytyczny W. Nie znając rozkładu cechy X nie potrafimy znaleźć dokładnego rozkładu żadnej statystyki. Nie jest to jednak sytuacja bez wyjścia. Skorzystać przecież można ze znanych twierdzeń granicznych, np. z tw. Lindeberga-Ley’ego, które orzeka, że jeżeli n jest dostatecznie duże, a zmienne losowe X 1 , X 2 ,..., X n są niezależne o jednakowym rozkładzie, i n istnieją E ( X 1 ) = m oraz V ( X 1 ) = σ 2 , to zmienna losowa X n = (1 n)∑ X k ma rozkład w k =1 przybliżeniu normalny o parametrach m i σ n . Korzystając z innego twierdzenia możemy przyjąć, że σ 2 ≈ sn2 . Uwzględniając powyższe, dochodzimy do wniosku, że chcąc zweryfikować hipotezę H 0 (m = m0 ) przeciw hipotezie alternatywnej H1 (m ≠ m0 ) , gdy nie mamy żadnych informacji o postaci rozkładu cechy X w populacji, należy pobrać dostatecznie liczną próbkę (rzędu co najmniej kilku dziesiątek), a następnie jako test przyjąć statystykę X n . Zbiorem krytycznym będzie w tym przypadku zbiór x n − m0 W = ( x1 , x 2 ,..., x n ): sn n > εα , gdzie εα jest liczbą odczytaną z tablic rozkładu normalnego, spełniającą warunek X n − m0 P Sn n > εα = α . Weryfikacja hipotez statystycznych 8 111 Hipotezę H 0 (m = m0 ) odrzucamy, gdy x n − m0 sn n > εα (8.13) n ≤ εα . (8.14) i przyjmujemy, gdy x n − m0 sn PRZYKŁAD 8.6 (Plucińscy, 1990) Zużycie wody przez zakład przemysłowy podlega losowym wahaniom w kolejnych dniach. Na podstawie obserwacji n = 256 dni stwierdzono, że średnie dzienne zużycie wody wynosi x 256 = 102 hl , a średnie odchylenie kwadratowe 2 s256 = 64 hl 2 . Przyjmując poziom istotności α = 0.05 zweryfikować hipotezę H 0 (m0 = 100 hl ) , tzn. że średnie dzienne zużycie wody wynosi 100 hl, przeciw hipotezie alternatywnej H1 (m0 ≠ 100 hl ) . Z tablicy rozkładu normalnego dla α = 0.05 odczytamy εα = 1.96 . Z danych przykładu wynika, że x 256 − m0 s256 n= 102 − 100 256 = 4 > εα = 196 . . 8 Ponieważ spełniona jest nierówność (8.13), więc hipotezę H 0 odrzucamy. 112 Weryfikacja hipotez statystycznych 8 Problemy rozdziału 8 1. Rodzaje testów statystycznych. 2. Podstawowe kanony sztuki statystycznej. 3. Przestrzeń parametrów. 4. Hipotezy statystyczne 5. Zbiór krytyczny testu. 6. Poziom istotności testu. 7. Warunek odrzucenia hipotezy. 8. Warunek przyjęcia hipotezy. 9. Weryfikacja hipotezy o wartości oczekiwanej przy znanej wariancji. 10. Weryfikacja hipotezy o wartości oczekiwanej przy nieznanej wariancji. 11. Weryfikacja hipotezy o wariancji w rozkładzie normalnym. 12. Weryfikacja hipotezy o równości wartości oczekiwanych o rozkładach normalnych z jednakową nieznaną wariancją. 13. Weryfikacja hipotezy o wartości oczekiwanej na podstawie próbek o dużej liczebności.