DWA RODZAJE TESTÓW STATYSTYCZNYCH

Transkrypt

Weryfikacja hipotez statystycznych 8
95
8. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH – DWA RODZAJE
TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI
8.1. Rodzaje testów oraz etapy badań statystycznych
Badanie interesującej nas cechy statystycznej populacji generalnej może się odbywać
w dwóch różnych sytuacjach: znanego oraz nieznanego rozkładu prawdopodobieństwa. W
pierwszym przypadku szukamy tylko wartości pewnych parametrów rozkładu i konieczne są
odpowiednie testy parametryczne. W drugim przypadku, gdy poszukiwany jest rozkład
prawdopodobieństwa, konieczne są testy zgodności rozkładów prawdopodobieństwa. Jak już
niejednokrotnie podkreślano badanie każdej cechy statystycznej odbywa się w dwóch etapach:
stawianie hipotezy statystycznej na podstawie zebranego materiału statystycznego, a następnie
zebranie nowego, niezależnego materiału statystycznego dla przeprowadzenia sprawdzenia, a
więc testu-weryfikacji postawionej hipotezy statystycznej. Wykorzystywanie tego samego
materiału statystycznego do formułowania i weryfikowania hipotezy jest niedopuszczalne,
bowiem nie powinno nam zależeć na jak najszybszym przyjęciu każdej hipotezy, jak to
czasem bywa podczas testowania, gdy testującemu, w
gruncie rzeczy, nie zależy na
obiektywnej prawdzie statystycznej, a zależy na przemyceniu pewnych hipotez statystycznych,
które uważa za pożyteczne. Są to niestety sytuacje manipulowania materiałem statystycznym
dla uzyskania z góry założonego rezultatu badań statystycznych. W zdrowej sytuacji
praktycznej, nie powinno się z góry nigdy niczego zakładać i odrzucanie hipotezy powinno
występować jeszcze częściej, niż przyjmowanie. A więc normalna sytuacja praktyczna to taka,
w której badający poszukuje obiektywnej prawdy statystycznej i nie jest zainteresowany
jakimś z góry określonym wynikiem badań. Tak więc postawiona hipoteza statystyczna, aby
można ją traktować jako sprawdzoną hipotezę, musi również być potwierdzona przez
niezależny materiał statystyczny. Jest to podstawowy kanon sztuki statystycznej. Co zatem
robić, gdy nie możemy, ze względów kosztowych lub technicznych, zebrać niezależnego
materiału weryfikacyjnego? Należy losowo (nie tendencyjnie) podzielić zebrany materiał na
96
dwie części: jedną do stawiania, a drugą do weryfikacji badanej hipotezy, na przykład za
pomocą generatora liczb pseudolosowych lub tablic statystycznych.
Drugim kanonem sztuki statystycznej jest specyficzny język określający badane
hipotezy
statystyczne,
który
powinien
nam
uświadamiać,
że
nasze
wnioski
z
przeprowadzonych badań mają bardzo specyficzny, warunkowy charakter, co pozwala nam na
ostrożne formułowanie ogólnych wniosków płynących z badań statystycznych. W języku
potocznym nie stosuje się na ogół tak ostrożnego wyrażania sądów ogólnych, jakim są
zweryfikowane hipotezy statystyczne. Język wniosków z weryfikacji hipotez statystycznych
wyraża tę niepewną sytuację, jaką jest nasza znajomość badanej rzeczywistości.
Trzecim kanonem sztuki statystycznej jest bardzo duża ostrożność podczas zbierania i
przetwarzania danych statystycznych. Dzisiejsza technika obliczeniowa stwarza duże
możliwości w zakresie obliczeń statystycznych. Z drugiej strony, stwarza również możliwości
popełnienia błędów przenoszenia danych statystycznych, gdy uczestniczy w tym omylny, a
czasem nieświadomie tendencyjny obserwator procesów transportowych. Łatwość stosowania
narzędzi weryfikacji hipotez statystycznych w postaci programów komputerowych stwarza
również możliwości wykorzystania przez użytkowników niewtajemniczonych w narzędzia
statystyczne i ułatwia manipulację przez użytkowników zainteresowanych sfałszowaniem
badań. Innymi słowy, dzisiejsza technika komputerowa w zakresie statystyki matematycznej
obok wspaniałych możliwości obliczeniowych, stwarza również duże możliwości manipulacji
statystycznej opatrzonej etykietą: badania naukowe.
Poprzednio zajmowaliśmy się metodami najlepszego, w określonym sensie,
oszacowania wartości nieznanych parametrów interesującej nas cechy elementów populacji
generalnej. Obecnie zajmiemy się zupełnie innym zagadnieniem. Mianowicie, będziemy się
starali dysponując informacjami z próbki, jak również czasami informacjami spoza próbki
zaklasyfikować nieznany lub częściowo nieznany rozkład interesującej nas cechy elementów
populacji do jednej z dwóch rozłącznych podklas. Mówiąc dokładniej, będziemy się starali
odpowiedzieć na pytanie, do której z dwóch podklas pewnej klasy rozkładów należy wybrany
z tej klasy rozkład. Dobrym wprowadzeniem do tej tematyki jest rozdział 5.11 książki
Plucińskich (1990), który w dalszym ciągu przytacza się po małej zmianie terminologicznej.
Wspomniane informacje spoza próbki mogą pozwolić na ograniczenie rozważań do
pewnej rodziny rozkładów, np. normalnych, Poissona, gamma itp. Będziemy wtedy mówili,
że znana jest postać rozkładu. Inne informacje mogą dotyczyć znajomości niektórych
parametrów lub niezależności pewnych zdarzeń. Informacje tego typu pochodzą bądź z
97
poprzednio przeprowadzonych badań statystycznych, bądź wynikają w sposób oczywisty z
charakteru czy własności elementów populacji. I tak na przykład, przyjmuje się na ogół, że
błędy pomiarów, cechy elementów pochodzących z masowej produkcji mają rozkłady
normalne. W tym przypadku informacja spoza próbki polega na znajomości rozkładu.
Nieznane są natomiast parametry tego rozkładu i dlatego w tym przypadku możemy
ograniczyć rozważania do klasy rozkładów normalnych o nieznanych parametrach.
Przystępując do badań statystycznych w mniejszym lub większym stopniu nie znamy
interesującej nas cechy X elementów populacji. Możemy jednak na ogół ustalić klasę P
rozkładów, które mogą być brane pod uwagę jako ewentualne rozkłady cechy X. Może to być
np. zbiór rozkładów normalnych o nieznanej wartości przeciętnej, zbiór rozkładów o ciągłej
dystrybuancie, zbiór rozkładów, w których cecha X jest typu skokowego i przyjmuje wartości
z pewnego skończonego przedziału itp. Jeśli elementy klasy P są wyznaczone przez podanie
wartości parametru θ , gdzie θ może być wektor, to klasę P wygodnie jest zapisywać w
postaci
P = {Pθ :θ ∈Θ} .
Zadaniem statystyka jest odpowiedź na pytanie: czy wskazany rozkład należący do
klasy P może być uznany za rozkład cechy X? W najbliższych paragrafach będziemy się
starali odpowiedzieć na powyższe pytania w różnych aspektach.
Hipotezą statystyczną nazywamy każdy niepusty podzbiór klasy P. Hipotezą
statystyczną jest na przykład wybranie z klasy P konkretnego rozkładu. Jeżeli hipoteza
statystyczna polega na wyborze rozkładu PΘ ∈ P wskazanego przez podanie numerycznej
wartości Θ 0 parametru Θ , to taką hipotezę nazywamy parametryczną. Używać będziemy
przy tym zapisu H (Θ = Θ 0 ) .
Klasę P nazywamy zbiorem możliwych (dopuszczalnych) hipotez.
Ze zbioru wszystkich możliwych w danym zagadnieniu hipotez wyróżniamy, ze
względu na aspekt praktyczny, tę hipotezę, która podlega weryfikacji. Tę wyróżnioną hipotezę
nazywać będziemy hipotezą zerową i oznaczać symbolem H 0 . Wszystkie pozostałe hipotezy
nazywać będziemy alternatywnymi i oznaczać symbolem H1 .
Jeżeli hipoteza dotyczy nieznanej wartości parametru, to zbiór możliwych hipotez jest
wyznaczany przez zbiór wszystkich możliwych wartości parametru. W dalszych rozważaniach
98
te dwa zbiory będziemy utożsamiać. Ten zbiór możliwych wartości parametru nazywamy
przestrzenią
parametrów
i
oznaczamy
symbolem
Θ.
Przestrzeń
parametrów
Θ przedstawiamy w postaci sumy dwóch niepustych zbiorów rozłącznych H 0 i H1 = Θ − H 0 .
Zbiór H 0 nazywamy hipotezą zerową, zbiór H1 hipotezą alternatywną.
Jeżeli H 0 jest zbiorem jednoelementowym będziemy mówić że jest hipotezą prostą.
Jeżeli H 0 jest zbiorem wieloelementowym będziemy mówić, że jest hipotezą złożoną.
Podobnie o hipotezie alternatywnej mówić będziemy, że jest prosta lub złożona w zależności
od tego czy H1 jest zbiorem jednoelementowym czy wieloelementowym.
Zanim sprecyzujemy co znaczy z w e r y f i k o w a ć hipotezę H 0 rozważmy
następujący przykład:
PRZYKŁAD 8.1 (Plucińscy, 1990) Wyprodukowano nowy materiał izolacyjny używany w
określonym rodzaju kondensatorów. Chcemy zbadać, czy nowy materiał jest bardziej
wytrzymały na przebicie od dotychczas używanego. W tym celu przeprowadźmy następujące
doświadczenie.
Z bieżącej produkcji kondensatorów wybieramy losowo parę kondensatorów: jeden z
dotychczas stosowanym izolatorem, drugi z nowym izolatorem. Włączamy je równocześnie w
obwód i obserwujemy napięcia, przy których następują przebicia. Oznaczmy zaobserwowane
napięcia przez x1 i y1 . Powtórzmy doświadczenie n razy. W wyniku obserwacji otrzymamy n
par liczb
(x
1
, y1 ) , ( x 2 , y 2 ) ,..., ( x n , y n ) .
Opisana metoda postępowania gwarantuje jednakowe warunki przeprowadzania
doświadczenia.
Ponieważ kondensatory pobierane są z bieżącej produkcji, więc na ich jakość ma
wpływ wiele czynników losowych, takich jak: grubość izolatora, odległość okładzin,
wilgotność itp. Te czynniki losowe powodują, że zaobserwowane przez nas wartości
x1 , x 2 ,..., x n będą różne w różnych doświadczeniach. To samo dotyczy wartości y1 , y 2 ,..., y n .
Wspomniane czynniki losowe spowodują także, że w przypadku pobrania do badania innych n
par kondensatorów otrzymamy inny układ zaobserwowanych wartości.
W wyniku przeprowadzonego doświadczenia chcemy odpowiedzieć na pytanie, czy
nowy izolator jest lepszy od starego.
99
Przyjmijmy, że na podstawie poprzednich badań wiemy, że x1 , x 2 ,..., x n są
wartościami zmiennej losowej X o rozkładzie normalnym o znanej wariancji. Ze względu na
identyczny proces produkcji analogiczne założenie możemy przyjąć o wartościach
y1 , y 2 ,..., y n .
Rozważmy różnice
y1 − x1 = z1 , y 2 − x 2 = z 2 ,..., y n − x n = z n .
Wartości z1 , z 2 ,..., z n możemy zaobserwować jako zaobserwowane wartości zmiennej
losowej o rozkładzie normalnym o znanej wariancji σ 2 . Gdyby obydwa izolatory miały
jednakową wytrzymałość na przebicie, wówczas z1 , z 2 ,..., z n byłyby zaobserwowanymi
wartościami zmiennej losowej o rozkładzie normalnym N ( 0, σ ) . Wartość
zn =
1 n
∑z
n i =1 i
byłaby wtedy zaobserwowaną wartością zmiennej losowej Z n o rozkładzie normalnym
(
N 0, σ
)
n .
Gdybyśmy opisane doświadczenie powtarzali wielokrotnie, to w poszczególnych
doświadczeniach otrzymać możemy różne wartości z n . Niektóre z nich mogą się dość
znacznie różnić od zera. Oczywiście, im większą wartość z n zaobserwujemy, tym bardziej
skłonni jesteśmy sądzić, że nowy izolator jest lepszy od starego. Ale niewielkie odchylenia
wartości z n są nieuniknione ze względu na losowy charakter doświadczenia. Powstaje
zasadnicze pytanie: jak duże odchylenia wartości z n od zera należy uważać za dopuszczalne
odchylenia losowe, a jak duże za istotną wskazówkę, że nowy izolator jest lepszy od starego?
Musimy przyjąć umownie jakąś granicę. Wybór tej umownej granicy uzasadniamy w sposób
następujący.
Wartość z n jest zaobserwowaną wartością zmiennej losowej Z n mającą rozkład
normalny o nieznanej wartości oczekiwanej m i znanej wariancji σ 2 n . Stawiamy hipotezę
dotyczącą nieznanej wartości parametru m. Mamy tu więc do czynienia z hipotezą
100
parametryczną. Przestrzenią parametrów jest tu zbiór
{m: 0 ≤ m < ∞} .
Wykluczamy
możliwość, że nowy izolator jest gorszy od starego. Zbiór ten przedstawiamy w postaci sumy
dwóch zbiorów rozłącznych
{m: m = 0} ∪ {m: m > 0} .
Pierwszy z nich będzie hipotezą zerową H 0 , drugi hipotezą alternatywną H1 . Hipoteza
zerowa orzeka, że m = 0 , tzn. że obydwa izolatory mają tę samą wytrzymałość na przebicie.
Jest to hipoteza wyróżniona ze zbioru możliwych hipotez wyłącznie ze względu na aspekt
praktyczny.
Jeżeli hipoteza H 0 jest prawdziwa, to zaobserwowanie dużych odchyleń wartości z n
od zera jest zdarzeniem mało prawdopodobnym. Określenie takie jest mało precyzyjne.
Dlatego też musimy ustalić, jakie prawdopodobieństwo w rozważanym przypadku uznamy za
małe lub inaczej, zdarzenia o jakim prawdopodobieństwie uznajemy za przeczące hipotezie
zerowej. Oznaczmy to prawdopodobieństwo przez α . Jako wspomnianą wyżej umowną
granicę odchylenia wartości zaobserwowanej z n od hipotetycznej m = 0 przyjmijmy taką
liczbę ε α , dla której
 Zn − 0

P
> εα  = α ,
σ n

gdzie α jest znaną liczbą. Liczbę ε α odczytujemy z tablic rozkładu normalnego.
Spełnienie warunku
z n > εα
σ
n
interpretujemy jako wystąpienie zdarzenia o małym prawdopodobieństwie (mniejszym od α )
i uznajemy za zaprzeczenie hipotezie zerowej, tzn. za zaprzeczenie zdania: obydwa izolatory
mają tę samą wytrzymałość na przebicie, lub inaczej nieprawdą jest, że zmienna losowa Z n
101
ma rozkład normalny o wartości oczekiwanej m = 0 . Mówić wtedy będziemy: o d r z u c a m
y hipotezę zerową H 0 .
Jeżeli spełniona jest nierówność
zn ≤ εα
σ
n
,
to będziemy uważać, że zaobserwowana wartość z n nie przeczy hipotezie zerowej, a więc
możemy przyjąć, że obydwa izolatory mają tę samą wytrzymałość na przebicie lub inaczej, że
zmienna losowa Z n ma rozkład normalny o wartości oczekiwanej m = 0 . Mówić wtedy
będziemy: p r z y j m u j e m y hipotezę zerową H 0 .
Zwroty „odrzucamy hipotezę zerową” i „przyjmujemy hipotezę zerową” są bardzo
wygodne i przyjęte w literaturze statystycznej. Należy jednak przy tym pamiętać, że nie
oznaczają one naszego całkowitego przekonania o nieprawdziwości czy prawdziwości
hipotezy zerowej. Naszym zadaniem była jedynie odpowiedź na pytanie: czy na podstawie
zaobserwowanych wartości zmiennej losowej Z n uznać, że rozkład zmiennej losowej Z n jest
rozkładem normalnym o wartości oczekiwanej m = 0 czy też raczej o wartości m > 0 ?
Przytoczony przykład upoważnia nas do stwierdzenia, że z formalnego punktu
widzenia weryfikacja hipotez polega na określeniu na przestrzeni próbkowej funkcji, której
wartościami jest jedno z dwóch orzeczeń: „przyjąć hipotezę zerową” lub „odrzucić hipotezę
zerową”.
Mówiąc bardziej poglądowo weryfikacja hipotezy zerowej polega na:
10 wyborze odpowiedniej statystyki U, której rozkład (dokładny lub asymptotyczny) jest
znany,
2 0 ustaleniu zbioru W tych wartości statystyki U, których wystąpienie uważamy za
zaprzeczenie hipotezy zerowej.
Statystykę U nazywamy testem hipotezy H 0 przeciw hipotezie alternatywnej H1 ,
a zbiór W zbiorem krytycznym testu.
W przykładzie 8.1 statystyką U była statystyka Z n , a zbiorem W zbiór
σ 

( x1 , y1 , x 2 , y 2 ,..., x n , y n ): z n > ε α
.
n

102
Prawdopodobieństwo
(
)
P U ∈W H 0 = α ,
(8.1)
tzn. prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona prawdziwa, nazywamy
poziomem istotności testu. Wybór liczby α jest w zasadzie dość dowolny. W praktyce
przyjmuje się na ogół jedną z liczb: 0.05, 0.02, 0.01, 0.001. Ustalając liczbę α należy przede
wszystkim mieć na uwadze konsekwencje praktyczne, jakie się z tym wiążą.
Testy służące do weryfikowania hipotez parametrycznych nazywamy testami
parametrycznymi, testy służące do weryfikowania hipotez nieparametrycznvh - testami
nieparametrycznymi lub testami zgodności.
8.2. Testy parametryczne
W niniejszym rozdziale ograniczymy się do przedstawienia testów do weryfikacji
hipotez
dotyczących
wartości
oczekiwanej,
wariancji,
współczynnika
korelacji
i
współczynnika regresji.
10
Weryfikacja hipotezy o
wartości oczekiwanej przy
znanym σ
Niech cecha X elementów populacji ma rozkład normalny N ( m, σ ) , w którym σ jest
znane.
Pobrano n-elementową próbkę i zaobserwowano wartości x1 , x 2 ,..., x n . Przyjmując
poziom istotności α
chcemy zweryfikować hipotezę H 0 ( m = m0 ) przeciw hipotezie
alternatywnej H1 ( m ≠ m0 ) . Wykorzystując fakt, że średnia arytmetyczna X n z n niezależnych
(
zmiennych losowych o rozkładach normalnych N ( m, σ ) ma rozkład normalny N m, σ
jako test przyjmujemy statystykę X n . Zbiorem krytycznym jest w tym przypadku zbiór
)
n ,
103
x n − m0


W = ( x1 , x 2 ,..., x n ):
> εα  ,
σ n


(8.2)
gdzie ε α wyznaczone jest z równości
 X n − m0

 X n − m0

P
∈W H 0  = P
> εα  = α
 σ n

 σ n

Zatem hipotezę H 0 odrzucamy, gdy
x n − m0 > εα
σ
(8.3)
n
i przyjmujemy, gdy
x n − m0 ≤ εα
σ
n
.
(8.4)
PRZYKŁAD 8.2 (Plucińscy, 1990). Wiadomo, że dla oporników pochodzących z masowej
produkcji odchylenie wartości rezystancji od wartości znamionowej ma rozkład normalny o
znanym odchyleniu standardowym σ = 0.2 kΩ . Celem zweryfikowania hipotezy H 0 ( m = 0) ,
tzn. że wartość oczekiwana rezystancji jest równa wartości znamionowej (nie występują
systematyczne odchylenia) pobrano próbkę o liczności n = 9 i otrzymano wyniki w kΩ .
k
1
2
3
4
5
6
7
8
9
xk
-1.8
0.9
-1.0
4.5
-3.5
1.9
2.7
-0.8
-2.0
∑x
k
Przyjmujemy poziom istotności α = 0.05 .
Z tablic statystycznych rozkładu normalnego odczytujemy, że εα = 1.96 . Zatem
= 0.9
104
σ
εα
n
= 1.96 ⋅
0.2
= 0.13 .
3
Uwzględniając, że x n = 0.1 otrzymujemy
x n − m0 = 0.1 − 0 = 0.1 ≤ 0.13 .
Ponieważ spełniona jest nierówność (8.4), więc hipotezę H 0 przyjmujemy na
poziomie istotności α = 0.05 .
20 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a n e j
w rozkładzie normalnym przy nieznanym σ
Wiadomo, że cecha X elementów populacji ma rozkład normalny N ( m, σ ) ,
w którym m i σ są nieznane. Na podstawie n-elementowej próbki chcemy zweryfikować
hipotezę H 0 ( m = m0 ) przeciw hipotezie alternatywnej H1 ( m ≠ m0 ) .
Niech poziom istotności będzie α . Korzystając z twierdzenia o rozkładzie Studenta
jako test przyjmiemy t u statystykę
tn =
X n − m0
Sn
n − 1,
o której wiemy, że ma rozkład niezależny od σ , a mianowicie, rozkład Studenta o n − 1
stopniach swobody.
Zbiorem krytycznym jest zbiór
{
}
W = ( x1 , x 2 ,..., x n ): t n > tα ,
gdzie tα jest wartością odczytaną z tablicy rozkładu Studenta spełniającą warunek
 X n − m0

P t n ∈W H 0 = P
> tα  = α .
Sn


(
)
105
Hipotezę H 0 ( m = m0 ) odrzucamy, gdy
sn
x n − m0 > tα
(8.5)
n−1
i przyjmujemy, gdy
sn
x n − m0 ≤ tα
n−1
.
(8.6)
PRZYKŁAD 8.3 (Plucińscy, 1990) Niech w warunkach przykładu 8.2 odchylenie
standardowe
σ
będzie
nieznane.
Po
sn2 =
obliczeniu
1 9
26
2
xk − xn ) =
(
∑
9 k =1
9
i odczytaniu tα = 2.306 z tablicy rozkładu Studenta otrzymujemy
x n − m0 = 0.1 − 0 ≤ tα
sn
n−1
= 2.306 ⋅
26
3 8
= 1.38 .
Ponieważ jest spełniona nierówność (8.6), więc hipotezę H 0 ( m = m0 ) przyjmujemy.
Porównując wyniki w przykładach 8.2 i 8.3 warto zwrócić uwagę na fakt, że
nieznajomość σ , a więc posiadanie mniejszej ilości informacji, powoduje ostrożniejsze
podejmowanie decyzji o przyjęciu hipotezy zerowej.
30 W e r y f i k a c j a h i p o t e z y o w a r i a n c j i w r o z k ł a d z i e n o r m a l n y m
Wiemy, że cecha X elementów populacji ma rozkład normalny N ( m, σ ) o nieznanych
parametrach m i σ . Na podstawie n-elementowej próbki chcemy zweryfikować hipotezę
H 0 (σ 2 ≤ σ 02 ) , tzn. że wariancja nie przekracza pewnej liczby. Hipotezą alternatywną jest tu
hipoteza H1 (σ 2 > σ 02 ) .
Przyjmijmy poziom istotności α . Pamiętajmy, że statystyka nS n2 σ 2 ma rozkład chikwadrat o n − 1 stopniach swobody. Wykorzystamy tę statystykę jako test do weryfikacji
hipotezy H 0 (σ 2 ≤ σ 02 ) .
Zbiorem krytycznym będzie tu zbiór
106


nsn2
W = ( x1 , x 2 ,..., x n ): 2 > χ α2  ,
σ0


gdzie χα2 jest liczbą odczytaną z tablicy rozkładu chi-kwadrat, spełniającą warunek
 nS n2

 nS n2

P 2 ∈W H 0  = P 2 > χα2  = α .
 σ0

 σ0

Hipotezę H o (σ 2 ≤ σ 02 ) odrzucamy, gdy
nsn2
σ
2
0
> χα2
(8.7)
≤ χ α2 .
(8.8)
i przyjmujemy, gdy
nsn2
σ
2
0
PRZYKŁAD 8.4 (Plucińscy, 1990) Błąd pomiaru odległości za pomocą radaru ma rozkład
normalny. Przeprowadzono 10 pomiarów tej samej odległości i otrzymano następujące
wartości błędów (w km):
k
1
2
3
4
5
6
7
8
9
10
x k 0.115 -0.25 0.18 -0.06 -0.12 0.01 -0.05 0.075 -0.15 -0.25
Σx k = −0.5
Przyjmując poziom istotności α = 0.02 zweryfikować hipotezę H 0 (σ 2 ≤ 0.0125) .
Z danych liczbowych wynika, że x n = −0.05 , nsn2 = 0.29435 . Z tablicy rozkładu chi-kwadrat
dla danych n i α , odczytujemy χα2 = 19.679 .
107
Zatem
nsn2
σ
2
0
=
0.29435
= 23.448 > 19.679 .
0.0125
Oznacza to, że spełniona jest nierówność (8.7) i hipotezę H 0 (σ 2 ≤ 0.0125) należy
odrzucić.
40
W e r y f i k a c j a
h i p o t e z y o
r ó w n o ś c i
w a r t o ś c i
oczekiwanych o rozkładach normalnych
z jednakową nieznaną wariancją
Dane są dwie populacje, w których cecha X ma odpowiednio rozkład normalny
N ( m1 , σ ) i N ( m2 , σ ) , przy czym parametry m1 , m2 i σ są nieznane. Pobrano z obu populacji
próbki o licznościach odpowiednio n1 i n2 i otrzymano następujące wyniki: x1 , x 2 ,..., x n dla
próbki z pierwszej populacji i y1 , y 2 ,..., y n dla próbki z drugiej populacji. Przyjmując poziom
istotności α chcemy zweryfikować hipotezę H 0 ( m1 = m2 ) przeciw hipotezie alternatywnej
H1 (m1 ≠ m2 ) .
Żadna z poznanych dotąd statystyk nie nadaje się do weryfikowania hipotezy H 0 .
Dlatego wprowadzamy tu nową statystykę określoną wzorem
T=
X n1 − Yn2
n1 + n 2
n1 S n21 + n 2 S n22
n1 n 2
(
n1 + n 2 − 2
(8.9)
)
Jeśli hipoteza H 0 jest prawdziwa, to statystyka T ma rozkład Studenta o n1 + n 2 − 2
stopniach swobody. Nie trudno to uzasadnić, jeżeli tylko (8.9) zapiszemy w nieco innej
postaci, a mianowicie:
(X
T=
n1
− Yn2
)
σ2
n1
+
σ2
n2
1
n1 S n21 σ 2 + n 2 S n22 σ 2
n1 + n 2 − 2
[(
) (
(8.10)
)]
108
Jeżeli hipoteza H 0 jest prawdziwa, to wobec niezależności zmiennych losowych
X 1 , X 2 ,..., X n , Y1 , Y2 ,..., Yn i twierdzenia o rozkładzie chi-kwadrat, tak podany licznik i
nawias kwadratowy w mianowniku wzoru (8.10) są niezależnymi zmiennymi losowymi o
rozkładach odpowiednio N ( 0,1) i chi-kwadrat o n1 + n 2 − 2 stopniach swobody, a zatem w
myśl definicji rozkładu Studenta zmienna losowa T ma rozkład Studenta o n1 + n 2 − 2
stopniach swobody.
Statystykę T określoną wzorem (8.9) możemy wykorzystać jako test do weryfikacji
hipotezy H 0 ( m1 = m2 ) .
Przyjmijmy poziom istotności α .
Zbiorem krytycznym jest tu zbiór




x n1 − y n2


W =  x1 , x 2 ,..., x 1 , y1 , y 2 ,..., y n2 :
> tα  ,
2
2


n1 + n 2 n1 S n1 + n 2 S n2
⋅


n1 n 2
n1 + n 2 − 2


(
)
gdzie tα jest liczbą odczytaną z tablicy rozkładu Studenta spełniającą warunek
P(T ∈W H 0 ) = P( T > tα ) = α .
Hipotezę H 0 o równości wartości oczekiwanych odrzucamy, gdy
x n1 − y n2
2
2
n1 + n 2 n1 S n1 + n 2 S n2
⋅
n1 n 2
n1 + n 2 − 2
> tα
(8.11)
≤ tα .
(8.12)
i przyjmujemy, gdy
x n1 − y n2
2
2
n1 + n 2 n1 S n1 + n 2 S n2
⋅
n1 n 2
n1 + n 2 − 2
109
PRZYKŁAD 8.5 (Plucińscy, 1990) Wałek główny samochodowej skrzynki biegów obrabiany
jest na obrabiarce automatycznej. Rozkład średnic wałków jest rozkładem normalnym. W celu
sprawdzenia, czy poziom nastawienia obrabiarki nie zmienia się w czasie pracy, pobrano dwie
próbki wałków o licznościach 8 i 10 sztuk, jedną próbkę z produkcji przedpołudniowej, drugą
z popołudniowej i otrzymano następujące dane dla długości średnic wałków (w mm):
k
xk
1
2
3
4
5
6
7
8
19.8
20.1
19.9
20.0
19.8
20.1
19.8
19.7
j
1
2
3
4
5
6
7
8
9
10
yk
19.9
20.2
20.0
20.3
20.1
19.8
20.1
19.9
19.8
19.9
Zakładamy, że zmiana warunków w ciągu odstępu czasu między pobieraniem próbek
może wpłynąć tylko na średni rozmiar, a nie zmienia wariancji.
Przyjmując poziom istotności
α = 0.05 ,
zweryfikować
hipotezę
o
niewystępowaniu zmian poziomu nastawienia obrabiarki w czasie.
Z danych liczbowych znajdujemy x8 = 19.9 , s82 = 0.02 , y10 = 20.0 , s102 = 0.026 .
Z tablic rozkładu Studenta dla α = 0.05 i 8+10-2=16 stopni swobody odczytujemy
tα = 2.120 . Obliczając wartość statystyki (8.9) znajdujemy
19.9 − 20.0
8 + 10 − 2 = 137
. < 2.120 .
8 + 10
( 016
. + 0.26)
8 ⋅ 10
Ponieważ spełniona jest nierówność (8.12) więc przyjmujemy hipotezę o
niewystępowaniu zmian poziomu nastawienia obrabiarki.
50 W e r y f k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a n e j n a
podstawie próbek o dużej liczebności
110
W punktach 10 − 4 0 niniejszego rozdziału zakładaliśmy, że znana jest postać badanej
cechy populacji, nie przyjmowaliśmy żadnych założeń odnośnie do liczności próbki. Przy tak
mocnym założeniu, jakim jest znajomość postaci rozkładu, założenie o liczności próbki nie
było potrzebne.
Rozważmy teraz przypadek, gdy postać rozkładu interesującej nas cechy elementów
populacji jest nieznana.
Aby móc zweryfikować hipotezę o nieznanej wartości oczekiwanej cechy X, musimy
znać rozkład jakiejś statystyki, która może służyć za test. Tylko wtedy bowiem potrafimy
zbudować zbiór krytyczny W. Nie znając rozkładu cechy X nie potrafimy znaleźć dokładnego
rozkładu żadnej statystyki. Nie jest to jednak sytuacja bez wyjścia. Skorzystać przecież można
ze znanych twierdzeń granicznych, np. z tw. Lindeberga-Ley’ego, które orzeka, że jeżeli n jest
dostatecznie duże, a zmienne losowe X 1 , X 2 ,..., X n są niezależne o jednakowym rozkładzie, i
n
istnieją E ( X 1 ) = m oraz V ( X 1 ) = σ 2 , to zmienna losowa X n = (1 n)∑ X k ma rozkład w
k =1
przybliżeniu normalny o parametrach m i σ
n . Korzystając z innego twierdzenia możemy
przyjąć, że σ 2 ≈ sn2 .
Uwzględniając powyższe, dochodzimy do wniosku, że chcąc zweryfikować hipotezę
H 0 (m = m0 ) przeciw hipotezie alternatywnej H1 (m ≠ m0 ) , gdy nie mamy żadnych
informacji o postaci rozkładu cechy X w populacji, należy pobrać dostatecznie liczną próbkę
(rzędu co najmniej kilku dziesiątek), a następnie jako test przyjąć statystykę X n . Zbiorem
krytycznym będzie w tym przypadku zbiór

x n − m0
W = ( x1 , x 2 ,..., x n ):
sn


n > εα  ,

gdzie εα jest liczbą odczytaną z tablic rozkładu normalnego, spełniającą warunek
 X n − m0
P
Sn


n > εα  = α .

111
Hipotezę H 0 (m = m0 ) odrzucamy, gdy
x n − m0
sn
n > εα
(8.13)
n ≤ εα .
(8.14)
i przyjmujemy, gdy
x n − m0
sn
PRZYKŁAD 8.6 (Plucińscy, 1990) Zużycie wody przez zakład przemysłowy podlega
losowym wahaniom w kolejnych dniach. Na podstawie obserwacji n = 256 dni stwierdzono,
że średnie dzienne zużycie wody wynosi x 256 = 102 hl , a średnie odchylenie kwadratowe
2
s256
= 64 hl 2 .
Przyjmując
poziom
istotności
α = 0.05
zweryfikować
hipotezę
H 0 (m0 = 100 hl ) , tzn. że średnie dzienne zużycie wody wynosi 100 hl, przeciw hipotezie
alternatywnej H1 (m0 ≠ 100 hl ) .
Z tablicy rozkładu normalnego dla α = 0.05 odczytamy εα = 1.96 . Z danych
przykładu wynika, że
x 256 − m0
s256
n=
102 − 100
256 = 4 > εα = 196
. .
8
Ponieważ spełniona jest nierówność (8.13), więc hipotezę H 0 odrzucamy.
112
Problemy rozdziału 8
1. Rodzaje testów statystycznych.
2. Podstawowe kanony sztuki statystycznej.
3. Przestrzeń parametrów.
4. Hipotezy statystyczne
5. Zbiór krytyczny testu.
6. Poziom istotności testu.
7. Warunek odrzucenia hipotezy.
8. Warunek przyjęcia hipotezy.
9. Weryfikacja hipotezy o wartości oczekiwanej przy znanej wariancji.
10. Weryfikacja hipotezy o wartości oczekiwanej przy nieznanej wariancji.
11. Weryfikacja hipotezy o wariancji w rozkładzie normalnym.
12. Weryfikacja hipotezy o równości wartości oczekiwanych o rozkładach normalnych z
jednakową nieznaną wariancją.
13. Weryfikacja hipotezy o wartości oczekiwanej na podstawie próbek o dużej liczebności.

DWA RODZAJE TESTÓW STATYSTYCZNYCH

Transkrypt

Podobne dokumenty

Weryfikacja hipotez statystycznych - Sigma Kwadrat

Testy statystyczne

testy istotności dla wartości oczekiwanej

Błędy weryfikacyjne, moc testów, testy jednostajnie najmocniejsze

Inżynierskie zastosowania statystyki — ćwiczenia

Zestaw SM4

Weryfikacja hipotez statystycznych

Prezentacja danych statystycznych w GIS