Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy

Transkrypt

Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy
Wykład 3
Hipotezy statystyczne
Hipotezą statystyczną nazywamy każde
przypuszczenie dotyczące nieznanego rozkładu
obserwowanej zmiennej losowej (cechy populacji
generalnej).
Hipoteza zerowa (H0) jest hipoteza sprawdzaną,
podlegającą weryfikacji. Wyróżnia się spośród
innych hipotez statystycznych, dlatego że
przypisuje się jej specjalną interpretację w
rozważanym problemie.
Hipoteza alternatywna (H1) to hipoteza przeciwna
lub „częściowo” przeciwna do hipotezy zerowej.
Testem statystycznym nazywamy postępowanie
statystyczne, w wyniku którego decydujemy czy na
podstawie zaobserwowanego zbioru liczb (próby)
weryfikowaną hipotezę H0 przyjąć czy odrzucić.
Przy takim postępowaniu możemy popełnić
następujące błędy:
a) odrzucić hipotezę prawdziwą ( błąd 1. rodzaju)
b) przyjąć hipotezę fałszywą ( błąd 2. rodzaju).
Prawdopodobieństwo popełnienia błędu 1. rodzaju
oznaczamy przez  i nazywamy poziomem istotności.
Jeśli zadanie polega na sprawdzeniu czy wyniki
doświadczenia przeczą ustalonej hipotezie zerowej, to
odpowiedni test nazywamy testem istotności.
Przy budowie testu istotności
-korzysta się z rozkładów odpowiedniej dla H0 statystyki
Zn zbudowanej z wyników n- elementowej próby
-wyznacza się zbiór Z wartości tej statystyki
powodujących odrzucenie H0.
Zbiór Z nazywamy zbiorem krytycznym. Spełniony musi
być przy tym warunek:
.
Test istotności jest testem statystycznym, którego
stosowanie pozwala na odrzucenie hipotezy H0, gdy
wyniki z próby prowadzą do wartości należącej do
zbioru krytycznego.
W przeciwnym przypadku nie mamy podstaw do
odrzucenia H0. Sposób konstrukcji testu istotności nie
pozwala na przyjęcie H0, gdyż prawdopodobieństwo
błędu 2. rodzaju może być zbyt wysokie.
Typy testów istotności:
1) testy dotyczące parametrów, gdy kształt rozkładu
populacji jest znany
2) testy zgodności dotyczące kształtu rozkładu
populacji
3) testy jednorodności dotyczące kilku populacji
(jednakowe parametry lub kształt rozkładów)
4) testy niezależności dotyczące kilku cech i ich
wzajemnej zależności.
Testy istotności dla wartości oczekiwanej.
Testy istotności dla jednej wartości oczekiwanej.
Model I
Populacja generalna ma rozkład normalny
Wielkości
szacujemy na podstawie
małej próby.
Stawiamy hipotezy.
H0: =0
H1:
gdzie 0 jest wartością daną.
Obliczamy wartość statystyki:
tobl
x  0

n 1
s
Wyznaczone tobl porównujemy z wartością t
odczytaną z tablic rozkładu Studenta dla z góry
ustalonego poziomu istotności 
i n-1 stopni swobody tak, aby
tzn. obszar krytyczny jest dwustronny, postaci
.
Jeśli
to H0 należy odrzucić. W
przeciwnym przypadku nie ma podstaw do
odrzucenia H0.
Przy powyższych wstępnych ustaleniach można
przyjąć jako alternatywną również hipotezę
postaci:
1) H1: <0
Wówczas obszar krytyczny jest jednostronny t<t
czyli
}=

-t
Oznacza to, że t jest ujemne.
Aby skorzystać z tablic trzeba uwzględnić fakt, że
.
Oznacza to odczyt wartości dodatniej t dla 2.
Jeżeli tobl≤-t to H0 odrzucamy.
2) H1: >0
Obszar krytyczny jest jednostronny t>t czyli P{t>t}=.
t
Tzn. t jest dodatnie, a z tablic t odczytujemy zgodnie z
równością
.
Oznacza to odczyt wartości t dla 2.
Jeżeli tobl ≥t to H0 odrzucamy.
Przykład.
Automat produkuje części o nominalnej grubości 0,04
mm. Zakładając, że grubość produkowanych części jest
zmienną losową o rozkładzie normalnym. Zweryfikować
na poziomie istotności =0,05 hipotezę, że średnia
grubość wynosi 0,04, gdy dla 17-elementowej próby
[mm], a s=0,005 [mm].
Rozwiązanie:
H0: =0,04
H1:
Obliczamy wartość statystyki:
tobl
0,037  0,04

17  1  2,4
0,005
Mamy dwustronny obszar krytyczny:

Wartość t odczytana z tablic rozkładu Studenta
dla poziomu istotności =0,05 i 16 stopni swobody
wynosi 2,12.
Odpowiedź:
Skoro │tobl│=2,4 to │tobl│≥t. Mamy podstawy aby
odrzucić H0.
Model II
Populacja generalna ma dowolny rozkład o
wartości oczekiwanej i wariancji
Parametry
te szacujemy na podstawie dużej próby.
Stawiamy hipotezy.
H0: =0
H1:
gdzie 0 jest wartością daną.
Obliczamy wartość statystyki:
uobl
x  0

n
s
Wyznaczone uobl porównujemy z wartością u
odczytaną z tablic rozkładu Studenta dla z góry
ustalonego poziomu istotności 
i  stopni swobody tak, aby
tzn. obszar krytyczny jest dwustronny, postaci
.
Jeśli
to H0 należy odrzucić. W
przeciwnym przypadku nie ma podstaw do
odrzucenia H0.
Przy powyższych wstępnych ustaleniach można
przyjąć jako alternatywną również hipotezę
postaci:
1) H1: <0
Wówczas obszar krytyczny jest jednostronny u<u
czyli
}=

-u
Oznacza to, że t jest ujemne.
Aby skorzystać z tablic trzeba uwzględnić fakt, że
.
Oznacza to odczyt wartości dodatniej u dla 2.
Jeżeli uobl≤-u to H0 odrzucamy.
2) H1: >0
Obszar krytyczny jest jednostronny u>u czyli
P{u>u}=.
u
Tzn. u jest dodatnie, a z tablic u odczytujemy zgodnie
z równością
.
Oznacza to odczyt wartości u dla 2.
Jeżeli uobl ≥u to H0 odrzucamy.
Testy istotności dla dwóch średnich.
Badamy dwie populacje i porównujemy dwie średnie
tej samej cechy.
Model I
Dane są 2 populacje o rozkładach normalnych
. Parametry są nieznane, ale
. Dwie próby wylosowane z odpowiedniej
populacji mają liczność n1, n2 (małe).
Stawiamy hipotezy.
H0: 1=2
H1:
Obliczamy wartość statystyki:
tobl 
x1  x2
n1s12  n2 s22  1 1 
  
n1  n2  2  n1 n2 
Wyznaczone tobl porównujemy z wartością t
odczytaną z tablic rozkładu Studenta dla z góry
ustalonego poziomu istotności 
i n1+n2-2 stopni swobody tak, aby
tzn. obszar krytyczny jest dwustronny, postaci
.
Jeśli
to H0 należy odrzucić. W
przeciwnym przypadku nie ma podstaw do
odrzucenia H0.
Uwaga:
Podobnie jak dla testów dla jednej średniej
możemy uwzględnić inne alternatywne hipotezy.
Model II
Dane są dwie populacje o rozkładach dowolnych, ale o
skończonych wariancjach. Dwie próby wylosowane z
obu populacji mają liczność
n1, n2 (duże).
Stawiamy hipotezy.
H0: 1=2
Obliczamy wartość statystyki:
H1:
uobl 
x1  x2
s12 s22

n1 n2
Wyznaczone uobl porównujemy z wartością u
odczytaną z tablic rozkładu Studenta dla z góry
ustalonego poziomu istotności 
i liczby stopni swobody tak, aby
tzn. obszar krytyczny jest dwustronny, postaci
.
Jeśli
to H0 należy odrzucić. W
przeciwnym przypadku nie ma podstaw do
odrzucenia H0.
Uwaga:
Podobnie jak dla testów dla jednej średniej
możemy uwzględnić inne alternatywne hipotezy.
Przykład:
W celu sprawdzenia hipotezy, że zastosowanie
innego materiału zwiększa żywotność pewnej
części trącej maszyny, zbadano na 2 próbach
żywotność tej części ze starego i nowego
materiału. Otrzymano:
n1=90,
=9,3, =4,1
n2=120, =9,9, =3,8
Przyjmując poziom istotności =0,05 sprawdzić
hipotezę o większej średniej żywotności części z
nowego materiału.
Rozwiązanie:
Stawiamy hipotezy.
H0: 1=2
H1:
Obliczamy wartość statystyki:
uobl 
x1  x2
s12 s22

n1 n2

9,3  9,9
 2,16
4,1 3,8

90 120
Ze względu na postać hipotezy alternatywnej mamy
obszar jednostronny P{u<u}=.
Stąd u2=-1,645
dla 2=0,1.
Ponieważ uobl=-2,16 to uobl<u2.
Hipotezę H0 należy odrzucić.
Testy dotyczące wariancji.
Test istotności dla jednej wariancji.
Populacja ma rozkład
dowolna.
. Liczebność n jest
Stawiamy hipotezy:
H0: 2=02
H1: 2>02
Wyznaczamy wartość statystyki:

2
obl
Porównujemy z wartością
krytyczny
, gdzie

ns
2
 02
wyznaczającą obszar
Wartość
odczytujemy z tablic rozkładu chi-kwadrat
dla danego poziomu istotności  i n-1 stopni swobody.
Jeśli
to H0 należy odrzucić.
Przykład:
W celu oszacowania dokładności pomiarów
wykonywanych pewnym przyrządem dokonano 8
pomiarów i otrzymano s2=0,0575. Na poziomie
istotności =0,05 zweryfikować hipotezę, że wariancja
2>0,06.
Rozwiązanie:
H0: 2=0,06
H1: 2>0,06
Wyznaczamy wartość statystyki:

2
obl
8  0,0575
 2 
 7,667
0
0,06
ns2
Wartość
odczytujemy z tablic rozkładu chi-kwadrat
dla poziomu istotności =0,05 i 7 stopni swobody.
Stąd
=14,067 i nie ma podstaw do odrzucenia H0.