Testowanie hipotez statystycznych.

Transkrypt

Testowanie hipotez statystycznych.
Testowanie hipotez statystycznych.
Krzysztof Topolski
Bioinformatyka
Wykład 9
Wrocław, 5 grudnia 2011
Krzysztof Topolski
Testowanie hipotez statystycznych.
Temat.
Test zgodności 𝜒2 Pearsona.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Statystyka 𝜒2 Pearsona
Rozpatrzmy ciąg niezależnych zmiennych losowych X1 , ..., Xn o
jednakowym dyskretnym rozkładzie P{X1 = xi } = pi , i = 1, ..., k.
Oznaczmy przez Oi liczbę tych zmiennych spośród X1 , ..., Xn , które
przyjęły wartość xi a przez Ei = npi oczekiwaną liczbę wartości xi .
Wektor losowy (O1 , O2 , ..., Ok ) ma rozkład wielomianowy z
parametrami n i (p1 , ..., pk ) natomiast zmienna losowa
𝜒2P =
k
∑
(Oi − Ei )2
,
Ei
i=1
ma asymptotyczny rozkład chi kwadrat z (k − 1) stopniami
swobody 𝜒2k−1 .
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla hipotezy prostej
Rozważmy dyskretną zmienną losową X o nieznanym rozkładzie
P{X = xi } = qi ,
i = 1, ..., k,
qi są nieznane. Stawiamy hipotezę
H0 : qi = pi
dla każdego
i = 1, ..., k.
Statystyka testowa to statystyka Pearsona 𝜒2P
𝜒2P =
k
∑
(Oi − Ei )2
,
Ei
i=1
która w tym przypadku ma postać
𝜒2P
k
∑
(Oi − npi )2
=
.
npi
i=1
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla hipotezy prostej
Rozważmy dyskretną zmienną losową X o nieznanym rozkładzie
P{X = xi } = qi ,
i = 1, ..., k,
qi są nieznane. Stawiamy hipotezę
H0 : qi = pi
dla każdego
i = 1, ..., k.
Statystyka testowa to statystyka Pearsona 𝜒2P
𝜒2P =
k
∑
(Oi − Ei )2
,
Ei
i=1
która w tym przypadku ma postać
𝜒2P
k
∑
(Oi − npi )2
=
.
npi
i=1
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład
Sprawdzamy, że cyfry z tabeli
i
Oi
0 1 2 3 4 5 6 7 8 9
33 32 29 31 37 34 34 26 32 32
są wygenerowane z rozkładu jednostajnego.
Przetestujemy hipotezę
H0 : P{X = i} =
1
,
10
dla każdego
i = 0, ..., 9,
na poziomie istotności 𝛼 = 0, 01.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład
Sprawdzamy, że cyfry z tabeli
i
Oi
0 1 2 3 4 5 6 7 8 9
33 32 29 31 37 34 34 26 32 32
są wygenerowane z rozkładu jednostajnego.
Przetestujemy hipotezę
H0 : P{X = i} =
1
,
10
dla każdego
i = 0, ..., 9,
na poziomie istotności 𝛼 = 0, 01.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład
Sprawdzamy, że cyfry z tabeli
i
Oi
0 1 2 3 4 5 6 7 8 9
33 32 29 31 37 34 34 26 32 32
są wygenerowane z rozkładu jednostajnego.
Przetestujemy hipotezę
H0 : P{X = i} =
1
,
10
dla każdego
i = 0, ..., 9,
na poziomie istotności 𝛼 = 0, 01.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
W tabeli jest 320 cyfr a więc n = 320. Wszystkie częstości
oczekiwane są takie same
Ei =
n
320
=
= 32.
10
10
Statystyka testowa ma wartość 𝜒2P = 2, 5, natomiast kwantyl rzędu
0, 99 dla rozkładu 𝜒2 z 9 stopniami swobody jest równy
𝜒29:0,01 = 21, 67.
Tak więc nie ma podstaw do odrzucenia hipotezy zerowej i
przyjmujemy H0 ,
(p−wartość jest w tym przypadku równa p = 0, 981.)
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego.
Test 𝜒2 możemy także stosować do sprawdzania hipotez o postaci
rozkładu ciągłego. W tym celu należy wyznaczyć rozłączne klasy
A1 , ..., Ak (podobnie jak przy konstrukcji histogramu) i obliczyć,
przy założeniu hipotezy zerowej H0 , prawdopodobieństwa
p1 = P{X ∈ A1 },
p2 = P{X ∈ A2 },
.... ,
pk = P{X ∈ Ak }.
Niech n oznacza wielkość próby, a Oi liczbę obserwacji w i−tej
klasie. Za pomocą testu 𝜒2 Pearsona możemy sprawdzić, czy
zaobserwowane częstości O1 , O2 , ..., Ok podlegają rozkładowi z
gęstością {pi , i = 1, ..., k}.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego cd.
Metodę tę zilustrujemy następującym przykładem.
Przykład
Według producenta pojemność jego naczynie miareczkowego ma
rozkład normalny z wartością średnią równą nominalnej pojemności
oraz odchyleniu standardowym równym 0, 01 mm3 . Aby to
sprawdzić, przebadano pojemność 200 naczyń o nominalnej
pojemności równej 30 mm3 . Wyznaczono k = 10 rozłącznych klas
A1 , ..., A10 . Ich granice z zaobserwowanymi liczebnościami są
podane w tabeli
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego cd.
Metodę tę zilustrujemy następującym przykładem.
Przykład
Według producenta pojemność jego naczynie miareczkowego ma
rozkład normalny z wartością średnią równą nominalnej pojemności
oraz odchyleniu standardowym równym 0, 01 mm3 . Aby to
sprawdzić, przebadano pojemność 200 naczyń o nominalnej
pojemności równej 30 mm3 . Wyznaczono k = 10 rozłącznych klas
A1 , ..., A10 . Ich granice z zaobserwowanymi liczebnościami są
podane w tabeli
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
i
1
2
3
4
5
6
7
8
9
10
Klasa
(−∞, 29, 980]
(29, 980, 29, 985]
(29, 985, 29, 990]
(29, 990, 29, 995]
(29, 995, 30, 000]
(30, 000, 30, 005]
(30, 005, 30, 010]
(30, 010, 30, 015]
(30, 015, 30, 020]
(30, 020, +∞)
Krzysztof Topolski
Oi
2
13
20
26
40
42
26
21
10
0
Ei
4, 55
8, 81
18, 37
29, 98
38, 29
38, 29
29, 98
18, 37
8, 81
4, 55
Testowanie hipotez statystycznych.
Przykład cd.
Niech X oznacza pomiar pojemności oraz niech qi = P{X ∈ Ai }.
W zapewnienia producenta oznaczają, że X ma rozkład normalny
N(30, 00, 0, 0001). My sprawdzamy hipotezę H0 : qi = pi , w
której
)
(
)
(
ai−1 − 30
ai − 30
−Φ
,
pi = Φ
0, 01
0, 01
gdzie Ai = (ai−1 , ai ] jest i−tą klasą.
Na podstawie danych z tablicy, w których łączymy w jedną dwie
dolne i dwie górne klasy otrzymujemy następującą wartość
statystyki testowej 𝜒2P = 3, 06. Ponieważ przy 7 stopniach
swobody p−wartość wynosi 0,879, nie ma podstaw do odrzucenia
hipotezy zerowej H0 , a w takim razie także hipotezy o rozkładzie
normalnym N(0, 1) pojemności naczyń miareczkowych.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Niech X oznacza pomiar pojemności oraz niech qi = P{X ∈ Ai }.
W zapewnienia producenta oznaczają, że X ma rozkład normalny
N(30, 00, 0, 0001). My sprawdzamy hipotezę H0 : qi = pi , w
której
)
(
)
(
ai−1 − 30
ai − 30
−Φ
,
pi = Φ
0, 01
0, 01
gdzie Ai = (ai−1 , ai ] jest i−tą klasą.
Na podstawie danych z tablicy, w których łączymy w jedną dwie
dolne i dwie górne klasy otrzymujemy następującą wartość
statystyki testowej 𝜒2P = 3, 06. Ponieważ przy 7 stopniach
swobody p−wartość wynosi 0,879, nie ma podstaw do odrzucenia
hipotezy zerowej H0 , a w takim razie także hipotezy o rozkładzie
normalnym N(0, 1) pojemności naczyń miareczkowych.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla rozkładu ciągłego cd.
Uwaga
Przybliżenie rozkładem 𝜒2 można uznać za dopuszczalne, gdy
npi ≥ 5 dla każdego i = 1, ..., k.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla hipotezy złożonej.
Omówiliśmy przypadek, w którym sformułowana hipoteza H0
określała całkowicie rozkład zmiennej losowej. W wielu
zagadnieniach praktycznych stawia się również hipotezy, które nie
określają całkowicie rozkładu. Możemy mieć na przykład do
czynienia z hipotezą, która orzeka, że zmienna losowa X ma
rozkład dyskretny o znanej postaci ogólnej {pi (𝜃), i = 1, ..., k}, a
parametr 𝜃 pozostaje nieokreślony.
Krzysztof Topolski
Testowanie hipotez statystycznych.
W tej sytuacji nie możemy bezpośrednio skorzystać ze statystyki
𝜒2P gdyż nie możemy obliczyć, Ei = Ei (𝜃) = npi (𝜃), teoretycznych
oczekiwanych liczebności klas. Zależą one bowiem od wartości
nieznanego parametru 𝜃. Okazuje się, że jeśli nieznany parametr 𝜃
jest oszacowany za pomocą metody największej wiarogodności, to
statystyka
k
∑
ˆ 2
(Oi − Ei (𝜃))
,
𝜒2P =
ˆ
Ei (𝜃)
i=1
gdzie 𝜃ˆ oznacza estymator największej wiarogodności parametru 𝜃,
ma nadal asymptotyczny rozkład 𝜒2 ale już nie z k − 1 stopniami
swobody ale z k − 2 stopniami swobody.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Test zgodności 𝜒2 dla hipotezy złożonej cd.
Przykład
W diploidalnej populacji z losowym kojarzeniem częstość allelu A
jest równa 𝜃. Jeśli populacja znajduje się w równowadze
Hardyego-Weinberga to częstości genotypów AA, Aa i aa są równe
odpowiednio 𝜃2 , 2𝜃(1 − 𝜃) i (1 − 𝜃)2 .
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Załóżmy, że w populacji stwierdzono 110 osobników o genotypie
AA, 235 osobników o genotypie Aa oraz 155 osobników o
genotypie aa. Czy istnieje podstawa do odrzucenia hipotezy o
znajdowaniu się tej populacji w warunkach równowagi
Hardyego-Wainberga.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
W tym przypadku hipoteza zerowa ma postać
H0 : p1 (𝜃) = 𝜃2 , p2 (𝜃) = 2𝜃(1 − 𝜃), p3 (𝜃) = (1 − 𝜃)2 .
Estymator parametru 𝜃 wyznaczony metodą największej
wiarogodności jest postaci
2n1 + n2
,
𝜃ˆ =
2n
gdzie n = n1 + n2 + n3 .
Ponieważ
Genotyp AA Aa aa
ni
110 235 155
więc
𝜃ˆ = 0, 455.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
W tym przypadku hipoteza zerowa ma postać
H0 : p1 (𝜃) = 𝜃2 , p2 (𝜃) = 2𝜃(1 − 𝜃), p3 (𝜃) = (1 − 𝜃)2 .
Estymator parametru 𝜃 wyznaczony metodą największej
wiarogodności jest postaci
2n1 + n2
𝜃ˆ =
,
2n
gdzie n = n1 + n2 + n3 .
Ponieważ
Genotyp AA Aa aa
ni
110 235 155
więc
𝜃ˆ = 0, 455.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
W tym przypadku hipoteza zerowa ma postać
H0 : p1 (𝜃) = 𝜃2 , p2 (𝜃) = 2𝜃(1 − 𝜃), p3 (𝜃) = (1 − 𝜃)2 .
Estymator parametru 𝜃 wyznaczony metodą największej
wiarogodności jest postaci
2n1 + n2
𝜃ˆ =
,
2n
gdzie n = n1 + n2 + n3 .
Ponieważ
Genotyp AA Aa aa
ni
110 235 155
więc
𝜃ˆ = 0, 455.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Statystyka testowa jest więc równa
𝜒2P =
(110 − 103, 51)2 (235 − 247, 97)2 (155 − 148, 51)2
+
+
= 1, 369.
103, 51
247, 97
148, 51
Dla tej wartości statystyki testowej p−wartość jest równa 0,24,
czyli nie ma podstaw do odrzucenia hipotezy zerowej.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Statystyka testowa jest więc równa
𝜒2P =
(110 − 103, 51)2 (235 − 247, 97)2 (155 − 148, 51)2
+
+
= 1, 369.
103, 51
247, 97
148, 51
Dla tej wartości statystyki testowej p−wartość jest równa 0,24,
czyli nie ma podstaw do odrzucenia hipotezy zerowej.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Za pomocą testu 𝜒2 możemy przetestować hipotezę o
niezależności dwóch zmiennych losowych. Niech (X , Y ) będzie
dwuwymiarowym wektorem losowym o rozkładzie dyskretnym
rij = P{X = xi , Y = yj },
i = 1, ..., a, j = 1, ..., b.
Rozkład {rij } możemy wygodnie zapisać w tablicy
X/Y y1 y2
x1 r11 r12
x2 r21 r22
..
.
... ...
xa ra1 ra2
Krzysztof Topolski
... yb
... r1b
... r2b
... ...
... rab
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Za pomocą testu 𝜒2 możemy przetestować hipotezę o
niezależności dwóch zmiennych losowych. Niech (X , Y ) będzie
dwuwymiarowym wektorem losowym o rozkładzie dyskretnym
rij = P{X = xi , Y = yj },
i = 1, ..., a, j = 1, ..., b.
Rozkład {rij } możemy wygodnie zapisać w tablicy
X/Y y1 y2
x1 r11 r12
x2 r21 r22
..
.
... ...
xa ra1 ra2
Krzysztof Topolski
... yb
... r1b
... r2b
... ...
... rab
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Stawiamy hipotezę zerową H0 , że zmienne losowe X i Y są
niezależne.
H0 : P {(X , Y ) = (xi , yj )} = P {X = xi } P {Y = yj } , dla wszystkich i, j
Jeśli wprowadzimy oznaczenia
pi = P{X = xi }
oraz
qj = P{Y = yj }
to możemy hipotezę H0 zapisać w postaci
H0 : rij = pi qj , dla wszystkich i, j.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Hipoteza zerowa jest hipotezą złożoną. Nie określamy ani
prawdopodobieństw rij ani prawdopodobieństw pi oraz qj .
Orzekamy jedynie, że prawdopodobieństwo rij jest równe
iloczynowi pewnych liczb pi oraz qj , które będziemy traktować jako
parametry. Ponieważ
p1 + p2 + ... + pa = 1
oraz
q1 + q2 + ... + qb = 1
więc mamy a + b − 2 niezależnych parametrów, które musimy
estymować na podstawie danych.
Dwa pozostałe parametry, pa oraz qb , określamy za pomocą
równości
pa = 1 −
a−1
∑
pi
oraz
i=1
Krzysztof Topolski
qb = 1 −
b−1
∑
qj .
j=1
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Estymacji dokonujemy na podstawie n elementowej próby prostej
(X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ). Oznaczmy przez Oij liczbę par
(Xk , Yk ) równych (xi , yj ). Wygodnie jest zapisać dane w tabeli
X/Y
x1
x2
..
.
y1
y2 ... yb Suma
O11 O12 ... O1b
O1⋅
O21 O22 ... O2b
O2⋅
.
...
... ... ...
O ..
1
xa
Oa1 Oa2 ... Oab
Suma O⋅1 O⋅2 ... O⋅b
Oa⋅
n
gdzie
Oi⋅ − oznacza sumę liczb w i − tym wierszu,
O⋅j − oznacza sumę liczb w j − tej kolumnie.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Testowanie hipotezy o niezależności
Estymatorami wyznaczonymi metoda największej wiarogodności
nieznanych parametrów p1 , ..., pa oraz q1 , ..., qb są odpowiednio
p̂i =
Oi⋅
,
n
i = 1, ..., a,
qˆj =
O⋅j
,
n
j = 1, ..., b.
oraz
Krzysztof Topolski
Testowanie hipotez statystycznych.
Procedurę testowania opieramy na statystyce testowej
𝜒2P =
(
a
b ∑
Oij − n Oni⋅
∑
j=1 i=1
n Oni⋅
O⋅j
n
)2
O⋅j
n
.
Po przekształceniu
𝜒2P = n
(
b ∑
a
Oij −
∑
j=1 i=1
Oi⋅ O⋅j
n
Oi⋅ O⋅j
)2
.
Statystyka 𝜒2P ma asymptotyczny rozkład chi kwadrat z
(a − 1)(b − 1) stopniami swobody.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Procedurę testowania opieramy na statystyce testowej
𝜒2P =
(
a
b ∑
Oij − n Oni⋅
∑
j=1 i=1
n Oni⋅
O⋅j
n
)2
O⋅j
n
.
Po przekształceniu
𝜒2P = n
(
b ∑
a
Oij −
∑
j=1 i=1
Oi⋅ O⋅j
n
Oi⋅ O⋅j
)2
.
Statystyka 𝜒2P ma asymptotyczny rozkład chi kwadrat z
(a − 1)(b − 1) stopniami swobody.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Procedurę testowania opieramy na statystyce testowej
𝜒2P =
(
a
b ∑
Oij − n Oni⋅
∑
j=1 i=1
n Oni⋅
O⋅j
n
)2
O⋅j
n
.
Po przekształceniu
𝜒2P = n
(
b ∑
a
Oij −
∑
j=1 i=1
Oi⋅ O⋅j
n
Oi⋅ O⋅j
)2
.
Statystyka 𝜒2P ma asymptotyczny rozkład chi kwadrat z
(a − 1)(b − 1) stopniami swobody.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Stopnie swobody
Liczba stopni swobody wynika z faktu, że mamy k = ab klatek
oraz szacujemy a + b − 2 niezależnych parametrów, a więc liczba
swobody rozkładu statystyki testowej jest równa
𝜈 = ab − 1 − (a + b − 2) = (a − 1)(b − 1).
Krzysztof Topolski
Testowanie hipotez statystycznych.
Stopnie swobody
Liczba stopni swobody wynika z faktu, że mamy k = ab klatek
oraz szacujemy a + b − 2 niezależnych parametrów, a więc liczba
swobody rozkładu statystyki testowej jest równa
𝜈 = ab − 1 − (a + b − 2) = (a − 1)(b − 1).
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład
W fabryce telewizorów sądzi się, że jakość obrazu
wyprodukowanego telewizora nie zależy od jakości dźwięku. Aby
sprawdzić to przypuszczenie, zbadano 100 wybranych losowo
telewizorów i otrzymano wynik podany w tablicy:
Obraz/Dźwięk zła dobra wysoka Suma
zła
11
17
6
34
dobra
15
18
7
40
wysoka
8
8
10
26
Suma
34
43
23
100
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład
W fabryce telewizorów sądzi się, że jakość obrazu
wyprodukowanego telewizora nie zależy od jakości dźwięku. Aby
sprawdzić to przypuszczenie, zbadano 100 wybranych losowo
telewizorów i otrzymano wynik podany w tablicy:
Obraz/Dźwięk zła dobra wysoka Suma
zła
11
17
6
34
dobra
15
18
7
40
wysoka
8
8
10
26
Suma
34
43
23
100
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Należy postawić i przetestować hipotezę, przyjmując poziom
istotności 1 − 𝛼 = 0, 9.
Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od
jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Należy postawić i przetestować hipotezę, przyjmując poziom
istotności 1 − 𝛼 = 0, 9.
Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od
jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Należy postawić i przetestować hipotezę, przyjmując poziom
istotności 1 − 𝛼 = 0, 9.
Hipoteza zerowa orzeka, że jakość dźwięku jest niezależna od
jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Oczekiwana częstość w poszczególnych klatkach.
Jakość obrazu/dźwięku zła dobra wysoka Suma
zła
11, 56 14, 62
7, 82
34
dobra
13, 60 17, 20
9, 20
40
wysoka
8, 84 11, 18
5, 98
26
Suma
34, 00 43, 00 23, 00
100
Otrzymujemy wartość statystyki 𝜒2P = 5, 23 dla rozkładu 𝜒2 z 4
stopniami swobody daje to p−wartość równą 0,26.
Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość
dźwięku jest niezależna od jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Oczekiwana częstość w poszczególnych klatkach.
Jakość obrazu/dźwięku zła dobra wysoka Suma
zła
11, 56 14, 62
7, 82
34
dobra
13, 60 17, 20
9, 20
40
wysoka
8, 84 11, 18
5, 98
26
Suma
34, 00 43, 00 23, 00
100
Otrzymujemy wartość statystyki 𝜒2P = 5, 23 dla rozkładu 𝜒2 z 4
stopniami swobody daje to p−wartość równą 0,26.
Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość
dźwięku jest niezależna od jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Przykład cd.
Oczekiwana częstość w poszczególnych klatkach.
Jakość obrazu/dźwięku zła dobra wysoka Suma
zła
11, 56 14, 62
7, 82
34
dobra
13, 60 17, 20
9, 20
40
wysoka
8, 84 11, 18
5, 98
26
Suma
34, 00 43, 00 23, 00
100
Otrzymujemy wartość statystyki 𝜒2P = 5, 23 dla rozkładu 𝜒2 z 4
stopniami swobody daje to p−wartość równą 0,26.
Tak więc nie ma podstaw do odrzucenia hipotezy zerowej. Jakość
dźwięku jest niezależna od jakości obrazu.
Krzysztof Topolski
Testowanie hipotez statystycznych.
Tablice kontyngencji
Dla danych, które możemy przedstawić w tablicy dwudzielczej
X/Y
0
1
0
a
b
1
c
d
Suma a + c b + d
Suma
a+b
c +d
n
statystyka 𝜒2P przyjmuje postać
𝜒2P =
n(ad − bc)2
.
(a + b)(c + d)(a + c)(b + d)
Krzysztof Topolski
Testowanie hipotez statystycznych.
Tablice kontyngencji
Dla danych, które możemy przedstawić w tablicy dwudzielczej
X/Y
0
1
0
a
b
1
c
d
Suma a + c b + d
Suma
a+b
c +d
n
statystyka 𝜒2P przyjmuje postać
𝜒2P =
n(ad − bc)2
.
(a + b)(c + d)(a + c)(b + d)
Krzysztof Topolski
Testowanie hipotez statystycznych.

Podobne dokumenty