98-16 Przeglad Statyst. 2

Transkrypt

PRZEGLĄD STATYSTYCZNY
R. LXIII – ZESZYT 2 – 2016
PIOTR SULEWSKI1
MOC TESTÓW NIEZALEĩNOĝCI
W TABLICY DWUDZIELCZEJ WIĉKSZEJ NIĩ 2 × 2
1. WPROWADZENIE
Moc testów niezaleĪnoĞci to prawdopodobieĔstwo odrzucenia hipotezy zerowej H0,
gdy nie jest ona prawdziwa. W kaĪdym popularnym podrĊczniku ze statystyki znajdują
siĊ informacje o m.in. takich testach jak: niezaleĪnoĞci, t Studenta, Koámogorowa
czy Behrensa-Fishera. Nie sposób nie zgodziü siĊ zatem z tezą, Īe testy niezaleĪnoĞci – obok wspomnianych wczeĞniej testów – są zapewne najczĊĞciej stosowanymi
narzĊdziami statystycznym. Dane do testów niezaleĪnoĞci aranĪuje siĊ w postaci tablic
dwudzielczych (TD).
W pracy porównano rodzinĊ szeĞciu tzw. „statystyk chi-kwadrat” – w skáad której
wchodzi powszechnie znana i czĊsto stosowana statystyka Ȥ2 Pearsona – ze statystyką
moduáową zaproponowaną w Sulewski (2013). Pearson w statystyce Ȥ2 uĪyá kwadratu
dlatego, aby móc skorzystaü z rozkáadu chi-kwadrat jako miary rozbieĪnoĞci. Kwadrat
uĪyty w liczniku statystyki Ȥ2 powoduje równieĪ, Īe duĪe rozbieĪnoĞci miĊdzy liczebnoĞcią empiryczną a oczekiwaną są jeszcze wiĊksze, a maáe rozbieĪnoĞci jeszcze
mniejsze. Innym celem jego zastosowania byáo unikniĊcie wzajemnego niwelowania
siĊ rozbieĪnoĞci. Do tego jednak celu zamiast kwadratu odchyleĔ moĪna uĪyü takĪe
ich wartoĞci bezwzglĊdnej, stąd narodziá siĊ pomysá na statystykĊ moduáową.
W Sulewski (2014) pokazano, Īe tzw. „statystyki chi-kwadrat”: Ȥ2 Pearsona, G2 ilorazu wiarygodnoĞci, N Neymana, KL Kullbacka-Leiblera, FT Freemana-Tukeya oraz
CR Cressiego-Reada, mają rozkáad chi-kwadrat dla próbek liczących przynajmniej
kilkaset elementów. Korzystanie ze „statystyk chi-kwadrat” – szczególnie dla maáych
próbek – wiąĪe siĊ ze stosowaniem róĪnego rodzaju ograniczeĔ. Np. ze statystyki
Ȥ2 Pearsona w tablicach dwudzielczych wiĊkszych niĪ 2 × 2 moĪna korzystaü, gdy
wszystkie liczebnoĞci oczekiwane są nie mniejsze od 1oraz gdy nie wiĊcej niĪ 20%
tych wartoĞci jest mniejsze niĪ 5 (Yates i inni, 1999; Shier, 2004). Zdaniem Cochran’a
(1952) statystykĊ Ȥ2 Pearsona dla tablic wiĊkszych niĪ 2 × 2 moĪna stosowaü, gdy
przynajmniej jedna z liczebnoĞci oczekiwanych jest wiĊksza niĪ 5. W celu zniesienia powyĪszych ograniczeĔ w niniejszej pracy zaproponowano wyznaczanie wartoĞci
krytycznych na drodze symulacji komputerowych metodą Monte Carlo. Wyznaczanie
1
Akademia Pomorska w Sáupsku, Instytut Matematyki, ul. Arciszewskiego 22, 76-200 Sáupsk,
Polska, e-mail: [email protected].
192
Piotr Sulewski
wartoĞci krytycznych na podstawie np. 100.000 wartoĞci statystyki testowej – w dobie
wydajnych komputerów z procesorami wielordzeniowymi – nie stanowi problemu, bo
trwa kilkadziesiąt sekund.
Wymienione powyĪej testy porównano ze wzglĊdu na ich moc – czyli zdolnoĞci
TD w × k do odrzucenia H0 mówiącej o tym, Īe nie ma związku miĊdzy cechami X
i Y. Do wyznaczenia mocy testów tablice dwudzielcze w × k generowano za pomocą
metody sáupkowej oraz zaproponowano miarĊ nieprawdziwoĞci H0 przyjmującą róĪne
wartoĞci dla danego schematu wyznaczania prawdopodobieĔstw pij (i,j = 1,2), dla
których H0 jest niesáuszna.
Niniejsza praca jest kontynuacją rozwaĪaĔ podjĊtych w Sulewski (2016), gdzie
omawianą tematykĊ zastosowano dla TD 2 × 2. Pierwszym celem pracy jest przedstawienie teorii dotyczącej testów niezaleĪnoĞci dla TD w × k, drugim celem – wprowadzenie miary nieprawdziwoĞci H0 oraz porównanie jakoĞci testów za pomocą ich
mocy. Praca skáada siĊ z dwóch czĊĞci. W czĊĞci I realizowany jest cel pierwszy,
zdefiniowano w niej TD w × k oraz siedem testów niezaleĪnoĞci, opisano sposób
generowania TD i wyznaczania wartoĞci krytycznych. W czĊĞci II realizowany jest
cel drugi, zdefiniowano w niej miarĊ nieprawdziwoĞci H0 oraz wyznaczono moc analizowanych testów niezaleĪnoĞci w celu wyáonienia najlepszego testu.
2. TABLICA DWUDZIELCZA w × k
Tabela 1 przedstawia tablicĊ dwudzielczą w × k, która skáada siĊ z wartoĞci nij
Z
N
(i = 1,2,…,w; j = 1,2,…,k) rozkáadu áącznego cech X i Y takich, Īe ¦ L ¦ M Q LM Q .
Tabela 1.
Tablica dwudzielcza w × k liczebnoĞci
Cecha Y
Razem
Cecha X
Y1
Y2
...
Yk
X1
n11
n12
...
n1k
n1•
X2
n21
n22
...
n2k
n2•
...
...
...
...
...
...
Xw
n12
n12
...
nwk
n12
Razem
n•1
n•2
...
n*k
n
ħródáo: opracowanie wáasne.
LiczebnoĞci oczekiwane i-tego wiersza i j-tej kolumny wyznacza siĊ ze wzoru
HLM
QL x Qx M
Q
, (i = 1,2,…,w; j = 1,2,…,k).
(1)
193
Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2
TablicĊ dwudzielczą w × k moĪna takĪe przedstawiü wykorzystując prawdopodoZ
N
bieĔstwa pij (i = 1,2,…,w; j = 1,2,…,k) takie, Īe ¦ L ¦ M S LM . W odniesieniu do
tabeli 1 wartoĞci te wyznaczane są ze wzoru pij = nij / n (i = 1,2,…,w; j = 1,2,…,k).
GeneracjĊ TD w × k niezbĊdną do przeprowadzenia symulacji i wyznaczenia mocy
testów przeprowadzono metodą sáupkową. W tym celu przedziaá (o,1´ podzielono
na w Â k podprzedziaáów o szerokoĞciach równych wartoĞci prawdopodobieĔstw pij
w taki sposób, Īe pierwszy podprzedziaá ma szerokoĞü p11, drugi – p12, …, k-ty
– p1k,…, ostatni – pwk. WielkoĞci pij speániają oczywiĞcie warunek normalizacji
Z
N
¦ L ¦ M S LM i dobrano je w taki sposób, aby uzyskaü Īądaną wartoĞü miary
nieprawdziwoĞci H0.
KaĪda z n wygenerowanych liczb losowych równomiernych „wpada” do jednego z podprzedziaáów i tym samym zostaje o jedną zwiĊkszona liczba obiektów
w odpowiadającej temu podprzedziaáowi komórce TD. WielkoĞci nij speániające rówZ
N
noĞü ¦ L ¦ M Q LM Q są liczebnoĞcią obiektów w poszczególnych komórkach TD.
Rysunek 1 przedstawia schemat wypeániania komórek TD 4 × 2 dla liczebnoĞci próby
n = 2000 i miary nieprawdziwoĞci H0 równej 0, czyli pij = 0,125 dla kaĪdego i = 1,2,…,4;
j = 1,2. Tabela 2 prezentuje odpowiadającą temu schematowi tablicĊ dwudzielczą.
n = 2000 liczb losowych równomiernych
p11
0
p12
0,125
n11 = 264
p21
0,25
n12 = 245
p22
0,325
p31
0,5
p32
0,625
p41
0,75
p42
0,875
n21 = 245 n22 = 231 n31 = 274 n32 = 253 n41 = 252
1
n42 = 236
Rysunek 1. Schemat wypeániania komórek TD 4 × 2
Tabela 2.
Tablica dwudzielcza w × k otrzymana metoda sáupkową
Cecha Y
Razem
Cecha X
Y1
Y2
X1
264
245
509
X2
245
231
476
X3
274
253
527
X4
252
236
488
Razem
1035
965
2000
194
Piotr Sulewski
3. TESTY NIEZALEĩNOĝCI W TABLICY DWUDZIELCZEJ w × k
Do badania niezaleĪnoĞci cech X i Y w TD w × k skorzystano ze statystyki moduáowej bĊdącej modyfikacją statystyki Ȥ2 Pearsona (Sulewski, 2013):
F
Z
N
¦¦
Q LM HLM
(2)
HLM
L M oraz z rodziny statystyk, które dla TD w × k mają asymptotyczny rozkáad chi-kwadrat
z (w-1)(k-1) stopniami swobody i dlatego są okreĞlane mianem „statystyk chi-kwadrat”
(Cressie, Read, 1984). Są to:
1) Powszechnie znana i czĊsto stosowana statystyka Ȥ2 Pearsona (Pearson, 1900)
F
Z
Q
N
¦¦
LM
HLM HLM
L M ;
(3)
2) Statystyka G2 ilorazu wiarygodnoĞci (Sokal, Rohlf, 2012)
*
§ QLM
¦¦ QLM OQ¨
¨H
L M © LM
Z
N
·
¸;
¸
¹
(4)
;
(5)
3) Statystyka N Neymana (Neyman, 1949)
Z
Q
N
¦¦
1
HLM LM
QLM
L M 4) Statystyka KL Kullbacka-Leiblera (Kullback, 1959)
./
§ HLM
¦¦ HLM OQ¨
¨Q
L M © LM
Z
N
·
¸;
¸
¹
(6)
5) Statystyka FT Freemana-Tukeya (Freeman, Tukey, 1950)
)7
Z
N
¦ ¦
Q LM HLM
;
(7)
L M 6) Statystyka CR Cressiego-Reada (Cressie, Read, 1984)
&5
ª§ Q
Z N
«¨ LM
Q
¦¦
LM ¨
L M «© HLM
¬
·
¸
¸
¹
º
» .
»
¼
(8)
195
CharakterystykĊ statystyk „chi-kwadrat” dla tablic dwudzielczych, trójdzielczych
i czterodzielczych wraz z implementacją komputerową moĪna znaleĨü w pracy
Sulewskiego (2014).
W Sulewski, Motyka (2015a), korzystając z metody Monte Carlo, porównano
jakoĞü „statystyk chi-kwadrat” wyraĪoną w funkcji mocy przy zaáoĪeniu, Īe statystyki
te – jaką twierdzą ich autorzy – podlegają rozkáadowi chi-kwadrat. Badania wykazaáy,
Īe jakoĞü testu Ȥ2 Pearsona oraz CR Cressiego-Reada jest porównywalna i znacznie
lepsza od pozostaáych.
LiczebnoĞci nij (i = 1,2,…,w; j = 1,2,…,k) w TD w × k są zmiennymi losowymi.
Godnym uwagi jest, Īe zmienne losowe bĊdące odwrotnoĞcią lub ilorazem zmiennych losowych nie posiadają wartoĞci oczekiwanej i w konsekwencji takĪe niektórych
momentów wyĪszych rzĊdów. Rozkáad chi-kwadrat – jak powszechnie wiadomo –
posiada wszystkie momenty.
Ponadto poĪądanym jest, aby poszczególne skáadniki statystyki testowej – gdy H0
o niezaleĪnoĞci cech X i Y jest sáuszna – byáy tego samego znaku i jak najbliĪsze 0.
Skáadniki statystyk (4), (6) i (8) są róĪnego znaku i wzajemnie siĊ rekompensują i tylko
dla bardzo duĪych prób podlegają rozkáadowi chi-kwadrat (Sulewski, 2014). Aby to
pokazaü metodą sáupkową opisaną powyĪej wygenerowano tablicĊ dwudzielczą 3 × 3
o liczebnoĞci próby n = 150, gdy hipoteza H0 o niezaleĪnoĞci cech X i Y jest sáuszna,
czyli pij = 1/9(i,j = 1,2,3). Tabela 3 przedstawia wartoĞci poszczególnych skáadników
„statystyk chi-kwadrat” (wartoĞci ujemne pogrubiono).
Tabela 3.
WartoĞci skáadników „statystyk chi-kwadrat”
Skáadnik
Ȥ2
G2
N
KL
FT
CR
i=1, j=1
0,029
1,362
0,028
-1,305
0,007
0,829
i=1, j=2
0,003
0,429
0,003
-0,424
0,001
0,259
i=1, j=3
0,060
-1,698
0,065
1,823
0,016
-0,995
i=2, j=1
0,381
-4,933
0,444
5,755
0,103
-2,813
i=2, j=2
0,616
-6,652
0,741
8,003
0,169
-3,755
i=2, j=3
2,547
14,901
1,816
-10,620
0,534
10,030
i=3, j=1
0,250
4,240
0,222
-3,769
0,059
2,647
i=3, j=2
0,638
7,481
0,538
-6,312
0,146
4,753
i=3, j=3
2,202
-8,301
3,699
13,945
0,702
-4,210
Razem
6,726
6,829
7,556
7,095
1,735
6,744
196
Piotr Sulewski
4. WYZNACZANIE WARTOĝCI KRYTYCZNYCH
W okresie ostatnich kilkudziesiĊciu lat zaproponowano róĪne testy niezaleĪnoĞci
dla tablic dwudzielczych oraz okreĞlono warunki ich stosowalnoĞci szczególnie dla
maáych prób, które najczĊĞciej są przedmiotem badaĔ statystycznych. W dobie coraz to
szybszych komputerów z procesorami wielordzeniowymi oraz rozbudowaną pamiĊcią
operacyjną, moĪna za pomocą stosownego oprogramowania znieĞü te ograniczenia
i drogą symulacyjną wyznaczyü wartoĞci krytyczne.
Przy wyznaczaniu wartoĞci krytycznych, gdy miĊdzy cechami nie ma związku,
zawartoĞü tablic dwudzielczych w × k o liczebnoĞci próby n generowano za pomocą
metody sáupkowej przyjmując pij = 1/(w Â k) (i = 1,2,…,w; j = 1,2,…,k). Dla kaĪdej
TD w × k obliczono r = 105 wartoĞci kaĪdej analizowanej statystyki testowej ‫׌‬, które
nastĊpnie uporządkowano w kolejnoĞci rosnącej. WartoĞü krytyczną na poziomie istotnoĞci Į = 0,1 wyznaczono ze wzoru:
Y .
FYD
(9)
Tak duĪa liczba powtórzeĔ r przy wyznaczaniu wartoĞci statystyki testowej zapewnia uzyskanie dokáadnego wyniku.
5. MOC TESTU
Moc testu to prawdopodobieĔstwo odrzucenia hipotezy zerowej H0, gdy nie jest
ona prawdziwa. Moc testu zaleĪy od liczebnoĞci próby – im liczniejsza próba, tym
wiĊksza moc. Moc testu zaleĪy takĪe od poziomu istotnoĞci testu – im niĪszy poziom
istotnoĞci, tym mniejsza moc testu. Moc testu zaleĪy równieĪ od siáy związku miĊdzy
cechami – im wiĊksza siáa związku, tym wiĊksza moc testu. WiĊcej informacji o mocy
testu znaleĨü moĪna m.in. w Sulewski (2015b).
W celu wyznaczenia mocy testu – czyli zdolnoĞci TD do odrzucenia hipotezy
mówiącej o tym, Īe nie ma związku miĊdzy cechami X i Y – gdy w istocie związek
jest, niezbĊdna jest generacja tablic dwudzielczych. Dane podlegające opracowaniu
muszą byü danymi pochodzącymi z generatora liczb losowych, a nie danymi wziĊtymi z praktyki. UwzglĊdniając narzuconą siáĊ związku miĊdzy cechami wyraĪoną za
pomocą miary nieprawdziwoĞci H0 danej wzorem
PQ Zu N
Z
N
¦¦
S LM S L x S x M ,
(10)
L M do wypeánienia TD w × k skorzystano z metody „sáupkowej” wykorzystującej prawdopodobieĔstwa pij (i = 1,2,…,w; j = 1,2,…,k).
Znając wartoĞü statystyki testowej ‫ ׌‬dla róĪnych liczebnoĞci próby n wyznaczono
moc testu za pomocą wzoru m = u/r, gdzie u okreĞla liczbĊ tych spoĞród r = 105
197
wszystkich moĪliwych przypadków, kiedy to wartoĞü statystyki testowej ‫ ׌‬jest nie
mniejsza od wartoĞci krytycznej cvĮ.
Hipoteza zerowa H0 – mówiąca o tym, Īe miĊdzy cechami X i Y w TD w × k nie
ma związku – jest sáuszna, gdy pij = pi• Â p•j dla i = 1,2,…,w; j = 1,2,…,k. Zatem miara
(10) przyjmuje wartoĞü 0, gdy hipoteza H0 jest sáuszna. Im wiĊksze wartoĞci mn, tym
wiĊksza jest moĪliwoĞü faászywoĞci H0.
Do wyznaczenia mocy testu dla TD w × k skorzystano z róĪnych schematów
wyznaczania prawdopodobieĔstw pij (i = 1,2,…,w; j = 1,2,…,k), dla których hipoteza
zerowa H0 jest niesáuszna. PrawdopodobieĔstwa te – jak równieĪ przedziaáy zmiennoĞci miary mn dla omawianych schematów – przedstawiono w tabelach 5, 7, 9, 11, 13.
Wynika z nich, Īe miara nieprawdziwoĞci hipotezy H0 zmienia siĊ w róĪnych przedziaáach. Minimalna liczebnoĞü próby dla danej TD i dla danego schematu zostaáa tak
dobrana, aby liczebnoĞci oczekiwane byáy róĪne od zera. Maksymalną wartoĞü próby
ustalono tak, aby uzyskaü maksymalną moc testu.
Dla statystyki moduáowej |Ȥ| oraz dla „statystyki chi-kwadrat” o najwiĊkszej mocy,
uzyskane wyniki porównano za pomocą testu o równoĞci prawdopodobieĔstw stawiając hipotezĊ zerową, Īe moce testów są równe, czyli róĪnice są statystycznie nieistotne.
TABLICA DWUDZIELCZA 2 × 3
Tabela 4.
Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 2 × 3
p0 = 1/6, ǻp = p0/10, k = 0,1,…,9
Schemat A
Y1
Y2
Y3
X1
po – k ǻp
po
po
X2
po
po
po + k ǻp
Y1
Y2
Y3
X1
po – k ǻp
po – k ǻp
po
X2
po
po + k ǻp
po + k ǻp
Y1
Y2
Y3
X1
po – k ǻp
po – k ǻp
po
X2
po + k ǻp
po + k ǻp
po
Y1
Y2
Y3
X1
po – k ǻp
po
po + k ǻp
X2
po + k ǻp
po
po – k ǻp po
Schemat B
Schemat C
Schemat D
198
Piotr Sulewski
ϭ͕ϬϬ
ϭ͕ϬϬ
Ϭ͕ϵϬ
Ϭ͕ϴϬ
Ϭ͕ϳϬ
ͮʖͮ
ʖϮ
'Ϯ
E
<>
&d
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Z
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϰ
Ϭ͕Ϭϲ
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
0LDUDQLHSUDZG]LZRĞFLPQ
Ϭ
I
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕Ϭϲ
II
Ϭ͕ϵϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϰ
Ϭ͕Ϭϲ
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
Ϭ͕ϮϮ
Ϭ͕Ϯϰ
Ϭ͕Ϯϲ
Ϭ͕Ϯϴ
Ϭ
III
Ϭ͕ϬϮ
Ϭ͕Ϭϰ
Ϭ͕Ϭϲ
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
Ϭ͕ϮϮ
Ϭ͕Ϯϰ
Ϭ͕Ϯϲ
Ϭ͕Ϯϴ
IV
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕Ϭϰ
ϭ͕ϬϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϰ
Ϭ͕Ϭϲ
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
Ϭ͕ϮϮ
Ϭ͕Ϯϰ
Ϭ͕Ϯϲ
Ϭ͕Ϯϴ
Ϭ͕ϯ
Ϭ͕ϯϮ
Ϭ͕ϯϰ
Ϭ͕ϯϲ
Ϭ͕ϯϴ
Ϭ͕ϰ
Ϭ
V
Ϭ͕ϬϮ
Ϭ͕Ϭϰ
Ϭ͕Ϭϲ
Ϭ͕Ϭϴ
Ϭ͕ϭ
Ϭ͕ϭϮ
Ϭ͕ϭϰ
Ϭ͕ϭϲ
Ϭ͕ϭϴ
Ϭ͕Ϯ
Ϭ͕ϮϮ
Ϭ͕Ϯϰ
Ϭ͕Ϯϲ
Ϭ͕Ϯϴ
Ϭ͕ϯ
Ϭ͕ϯϮ
Ϭ͕ϯϰ
Ϭ͕ϯϲ
Ϭ͕ϯϴ
Ϭ͕ϰ
VI
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
ͮʖͮ
ʖϮ
'Ϯ
E
<>
&d
Ϭ͕ϵϬ
Ϭ͕ϵϬ
Ϭ͕ϴϬ
<>
Ϭ͕ϳϬ
Z
&d
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϬϮ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϴϬ
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϲ
Ϭ͕ϭϮ
Ϭ͕ϭϴ
Ϭ͕Ϯϰ
Ϭ͕ϯ
Ϭ͕ϯϲ
Ϭ͕ϰϮ
Ϭ͕ϰϴ
Ϭ͕ϱϰ
Ϭ
Ϭ͕ϲ
Ϭ͕Ϭϲ
Ϭ͕ϭϮ
Ϭ͕ϭϴ
Ϭ͕Ϯϰ
Ϭ͕ϯ
Ϭ͕ϯϲ
Ϭ͕ϰϮ
Ϭ͕ϰϴ
VIII
VII
Rysunek 2. Moc testów niezaleĪnoĞci dla TD 2 × 3 oraz liczebnoĞci próby n
I. Schemat A, n = 125
V. Schemat C, n = 50
II. Schemat A, n = 150
VI. Schemat C, n = 75
III. Schemat B, n = 125
VII. Schemat D, n = 30
IV. Schemat B, n = 150
VIII. Schemat D, n = 40
Ϭ͕ϱϰ
Ϭ͕ϲ
199
Tabela 5.
Miara nieprawdziwoĞci H0 dla TD 2 × 3 i k = 0,1,...,9
Schemat A
mn2 × 3 = k / 45
Schemat B
N
N mn2 × 3 = ® ¯N N N
mn2 × 3 ¤0;0,2´
mn2 × 3 ¤0;0,28´
Schemat C
Schemat D
mn2 × 3 = 2k / 45
mn2 × 3 = k / 15
mn2 × 3 ¤0;0,4´
mn2 × 3 ¤0;0,6´
Rysunek 2 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD
2 × 3, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n.
Z rysunku 2 wynika, Īe „statystyki chi-kwadrat” dla TD 2 × 3 mają podobną moc,
a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne. Dla schematu A róĪnice miĊdzy statystyką |Ȥ|, a pozostaáymi analizowanymi statystykami są statystycznie
istotne dla mn ¤0,133;0,178´. Dla schematu B oraz n = 125, n = 150 róĪnice te
są statystycznie istotne odpowiednio dla mn ¤0,147;0,280´ i mn ¤0,111;0,231´.
Dla schematu C statystyka |Ȥ| ma istotnie wiĊkszą moc od pozostaáych statystyk,
gdy mn ¤0,222;0,4´. Dla schematu D róĪnice miĊdzy statystykami są statystycznie
nieistotne.
Tabela 6.
p0 = 1/8, ǻp = p0/10, k = 0,1,…,9
Schemat A
Y1
Y2
Y3
Y4
X1
po – k ǻp
po
po
po
X2
po
po
po
po + k ǻp
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp
po
po
X2
po
po
po + k ǻp
po + k ǻp
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp
po
po
X2
po + k ǻp
po + k ǻp
po
po
Schemat B
Schemat C
200
Piotr Sulewski
Tabela 6. (cd.)
Schemat D
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp
po + k ǻp
po + k ǻp
X2
po + k ǻp
po + k ǻp
po – k ǻp
po – k ǻp
Tabela 7.
Schemat A
Schemat B
Schemat C
Schemat D
mn2 × 4 = k / 40
mn2 × 4 = k2 / 400
mn2 × 4 = k / 20
mn2 × 4 = 3k / 40
mn2 × 4 ¤0;0,225´
mn2 × 4 ¤0;0,2025´
mn2 × 4 ¤0;0,45´
mn2 × 4 ¤0;0,675´
Rysunek 3 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla
TD 2 × 4, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n.
Z rysunku 3 wynika, Īe dla schematów A, C, D „statystyki chi-kwadrat” dla
TD 2 × 4 mają podobną moc, a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne. Dla schematu A statystyka |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ pozostaáe
statystyki, jednak przewaga ta jest statystycznie istotna dla n = 175 i mn = 0,175.
Podobna sytuacja jest dla schematu B, gdy mn ¤0,09;0,203´. Dla schematu C róĪnica
istotna statystycznie na korzyĞü statystyki moduáowej jest dla n = 50 i mn ¤0,3;0,45´
oraz n = 100 i mn ¤0,3;0,35´. Dla schematu D róĪnice miĊdzy statystykami są nieistotne statystycznie.
201
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϮϱ
Ϭ͕Ϭϱ
Ϭ͕Ϭϳϱ
Ϭ͕ϭ
Ϭ͕ϭϮϱ
Ϭ͕ϭϱ
Ϭ͕ϭϳϱ
Ϭ͕Ϯ
Ϭ͕ϮϮϱ
Ϭ
I
Ϭ͕ϬϮϱ
Ϭ͕Ϭϱ
Ϭ͕Ϭϳϱ
Ϭ͕ϭ
Ϭ͕ϭϮϱ
Ϭ͕ϭϱ
Ϭ͕ϭϳϱ
Ϭ͕Ϯ
Ϭ͕ϮϮϱ
II
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
E
Ϭ͕ϴϬ
Ϭ͕ϮϬ
Ϭ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϯ
Ϭ͕Ϭϲ
Ϭ͕Ϭϵ
Ϭ͕ϭϮ
Ϭ͕ϭϱ
Ϭ͕ϭϴ
Ϭ͕Ϯϭ
Ϭ
III
Ϭ͕Ϭϯ
Ϭ͕Ϭϲ
Ϭ͕Ϭϵ
Ϭ͕ϭϮ
Ϭ͕ϭϱ
Ϭ͕ϭϴ
Ϭ͕Ϯϭ
IV
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ʖϮ
'Ϯ
Ϭ͕ϯϬ
Ϭ͕ϬϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ͕ϯϱ
Ϭ͕ϰ
Ϭ
Ϭ͕ϰϱ
Ϭ͕Ϭϱ
Ϭ͕ϭ
V
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ͕ϯϱ
Ϭ͕ϰ
Ϭ͕ϰϱ
VI
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ͮʖͮ
Ϭ͕ϵϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϵϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕ϭϮϱ
Ϭ͕Ϯϱ
Ϭ͕ϯϳϱ
Ϭ͕ϱ
Ϭ͕ϲϮϱ
Ϭ
Ϭ͕ϭϮϱ
Ϭ͕Ϯϱ
Ϭ͕ϯϳϱ
Ϭ͕ϱ
VII
VIII
VII. Schemat D, n = 30
VIII. Schemat D, n = 50
Ϭ͕ϲϮϱ
202
Piotr Sulewski
Tabela 8.
p0 = 1/9, ǻp = p0/10, k = 0,1,…,9
Schemat A
Y1
Y2
Y3
X1
po – k ǻp
po – k ǻp / 2
po
X2
po – k ǻp / 2
po
po + k ǻp / 2
X3
po
po + k ǻp / 2
po + k ǻp
Y1
Y2
Y3
X1
po – k ǻp
po – k ǻp
po
X2
po
po
po
X3
po + k ǻp
po + k ǻp
po
Y1
Y2
Y3
X1
po – k ǻp
po
po + k ǻp
X2
po
po
po
X3
po + k ǻp
po
po – k ǻp
Schemat B
Schemat C
Tabela 9.
Schemat A
Schemat B
Schemat C
mn3 × 3 = k2 / 900
mn3 × 3 = 0,02963 Â k
mn3 × 3 = 2k / 45
mn3 × 3 ¤0;0,09´
mn3 × 3 ¤0;0,2667´
mn3 × 3 ¤0;0,04´
Z rysunku 4 wynika, Īe dla schematów B, C „statystyki chi-kwadrat” dla TD 3 × 3
mają podobną moc, a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne.
Dla schematu A statystyka |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ statystyka N,
jednak przewaga ta jest statystycznie istotna dla n = 300 i mn ¤0,04;0,09´ oraz
n = 400 i mn ¤0,028;0,09´. Statystyka |Ȥ| charakteryzuje siĊ takĪe wiĊkszą mocą
203
od pozostaáych statystyk dla schematu B i przewaga ta jest statystycznie istotna dla
mn ¤0,148;0,267´. Dla schematu C „statystyki chi-kwadrat” mają wiĊkszą moc od
statystyki moduáowej, jednak przewaga ta jest statystycznie istotna tylko dla n = 50
i mn = 0,311.
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ͕Ϭϴ
Ϭ͕Ϭϵ
Ϭ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
I
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ͕Ϭϴ
Ϭ͕Ϭϵ
II
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ʖϮ
'Ϯ
Ϭ͕ϯϬ
Ϭ͕ϬϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϯ
Ϭ͕Ϭϲ
Ϭ͕Ϭϵ
Ϭ͕ϭϮ
Ϭ͕ϭϱ
Ϭ͕ϭϴ
Ϭ͕Ϯϭ
Ϭ͕Ϯϰ
Ϭ͕Ϯϳ
Ϭ
Ϭ͕Ϭϯ
Ϭ͕Ϭϲ
Ϭ͕Ϭϵ
III
Ϭ͕ϭϮ
Ϭ͕ϭϱ
Ϭ͕ϭϴ
Ϭ͕Ϯϭ
Ϭ͕Ϯϰ
Ϭ͕Ϯϳ
IV
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ͮʖͮ
Ϭ͕ϵϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϵϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϰ
Ϭ͕Ϭϴ
Ϭ͕ϭϮ
Ϭ͕ϭϲ
Ϭ͕Ϯ
Ϭ͕Ϯϰ
Ϭ͕Ϯϴ
Ϭ͕ϯϮ
Ϭ͕ϯϲ
Ϭ
Ϭ͕ϰ
V
Ϭ͕Ϭϰ
Ϭ͕Ϭϴ
Ϭ͕ϭϮ
Ϭ͕ϭϲ
Ϭ͕Ϯ
Ϭ͕Ϯϰ
Ϭ͕Ϯϴ
Ϭ͕ϯϮ
VI
Ϭ͕ϯϲ
Ϭ͕ϰ
204
Piotr Sulewski
Tabela 10.
p0 = 1/12, ǻp = p0/10, k = 0,1,…,9
Schemat A
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp / 2
po – k ǻp / 3
po
X2
po – k ǻp / 2
po
po
po + k ǻp / 2
X3
po
po + k ǻp / 3
po + k ǻp / 2
po + k ǻp
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp
po
po
X2
po
po
po
po
X3
po + k ǻp
po + k ǻp
po
po
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp / 2
po + k ǻp / 2
po + k ǻp
X2
po
pov
po
po
X3
po + k ǻp
po + k ǻp / 2
po – k ǻp / 2
po – k ǻp
Schemat B
Schemat C
Tabela 11.
Schemat A
Schemat B
Schemat C
mn3 × 4 = k2 / 1250 + k / 500
mn3 × 4 = k / 30
mn3 × 4 = k / 20
mn3 × 4 ¤0;0,084´
mn3 × 4 ¤0;0,03´
mn3 × 4 ¤0;0,45´
Z rysunku 5 (schemat A) wynika, Īe „statystyki chi-kwadrat” charakteryzują siĊ
róĪną mocą. Przy n = 400 róĪnice miĊdzy statystyką |Ȥ| a statystyką N jako reprezentanta „statystyk chi-kwadrat” o najwiĊkszej mocy, są statystycznie istotne dla
mn ¤0,031;0,054´, z kolei przy n = 500 – dla mn ¤0,042;0,054´. Dla schematu B
moc testu dla „statystyk chi-kwadrat” jest bardzo podobna. RóĪnice miĊdzy staty-
205
styką |Ȥ| a pozostaáymi statystykami są statystycznie istotne dla mn ¤0,2;0,3´ z korzyĞcią dla statystyki moduáowej. Dla schematu C i próby n = 75 funkcje mocy testów
dla statystyki |Ȥ| i N są bardzo podobne. Dla n = 100 funkcje mocy analizowanych
testów mają podobne przebiegi.
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ
Ϭ͕Ϭϴ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ͕Ϭϴ
II
I
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ʖϮ
'Ϯ
Ϭ͕ϯϬ
Ϭ͕ϬϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ
III
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
IV
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ͮʖͮ
Ϭ͕ϵϬ
Ϭ͕ϵϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ͕ϯϱ
Ϭ͕ϰ
Ϭ͕ϰϱ
Ϭ
V
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ͕ϯϱ
VI
Ϭ͕ϰ
Ϭ͕ϰϱ
206
Piotr Sulewski
Tabela 12.
p0 = 1/16, ǻp = p0/10, k = 0,1,…,9
Schemat A
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp / 2
po – k ǻp / 3
po
X2
po – k ǻp / 2
po – k ǻp / 3
po
po + k ǻp / 3
X3
po – k ǻp / 3
po
po + k ǻp / 3
po + k ǻp / 2
X4
po
po + k ǻp / 3
po + k ǻp / 2
po + k ǻp
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp
po
po
X2
po – k ǻp / 2
po – k ǻp / 2
po
po
X3
po + k ǻp / 2
po + k ǻp / 2
po
po
X4
po + k ǻp
po + k ǻp
po
po
Y1
Y2
Y3
Y4
X1
po – k ǻp
po – k ǻp / 2
po – k ǻp / 3
po
X2
po – k ǻp / 2
po – k ǻp / 3
po
po + k ǻp / 3
X3
po – k ǻp / 3
po
po + k ǻp / 3
po + k ǻp / 2
X4
po
po + k ǻp / 3
po + k ǻp / 2
po + k ǻp
Schemat B
Schemat C
Tabela 13.
Schemat A
Schemat B
Schemat C
½
mn4 × 4 ®
¾
¯ ¿
mn4 × 4 = 3k / 80
mn4 × 4 = 3k / 40
mn4 × 4 ¤0;0,084´
mn4 × 4 ¤0;0,338´
mn4 × 4 ¤0;0,675´
Rysunek 6 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD
4 × 4, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n.
207
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
<>
Ϭ͕ϳϬ
Z
&d
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
Ϭ͕ϴϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
E
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ
Ϭ͕Ϭϴ
Ϭ͕Ϭϭ
Ϭ͕ϬϮ
Ϭ͕Ϭϯ
Ϭ͕Ϭϰ
Ϭ͕Ϭϱ
Ϭ͕Ϭϲ
Ϭ͕Ϭϳ
Ϭ͕Ϭϴ
II
I
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ʖϮ
'Ϯ
Ϭ͕ϴϬ
Ϭ͕ϯϬ
Ϭ͕ϬϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
Ϭ
III
Ϭ͕Ϭϱ
Ϭ͕ϭ
Ϭ͕ϭϱ
Ϭ͕Ϯ
Ϭ͕Ϯϱ
Ϭ͕ϯ
IV
ϭ͕ϬϬ
ϭ͕ϬϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
ͮʖͮ
ʖϮ
'Ϯ
E
Ϭ͕ϴϬ
<>
&d
Ϭ͕ϳϬ
Z
Ϭ͕ϵϬ
Ϭ͕ϲϬ
DŽĐƚĞƐƚƵŵ
DŽĐƚĞƐƚƵŵ
ͮʖͮ
Ϭ͕ϵϬ
Ϭ͕ϵϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϲϬ
Ϭ͕ϱϬ
Ϭ͕ϰϬ
Ϭ͕ϯϬ
Ϭ͕ϯϬ
Ϭ͕ϮϬ
Ϭ͕ϮϬ
Ϭ͕ϭϬ
Ϭ͕ϭϬ
Ϭ͕ϬϬ
Ϭ͕ϬϬ
Ϭ
Ϭ͕ϭ
Ϭ͕Ϯ
Ϭ͕ϯ
Ϭ͕ϰ
Ϭ͕ϱ
Ϭ͕ϲ
Ϭ
V
Ϭ͕ϭ
Ϭ͕Ϯ
Ϭ͕ϯ
Ϭ͕ϰ
Ϭ͕ϱ
Ϭ͕ϲ
VI
Z rysunku 6 (schemat A) wynika, Īe róĪnice miĊdzy statystyką |Ȥ| a statystyką N
jako reprezentanta „statystyk chi-kwadrat” o najwiĊkszej mocy, są statystycznie
nieistotne z wyjątkiem mn = 0,084. Dla schematu B róĪnice miĊdzy statystyką |Ȥ|
a pozostaáymi statystykami są statystycznie istotne dla mn > 0,188 z korzyĞcią dla
statystyki moduáowej. Dla schematu C analizowane statystyki mają podobną moc
z wyjątkiem statystyki N, która dla n = 80 i mn ¤0,3;0,525´ ma istotnie mniejszą
moc niĪ pozostaáe statystyki.
208
Piotr Sulewski
6. PODSUMOWANIE
Kwadrat uĪyty w liczniku statystyki Ȥ2 powoduje, Īe duĪe rozbieĪnoĞci miĊdzy
liczebnoĞcią empiryczną a teoretyczną są jeszcze wiĊksze, a maáe rozbieĪnoĞci jeszcze
mniejsze. Innym celem zastosowania kwadratu byáo unikniĊcie wzajemnego niwelowania siĊ rozbieĪnoĞci. Do tego jednak celu zamiast kwadratu odchyleĔ moĪna uĪyü
takĪe ich wartoĞci bezwzglĊdnej, stąd pomysá na statystykĊ moduáową.
Zaproponowana miara mn dla analizowanych schematów prawdopodobieĔstw
zmienia siĊ w róĪnych przedziaáach. Minimalna liczebnoĞü próby dla danej TD i dla
danego schematu zostaáa tak ustalona, by liczebnoĞci oczekiwane byáy niezerowe.
Maksymalną wartoĞü próby dobrano tak, by uzyskaü maksymalną moc testu.
Artykuá zwraca uwagĊ na fakt, Īe testy niezaleĪnoĞci wykorzystujące „statystyki
chi-kwadrat” tylko dla schematów prawdopodobieĔstw o najmniejszym zakresie
zmiennoĞci miary mn charakteryzują siĊ róĪną mocą dla danej liczebnoĞci próby n
i miary mn. NajwiĊkszą moc wĞród nich ma statystyka N i ona jest bezpoĞrednio
porównywana ze statystyką moduáową. JeĪeli widoczna jest przewaga statystyki
moduáowej nad „statystykami chi-kwadrat”, to gáównie dla nie początkowych wartoĞci miary mn w ramach danego przedziaáu zmiennoĞci tej miary. Dla ostatniego
analizowanego w ramach danej TD schematu nieprawdziwoĞci H0 przedstawiającego
najwiĊkszy zakres zmiennoĞci miary mn, test wykorzystujący statystykĊ moduáową
ma podobną moc jak pozostaáe testy niezaleĪnoĞci, z wyjątkiem TD 3 × 3, liczebnoĞci
próby n = 50 i miary mn = 0,311, kiedy to statystyka |Ȥ| ma istotnie mniejszą moc
od pozostaáych statystyk.
Reasumując statystyka moduáowa |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ „statystyki chi-kwadrat”, szczególnie jest to widoczne dla schematów prawdopodobieĔstw
o mniejszych zakresach zmiennoĞci miary mn. Dla schematów C lub D o najwiĊkszym
zakresie zmiennoĞci miary mn statystyka moduáowa nie odstĊpuje pod wzglĊdem mocy
od pozostaáych analizowanych statystyk. Na korzyĞü statystyki moduáowej przemawia
takĪe fakt, Īe moĪna z niej skorzystaü w sytuacji, gdy jedna komórka lub dwie leĪące
na przekątnej są puste. Statystyk G2, N i KL nie moĪna stosowaü w tej sytuacji.
LITERATURA
Cochran W. G., (1954), Some Methods for Strengthening the Common Ȥ2 Tests, Biometrics, 10, 417–451.
Cressie N., Read T., (1984), Multinomial Goodness-of-Fit Tests, Journal of the Royal Statistical Society,
Series B (Methodological), 46 (3), 440–464.
Freeman M. F., Tukey J. W., (1950), Transformations Related to the Angular and the Square root, Annals
of Mathematical Statistics, 21, 607–611.
Kullback S., (1959), Information Theory and Statistics, Wiley, New York.
Neyman J., (1949), Contribution to the Theory of the Ȥ2 Test, Proceedings of the (First) Berkeley Symposium
on Mathematical Statistics and Probability, University of California Press, 239–273.
209
Pearson K., (1900), On the Criterion that a Given System of Deviations from the Probable in the Case of
a Correlated System of Variables is Such that It Can be Reasonably Supposed to Have Arisen from
Random Sampling, Philosophy Magazine Series, 5 (50), 157–172.
Shier R., (2004), The Chi-squared Test for Two-Way Tables, Mathematics Learning Support Centre.
Sokal R. R., Rohlf F. J., (2012), Biometry: The Principles and Practice of Statistics in Biological Research,
Freeman, New York.
Sulewski P., (2013), Modyfikacja testu niezaleĪnoĞci, WiadomoĞci Statystyczne, GUS, 10, 1–19.
Sulewski P., (2014), Statystyczne badanie wspóázaleĪnoĞci cech typu dyskretne kategorie, Akademia
Pomorska, Sáupsk.
Sulewski P., Motyka R., (2015a), Independence Test. A Comparative Analysis of Its Six Variants, ZN
AMW, Gdynia, LVI,1, 37–46.
Sulewski P., (2015b), Ocena zdolnoĞci tablic dwudzielczych do wykrywania związku miĊdzy uporządkowanymi cechami typu jakoĞciowego, WiadomoĞci Statystyczne, GUS, 5, 1–16.
Sulewski P., (2016), Moc testów niezaleĪnoĞci w tablicy dwudzielczej 2 × 2, WiadomoĞci Statystyczne, GUS, 8.
Yates D., Moore D., McCabe G., (1999), The Practice of Statistics, 1st Ed., New York, W. H. Freeman.
MOC TESTÓW NIEZALEĩNOĝCI W TABLICY DWUDZIELCZEJ WIĉKSZEJ NIĩ 2 × 2
Streszczenie
W literaturze statystycznej istnieje wiele miar testowych do badania niezaleĪnoĞci cech w tablicach
dwudzielczych. Do analiz statystycznych wybrano rodzinĊ szeĞciu tzw. „statystyk chi-kwadrat” – w tym
statystykĊ Ȥ2 Pearsona – oraz propozycjĊ autora w postaci statystyki moduáowej. W celu uwolnienia siĊ
od ograniczeĔ stosowalnoĞci „statystyk chi-kwadrat”, wartoĞci krytyczne dla wszystkich analizowanych
statystyk wyznaczono symulacyjnie metodami Monte Carlo. W celu porównania testów zaproponowano
miarĊ nieprawdziwoĞci H0 oraz wyznaczono moc testów, czyli zdolnoĞü tablicy dwudzielczej w × k do
odrzucenia H0 mówiącej o tym, Īe miĊdzy cechami X i Y nie ma związku.
Sáowa kluczowe: tablica dwudzielcza, test niezaleĪnoĞci, wartoĞci krytyczne, Monte Carlo
POWER ANALYSIS OF INDEPENDENCE TESTING
FOR TWO-WAY CONTINGENCY TABLES BIGGER THAN 2 × 2
Abstract
In the statistical literature there are many test measures to study the independence features in the
two-way contingency tables. For statistical analysis, the family of six so-called “chi-squared statistic”
was selected – including Pearson’s Ȥ2 statistics – and the proposal of the author in the form of modular statistics. In order to free themselves from the limitations of the applicability of the “chi-squared
statistic”, critical values for all analyzed statistics were determined by simulation methods of Monte
Carlo. In order to compare the tests, the measure of untruthfulness of H0 was proposed and calculated
the power of the tests which is the ability of two-way contingency tables to reject null hypothesis
which says that between features X and Y there is no relation.
Keywords: two-way contingency tables, independence test, critical values, Monte Carlo study

98-16 Przeglad Statyst. 2

Transkrypt

Podobne dokumenty

Statystyki stron - Programy Partnerskie

Inżynier ds. testów systemów z oprogramowaniem

Społeczny rodowód statystyki

Szkolenie specjalizacyjne w dziedzinie „Organizacja i Zarządzanie

Młodszy Tester Oprogramowania

Plakat - Europejski Dzień Statystyki

INŻYNIER DS. TESTÓW GEC-P (GLOBAL ENGINEERING CENTER

Statystyki: Saint-Etienne

Statystyki: PSG - Lorient

mapy cyfrowe dla biznesu