98-16 Przeglad Statyst. 2
Transkrypt
98-16 Przeglad Statyst. 2
PRZEGLĄD STATYSTYCZNY R. LXIII – ZESZYT 2 – 2016 PIOTR SULEWSKI1 MOC TESTÓW NIEZALEĩNOĝCI W TABLICY DWUDZIELCZEJ WIĉKSZEJ NIĩ 2 × 2 1. WPROWADZENIE Moc testów niezaleĪnoĞci to prawdopodobieĔstwo odrzucenia hipotezy zerowej H0, gdy nie jest ona prawdziwa. W kaĪdym popularnym podrĊczniku ze statystyki znajdują siĊ informacje o m.in. takich testach jak: niezaleĪnoĞci, t Studenta, Koámogorowa czy Behrensa-Fishera. Nie sposób nie zgodziü siĊ zatem z tezą, Īe testy niezaleĪnoĞci – obok wspomnianych wczeĞniej testów – są zapewne najczĊĞciej stosowanymi narzĊdziami statystycznym. Dane do testów niezaleĪnoĞci aranĪuje siĊ w postaci tablic dwudzielczych (TD). W pracy porównano rodzinĊ szeĞciu tzw. „statystyk chi-kwadrat” – w skáad której wchodzi powszechnie znana i czĊsto stosowana statystyka Ȥ2 Pearsona – ze statystyką moduáową zaproponowaną w Sulewski (2013). Pearson w statystyce Ȥ2 uĪyá kwadratu dlatego, aby móc skorzystaü z rozkáadu chi-kwadrat jako miary rozbieĪnoĞci. Kwadrat uĪyty w liczniku statystyki Ȥ2 powoduje równieĪ, Īe duĪe rozbieĪnoĞci miĊdzy liczebnoĞcią empiryczną a oczekiwaną są jeszcze wiĊksze, a maáe rozbieĪnoĞci jeszcze mniejsze. Innym celem jego zastosowania byáo unikniĊcie wzajemnego niwelowania siĊ rozbieĪnoĞci. Do tego jednak celu zamiast kwadratu odchyleĔ moĪna uĪyü takĪe ich wartoĞci bezwzglĊdnej, stąd narodziá siĊ pomysá na statystykĊ moduáową. W Sulewski (2014) pokazano, Īe tzw. „statystyki chi-kwadrat”: Ȥ2 Pearsona, G2 ilorazu wiarygodnoĞci, N Neymana, KL Kullbacka-Leiblera, FT Freemana-Tukeya oraz CR Cressiego-Reada, mają rozkáad chi-kwadrat dla próbek liczących przynajmniej kilkaset elementów. Korzystanie ze „statystyk chi-kwadrat” – szczególnie dla maáych próbek – wiąĪe siĊ ze stosowaniem róĪnego rodzaju ograniczeĔ. Np. ze statystyki Ȥ2 Pearsona w tablicach dwudzielczych wiĊkszych niĪ 2 × 2 moĪna korzystaü, gdy wszystkie liczebnoĞci oczekiwane są nie mniejsze od 1oraz gdy nie wiĊcej niĪ 20% tych wartoĞci jest mniejsze niĪ 5 (Yates i inni, 1999; Shier, 2004). Zdaniem Cochran’a (1952) statystykĊ Ȥ2 Pearsona dla tablic wiĊkszych niĪ 2 × 2 moĪna stosowaü, gdy przynajmniej jedna z liczebnoĞci oczekiwanych jest wiĊksza niĪ 5. W celu zniesienia powyĪszych ograniczeĔ w niniejszej pracy zaproponowano wyznaczanie wartoĞci krytycznych na drodze symulacji komputerowych metodą Monte Carlo. Wyznaczanie 1 Akademia Pomorska w Sáupsku, Instytut Matematyki, ul. Arciszewskiego 22, 76-200 Sáupsk, Polska, e-mail: [email protected]. 192 Piotr Sulewski wartoĞci krytycznych na podstawie np. 100.000 wartoĞci statystyki testowej – w dobie wydajnych komputerów z procesorami wielordzeniowymi – nie stanowi problemu, bo trwa kilkadziesiąt sekund. Wymienione powyĪej testy porównano ze wzglĊdu na ich moc – czyli zdolnoĞci TD w × k do odrzucenia H0 mówiącej o tym, Īe nie ma związku miĊdzy cechami X i Y. Do wyznaczenia mocy testów tablice dwudzielcze w × k generowano za pomocą metody sáupkowej oraz zaproponowano miarĊ nieprawdziwoĞci H0 przyjmującą róĪne wartoĞci dla danego schematu wyznaczania prawdopodobieĔstw pij (i,j = 1,2), dla których H0 jest niesáuszna. Niniejsza praca jest kontynuacją rozwaĪaĔ podjĊtych w Sulewski (2016), gdzie omawianą tematykĊ zastosowano dla TD 2 × 2. Pierwszym celem pracy jest przedstawienie teorii dotyczącej testów niezaleĪnoĞci dla TD w × k, drugim celem – wprowadzenie miary nieprawdziwoĞci H0 oraz porównanie jakoĞci testów za pomocą ich mocy. Praca skáada siĊ z dwóch czĊĞci. W czĊĞci I realizowany jest cel pierwszy, zdefiniowano w niej TD w × k oraz siedem testów niezaleĪnoĞci, opisano sposób generowania TD i wyznaczania wartoĞci krytycznych. W czĊĞci II realizowany jest cel drugi, zdefiniowano w niej miarĊ nieprawdziwoĞci H0 oraz wyznaczono moc analizowanych testów niezaleĪnoĞci w celu wyáonienia najlepszego testu. 2. TABLICA DWUDZIELCZA w × k Tabela 1 przedstawia tablicĊ dwudzielczą w × k, która skáada siĊ z wartoĞci nij Z N (i = 1,2,…,w; j = 1,2,…,k) rozkáadu áącznego cech X i Y takich, Īe ¦ L ¦ M Q LM Q . Tabela 1. Tablica dwudzielcza w × k liczebnoĞci Cecha Y Razem Cecha X Y1 Y2 ... Yk X1 n11 n12 ... n1k n1• X2 n21 n22 ... n2k n2• ... ... ... ... ... ... Xw n12 n12 ... nwk n12 Razem n•1 n•2 ... n*k n ħródáo: opracowanie wáasne. LiczebnoĞci oczekiwane i-tego wiersza i j-tej kolumny wyznacza siĊ ze wzoru HLM QL x Qx M Q , (i = 1,2,…,w; j = 1,2,…,k). (1) 193 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 TablicĊ dwudzielczą w × k moĪna takĪe przedstawiü wykorzystując prawdopodoZ N bieĔstwa pij (i = 1,2,…,w; j = 1,2,…,k) takie, Īe ¦ L ¦ M S LM . W odniesieniu do tabeli 1 wartoĞci te wyznaczane są ze wzoru pij = nij / n (i = 1,2,…,w; j = 1,2,…,k). GeneracjĊ TD w × k niezbĊdną do przeprowadzenia symulacji i wyznaczenia mocy testów przeprowadzono metodą sáupkową. W tym celu przedziaá (o,1´ podzielono na w  k podprzedziaáów o szerokoĞciach równych wartoĞci prawdopodobieĔstw pij w taki sposób, Īe pierwszy podprzedziaá ma szerokoĞü p11, drugi – p12, …, k-ty – p1k,…, ostatni – pwk. WielkoĞci pij speániają oczywiĞcie warunek normalizacji Z N ¦ L ¦ M S LM i dobrano je w taki sposób, aby uzyskaü Īądaną wartoĞü miary nieprawdziwoĞci H0. KaĪda z n wygenerowanych liczb losowych równomiernych „wpada” do jednego z podprzedziaáów i tym samym zostaje o jedną zwiĊkszona liczba obiektów w odpowiadającej temu podprzedziaáowi komórce TD. WielkoĞci nij speániające rówZ N noĞü ¦ L ¦ M Q LM Q są liczebnoĞcią obiektów w poszczególnych komórkach TD. Rysunek 1 przedstawia schemat wypeániania komórek TD 4 × 2 dla liczebnoĞci próby n = 2000 i miary nieprawdziwoĞci H0 równej 0, czyli pij = 0,125 dla kaĪdego i = 1,2,…,4; j = 1,2. Tabela 2 prezentuje odpowiadającą temu schematowi tablicĊ dwudzielczą. n = 2000 liczb losowych równomiernych p11 0 p12 0,125 n11 = 264 p21 0,25 n12 = 245 p22 0,325 p31 0,5 p32 0,625 p41 0,75 p42 0,875 n21 = 245 n22 = 231 n31 = 274 n32 = 253 n41 = 252 1 n42 = 236 Rysunek 1. Schemat wypeániania komórek TD 4 × 2 ħródáo: opracowanie wáasne. Tabela 2. Tablica dwudzielcza w × k otrzymana metoda sáupkową Cecha Y Razem Cecha X Y1 Y2 X1 264 245 509 X2 245 231 476 X3 274 253 527 X4 252 236 488 Razem 1035 965 2000 ħródáo: opracowanie wáasne. 194 Piotr Sulewski 3. TESTY NIEZALEĩNOĝCI W TABLICY DWUDZIELCZEJ w × k Do badania niezaleĪnoĞci cech X i Y w TD w × k skorzystano ze statystyki moduáowej bĊdącej modyfikacją statystyki Ȥ2 Pearsona (Sulewski, 2013): F Z N ¦¦ Q LM HLM (2) HLM L M oraz z rodziny statystyk, które dla TD w × k mają asymptotyczny rozkáad chi-kwadrat z (w-1)(k-1) stopniami swobody i dlatego są okreĞlane mianem „statystyk chi-kwadrat” (Cressie, Read, 1984). Są to: 1) Powszechnie znana i czĊsto stosowana statystyka Ȥ2 Pearsona (Pearson, 1900) F Z Q N ¦¦ LM HLM HLM L M ; (3) 2) Statystyka G2 ilorazu wiarygodnoĞci (Sokal, Rohlf, 2012) * § QLM ¦¦ QLM OQ¨ ¨H L M © LM Z N · ¸; ¸ ¹ (4) ; (5) 3) Statystyka N Neymana (Neyman, 1949) Z Q N ¦¦ 1 HLM LM QLM L M 4) Statystyka KL Kullbacka-Leiblera (Kullback, 1959) ./ § HLM ¦¦ HLM OQ¨ ¨Q L M © LM Z N · ¸; ¸ ¹ (6) 5) Statystyka FT Freemana-Tukeya (Freeman, Tukey, 1950) )7 Z N ¦ ¦ Q LM HLM ; (7) L M 6) Statystyka CR Cressiego-Reada (Cressie, Read, 1984) &5 ª§ Q Z N «¨ LM Q ¦¦ LM ¨ L M «© HLM ¬ · ¸ ¸ ¹ º » . » ¼ (8) 195 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 CharakterystykĊ statystyk „chi-kwadrat” dla tablic dwudzielczych, trójdzielczych i czterodzielczych wraz z implementacją komputerową moĪna znaleĨü w pracy Sulewskiego (2014). W Sulewski, Motyka (2015a), korzystając z metody Monte Carlo, porównano jakoĞü „statystyk chi-kwadrat” wyraĪoną w funkcji mocy przy zaáoĪeniu, Īe statystyki te – jaką twierdzą ich autorzy – podlegają rozkáadowi chi-kwadrat. Badania wykazaáy, Īe jakoĞü testu Ȥ2 Pearsona oraz CR Cressiego-Reada jest porównywalna i znacznie lepsza od pozostaáych. LiczebnoĞci nij (i = 1,2,…,w; j = 1,2,…,k) w TD w × k są zmiennymi losowymi. Godnym uwagi jest, Īe zmienne losowe bĊdące odwrotnoĞcią lub ilorazem zmiennych losowych nie posiadają wartoĞci oczekiwanej i w konsekwencji takĪe niektórych momentów wyĪszych rzĊdów. Rozkáad chi-kwadrat – jak powszechnie wiadomo – posiada wszystkie momenty. Ponadto poĪądanym jest, aby poszczególne skáadniki statystyki testowej – gdy H0 o niezaleĪnoĞci cech X i Y jest sáuszna – byáy tego samego znaku i jak najbliĪsze 0. Skáadniki statystyk (4), (6) i (8) są róĪnego znaku i wzajemnie siĊ rekompensują i tylko dla bardzo duĪych prób podlegają rozkáadowi chi-kwadrat (Sulewski, 2014). Aby to pokazaü metodą sáupkową opisaną powyĪej wygenerowano tablicĊ dwudzielczą 3 × 3 o liczebnoĞci próby n = 150, gdy hipoteza H0 o niezaleĪnoĞci cech X i Y jest sáuszna, czyli pij = 1/9(i,j = 1,2,3). Tabela 3 przedstawia wartoĞci poszczególnych skáadników „statystyk chi-kwadrat” (wartoĞci ujemne pogrubiono). Tabela 3. WartoĞci skáadników „statystyk chi-kwadrat” Skáadnik Ȥ2 G2 N KL FT CR i=1, j=1 0,029 1,362 0,028 -1,305 0,007 0,829 i=1, j=2 0,003 0,429 0,003 -0,424 0,001 0,259 i=1, j=3 0,060 -1,698 0,065 1,823 0,016 -0,995 i=2, j=1 0,381 -4,933 0,444 5,755 0,103 -2,813 i=2, j=2 0,616 -6,652 0,741 8,003 0,169 -3,755 i=2, j=3 2,547 14,901 1,816 -10,620 0,534 10,030 i=3, j=1 0,250 4,240 0,222 -3,769 0,059 2,647 i=3, j=2 0,638 7,481 0,538 -6,312 0,146 4,753 i=3, j=3 2,202 -8,301 3,699 13,945 0,702 -4,210 Razem 6,726 6,829 7,556 7,095 1,735 6,744 ħródáo: opracowanie wáasne. 196 Piotr Sulewski 4. WYZNACZANIE WARTOĝCI KRYTYCZNYCH W okresie ostatnich kilkudziesiĊciu lat zaproponowano róĪne testy niezaleĪnoĞci dla tablic dwudzielczych oraz okreĞlono warunki ich stosowalnoĞci szczególnie dla maáych prób, które najczĊĞciej są przedmiotem badaĔ statystycznych. W dobie coraz to szybszych komputerów z procesorami wielordzeniowymi oraz rozbudowaną pamiĊcią operacyjną, moĪna za pomocą stosownego oprogramowania znieĞü te ograniczenia i drogą symulacyjną wyznaczyü wartoĞci krytyczne. Przy wyznaczaniu wartoĞci krytycznych, gdy miĊdzy cechami nie ma związku, zawartoĞü tablic dwudzielczych w × k o liczebnoĞci próby n generowano za pomocą metody sáupkowej przyjmując pij = 1/(w  k) (i = 1,2,…,w; j = 1,2,…,k). Dla kaĪdej TD w × k obliczono r = 105 wartoĞci kaĪdej analizowanej statystyki testowej , które nastĊpnie uporządkowano w kolejnoĞci rosnącej. WartoĞü krytyczną na poziomie istotnoĞci Į = 0,1 wyznaczono ze wzoru: Y . FYD (9) Tak duĪa liczba powtórzeĔ r przy wyznaczaniu wartoĞci statystyki testowej zapewnia uzyskanie dokáadnego wyniku. 5. MOC TESTU Moc testu to prawdopodobieĔstwo odrzucenia hipotezy zerowej H0, gdy nie jest ona prawdziwa. Moc testu zaleĪy od liczebnoĞci próby – im liczniejsza próba, tym wiĊksza moc. Moc testu zaleĪy takĪe od poziomu istotnoĞci testu – im niĪszy poziom istotnoĞci, tym mniejsza moc testu. Moc testu zaleĪy równieĪ od siáy związku miĊdzy cechami – im wiĊksza siáa związku, tym wiĊksza moc testu. WiĊcej informacji o mocy testu znaleĨü moĪna m.in. w Sulewski (2015b). W celu wyznaczenia mocy testu – czyli zdolnoĞci TD do odrzucenia hipotezy mówiącej o tym, Īe nie ma związku miĊdzy cechami X i Y – gdy w istocie związek jest, niezbĊdna jest generacja tablic dwudzielczych. Dane podlegające opracowaniu muszą byü danymi pochodzącymi z generatora liczb losowych, a nie danymi wziĊtymi z praktyki. UwzglĊdniając narzuconą siáĊ związku miĊdzy cechami wyraĪoną za pomocą miary nieprawdziwoĞci H0 danej wzorem PQ Zu N Z N ¦¦ S LM S L x S x M , (10) L M do wypeánienia TD w × k skorzystano z metody „sáupkowej” wykorzystującej prawdopodobieĔstwa pij (i = 1,2,…,w; j = 1,2,…,k). Znając wartoĞü statystyki testowej dla róĪnych liczebnoĞci próby n wyznaczono moc testu za pomocą wzoru m = u/r, gdzie u okreĞla liczbĊ tych spoĞród r = 105 197 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 wszystkich moĪliwych przypadków, kiedy to wartoĞü statystyki testowej jest nie mniejsza od wartoĞci krytycznej cvĮ. Hipoteza zerowa H0 – mówiąca o tym, Īe miĊdzy cechami X i Y w TD w × k nie ma związku – jest sáuszna, gdy pij = pi•  p•j dla i = 1,2,…,w; j = 1,2,…,k. Zatem miara (10) przyjmuje wartoĞü 0, gdy hipoteza H0 jest sáuszna. Im wiĊksze wartoĞci mn, tym wiĊksza jest moĪliwoĞü faászywoĞci H0. Do wyznaczenia mocy testu dla TD w × k skorzystano z róĪnych schematów wyznaczania prawdopodobieĔstw pij (i = 1,2,…,w; j = 1,2,…,k), dla których hipoteza zerowa H0 jest niesáuszna. PrawdopodobieĔstwa te – jak równieĪ przedziaáy zmiennoĞci miary mn dla omawianych schematów – przedstawiono w tabelach 5, 7, 9, 11, 13. Wynika z nich, Īe miara nieprawdziwoĞci hipotezy H0 zmienia siĊ w róĪnych przedziaáach. Minimalna liczebnoĞü próby dla danej TD i dla danego schematu zostaáa tak dobrana, aby liczebnoĞci oczekiwane byáy róĪne od zera. Maksymalną wartoĞü próby ustalono tak, aby uzyskaü maksymalną moc testu. Dla statystyki moduáowej |Ȥ| oraz dla „statystyki chi-kwadrat” o najwiĊkszej mocy, uzyskane wyniki porównano za pomocą testu o równoĞci prawdopodobieĔstw stawiając hipotezĊ zerową, Īe moce testów są równe, czyli róĪnice są statystycznie nieistotne. TABLICA DWUDZIELCZA 2 × 3 Tabela 4. Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 2 × 3 p0 = 1/6, ǻp = p0/10, k = 0,1,…,9 Schemat A Y1 Y2 Y3 X1 po – k ǻp po po X2 po po po + k ǻp Y1 Y2 Y3 X1 po – k ǻp po – k ǻp po X2 po po + k ǻp po + k ǻp Y1 Y2 Y3 X1 po – k ǻp po – k ǻp po X2 po + k ǻp po + k ǻp po Y1 Y2 Y3 X1 po – k ǻp po po + k ǻp X2 po + k ǻp po po – k ǻp po Schemat B Schemat C Schemat D ħródáo: opracowanie wáasne. 198 Piotr Sulewski ϭ͕ϬϬ ϭ͕ϬϬ Ϭ͕ϵϬ Ϭ͕ϴϬ Ϭ͕ϳϬ ͮʖͮ ʖϮ 'Ϯ E <> &d ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Z Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕ϬϮ Ϭ͕Ϭϰ Ϭ͕Ϭϲ Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ I Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕Ϭϲ II Ϭ͕ϵϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕ϬϮ Ϭ͕Ϭϰ Ϭ͕Ϭϲ Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ Ϭ͕ϮϮ Ϭ͕Ϯϰ Ϭ͕Ϯϲ Ϭ͕Ϯϴ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ III Ϭ͕ϬϮ Ϭ͕Ϭϰ Ϭ͕Ϭϲ Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ Ϭ͕ϮϮ Ϭ͕Ϯϰ Ϭ͕Ϯϲ Ϭ͕Ϯϴ 0LDUDQLHSUDZG]LZRĞFLPQ IV ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕Ϭϰ 0LDUDQLHSUDZG]LZRĞFLPQ ϭ͕ϬϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕ϬϮ Ϭ͕Ϭϰ Ϭ͕Ϭϲ Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ Ϭ͕ϮϮ Ϭ͕Ϯϰ Ϭ͕Ϯϲ Ϭ͕Ϯϴ Ϭ͕ϯ Ϭ͕ϯϮ Ϭ͕ϯϰ Ϭ͕ϯϲ Ϭ͕ϯϴ Ϭ͕ϰ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ V Ϭ͕ϬϮ Ϭ͕Ϭϰ Ϭ͕Ϭϲ Ϭ͕Ϭϴ Ϭ͕ϭ Ϭ͕ϭϮ Ϭ͕ϭϰ Ϭ͕ϭϲ Ϭ͕ϭϴ Ϭ͕Ϯ Ϭ͕ϮϮ Ϭ͕Ϯϰ Ϭ͕Ϯϲ Ϭ͕Ϯϴ Ϭ͕ϯ Ϭ͕ϯϮ Ϭ͕ϯϰ Ϭ͕ϯϲ Ϭ͕ϯϴ Ϭ͕ϰ 0LDUDQLHSUDZG]LZRĞFLPQ VI ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E ͮʖͮ ʖϮ 'Ϯ E <> &d Ϭ͕ϵϬ Ϭ͕ϵϬ Ϭ͕ϴϬ <> Ϭ͕ϳϬ Z &d Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϬϮ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϴϬ Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϲ Ϭ͕ϭϮ Ϭ͕ϭϴ Ϭ͕Ϯϰ Ϭ͕ϯ Ϭ͕ϯϲ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕ϰϮ Ϭ͕ϰϴ Ϭ͕ϱϰ Ϭ Ϭ͕ϲ Ϭ͕Ϭϲ Ϭ͕ϭϮ Ϭ͕ϭϴ Ϭ͕Ϯϰ Ϭ͕ϯ Ϭ͕ϯϲ Ϭ͕ϰϮ Ϭ͕ϰϴ 0LDUDQLHSUDZG]LZRĞFLPQ VIII VII Rysunek 2. Moc testów niezaleĪnoĞci dla TD 2 × 3 oraz liczebnoĞci próby n I. Schemat A, n = 125 V. Schemat C, n = 50 II. Schemat A, n = 150 VI. Schemat C, n = 75 III. Schemat B, n = 125 VII. Schemat D, n = 30 IV. Schemat B, n = 150 VIII. Schemat D, n = 40 ħródáo: opracowanie wáasne. Ϭ͕ϱϰ Ϭ͕ϲ 199 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 Tabela 5. Miara nieprawdziwoĞci H0 dla TD 2 × 3 i k = 0,1,...,9 Schemat A mn2 × 3 = k / 45 Schemat B N N mn2 × 3 = ® ¯N N N mn2 × 3 ¤0;0,2´ mn2 × 3 ¤0;0,28´ Schemat C Schemat D mn2 × 3 = 2k / 45 mn2 × 3 = k / 15 mn2 × 3 ¤0;0,4´ mn2 × 3 ¤0;0,6´ ħródáo: opracowanie wáasne. Rysunek 2 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD 2 × 3, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n. Z rysunku 2 wynika, Īe „statystyki chi-kwadrat” dla TD 2 × 3 mają podobną moc, a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne. Dla schematu A róĪnice miĊdzy statystyką |Ȥ|, a pozostaáymi analizowanymi statystykami są statystycznie istotne dla mn ¤0,133;0,178´. Dla schematu B oraz n = 125, n = 150 róĪnice te są statystycznie istotne odpowiednio dla mn ¤0,147;0,280´ i mn ¤0,111;0,231´. Dla schematu C statystyka |Ȥ| ma istotnie wiĊkszą moc od pozostaáych statystyk, gdy mn ¤0,222;0,4´. Dla schematu D róĪnice miĊdzy statystykami są statystycznie nieistotne. TABLICA DWUDZIELCZA 2 × 4 Tabela 6. Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 2 × 4 p0 = 1/8, ǻp = p0/10, k = 0,1,…,9 Schemat A Y1 Y2 Y3 Y4 X1 po – k ǻp po po po X2 po po po po + k ǻp Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp po po X2 po po po + k ǻp po + k ǻp Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp po po X2 po + k ǻp po + k ǻp po po Schemat B Schemat C 200 Piotr Sulewski Tabela 6. (cd.) Schemat D Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp po + k ǻp po + k ǻp X2 po + k ǻp po + k ǻp po – k ǻp po – k ǻp ħródáo: opracowanie wáasne. Tabela 7. Miara nieprawdziwoĞci H0 dla TD 2 × 4 i k = 0,1,...,9 Schemat A Schemat B Schemat C Schemat D mn2 × 4 = k / 40 mn2 × 4 = k2 / 400 mn2 × 4 = k / 20 mn2 × 4 = 3k / 40 mn2 × 4 ¤0;0,225´ mn2 × 4 ¤0;0,2025´ mn2 × 4 ¤0;0,45´ mn2 × 4 ¤0;0,675´ ħródáo: opracowanie wáasne. Rysunek 3 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD 2 × 4, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n. Z rysunku 3 wynika, Īe dla schematów A, C, D „statystyki chi-kwadrat” dla TD 2 × 4 mają podobną moc, a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne. Dla schematu A statystyka |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ pozostaáe statystyki, jednak przewaga ta jest statystycznie istotna dla n = 175 i mn = 0,175. Podobna sytuacja jest dla schematu B, gdy mn ¤0,09;0,203´. Dla schematu C róĪnica istotna statystycznie na korzyĞü statystyki moduáowej jest dla n = 50 i mn ¤0,3;0,45´ oraz n = 100 i mn ¤0,3;0,35´. Dla schematu D róĪnice miĊdzy statystykami są nieistotne statystycznie. 201 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϮϱ Ϭ͕Ϭϱ Ϭ͕Ϭϳϱ Ϭ͕ϭ Ϭ͕ϭϮϱ Ϭ͕ϭϱ Ϭ͕ϭϳϱ Ϭ͕Ϯ Ϭ͕ϮϮϱ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ I Ϭ͕ϬϮϱ Ϭ͕Ϭϱ Ϭ͕Ϭϳϱ Ϭ͕ϭ Ϭ͕ϭϮϱ Ϭ͕ϭϱ Ϭ͕ϭϳϱ Ϭ͕Ϯ Ϭ͕ϮϮϱ 0LDUDQLHSUDZG]LZRĞFLPQ II ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ E Ϭ͕ϴϬ Ϭ͕ϮϬ Ϭ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϯ Ϭ͕Ϭϲ Ϭ͕Ϭϵ Ϭ͕ϭϮ Ϭ͕ϭϱ Ϭ͕ϭϴ Ϭ͕Ϯϭ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ III Ϭ͕Ϭϯ Ϭ͕Ϭϲ Ϭ͕Ϭϵ Ϭ͕ϭϮ Ϭ͕ϭϱ Ϭ͕ϭϴ Ϭ͕Ϯϭ 0LDUDQLHSUDZG]LZRĞFLPQ IV ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ʖϮ 'Ϯ Ϭ͕ϯϬ Ϭ͕ϬϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ Ϭ͕ϯϱ Ϭ͕ϰ Ϭ Ϭ͕ϰϱ Ϭ͕Ϭϱ Ϭ͕ϭ 0LDUDQLHSUDZG]LZRĞFLPQ V Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ Ϭ͕ϯϱ Ϭ͕ϰ Ϭ͕ϰϱ 0LDUDQLHSUDZG]LZRĞFLPQ VI ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ͮʖͮ Ϭ͕ϵϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϵϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕ϭϮϱ Ϭ͕Ϯϱ Ϭ͕ϯϳϱ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕ϱ Ϭ͕ϲϮϱ Ϭ Ϭ͕ϭϮϱ Ϭ͕Ϯϱ Ϭ͕ϯϳϱ Ϭ͕ϱ 0LDUDQLHSUDZG]LZRĞFLPQ VII VIII Rysunek 3. Moc testów niezaleĪnoĞci dla TD 2 × 4 oraz liczebnoĞci próby n I. Schemat A, n = 150 V. Schemat C, n = 50 II. Schemat A, n = 175 VI. Schemat C, n = 100 III. Schemat B, n = 150 VII. Schemat D, n = 30 IV. Schemat B, n = 200 VIII. Schemat D, n = 50 ħródáo: opracowanie wáasne. Ϭ͕ϲϮϱ 202 Piotr Sulewski TABLICA DWUDZIELCZA 3 × 3 Tabela 8. Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 3 × 3 p0 = 1/9, ǻp = p0/10, k = 0,1,…,9 Schemat A Y1 Y2 Y3 X1 po – k ǻp po – k ǻp / 2 po X2 po – k ǻp / 2 po po + k ǻp / 2 X3 po po + k ǻp / 2 po + k ǻp Y1 Y2 Y3 X1 po – k ǻp po – k ǻp po X2 po po po X3 po + k ǻp po + k ǻp po Y1 Y2 Y3 X1 po – k ǻp po po + k ǻp X2 po po po X3 po + k ǻp po po – k ǻp Schemat B Schemat C ħródáo: opracowanie wáasne. Tabela 9. Miara nieprawdziwoĞci H0 dla TD 3 × 3 i k = 0,1,...,9 Schemat A Schemat B Schemat C mn3 × 3 = k2 / 900 mn3 × 3 = 0,02963  k mn3 × 3 = 2k / 45 mn3 × 3 ¤0;0,09´ mn3 × 3 ¤0;0,2667´ mn3 × 3 ¤0;0,04´ ħródáo: opracowanie wáasne. Rysunek 4 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD 3 × 3, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n. Z rysunku 4 wynika, Īe dla schematów B, C „statystyki chi-kwadrat” dla TD 3 × 3 mają podobną moc, a wystĊpujące miĊdzy nimi róĪnice są statystycznie nieistotne. Dla schematu A statystyka |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ statystyka N, jednak przewaga ta jest statystycznie istotna dla n = 300 i mn ¤0,04;0,09´ oraz n = 400 i mn ¤0,028;0,09´. Statystyka |Ȥ| charakteryzuje siĊ takĪe wiĊkszą mocą 203 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 od pozostaáych statystyk dla schematu B i przewaga ta jest statystycznie istotna dla mn ¤0,148;0,267´. Dla schematu C „statystyki chi-kwadrat” mają wiĊkszą moc od statystyki moduáowej, jednak przewaga ta jest statystycznie istotna tylko dla n = 50 i mn = 0,311. ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϭ Ϭ͕ϬϮ Ϭ͕Ϭϯ Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ͕Ϭϴ Ϭ͕Ϭϵ Ϭ Ϭ͕Ϭϭ Ϭ͕ϬϮ Ϭ͕Ϭϯ 0LDUDQLHSUDZG]LZRĞFLPQ I Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ͕Ϭϴ Ϭ͕Ϭϵ 0LDUDQLHSUDZG]LZRĞFLPQ II ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ʖϮ 'Ϯ Ϭ͕ϯϬ Ϭ͕ϬϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϯ Ϭ͕Ϭϲ Ϭ͕Ϭϵ Ϭ͕ϭϮ Ϭ͕ϭϱ Ϭ͕ϭϴ Ϭ͕Ϯϭ Ϭ͕Ϯϰ Ϭ͕Ϯϳ Ϭ Ϭ͕Ϭϯ Ϭ͕Ϭϲ Ϭ͕Ϭϵ 0LDUDQLHSUDZG]LZRĞFLPQ III Ϭ͕ϭϮ Ϭ͕ϭϱ Ϭ͕ϭϴ Ϭ͕Ϯϭ Ϭ͕Ϯϰ Ϭ͕Ϯϳ 0LDUDQLHSUDZG]LZRĞFLPQ IV ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ͮʖͮ Ϭ͕ϵϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϵϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϰ Ϭ͕Ϭϴ Ϭ͕ϭϮ Ϭ͕ϭϲ Ϭ͕Ϯ Ϭ͕Ϯϰ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕Ϯϴ Ϭ͕ϯϮ Ϭ͕ϯϲ Ϭ Ϭ͕ϰ V Ϭ͕Ϭϰ Ϭ͕Ϭϴ Ϭ͕ϭϮ Ϭ͕ϭϲ Ϭ͕Ϯ Ϭ͕Ϯϰ Ϭ͕Ϯϴ Ϭ͕ϯϮ 0LDUDQLHSUDZG]LZRĞFLPQ VI Rysunek 4. Moc testów niezaleĪnoĞci dla TD 3 × 3 oraz liczebnoĞci próby n I. Schemat A, n = 300 IV. Schemat B, n = 100 II. Schemat A, n = 400 V. Schemat C, n = 50 III. Schemat B, n = 75 VI. Schemat C, n = 75 ħródáo: opracowanie wáasne. Ϭ͕ϯϲ Ϭ͕ϰ 204 Piotr Sulewski TABLICA DWUDZIELCZA 3 × 4 Tabela 10. Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 3 × 4 p0 = 1/12, ǻp = p0/10, k = 0,1,…,9 Schemat A Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp / 2 po – k ǻp / 3 po X2 po – k ǻp / 2 po po po + k ǻp / 2 X3 po po + k ǻp / 3 po + k ǻp / 2 po + k ǻp Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp po po X2 po po po po X3 po + k ǻp po + k ǻp po po Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp / 2 po + k ǻp / 2 po + k ǻp X2 po pov po po X3 po + k ǻp po + k ǻp / 2 po – k ǻp / 2 po – k ǻp Schemat B Schemat C ħródáo: opracowanie wáasne. Tabela 11. Miara nieprawdziwoĞci H0 dla TD 3 × 4 i k = 0,1,...,9 Schemat A Schemat B Schemat C mn3 × 4 = k2 / 1250 + k / 500 mn3 × 4 = k / 30 mn3 × 4 = k / 20 mn3 × 4 ¤0;0,084´ mn3 × 4 ¤0;0,03´ mn3 × 4 ¤0;0,45´ ħródáo: opracowanie wáasne. Rysunek 5 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD 3 × 4, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n. Z rysunku 5 (schemat A) wynika, Īe „statystyki chi-kwadrat” charakteryzują siĊ róĪną mocą. Przy n = 400 róĪnice miĊdzy statystyką |Ȥ| a statystyką N jako reprezentanta „statystyk chi-kwadrat” o najwiĊkszej mocy, są statystycznie istotne dla mn ¤0,031;0,054´, z kolei przy n = 500 – dla mn ¤0,042;0,054´. Dla schematu B moc testu dla „statystyk chi-kwadrat” jest bardzo podobna. RóĪnice miĊdzy staty- 205 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 styką |Ȥ| a pozostaáymi statystykami są statystycznie istotne dla mn ¤0,2;0,3´ z korzyĞcią dla statystyki moduáowej. Dla schematu C i próby n = 75 funkcje mocy testów dla statystyki |Ȥ| i N są bardzo podobne. Dla n = 100 funkcje mocy analizowanych testów mają podobne przebiegi. ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϭ Ϭ͕ϬϮ Ϭ͕Ϭϯ Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ Ϭ͕Ϭϴ Ϭ͕Ϭϭ Ϭ͕ϬϮ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕Ϭϯ Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ͕Ϭϴ 0LDUDQLHSUDZG]LZRĞFLPQ II I ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ʖϮ 'Ϯ Ϭ͕ϯϬ Ϭ͕ϬϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ III Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ 0LDUDQLHSUDZG]LZRĞFLPQ IV ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ͮʖͮ Ϭ͕ϵϬ Ϭ͕ϵϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕ϯϱ Ϭ͕ϰ Ϭ͕ϰϱ Ϭ V Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ Ϭ͕ϯϱ 0LDUDQLHSUDZG]LZRĞFLPQ VI Rysunek 5. Moc testów niezaleĪnoĞci dla TD 3 × 4 oraz liczebnoĞci próby n I. Schemat A, n = 400 IV. Schemat B, n = 125 II. Schemat A, n = 500 V. Schemat C, n = 75 III. Schemat B, n = 100 VI. Schemat C, n = 100 ħródáo: opracowanie wáasne. Ϭ͕ϰ Ϭ͕ϰϱ 206 Piotr Sulewski TABLICA DWUDZIELCZA 4 × 4 Tabela 12. Schematy prawdopodobieĔstw ukazujące związek miĊdzy cechami dla TD 4 × 4 p0 = 1/16, ǻp = p0/10, k = 0,1,…,9 Schemat A Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp / 2 po – k ǻp / 3 po X2 po – k ǻp / 2 po – k ǻp / 3 po po + k ǻp / 3 X3 po – k ǻp / 3 po po + k ǻp / 3 po + k ǻp / 2 X4 po po + k ǻp / 3 po + k ǻp / 2 po + k ǻp Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp po po X2 po – k ǻp / 2 po – k ǻp / 2 po po X3 po + k ǻp / 2 po + k ǻp / 2 po po X4 po + k ǻp po + k ǻp po po Y1 Y2 Y3 Y4 X1 po – k ǻp po – k ǻp / 2 po – k ǻp / 3 po X2 po – k ǻp / 2 po – k ǻp / 3 po po + k ǻp / 3 X3 po – k ǻp / 3 po po + k ǻp / 3 po + k ǻp / 2 X4 po po + k ǻp / 3 po + k ǻp / 2 po + k ǻp Schemat B Schemat C ħródáo: opracowanie wáasne. Tabela 13. Miara nieprawdziwoĞci H0 dla TD 4 × 4 i k = 0,1,...,9 Schemat A Schemat B Schemat C ½ mn4 × 4 ® ¾ ¯ ¿ mn4 × 4 = 3k / 80 mn4 × 4 = 3k / 40 mn4 × 4 ¤0;0,084´ mn4 × 4 ¤0;0,338´ mn4 × 4 ¤0;0,675´ ħródáo: opracowanie wáasne. Rysunek 6 przedstawia zaleĪnoĞü mocy testów niezaleĪnoĞci od miary mn dla TD 4 × 4, na poziomie istotnoĞci Į = 0,1 i liczebnoĞci próby n. 207 Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E <> Ϭ͕ϳϬ Z &d Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ Ϭ͕ϴϬ Ϭ͕ϱϬ Ϭ͕ϰϬ E <> &d Ϭ͕ϳϬ Z Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϭ Ϭ͕ϬϮ Ϭ͕Ϭϯ Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ Ϭ͕Ϭϴ Ϭ͕Ϭϭ Ϭ͕ϬϮ Ϭ͕Ϭϯ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕Ϭϰ Ϭ͕Ϭϱ Ϭ͕Ϭϲ Ϭ͕Ϭϳ Ϭ͕Ϭϴ 0LDUDQLHSUDZG]LZRĞFLPQ II I ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ʖϮ 'Ϯ Ϭ͕ϴϬ Ϭ͕ϯϬ Ϭ͕ϬϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ Ϭ 0LDUDQLHSUDZG]LZRĞFLPQ III Ϭ͕Ϭϱ Ϭ͕ϭ Ϭ͕ϭϱ Ϭ͕Ϯ Ϭ͕Ϯϱ Ϭ͕ϯ 0LDUDQLHSUDZG]LZRĞFLPQ IV ϭ͕ϬϬ ϭ͕ϬϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ ͮʖͮ ʖϮ 'Ϯ E Ϭ͕ϴϬ <> &d Ϭ͕ϳϬ Z Ϭ͕ϵϬ Ϭ͕ϲϬ DŽĐƚĞƐƚƵŵ DŽĐƚĞƐƚƵŵ ͮʖͮ Ϭ͕ϵϬ Ϭ͕ϵϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϲϬ Ϭ͕ϱϬ Ϭ͕ϰϬ Ϭ͕ϯϬ Ϭ͕ϯϬ Ϭ͕ϮϬ Ϭ͕ϮϬ Ϭ͕ϭϬ Ϭ͕ϭϬ Ϭ͕ϬϬ Ϭ͕ϬϬ Ϭ Ϭ͕ϭ Ϭ͕Ϯ Ϭ͕ϯ Ϭ͕ϰ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕ϱ Ϭ͕ϲ Ϭ V Ϭ͕ϭ Ϭ͕Ϯ Ϭ͕ϯ Ϭ͕ϰ Ϭ͕ϱ 0LDUDQLHSUDZG]LZRĞFLPQ Ϭ͕ϲ VI Rysunek 6. Moc testów niezaleĪnoĞci dla TD 4 × 4 oraz liczebnoĞci próby n I. Schemat A, n = 300 IV. Schemat B, n = 125 II. Schemat A, n = 500 V. Schemat C, n = 60 III. Schemat B, n = 100 VI. Schemat C, n = 80 ħródáo: opracowanie wáasne. Z rysunku 6 (schemat A) wynika, Īe róĪnice miĊdzy statystyką |Ȥ| a statystyką N jako reprezentanta „statystyk chi-kwadrat” o najwiĊkszej mocy, są statystycznie nieistotne z wyjątkiem mn = 0,084. Dla schematu B róĪnice miĊdzy statystyką |Ȥ| a pozostaáymi statystykami są statystycznie istotne dla mn > 0,188 z korzyĞcią dla statystyki moduáowej. Dla schematu C analizowane statystyki mają podobną moc z wyjątkiem statystyki N, która dla n = 80 i mn ¤0,3;0,525´ ma istotnie mniejszą moc niĪ pozostaáe statystyki. 208 Piotr Sulewski 6. PODSUMOWANIE Kwadrat uĪyty w liczniku statystyki Ȥ2 powoduje, Īe duĪe rozbieĪnoĞci miĊdzy liczebnoĞcią empiryczną a teoretyczną są jeszcze wiĊksze, a maáe rozbieĪnoĞci jeszcze mniejsze. Innym celem zastosowania kwadratu byáo unikniĊcie wzajemnego niwelowania siĊ rozbieĪnoĞci. Do tego jednak celu zamiast kwadratu odchyleĔ moĪna uĪyü takĪe ich wartoĞci bezwzglĊdnej, stąd pomysá na statystykĊ moduáową. Zaproponowana miara mn dla analizowanych schematów prawdopodobieĔstw zmienia siĊ w róĪnych przedziaáach. Minimalna liczebnoĞü próby dla danej TD i dla danego schematu zostaáa tak ustalona, by liczebnoĞci oczekiwane byáy niezerowe. Maksymalną wartoĞü próby dobrano tak, by uzyskaü maksymalną moc testu. Artykuá zwraca uwagĊ na fakt, Īe testy niezaleĪnoĞci wykorzystujące „statystyki chi-kwadrat” tylko dla schematów prawdopodobieĔstw o najmniejszym zakresie zmiennoĞci miary mn charakteryzują siĊ róĪną mocą dla danej liczebnoĞci próby n i miary mn. NajwiĊkszą moc wĞród nich ma statystyka N i ona jest bezpoĞrednio porównywana ze statystyką moduáową. JeĪeli widoczna jest przewaga statystyki moduáowej nad „statystykami chi-kwadrat”, to gáównie dla nie początkowych wartoĞci miary mn w ramach danego przedziaáu zmiennoĞci tej miary. Dla ostatniego analizowanego w ramach danej TD schematu nieprawdziwoĞci H0 przedstawiającego najwiĊkszy zakres zmiennoĞci miary mn, test wykorzystujący statystykĊ moduáową ma podobną moc jak pozostaáe testy niezaleĪnoĞci, z wyjątkiem TD 3 × 3, liczebnoĞci próby n = 50 i miary mn = 0,311, kiedy to statystyka |Ȥ| ma istotnie mniejszą moc od pozostaáych statystyk. Reasumując statystyka moduáowa |Ȥ| charakteryzuje siĊ wiĊkszą mocą niĪ „statystyki chi-kwadrat”, szczególnie jest to widoczne dla schematów prawdopodobieĔstw o mniejszych zakresach zmiennoĞci miary mn. Dla schematów C lub D o najwiĊkszym zakresie zmiennoĞci miary mn statystyka moduáowa nie odstĊpuje pod wzglĊdem mocy od pozostaáych analizowanych statystyk. Na korzyĞü statystyki moduáowej przemawia takĪe fakt, Īe moĪna z niej skorzystaü w sytuacji, gdy jedna komórka lub dwie leĪące na przekątnej są puste. Statystyk G2, N i KL nie moĪna stosowaü w tej sytuacji. LITERATURA Cochran W. G., (1954), Some Methods for Strengthening the Common Ȥ2 Tests, Biometrics, 10, 417–451. Cressie N., Read T., (1984), Multinomial Goodness-of-Fit Tests, Journal of the Royal Statistical Society, Series B (Methodological), 46 (3), 440–464. Freeman M. F., Tukey J. W., (1950), Transformations Related to the Angular and the Square root, Annals of Mathematical Statistics, 21, 607–611. Kullback S., (1959), Information Theory and Statistics, Wiley, New York. Neyman J., (1949), Contribution to the Theory of the Ȥ2 Test, Proceedings of the (First) Berkeley Symposium on Mathematical Statistics and Probability, University of California Press, 239–273. Moc testów niezaleĪnoĞci w tablicy dwudzielczej wiĊkszej niĪ 2×2 209 Pearson K., (1900), On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is Such that It Can be Reasonably Supposed to Have Arisen from Random Sampling, Philosophy Magazine Series, 5 (50), 157–172. Shier R., (2004), The Chi-squared Test for Two-Way Tables, Mathematics Learning Support Centre. Sokal R. R., Rohlf F. J., (2012), Biometry: The Principles and Practice of Statistics in Biological Research, Freeman, New York. Sulewski P., (2013), Modyfikacja testu niezaleĪnoĞci, WiadomoĞci Statystyczne, GUS, 10, 1–19. Sulewski P., (2014), Statystyczne badanie wspóázaleĪnoĞci cech typu dyskretne kategorie, Akademia Pomorska, Sáupsk. Sulewski P., Motyka R., (2015a), Independence Test. A Comparative Analysis of Its Six Variants, ZN AMW, Gdynia, LVI,1, 37–46. Sulewski P., (2015b), Ocena zdolnoĞci tablic dwudzielczych do wykrywania związku miĊdzy uporządkowanymi cechami typu jakoĞciowego, WiadomoĞci Statystyczne, GUS, 5, 1–16. Sulewski P., (2016), Moc testów niezaleĪnoĞci w tablicy dwudzielczej 2 × 2, WiadomoĞci Statystyczne, GUS, 8. Yates D., Moore D., McCabe G., (1999), The Practice of Statistics, 1st Ed., New York, W. H. Freeman. MOC TESTÓW NIEZALEĩNOĝCI W TABLICY DWUDZIELCZEJ WIĉKSZEJ NIĩ 2 × 2 Streszczenie W literaturze statystycznej istnieje wiele miar testowych do badania niezaleĪnoĞci cech w tablicach dwudzielczych. Do analiz statystycznych wybrano rodzinĊ szeĞciu tzw. „statystyk chi-kwadrat” – w tym statystykĊ Ȥ2 Pearsona – oraz propozycjĊ autora w postaci statystyki moduáowej. W celu uwolnienia siĊ od ograniczeĔ stosowalnoĞci „statystyk chi-kwadrat”, wartoĞci krytyczne dla wszystkich analizowanych statystyk wyznaczono symulacyjnie metodami Monte Carlo. W celu porównania testów zaproponowano miarĊ nieprawdziwoĞci H0 oraz wyznaczono moc testów, czyli zdolnoĞü tablicy dwudzielczej w × k do odrzucenia H0 mówiącej o tym, Īe miĊdzy cechami X i Y nie ma związku. Sáowa kluczowe: tablica dwudzielcza, test niezaleĪnoĞci, wartoĞci krytyczne, Monte Carlo POWER ANALYSIS OF INDEPENDENCE TESTING FOR TWO-WAY CONTINGENCY TABLES BIGGER THAN 2 × 2 Abstract In the statistical literature there are many test measures to study the independence features in the two-way contingency tables. For statistical analysis, the family of six so-called “chi-squared statistic” was selected – including Pearson’s Ȥ2 statistics – and the proposal of the author in the form of modular statistics. In order to free themselves from the limitations of the applicability of the “chi-squared statistic”, critical values for all analyzed statistics were determined by simulation methods of Monte Carlo. In order to compare the tests, the measure of untruthfulness of H0 was proposed and calculated the power of the tests which is the ability of two-way contingency tables to reject null hypothesis which says that between features X and Y there is no relation. Keywords: two-way contingency tables, independence test, critical values, Monte Carlo study