Temat: TEST CHI
Transkrypt
Temat: TEST CHI
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM – TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego. Jaki jest rozkład liczby owoców uszkodzonych w opakowaniu zawierającym cztery sztuki? Anna Rajfura 2 Przykład wprowadzający cd. Cecha X – liczba owoców uszkodzonych w opakowaniu X ~ B (n = 4, p = 0,4) wartości zmiennej losowej: k = 0, 1, 2, ..., n prawdopodobieństwo: n k n−k Pn ( X = k ) = p (1 − p) k 0 1 2 3 4 wartość k p-stwo 0,1296 0,3456 0,3456 0,1536 0,0256 Σ pk = 1,0000 pk = P4( X = k) Anna Rajfura 3 Przykład wprowadzający cd. 0 1 2 3 4 wartość k p-stwo 0,1296 0,3456 0,3456 0,1536 0,0256 Σ pk = 1,0000 pk = P4(X = k) Wykres funkcji rozkładu p-stwa cechy X p-stwo 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 liczba owoców uszkodzonych Anna Rajfura 4 Przykład 1. Przypuśćmy, Ŝe nie wiadomo, jaka część owoców ulega uszkodzeniu podczas automatycznego pakowania. Będzie to przedmiotem badania. Sprawdzono 200 opakowań. Wyniki przedstawia tabela: liczba owoców uszkodzonych liczba opakowań 0 1 2 3 4 20 75 67 30 8 Σ = 200 Czy na podstawie otrzymanej próby moŜna przyjąć, Ŝe liczba owoców uszkodzonych w jednym opakowaniu ma rozkład dwumianowy z parametrem p = 0,4? Anna Rajfura 5 Przykład 1. cd. Wyniki doświadczenia (dają rozkład empiryczny) liczba owoców uszkodzonych liczba opakowań % opakowań 0 1 2 3 4 20 75 67 30 8 Σ = 200 0,1 0,375 0,335 0,15 0,04 Rozkład teoretyczny 0 1 2 3 4 wartość k p-stwo 0,130 0,346 0,346 0,154 0,026 Σ pk = 1,000 pk= P4( X = k ) Anna Rajfura 6 Przykład 1. cd. Wykres frp rozkładu dwumianowego Wykres częstości rozkładu empirycznego 0,40 pstwo częstość 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 liczba owoców uszkodzonych Anna Rajfura 7 Przykład 1. cd. (inny sposób porównania rozkładów) Wyniki doświadczenia (rozkład empiryczny) liczba owoców uszkodzonych liczba opakowań 0 1 2 3 4 20 75 67 30 8 Σ = 200 Rozkład teoretyczny 0 1 2 3 4 wartość k p-stwo 0,130 0,346 0,346 0,154 0,026 Σ pk = 1,000 pk = P4( X = k ) liczebności teoretyczne 200,4 26 69,2 69,2 30,8 5,2 n (t) = p k ·N Anna Rajfura 8 Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym Cecha X – liczba owoców uszkodzonych w opakowaniu; H0: X~ B (n = 4, p = 0,4), poziom istotności α = 0,05; • test χ (czyt.: chi - kwadrat), • wzór funkcji testowej: 2 r χ Anna Rajfura 2 emp =∑ i =1 (n −n ( ) ) t i 2 i ni ( t ) 9 Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym cd. • wzór funkcji testowej: r χ 2 emp =∑ i =1 (n −n ( ) ) t i 2 i ni ( t ) gdzie: ni – liczebność empiryczna, (t) ni – liczebność teoretyczna, r – liczba klas, Anna Rajfura 10 Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym cd. Wnioskowanie 2 2 jeŜeli emp α , v = r −1−u , to H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić χ >χ gdzie: u – liczba parametrów, które naleŜy oszacować na podstawie próby Obliczenia i wnioski na tablicy. Anna Rajfura 11 Wartości krytyczne rozkładu chi-kwadrat X ~ χ2ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody ν, α - poziom istotności, χ2α, ν - wartość krytyczna - liczba taka, Ŝe P(X > χ2 α, ν ) = α ν \ a 0,995 0,990 0,975 0,950 0,900 1 0,04393 0,0002 0,0010 0,0039 0,0158 0,0100 0,0201 0,0506 0,1026 0,2107 2 0,0717 0,1148 0,2158 0,3518 0,5844 3 4 5 6 7 8 9 : 80 85 90 95 100 Anna Rajfura 0,100 2,7055 4,6052 6,2514 0,2070 0,4118 0,6757 0,9893 1,3444 1,7349 0,2971 0,5543 0,8721 1,2390 1,6465 2,0879 0,4844 0,8312 1,2373 1,6899 2,1797 2,7004 0,7107 1,1455 1,6354 2,1673 2,7326 3,3251 1,0636 1,6103 2,2041 2,8331 3,4895 4,1682 7,7794 9,2363 10,6446 12,0170 13,3616 14,6837 51,1719 55,1695 59,1963 63,2495 67,3275 53,5400 57,6339 61,7540 65,8983 70,0650 57,1532 61,3888 65,6466 69,9249 74,2219 60,3915 64,7494 69,1260 73,5198 77,9294 64,2778 68,7771 73,2911 77,8184 82,3581 96,5782 102,0789 107,5650 113,0377 118,4980 0,050 0,025 5,0239 7,3778 9,3484 0,010 0,005 6,6349 7,8794 9,2104 10,5965 11,3449 12,8381 11,0705 12,5916 14,0671 15,5073 16,9190 11,1433 12,8325 14,4494 16,0128 17,5345 19,0228 13,2767 15,0863 16,8119 18,4753 20,0902 21,6660 14,8602 16,7496 18,5475 20,2777 21,9549 23,5893 101,8795 107,5217 113,1452 118,7516 124,3421 106,6285 112,3933 118,1359 123,8580 129,5613 112,3288 118,2356 124,1162 129,9725 135,8069 116,3209 122,3244 128,2987 134,2466 140,1697 3,8415 5,9915 7,8147 9,4877 12 Przykład 2. Badano masę owocu pewnej odmiany. Czy na podstawie uzyskanych wyników (rozkład empiryczny) moŜna stwierdzić, Ŝe ma ona rozkład normalny? Numer Granice przedziału przedziału <184,05; 186,55) 1. <186,55;189,05) 2. <189,05;191,55) 3. <191,55;194,05) 4. <194,05;196,55) 5. <196,55;199,55) 6. <199,55;201,55) 7. <201,55;204,05) 8. <204,05;206,55> 9. Razem Anna Rajfura Środek Liczebność przedz. xi ni 185,3 187,8 190,3 192,8 195,3 197,8 200,3 202,8 205,3 2 7 23 32 33 34 20 7 2 160 13 Przykład 2. cd. Wykres fgp rozkładu normalnego Wykres częstości rozkładu empirycznego 185,3 187,8 190,3 192,8 195,3 197,8 200,3 202,8 205,3 masa owocu Czy rozkład empiryczny wartości cechy X jest dobrze opisany za pomocą teoretycznego rozkładu normalnego? Anna Rajfura 14 Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym Cecha X – masa owocu pewnej odmiany; H 0 : X~ N, poziom istotności α = 0,05, Uwaga: W hipotezie zerowej jest nazwa rozkładu, ale nie ma parametrów. Stosujemy taką samą procedurę testowania hipotezy, jak wcześniej. Wymaga ona wyznaczenia liczebności teoretycznej w przedziałach, np. <186,55;189,05), i in. Anna Rajfura 15 Przypomnienie na tablicy: wyznaczanie liczebności teoretycznej dla przedziału; obliczanie p-stwa wartości z przedziału < a ; b ) z wykorzystaniem dystrybuanty rozkładu normalnego; standaryzacja; odczyt z tablic dystrybuanty rozkładu normalnego; wyznaczenie średniej i wariancji z próby (stąd liczba parametrów szacowanych na podstawie próby!) Anna Rajfura 16 Wyznaczanie wartości średniej i wariancji dla próby w postaci szeregu rozdzielczego Numer przedziału Granice przedziału 1. <184,05; 186,55) 2. <186,55;189,05) 3. <189,05;191,55) 4. <191,55;194,05) 5. <194,05;196,55) 6. <196,55;199,55) 7. <199,55;201,55) 8. <201,55;204,05) 9. <204,05;206,55> Razem Środek Liczebność ni przedz. xi 185,3 187,8 190,3 192,8 195,3 197,8 200,3 202,8 205,3 2 7 23 32 33 34 20 7 2 160 xini (xi-x)2ni 370,6 1314,6 4376,9 6169,6 6444,9 6725,2 4006,0 1419,6 410,6 31238,0 188,2 362,9 508,1 154,9 3,0 266,6 561,8 425,9 212,2 2683,4 x = 195 , s 2 = 16 . Anna Rajfura 17 Wyznaczanie wartości funkcji testowej Numer Granice przedziału przedziału 1. <184,05; 186,55) 2. <186,55;189,05) 3. <189,05;191,55) 4. <191,55;194,05) 5. <194,05;196,55) 6. <196,55;199,55) 7. <199,55;201,55) 8. <201,55;204,05) 9. <204,05;206,55> Razem Liczebność ni 2 7 23 32 33 34 20 7 2 160 pi (t) ni 0,02 0,05 0,13 0,21 0,24 0,19 0,10 0,04 0,01 1,00 2,77 8,18 20,12 33,91 39,15 30,97 16,78 6,23 1,89 ( n i − n i( t ) n (t ) ) 2 i 0,2148 0,1700 0,4115 0,1074 0,9654 0,2971 0,6171 0,0955 0,0060 2,8848 Obliczenia na tablicy. Anna Rajfura 18 Dystrybuanta standardowego rozkładu normalnego X – zmienna losowa, f(x) – funkcja gęstości, F(x) – dystrybuanta X~N (0, 1), f (x) = 1 2π e − x2 2 , x F(x)= ∫ f ( t ) dt −∞ x 0,0 0,1 : 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 0,90320 0,91924 0,93319 0,94520 0,95543 0,96407 0,97128 0,97725 0,98214 0,98610 0,98928 Anna Rajfura 0,90490 0,92073 0,93448 0,94630 0,95637 0,96485 0,97193 0,97778 0,98257 0,98645 0,98956 0,90658 0,92220 0,93574 0,94738 0,95728 0,96562 0,97257 0,97831 0,98300 0,98679 0,98983 0,90824 0,92364 0,93699 0,94845 0,95818 0,96638 0,97320 0,97882 0,98341 0,98713 0,99010 0,90988 0,92507 0,93822 0,94950 0,95907 0,96712 0,97381 0,97932 0,98382 0,98745 0,99036 0,91149 0,92647 0,93943 0,95053 0,95994 0,96784 0,97441 0,97982 0,98422 0,98778 0,99061 0,91308 0,92785 0,94062 0,95154 0,96080 0,96856 0,97500 0,98030 0,98461 0,98809 0,99086 0,91466 0,92922 0,94179 0,95254 0,96164 0,96926 0,97558 0,98077 0,98500 0,98840 0,99111 0,91621 0,93056 0,94295 0,95352 0,96246 0,96995 0,97615 0,98124 0,98537 0,98870 0,99134 0,91774 0,93189 0,94408 0,95449 0,96327 0,97062 0,97670 0,98169 0,98574 0,98899 0,99158 19 Anna Rajfura 20