Temat: TEST CHI

Transkrypt

Temat: TEST CHI
Temat:
BADANIE ZGODNOŚCI
ROZKŁADU CECHY (EMPIRYCZNEGO)
Z ROZKŁADEM TEORETYCZNYM –
TEST CHI-KWADRAT
Anna Rajfura
1
Przykład wprowadzający
Wiadomo, Ŝe 40% owoców ulega
uszkodzeniu podczas pakowania
automatycznego.
Jaki jest rozkład liczby owoców
uszkodzonych w opakowaniu zawierającym
cztery sztuki?
Anna Rajfura
2
Przykład wprowadzający cd.
Cecha X – liczba owoców uszkodzonych w opakowaniu
X ~ B (n = 4, p = 0,4)
wartości zmiennej losowej:
k = 0, 1, 2, ..., n
prawdopodobieństwo:
 n k
n−k
Pn ( X = k ) =   p (1 − p)
k 
0
1
2
3
4
wartość k
p-stwo
0,1296 0,3456 0,3456 0,1536 0,0256 Σ pk = 1,0000
pk = P4( X = k)
Anna Rajfura
3
Przykład wprowadzający cd.
0
1
2
3
4
wartość k
p-stwo
0,1296 0,3456 0,3456 0,1536 0,0256 Σ pk = 1,0000
pk = P4(X = k)
Wykres funkcji rozkładu p-stwa cechy X
p-stwo
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0
1
2
3
4
5
liczba owoców uszkodzonych
Anna Rajfura
4
Przykład 1.
Przypuśćmy, Ŝe nie wiadomo, jaka część owoców ulega
uszkodzeniu podczas automatycznego pakowania.
Będzie to przedmiotem badania.
Sprawdzono 200 opakowań. Wyniki przedstawia tabela:
liczba owoców
uszkodzonych
liczba opakowań
0
1
2
3
4
20
75
67
30
8
Σ = 200
Czy na podstawie otrzymanej próby moŜna
przyjąć, Ŝe liczba owoców uszkodzonych
w jednym opakowaniu ma rozkład
dwumianowy z parametrem p = 0,4?
Anna Rajfura
5
Przykład 1. cd.
Wyniki doświadczenia (dają rozkład empiryczny)
liczba owoców
uszkodzonych
liczba
opakowań
% opakowań
0
1
2
3
4
20
75
67
30
8
Σ = 200
0,1 0,375 0,335 0,15 0,04
Rozkład teoretyczny
0 1 2 3 4
wartość k
p-stwo
0,130 0,346 0,346 0,154 0,026 Σ pk = 1,000
pk= P4( X = k )
Anna Rajfura
6
Przykład 1. cd.
Wykres frp rozkładu dwumianowego
Wykres częstości rozkładu empirycznego
0,40
pstwo
częstość
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0
1
2
3
4
5
liczba owoców uszkodzonych
Anna Rajfura
7
Przykład 1. cd. (inny sposób porównania rozkładów)
Wyniki doświadczenia (rozkład empiryczny)
liczba owoców
uszkodzonych
liczba
opakowań
0
1
2
3
4
20
75
67
30
8
Σ = 200
Rozkład teoretyczny
0 1 2 3 4
wartość k
p-stwo
0,130 0,346 0,346 0,154 0,026 Σ pk = 1,000
pk = P4( X = k )
liczebności
teoretyczne
200,4
26
69,2
69,2
30,8
5,2
n (t) = p k ·N
Anna Rajfura
8
Badanie zgodności rozkładu empirycznego
z rozkładem teoretycznym
Cecha X – liczba owoców uszkodzonych w opakowaniu;
H0: X~ B (n = 4, p = 0,4), poziom istotności α = 0,05;
• test χ (czyt.: chi - kwadrat),
• wzór funkcji testowej:
2
r
χ
Anna Rajfura
2
emp
=∑
i =1
(n −n ( ) )
t
i
2
i
ni ( t )
9
Badanie zgodności rozkładu empirycznego
z rozkładem teoretycznym cd.
• wzór funkcji testowej:
r
χ
2
emp
=∑
i =1
(n −n ( ) )
t
i
2
i
ni ( t )
gdzie:
ni – liczebność empiryczna,
(t)
ni – liczebność teoretyczna,
r – liczba klas,
Anna Rajfura
10
Badanie zgodności rozkładu empirycznego
z rozkładem teoretycznym cd.
Wnioskowanie
2
2
jeŜeli emp
α , v = r −1−u , to H 0 odrzucamy,
w przeciwnym przypadku H 0 nie moŜna
odrzucić
χ
>χ
gdzie:
u – liczba parametrów, które naleŜy oszacować na
podstawie próby
Obliczenia i wnioski na tablicy.
Anna Rajfura
11
Wartości krytyczne rozkładu chi-kwadrat
X ~ χ2ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni
swobody ν, α - poziom istotności,
χ2α, ν - wartość krytyczna - liczba taka, Ŝe P(X > χ2 α, ν ) = α
ν \ a 0,995 0,990 0,975 0,950 0,900
1 0,04393 0,0002 0,0010 0,0039 0,0158
0,0100 0,0201 0,0506 0,1026 0,2107
2
0,0717 0,1148 0,2158 0,3518 0,5844
3
4
5
6
7
8
9
:
80
85
90
95
100
Anna Rajfura
0,100
2,7055
4,6052
6,2514
0,2070
0,4118
0,6757
0,9893
1,3444
1,7349
0,2971
0,5543
0,8721
1,2390
1,6465
2,0879
0,4844
0,8312
1,2373
1,6899
2,1797
2,7004
0,7107
1,1455
1,6354
2,1673
2,7326
3,3251
1,0636
1,6103
2,2041
2,8331
3,4895
4,1682
7,7794
9,2363
10,6446
12,0170
13,3616
14,6837
51,1719
55,1695
59,1963
63,2495
67,3275
53,5400
57,6339
61,7540
65,8983
70,0650
57,1532
61,3888
65,6466
69,9249
74,2219
60,3915
64,7494
69,1260
73,5198
77,9294
64,2778
68,7771
73,2911
77,8184
82,3581
96,5782
102,0789
107,5650
113,0377
118,4980
0,050
0,025
5,0239
7,3778
9,3484
0,010
0,005
6,6349 7,8794
9,2104 10,5965
11,3449 12,8381
11,0705
12,5916
14,0671
15,5073
16,9190
11,1433
12,8325
14,4494
16,0128
17,5345
19,0228
13,2767
15,0863
16,8119
18,4753
20,0902
21,6660
14,8602
16,7496
18,5475
20,2777
21,9549
23,5893
101,8795
107,5217
113,1452
118,7516
124,3421
106,6285
112,3933
118,1359
123,8580
129,5613
112,3288
118,2356
124,1162
129,9725
135,8069
116,3209
122,3244
128,2987
134,2466
140,1697
3,8415
5,9915
7,8147
9,4877
12
Przykład 2.
Badano masę owocu pewnej odmiany. Czy na
podstawie uzyskanych wyników (rozkład empiryczny)
moŜna stwierdzić, Ŝe ma ona rozkład normalny?
Numer
Granice
przedziału
przedziału
<184,05; 186,55)
1.
<186,55;189,05)
2.
<189,05;191,55)
3.
<191,55;194,05)
4.
<194,05;196,55)
5.
<196,55;199,55)
6.
<199,55;201,55)
7.
<201,55;204,05)
8.
<204,05;206,55>
9.
Razem
Anna Rajfura
Środek Liczebność
przedz. xi
ni
185,3
187,8
190,3
192,8
195,3
197,8
200,3
202,8
205,3
2
7
23
32
33
34
20
7
2
160
13
Przykład 2. cd.
Wykres fgp rozkładu normalnego
Wykres częstości rozkładu empirycznego
185,3
187,8
190,3
192,8
195,3
197,8
200,3
202,8
205,3
masa owocu
Czy rozkład empiryczny wartości cechy X
jest dobrze opisany za pomocą
teoretycznego rozkładu normalnego?
Anna Rajfura
14
Badanie zgodności rozkładu empirycznego
z rozkładem teoretycznym
Cecha X – masa owocu pewnej odmiany;
H 0 : X~ N,
poziom istotności α = 0,05,
Uwaga:
W hipotezie zerowej jest nazwa rozkładu, ale nie ma
parametrów.
Stosujemy taką samą procedurę testowania hipotezy,
jak wcześniej. Wymaga ona wyznaczenia liczebności
teoretycznej w przedziałach, np. <186,55;189,05), i in.
Anna Rajfura
15
Przypomnienie na tablicy:
wyznaczanie liczebności teoretycznej dla przedziału;
obliczanie p-stwa wartości z przedziału < a ; b )
z wykorzystaniem dystrybuanty rozkładu normalnego;
standaryzacja;
odczyt z tablic dystrybuanty rozkładu normalnego;
wyznaczenie średniej i wariancji z próby (stąd liczba
parametrów szacowanych na podstawie próby!)
Anna Rajfura
16
Wyznaczanie wartości średniej i wariancji
dla próby w postaci szeregu rozdzielczego
Numer
przedziału
Granice przedziału
1.
<184,05; 186,55)
2.
<186,55;189,05)
3.
<189,05;191,55)
4.
<191,55;194,05)
5.
<194,05;196,55)
6.
<196,55;199,55)
7.
<199,55;201,55)
8.
<201,55;204,05)
9.
<204,05;206,55>
Razem
Środek Liczebność
ni
przedz. xi
185,3
187,8
190,3
192,8
195,3
197,8
200,3
202,8
205,3
2
7
23
32
33
34
20
7
2
160
xini
(xi-x)2ni
370,6
1314,6
4376,9
6169,6
6444,9
6725,2
4006,0
1419,6
410,6
31238,0
188,2
362,9
508,1
154,9
3,0
266,6
561,8
425,9
212,2
2683,4
x = 195 , s 2 = 16 .
Anna Rajfura
17
Wyznaczanie wartości funkcji testowej
Numer
Granice
przedziału
przedziału
1.
<184,05; 186,55)
2.
<186,55;189,05)
3.
<189,05;191,55)
4.
<191,55;194,05)
5.
<194,05;196,55)
6.
<196,55;199,55)
7.
<199,55;201,55)
8.
<201,55;204,05)
9.
<204,05;206,55>
Razem
Liczebność
ni
2
7
23
32
33
34
20
7
2
160
pi
(t)
ni
0,02
0,05
0,13
0,21
0,24
0,19
0,10
0,04
0,01
1,00
2,77
8,18
20,12
33,91
39,15
30,97
16,78
6,23
1,89
(
n i − n i( t )
n (t )
)
2
i
0,2148
0,1700
0,4115
0,1074
0,9654
0,2971
0,6171
0,0955
0,0060
2,8848
Obliczenia na tablicy.
Anna Rajfura
18
Dystrybuanta standardowego rozkładu normalnego
X – zmienna losowa, f(x) – funkcja gęstości, F(x) – dystrybuanta X~N (0, 1),
f (x) =
1
2π
e
−
x2
2
,
x
F(x)=
∫ f ( t ) dt
−∞
x
0,0
0,1
:
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,97725
0,98214
0,98610
0,98928
Anna Rajfura
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,97778
0,98257
0,98645
0,98956
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,97831
0,98300
0,98679
0,98983
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,97882
0,98341
0,98713
0,99010
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,97932
0,98382
0,98745
0,99036
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,97982
0,98422
0,98778
0,99061
0,91308
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,98030
0,98461
0,98809
0,99086
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,98077
0,98500
0,98840
0,99111
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,98124
0,98537
0,98870
0,99134
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
0,98169
0,98574
0,98899
0,99158
19
Anna Rajfura
20