9. TESTY ZGODNOŚCI 9.1 Róne sytuacje praktyczne

Transkrypt

9. TESTY ZGODNOŚCI 9.1 Róne sytuacje praktyczne
Testy zgodności 9
113
9. TESTY ZGODNOŚCI
9.1 Różne sytuacje praktyczne
W praktyce badań statystycznych, jak już poprzednio stwierdzono, cały proces analizy
statystycznej dzielimy na dwa etapy: formułowanie hipotezy statystycznej oraz weryfikacje
hipotezy statystycznej, które powinny być oparte na niezależnych obserwacjach. Oznacza to,
że po sformułowaniu hipotezy należy zebrać nowe obserwacje dla jej sprawdzenia. Prawda
obiektywna nie może opierać się tylko na jednym materiale statystycznym. Często w praktyce
podświadomie hipotezę statystyczną, którą sformułowaliśmy, traktujemy jako własną, jedynie
słuszną, traktując odrzucenie hipotezy jak osobistą porażkę. Emocjonalny stosunek do
hipotezy zerowej nie jest właściwym podejściem do testowania hipotez statystycznych,
bowiem grozi statystycznym oszustwem. Niestety, często nawet w nauce zdarzają się takie
sytuacje, w których celem jest obrona własnej, jedynie słusznej hipotezy. W takich sytuacjach
powstaje manipulacja statystyczna udająca naukowe podejście do problemu. Dlatego też
raporty z badań statystycznych powinny być „przeźroczyste” pozwalające na łatwą kontrolę
obliczeń statystycznych. I stąd bierze się wymóg weryfikacji każdej hipotezy na niezależnym
materiale.
W dalszym ciągu przytacza się trochę zmieniony podrozdział 5.13 książki Plucińskich
(1990). Mówiąc o zagadnieniach estymacji, jak również weryfikacji hipotezy parametrycznej,
często zakładaliśmy, że znamy postać rozkładu interesującej nas cechy elementów populacji
generalnej, a w przypadku nieznajomości postaci rozkładu, korzystaliśmy z twierdzeń
granicznych. Obecnie omówione zostaną testy pozwalające na weryfikację hipotezy
dotyczącej postaci nieznanego rozkładu.
Niech dana będzie populacja, w której rozkład cechy X elementów jest nieznany.
Pobieramy n-elementową próbkę. Zaobserwowane w próbce wartości zawierają oczywiście
informacje o nieznanym rozkładzie cechy X.
Najprostszą metodą prowadzącą do uzyskania wstępnych informacji o postaci
rozkładu interesującej nas cechy elementów populacji jest narysowanie histogramu rozkładu
Testy zgodności 9
114
zaobserwowanego w próbce. Uzyskane z rysunku informacje są jednak niepełne i oczywiście
tylko „wzrokowe”. Niepełne przede wszystkim ze względu na to, że nie uwzględnia się
losowego składu próbki. Jednakże te „wzrokowe” informacje zawarte w histogramie
pozwalają na zorientowanie się, jakie ewentualnie rozkłady mogą być brane pod uwagę.
Popatrzmy na histogramy podane na rysunkach 9.1. O ile na prawym histogramie skłonni
byliśmy dopuścić możliwość występowania rozkładu Erlanga rzędu 2 lub więcej, o tyle taka
ewentualność dla lewego histogramu nie powinna być brana pod uwagę.
Rys. 9.1. Przykładowe histogramy z badań statystycznych
Oczywiście, spostrzeżenia oparte na kształcie histogramu nie mogą służyć za
podstawę do jakichś ogólniejszych rozważań. Niezbędna jest bardziej precyzyjna miara
zgodności między rozkładem w próbce a hipotetycznym rozkładem cechy elementów
populacji.
Pierwszym krokiem, podobnie jak to miało miejsce w przypadku hipotez
parametrycznych, powinno być ustalenie zbioru możliwych w danym zagadnieniu hipotez,
tzn. zbioru możliwych rozkładów, które mogą być brane pod uwagę. Następnie wyróżnienie z
tego zbioru hipotezy zerowej. Kolejnym krokiem jest przyjęcie odpowiedniej statystyki, która
może służyć za test do weryfikacji hipotezy zerowej. Rozważmy szczegółowo kilka testów
nieparametrycznych.
9.2 .Test χ 2 Pearsona
Niech cecha x elementów populacji ma rozkład o dystrybuancie F. Podzielmy całą oś
rzeczywistą
na
r +1
rozłącznych
przedziałów
I 1 , I 2 ,..., I r +1
za
pomocą
liczb
− ∞ = α 0 < α 1 <... < α r < α r +1 = ∞ . Oznaczmy przez p j prawdopodobieństwo, że zmienna
losowa X przyjmie wartość z przedziału I j , tzn.
Testy zgodności 9
115
( ) ( )
p j = F α j − F α j −1 ,
j = 1,2,..., r + 1
(9.1)
i niech p j > 0 dla każdego j. Liczba np j jest oczekiwaną liczbą obserwacji n-elementowej
próbki, które powinny się znaleźć w przedziale I j . Niech N j oznacza zmienną losową o
wartościach n j będących liczbą obserwacji, które znalazły się w przedziale I j . Suma
kwadratów różnic n j − np j tzn.
r +1
∑ (n
j
− np j
j =1
)
2
(9.2)
może służyć za miarę zgodności rozkładu zaobserwowanego w próbce z rozkładem
hipotetycznym. Wartość sumy (9.2) zmienia się od próbki do próbki, a statystyka, której
wartościami są te sumy ma bardzo złożony rozkład. Okazuje się jednak, że odpowiednie
(
„wyważenie” kwadratów n j − np j
)
2
pozwala na uzyskanie znanego rozkładu granicznego.
K Pearson udowodnił mianowicie, że statystyka
r +1
χ2 = ∑
j =1
(N
j
− np j
)
2
(9.3)
np j
ma, gdy n → ∞ , rozkład chi-kwadrat o r stopniach swobody.
Statystyka (9.3) znana jest w literaturze pod nazwą testu χ 2 Pearsona. Zauważmy, że
statystyka χ 2 nie zależy od tego, jaka jest postać dystrybuanty cechy X elementów populacji.
(
)
Istotną rolę odgrywają tu prawdopodobieństwa p j = P X ∈ I j , przy czym podział na
przedziały
Ij
został dokonany w sposób
zupełnie dowolny. Ten sam układ
prawdopodobieństw p1 , p2 ,..., pr +1 może odpowiadać wielu różnym rozkładom zarówno typu
ciągłego, jak i skokowego. Oznacza to, że w gruncie rzeczy za pomocą testu χ 2 możemy
zweryfikować hipotezę dotyczącą układu prawdopodobieństw p1 , p2 ,..., pr +1 , a nie postaci
rozkładu cechy X elementów populacji. Dlatego też za hipotezę zerową będziemy tu uważać
Testy zgodności 9
116
(
)
P X ∈ I j = p j ( j = 1,2 ,..., r + 1) . Hipotezą
klasę wszystkich rozkładów, dla których
(
)
alternatywną jest klasa rozkładów, dla których co najmniej dla jednego j jest P X ∈ I j ≠ p j .
Oczywiście, obydwie wymienione klasy rozkładów są dość szerokie. Możne je na ogół bardzo
zawęzić korzystając z informacji dotyczących przebiegu badanego zjawiska czy istoty
zagadnienia, np. że cecha X elementów populacji jest zmienną losową typu ciągłego lub że
przyjmuje wartości całkowite, czy też że przyjmuje wartości z pewnego niewielkiego
przedziału. Jednakże mimo zawężenia hipoteza zerowa, jak i alternatywna będą nadal bardzo
licznymi klasami rozkładów. Oznacza to, że przy danej próbce statystyka χ 2 będzie mieć tę
samą wartość dla wielu rozkładów. Te rozkłady, dla których prawdopodobieństwo odrzucenia
hipotezy zerowej jest takie samo i hipotezę odrzucamy, nie będą nas interesowały. Przyjęcie
hipotezy zerowej jest równoważne stwierdzeniu, że każdy rozkład należący do niej może
służyć do opisu danego zjawiska, czy doświadczenia. Wystarczy zatem wybrać jeden z
rozkładów należących do hipotezy zerowej. Dlatego też w dalszych rozważaniach, dla
uproszczenia, hipotezę zerową formułować będziemy jako przypuszczenie, że cecha X
elementów populacji ma rozkład o dystrybuancie F.
Mając sprecyzowaną hipotezę zerową i wybrany test do weryfikacji tej hipotezy
postępujemy w sposób analogiczny jak w przypadku hipotez parametrycznych. Za pomocą
testu χ 2 hipotezę zerową weryfikujemy w sposób następujący.
Przyjmujemy poziom istotności testu α . Zbiorem krytycznym jest zbiór
W=
{( x , x
1
2
}
2
2
,..., x n ): χ zaobs
. χα ,
gdzie χα2 jest liczbą odczytaną z tablic rozkładu chi-kwadrat o r stopniach swobody
spełniającą warunek
∞
P( χ 2 > χα2 ) =
∫ k ( x)dx = α ,
r
χα2
przy czym k r ( x ) jest gęstością prawdopodobieństwa zmiennej losowej o rozkładzie chikwadrat z r stopniami swobody.
Testy zgodności 9
117
Zatem hipotezę H 0 odrzucamy, gdy
2
χ zaobs.
> χα2
(9.4)
2
≤ χα2 ,
χ zaobs.
(9.5)
i przyjmujemy, gdy
2
gdzie χ zaobs
. oznacza wartość statystyki (9.3) zaobserwowaną w próbce.
Przedstawiona metoda weryfikacji hipotezy o postaci rozkładu jest oparta na
granicznym rozkładzie statystyki (9.3), a zatem n musi być dostatecznie duże. Przyjmuje się,
że test χ 2 można stosować, gdy np j ≥ 10 dla j = 2 ,3,..., r oraz np1 , npr +1 ≥ 5 .
W
przypadku
takiego
podziału
osi
na
OX
przedziały,
w
którym
p j = 1 r + 1 ( j = 1,2 ,..., r + 1) można stosować graniczny rozkład testu χ 2 o r stopniach
swobody na poziomie istotności α = 0.05 lub α = 0.01 już dla niewielkich n (15-20) i n j = 1.
PRZYKŁAD 9.1 (Plucińscy, 1990) przeprowadzono obserwacje dotyczące wypadków
określonym terenie spowodowanych w ciągu roku przez kierowców
drogowych na
będących w stanie nietrzeźwym. Otrzymany rozkład wypadków w poszczególne dni tygodnia
podaje następująca tabelka:
Pn
Wt
Śr
Czw
Pt
So
N
19
15
16
14
13
18
17
Przyjmując
poziom
istotności
α = 0.05
zweryfikować
hipotezę,
że
prawdopodobieństwo zdarzenia się na tym terenie wypadku spowodowanego przez kierowcę
w stanie nietrzeźwym jest jednakowe dla wszystkich dni tygodnia.
Mamy tu siedem przedziałów I 1 , I 2 ,..., I 7 oraz p1 = p 2 = ... = p 7 = 1 7 , a liczności n j
podane są w tabelce.
Z danych liczbowych wynika, że n = 112 , np j = 112 ⋅
1
= 16 ,
7
Testy zgodności 9
118
2
χ zaobs.
=
14
1
( 9 + 1 + 0 + 4 + 9 + 4 + 1) = = 1.75 .
16
8
Z tablicy rozkładu chi-kwadrat dla 6 stopni swobody i poziomu istotności α = 0.05
znajdujemy
χα2 = 12.592 . Ponieważ
2
χ zaobs.
< χ2
więc
hipotezę
H0
o
równości
prawdopodobieństw przyjmujemy.
Omówiona metoda weryfikacji hipotez nieparametrycznych odnosi się wyłącznie do
tych przypadków, gdy dystrybuanta F jednoznacznie określa hipotetyczny rozkład, bowiem
tylko wtedy w sposób jednoznaczny można określić prawdopodobieństwa p j . Nie można na
testem χ 2 zweryfikować hipotezy, że cecha X elementów
przykład przedstawionym
populacji ma rozkład normalny, jeśli parametry tego rozkładu nie są znane. Można jednak
ulepszyć, a dokładniej poszerzyć metodę zaproponowaną przez Pearsona. Fisher udowodnił,
że przy spełnieniu pewnych warunków odnośnie do nieznanych parametrów dystrybuanty F
test χ 2 może być zastosowany również w tych przypadkach, gdy dystrybuanta F precyzuje
jedynie pewną klasę rozkładów, a ściślej mówiąc, zależy od nieznanych parametrów.
Przedstawimy teraz zmodyfikowany przzez Fishera test χ 2 . Sformułujemy najpierw
twierdzenie udowodnione przez Fishera.
TWIERDZENIE 9.1. Niech p j = p j ( λ1 , λ2 ,..., λm ) i niech istnieją ciągłe pochodne
cząstkowe
δp j
δ 2 pj
,
,
δλ j
δλi δλl
Jeżeli macierz
[δp
j
δλi
]
j = 1,2 ,..., r + 1; i , l = 1,2,..., m .
( j = 1,2,..., r + 1; i = 1,2,..., m)
jest rzędu m, a parametry
λ1 , λ2 ,..., λm zostały wyznaczone metodą największej wiarygodności, to rozkład statystyki χ 2
Pearsona zmierza, gdy n → ∞ , do rozkładu chi-kwadrat o r-m stopniach swobody.
Z twierdzenia 9.1 wynika, że jeżeli chcemy zweryfikować hipotezę H 0 , że cecha X
elementów populacji ma rozkład o dystrybuancie F zależnej od m parametrów, to do
weryfikacji takiej hipotezy można użyć testu χ 2 Pearsona. Zbiorem krytycznym w tym
przypadku będzie zbiór
Testy zgodności 9
{
119
}
2
2
W = ( x1 , x 2 ,..., x n ): χ zaobs
. > χα ,
gdzie χα2 jest liczbą odczytaną z tablicy rozkładu chi-kwadrat spełniającą warunek
∞
P( χ 2 > χα2 ) =
∫ k ( x)dx = α ,
r−m
χ α2
przy czym k r − m ( x ) jest gęstością prawdopodobieństwa zmiennej losowej o rozkładzie chikwadrat z r-m stopniami swobody.
PRZYKŁAD 9.2 (Plucińscy, 1990). W dziale kontroli technicznej pewnej fabryki
konfekcji badanie jakości partii płaszczy damskich przeprowadza się wyrywkowo. W celu
zbadania jakości partii płaszczy damskich pobrano próbkę o liczności 80 sztuk i zbadano
liczby usterek otrzymując następujące dane liczbowe:
Liczba usterek
0
1
2
3
4
5
Liczba płaszczy
18
26
20
10
5
1
Przyjmując poziom istotności α = 0.05 , zweryfikować hipotezę H 0 , że rozkład liczby
usterek w płaszczach produkowanych w tej fabryce jest rozkładem Poissona.
Mamy tu jeden nieznany parametr λ . Jak wiemy estymatorem NW parametru λ jest
X n , a więc jako oszacowania parametru λ przyjmujemy x n = 15
. .
I1
I2
I3
I4
I5
Testy zgodności 9
120
Rys. 9.2. Podział na przedziały zmienności
Przyjmijmy podziały na przedziały I j jak na Rys. 9.2. Dwie ostatnie kolumny danych z
tabelki połączyliśmy ze względu na małe liczności w tych kolumnach. Z tablicy rozkładu
Poissona dla λ = 15
. odczytujemy prawdopodobieństwa p j . Następnie obliczamy wartość
statystyki χ 2 Pearsona zapisując kolejne obliczenia w następującej tabelce:
j
nj
pj
np j
n j − np j
( n − np )
j
2
j
( n − np )
j
2
j
np j
1
18
0.2231
17.848
0.152
0.023104
0.0013
2
26
0.3347
26.776
-0.776
0.602176
0.0225
3
20
0.2510
20.080
-0.080
0.00640
0.0003
4
10
0.1255
10.040
-0.040
0.001600
0.0002
5
6
0.0471
3.768
2.232
4.981824
1.3221
2
χzaobs
. =
1.3464
Mamy więc tu 5 przedziałów i jeden parametr wyznaczony na podstawie próbki, zatem
liczba stopni swobody jest równa 3. Z tablic rozkładu chi-kwadrat dla α = 0.05 i trzech
2
stopni swobody odczytujemy χ zaobs.
= 1.3464 < χα2 = 7.815 , więc przyjmujemy hipotezę H 0 ,
że rozkład liczby usterek w płaszczach jest rozkładem Poissona.
9.3 .Test λ Kołmogorowa
Testy zgodności 9
121
Test nieparametryczny można również skonstruować na podstawie twierdzenia
Kołmogorowa. Przypuśćmy, że interesująca nas cecha X elementów populacji jest zmienną
losową typu ciągłego. Na podstawie n elementowej próbki (n co najmniej rzędu kilku
dziesiątków) chcemy zweryfikować hipotezę H 0 , że cecha X ma dystrybuantę F.
Jako test do weryfikacji hipotezy H 0 możemy przyjąć statystykę
nDn = n sup Fn ( x ) − F ( x ) ,
(9.6)
−∞< x <∞
gdzie Fn jest dystrybuantą empiryczną. Rozkład graniczny statystyki
nDn precyzuje
twierdzenie Kołmogorowa (patrz np. Plucińscy, 1990). Przyjmijmy poziom istotności α .
Zbiorem krytycznym jest tu zbiór
W=
{( x , x
1
2
}
,..., x n ): nDn > λ ,
(9.7)
gdzie λ jest liczbą spełniającą warunek
P
przy czym Q( λ )
(
)
nDn > λ = 1 − Q( λ ) = α ,
jest wartością dystrybuanty rozkładu określonej w
(9.8)
twierdzeniu
Kołmogorowa (patrz np. Plucińscy, 1990). Dla danego α znamy Q( λ ) , a z odpowiedniej
tablicy odczytamy wartość λ .
Hipotezę H 0 , że cecha X ma dystrybuantę F odrzucamy, gdy
nDn > λ
(9.9)
nDn ≤ λ .
(9.10)
i przyjmujemy, gdy
Testy zgodności 9
122
Należy podkreślić, że przy stosowaniu testu λ Kołmogorowa trzeba mieć na uwadze pewne
ograniczenia.
Po pierwsze dystrybuanta F musi jednoznacznie określać hipotetyczny rozkład w tym
sensie, że nie może zależeć od parametrów szacowanych na podstawie próbki. W przypadku
zależności F od nieznanych parametrów twierdzenie Kołmogorowa nie jest prawdziwe.
Po drugie w związku z założeniem ciągłości dystrybuanty F wyników obserwacji nie
można grupować.
9.4 .Test Kołmogorowa- Smirnowa
Przyjmijmy, że dane są dwie populacje. Chcemy zweryfikować hipotezę H 0 , że cecha
X elementów obydwu populacji ma taką samą ciągłą dystrybuantę F. Test dla zweryfikowania
takiej hipotezy oparty jest na następującym twierdzeniu Smirnowa:
TWIERDZENIE 9.2. Niech:
a) X 1 , X 2 ,..., X n1 i Y1 , Y2 ,..., Yn2 będą niezależnymi zmiennymi losowymi o jednakowym
rozkładzie z ciągłą dystrybuantą F,
b) Fn1 i Fn2 będą dystrybuantami empirycznymi określonymi wzorami
Fn1 ( x ) =
1
Card {i: X i < x , i = 1,2,..., n1 }
n1
(9.11)
Fn2 ( x ) =
1
Card { i: Yi < x , i = 1,2 ,..., n2 }
n2
(9.12)
c) δ n = sup Fn1 ( x ) − Fn2 ( x ) , n =
−∞< x <∞
n1 n 2
.
n1 + n 2
Wówczas
lim P
n1 →∞
n2 →∞
gdzie
(
)
nδ n < x = Q( x )
(9.13)
Testy zgodności 9
123
 ∞
k − 2k 2x2
 ∑ ( − 1) e
Q( x ) = k =−∞
0

x>0
(9.14)
x≤0
Wygodnym testem do weryfikowania sformułowanej hipotezy jest statystyka
nδ n = n sup Fn1 ( x ) − Fn2 ( x ) .
(9.15)
−∞< x <∞
Opiszemy teraz metodę postępowania przy weryfikacji.
Mamy dwie populacje. Pobieramy z nich próbki odpowiednio o liczebnościach n1 i
n2 . Przypuśćmy, że zaobserwowaliśmy wartości x1 , x 2 ,..., x n oraz y1 , y 2 ,..., y n . Na
podstawie tych danych znajdujemy dystrybuanty empiryczne Fn1 ( x ) i Fn2 ( x ) , a następnie kres
górny bezwzględnej wartości różnicy tych dystrybuant i wartość statystyki
nδ n . Ustalamy
poziom istotności α , a następnie zbiór krytyczny
{(
)
}
W = x1 , x 2 ,..., x n1 , y1 , y 2 ,..., y n2 : nδ n > λ ,
(9.16)
gdzie λ jest liczbą spełniającą warunek
P
(
)
nδ n > λ = α .
(9.17)
Liczba Q( λ ) jest wartością dystrybuanty (9.14). Wartości dystrybuanty są stablicowane (patrz
np. Plucińscy, 1990). Dla danego α , a tym samym Q( λ ) z tablicy odczytujemy wartość λ .
Hipotezę H 0 o równości dystrybuant cechy X elementów obu populacji odrzucamy,
gdy
nδ n > λ
(9.18)
nδ n ≤ λ .
(9.19)
i przyjmujemy, gdy
Testy zgodności 9
124
Pamiętać należy, że test Kołmogorowa-Smirnowa oparty jest na granicznym
rozkładzie statystyki
nδ n , a więc być stosowany tylko wtedy, gdy liczebności są
dostatecznie duże (co najmniej rzędu kilku dziesiątek).
PRZYKŁAD 9.3 (Plucińscy, 1990). W celu zbadania trwałości opon samochodowych
produkowanych przez fabryki A i B pobrano próbki z bieżącej produkcji obu fabryk i
otrzymano następujące dane dotyczące maksymalnego przebiegu samochodów na badanych
oponach (wyrażone w tysiącach km):
Maksymalny
Liczba opon
przebieg
z fabryki A
z fabryki B
10-15
8
0
15-20
18
12
20-25
54
28
25-30
42
76
30-35
24
36
35-40
12
20
40-45
2
8
Razem
160
180
Przyjmując poziom istotności α = 0.02 zweryfikować hipotezę H 0 , że rozkłady
przebiegów dla opon produkowanych przez obie fabryki mają tę samą ciągłą dystrybuantę F.
Zastosujemy tu test Kołmogorowa-Smirnowa, a obliczenia zapiszemy w postaci
następującej tabelki:
x
n1 j
n2 j
n1sk
n2 sk
Fn1 ( x)
Fn 2 ( x)
Fn1 ( x) − Fn 2 ( x)
Testy zgodności 9
125
15
8
0
8
0
0.050
0.000
0.050
20
18
12
26
12
0.163
0.067
0.096
25
54
28
80
40
0.500
0.222
0.096
30
42
76
122
116
0.763
0.6444
0.119
35
24
36
146
152
0.913
0.844
0.069
40
12
20
158
172
0.987
0,9555
0.032
45
2
8
160
180
1.000
1.000
0.000
W tabelce tej przez n1sk i n 2 sk oznaczyliśmy tzw. Częstości skumulowane, tzn.
∑n
1j
i
j≤x
∑n
2j
. Z ostatniej kolumny tabelki odczytujemy, że
j≤x
δn = sup Fn ( x ) − Fn ( x ) = 0.278
1
(9.20)
2
Ponieważ
n=
n1 n 2
160 ⋅ 180
=
= 84.7 ,
n1 + n 2 160 + 180
n = 9.2 ,
(9.21)
więc
nδ n = 9.2 ⋅ 0.278 = 2.5576 .
(9.22)
Przyjęliśmy α = 0.02 , tzn. Q( λ ) = 0.98 . Dla tej wartości Q( λ ) z tablicy rozkładu
Kołmogorowa (patrz np. Plucińscy, 1990) odczytujemy λ = 152
. . Zatem otrzymaliśmy, że
nδ n = 2.5576 > λ = 152
. ,
(9.23)
126
Testy zgodności 9
czyli spełniona jest nierówność (9.18). Oznacza to, że hipotezę H 0 o równości dystrybuant
dla maksymalnych przebiegów opon pochodzących z fabryk A i B należy odrzucić.
Na zakończenie należy podkreślić, że w założeniach twierdzenia Smirnowa występuje
warunek ciągłości dystrybuanty F, co jest równoważne temu, że prawdopodobieństwo
wystąpienia w próbce dwóch jednakowych wartości jest równe zeru. Grupowanie wyników w
przedziałach może doprowadzić do błędnych wniosków (patrz np. Plucińscy, 1990). Niemniej
jednak w praktyce wielkości badane obserwuje się tylko z pewną dokładnością związaną z
przyjętym układem jednostek, co siłą rzeczy prowadzi do grupowania wyników. Przedziały
grupowania nie powinny być większe niż jednostka przyjętej dla danego zagadnienia skali.
Testy zgodności 9
127
Problemy rozdziału 9
1.
Histogramy
statystyczne
jako
źródła
hipotez
statystycznych
prawdopodobieństwa w pierwszym etapie badań statystycznych.
2.
Weryfikacja hipotezy o rozkładzie prawdopodobieństwa.
3.
Test chi-kwadrat Pearsona.
4.
Rozkład chi-kwadrat.
5.
Klasy obserwacji a liczba obserwacji.
6.
Zbiór krytyczny w teście chi-kwadrat.
7.
Modyfikacja Fishera testu chi-kwadrat.
8.
Liczba stopni swobody testu chi-kwadrat.
9.
Test Kołmogorowa.
10. Zbiór krytyczny testu Kołmogorowa.
11. Test Kołmogorowa-Smirnowa.
12. Zbiór krytyczny testu Kołmogorowa-Smirnowa.
13. Porównanie jakości testu chi-kwadrat a Kołmogorowa.
o
rozkładach

Podobne dokumenty