H - theta.edu.pl

Transkrypt

H - theta.edu.pl
STATYSTYKA MATEMATYCZNA
1. Wykład wstępny
2. Teoria prawdopodobieństwa i elementy kombinatoryki
3. Zmienne losowe
4. Populacje i próby danych
5. Testowanie hipotez i estymacja parametrów
6. Test t
7. Test 2
8. Test F
9. Testy nieparametryczne
10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
11. Korelacja
12. Regresja liniowa i nieliniowa
13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
14. Analiza wariancji
15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP
Testy nieparametryczne
1. Test Manna-Whitneya
2. Test Wilcoxona
3. Test Kolmogorova–Smirnova
4. Test Kruskala-Wallisa
Copyright ©2010, Joanna Szyda
TESTY NIEPARAMETRYCZNE
Testy nieparametryczne
1. Brak założeń dotyczących rozkładu zmiennej w
próbie danych
2. Wykorzystanie rankingu obserwacji zamiast
wartości zmiennych
3. Często bardziej czasochłonne obliczeniowo
4. Jeżeli próba danych spełnia założenia dotyczące
testu parametrycznego - test nieparametryczny ma
niższą moc (1-b)
5. ... utrata informacji przez zastosowanie rang
Copyright ©2010, Joanna Szyda

TEST MANNA-WHITNEYA
ZAKRES STOSOWALNOŚCI TESTU MANNA-WHITNEYA
1. Test nieparametryczny
2. Dane ciągłe lub porządkowe (rangi)
3. Dane nie mają rozkładu normalnego
4. Porównanie dwu niezależnych prób danych
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA
ŚREDNIE
PRÓBA DANYCH
WYSOKIE
5.5
6.0
6.0
7.0
5.0
7.5
7.0
6.0
5.5
7.5
6.0
8.0
7.0
11.0
6.0
9.0
8.0
8.0
7.0
11.0
1. Długość krewetki w zależności od
zasolenia wody
3. Długość krewetki [mm] w wieku 4
tygodni
10
8
6
N
4
2
0
1
6.0
8.0
7.0
8.0
8
6.0
7.0
6
N4
8.0
7.0
2
6.0
7.0
0
7.0
9.0
2
3
4
5
6
7
8
9
DŁUGOŚĆ
1 2 3 4 5 6 7 8 9 10 11
DŁUGOŚĆ
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA
1. Określenie hipotez H0 i H1
H0: średnia długość krewetki nie zależy do zasolenia wody
H1: średnia długość krewetki zależy od zasolenia wody
2. Ustalenie poziomu istotności
 = 0.05
3. Wybór i obliczenie wartości testu statystycznego

n2 n2  1 n2
n1 n1  1 n1 
U  min n1n2 
  r2i , n1n2 
  r1i 
2
2
i 1
i 1


Excel: przykład
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA

n2 n2  1 n2
n1 n1  1 n1 
U  min n1n2 
  r2i , n1n2 
  r1i 
2
2
i 1
i 1


minimalna suma rang próby 2
1
2
H1
obserwowana suma rang próby 2
 minimalna suma = obserwowana suma
 U mierzy odchylenie od H1
3
4
5
6
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA
3. Wybór i obliczenie wartości testu statystycznego

n2 n2  1 n2
n1 n1  1 n1 
U  min n1n2 
  r2i , n1n2 
  r1i 
2
2
i 1
i 1


1617 
1617 


U  min16 *16 
 182, 16 *16 
 346  
2
2


min 46, 210   46
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA
4. Określenie rozkładu testu
•
Test nieparametryczny – brak rozkładu
•
Dla n1n2 > 20 – aproksymowany przez rozkład normalny:
U
z
~
U  U
 U2

N U ,  U2


n1n2
U
2
n1n2 n1  n2  1
12
 brak tablic
~
N 0,1
 tablice
Copyright ©2010, Joanna Szyda
TEST MANNA-WHITNEYA
4. Określenie rozkładu testu
z
n1n2
16 *16
U
46 
2
2

 3.09 ~
n1n2 n1  n2  1
16 *1633
12
12
N 0,1
5. Obliczenie wartości p: p=0.002
Excel: przykład
lub porównanie z wartością krytyczną:
U  0.05,n1 16,n2 16  181
U t  46
Copyright ©2013, Joanna Szyda
TEST MANNA-WHITNEYA
6. Decyzja
p< 
Ut < U
H0
H1
UWAGA !!!
średnia długość krewetki zależy od zasolenia wody
Copyright ©2010, Joanna Szyda

TEST WILCOXONA
ZAKRES STOSOWALNOŚCI TESTU WILCOXONA
1. Test nieparametryczny
2. Dane ciągłe lub porządkowe
(rangi)
3. Dane nie mają rozkładu
normalnego
4. Porównywane dwu zależnych =
sparowanych prób danych
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
PRÓBA DANYCH
NR OWCY
BEZ JAGN
Z JAGN
1
72.00
55.50
2
62.35
43.80
3
55.77
66.80
4
59.98
68.00
5
51.60
57.88
6
61.48
61.90
7
52.57
45.40
8
52.50
56.67
9
56.43
73.30
10
60.13
77.50
11
48.60
63.53
12
42.90
54.50
13
53.50
55.58
14
70.43
91.10
15
47.10
64.05
16
50.08
71.40
1. Próba danych – zachowanie
się pokarmowe ociec
2. Dane zebrano w latach 19941996 w stadzie owiec
utrzymywanym u podnóża
Rocky Mountains w
Kanadzie
3. Różnice w czasie pasienia
się owcy z jagnięciem i bez
4. % czasu spędzanego na
pasieniu się
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
PRÓBA DANYCH
NR OWCY
BEZ JAGN
Z JAGN
1
72.00
55.50
2
62.35
43.80
3
55.77
66.80
4
59.98
68.00
5
51.60
57.88
6
61.48
61.90
7
52.57
45.40
8
52.50
56.67
9
56.43
73.30
10
60.13
77.50
11
48.60
63.53
12
42.90
54.50
13
53.50
55.58
14
70.43
91.10
15
47.10
64.05
3
2
N
1
0
-25
16
50.08
71.40
-20
-15
-10
-5
0
5
10
15
20
RÓŻNICA W CZASIE
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
1. Określenie hipotez H0 i H1
H0: czas pasienia się owcy nie zależy od obecności jagnięcia
H1: czas pasienie się owcy zależy od obecności jagnięcia
2. Ustalenie poziomu istotności
MAX = 0.05
3. Wybór i obliczenie wartości testu statystycznego
 n1  N  n1  
W  min  ri ,  ri 
i  n1
 i 1

Excel: przykład
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
 n1  N  n1  
W  min   ri ,  ri 
i  n1
 i 1

+
1
 H1
+
2
 maksymalna suma rang = N(N+1)/2
+
3
 H0
+
4
 suma rang = 0
+
5
+
6
 im bardziej prawdopodobna jest H1 tym
większa wartość W (zbliża się do N(N+1)/2)
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
3. Wybór i obliczenie wartości testu statystycznego
 n1  N  n1  
W  min  ri ,  ri   min 107, 29   29
i  n1
 i 1

Copyright ©2010, Joanna Szyda
TEST WILCOXONA
4. Określenie rozkładu testu
•
Test nieparametryczny – brak rozkładu
•
Dla N > 15 – aproksymowany przez rozkład normalny:
W
z
~
W  W

2
W

N W ,  W2
~

N 0,1
N  N  1
W
4
z
~ N 0,1
N  N  12 N  1
24
16 *17
29 
4
z
 2.02
~ N 0,1
16 *17 * 33
24
Copyright ©2010, Joanna Szyda
TEST WILCOXONA
5. Obliczenie wartości p: p=0.0437
Excel: przykład
lub porównanie z wartością krytyczną:
W 0.05, N 16  29
Wt  29
6. Decyzja
p< 
Wt = W
H0
H1
?
czas pasienie się owcy zależy od obecności jagnięcia
?
Copyright ©2010, Joanna Szyda

TEST KOŁMOGOROVA
TEST KOŁMOGOROVA- ZAKRES STOSOWANIA
1. Test nieparametryczny
2. Dane ciągłe lub porządkowe (rangi)
3. Porównanie rozkładu próby danych z oczekiwanym
rozkładem
4. Porównanie zgodności rozkładów dwu prób danych
A. Kolmogorov
Copyright ©2014 Joanna Szyda
TEST KOŁMOGOROVA
synowie
ogiera X
PRÓBA DANYCH
75
84
80
77
68
87
92
77
92
86
78
76
80
81
1. Próba danych – punkty bonitacyjne w
próbie dzielności ogierów
2. Dane zebrano 2000 r. na podstawie prób
dzielności ogierów rasy śląskiej w Książu
72
77
Copyright ©2010, Joanna Szyda
TEST KOŁMOGOROVA
PRÓBA DANYCH
synowie
ogiera X
75
84
80
77
68
87
92
77
3
92
86
78
2
N
76
1
80
81
72
77
0
70
72
74
76
78
80
82
84
86
88
90
92
94
PUNKT Y BONITACYJNE
Copyright ©2010, Joanna Szyda
TEST KOŁMOGOROVA
1. Określenie hipotez H0 i H1
H0: punkty bonitacyjne synów ogiera X nie odbiegają od
rozkładu normalnego dla wszystkich testowanych ogierków
H1: punktu bonitacyjne synów ogiera X odbiegają od rozkładu
normalnego dla wszystkich testowanych ogierków
H0: F(x) = F[ N(80,6) ]
H1: F(x) ≠ F[ N(80,6) ]
2. Ustalenie poziomu istotności
= 0.05
Copyright ©2014, Joanna Szyda
TEST KOŁMOGOROVA
3. Wybór i obliczenie wartości testu statystycznego
D  max F  x   F  N 
Mała różnica → H0
Duża różnica → H1
Excel: przykład
4. Określenie rozkładu testu
•
Test nieparametryczny – brak rozkładu
•
tablice
Copyright ©2010, Joanna Szyda
TEST KOŁMOGOROVA
5. Porównanie z wartością krytyczną:
D 0.05, N 16  0.33
Dt  0.13
6. Decyzja
Dt < D
H0
H1
bonitacja synów ogiera X nie różni się od całości testowanej
stawki ogierków
Copyright ©2010, Joanna Szyda

TEST KRUSKALA-WALLISA
TEST KRUSKALA-WALLISA - ZAKRES STOSOWANIA
1. Porównanie zmienności, różnice pomiędzy
wieloma próbami danych
2. Dane ciągłe lub porządkowe (rangi)
W. Kruskal
3. Dane nie mają rozkładu normalnego
4. Analiza wariancji
W. Wallis
Copyright ©2014, Joanna Szyda
TEST KRUSKALA-WALLISA
PRÓBA DANYCH
20-29
30-39
40-49
161.925
164.465
173.990
173.355
171.450
175.260
158.115
173.355
167.640
170.815
175.260
166.370
179.705
164.465
168.910
1. Wzrost dorosłych kobiet w
USA
2. 3 przedziały wiekowe
Copyright ©2013, Joanna Szyda
TEST KRUSKALA-WALLISA
1. Określenie hipotez H0 i H1
H0: wzrost jest jednakowy w każdym p. wiekowym
H1: wzrost różni się w przedziałach wiekowych
2. Ustalenie poziomu istotności
 = 0.05
Copyright ©2013, Joanna Szyda
TEST KRUSKALA-WALLISA
3. Wybór i obliczenie wartości testu statystycznego
NA
12
2
H
ni Ri  R 

N  N  1 i 1
~  N2 A 1
N
Liczba obserwacji
NA
Liczba grup
Ri
Średni ranking obserwacji w grupie i
R
Średni ranking wszystkich obserwacji
4. Określenie rozkładu testu
Copyright ©2013, Joanna Szyda
TEST KRUSKALA-WALLISA
5. Porównanie z wartością krytyczną:
 max  0.0500
H  6.45
 t  0.0398
6. Decyzja
H0
H1
wzrost dorosłych kobiet różni się w poszczególnych przedziałach wieku
Copyright ©2013, Joanna Szyda
TESTY NIEPARAMETRYCZNE
CECHY CHARAKTERYSTYCZNE TESTÓW
NIEPARAMETRYCZNYCH
• Wykorzystywanie rang
• Różnice między obserwacjami wyrażone jedynie
kolejnością, a nie wartością rzeczywistą
• Stosujemy gdy obserwacje nie pochodzą z
wymaganego rozkładu (najczęściej normalnego)
• Aby uzyskać wartość t transformujemy test żeby
sprowadzić go do rozkładu normalnego N(0,1)
Copyright ©2010, Joanna Szyda
Testy nieparametryczne
1. Test Manna-Whitneya
2. Test Wilcoxona
3. Test Kołmogorova
4. Test Kruskala-Wallisa

Podobne dokumenty