H - theta.edu.pl
Transkrypt
H - theta.edu.pl
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test 2 8. Test F 9. Testy nieparametryczne 10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11. Korelacja 12. Regresja liniowa i nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja WSTĘP Testy nieparametryczne 1. Test Manna-Whitneya 2. Test Wilcoxona 3. Test Kolmogorova–Smirnova 4. Test Kruskala-Wallisa Copyright ©2010, Joanna Szyda TESTY NIEPARAMETRYCZNE Testy nieparametryczne 1. Brak założeń dotyczących rozkładu zmiennej w próbie danych 2. Wykorzystanie rankingu obserwacji zamiast wartości zmiennych 3. Często bardziej czasochłonne obliczeniowo 4. Jeżeli próba danych spełnia założenia dotyczące testu parametrycznego - test nieparametryczny ma niższą moc (1-b) 5. ... utrata informacji przez zastosowanie rang Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA ZAKRES STOSOWALNOŚCI TESTU MANNA-WHITNEYA 1. Test nieparametryczny 2. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Porównanie dwu niezależnych prób danych Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA ŚREDNIE PRÓBA DANYCH WYSOKIE 5.5 6.0 6.0 7.0 5.0 7.5 7.0 6.0 5.5 7.5 6.0 8.0 7.0 11.0 6.0 9.0 8.0 8.0 7.0 11.0 1. Długość krewetki w zależności od zasolenia wody 3. Długość krewetki [mm] w wieku 4 tygodni 10 8 6 N 4 2 0 1 6.0 8.0 7.0 8.0 8 6.0 7.0 6 N4 8.0 7.0 2 6.0 7.0 0 7.0 9.0 2 3 4 5 6 7 8 9 DŁUGOŚĆ 1 2 3 4 5 6 7 8 9 10 11 DŁUGOŚĆ Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA 1. Określenie hipotez H0 i H1 H0: średnia długość krewetki nie zależy do zasolenia wody H1: średnia długość krewetki zależy od zasolenia wody 2. Ustalenie poziomu istotności = 0.05 3. Wybór i obliczenie wartości testu statystycznego n2 n2 1 n2 n1 n1 1 n1 U min n1n2 r2i , n1n2 r1i 2 2 i 1 i 1 Excel: przykład Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA n2 n2 1 n2 n1 n1 1 n1 U min n1n2 r2i , n1n2 r1i 2 2 i 1 i 1 minimalna suma rang próby 2 1 2 H1 obserwowana suma rang próby 2 minimalna suma = obserwowana suma U mierzy odchylenie od H1 3 4 5 6 Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA 3. Wybór i obliczenie wartości testu statystycznego n2 n2 1 n2 n1 n1 1 n1 U min n1n2 r2i , n1n2 r1i 2 2 i 1 i 1 1617 1617 U min16 *16 182, 16 *16 346 2 2 min 46, 210 46 Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA 4. Określenie rozkładu testu • Test nieparametryczny – brak rozkładu • Dla n1n2 > 20 – aproksymowany przez rozkład normalny: U z ~ U U U2 N U , U2 n1n2 U 2 n1n2 n1 n2 1 12 brak tablic ~ N 0,1 tablice Copyright ©2010, Joanna Szyda TEST MANNA-WHITNEYA 4. Określenie rozkładu testu z n1n2 16 *16 U 46 2 2 3.09 ~ n1n2 n1 n2 1 16 *1633 12 12 N 0,1 5. Obliczenie wartości p: p=0.002 Excel: przykład lub porównanie z wartością krytyczną: U 0.05,n1 16,n2 16 181 U t 46 Copyright ©2013, Joanna Szyda TEST MANNA-WHITNEYA 6. Decyzja p< Ut < U H0 H1 UWAGA !!! średnia długość krewetki zależy od zasolenia wody Copyright ©2010, Joanna Szyda TEST WILCOXONA ZAKRES STOSOWALNOŚCI TESTU WILCOXONA 1. Test nieparametryczny 2. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Porównywane dwu zależnych = sparowanych prób danych Copyright ©2010, Joanna Szyda TEST WILCOXONA PRÓBA DANYCH NR OWCY BEZ JAGN Z JAGN 1 72.00 55.50 2 62.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 52.57 45.40 8 52.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 12 42.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 16 50.08 71.40 1. Próba danych – zachowanie się pokarmowe ociec 2. Dane zebrano w latach 19941996 w stadzie owiec utrzymywanym u podnóża Rocky Mountains w Kanadzie 3. Różnice w czasie pasienia się owcy z jagnięciem i bez 4. % czasu spędzanego na pasieniu się Copyright ©2010, Joanna Szyda TEST WILCOXONA PRÓBA DANYCH NR OWCY BEZ JAGN Z JAGN 1 72.00 55.50 2 62.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 52.57 45.40 8 52.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 12 42.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 3 2 N 1 0 -25 16 50.08 71.40 -20 -15 -10 -5 0 5 10 15 20 RÓŻNICA W CZASIE Copyright ©2010, Joanna Szyda TEST WILCOXONA 1. Określenie hipotez H0 i H1 H0: czas pasienia się owcy nie zależy od obecności jagnięcia H1: czas pasienie się owcy zależy od obecności jagnięcia 2. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego n1 N n1 W min ri , ri i n1 i 1 Excel: przykład Copyright ©2010, Joanna Szyda TEST WILCOXONA n1 N n1 W min ri , ri i n1 i 1 + 1 H1 + 2 maksymalna suma rang = N(N+1)/2 + 3 H0 + 4 suma rang = 0 + 5 + 6 im bardziej prawdopodobna jest H1 tym większa wartość W (zbliża się do N(N+1)/2) Copyright ©2010, Joanna Szyda TEST WILCOXONA 3. Wybór i obliczenie wartości testu statystycznego n1 N n1 W min ri , ri min 107, 29 29 i n1 i 1 Copyright ©2010, Joanna Szyda TEST WILCOXONA 4. Określenie rozkładu testu • Test nieparametryczny – brak rozkładu • Dla N > 15 – aproksymowany przez rozkład normalny: W z ~ W W 2 W N W , W2 ~ N 0,1 N N 1 W 4 z ~ N 0,1 N N 12 N 1 24 16 *17 29 4 z 2.02 ~ N 0,1 16 *17 * 33 24 Copyright ©2010, Joanna Szyda TEST WILCOXONA 5. Obliczenie wartości p: p=0.0437 Excel: przykład lub porównanie z wartością krytyczną: W 0.05, N 16 29 Wt 29 6. Decyzja p< Wt = W H0 H1 ? czas pasienie się owcy zależy od obecności jagnięcia ? Copyright ©2010, Joanna Szyda TEST KOŁMOGOROVA TEST KOŁMOGOROVA- ZAKRES STOSOWANIA 1. Test nieparametryczny 2. Dane ciągłe lub porządkowe (rangi) 3. Porównanie rozkładu próby danych z oczekiwanym rozkładem 4. Porównanie zgodności rozkładów dwu prób danych A. Kolmogorov Copyright ©2014 Joanna Szyda TEST KOŁMOGOROVA synowie ogiera X PRÓBA DANYCH 75 84 80 77 68 87 92 77 92 86 78 76 80 81 1. Próba danych – punkty bonitacyjne w próbie dzielności ogierów 2. Dane zebrano 2000 r. na podstawie prób dzielności ogierów rasy śląskiej w Książu 72 77 Copyright ©2010, Joanna Szyda TEST KOŁMOGOROVA PRÓBA DANYCH synowie ogiera X 75 84 80 77 68 87 92 77 3 92 86 78 2 N 76 1 80 81 72 77 0 70 72 74 76 78 80 82 84 86 88 90 92 94 PUNKT Y BONITACYJNE Copyright ©2010, Joanna Szyda TEST KOŁMOGOROVA 1. Określenie hipotez H0 i H1 H0: punkty bonitacyjne synów ogiera X nie odbiegają od rozkładu normalnego dla wszystkich testowanych ogierków H1: punktu bonitacyjne synów ogiera X odbiegają od rozkładu normalnego dla wszystkich testowanych ogierków H0: F(x) = F[ N(80,6) ] H1: F(x) ≠ F[ N(80,6) ] 2. Ustalenie poziomu istotności = 0.05 Copyright ©2014, Joanna Szyda TEST KOŁMOGOROVA 3. Wybór i obliczenie wartości testu statystycznego D max F x F N Mała różnica → H0 Duża różnica → H1 Excel: przykład 4. Określenie rozkładu testu • Test nieparametryczny – brak rozkładu • tablice Copyright ©2010, Joanna Szyda TEST KOŁMOGOROVA 5. Porównanie z wartością krytyczną: D 0.05, N 16 0.33 Dt 0.13 6. Decyzja Dt < D H0 H1 bonitacja synów ogiera X nie różni się od całości testowanej stawki ogierków Copyright ©2010, Joanna Szyda TEST KRUSKALA-WALLISA TEST KRUSKALA-WALLISA - ZAKRES STOSOWANIA 1. Porównanie zmienności, różnice pomiędzy wieloma próbami danych 2. Dane ciągłe lub porządkowe (rangi) W. Kruskal 3. Dane nie mają rozkładu normalnego 4. Analiza wariancji W. Wallis Copyright ©2014, Joanna Szyda TEST KRUSKALA-WALLISA PRÓBA DANYCH 20-29 30-39 40-49 161.925 164.465 173.990 173.355 171.450 175.260 158.115 173.355 167.640 170.815 175.260 166.370 179.705 164.465 168.910 1. Wzrost dorosłych kobiet w USA 2. 3 przedziały wiekowe Copyright ©2013, Joanna Szyda TEST KRUSKALA-WALLISA 1. Określenie hipotez H0 i H1 H0: wzrost jest jednakowy w każdym p. wiekowym H1: wzrost różni się w przedziałach wiekowych 2. Ustalenie poziomu istotności = 0.05 Copyright ©2013, Joanna Szyda TEST KRUSKALA-WALLISA 3. Wybór i obliczenie wartości testu statystycznego NA 12 2 H ni Ri R N N 1 i 1 ~ N2 A 1 N Liczba obserwacji NA Liczba grup Ri Średni ranking obserwacji w grupie i R Średni ranking wszystkich obserwacji 4. Określenie rozkładu testu Copyright ©2013, Joanna Szyda TEST KRUSKALA-WALLISA 5. Porównanie z wartością krytyczną: max 0.0500 H 6.45 t 0.0398 6. Decyzja H0 H1 wzrost dorosłych kobiet różni się w poszczególnych przedziałach wieku Copyright ©2013, Joanna Szyda TESTY NIEPARAMETRYCZNE CECHY CHARAKTERYSTYCZNE TESTÓW NIEPARAMETRYCZNYCH • Wykorzystywanie rang • Różnice między obserwacjami wyrażone jedynie kolejnością, a nie wartością rzeczywistą • Stosujemy gdy obserwacje nie pochodzą z wymaganego rozkładu (najczęściej normalnego) • Aby uzyskać wartość t transformujemy test żeby sprowadzić go do rozkładu normalnego N(0,1) Copyright ©2010, Joanna Szyda Testy nieparametryczne 1. Test Manna-Whitneya 2. Test Wilcoxona 3. Test Kołmogorova 4. Test Kruskala-Wallisa