1 - theta.edu.pl
Transkrypt
1 - theta.edu.pl
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych 5. Testy parametryczne (na przykładzie testu t ) 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji Copyright ©2010, Joanna Szyda TESTY PARAMETRYCZNE weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (gł. cechy ilościowe o rozkładzie normalnym) hipotezy dotyczące średniej: test t (duże próby – test średniej standaryzowanej, z) hipotezy dotyczące wariancji: test F w analizie wariancji i analizie regresji Copyright ©2010, Joanna Szyda TEST T 1. Zakres stosowalności 2. Dla pojedynczej próby 3. Dla dwu niezależnych prób 4. Dla dwu sparowanych prób 5. Test Duncana Copyright ©2010, Joanna Szyda ROZKŁAD t k 1 k 1 2 2 x 2 1 f x k k k 2 x , tk E x 0 Var x k k 2 • Kształt zależny od stopni swobody • Dla wielu stopni swobody zbliżony do rozkł. normalnego Copyright ©2009, Joanna Szyda ZAKRES STOSOWALNOŚCI TESTU T 1. Test parametryczny 2. Dane o charakterze ciągłym 3. Wartości w próbie danych – rozkład normalny 4. Porównywane próby danych – podobne wariancje POJEDYNCZA PRÓBA TEST T – POJEDYNCZA PRÓBA BMD PRÓBA DANYCH SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.02 1 0.76 1 0.78 1 1.01 1 0.82 1 0.76 1 0.87 1 0.72 1 1. Badanie osteoporozy 2. Medical Research Council, Cambridge 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych W próbie: x 0,85 0,1040 … 0.91 2 1.02 2 0.87 2 n 40 Copyright ©2010, Joanna Szyda TEST T – POJEDYNCZA PRÓBA 1. Określenie hipotez H0 i H1 H0: średnia gęstość kości w populacji wynosi 1.0 g/cm2 H1: średnia gęstość kości w populacji różni się od 1.0 g/cm2 H0: = 1.0 H1: ≠ 1.0 (test dwustronny) 2. Ustalenie poziomu istotności MAX = 0.05 Copyright ©2010, Joanna Szyda Pojedyncza próba, nieznana wariancja 3. Wybór i określenie rozkładu statystyki testowej Statystyka gdzie: x t n s s – standardowe odchylenie w próbie danych ma rozkład t – Studenta o k = n -1 stopniach swobody stopnie swobody (degrees of freedom): wielkość określająca kształt rozkładu statystyki testowej (testu) w zależności od liczby obserwacji w próbie Copyright ©2010, Joanna Szyda TEST T – POJEDYNCZA PRÓBA 4. Obliczenie wartości testu t x 1.0 s x2 x 1,0 0,85 1,0 40 9,122 sx 0,1040 n 5. Obliczenie wartości t (lub odczyt t) T 0,000000000032312 ( t0,05;40-1 = 2,0227 ) 6. Decyzja t < max H0 H1 (|t| > t) średnia gęstość kości w populacji różni się od 1.0 g/cm2 Copyright ©2010, Joanna Szyda DWIE NIEZALEŻNE PRÓBY TEST T – DWIE NIEZALEŻNE PRÓBY PRÓBA DANYCH BMD SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.02 1 0.76 1 0.78 1 1.01 1 0.82 1 0.76 1 0.87 1 0.72 1 … 0.91 2 1.02 2 0.87 2 1. Badanie osteoporozy 2. Medical Research Council, Cambridge 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych 4. Wartości znane dla mężczyzn i kobiet x K 0,82 x M 0,88 n K n M 20 Copyright ©2010, Joanna Szyda TEST T – DWIE NIEZALEŻNE PRÓBY 1. Określenie hipotez H0 i H1 H0: średnia gęstość kości kobiet jest taka sama jak mężczyzn H1: średnia gęstość kości kobiet jest różna niż mężczyzn H0 : K = M H1 : K ≠ M (test dwustronny) 2. Ustalenie poziomu istotności MAX = 0.05 Copyright ©2010, Joanna Szyda Dwie próby, nieznana wariancja 3. Wybór i określenie rozkładu statystyki testowej Statystyka gdzie s D x1 x 2 t sD s12 s 22 n1 n2 s1, n1 – stand. odchylenie i liczebność w pierwszej próbie danych; s2, n2 – stand. odchylenie i liczebność w drugiej próbie danych ma rozkład t–Studenta o k = n1+n2 - 2 st. swob. Copyright ©2010, Joanna Szyda TEST T – DWIE NIEZALEŻNE PRÓBY 4. Obliczenie wartości statystyki testowej t t xK xM s K2 s M2 nK nM 0,82 0,88 0,0122895 0,0076895 20 20 1,8987 Copyright ©2010, Joanna Szyda TEST T – DWIE NIEZALEŻNE PRÓBY 5. Obliczenie wartości t t 0.0652 6. Decyzja t > max H0 H1 Nie można odrzucić hipotezy zerowej! TEST JEDNOSTRONNY: H0: K = M H1: K < M t 0.0326 Decyzja ?? Copyright ©2010, Joanna Szyda WNIOSKOWANIE STATYSTYCZNE Omułek słodkowodny Hyridella menziesi n=30 25.0 ± 0.9 mg/g [23.2 , 26.8] H0: 1= 2 max=0,05 t = 1,84 n=30 22.9 ± 0.7 mg/g [ 21.5 , 24.3 ] H1: 1≠2 → T = 0,0709 H1: 1>2 → T = 0,0354 Wnioski? Copyright ©2010, Joanna Szyda DWIE SPAROWANE PRÓBY (pary skorelowane) TEST T – PARY SKORELOWANE PRÓBA DANYCH 1. Badanie ciśnienia w gałce ocznej Low CCT High CCT 20.0 14.3 13.9 13.8 18.3 15.8 21.1 33.4 20.1 20.3 24.4 19.9 20.2 14.3 11.6 11.4 28.8 25.1 18.5 24.1 2. Ciśnienie w 2 gałkach tej samej osoby 3. U każdego człowieka oko prawe i lewe ma różną grubość rogówki → podział oczu w parach pod tym względem (low CCT i high CCT) Copyright ©2010, Joanna Szyda TEST T – PARY SKORELOWANE 1. Określenie hipotez H0 i H1 H0: ciśnienie w gałce ocznej nie zależy od grubości rogówki H1: ciśnienie w gałce ocznej zależy od grubości rogówki H0 : L = H H1 : L ≠ H 2. Ustalenie poziomu istotności MAX = 0.05 Copyright ©2010, Joanna Szyda TEST T – DWIE SPAROWANE PRÓBY 3. Wybór i określenie rozkładu statystyki testowej Średnia arytmetyczna różnic (Di ) w parach obserwacji D t SD N D x SD 1i i 1 x 2i N D i 1 Standardowe odchylenie różnic N D i 1 i Błąd standardowy średniej N S Di N S Di N i D N 1 2 Tak określona statystyka ma rozkład t-Studenta o N-1 stopniach swobody (N – liczba par!) Copyright ©2010, Joanna Szyda TEST T – DWIE SPAROWANE PRÓBY 4. Obliczenie wartości statystyki N D x 1i i 1 x 2i N D N S Di SD i i 1 D 2 N 1 S Di N 5,6589 10 4,5 0,45 10 288.21 5,6589 10 1 1,7895 D 0,45 t 0,25 S D 1,7895 Copyright ©2010, Joanna Szyda TEST T – DWIE SPAROWANE PRÓBY 5. Obliczenie wartości t t 0.8082 6. Decyzja t > max H0 H1 ciśnienie w gałce ocznej nie zależy od grubości rogówki Copyright ©2010, Joanna Szyda KILKA PRÓB - TEST DUNCANA TEST T – KILKA PRÓB, TEST DUNCANA PRÓBA DANYCH 1. Badanie frekwencji na zajęciach ze statystyki w USA 2. 4 grupy - atrakcyjność wykładowcy 3. Frekwencja na zajęciach w semestrze poziom atrakcyjności 0 1 2 4 15 20 10 30 10 13 24 22 12 10 29 29 10 22 12 20 ... ... ... ... średnia 11.13 17.88 20.25 24.38 Copyright ©2010, Joanna Szyda TEST T – KILKA PRÓB, TEST DUNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej 2. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX* = 1 - (1 - MAX)n-1 0 1 2 liczba prób pojedynczego testu t * = 1 - (1 - 0.2722)2-1 = 0.2722 3 H0: 1 = 2 H1: 1 ≠ 2 Copyright ©2010, Joanna Szyda TEST T – KILKA PRÓB, TEST DUNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej 2. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX* = 1 - (1 - MAX)n-1 0 1 2 * = 1 - (1 - 0.00000096)4-1 = 0.0000029 3 H0: 0 = 1 = 2 = 3 H1: 0 ≠ 1 ≠ 2 ≠ 3 Copyright ©2010, Joanna Szyda TEST T – KILKA PRÓB, TEST DUNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej 2. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX* = 1 - (1 - MAX)n-1 0 1 * = 1 - (1 - 0.0002)3-1 = 0.0004 2 * = 1 - (1 - 0.0048)3-1 = 0.0097 3 H0: 0 = 1 = 2 H0: 1 = 2 = 3 H1: 0 ≠ 1 ≠ 2 H1: 1 ≠ 2 ≠ 3 Copyright ©2010, Joanna Szyda TEST T – KILKA PRÓB, TEST DUNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej 2. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX MAX* = 1 - (1 - MAX)n-1 0 1 2 3 * = 1 - (1 - 0.0036)2-1 = 0.0036 * = 1 - (1 - 0.0625)2-1 = 0.0625 H0: 0 = 1 H1: 0 ≠ 1 H0: 2 = 3 H1: 2 ≠ 3 Copyright ©2010, Joanna Szyda TEST T – KILKA PRÓB, TEST DUNCANA 0 1 A 2 A 3 B B 1. Atrakcyjność wykładowcy wpływa na frekwencję 2. Frekwencja na zajęciach nie różni się istotnie (=0.05) w grupach 1 i 2 oraz 2 i 3 Copyright ©2010, Joanna Szyda Test t 1. Zakres stosowalności 2. Dla pojedynczej próby 3. Dla dwu niezależnych prób 4. Dla dwu sparowanych prób 5. Test Duncana