Anne prawdziwa masa
Transkrypt
Anne prawdziwa masa
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŜnienie – nowe pojęcie pomarańczowy – uwaga kursywa – komentarz Anna Rajfura 1 Zagadnienia omawiane na zajęciach Przykłady testowania hipotez dotyczących: a. średniej z rozkładu normalnego b. porównaniu dwóch średnich z rozkładów normalnych c. porównaniu dwóch wariancji z rozkładów normalnych d. porównaniu dwóch frakcji z rozkładów dwupunktowych Anna Rajfura 2 Był problem estymacji Cecha X – waga jednego owocu pewnej odmiany ZałoŜenie Cecha X ma w populacji rozkład normalny, X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane µ – średnia wartość cechy X dla odmiany, σ 2 – wariancja cechy X dla odmiany Cel Wyznaczyć ocenę średniej wagi jednego owocu tej odmiany µ (wyestymować µ ) Anna Rajfura 3 Był problem cd. Działanie Estymujemy parametr µ na podstawie wylosowanej próby: x 1 , x 2 , ..., x n ; np. 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2 Wynik Średnia dla próby wynosi x = 194 ,46 g Ocena przedziałowa µ (przedział ufności) μ ∈ (190,75 ; 198,17) P = 95% Anna Rajfura 4 Jest problem Cecha X – waga owocu pewnej odmiany ZałoŜenie Cecha X ma w populacji rozkład normalny, X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane Cel Wyestymować ocenę średniej wagi jednego owocu tej odmiany µ. Odpowiedzieć na pytanie (np.): Czy moŜna przyjąć, Ŝe średnia waga jednego owocu tej odmiany µ jest równa 200? Decyzja: tak / nie Anna Rajfura 5 Jest problem cd. µ = 200 Badana hipoteza Weryfikacja hipotezy (Testowanie hipotezy) tak / nie Anna Rajfura Decyzja 6 Terminologia i oznaczenia Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu p-stwa cechy X (typ rozkładu, parametr rozkładu) Testowaną (badaną, rozwaŜaną) hipotezę nazywamy hipotezą zerową, ozn.: H 0 Hipoteza alternatywna, ozn. H 1 – przyjmujemy ją przy odrzuceniu H 0 Mówimy: weryfikujemy hipotezę zerową H 0 przeciwko hipotezie alternatywnej H 1 Funkcja testowa (test), ozn. np.: t -Studenta, F -Fishera, χ 2 chi-kwadrat Anna Rajfura 7 Terminologia i oznaczenia Wartość empiryczna funkcji testowej (wartość funkcji testowej dla próby), np.: t e m p , F em p , χ2emp. Poziom istotności α – akceptowalne p-stwo popełnienia błędu (przy α α odrzucaniu = 0,01 , α hipotezy prawdziwej), np. = 0,05 Wartość krytyczna funkcji testowej (testu) np.: t k ry t , F k ry t , χ 2 k ry t ; Anna Rajfura 8 Testowanie hipotezy 1. Formułujemy hipotezę zerową H 0 2. Wybieramy test do zbadania hipotezy 3. Przyjmujemy poziom istotności α (wyznaczamy obszar krytyczny testu) 4. Losujemy próbę 5. Wyznaczamy wartości testu dla tej próby 6. Formułujemy wniosek odnośnie hipotezy (hipotezę odrzucamy/nie odrzucamy) Anna Rajfura 9 Hipoteza alternatywna H 1 Hipoteza alternatywna, ozn. H 1 – przyjmujemy ją przy odrzuceniu H 0 Mówimy: Weryfikujemy hipotezę zerową H 0 przeciwko hipotezie alternatywnej H 1 Anna Rajfura 10 Błędy wnioskowania WNIOSEK STAN RZECZYWISTY H0 prawdziwa ODRZUCIĆ H0 NIE ODRZUCAĆ H0 błąd I rodzaju, wniosek prawidłowy pstwo = H0 nieprawdziwa (fałszywa) Anna Rajfura α wniosek prawidłowy błąd II rodzaju, pstwo = β 11 Moc testu Procedury testowe konstruowane są w taki sposób, aby przy ustalonej wartości wartość β α, była jak najmniejsza. Moc testu = 1- β (pstwo odrzucenia fałszywej hipotezy zerowej). Anna Rajfura 12 Hipoteza H 0 : μ = μ0 ZałoŜenia: 1. cecha X ~ N( μ , σ 2 ), μ , σ 2 - nieznane 2. próba losowa: x 1 , x 2 , ..., x n ; n – liczebność próby H 0 : μ = μ 0 (porównanie z normą) test t - Studenta ; poziom istotności α Funkcja testowa: temp Anna Rajfura x − μ0 = ⋅ n s 13 Hipoteza H 0 : μ = μ0 cd. Wnioskowanie 1: jeŜeli | t emp | > t α,v= n-1 , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. Wnioskowanie 2 (równowaŜne z wnioskowaniem 1): jeŜeli wartość p < α , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. Anna Rajfura 14 Przykład H 0 : μ = 200 Cecha X – masa owocu pewnej odmiany. ZałóŜmy, Ŝe X ~ N( μ , σ 2 ), μ , σ 2 Hipoteza zerowa H 0 : μ – nieznane = 200 Test t -Studenta, poziom istotności α =0,05 Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2 Anna Rajfura 15 Przykład H 0 : μ = 200 cd. Parametry próby: n =10, x = 194,46 g , s = 5,19 g Wartość empiryczna funkcji testowej: t emp x − μ0 194,46 − 200 = ⋅ n= ⋅ 10 = −3,3755 s 5,19 Wartość krytyczna funkcji testowej t α,v = n-1 Anna Rajfura = t 0,05, 9 = 2,2622 16 Przykład H 0 : μ = 200 cd. Wnioskowanie 1 (wniosek statystyczny): | t emp | =3,3375> 2,2622 = t 0,05,9 , zatem hipotezę zerową H 0 odrzucamy. Wniosek merytoryczny: nie moŜna przyjąć, Ŝe średnia masa owocu tej odmiany wynosi 200 g. Anna Rajfura 17 Wartości krytyczne rozkładu t-Studenta X ~ tν - X zmienna losowa o rozkładzie t-Studenta z liczbą stopni swobody v, α - poziom istotności, t α , ν - wartość krytyczna - liczba taka, Ŝe P(|X| > t α , ν ) = α ν \ α 0,400 0,300 0,200 0,100 1 2 3 4 5 6 7 8 9 10 11 12 0,050 0,025 0,010 0,005 0,001 1,3764 1,9626 3,0777 6,3137 12,7062 25,4519 63,6559 1,0607 1,3862 1,8856 2,9200 4,3027 6,2054 9,9250 14,0892 31,5998 0,9785 1,2498 1,6377 2,3534 3,1824 4,1765 5,8408 7,4532 12,9244 0,9410 1,1896 1,5332 2,1318 2,7765 3,4954 4,6041 5,5975 8,6101 0,9195 1,1558 1,4759 2,0150 2,5706 3,1634 4,0321 4,7733 6,8685 0,9057 1,1342 1,4398 1,9432 2,4469 2,9687 3,7074 4,3168 5,9587 0,8960 1,1192 1,4149 1,8946 2,3646 2,8412 3,4995 4,0294 5,4081 0,8889 1,1081 1,3968 1,8595 2,3060 2,7515 3,3554 3,8325 5,0414 0,8834 1,0997 1,3830 1,8331 2,2622 2,6850 3,2498 3,6896 4,7809 0,8791 1,0931 1,3722 1,8125 2,2281 2,6338 3,1693 3,5814 4,5868 0,8755 1,0877 1,3634 1,7959 2,2010 2,5931 3,1058 3,4966 4,4369 0,8726 1,0832 1,3562 1,7823 2,1788 2,5600 3,0545 3,4284 4,3178 Anna Rajfura 127,3211 636,5776 18 Przykład H 0 : H0: μ = μ0 hipoteza zerowa Anna Rajfura μ = 200 cd. H1: μ ≠ μ0 hipoteza alternatywna 19 Hipoteza H 0 : μ1 = μ2 ZałoŜenia: 1. cecha X 1 ~N( μ 1 , σ 2 ), cecha X 2 ~N( μ 2 , σ 2 ), μ1, μ2, σ2- nieznane parametry, 2. pobrano n 1 – elementową próbę z pierwszej populacji oraz n 2 -elementową próbę z drugiej populacji H0: μ1 = μ2 test t-Studenta , Anna Rajfura H1: μ1 ≠ μ2 poziom istotności α 20 Hipoteza H 0 : μ1 = μ2 cd. Funkcja testowa: t emp x1 − x 2 = sr gdzie: sr = 1 1 s + błąd stand. róŜnicy średnich, n n 2 1 2 e 2 2 ( ) 1 s ⋅ n − + s 2 1 1 2 ⋅ (n2 − 1) se = wspólna wariancja; n1 + n2 − 2 Anna Rajfura 21 Hipoteza H 0 : μ1 = μ2 cd. Wnioskowanie 1: jeŜeli | t emp |> t α, v , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. v = n1 + n2 - 2 Wnioskowanie 2: jeŜeli p < α , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. Anna Rajfura 22 Zadanie. Hipoteza H 0 : μ1 = μ2 Porównywano odmiany bobiku A oraz B pod względem średniej liczby nasion w strąku. Otrzymano wyniki: x A = 4,05 s A 2 = 2 ,892 n A = 20 xB = 3,53 s B 2 = 2 ,981 nB = 15 Zweryfikuj odpowiednią hipotezę na poziomie istotności 0,05. Przyjmij, Ŝe badane cechy mają niezaleŜne rozkłady normalne z jednakowymi wariancjami. (Zapisz hipotezę zerową, alternatywną, nazwę testu statystycznego, wartość funkcji testowej, wniosek statystyczny i merytoryczny) Anna Rajfura 23 Hipoteza H 0 : σ12 = σ22 ZałoŜenia: 1. cecha X 1 ~N( μ 1 , μ 1 , μ 2, σ 1 2 , σ 2 2 2. pobrano n1 σ 1 2 ), cecha X 2 ~N( μ 2 , - nieznane parametry, – elementową próbę z pierwszej populacji oraz próbę z drugiej populacji. H0: σ12 = σ22 test F -Fishera , Anna Rajfura σ 2 2 ), n2 – elementową H1: σ12 ≠ σ22 poziom istotności α. 24 Hipoteza H 0 : σ12 = σ22 cd. Funkcja testowa: Femp = Anna Rajfura max ( s 21 , s22 ) min ( s 21 , s22 ) 25 Hipoteza H 0 : σ12 = σ22 Wnioskowanie 1: jeŜeli F emp > F α/2, v licz, v mian , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. UWAGA: v licz – liczba stopni swobody dla licznika , v mian - liczba stopni swobody dla mianownika, v i = n i – 1. Anna Rajfura 26 Hipoteza H 0 : σ12 = σ22 Wnioskowanie 2: jeŜeli wartość p < α , to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. Anna Rajfura 27 Zadanie. Hipoteza H 0 : σ12 = σ22 Z dwóch zbiorników wodnych pobrano siedmioelementowe próbki wody do analizy gęstości fitoplanktonu na podstawie koncentracji zielononiebieskich alg. Otrzymano wyniki: s1 = 6 ,9495 , s2 = 40 ,1248 . 2 2 Na poziomie istotności 0,1 zweryfikuj hipotezę o jednakowej zmienności fitoplanktonu w obu zbiornikach wobec hipotezy alternatywnej zakładającej, Ŝe zmienność jest róŜna. Przyjmij, Ŝe gęstości mają niezaleŜne rozkłady normalne. (Zapisz hipotezę zerową, alternatywną, nazwę testu statystycznego, wartość funkcji testowej, wniosek statystyczny i merytoryczny) Anna Rajfura 28 Hipoteza H 0 : p1 = p2 ZałoŜenia: 1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1 , 2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2 , 3. pobrano n1 – elementową próbę z pierwszej populacji oraz n 2 – elementową k i – liczba próbę z drugiej populacji, elementów wyróŜnionych w i -tej próbie; ki pi = ni Anna Rajfura k1 + k 2 p = n1 + n2 29 Hipoteza H 0 : p1 = p2 cd. H0: p1 = p2 H1: p1 ≠ p2 test przybliŜony u (dla duŜych prób), poziom istotności α . Funkcja testowa: uemp = Anna Rajfura p1 − p 2 1 1 p (1 − p ) + n1 n2 30 Hipoteza H 0 : p 1 = p 2 cd. Wnioskowanie: jeŜeli uemp ≥u 1− α , 2 to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŜna odrzucić. Anna Rajfura 31 Zadanie. Hipoteza H 0 : p1 = p2 W dwóch dzielnicach miasta przeprowadzono ankietę na temat sortowania odpadków w gospodarstwach domowych. Otrzymano następujące wyniki: w pierwszej na 210 ankietowanych gospodarstw w 55 sortowano odpadki, natomiast w drugiej na 130 gospodarstw w 51 sortowano odpadki. Na poziomie istotności 0,01 zweryfikuj hipotezę o jednakowej frakcji gospodarstw sortujących odpadki w obu miastach. Anna Rajfura 32