Metody probabilistyczne i statystyka Rozkłady statystyk z próby
Transkrypt
Metody probabilistyczne i statystyka Rozkłady statystyk z próby
Rozkłady statystyk z próby • Statystyk nazywamy zmienn losow , b d c funkcj zmiennych losowych X1, X2, ..., Xn stanowi cych prób . Metody probabilistyczne i statystyka Wykład 2: Rozkłady statystyk z próby. • Statystyka jako zmienna losowa posiada pewien rozkład, który nazywamy rozkładem statystyki z próby. Zale y on przede wszystkim od rozkładu populacji, z której pochodzi próba oraz od liczebno ci próby. Przedziały ufno ci Małgorzata Kr towska • Ze wzgl du na liczebno n próby rozkłady statystyk dzielimy na – dokładne - rozkłady prawdopodobie stwa wyznaczone dla dowolnej liczby naturalnej n, b d cej liczebno ci próby. S one wykorzystywane dla małych prób. – graniczne - rozkład prawdopodobie stwa statystyki, który otrzymuje si przy zało eniu nieograniczenie du ej próby, n→∞ . Nie ma jednej, okre lonej warto ci n od której uznajemy prób za du . W niektórych przypadkach rozkład dokładny ju dla n>30 niewiele ró ni si od rozkładu granicznego, w innych przypadkach potrzebujemy n>100. Wydział Informatyki Politechnika Białostocka e-mail: [email protected] strona www: http://aragorn.pb.bialystok.pl/~gkret Modele statystyczne, studia zaoczne 1 Rozkład redniej arytmetycznej z próby x= 1 n n i =1 σ w praktyce wykorzystujemy zmienn standaryzowan : xi f(x) n 2 ) u= N(2,2) N(2,0.2) t= σ n X −m n −1 s s= 1 n n i =1 ( xi − X ) 2 zmienna t ma rozkład t Studenta z n-1 stopniami swobody. srednia arytmetyczna 1 x −m która ma rozkład N(0,1). 2. Cecha X w populacji ma rozkład N(µ,σ), σ nieznane, n≤30 Dokonujemy przekształcenia zwanego studentyzacj : N(0,1) t-Studenta X 0 x Modele statystyczne, studia zaoczne 2 Rozkład redniej arytmetycznej z próby 1. Cecha X w populacji generalnej ma rozkład N(µ,σ), σ znane. Z populacji tej pobieramy prób n-elementow (X1, X2, ..., Xn). rednia arytmetyczna z próby ma rozkład: N (µ , Modele statystyczne, studia zaoczne Dla du ych n: rozkład t Studenta -> N(0,1) W praktyce, gdy n>30 rozkład t Studenta aproksymujemy rozkładem normalnym. 0 x 3 Modele statystyczne, studia zaoczne 4 Rozkład redniej arytmetycznej z próby Rozkład wariancji z próby 3. Cecha X w populacji ma rozkład dowolny, σ nieznane, n>30. Dla du ych prób zakładamy, e σ≈s . Korzystamy ze statystyki: u= Cecha X ma w populacji generalnej rozkład N(m, σ); σ, m - nieznane; n ≤ 30 Estymatorem parametru σ2 jest wariancja z próby s2 x −m n s χ = 2 f(x) 0.50 2 1 n n i =1 ( xi − X ) 2 2 χ n2 → N ( 2n − 1,1) Y = 2 χ n2 − 2n − 1 ≈ N (0,1) 0 2 4 6 x 5 Dla du ych n: n=2 n=4 n=8 0.25 0.00 Modele statystyczne, studia zaoczne 8 10 W praktyce, gdy n>30 rozkład chi-kwadrat aproksymujemy rozkładem normalnym 6 Współczynnik ufno ci Estymacja przedziałowa Ustalone z góry prawdopodobie stwo 1- α nazywamy współczynnikiem ufno ci Estymacja przedziałowa polega na konstruowaniu przedziału liczbowego, który z góry okre lonym - bliskim jedno ci prawdopodobie stwem b dzie zawierał nieznan warto szacowanego parametru θ. Przedział ten nosi nazwe przedziału ufno ci: Interpretacja współczynnika ufno ci: przy wielokrotnym pobieraniu prób nelementowych i wyznaczaniu na ich podstawie funkcji g1(θn) oraz g2(θn) rednio w (1- α)100% przypadków otrzymaliby my przedziały pokrywaj ce nieznan warto parametru θ, w α100% przypadków - przedziały nie pokrywaj ce tej warto ci. Z reguły za 1- α przyjmujemy: 0.9; 0.95, 0.99 P {g1(θn) < θ < g2(θn)} =1- α Długo c przedziału ufnosci: g2(θn) - g1(θn) => im dlugo tym oszacowanie bardziej precyzyjne gdzie θn- estymator parametru θ, g1(θn) - dolny kraniec przedziału ufno ci g2(θn) - górny kraniec przedziału ufno ci 1- α - prawdopodobie stwo tzw. współczynnik ufno ci Modele statystyczne, studia zaoczne σ s= która ma rozklad chi-kwadrat z n-1 stopniami swobody. która ma rozkład N(0,1). Modele statystyczne, studia zaoczne ns 2 przedziału mniejsza Maksymalny bł d szacunku: (g2(θn) - g1(θn))/2. 7 Modele statystyczne, studia zaoczne 8 PU dla warto ci redniej - Model 1 Przedziały ufno ci dla warto ci oczekiwanej ( redniej) (1) Zało enia: • próba losowa pobrana z populacji o rozkładzie N(m, σ); • σ jest znane; Budowa przedziału ufno ci dla warto ci redniej (oczekiwanej) µ=m=E(X) rozkladu populacji zalezy od: Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. Budowa przedziału ufno ci: • typu rozkładu cechy X w populacji generalnej • znajomo ci wariancji (odchylenia standardowego) • wielko ci próby Estymatorem parametru m jest rednia arytmetyczna z próby : Xsr, która ma rozkład N (m, σ ). Standaryzuj c otrzymujemy statystyk U: n U= X −m σ = X −m σ n n która ma rozkład N(0,1). Modele statystyczne, studia zaoczne 9 Modele statystyczne, studia zaoczne 10 Rozwi zanie PU dla warto ci redniej - Model 1 (2) Dane: x r=420 zł σ2 =10 000 => σ=100 n=100; 1- α=0.95 Rozklad statystyki U - N(0,1) P{− uα < U < uα } = 1 − α 1-α α α/2 α/2 P − uα < -uα 0 X −m σ n < uα = 1 − α Model 1: P X − uα Rozklad statystyki U - N(0,1) uα Przedział ufno ci dla warto ci redniej: P X − uα σ n < m < X + uα 1-α α α/2 σ n -uα = 1−α 0 α/2 uα P(|U|<uα)=0.95 P(U<uα)=0.975 => uα=1.96 Modele statystyczne, studia zaoczne 11 Modele statystyczne, studia zaoczne 420 − 1.96 σ n < m < X + uα σ n = 1−α 100 100 < m < 420 + 1.96 100 100 400.4 < m < 439,6 Odp.: Przedział liczbowy (400.4; 439.6) z prawdopodobie stwem 0.95 pokrywa nieznan warto przeci tnych wydatków na ywno w miejskich rodzinach 3-osobowych. 12 PU dla warto ci redniej - Model 2 (2) PU dla warto ci redniej - Model 2 (1) Zało enia: • próba losowa pobrana z populacji o rozkładzie N(m, σ); • σ jest nieznane; • liczno próby mała (n ≤ 30) Rozklad t-Studenta Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. Budowa przedziału ufno ci: α/2 t= X −m n −1 s gdzie 1 n s= i =1 -tα α/2 -tα 0 Model 2: P(|T| < tα) = 0.9 P(|T| > tα) = 0.1 => tα=1.833 9 stopni swobody Modele statystyczne, studia zaoczne 14 Zało enia: s < m < X + tα n −1 s = 1−α n −1 • próba losowa pobrana z populacji o dowolnym rozkładzie; • σ jest nieznane; • liczno próby du a (n > 30) Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. 12000 12000 60000 − 1.833 < m < 60000 + 1.833 9 9 50952 < m < 69048 Budowa przedziału ufno ci: Dla du ych prób rozkład t-Studenta mo na przybli y rozkładem normalnym oraz σ ≈ s. Wówczas przedział ufno ci jest analogiczny jak w Modelu 1: α/2 tα s = 1−α n −1 PU dla warto ci redniej - Model 3 n=10; 1- α=0.9 1-α α s < m < X + tα n −1 Modele statystyczne, studia zaoczne Rozwi zanie Rozklad t-Studenta tα P X − tα 13 P X − tα 0 X −m n − 1 < tα = 1 − α s Przedział ufno ci dla warto ci redniej: ( xi − X ) 2 Modele statystyczne, studia zaoczne Dane: x r=60 000 s2=144 000 => s=12 000 α/2 P − tα < Przy nieznanym parametrze podstaw budowy testu istotno ci dla warto ci redniej m jest statystyka t o rozkładzie t-Studenta z n-1 stopniami swobody: n P{− tα < t < tα } = 1 − α 1-α α Odp.: Przedział liczbowy (50952; 69048) z prawdopodobie stwem 0.9 pokrywa nieznan warto przeci tnych wydatków na promocj nowych wyrobów P X − uα 15 Modele statystyczne, studia zaoczne s s < m < X + uα = 1−α n n 16 PU dla wariancji - Model 1 (1) Estymacja przedziałowa Zało enia: Estymacja przedziałowa polega na konstruowaniu przedziału liczbowego, który z góry okre lonym - bliskim jedno ci prawdopodobie stwem b dzie zawierał nieznan warto szacowanego parametru θ. Przedział ten nosi nazwe przedziału ufno ci: • populacja generalna ma rozkład N(m, σ) • σ, m - nieznane; • n – liczno próby ≤ 30 Cel: budowa przedziału ufno ci dla σ przy współczynniku ufno ci 1-α Budowa przedziału ufno ci: P {g1(θn) < θ < g2(θn)} =1- α Estymatorem parametru σ2 jest wariancja z próby s2. Budow przedziału ufno ci oprzemy na statystyce: χ = 2 gdzie θn- estymator parametru θ, g1(θn) - dolny kraniec przedziału ufno ci g2(θn) - górny kraniec przedziału ufno ci 1- α - prawdopodobie stwo tzw. współczynnik ufno ci ns 2 σ2 która ma rozklad chi-kwadrat z n-1 stopniami swobody. Modele statystyczne, studia zaoczne 17 Interpretacja przedziału ufno ci 18 Współczynnik ufno ci • to przedział, do którego z prawdopodobie stwem 1- α trafia warto szacowanego parametru • to przedział, który z prawdopodobie stwem 1- α obejmuje szacowany parametr Ustalone z góry prawdopodobie stwo 1- α nazywamy współczynnikiem ufno ci Interpretacja współczynnika ufno ci: przy wielokrotnym pobieraniu prób nelementowych i wyznaczaniu na ich podstawie funkcji g1(θn) oraz g2(θn) rednio w (1- α)100% przypadków otrzymaliby my przedziały pokrywaj ce nieznan warto parametru θ, w α100% przypadków - przedziały nie pokrywaj ce tej warto ci. Z reguły za 1- α przyjmujemy: 0.9; 0.95, 0.99 (1) (2) (3) (4) (5) Długo c przedziału ufnosci: g2(θn) - g1(θn) => im dlugo tym oszacowanie bardziej precyzyjne θ przedziału mniejsza Maksymalny bł d szacunku: (g2(θn) - g1(θn))/2. Definicja nr 2 jest poprawna, poniewa wskazuje na zmienno granic przedziału ufno ci. Modele statystyczne, studia zaoczne Modele statystyczne, studia zaoczne 19 Modele statystyczne, studia zaoczne 20 PU dla warto ci redniej - Model 1 Przedziały ufno ci dla warto ci oczekiwanej ( redniej) (1) Zało enia: • próba losowa pobrana z populacji o rozkładzie N(m, σ); • σ jest znane; Budowa przedziału ufno ci dla warto ci redniej (oczekiwanej) µ=m=E(X) rozkladu populacji zalezy od: Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. Budowa przedziału ufno ci: • typu rozkładu cechy X w populacji generalnej • znajomo ci wariancji (odchylenia standardowego) • wielko ci próby Estymatorem parametru m jest rednia arytmetyczna z próby : Xsr, która ma rozkład N (m, σ ). Standaryzuj c otrzymujemy statystyk U: n U= X −m σ = X −m σ n n która ma rozkład N(0,1). Modele statystyczne, studia zaoczne 21 PU dla warto ci redniej - Model 1 (2) Modele statystyczne, studia zaoczne 22 PU dla warto ci redniej - Model 2 (1) Zało enia: • próba losowa pobrana z populacji o rozkładzie N(m, σ); • σ jest nieznane; • liczno próby mała (n ≤ 30) Rozklad statystyki U - N(0,1) P{− uα < U < uα } = 1 − α 1-α α α/2 α/2 P − uα < -uα 0 X −m σ Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. Budowa przedziału ufno ci: n < uα = 1 − α Przy nieznanym parametrze podstaw budowy testu istotno ci dla warto ci redniej m jest statystyka t o rozkładzie t-Studenta z n-1 stopniami swobody: uα Przedział ufno ci dla warto ci redniej: P X − uα Modele statystyczne, studia zaoczne σ n < m < X + uα σ n t= = 1−α 23 X −m n −1 s Modele statystyczne, studia zaoczne gdzie s= 1 n n i =1 ( xi − X ) 2 24 PU dla warto ci redniej - Model 2 (2) PU dla warto ci redniej - Model 3 Zało enia: • próba losowa pobrana z populacji o dowolnym rozkładzie; • σ jest nieznane; • liczno próby du a (n > 30) Rozklad t-Studenta P{− tα < t < tα } = 1 − α 1-α α α/2 -tα 0 α/2 X −m P − tα < n − 1 < tα = 1 − α s tα Przedział ufno ci dla warto ci redniej: P X − tα s < m < X + tα n −1 s = 1−α n −1 Modele statystyczne, studia zaoczne Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α. Budowa przedziału ufno ci: Dla du ych prób rozkład t-Studenta mo na przybli y rozkładem normalnym oraz σ ≈ s. Wówczas przedział ufno ci jest analogiczny jak w Modelu 1: P X − uα 25 Modele statystyczne, studia zaoczne Zało enia: Rozklad chi-kwadrat • populacja generalna ma rozkład N(m, σ) • σ, m - nieznane; próby ≤ 30 α/2 { 0 c1 c2 } P c1 < χ 2 < c2 = 1 − α P c1 < Estymatorem parametru σ2 jest wariancja z próby s2. Budow przedziału ufno ci oprzemy na statystyce: χ2 = α/2 1-α α Cel: budowa przedziału ufno ci dla σ przy współczynniku ufno ci 1-α Budowa przedziału ufno ci: ns 2 σ2 < c2 = 1 − α Przedział ufno ci dla wariancji: ns 2 σ2 P która ma rozklad chi-kwadrat z n-1 stopniami swobody. Modele statystyczne, studia zaoczne 26 PU dla wariancji - Model 1 (2) PU dla wariancji - Model 1 (1) • n – liczno s s < m < X + uα = 1−α n n 27 Modele statystyczne, studia zaoczne ns 2 ns 2 = 1−α <σ2 < c2 c1 28