Metody probabilistyczne i statystyka Rozkłady statystyk z próby

Transkrypt

Metody probabilistyczne i statystyka Rozkłady statystyk z próby
Rozkłady statystyk z próby
• Statystyk nazywamy zmienn losow , b d c funkcj zmiennych losowych
X1, X2, ..., Xn stanowi cych prób .
Metody probabilistyczne i statystyka
Wykład 2: Rozkłady statystyk z próby.
• Statystyka jako zmienna losowa posiada pewien rozkład, który nazywamy
rozkładem statystyki z próby. Zale y on przede wszystkim od rozkładu
populacji, z której pochodzi próba oraz od liczebno ci próby.
Przedziały ufno ci
Małgorzata Kr towska
• Ze wzgl du na liczebno n próby rozkłady statystyk dzielimy na
– dokładne - rozkłady prawdopodobie stwa wyznaczone dla dowolnej liczby
naturalnej n, b d cej liczebno ci próby. S one wykorzystywane dla
małych prób.
– graniczne - rozkład prawdopodobie stwa statystyki, który otrzymuje si
przy zało eniu nieograniczenie du ej próby, n→∞ . Nie ma jednej,
okre lonej warto ci n od której uznajemy prób za du . W niektórych
przypadkach rozkład dokładny ju dla n>30 niewiele ró ni si od rozkładu
granicznego, w innych przypadkach potrzebujemy n>100.
Wydział Informatyki
Politechnika Białostocka
e-mail: [email protected]
strona www: http://aragorn.pb.bialystok.pl/~gkret
Modele statystyczne, studia zaoczne
1
Rozkład redniej arytmetycznej z próby
x=
1
n
n
i =1
σ
w praktyce wykorzystujemy zmienn standaryzowan :
xi
f(x)
n
2
)
u=
N(2,2)
N(2,0.2)
t=
σ
n
X −m
n −1
s
s=
1
n
n
i =1
( xi − X ) 2
zmienna t ma rozkład t Studenta z n-1 stopniami swobody.
srednia
arytmetyczna
1
x −m
która ma rozkład N(0,1).
2. Cecha X w populacji ma rozkład N(µ,σ), σ nieznane, n≤30
Dokonujemy przekształcenia zwanego studentyzacj :
N(0,1)
t-Studenta
X
0
x
Modele statystyczne, studia zaoczne
2
Rozkład redniej arytmetycznej z próby
1. Cecha X w populacji generalnej ma rozkład N(µ,σ), σ znane. Z populacji tej
pobieramy prób n-elementow (X1, X2, ..., Xn).
rednia arytmetyczna z próby ma rozkład:
N (µ ,
Modele statystyczne, studia zaoczne
Dla du ych n:
rozkład t Studenta -> N(0,1)
W praktyce, gdy n>30 rozkład t Studenta
aproksymujemy rozkładem normalnym.
0
x
3
Modele statystyczne, studia zaoczne
4
Rozkład redniej arytmetycznej z próby
Rozkład wariancji z próby
3. Cecha X w populacji ma rozkład dowolny, σ nieznane, n>30.
Dla du ych prób zakładamy, e σ≈s . Korzystamy ze statystyki:
u=
Cecha X ma w populacji generalnej rozkład N(m, σ); σ, m - nieznane; n ≤ 30
Estymatorem parametru σ2 jest wariancja z próby s2
x −m
n
s
χ =
2
f(x)
0.50
2
1
n
n
i =1
( xi − X ) 2
2 χ n2 → N ( 2n − 1,1)
Y = 2 χ n2 − 2n − 1 ≈ N (0,1)
0
2
4
6
x
5
Dla du ych n:
n=2
n=4
n=8
0.25
0.00
Modele statystyczne, studia zaoczne
8
10
W praktyce, gdy n>30 rozkład
chi-kwadrat aproksymujemy
rozkładem normalnym
6
Współczynnik ufno ci
Estymacja przedziałowa
Ustalone z góry prawdopodobie stwo 1- α nazywamy współczynnikiem ufno ci
Estymacja przedziałowa polega na konstruowaniu przedziału
liczbowego, który z góry okre lonym - bliskim jedno ci prawdopodobie stwem b dzie zawierał nieznan warto
szacowanego parametru θ. Przedział ten nosi nazwe przedziału
ufno ci:
Interpretacja współczynnika ufno ci: przy wielokrotnym pobieraniu prób nelementowych i wyznaczaniu na ich podstawie funkcji g1(θn) oraz g2(θn)
rednio w (1- α)100% przypadków otrzymaliby my przedziały pokrywaj ce
nieznan warto parametru θ, w α100% przypadków - przedziały nie
pokrywaj ce tej warto ci.
Z reguły za 1- α przyjmujemy: 0.9; 0.95, 0.99
P {g1(θn) < θ < g2(θn)} =1- α
Długo c przedziału ufnosci: g2(θn) - g1(θn) => im dlugo
tym oszacowanie bardziej precyzyjne
gdzie θn- estymator parametru θ,
g1(θn) - dolny kraniec przedziału ufno ci
g2(θn) - górny kraniec przedziału ufno ci
1- α - prawdopodobie stwo tzw. współczynnik ufno ci
Modele statystyczne, studia zaoczne
σ
s=
która ma rozklad chi-kwadrat z n-1 stopniami swobody.
która ma rozkład N(0,1).
Modele statystyczne, studia zaoczne
ns 2
przedziału mniejsza
Maksymalny bł d szacunku: (g2(θn) - g1(θn))/2.
7
Modele statystyczne, studia zaoczne
8
PU dla warto ci redniej - Model 1
Przedziały ufno ci dla warto ci
oczekiwanej ( redniej)
(1)
Zało enia:
• próba losowa pobrana z populacji o rozkładzie N(m, σ);
• σ jest znane;
Budowa przedziału ufno ci dla warto ci redniej
(oczekiwanej) µ=m=E(X) rozkladu populacji zalezy od:
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
Budowa przedziału ufno ci:
• typu rozkładu cechy X w populacji generalnej
• znajomo ci wariancji (odchylenia standardowego)
• wielko ci próby
Estymatorem parametru m jest rednia arytmetyczna z próby : Xsr, która ma
rozkład N (m, σ ). Standaryzuj c otrzymujemy statystyk U:
n
U=
X −m
σ
=
X −m
σ
n
n
która ma rozkład N(0,1).
Modele statystyczne, studia zaoczne
9
Modele statystyczne, studia zaoczne
10
Rozwi zanie
PU dla warto ci redniej - Model 1 (2)
Dane:
x r=420 zł
σ2 =10 000 => σ=100
n=100; 1- α=0.95
Rozklad statystyki U - N(0,1)
P{− uα < U < uα } = 1 − α
1-α
α
α/2
α/2
P − uα <
-uα
0
X −m
σ
n < uα = 1 − α
Model 1:
P X − uα
Rozklad statystyki
U - N(0,1)
uα
Przedział ufno ci dla warto ci redniej:
P X − uα
σ
n
< m < X + uα
1-α
α
α/2
σ
n
-uα
= 1−α
0
α/2
uα
P(|U|<uα)=0.95
P(U<uα)=0.975 => uα=1.96
Modele statystyczne, studia zaoczne
11
Modele statystyczne, studia zaoczne
420 − 1.96
σ
n
< m < X + uα
σ
n
= 1−α
100
100
< m < 420 + 1.96
100
100
400.4 < m < 439,6
Odp.: Przedział liczbowy (400.4;
439.6) z prawdopodobie stwem 0.95
pokrywa nieznan warto
przeci tnych wydatków na ywno
w miejskich rodzinach 3-osobowych.
12
PU dla warto ci redniej - Model 2 (2)
PU dla warto ci redniej - Model 2 (1)
Zało enia:
• próba losowa pobrana z populacji o rozkładzie N(m, σ);
• σ jest nieznane;
• liczno próby mała (n ≤ 30)
Rozklad t-Studenta
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
Budowa przedziału ufno ci:
α/2
t=
X −m
n −1
s
gdzie
1
n
s=
i =1
-tα
α/2
-tα
0
Model 2:
P(|T| < tα) = 0.9
P(|T| > tα) = 0.1 => tα=1.833
9 stopni swobody
Modele statystyczne, studia zaoczne
14
Zało enia:
s
< m < X + tα
n −1
s
= 1−α
n −1
• próba losowa pobrana z populacji o dowolnym rozkładzie;
• σ jest nieznane;
• liczno próby du a (n > 30)
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
12000
12000
60000 − 1.833
< m < 60000 + 1.833
9
9
50952 < m < 69048
Budowa przedziału ufno ci:
Dla du ych prób rozkład t-Studenta mo na przybli y rozkładem
normalnym oraz σ ≈ s. Wówczas przedział ufno ci jest
analogiczny jak w Modelu 1:
α/2
tα
s
= 1−α
n −1
PU dla warto ci redniej - Model 3
n=10; 1- α=0.9
1-α
α
s
< m < X + tα
n −1
Modele statystyczne, studia zaoczne
Rozwi zanie
Rozklad t-Studenta
tα
P X − tα
13
P X − tα
0
X −m
n − 1 < tα = 1 − α
s
Przedział ufno ci dla warto ci redniej:
( xi − X ) 2
Modele statystyczne, studia zaoczne
Dane:
x r=60 000
s2=144 000 => s=12 000
α/2
P − tα <
Przy nieznanym parametrze podstaw budowy testu istotno ci dla warto ci
redniej m jest statystyka t o rozkładzie t-Studenta z n-1 stopniami
swobody:
n
P{− tα < t < tα } = 1 − α
1-α
α
Odp.: Przedział liczbowy (50952;
69048) z prawdopodobie stwem 0.9
pokrywa nieznan warto
przeci tnych wydatków na promocj
nowych wyrobów
P X − uα
15
Modele statystyczne, studia zaoczne
s
s
< m < X + uα
= 1−α
n
n
16
PU dla wariancji - Model 1 (1)
Estymacja przedziałowa
Zało enia:
Estymacja przedziałowa polega na konstruowaniu przedziału
liczbowego, który z góry okre lonym - bliskim jedno ci prawdopodobie stwem b dzie zawierał nieznan warto
szacowanego parametru θ. Przedział ten nosi nazwe przedziału
ufno ci:
• populacja generalna ma rozkład N(m, σ)
• σ, m - nieznane;
• n – liczno
próby ≤ 30
Cel: budowa przedziału ufno ci dla σ przy współczynniku ufno ci 1-α
Budowa przedziału ufno ci:
P {g1(θn) < θ < g2(θn)} =1- α
Estymatorem parametru σ2 jest wariancja z próby s2. Budow przedziału
ufno ci oprzemy na statystyce:
χ =
2
gdzie θn- estymator parametru θ,
g1(θn) - dolny kraniec przedziału ufno ci
g2(θn) - górny kraniec przedziału ufno ci
1- α - prawdopodobie stwo tzw. współczynnik ufno ci
ns 2
σ2
która ma rozklad chi-kwadrat z n-1 stopniami swobody.
Modele statystyczne, studia zaoczne
17
Interpretacja przedziału ufno ci
18
Współczynnik ufno ci
• to przedział, do którego z prawdopodobie stwem 1- α trafia
warto szacowanego parametru
• to przedział, który z prawdopodobie stwem 1- α obejmuje
szacowany parametr
Ustalone z góry prawdopodobie stwo 1- α nazywamy współczynnikiem ufno ci
Interpretacja współczynnika ufno ci: przy wielokrotnym pobieraniu prób nelementowych i wyznaczaniu na ich podstawie funkcji g1(θn) oraz g2(θn)
rednio w (1- α)100% przypadków otrzymaliby my przedziały pokrywaj ce
nieznan warto parametru θ, w α100% przypadków - przedziały nie
pokrywaj ce tej warto ci.
Z reguły za 1- α przyjmujemy: 0.9; 0.95, 0.99
(1)
(2)
(3)
(4)
(5)
Długo c przedziału ufnosci: g2(θn) - g1(θn) => im dlugo
tym oszacowanie bardziej precyzyjne
θ
przedziału mniejsza
Maksymalny bł d szacunku: (g2(θn) - g1(θn))/2.
Definicja nr 2 jest poprawna, poniewa wskazuje na zmienno
granic przedziału ufno ci.
Modele statystyczne, studia zaoczne
Modele statystyczne, studia zaoczne
19
Modele statystyczne, studia zaoczne
20
PU dla warto ci redniej - Model 1
Przedziały ufno ci dla warto ci
oczekiwanej ( redniej)
(1)
Zało enia:
• próba losowa pobrana z populacji o rozkładzie N(m, σ);
• σ jest znane;
Budowa przedziału ufno ci dla warto ci redniej
(oczekiwanej) µ=m=E(X) rozkladu populacji zalezy od:
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
Budowa przedziału ufno ci:
• typu rozkładu cechy X w populacji generalnej
• znajomo ci wariancji (odchylenia standardowego)
• wielko ci próby
Estymatorem parametru m jest rednia arytmetyczna z próby : Xsr, która ma
rozkład N (m, σ ). Standaryzuj c otrzymujemy statystyk U:
n
U=
X −m
σ
=
X −m
σ
n
n
która ma rozkład N(0,1).
Modele statystyczne, studia zaoczne
21
PU dla warto ci redniej - Model 1 (2)
Modele statystyczne, studia zaoczne
22
PU dla warto ci redniej - Model 2 (1)
Zało enia:
• próba losowa pobrana z populacji o rozkładzie N(m, σ);
• σ jest nieznane;
• liczno próby mała (n ≤ 30)
Rozklad statystyki U - N(0,1)
P{− uα < U < uα } = 1 − α
1-α
α
α/2
α/2
P − uα <
-uα
0
X −m
σ
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
Budowa przedziału ufno ci:
n < uα = 1 − α
Przy nieznanym parametrze podstaw budowy testu istotno ci dla warto ci
redniej m jest statystyka t o rozkładzie t-Studenta z n-1 stopniami
swobody:
uα
Przedział ufno ci dla warto ci redniej:
P X − uα
Modele statystyczne, studia zaoczne
σ
n
< m < X + uα
σ
n
t=
= 1−α
23
X −m
n −1
s
Modele statystyczne, studia zaoczne
gdzie
s=
1
n
n
i =1
( xi − X ) 2
24
PU dla warto ci redniej - Model 2 (2)
PU dla warto ci redniej - Model 3
Zało enia:
• próba losowa pobrana z populacji o dowolnym rozkładzie;
• σ jest nieznane;
• liczno próby du a (n > 30)
Rozklad t-Studenta
P{− tα < t < tα } = 1 − α
1-α
α
α/2
-tα
0
α/2
X −m
P − tα <
n − 1 < tα = 1 − α
s
tα
Przedział ufno ci dla warto ci redniej:
P X − tα
s
< m < X + tα
n −1
s
= 1−α
n −1
Modele statystyczne, studia zaoczne
Cel: budowa przedziału ufno ci dla m przy współczynniku ufno ci 1-α.
Budowa przedziału ufno ci:
Dla du ych prób rozkład t-Studenta mo na przybli y rozkładem
normalnym oraz σ ≈ s. Wówczas przedział ufno ci jest
analogiczny jak w Modelu 1:
P X − uα
25
Modele statystyczne, studia zaoczne
Zało enia:
Rozklad chi-kwadrat
• populacja generalna ma rozkład N(m, σ)
• σ, m - nieznane;
próby ≤ 30
α/2
{
0
c1
c2
}
P c1 < χ 2 < c2 = 1 − α
P c1 <
Estymatorem parametru σ2 jest wariancja z próby s2. Budow przedziału
ufno ci oprzemy na statystyce:
χ2 =
α/2
1-α
α
Cel: budowa przedziału ufno ci dla σ przy współczynniku ufno ci 1-α
Budowa przedziału ufno ci:
ns 2
σ2
< c2 = 1 − α
Przedział ufno ci dla wariancji:
ns 2
σ2
P
która ma rozklad chi-kwadrat z n-1 stopniami swobody.
Modele statystyczne, studia zaoczne
26
PU dla wariancji - Model 1 (2)
PU dla wariancji - Model 1 (1)
• n – liczno
s
s
< m < X + uα
= 1−α
n
n
27
Modele statystyczne, studia zaoczne
ns 2
ns 2
= 1−α
<σ2 <
c2
c1
28

Podobne dokumenty