X - Ath

Transkrypt

X - Ath
Rozkłady statystyk z próby
Rozkłady statystyk z próby
Przypuśćmy, że wykonujemy serię
doświadczeń polegających na 4 – krotnym
rzucie symetryczną kostką do gry,
obserwując liczbę wyrzuconych oczek
x1
x2
x3
x4
5
5
4
1
2
1
2
4
2
....
3
1
5
6
Nr kolejny
doświadczenia
1
wszystkie wyniki pierwszego rzutu kostką można
traktować, jako realizację zmiennej losowej,
którą oznaczmy przez X1 , drugiego X2 itd.
Definicja.
Próbą losową prostą jest ciąg n zmiennych
losowych (X1, X2, ,..., Xn) niezależnych,
mających jednakowe rozkłady.
Definicja
Statystyką z próby nazywamy zmienną losową
Z, będącą funkcją zmiennych X1, X2, ,..., Xn
stanowiących próbę losową.
Statystykami są : średnia z próby, wariancja z
próby, odchylenie standardowe z próby..
Liczba stopni swobody
jest równa liczbie niezależnych
obserwacji określających statystykę.
Rozkład średniej arytmetycznej z
próby dla populacji normalnej
Założenia:
Cecha X ma w populacji generalnej rozkład N(m, ).
Z populacji tej pobieramy n- elementową próbę
losową prostą (X1, X2, ,..., Xn).
Teza:
przy powyższych założeniach średnia arytmetyczna z
próby
1 n
X
X

n
i 1
ma rozkład normalny
i

N (m ,
Błąd standardowy średniej
n

n
)
Przykład.
Waga brzoskwiń ma rozkład N(150,3). Pakowane
są one po dziewięć sztuk, przy czym dobór ten jest
losowy.
1. Określić rozkład średniej arytmetycznej
brzoskwiń w pojedynczych opakowaniach.
2. Jakie jest prawdopodobieństwo tego, że średnia
waga brzoskwiń w opakowaniu jest większa od
152 g?
Rozwiązanie.
Średnia arytmetyczna wag brzoskwiń ma
rozkład normalny, ze średnią 150 g i
odchyleniem standardowym

3
D(X) 

n
9
= 1 g.
2.
 X  150 152  150 
P( X  152)  P


1
 1

 P(U  2)  1  P(U  2)  1  (2)
 1  0,97725  0,02275
Rozkład różnicy średnich
arytmetycznych z prób
Zakładamy, że z dwóch populacji normalnych
N(m1, 1) i N(m2, 2) pobieramy niezależne próby
liczące odpowiednio n1 i n2 elementów.
Statystyka :
X1  X2
ma rozkład normalny
N(m1  m2 ,
2
1
n1

2
2
n2
)
Rozkład t-Studenta.
Jeżeli zmienne losowe X1,X2,...,Xn mają jednakowy
rozkład prawdopodobieństwa, który jest rozkładem
normalnym o średniej m i wariancji σ2, to zmienna t
określona wzorem
Xm
t
n
s
gdzie X - wartość średnia z próby,
s – odchylenie standardowe obliczone z próby
ma rozkład t-Studenta o v = n-1 stopniach swobody.
Rozkład t-Studenta
Zastosowanie:
• w procedurach testowania hipotez statystycznych
• przy ocenie błędów pomiaru,
• szacowania przedziału, w którym leży, z
określonym prawdopodobieństwem, rzeczywista
wartość mierzona.
Funkcja gęstości rozkładu t-Studenta.
Dystrybuanta rozkładu t-Studenta.
Tablice t-Studenta
zawierają kwantyle rozkładu Studenta.
Tablice są skonstruowane w taki sposób, że dla
ustalonej wartości  (0 <  <1)
i liczby stopni swobody  podana jest wartość t, 
spełniająca relację
P(|t|  t, ) = .
Tablice t Studenta.
n
4
5
6
10
11
12
13
18
19
25
26
40
=0,1
2,132
2.015
1.943
1,812
1,796
1,782
1,771
1.734
1.729
1.708
1.706
1.684
 = 0,05
2,776
2.571
2.447
2,228
2,201
1,179
2,160
2.552
2.093
2.060
2.056
2.021
 = 0,02
3,747
3,365
3.143
2,764
2,718
2,681
2,650
2.878
2.539
2.485
2.479
2.423
 =0,01
4,604
4.032
3.707
3,169
3,106
3,055
3,012
3.922
2.861
2.787
2.779
2.704
Funkcja gęstości prawdopodobieństwa
y =student(x;10)
Dy stry buanta
p=1-istudent(x;10)
0.5
1.0
0.4
0.8
0.3
0.6
0.2
0.4
0.1
0.2
0.0
0.0
-3
-2
-1
0
1
2
3
-3
-2
-1
0
1
2
3
Twierdzenie graniczne
Przy    (dla  > 30) rozkład
t-Studenta jest zbieżny do standardowego
rozkładu normalnego N(0, 1).
Rozkład chi-kwadrat (2)
Rozkład chi kwadrat χ² to rozkład zmiennej
losowej która jest sumą k kwadratów
niezależnych zmiennych losowych o
standardowym rozkładzie normalnym.
k
Y   (X i ) ,
i 1
2
Rozkład chi-kwadrat (2)
Statystyka
(n  1)s
 

2
2
stosowana przy wnioskowaniu o wariancji
z próby dla populacji normalnej
Funkcja gęstości rozkładu 2
Rozkład chi-kwadrat (2)
• Rozkład 2 jest stablicowany w ten sposób,
że dla ustalonej wartości  i liczby stopni
swobody  tablice podają wartość 2,
spełniającą relację
P(2  2,) = .
Rozkład 2
n
0,05
0,02
0,01
0,98
0,99
2
5.991
7.824
9.210
0.040
0.020
3
7.815
9.837
11.345
0.185
0.115
4
9.488
11.668 13.277
0.429
0.297
5
11.070 13.388 15.086
0.752
0.554
6
12.592 15.033 16.812
1.134
0.872
7
14.067 16.622 18.475
1.564
1.239
Rozkład F Fishera-Snedecora.
Rozkład ilorazu wariancji dla dwóch populacji
normalnych.
Zakładamy, że z dwóch populacji normalnych
N(m1, ) i N(m2, ) pobieramy niezależne
próby liczące odpowiednio n1 i n2 elementów, z
których wyznaczamy średnie i wariancje:
2
2
s1 , s 2
Rozkład F Fishera -Snedecora.
• Budujemy statystykę
2
1
2
2
s
F
s
• Rozkład dla tej statystyki nazywany jest rozkładem
F-Snedecora o liczbie stopni swobody :
licznika 1 = n1 –1 i mianownika 2 = n2 - 2.
Funkcja gęstości rozkładu F- Fishera
Twierdzenia graniczne i prawa
wielkich liczb
Definicja stochastycznej zbieżności
Ciąg zmiennych losowych {Xn} jest - przy n  
zbieżny stochastycznie (wg prawdopodobieństwa )
do zmiennej losowej X, jeśli dla każdego  > 0
spełniona jest następująca równość:
lim P(| X n  X | )  1
n 
Prawo wielkich liczb Czebyszewa
Jeśli dla ciągu zmiennych losowych {Xk}, z których
każda ma skończoną wartość oczekiwaną E(Xk)
oraz wariancję D2(Xk) jest spełniony warunek
lim D 2 (X k )  0
k 
to
lim P(| X k  E(X k ) | )  1
k 
co oznacza, że ciąg {Xk} jest stochastycznie (wg
prawdopodobieństwa) zbieżny do wartości oczekiwanej.
Mocne prawo wielkich liczb
(Chinczyna)
to twierdzenie matematyczne, które mówi że
n
Xi
ciąg zmiennych losowych S 

n
i 1 n
zbiega z prawdopodobieństwem równym 1
do wartości oczekiwanej m zmiennej losowej Xi.
(Średnia z próby jest zbieżna do wartości oczekiwanej).
Twierdzenia graniczne
• Dotyczą zbieżności ciągu zmiennych
losowych {Xn} do rozkładu
jednopunktowego tzn. istnienia granicy
stochastycznej tego ciągu.
Przybliżenie Poissona
• Zmienna losowa X o rozkładzie
dwumianowym przy n  
zmierza do rozkładu Poissona.
• Dystrybuanta rozkładu N(0,1) jest
asymptotyczną (graniczną) dystrybuantą
ciągu dystrybuant zestandaryzowanych
zmiennych dwumianowych.
Centralne twierdzenie graniczne
Lindeberga-Levy’ego.
Założenia:
Dany jest ciąg X1, … , Xn niezależnych
zmiennych losowych o jednakowym rozkładzie.
czyli spełnione są warunki:
E(X1) =m, E(X2) = …=E(Xn) = m
D2(X1) = 2 D2(X2) = …= D2(Xn) = 2
Centralne twierdzenie graniczne
Lindeberga-Levy’ego.
Teza:
Oznaczmy przez Z = X1+ … +Xn
Jeśli n rozkład zmiennej losowej Zn można
przybliżać rozkładem normalnym z wartością
oczekiwaną nm i odchyleniem  n
czyli dla dużych n jest zbliżony do rozkładu
N(nm,  n )
E(Zn) = nm oraz D2(Zn) = n2 (Wynika to z własności
wartości oczekiwanej i wariancji)
Rozkład sumy, różnicy, średniej
arytmetycznej zmiennych losowych
Wiadomo, że waga dorosłego człowieka ma
rozkład N(70,3). Samolot zabiera 80
pasażerów.
Jakie jest prawdopodobieństwo, że łączna
waga pasażerów przekroczy 5550 kg.
Rozwiązanie
Centralne twierdzenie graniczne Lindeberga-Levy’ego.
Łączna waga pasażerów Y = X1 + X2 + ...+ Xn ma
rozkład

N nm,  n
czyli

N(5600,
N(80 * 70,3 80
3 80)

5550  5600 
50 

P Y  5550)  P(U 
  PU  
  P(U  1,86) 
26,8 
3 80



1  P(U  1,86)  1  ( 1,86)  1  1  (1,86)  (1,86)  0,969
Przykład. Rozkład chi-kwadrat .
Zmienna losowa X ma rozkład 2 chi-kwadrat z
pięcioma stopniami swobody.
Oblicz P(X  11,070)
P(X  11,070) =
=1- P(X > 11,070) =1 - 0,05 = 0,95
• Rozkład 2 jest stablicowany w ten
sposób, że dla ustalonej wartości  i
liczby stopni swobody n tablice podają
wartość 2 ,n spełniającą relację
P(2 2 ,n) = .
P(X  11,070)
P(X > 11,070)
Zadania.
1. Zmienna losowa X ma rozkład chi-kwadrat o
6 stopniach swobody. Oblicz P(X > 1,610)
2. Zmienna losowa X ma rozkład chi-kwadrat z
pięcioma stopniami swobody.
Oblicz prawdopodobieństwo P(X > 1,145)
oraz P(X 7,289)
Przykład.
1. Wiedząc , że zmienna losowa X ma rozkład chikwadrat o 6 stopniach swobody , znajdź taką
wartość x0, że
a) P(X >x0) = 0,9
b) P(X < x0) = 0,05
a) P(X >x0) = 0,9
Odp.a) x0 = 2,204
b) P(X<x0) = 1- P(X  x0) =0,1 stąd P(X  x0) = 0,95
z tablic x0 = 1,635
Przykład. Rozkład t-Studenta
Zmienna losowa ma rozkład t-Studenta
o 15 stopniach swobody.
Obliczyć
a) P(|X|>0,128)
b) P(X > 0,258)
c) P(|X|0,39)
P(|X|>0,128)
Tablice: P(|t|  t, ) = .
P(|X|>0,128) – odczytujemy z tablic następująco:
dla 15 stopni swobody znajdujemy wartość
0,128 i odczytujemy prawdopodobieństwo
(czyli alfa) =0,9
P(|X|>0,128) (P(|t|  t, ) = )
b) P(X > 0,258)
P(X > 0,258)
P(X > 0,258) =1/2* P(X > 0,258) =0,8/2
=0,4
P(|X|0,39)
P(|X|0,39) = 1-P(|X|0,39)=1-0,7=0,3;
P(|X|0,39)
Przykład.
Waga brzoskwiń ma rozkład N(150,3). Pakowane
są one po dziewięć sztuk, przy czym dobór ten jest
losowy.
1. Określić rozkład średniej arytmetycznej
brzoskwiń w pojedynczych opakowaniach.
2. Jakie jest prawdopodobieństwo tego, że średnia
waga brzoskwiń w opakowaniu jest większa od
152 g?
Rozwiązanie.
Średnia arytmetyczna wag brzoskwiń ma
rozkład normalny, ze średnią 150 g i
odchyleniem standardowym

3
D(X) 

n
9
= 1 g.
2.
 X  150 152  150 
P( X  152)  P


1
 1

 P(U  2)  1  P(U  2)  1  (2)
 1  0,97725  0,02275
Przykład.
Wzrost 15-letnich chłopców ma rozkład
normalny N(170,5), natomiast wzrost
piętnastoletnich dziewcząt ma rozkład
N(166,4). Pobiera się niezależnie próby
liczące 8 chłopców i 10 dziewcząt.
Jakie jest prawdopodobieństwo, że obliczana
na podstawie prób średnia arytmetyczna
wzrostu dziewczyn będzie większa od
średniej arytmetycznej wzrostu chłopców?
Rozwiązanie
Różnica średnich z obu prób - ma rozkład
normalny ze średnią wynoszącą
m1  m2  170-166 = 4
oraz odchyleniem standardowym
2
1
2
2
25
16




2
,
17
n1 n 2
8 10
czyli rozkład normalny N(4, 2,17).
2.
P(X2  X1)  P(X1  X2 )  0) 
 (X1  X2 )  4 0  4 
P



2,17
2,17 

 P( U  1,84)  (1,84)  0,03288
Rozkład sumy, różnicy, średniej
arytmetycznej zmiennych losowych
Wiadomo, że waga dorosłego człowieka ma
rozkład N(70,3). Samolot zabiera 80
pasażerów.
Jakie jest prawdopodobieństwo, że łączna
waga pasażerów przekroczy 5550 kg.
Rozwiązanie
Centralne twierdzenie graniczne Lindeberga-Levy’ego.
Łączna waga pasażerów Y = X1 + X2 + ...+ Xn ma
rozkład

N nm, n  2
czyli

N(5600,
N(80 * 70,3 80
3 80)

5550  5600 
50 

P Y  5550)  P(U 
  PU  
  P(U  1,86) 
26,8 
3 80



1  P(U  1,86)  1  ( 1,86)  1  1  (1,86)  (1,86)  0,969
Przykład
Błędy pomiarów dokonywanych pewnym
przyrządem mają rozkład normalny z wariancją
2 = 0,25 (cm)2.
Jakie jest prawdopodobieństwo, że wariancja
błędów 10 niezależnych pomiarów nie
przekroczy 0,16 (cm)2.
Obliczyć: P(s2  0,16)
Prawdopodobieństwo zdarzenia s2  0,16
obliczymy, gdy wykorzystamy fakt, że statystyka
2
(n  1)s
 


2
2
9s
0,25
ma rozkład 2 o 9 stopniach swobody.
P(s2  0,16) =
 9s
9 * 0,16 
2
  P( (9)  5,76)  0,236
P

0,25 
 0,25
2