przedział ufności

Transkrypt

przedział ufności
1
2
1
H A : p≠
2
Test dwustronny:
H 0 : p=
0,300
0,250
P(r)
0,200
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
r
α/2
Przedział ufności
Obszar krytyczny
dla α = 0,05
α/2
Prawo Murphy'ego: kanapka zazwyczaj spada posmarowaną
stroną do dołu.
Zrzucono 10 razy kanapkę na dywan. 8 razy kanapka spadła
posmarowaną stroną do dołu.
Czy można uznać, że prawo Murphy'ego jest prawdziwe?
Przetestuj hipotezę dla poziomu istotności α = 0,05 i α = 0,1.
α = 0,05
p = 56/1024 = 5,5%
0,300
0,250
0,200
P(r)
P(r=0) = 1/1024
P(r=1) = 10/1024
P(r=2) = 45/1024
P(r=3) = 120/1024
P(r=4) = 210/1024
P(r=5) = 252/1024
P(r=6) = 210/1024
P(r=7) = 120/1024
P(r=8) = 45/1024
P(r=9) = 10/1024
P(r=10) = 1/1024
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
r
Przedział ufności
Obszar krytyczny
dla α = 0,05
α
α = 0,1
p = 56/1024 = 5,5%
0,300
0,250
0,200
P(r)
P(r=0) = 1/1024
P(r=1) = 10/1024
P(r=2) = 45/1024
P(r=3) = 120/1024
P(r=4) = 210/1024
P(r=5) = 252/1024
P(r=6) = 210/1024
P(r=7) = 120/1024
P(r=8) = 45/1024
P(r=9) = 10/1024
P(r=10) = 1/1024
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
r
Przedział ufności
Obszar krytyczny
dla α = 0,1
α
Zadanie: Jakie jest prawdopodobieństwo, że uda się
zidentyfikować krzywą monetę (p=0,3) przy dziesięciu rzutach
monetą?
Wyznaczamy obszar krytyczny i przedział ufności dla n = 10.
Przyjmujemy poziom istotności testu α = 0,05.
p = 22/1024 = 2,1%
0,300
0,250
0,200
P(r)
P(r=0) = 1/1024
P(r=1) = 10/1024
P(r=2) = 45/1024
P(r=3) = 120/1024
P(r=4) = 210/1024
P(r=5) = 252/1024
P(r=6) = 210/1024
P(r=7) = 120/1024
P(r=8) = 45/1024
P(r=9) = 10/1024
P(r=10) = 1/1024
0,150
0,100
0,050
0,000
0
1
2
3
4
5
6
7
8
9
10
r
α/2
Przedział ufności
Obszar krytyczny
dla α = 0,05
α/2
Zadanie: Jakie jest prawdopodobieństwo, że uda się
zidentyfikować krzywą monetę (p=0,3) przy n = 10?
0,30
0,25
0,20
P(r)
P(p = 0,3; r=0) = 0,028
P(p = 0,3; r=1) = 0,121
P(p = 0,3; r=2) = 0,233
P(p = 0,3; r=3) = 0,267
P(p = 0,3; r=4) = 0,200
P(p = 0,3; r=5) = 0,103
P(p = 0,3; r=6) = 0,037
P(p = 0,3; r=7) = 0,009
P(p = 0,3; r=8) = 0,001
P(p = 0,3; r=9) = 0
P(p = 0,3; r=10) = 0
0,15
p=0.5
p=0.3
0,10
0,05
0,00
0
1
2
3
4
5
6
7
8
9
10
r
α/2
Przedział ufności
Obszar krytyczny
dla α = 0,05
p = 0,028 + 0,121 + 0 + 0 = 0,149 = 14.9% = β
α/2
Rodzaje błędów, które można popełnić przy testowaniu
hipotez.
Błąd I-go rodzaju (α) – odrzucenie prawdziwej hipotezy H0.
Błąd II-go rodzaju (1-β) – przyjęcie fałszywej hipotezy H0.
Hipoteza H0
Prawdziwa
Fałszywa
Odrzucamy
Przyjmujemy
α
1-β
Błąd III-go rodzaju (γ) – przyjęcie złego kierunku HA.
Pytanie: Kiedy do testowania hipotezy stosujemy rozkład
dwumianowy?
Gdy:
● badana cecha jest niemierzalna i może przyjąć dwie możliwe
wartości (np. orzeł i reszka);
● dysponujemy pojedynczą próbą (np. jedną serią), w której
policzono ilość przypadków wystąpienia każdej z dwóch wartości,
jakie może przyjąć cecha (np. ilość wyrzuconych orłów i reszek);
● dysponujemy rozkładem teoretycznym;
● próba (seria) zdarzeń (np. rzutów monetą) jest małoliczna
(mniej niż 30).
Rozkład normalny n ∞
0,12
0,30
0,1
0,25
0,08
P(r)
0,15
0,06
0,10
0,04
0,05
0,02
0,00
0
0
1
2
3
4
5
6
7
8
9
r
10
r
0,090
0,080
0,070
0,060
P(X)
P(r)
0,20
0,050
0,040
0,030
0,020
0,010
0,000
0
10
20
30
X
40
50
60
Parametry charakteryzujące rozkład normalny
0,25
0,20
P(X)
0,15
0,10
0,05
0,00
0
10
20
30
40
X
50
60
Parametry charakteryzujące rozkład normalny
μ
0,09
1
f  xi =
⋅e
 2
−
0,08
0,07
P(X)
0,06
0,05
0,04
σ
0,03
0,02
0,01
0,00
0
10
20
30
X
40
50
60
 
1 x i −
2 
Standaryzacja rozkładu normalnego
X  N  ,  
X − N 0,  
X −
 N 0,1

Wartość standaryzowana:
x−
z=

0,6
0,5
P(Z)
0,4
0,3
0,2
0,1
0
-0,1
-4
-3
-2
-1
0
Z
1
2
3
4
Dystrybuanta rozkładu normalnego
F  X =P  X  x i = P −∞ X  x i 
1
 z =
2 
z
−
∫e
z2
2
dz
−∞
1,2
1
F(Z)
0,8
0,6
0,4
0,2
0
-4
-3
-2
-1
0
Z
1
2
3
4
Kodowanie danych
●
Dodawanie, odejmowanie, mnożenie i dzielenie wszystkich
elementów szeregu przez stałą. W/w działania można łączyć.
●
Obliczając statystyki z danych zakodowanych można je
odkodować i uzyskujemy statystykę, jak z danych
niekodowanych.
●
Rozkład przy kodowaniu przesuwa się na skali, zwęża lub
rozszerza, ale jego zasadniczy kształt nie zmienia się.
Transformowanie danych
●
Pierwiastkowanie, podnoszenie do potęgi, obliczanie
odwrotności, logarytmowanie i antylogarytmowanie, stosowanie
funkcji trygonometrycznych,
●
Transformowanie danych stosujemy, gdy mamy do czynienia z
przypadkami zależności nieliniowych (występujących w
przyrodzie).
Np. powierzchnia liścia rośne z kwadratem długości.
Zadania:
1) Wystandaryzować wartości x1 = 23, x2 = 34, x3 = 28 względem
rozkładu o parametrach μ = 27 i σ = 4.
Odp: z1 = -1; z2 = 1,75; z3 = 0,25
2) Odkodować wartości z1 = 3, z2 = -1,5 oraz z3 = -0,5 wiedząc,
że pochodzą one z rozkładu o parametrach μ = 30 i σ = 5.
Odp: x1 = 45; x2 = 22,5; x3 = 27,5
Student wystandaryzował wartość x1 = 25 otrzymując wartość z1
= 2. Pamięta, że standaryzacji dokonał względem σ = 3.
Niestety, nie pamięta wartości μ. Czy na podstawie
posiadanych danych można odzyskać informację o wartości μ?
Odp: Tak. μ = 19.
Jakie jest prawdopodobieństwo, że zmienna Z przyjmie wartość
mniejszą niż z1 = 3. Jak to prawdopodobieństwo zmienia się dla
wartości z2 = 2, z3 = 1, z4 = 0, z5 = -1, z6 = -2, z7 = -3? Wynik podaj z
dokładnością do trzech cyfr znaczących.
Odp: F(z1) = 0,999; F(z2) = 0,977; F(z3) = 0,841; F(z4) = (0,500);
F(z5) = 0,159; F(z6) = 0,0228; F(z7 ) = 0,00135
Rozkład pewnej cechy posiada następujące parametry: μ = 20,0 i
σ = 5,0. Odszukaj:
a) Kwartyle Q1 i Q3.
Odp: Q1 = 16,6 (17), Q3 = 23,4 (23)
b) Centyle C20 i C70.
Odp: C20 = 15,8, C70 = 22,6
Siatka centylowa
Masa chłopców w wieku 12-36 miesięcy.
Rozkład pewnej cechy w populacji (np. wzrost 8-letnich
chłopców we Wrocławiu) posiada parametry μ = 100 i σ =
12,0. Odszukaj:
Jaki procent chłopców zawiera się w granicach: a) μ ± σ,
b) μ ± 2σ, c) μ ± 3σ?
Odp: a) 68,3% b) 95,4% c) 99,7%
W jakim zakresie zawiera się 95% chłopców?
Odp: <76,5 (76); 124>
Wyznaczyć przedział ufności i obszar krytyczny (dwustronny) w
rozkładzie o parametrach μ = 100 i σ = 12,0 dla α= 0,01, α=
0,05 i α= 0,1.
Odp:
α= 0,01: Przedział ufności <69,0; 131>
α= 0,05: Przedział ufności <76,5; 124>
α= 0,1: Przedział ufności <80,3; 120>
Na ulicach Wrocławia złapano osobnika podającego się za
ośmiolatka o wzroście 128 cm. Czy osobnik ten jest rodowitym
mieszkańcem Wrocławia?
Odp: Nie, dla α= 0,05.
Na jakim najniższym poziomie istotności możemy odrzucić
hipotezę H0 (tzn. że chłopiec pochodzi z Wrocławia)?
Odp: α= 0,02.