1 - theta.edu.pl

Transkrypt

1 - theta.edu.pl
STATYSTYKA MATEMATYCZNA
1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki
2. Zmienne losowe i ich rozkłady
3. Populacje i próby danych, estymacja parametrów
4. Testowanie hipotez statystycznych
5. Testy parametryczne (na przykładzie testu t )
6. Testy nieparametryczne
7. Korelacja i regresja liniowa i nieliniowa
8. Analiza wariancji
Copyright ©2010, Joanna Szyda
TESTY PARAMETRYCZNE
 weryfikacja hipotez dotyczących parametrów populacji
(średnia, wariancja)
 założenie: znany rozkład populacji (gł. cechy ilościowe
o rozkładzie normalnym)
 hipotezy dotyczące średniej: test t (duże próby – test
średniej standaryzowanej, z)
 hipotezy dotyczące wariancji: test F w analizie
wariancji i analizie regresji
Copyright ©2010, Joanna Szyda
TEST T
1. Zakres stosowalności
2. Dla pojedynczej próby
3. Dla dwu niezależnych prób
4. Dla dwu sparowanych prób
5. Test Duncana
Copyright ©2010, Joanna Szyda
ROZKŁAD t
 k 1
k 1



2

 2
x
2


1  
f x  
k 
k 
k  
2
x   ,
tk
E x   0
Var  x  
k
k 2
• Kształt zależny od stopni swobody
• Dla wielu stopni swobody zbliżony do rozkł. normalnego
Copyright ©2009, Joanna Szyda
ZAKRES STOSOWALNOŚCI TESTU T
1. Test parametryczny
2. Dane o charakterze ciągłym
3. Wartości w próbie danych – rozkład normalny
4. Porównywane próby danych – podobne
wariancje

POJEDYNCZA PRÓBA
TEST T – POJEDYNCZA PRÓBA
BMD
PRÓBA DANYCH
SEX
0.97
1
0.73
1
0.87
1
0.94
1
1.02
1
0.76
1
0.78
1
1.01
1
0.82
1
0.76
1
0.87
1
0.72
1
1. Badanie osteoporozy
2. Medical Research Council,
Cambridge
3. Gęstość kości [g/cm2] 40 zdrowych
osób dorosłych
W próbie:
x  0,85
  0,1040
…
0.91
2
1.02
2
0.87
2
n  40
Copyright ©2010, Joanna Szyda
TEST T – POJEDYNCZA PRÓBA
1. Określenie hipotez H0 i H1
H0: średnia gęstość kości w populacji wynosi 1.0 g/cm2
H1: średnia gęstość kości w populacji różni się od 1.0 g/cm2
H0:  = 1.0
H1:  ≠ 1.0
(test dwustronny)
2. Ustalenie poziomu istotności
MAX = 0.05
Copyright ©2010, Joanna Szyda
Pojedyncza próba, nieznana wariancja
3. Wybór i określenie rozkładu statystyki testowej
Statystyka
gdzie:
x
t
n
s
s – standardowe odchylenie w próbie danych
ma rozkład t – Studenta o k = n -1 stopniach
swobody
stopnie swobody (degrees of freedom):
wielkość określająca kształt rozkładu statystyki
testowej (testu) w zależności od liczby
obserwacji w próbie
Copyright ©2010, Joanna Szyda
TEST T – POJEDYNCZA PRÓBA
4. Obliczenie wartości testu
t
x  1.0
s x2
x  1,0 0,85  1,0


40  9,122
sx
0,1040
n
5. Obliczenie wartości t (lub odczyt t)
 T  0,000000000032312
( t0,05;40-1 = 2,0227 )
6. Decyzja
t < max
H0
H1
(|t| > t)
średnia gęstość kości w populacji różni się od 1.0 g/cm2
Copyright ©2010, Joanna Szyda

DWIE NIEZALEŻNE PRÓBY
TEST T – DWIE NIEZALEŻNE PRÓBY
PRÓBA DANYCH
BMD
SEX
0.97
1
0.73
1
0.87
1
0.94
1
1.02
1
0.76
1
0.78
1
1.01
1
0.82
1
0.76
1
0.87
1
0.72
1
…
0.91
2
1.02
2
0.87
2
1. Badanie osteoporozy
2. Medical Research Council,
Cambridge
3. Gęstość kości [g/cm2] 40 zdrowych
osób dorosłych
4. Wartości znane dla mężczyzn i
kobiet
x K  0,82
x M  0,88
n K  n M  20
Copyright ©2010, Joanna Szyda
TEST T – DWIE NIEZALEŻNE PRÓBY
1. Określenie hipotez H0 i H1
H0: średnia gęstość kości kobiet jest taka sama jak mężczyzn
H1: średnia gęstość kości kobiet jest różna niż mężczyzn
H0 :  K =  M
H1 :  K ≠  M
(test dwustronny)
2. Ustalenie poziomu istotności
MAX = 0.05
Copyright ©2010, Joanna Szyda
Dwie próby, nieznana wariancja
3. Wybór i określenie rozkładu statystyki testowej
Statystyka
gdzie s D 
x1  x 2
t 
sD
s12 s 22

n1 n2
s1, n1 – stand. odchylenie i liczebność w pierwszej
próbie danych;
s2, n2 – stand. odchylenie i liczebność w drugiej
próbie danych
ma rozkład t–Studenta o k = n1+n2 - 2 st. swob.
Copyright ©2010, Joanna Szyda
TEST T – DWIE NIEZALEŻNE PRÓBY
4. Obliczenie wartości statystyki testowej
t
t
xK  xM
s K2 s M2

nK nM
0,82  0,88
0,0122895 0,0076895

20
20
 1,8987
Copyright ©2010, Joanna Szyda
TEST T – DWIE NIEZALEŻNE PRÓBY
5. Obliczenie wartości t
 t  0.0652
6. Decyzja
t > max
H0
H1
Nie można odrzucić hipotezy zerowej!
TEST JEDNOSTRONNY: H0: K = M
H1: K < M
 t  0.0326
Decyzja ??
Copyright ©2010, Joanna Szyda
WNIOSKOWANIE STATYSTYCZNE
Omułek słodkowodny
Hyridella menziesi
n=30
25.0 ± 0.9 mg/g
[23.2 , 26.8]
H0: 1= 2
max=0,05
t = 1,84
n=30
22.9 ± 0.7 mg/g
[ 21.5 , 24.3 ]
H1: 1≠2 → T = 0,0709
H1: 1>2 → T = 0,0354
Wnioski?
Copyright ©2010, Joanna Szyda

DWIE SPAROWANE PRÓBY
(pary skorelowane)
TEST T – PARY SKORELOWANE
PRÓBA DANYCH
1. Badanie ciśnienia w gałce ocznej
Low CCT
High CCT
20.0
14.3
13.9
13.8
18.3
15.8
21.1
33.4
20.1
20.3
24.4
19.9
20.2
14.3
11.6
11.4
28.8
25.1
18.5
24.1
2. Ciśnienie w 2 gałkach tej samej
osoby
3. U każdego człowieka oko prawe i
lewe ma różną grubość rogówki →
podział oczu w parach pod tym
względem (low CCT i high CCT)
Copyright ©2010, Joanna Szyda
TEST T – PARY SKORELOWANE
1. Określenie hipotez H0 i H1
H0: ciśnienie w gałce ocznej nie zależy od grubości rogówki
H1: ciśnienie w gałce ocznej zależy od grubości rogówki
H0 :  L =  H
H1 :  L ≠  H
2. Ustalenie poziomu istotności
MAX = 0.05
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY
3. Wybór i określenie rozkładu statystyki testowej
Średnia arytmetyczna różnic
(Di ) w parach obserwacji
D
t
SD
N
D
 x
SD 
1i
i 1
 x 2i 
N
D

i 1
Standardowe odchylenie
różnic
N
 D
i 1
i
Błąd standardowy
średniej
N
S Di
N
S Di 
N
i
 D
N 1
2
Tak określona statystyka ma
rozkład t-Studenta o N-1
stopniach swobody
(N – liczba par!)
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY
4. Obliczenie wartości statystyki
N
D
 x
1i
i 1
 x 2i 
N
 D
N
S Di 
SD 
i
i 1

D

2
N 1
S Di
N

5,6589
10
4,5
 0,45
10

288.21
 5,6589
10  1
 1,7895
D
0,45
t

 0,25
S D 1,7895
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY
5. Obliczenie wartości t
 t  0.8082
6. Decyzja
t > max
H0
H1
ciśnienie w gałce ocznej nie zależy od grubości rogówki
Copyright ©2010, Joanna Szyda

KILKA PRÓB - TEST DUNCANA
TEST T – KILKA PRÓB, TEST DUNCANA
PRÓBA DANYCH
1. Badanie frekwencji na zajęciach ze statystyki w USA
2. 4 grupy - atrakcyjność wykładowcy
3. Frekwencja na zajęciach w semestrze
poziom atrakcyjności
0
1
2
4
15
20
10
30
10
13
24
22
12
10
29
29
10
22
12
20
...
...
...
...
średnia
11.13
17.88
20.25
24.38
Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
1. Próby uszeregowane od najniższej do najwyższej średniej
2. Sekwencja kilku testów t dla niezależnych prób
3. Zmodyfikowany poziom błędu istotności MAX
MAX* = 1 - (1 - MAX)n-1
0
1
2
liczba prób
 pojedynczego
testu t
* = 1 - (1 - 0.2722)2-1 = 0.2722
3
H0: 1 = 2
H1: 1 ≠ 2
Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
1. Próby uszeregowane od najniższej do najwyższej średniej
2. Sekwencja kilku testów t dla niezależnych prób
3. Zmodyfikowany poziom błędu istotności MAX
MAX* = 1 - (1 - MAX)n-1
0
1
2
* = 1 - (1 - 0.00000096)4-1 = 0.0000029
3
H0: 0 = 1 = 2 = 3
H1: 0 ≠ 1 ≠ 2 ≠ 3
Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
1. Próby uszeregowane od najniższej do najwyższej
średniej
2. Sekwencja kilku testów t dla niezależnych prób
3. Zmodyfikowany poziom błędu istotności MAX
MAX* = 1 - (1 - MAX)n-1
0
1
* = 1 - (1 - 0.0002)3-1 = 0.0004
2
* = 1 - (1 - 0.0048)3-1 = 0.0097
3
H0: 0 = 1 = 2
H0: 1 = 2 = 3
H1: 0 ≠ 1 ≠ 2
H1: 1 ≠ 2 ≠ 3
Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
1. Próby uszeregowane od najniższej do najwyższej
średniej
2. Sekwencja kilku testów t dla niezależnych prób
3. Zmodyfikowany poziom błędu istotności MAX
MAX* = 1 - (1 - MAX)n-1
0
1
2
3
* = 1 - (1 - 0.0036)2-1 = 0.0036
* = 1 - (1 - 0.0625)2-1 = 0.0625
H0: 0 = 1
H1: 0 ≠ 1
H0: 2 = 3
H1: 2 ≠ 3
Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
0
1
A
2
A
3
B
B
1. Atrakcyjność wykładowcy wpływa na frekwencję
2. Frekwencja na zajęciach nie różni się istotnie (=0.05)
w grupach 1 i 2 oraz 2 i 3
Copyright ©2010, Joanna Szyda
Test t
1. Zakres stosowalności
2. Dla pojedynczej próby
3. Dla dwu niezależnych prób
4. Dla dwu sparowanych prób
5. Test Duncana

Podobne dokumenty