STATYSTYKA MATEMATYCZNA

Transkrypt

STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA
1. Wykład wstępny
2. Teoria prawdopodobieństwa i elementy kombinatoryki
3. Zmienne losowe
4. Populacje i próby danych
5. Testowanie hipotez i estymacja parametrów
6. Test t
7. Test
2
8. Test F
9. Testy nieparametryczne
10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
11. Korelacja
12. Regresja liniowa i nieliniowa
13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
14. Analiza wariancji
15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP
1. Zmienna losowa
2. Funkcja gęstości prawdopodobieństwa
3. Dystrybuanta
4. Statystyki opisowe
5. Przykładowe rozkłady
Copyright ©2009, Joanna Szyda
ZMIENNA LOSOWA
ZMIENNA LOSOWA
ZMIENNA
LOSOWA
→
→
random variable
funkcja, przyjmuje różne wartości
wartości są określone przez przypadek
ZMIENNA LOSOWA
PRZYJĘTA WARTOŚĆ (REALIZACJA)
→
→
X
x
ZMIENNA LOSOWA DYSKRETNA→ wartości przeliczalne
 pomiar w skali nominalnej (brak uporządkowania) np.?
 pomiar w skali porządkowej (uporządkowanej) np.?
ZMIENNA LOSOWA CIĄGŁA
→ dowolne wartości
Copyright ©2013, Joanna Szyda
ZMIENNA LOSOWA
ZMIENNA LOSOWA
DYSKRETNA
• liczba szczeniąt w miocie
X
• X=x czyli X=7
• X { 1, 2, 3, 4, 5, 6, 7, 8, 9 }
random variable
ZMIENNA LOSOWA
CIĄGŁA
• wysokość konia w kłębie
W
• W=w czyli W=167
• W [ 150, 190 ]
Copyright ©2009, Joanna Szyda
FUNKCJA GĘSTOŚCI
PRAWDOPODOBIEŃSTWA
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA
probability (density) function
ZMIENNA LOSOWA
DYSKRETNA
• funkcja
prawdopodobieństwa
ZMIENNA LOSOWA
CIĄGŁA
• funkcja gęstości
prawdopodobieństwa
• jakie jest prawdopodobieńs- • jakie jest prawdopodobieństwo uzyskania danej
two uzyskania wartości z
wartości
danego przedziału
•X
{ 1, 2, 3, 4, 5, 6, 7, 8, 9 }
•W
[ 150, 190 ]
• P(X=xi)
• f(w)
• urodzenie 5 szczeniąt
• wys. w kłębie
• P(X=5)
•
165
[ 160, 165 ]
f w dw 0.12
160
Copyright ©2009, Joanna Szyda
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA
probability (density) function
ZMIENNA LOSOWA
DYSKRETNA
ZMIENNA LOSOWA
CIĄGŁA
9
PX
0.25
xi
1
f w dw 1
i 1
f (w)
P(X=x)
0.20
0.15
0.10
0.05
0.00
1
2
3
4
5
6
7
liczba szczeniąt
8
x
9
wysokość w kłębie
w
Copyright ©2014, Joanna Szyda
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA 2
ZMIENNYCH
ZMIENNA LOSOWA
CIĄGŁA
P(x,y)
f (w,z)
ZMIENNA LOSOWA
DYSKRETNA
w
y
x
z
prawdopodobieństwo
łączne, warunkowe
Copyright ©2009, Joanna Szyda
DYSTRYBUANTA
DYSTRYBUANTA
cumulative distribution function
ZMIENNA LOSOWA
DYSKRETNA
• dystrybuanta
ZMIENNA LOSOWA
CIĄGŁA
• dystrybuanta
• jakie jest prawdopodobieńs- • jakie jest prawdopodobieństwo uzyskania wartości
two uzyskania wartości
mniejszej lub równej x
mniejszej lub równej w
•X
{ 1, 2, 3, 4, 5, 6, 7, 8, 9 }
•W
[ 150, 190 ]
w
• F(x) = P(X x)
•F
• urodzenie maks 5 szczeniąt
• max wys. w kłębie 170
• F(5)=P(X 5)=0.40
•F
w
f w dw
170
170
f w dw 0.69
Copyright ©2009, Joanna Szyda
DYSTRYBUANTA
cumulative distribution function
ZMIENNA LOSOWA
DYSKRETNA
9
1.20
PX
1.00
xi
F w
1
1
i 1
0.80
F (w)
P(X x)
ZMIENNA LOSOWA
CIĄGŁA
0.60
0.40
0.20
0.00
1
2
3
4
5
6
7
8
maks. liczba szczeniąt
9
x
wysokość w kłębie
w
Copyright ©2013, Joanna Szyda
DYSTRYBUANTA
cumulative distribution function
ZMIENNA LOSOWA DYSKRETNA
• pr. urodzenia 1 szczeniaka:
F(1)=P(X 1)=0.03
• pr. urodzenia maks. 3
szczeniaków:
F(3)=P(X 3)=0.03+0.04+0.06
• pr. urodzenia 4 lub 5
szczeniaków:
F(5)-F(3)
1.00
P(X x)
• pr. urodzenia maks. 9
szczeniaków:
F(9)=P(X 9)=1
1.20
0.80
0.60
0.40
0.20
0.00
1
2
3
4
5
6
7
8
maks. liczba szczeniąt
9
x
Copyright ©2013, Joanna Szyda
DYSTRYBUANTA
cumulative distribution function
• pr. wystąpienia osobnika o
wys. w kłębie maks. 190 cm:
F(190)=P(W 190)=1.00
• pr. wystąpienia osobnika o
wys. w kłębie 160-170 cm:
F(170)-F(160)=0.32
• pr. wystąpienia osobnika o
wys. w kłębie pow. 165 cm:
1-F(165)=0.62
F (w)
ZMIENNA LOSOWA CIĄGŁA
• pr. wystąpienia osobnika o
wys. w kłębie maks. 150 cm:
F(150)=P(W 150)=0.11
wysokość w kłębie
w
Copyright ©2009, Joanna Szyda
STATYSTYKI OPISOWE
WARTOŚĆ OCZEKIWANA I WARIANCJA
wartość oczekiwana
wariancja
• PRZEBIEG FUNKCJI
• KSZTAŁT ROZKŁADU
(GĘSTOŚCI)
PRAWDOPODOBIEŃSTWA
mediana
modalna
Copyright ©2009, Joanna Szyda
WARTOŚĆ OCZEKIWANA
expected value
Wartość oczekiwana (średnia)
→
E(X)
→
liczba, wokół której skupiają się poszczególne
wartości zmiennej losowej
→
wartość średnia
ZMIENNA LOSOWA
DYSKRETNA
• E(X)=5.72 szczeniąt - w
miotach liczba urodzonych
szczeniąt jest bliska 5
ZMIENNA LOSOWA
CIĄGŁA
• E(W)=167 cm - większość
koni ma wys. w kłębie ok.
167 cm
9
•
E X
pi xi
•E
W
wf w dw
i 1
• E(X)=0.03*1 + 0.04*2 + 0.06*3
+ 0.10*4 + 0.17*5 + 0.22*6 +
0.23*7 + 0.10*8 + 0.05*9
Copyright ©2011, Joanna Szyda
WARIANCJA
variance
Wariancja
→
→
V(X), Var(X), X2
liczba określająca rozproszenie wartości zmiennej
wokół wartości oczekiwanej
→
V X ,
X , s.d . X
ZMIENNA LOSOWA
DYSKRETNA
V X
EX
E X
2
odchylenie standardowe
ZMIENNA LOSOWA
CIĄGŁA
VW
EW
EW
2
Copyright ©2009, Joanna Szyda
ZMIENNA STANDARYZOWANA
• Standaryzacja zmiennej X
stara zmienna
nowa zmienna
Z
X
E X
V X
• Z i X maja taki sam typ rozkładu
• E(Z) = 0
• Var(Z) = 1
Copyright ©2009, Joanna Szyda
MEDIANA
median
~
Mediana  x
 liczba, która dzieli funkcję gęstości na połowy
 (N+1)/2
 mniej zależna od odstających obserwacji niż śr.
ZM. LOSOWA DYSKRETNA
ZM. LOSOWA CIĄGŁA
• P(X m) ½ i P(X m) ½ • F(w)=½
0.25
f (w)
P(X=x)
0.20
0.15
0.10
0.05
0.00
1
2
3
4
5
6
7
liczba szczeniąt
8
x
9
wysokość w kłębie
w
Copyright ©2013 Joanna Szyda
MODALNA
mode
 liczba, która występuje najczęściej
 może istnieć więcej niż jedna modalna
 może nie być wartości modalnej
Modalna
ZM. LOSOWA DYSKRETNA
ZM. LOSOWA CIĄGŁA
• wartość x o najwyższym
• wartość w dla której f(w)
prawdopodobieństwie
jest najwyższe
0.25
f (w)
P(X=x)
0.20
0.15
0.10
0.05
0.00
1
2
3
4
5
6
7
liczba szczeniąt
8
x
9
wysokość w kłębie
w
Copyright ©2012, Joanna Szyda
STATYSTYKI OPISOWE
w. oczekiwana
modalna
mediana
rozkład symetryczny
1
2
3
4
5
6
7
modalna
mediana
w. oczekiwana
rozkład skośny
1
2
3
4
5
6
7
Copyright ©2011, Joanna Szyda
STATYSTYKI OPISOWE
1
2
3
4
5
6
7
duża wariancja
1
2
3
4
5
6
7
mała wariancja
Copyright ©2009, Joanna Szyda
STATYSTYKI OPISOWE
5 number data summary
Copyright ©2013, Joanna Szyda
STATYSTYKI OPISOWE
wykres pudełkowy box plot
maksimum
3 kwartyl:
75% danych
mediana:
50% danych
1 kwartyl:
25% danych
minimum
obserwacja odstająca
Copyright ©2013, Joanna Szyda
STATYSTYKI OPISOWE
https://www.khanacademy.org/math/probability/randomvariables-topic/random_variables_prob_dist/v/probabilitydensity-functions
Copyright ©2014, Joanna Szyda
PRZYKŁADOWE ROZKŁADY
ROZKŁAD NORMALNY
1
e
2
f x
x
N
1 x
2
2
2
,
,
2
E(x) = mediana = modalna
• Bardzo często spotykany w danych biologicznych
• Np. wydajność mleka
• Np. masa ciała prosięcia w 4 tygodniu życia
Copyright ©2009, Joanna Szyda
ROZKŁAD t Studenta
William Gosset
pseudonim „student”
k 1
2
k
k
2
f x
x
tk
E x
Var x
x2
1
k
k 1
2
,
0
k
k 2
• Kształt zależny od stopni swobody
• Dla wielu stopni swobody zbliżony do rozkładu normalnego
Copyright ©2014, Joanna Szyda
ROZKŁAD
2
x
f x
2
x (0,
k
1
2
k
2
k
2
e
x
2
]
2
k
E x
k
Var x
2k
• Skośny
• Kształt zależny od liczby stopni swobody
Copyright ©2009, Joanna Szyda
ROZKŁAD DWUMIANOWY
f x
n
x
x
p 1 p
n x
x [0, n]
E x
Var x
np
np 1 p
• Liczba "sukcesów" (x) w n próbach
• Np. liczba urodzonych ogierków w 10 wyźrebieniach
• Dla dużej liczby prób kształt zbliżony do rozkładu
normalnego
Copyright ©2014, Joanna Szyda
ROZKŁAD POISSONA
x
f x
x!
x [0, n]
E x
e
Var x
• Liczba "sukcesów" (x) w danym przedziale czasu
• np. liczba odchowanych prosiąt w 2 tyg. po urodzeniu
• Przykład: http://www.youtube.com/watch?v=Fk02TW6reiA
Copyright ©2013, Joanna Szyda
ZMIENNE LOSOWE
E(X)
V(X)
Copyright ©2011, Joanna Szyda

Podobne dokumenty