STATYSTYKA MATEMATYCZNA
Transkrypt
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test 2 8. Test F 9. Testy nieparametryczne 10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11. Korelacja 12. Regresja liniowa i nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja WSTĘP 1. Zmienna losowa 2. Funkcja gęstości prawdopodobieństwa 3. Dystrybuanta 4. Statystyki opisowe 5. Przykładowe rozkłady Copyright ©2009, Joanna Szyda ZMIENNA LOSOWA ZMIENNA LOSOWA ZMIENNA LOSOWA → → random variable funkcja, przyjmuje różne wartości wartości są określone przez przypadek ZMIENNA LOSOWA PRZYJĘTA WARTOŚĆ (REALIZACJA) → → X x ZMIENNA LOSOWA DYSKRETNA→ wartości przeliczalne pomiar w skali nominalnej (brak uporządkowania) np.? pomiar w skali porządkowej (uporządkowanej) np.? ZMIENNA LOSOWA CIĄGŁA → dowolne wartości Copyright ©2013, Joanna Szyda ZMIENNA LOSOWA ZMIENNA LOSOWA DYSKRETNA • liczba szczeniąt w miocie X • X=x czyli X=7 • X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } random variable ZMIENNA LOSOWA CIĄGŁA • wysokość konia w kłębie W • W=w czyli W=167 • W [ 150, 190 ] Copyright ©2009, Joanna Szyda FUNKCJA GĘSTOŚCI PRAWDOPODOBIEŃSTWA FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function ZMIENNA LOSOWA DYSKRETNA • funkcja prawdopodobieństwa ZMIENNA LOSOWA CIĄGŁA • funkcja gęstości prawdopodobieństwa • jakie jest prawdopodobieńs- • jakie jest prawdopodobieństwo uzyskania danej two uzyskania wartości z wartości danego przedziału •X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } •W [ 150, 190 ] • P(X=xi) • f(w) • urodzenie 5 szczeniąt • wys. w kłębie • P(X=5) • 165 [ 160, 165 ] f w dw 0.12 160 Copyright ©2009, Joanna Szyda FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA 9 PX 0.25 xi 1 f w dw 1 i 1 f (w) P(X=x) 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 liczba szczeniąt 8 x 9 wysokość w kłębie w Copyright ©2014, Joanna Szyda FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA 2 ZMIENNYCH ZMIENNA LOSOWA CIĄGŁA P(x,y) f (w,z) ZMIENNA LOSOWA DYSKRETNA w y x z prawdopodobieństwo łączne, warunkowe Copyright ©2009, Joanna Szyda DYSTRYBUANTA DYSTRYBUANTA cumulative distribution function ZMIENNA LOSOWA DYSKRETNA • dystrybuanta ZMIENNA LOSOWA CIĄGŁA • dystrybuanta • jakie jest prawdopodobieńs- • jakie jest prawdopodobieństwo uzyskania wartości two uzyskania wartości mniejszej lub równej x mniejszej lub równej w •X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } •W [ 150, 190 ] w • F(x) = P(X x) •F • urodzenie maks 5 szczeniąt • max wys. w kłębie 170 • F(5)=P(X 5)=0.40 •F w f w dw 170 170 f w dw 0.69 Copyright ©2009, Joanna Szyda DYSTRYBUANTA cumulative distribution function ZMIENNA LOSOWA DYSKRETNA 9 1.20 PX 1.00 xi F w 1 1 i 1 0.80 F (w) P(X x) ZMIENNA LOSOWA CIĄGŁA 0.60 0.40 0.20 0.00 1 2 3 4 5 6 7 8 maks. liczba szczeniąt 9 x wysokość w kłębie w Copyright ©2013, Joanna Szyda DYSTRYBUANTA cumulative distribution function ZMIENNA LOSOWA DYSKRETNA • pr. urodzenia 1 szczeniaka: F(1)=P(X 1)=0.03 • pr. urodzenia maks. 3 szczeniaków: F(3)=P(X 3)=0.03+0.04+0.06 • pr. urodzenia 4 lub 5 szczeniaków: F(5)-F(3) 1.00 P(X x) • pr. urodzenia maks. 9 szczeniaków: F(9)=P(X 9)=1 1.20 0.80 0.60 0.40 0.20 0.00 1 2 3 4 5 6 7 8 maks. liczba szczeniąt 9 x Copyright ©2013, Joanna Szyda DYSTRYBUANTA cumulative distribution function • pr. wystąpienia osobnika o wys. w kłębie maks. 190 cm: F(190)=P(W 190)=1.00 • pr. wystąpienia osobnika o wys. w kłębie 160-170 cm: F(170)-F(160)=0.32 • pr. wystąpienia osobnika o wys. w kłębie pow. 165 cm: 1-F(165)=0.62 F (w) ZMIENNA LOSOWA CIĄGŁA • pr. wystąpienia osobnika o wys. w kłębie maks. 150 cm: F(150)=P(W 150)=0.11 wysokość w kłębie w Copyright ©2009, Joanna Szyda STATYSTYKI OPISOWE WARTOŚĆ OCZEKIWANA I WARIANCJA wartość oczekiwana wariancja • PRZEBIEG FUNKCJI • KSZTAŁT ROZKŁADU (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA mediana modalna Copyright ©2009, Joanna Szyda WARTOŚĆ OCZEKIWANA expected value Wartość oczekiwana (średnia) → E(X) → liczba, wokół której skupiają się poszczególne wartości zmiennej losowej → wartość średnia ZMIENNA LOSOWA DYSKRETNA • E(X)=5.72 szczeniąt - w miotach liczba urodzonych szczeniąt jest bliska 5 ZMIENNA LOSOWA CIĄGŁA • E(W)=167 cm - większość koni ma wys. w kłębie ok. 167 cm 9 • E X pi xi •E W wf w dw i 1 • E(X)=0.03*1 + 0.04*2 + 0.06*3 + 0.10*4 + 0.17*5 + 0.22*6 + 0.23*7 + 0.10*8 + 0.05*9 Copyright ©2011, Joanna Szyda WARIANCJA variance Wariancja → → V(X), Var(X), X2 liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej → V X , X , s.d . X ZMIENNA LOSOWA DYSKRETNA V X EX E X 2 odchylenie standardowe ZMIENNA LOSOWA CIĄGŁA VW EW EW 2 Copyright ©2009, Joanna Szyda ZMIENNA STANDARYZOWANA • Standaryzacja zmiennej X stara zmienna nowa zmienna Z X E X V X • Z i X maja taki sam typ rozkładu • E(Z) = 0 • Var(Z) = 1 Copyright ©2009, Joanna Szyda MEDIANA median ~ Mediana x liczba, która dzieli funkcję gęstości na połowy (N+1)/2 mniej zależna od odstających obserwacji niż śr. ZM. LOSOWA DYSKRETNA ZM. LOSOWA CIĄGŁA • P(X m) ½ i P(X m) ½ • F(w)=½ 0.25 f (w) P(X=x) 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 liczba szczeniąt 8 x 9 wysokość w kłębie w Copyright ©2013 Joanna Szyda MODALNA mode liczba, która występuje najczęściej może istnieć więcej niż jedna modalna może nie być wartości modalnej Modalna ZM. LOSOWA DYSKRETNA ZM. LOSOWA CIĄGŁA • wartość x o najwyższym • wartość w dla której f(w) prawdopodobieństwie jest najwyższe 0.25 f (w) P(X=x) 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 liczba szczeniąt 8 x 9 wysokość w kłębie w Copyright ©2012, Joanna Szyda STATYSTYKI OPISOWE w. oczekiwana modalna mediana rozkład symetryczny 1 2 3 4 5 6 7 modalna mediana w. oczekiwana rozkład skośny 1 2 3 4 5 6 7 Copyright ©2011, Joanna Szyda STATYSTYKI OPISOWE 1 2 3 4 5 6 7 duża wariancja 1 2 3 4 5 6 7 mała wariancja Copyright ©2009, Joanna Szyda STATYSTYKI OPISOWE 5 number data summary Copyright ©2013, Joanna Szyda STATYSTYKI OPISOWE wykres pudełkowy box plot maksimum 3 kwartyl: 75% danych mediana: 50% danych 1 kwartyl: 25% danych minimum obserwacja odstająca Copyright ©2013, Joanna Szyda STATYSTYKI OPISOWE https://www.khanacademy.org/math/probability/randomvariables-topic/random_variables_prob_dist/v/probabilitydensity-functions Copyright ©2014, Joanna Szyda PRZYKŁADOWE ROZKŁADY ROZKŁAD NORMALNY 1 e 2 f x x N 1 x 2 2 2 , , 2 E(x) = mediana = modalna • Bardzo często spotykany w danych biologicznych • Np. wydajność mleka • Np. masa ciała prosięcia w 4 tygodniu życia Copyright ©2009, Joanna Szyda ROZKŁAD t Studenta William Gosset pseudonim „student” k 1 2 k k 2 f x x tk E x Var x x2 1 k k 1 2 , 0 k k 2 • Kształt zależny od stopni swobody • Dla wielu stopni swobody zbliżony do rozkładu normalnego Copyright ©2014, Joanna Szyda ROZKŁAD 2 x f x 2 x (0, k 1 2 k 2 k 2 e x 2 ] 2 k E x k Var x 2k • Skośny • Kształt zależny od liczby stopni swobody Copyright ©2009, Joanna Szyda ROZKŁAD DWUMIANOWY f x n x x p 1 p n x x [0, n] E x Var x np np 1 p • Liczba "sukcesów" (x) w n próbach • Np. liczba urodzonych ogierków w 10 wyźrebieniach • Dla dużej liczby prób kształt zbliżony do rozkładu normalnego Copyright ©2014, Joanna Szyda ROZKŁAD POISSONA x f x x! x [0, n] E x e Var x • Liczba "sukcesów" (x) w danym przedziale czasu • np. liczba odchowanych prosiąt w 2 tyg. po urodzeniu • Przykład: http://www.youtube.com/watch?v=Fk02TW6reiA Copyright ©2013, Joanna Szyda ZMIENNE LOSOWE E(X) V(X) Copyright ©2011, Joanna Szyda