N - Katedra Genetyki i Ogólnej Hodowli Zwierząt

Transkrypt

N - Katedra Genetyki i Ogólnej Hodowli Zwierząt
METODY BADAŃ NA
ZWIERZĘTACH
ze STATYSTYKĄ
wykład 1
Wanda Olech
Katedra Genetyki i Ogólnej Hodowli Zwierząt
Plan wykładów
Data
4.III
Wstęp i przypomnienie rachunku prawdopodobieństwa
11.III
Zmienna losowa jednowymiarowa
18.III
Rozkłady zm. losowych (normalny, dwumianowy, Poissona, dwupunktowy,
geometryczny)
25.III
Twierdzenia graniczne i rozkłady statystyk z próby
01.IV
Wnioskowanie (przedziały ufności, weryfikacja hipotez)
Hipotezy nieparametryczne – zgodności, losowości
Zmienna losowa dwuwymiarowa – zależność stochastyczna i korelacyjna
Ocena zależności, korelacja
8.IV
15.IV
Analiza regresji
22.IV
Analiza wariancji jednoczynnikowa
29.IV
06.V
13.V
20.V
27.V
Modele liniowe – układy wieloczynnikowe, interakcja
Nieparametryczne metody wnioskowania
Zasady prowadzenia doświadczeń
Błędy popełniane w trakcie prowadzenia doświadczeń,
Optymalna wielkość próby
Zasady prezentacji wyników
03.VI
Przykłady doświadczeń w badaniach na zwierzętach
10.VI
Powtórzenie/uzupełnienie
„Statystyka”
Pierwotnie oznaczała stan rzeczy (od status) i do
XVIII wieku używana dla określenia zbioru
wiadomości o państwie
„Statystyka” obecnie:
Zespół informacji liczbowych dotyczących
celowo wybranej grupy lub kategorii
zjawisk (statystyka produkcji, statystyka
rolnictwa itp.)
Dyscyplina naukowa traktująca o metodach
(narzędziach) liczbowego opisu i
wnioskowania o prawidłowościach
występujących w procesach masowych
Przedmiotem badań statystyki:
są zjawiska masowe występujące w przyrodzie lub
społeczeństwie a dające się mierzyć np. produkcja
wyrobów, zużycie materiałów, zatrudnienie,
zjawiska demograficzne, tempo wzrostu itd.
Traktując te zjawiska jako losowe można zauważyć
działanie przyczyn powodujących pewne
prawidłowości. Przyczyny mogą być główne lub
uboczne, ale ich działanie można zauważyć jedynie
w większej masie przypadków (zjawiska masowe).
Badania służące wyjaśnianiu tych przyczyn to
badania statystyczne.
Przedmiotem badań statystyki:
zjawiska losowe -
badane poprzez doświadczenie
Doświadczenie losowe to takie, które może być
powtarzane w tych samych (zasadniczo) warunkach
ale jego wynik nie może być przewidziany w sposób
pewny oraz zbiór wszystkich możliwych wyników
jest znany i może być opisany przed
przeprowadzeniem doświadczenia.
.
U podstaw współczesnej statystyki leży rachunek
prawdopodobieństwa
Rachunek
prawdopodobieństwa
podstawowe pojęcia
• zdarzenie elementarne (pojedynczy wynik doświadczenia
losowego)
• zbiór wszystkich zdarzeń elementarnych (zbiór wszystkich
wyników doświadczenia losowego) to
zdarzenie pewne ()
Zbiór  może być skończony lub nieskończony, przeliczalny lub
nieprzeliczalny
• zdarzenie losowe (oznaczane np. przez A, B) jest
podzbiorem 
• Dopełnieniem zdarzenia A nazywamy zdarzenie A’= - A
• zdarzenie niemożliwe, to zbiór pusty 
podstawowe pojęcia
Zdarzenie elementarne
A
.
. .
. : .
. .
:

A  B = suma zdarzeń losowych
(alternatywa)
A  B = iloczyn zdarzeń
(koniunkcja)
A i B są zdarzeniami wykluczającymi gdy
AB=
BA
A
B
A  B = suma zdarzeń losowych
(alternatywa)
A
B
A  B = iloczyn zdarzeń
(koniunkcja)
A
B
Definicje prawdopodobieństwa
Definicja Kołmogorowa
Jeżeli A   , to P(A) jest liczbą rzeczywistą spełniająca
następujące aksjomaty:
P(A)  0
P(AB) = P(A) + P(B) gdy B   i A  B = 
P() = 1
Definicja Kołmogorowa
z powyższego wynikają własności:
P() = 0
jeśli A  B to P(A)  P(B)
P(A’) = 1 - P(A) gdzie A’ =  - A
0  P(A)  1
P(AB) = P(A) + P(B) - P(AB)
Klasyczna definicja
prawdopodobieństwa Laplace’a
n
P( A) 
N
n - liczba zdarzeń sprzyjających,
N - liczba wszystkich zdarzeń
lub
P( A) 
A

gdzie - miara , A- miara A
Kombinatoryka
to metody zliczania (określania liczby) wszystkich zdarzeń
oraz zdarzeń sprzyjających
dwa sposoby przedstawiania wyników losowania:
-istotna jest kolejność losowanych elementów – wariacja
istotna jest liczba pobranych elementów - kombinacja
Kombinatoryka
wariacja ze zwracaniem - czyli wylosowanie k
elementów z puli n-elementowej i
rozmieszczenie ich na k miejscach
W n
k
k
n
n=6 ; k =2 W=62
Kombinatoryka
wariacja bez zwracania - losowanie za każdym
kolejnym razem ze zmniejszonej o jeden puli
V
k
n
n!

(n  k )!
n=6 ; k =2 V=6!/4!=30
Kombinatoryka
- wariacja bez zwracania
gdy k = n (losowane wszystkie elementy i
ustawiane w kolejności - permutacja
k!
V n  (n  n)!  k !
k
n=4 ; k =4 V=4!=24
Kombinatoryka
kombinacja - wybieranie k-elementowego
zbioru z n-elementowego w jednym
 n
losowaniu
k
C
n=6 ; k =3 C=6!/(3!3!)=20
n
n!
  
 k  k ! (n  k )!
Przykład
W klatce jest 5 białych i 2 czarne myszy. Obliczyć
prawdopodobieństwo, że dwie myszy, które pierwsze
wyjdą w klatki będę czarne.
 7
7!
7!
76
    


 21
2
 2  2!(7  2)! 2!5!

 2  5
2!
5!
A       

1
 2   0  2!0! 0!5!
P( A)  1
21
Przykład
Autobus wiozący 6 pasażerów może się zatrzymać na
4 przystankach. Jakie jest prawdopodobieństwo, że
wszyscy pasażerowie wysiądą na jednym przystanku.
  4  2048
6
A4
P( A)  4
2048
1
512
Przykład
W stadzie są 4 białe gęsi i 2 siodłate. Jakie jest
prawdopodobieństwo, że siodłata gęś będzie szła
pierwsza, gdy ptaki będą szły gęsiego.

  6! 720
 2
2!
A     5!
 5! 240
1!1!
1
P( A)  240
720
1
3
Niezależność
zdarzenia A i B są niezależne gdy
P( A  B)  P( A)  P( B)
P(A) = 50/100 = 0, 5
P(B) = 30/100 = 0,3
P(AB)=15/100 =
0,15 = 0,5 x 0,3
Prawdopodobieństwo warunkowe
prawdopodobieństwo zdarzenia A pod warunkiem, że
zajdzie zdarzenie W
P( A  W )
P( A / W ) 
P(W )
P(A/W)=0,15/0,3=0,5
P(A/W)=0,05/0,3=1/6
Prawdopodobieństwo całkowite
P( A)  P( A / A1 )  P( A1 )  P( A / A2 )  P( A2 )... P( A / An )  P( An )
Gdzie
A1  A2 ... An  
P(A)=15/30 0,3 + 4/20  0,2 +
+ 12/40  0,4 + 5/10  0,1 =
= 0,15 + 0,04 + 0,12+ 0,05=
= 0,36
A
A
Przykład
Puszki do sklepu są dostarczane przez trzech
producentów w proporcji 1:3:6. Wadliwość puszek
wynosi 0,1; 0,04; 0,03.
0,90
+
0,1
0,3
I
II
III
0,10
0,96 0,04
0,97 0,03
- +
0,6
- +
P(Ai)
-
P(C/Ai)
P(-)=0,1x0,10+0,3x0,04+0,6x0,03 = 0,01+0,012+0,018 = 0,04
wzór Bayes’a na wielkość
prawdopodobieństwa a’posteriori
P( Ai / A) 
P( A / Ai )  P( Ai )
n
 P( A / A )  P( A )
i 1
i
i
A
A A
P(A3/A)= (12/40  0,4)/0,36=0,12/0,35=1/3
Przykład
Puszki do sklepu są dostarczane przez trzech
producentów w proporcji 1:3:6. Wadliwość puszek
wynosi 0,1; 0,04; 0,03.
0,90
+
0,1
0,3
I
II
III
0,10
0,96 0,04
0,97 0,03
- +
0,6
- +
P(Ai)
-
P(III/-)=0,6x0,03 / 0,04 = 0,018/0,040 = 9/20
P(C/Ai)
Przykład
W populacji są osoby o grupie krwi A, B, AB i 0 w
proporcji 4:2:3:1. Szansa reakcji na lek wynosi
odpowiednio 0,4; 0,1; 0,2; 0,6.
Obliczyć prawdopodobieństwo, że osoba wrażliwa na
lek ma grupę krwi AB.
0,2  0,3
P( AB / W ) 

0,4  0,4  0,1  0,2  0,2  0,3  0,6  0,1
0,06
0,06


 0,20
0,16  0,02  0,06  0,06 0,30
Przykład
Wiedząc, że P(B) = 2/3, P(A/B) = 1/4, obliczyć P(AB)
P( A  B )
P( A / B ) 
P( B )
P(AB) = 1/6
Wiedząc, że P(AB) = 1/6, P(A/B) = 1/3, P(B/A) = 1/2,
obliczyć P(AB)
P(A) = 1/3 ; P(B) = 1/2 ; P(AB) = 1/3 + 1/2 - 1/6 = 2/3
Wiedząc, że P(B) = P(B’), oraz P(A/B) + P(A/B’) = 2/3,
obliczyć P(A)
P( A)  P( A / B)  P( B)  P( A / B' )  P( B' )
P(B) = P(B’) = 1/2 ; P(A) = 1/3
Pica pica