x - HIRG - Politechnika Warszawska

Transkrypt

x - HIRG - Politechnika Warszawska
Komputerowa Analiza
Danych Doświadczalnych
Prowadząca:
dr inż. Hanna Zbroszczyk
e-mail:
e-mail [email protected]
tel:
tel +48 22 234 58 51
www: http://hirg.if.pw.edu.pl/~gos/students/kadd
Politechnika Warszawska
Wydział Fizyki
Pok. 117b (wejście przez 115)
1
Zmienne losowe
Jeśli w tych samych warunkach eksperymentalnych dokonujemy n pomiarów danej wielkości
i dostajmy różne wyniki, to znaczy, że są one obarczone niepewnościami przypadkowymi,
traktujemy je jako zdarzenia losowe.
Zdarzeniu losowemu przypisywana jest określona wartość zmiennej losowej.
Typy zmiennych losowych:
- jednowymiarowe,
- dwuwymiarowe,
-...
- n-wymiarowe
Rodzaje zmiennych losowych:
- skokowe (dyskretne),
- ciągłe.
Zmienne losowe będziemy oznaczali znakami: x,y,..
2
Dystrybuanta zmiennej losowej
Dana jest zmienna losowa x oraz liczba x, która może przybierać dowolną wartość.
Prawdopodobieństwo zajścia zdarzenia x<x jest funkcją x i nosi nazwę
dystrybuanty zmiennej losowej x.
F  x=P  xx 
Jeśli x może przybierać tylko skończoną liczbę wartości, to dystrybuanta jest funkcją skokową.
Dystrubuanta dla zmiennej losowej typu skokowego:
F x=P  xx =∑ki=1 P i
Dystrybuanta dla zmiennej losowej typu ciągłego, gdzie f(x) jest funkcją gęstości:
x
F  x=P  xx =∫−∞
f x 'dx '
3
Pojęcie prawdopodobieństwa
Własności dystrybuanty:
1) funkcja niemalejąca
2) lim x −∞ Fx =0
oraz lim x  ∞ F  x=1
3) w przypadku, kiedy dystrubuanta F(x) jest ciągła oraz ma 1-szą pochodną:
x
F 'x = dF
=f x 
dx
f(x) jest funkcją gęstości prawdopodobieństwa zmiennej losowej x
f(x) jest miarą prawdopodobieństwa zajścia zdarzenia xxxdx
Prawdopodobieństwo:
a
P xa=Fa=∫−∞
f x dx
Paxb=∫ab f  xdx=F b−Fa
∫∞−∞ f  x dx=1
4
Położenia kątowe wskazówek zegara – zmienna losowa ciągła
1
f  x= 360 ; x ∈[0,360]
f  x=0 ; x ∉[0,360]
Fx=0 ; x0
1
1
F  x=∫0x f x 'dx '= 360 ∫0x dx '= 360 x
F x=1 ; x360
5
Rozkład normalny – zmienna losowa ciągła
2
−a
f  x=  21b exp  x2b
; x ∈R
2
x =a
=b
x
F  x=∫−∞
f  x ' dx '
lim x −∞ Fx =0
lim x  ∞ F x =1
6
Rzut kostką – zmienna losowa dyskretna
1
P x i = 6 ; i={1,2 ,3,4 ,5 ,6}
1
F  xi = 6 i ; i={1,2 ,3 ,4 ,5,6}
7
Wartość średnia
Funkcje zmiennej losowej x są zmienną losową.
y=H x 
Zmienna losowa y ma swoją dystrybuantę oraz gęstość prawdopodobieństwa.
Wartość średnia (wartośc oczekiwana, wartość przeciętna) dla zmiennej loswej typu skokowego:
n

E x = x=∑
i=1 xi P x=x i 
Wartość średnia dla funkcji y= H(x)
E {H x}=∑ni=1 H x i  P x=x i 
Wartość średnia (oczekiwana, przeciętna) dla zmiennej loswej typu ciągłego:
∞
 −∞
E x = x=∫
x f  xdx
Wartość średnia dla funkcji y=H(x)
∞
E {H x}=∫−∞
H xf  x dx
8
Momenty
W przypadku, kiedy H(x) = (x-c)l
Momenty rzędu l względem c: wartości oczekiwane
l=E { x−cl }
Ważne momenty:
Moment centralny: moment wartości średniej
Najniższe momenty:
0 =1
l=E { x− x l }
1 =0
Wariancja zmiennej losowej x
2 = 2  x=var  x =E{ x− x 2 }
Najniższy moment, który zawiera informację
o średnim odchyleniu zmiennej losowej x od swojej wartości średniej.
∞
 2  x=var  x =∫−∞
 x− x 2 f  x dx
 2  x=var  x =∑ni=1  x i − x 2 P  x=x i 
9
Rozkład normalny o różnych wariancjach (dyspersjach)
2
−a
f  x=  21 b exp  x2b
; x ∈R
2
10
Wariancja, dyspersja, skośność
Wariancja jest miarę szerokości rozkładu gęstości prawdopodobieństwa w pobliżu
wartości średniej. Jeżeli wariancja jest mała, to wyniki poszczególnych pomiarów leżą w pobliżu
wartości średniej, jeśli natomiast jest ona duża, to wyniki są bardziej rozproszone wokół
średniej.
Odchylenie standardowe (dyspersja)
  x=   2 x 
jest miarą odchylenia wyników od wartości oczekiwanej.
Odchylenie standardowe ma ten sam wymiar co zmienna losowa x, jest utoższamiane
z błędem pomiaru.
  x= x
Skośność – trzeci moment względem wartości średniej 3 (współczynnik skośności, skośność)

Współczynnik asymetrii rozkładu zmiennej losowej x = 
Zawiera on informacje o
3
3
możliwych różnicach pomiędzy dodatnimi i ujemnymi odchyleniami od wartości średniej. Dla
rozkładów symetrycznych skośność jest równa zeru.
11
Własności wartości średniej oraz wariancji
Właśności:
H x=c x
c=const
Ec x =c E  x
 2 c x =c2  2  x
 2  x =E { x− x 2 }=E {x 2 −2 x x  x2 }=E x 2 − x2 =E x 2 −E  x 2
Rozpatrzmy funkcję:
Wartość oczekiwana:
u= x− xx

2
 u=
1
2
  x
E {x− x 2 }= 
2
2
x
x
=1
wariancja:
Zmienna standaryzowana – zmienna losowa o wartości oczekiwanej 0 oraz odchyleniu
standardowym 1.
12
Wartość modalna, mediana
Wartość modalną (wartość najbardziej prawdopodobna, moda) xm, to wartość zmiennej losowej
odpowiadającą maksimum prawdopodobieństwa P x=x =max
m
Rozkład jednomodalny – gęstość prawdopodobieństwa ma jedno maksimum
Rozkład wielomodalny – gęstość prawdopodobieństwa ma więcej niż jedno maksimum
Dla rozkładów gęstości prawdopodobieństwa mających pierwszą oraz drugą pochodną wartość
modalna odpowiada maksimum rozkładu, jest określona przez warunki:
df  x
dx
d2 f  x 
dx 2
=0
0
Mediana x0.5 rozkładu, to taka wartość zmiennej losowej, dla której dystrybuanta przyjmuje
wartość 0.5:
F  x0.5 =P  xx 0.5 =0.5
Dla ciągłej gęstości prawdopodobieństwa:
x 0.5
∫−∞ f  x dx=0.5
mediana dzieli cały zakres zmiennej loswej na dwa obszary o równym prawdopodbieństwie.
13
Kwantyle
Kwantyl xq:
Kwantyl górny x0.25 :
xq
F  xq =∫−∞ f x dx=q
q∈[0,1]
x 0.25
F  x0.25 =∫−∞ f  x dx=0.25
x 0.75
Kwantyl dolny x0.75 :
F  x0.75 =∫−∞ f  x dx=0.75
Mediana x0.5 :
F  x0.5 =∫−∞ f  x dx=0.5
x 0.5
Decyle: x0.1 , x0.2 , x0.3, ...
Dla rozkładów jednomodalnych, o ciągłej funkcji gęstości prawdopodobieństwa, symetrycznych
Wokół wartości średniej – wartość średnia, wartość modalna oraz mediana są identyczne.
14
Kwantyle - ilustracja
x 0.5
F  x0.5 =∫−∞ f  x dx=0.5
x 0.25
F  x0.25 =∫−∞ f  x dx=0.25
x 0.75
F  x0.75 =∫−∞ f  x dx=0.75
Mediana
Kwantyl dolny
Kwantyl górny
Max
F(x0.75 )=0.75
F(x0.5 )=0.5
F(x0.25 )=0.25
15
(xm)
(x0.25 ) (x0.5 ) (x0.75 )
Rozkład jednostajny
f(x)
Gęstość prawdopodobieństwa:
f  x=c ; x ∈a , b
c
f  x=0 ; x ∉a ,b
Rozkład jednostajny:
∞
−∞
∫
b
a
f  x dx=c∫ dx=c b−a=1
a
b
x
1
f  x= b−a
; x∈a , b
f  x=0 ; x ∉a ,b
Dystrybuanta:
F  x=0 ; x≤a
1
F  x= b−a
∫xa dx= x−a
; x ∈a , b
b−a
F  x=1 ; x≥b
Wartość oczekiwana:
1
 b−a
E x = x=
∫ab x dx= 12
Wariancja:
2 1
1
ba 2
b
 2  x =∫ba  x− x 2 f xdx=∫ba  x− ba

dx=
∫

x−
 dx
a
2
b−a
b−a
2
2
 2  x =  b−a
12
1
b−a
b2−a2 = ba
2
16
Rozkład dwumianowy
n!
Prawdopodobieństwo: pn k = k ! n−k
pk q n−k
!
p∈[0,1]
q=1−p
k sukcesów w n niezależnych próbach przeprowadzonych w identycznych warunkach
p – prawdopodobieństwo sukcesu w pojedynczej próbie
q= 1-p – prawdopodobieństwo porażki w pojedynczej próbie
Wartość oczekiwana w pojedynczej próbie:
E x i =1 p0q=p
Wariancja w pojedynczej próbie:
var  xi =E { x i−p2}=1−p2 p0−p2 q=pq
Wartość oczekiwana:
E x =np
Wariancja:
var  x=npq
Odchylenie standardowe:
  x =   var  x=  npq
17
Rozkład dwumianowy
n!
Prawdopodobieństwo: pn k = k ! n−k
pk q n−k
!
p∈[0,1]
q=1−p
Wartość oczekiwana:
!
E x =∑nk=0 k pn k =∑nk=0 k k !nn−k
pk qn− k
!
n−1 !
k−1 n−k
n−1
E x =np ∑nk=1 k−1!
p
q
=np
pq
=np
n−k !
Wariancja:
V  x =E  x 2 −E x 2
n!
E x 2 =∑nk=0 k2 k ! n−k
p k qn− k =∑nk =1  k−11k
!
n!
k !n− k!
pq q n−k
!
n!
k n−k
n
k n−k
E x 2 =∑nk=2 k−2n!n−k
p
q
∑
p
q
k=1
!
 k−1 !n−k  !
 n−2 !
n−1 !
E x 2 =n n−1 p2 ∑nk=2  k−2
pk qn−k np∑nk=1  k−1!
pk−1 qn−k
!n−k  !
n−k !
E x 2 =n n−1 p2 pqn−2 nppqn−1 =n n−1 p2np
var  x=n n−1p2 np−np2=npq
Odchylenie standardowe:
 var  x= npq
18
Zmienne losowe dwuwymiarowe – f(x,y, F(x,y)
Rozpatrzmy prawdopodobieństwo dwóch zmiennych losowych x oraz y, które spełniają
warunek: x<x oraz y<y
Zakładamy istnienie dystrybuanty: F(x,y) = P(x<x, y<y)
Jeśli dystrybuanta jest funkcją ciągłych zmiennych x oraz y, to łączna gęstość
prawdopodobieństwa zmiennych losowych x, y wynosi:
f  x , y = ∂∂x
∂
∂y
F x , y 
Skąd bezpośrednio wynika:
Paxb ,cyd=∫ba [∫dc f  x , ydy ]dx
19
Zmienne losowe dwuwymiarowe – f(x,y), F(x,y)
20
Zmienne losowe dwuwymiarowe – f(x,y), F(x,y)
f(x,y)
F(x,y)
21
Zmienne losowe dwuwymiarowe – gęstości brzegowe
Często spotkać się można z takim problemem, że z pomiaru mamy dwie zmienne losowe x, y.
Dzięki wielu takim pomiarom możliwe jest wyznaczenie doświadczalne dystrybuanty F(x,y),
ale intersuje nas jedynie zależność zmiennej x dla ustalonego y.
∞
Paxb ,−∞y∞=∫ba [∫−∞
f  x , y dy ]dx=∫ba g  x dx
∞
g  x dx=∫−∞
f  x , y dy
g(x) – brzegowa gęstość prawdopodobieństwa dla zmiennej x.
Analogicznie:
∞
P−∞x∞ , cyd=∫dc [∫−∞
f  x , ydx ]dy=∫dc h  y dy
h  y  dy=∫∞−∞ f  x , y  dx
h(y) – brzegowa gęstość prawdopodobieństwa dla zmiennej y.
22
23
...
24
Zmienne losowe dwuwymiarowe – niezależność zmiennych
Niezależność zmiennych losowych x, y:
Zmienne losowe są niezależne, jeśli spełniony jest warunek:
f  x , y =g  x h  y 
Używając rozkładów brzegowych można zdefiniować prawdopodobieństwo warunkowe dla
zmiennej y przy znanej wartości x:
P y yydy∣xxxdx
Gęstość prawdopodobieństwa warunkowego:
f  x∣y = f g x ,xy 
Wówczas powyższe prawdopodobieństwo dane jest jako:
f  x∣y dy
25
Gęstość prawdopodobieństwa warunkowego
Reguła całkowitego prawdopodobieństwa przybiera postać:
∞
∞
h  y =∫−∞
f  x , y dx=∫−∞
f  y∣x g  x dx
Analogicznie:
∞
g  x=∫−∞
f  x , y  dy=∫∞−∞ f  x∣y g  y  dy
Dla zmiennych niezależnych:
y
f  y∣x = f g x ,xy  = g  xh
=h  y 
g x 
Analogicznie:
y
f  x∣y = f h x ,yy  = g hxh
=g  x
y
Warunek narzucony na jedną zmienną nie może mieć wpływu na drugą zmienną.
26

Podobne dokumenty