x - HIRG - Politechnika Warszawska
Transkrypt
x - HIRG - Politechnika Warszawska
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: e-mail [email protected] tel: tel +48 22 234 58 51 www: http://hirg.if.pw.edu.pl/~gos/students/kadd Politechnika Warszawska Wydział Fizyki Pok. 117b (wejście przez 115) 1 Zmienne losowe Jeśli w tych samych warunkach eksperymentalnych dokonujemy n pomiarów danej wielkości i dostajmy różne wyniki, to znaczy, że są one obarczone niepewnościami przypadkowymi, traktujemy je jako zdarzenia losowe. Zdarzeniu losowemu przypisywana jest określona wartość zmiennej losowej. Typy zmiennych losowych: - jednowymiarowe, - dwuwymiarowe, -... - n-wymiarowe Rodzaje zmiennych losowych: - skokowe (dyskretne), - ciągłe. Zmienne losowe będziemy oznaczali znakami: x,y,.. 2 Dystrybuanta zmiennej losowej Dana jest zmienna losowa x oraz liczba x, która może przybierać dowolną wartość. Prawdopodobieństwo zajścia zdarzenia x<x jest funkcją x i nosi nazwę dystrybuanty zmiennej losowej x. F x=P xx Jeśli x może przybierać tylko skończoną liczbę wartości, to dystrybuanta jest funkcją skokową. Dystrubuanta dla zmiennej losowej typu skokowego: F x=P xx =∑ki=1 P i Dystrybuanta dla zmiennej losowej typu ciągłego, gdzie f(x) jest funkcją gęstości: x F x=P xx =∫−∞ f x 'dx ' 3 Pojęcie prawdopodobieństwa Własności dystrybuanty: 1) funkcja niemalejąca 2) lim x −∞ Fx =0 oraz lim x ∞ F x=1 3) w przypadku, kiedy dystrubuanta F(x) jest ciągła oraz ma 1-szą pochodną: x F 'x = dF =f x dx f(x) jest funkcją gęstości prawdopodobieństwa zmiennej losowej x f(x) jest miarą prawdopodobieństwa zajścia zdarzenia xxxdx Prawdopodobieństwo: a P xa=Fa=∫−∞ f x dx Paxb=∫ab f xdx=F b−Fa ∫∞−∞ f x dx=1 4 Położenia kątowe wskazówek zegara – zmienna losowa ciągła 1 f x= 360 ; x ∈[0,360] f x=0 ; x ∉[0,360] Fx=0 ; x0 1 1 F x=∫0x f x 'dx '= 360 ∫0x dx '= 360 x F x=1 ; x360 5 Rozkład normalny – zmienna losowa ciągła 2 −a f x= 21b exp x2b ; x ∈R 2 x =a =b x F x=∫−∞ f x ' dx ' lim x −∞ Fx =0 lim x ∞ F x =1 6 Rzut kostką – zmienna losowa dyskretna 1 P x i = 6 ; i={1,2 ,3,4 ,5 ,6} 1 F xi = 6 i ; i={1,2 ,3 ,4 ,5,6} 7 Wartość średnia Funkcje zmiennej losowej x są zmienną losową. y=H x Zmienna losowa y ma swoją dystrybuantę oraz gęstość prawdopodobieństwa. Wartość średnia (wartośc oczekiwana, wartość przeciętna) dla zmiennej loswej typu skokowego: n E x = x=∑ i=1 xi P x=x i Wartość średnia dla funkcji y= H(x) E {H x}=∑ni=1 H x i P x=x i Wartość średnia (oczekiwana, przeciętna) dla zmiennej loswej typu ciągłego: ∞ −∞ E x = x=∫ x f xdx Wartość średnia dla funkcji y=H(x) ∞ E {H x}=∫−∞ H xf x dx 8 Momenty W przypadku, kiedy H(x) = (x-c)l Momenty rzędu l względem c: wartości oczekiwane l=E { x−cl } Ważne momenty: Moment centralny: moment wartości średniej Najniższe momenty: 0 =1 l=E { x− x l } 1 =0 Wariancja zmiennej losowej x 2 = 2 x=var x =E{ x− x 2 } Najniższy moment, który zawiera informację o średnim odchyleniu zmiennej losowej x od swojej wartości średniej. ∞ 2 x=var x =∫−∞ x− x 2 f x dx 2 x=var x =∑ni=1 x i − x 2 P x=x i 9 Rozkład normalny o różnych wariancjach (dyspersjach) 2 −a f x= 21 b exp x2b ; x ∈R 2 10 Wariancja, dyspersja, skośność Wariancja jest miarę szerokości rozkładu gęstości prawdopodobieństwa w pobliżu wartości średniej. Jeżeli wariancja jest mała, to wyniki poszczególnych pomiarów leżą w pobliżu wartości średniej, jeśli natomiast jest ona duża, to wyniki są bardziej rozproszone wokół średniej. Odchylenie standardowe (dyspersja) x= 2 x jest miarą odchylenia wyników od wartości oczekiwanej. Odchylenie standardowe ma ten sam wymiar co zmienna losowa x, jest utoższamiane z błędem pomiaru. x= x Skośność – trzeci moment względem wartości średniej 3 (współczynnik skośności, skośność) Współczynnik asymetrii rozkładu zmiennej losowej x = Zawiera on informacje o 3 3 możliwych różnicach pomiędzy dodatnimi i ujemnymi odchyleniami od wartości średniej. Dla rozkładów symetrycznych skośność jest równa zeru. 11 Własności wartości średniej oraz wariancji Właśności: H x=c x c=const Ec x =c E x 2 c x =c2 2 x 2 x =E { x− x 2 }=E {x 2 −2 x x x2 }=E x 2 − x2 =E x 2 −E x 2 Rozpatrzmy funkcję: Wartość oczekiwana: u= x− xx 2 u= 1 2 x E {x− x 2 }= 2 2 x x =1 wariancja: Zmienna standaryzowana – zmienna losowa o wartości oczekiwanej 0 oraz odchyleniu standardowym 1. 12 Wartość modalna, mediana Wartość modalną (wartość najbardziej prawdopodobna, moda) xm, to wartość zmiennej losowej odpowiadającą maksimum prawdopodobieństwa P x=x =max m Rozkład jednomodalny – gęstość prawdopodobieństwa ma jedno maksimum Rozkład wielomodalny – gęstość prawdopodobieństwa ma więcej niż jedno maksimum Dla rozkładów gęstości prawdopodobieństwa mających pierwszą oraz drugą pochodną wartość modalna odpowiada maksimum rozkładu, jest określona przez warunki: df x dx d2 f x dx 2 =0 0 Mediana x0.5 rozkładu, to taka wartość zmiennej losowej, dla której dystrybuanta przyjmuje wartość 0.5: F x0.5 =P xx 0.5 =0.5 Dla ciągłej gęstości prawdopodobieństwa: x 0.5 ∫−∞ f x dx=0.5 mediana dzieli cały zakres zmiennej loswej na dwa obszary o równym prawdopodbieństwie. 13 Kwantyle Kwantyl xq: Kwantyl górny x0.25 : xq F xq =∫−∞ f x dx=q q∈[0,1] x 0.25 F x0.25 =∫−∞ f x dx=0.25 x 0.75 Kwantyl dolny x0.75 : F x0.75 =∫−∞ f x dx=0.75 Mediana x0.5 : F x0.5 =∫−∞ f x dx=0.5 x 0.5 Decyle: x0.1 , x0.2 , x0.3, ... Dla rozkładów jednomodalnych, o ciągłej funkcji gęstości prawdopodobieństwa, symetrycznych Wokół wartości średniej – wartość średnia, wartość modalna oraz mediana są identyczne. 14 Kwantyle - ilustracja x 0.5 F x0.5 =∫−∞ f x dx=0.5 x 0.25 F x0.25 =∫−∞ f x dx=0.25 x 0.75 F x0.75 =∫−∞ f x dx=0.75 Mediana Kwantyl dolny Kwantyl górny Max F(x0.75 )=0.75 F(x0.5 )=0.5 F(x0.25 )=0.25 15 (xm) (x0.25 ) (x0.5 ) (x0.75 ) Rozkład jednostajny f(x) Gęstość prawdopodobieństwa: f x=c ; x ∈a , b c f x=0 ; x ∉a ,b Rozkład jednostajny: ∞ −∞ ∫ b a f x dx=c∫ dx=c b−a=1 a b x 1 f x= b−a ; x∈a , b f x=0 ; x ∉a ,b Dystrybuanta: F x=0 ; x≤a 1 F x= b−a ∫xa dx= x−a ; x ∈a , b b−a F x=1 ; x≥b Wartość oczekiwana: 1 b−a E x = x= ∫ab x dx= 12 Wariancja: 2 1 1 ba 2 b 2 x =∫ba x− x 2 f xdx=∫ba x− ba dx= ∫ x− dx a 2 b−a b−a 2 2 2 x = b−a 12 1 b−a b2−a2 = ba 2 16 Rozkład dwumianowy n! Prawdopodobieństwo: pn k = k ! n−k pk q n−k ! p∈[0,1] q=1−p k sukcesów w n niezależnych próbach przeprowadzonych w identycznych warunkach p – prawdopodobieństwo sukcesu w pojedynczej próbie q= 1-p – prawdopodobieństwo porażki w pojedynczej próbie Wartość oczekiwana w pojedynczej próbie: E x i =1 p0q=p Wariancja w pojedynczej próbie: var xi =E { x i−p2}=1−p2 p0−p2 q=pq Wartość oczekiwana: E x =np Wariancja: var x=npq Odchylenie standardowe: x = var x= npq 17 Rozkład dwumianowy n! Prawdopodobieństwo: pn k = k ! n−k pk q n−k ! p∈[0,1] q=1−p Wartość oczekiwana: ! E x =∑nk=0 k pn k =∑nk=0 k k !nn−k pk qn− k ! n−1 ! k−1 n−k n−1 E x =np ∑nk=1 k−1! p q =np pq =np n−k ! Wariancja: V x =E x 2 −E x 2 n! E x 2 =∑nk=0 k2 k ! n−k p k qn− k =∑nk =1 k−11k ! n! k !n− k! pq q n−k ! n! k n−k n k n−k E x 2 =∑nk=2 k−2n!n−k p q ∑ p q k=1 ! k−1 !n−k ! n−2 ! n−1 ! E x 2 =n n−1 p2 ∑nk=2 k−2 pk qn−k np∑nk=1 k−1! pk−1 qn−k !n−k ! n−k ! E x 2 =n n−1 p2 pqn−2 nppqn−1 =n n−1 p2np var x=n n−1p2 np−np2=npq Odchylenie standardowe: var x= npq 18 Zmienne losowe dwuwymiarowe – f(x,y, F(x,y) Rozpatrzmy prawdopodobieństwo dwóch zmiennych losowych x oraz y, które spełniają warunek: x<x oraz y<y Zakładamy istnienie dystrybuanty: F(x,y) = P(x<x, y<y) Jeśli dystrybuanta jest funkcją ciągłych zmiennych x oraz y, to łączna gęstość prawdopodobieństwa zmiennych losowych x, y wynosi: f x , y = ∂∂x ∂ ∂y F x , y Skąd bezpośrednio wynika: Paxb ,cyd=∫ba [∫dc f x , ydy ]dx 19 Zmienne losowe dwuwymiarowe – f(x,y), F(x,y) 20 Zmienne losowe dwuwymiarowe – f(x,y), F(x,y) f(x,y) F(x,y) 21 Zmienne losowe dwuwymiarowe – gęstości brzegowe Często spotkać się można z takim problemem, że z pomiaru mamy dwie zmienne losowe x, y. Dzięki wielu takim pomiarom możliwe jest wyznaczenie doświadczalne dystrybuanty F(x,y), ale intersuje nas jedynie zależność zmiennej x dla ustalonego y. ∞ Paxb ,−∞y∞=∫ba [∫−∞ f x , y dy ]dx=∫ba g x dx ∞ g x dx=∫−∞ f x , y dy g(x) – brzegowa gęstość prawdopodobieństwa dla zmiennej x. Analogicznie: ∞ P−∞x∞ , cyd=∫dc [∫−∞ f x , ydx ]dy=∫dc h y dy h y dy=∫∞−∞ f x , y dx h(y) – brzegowa gęstość prawdopodobieństwa dla zmiennej y. 22 23 ... 24 Zmienne losowe dwuwymiarowe – niezależność zmiennych Niezależność zmiennych losowych x, y: Zmienne losowe są niezależne, jeśli spełniony jest warunek: f x , y =g x h y Używając rozkładów brzegowych można zdefiniować prawdopodobieństwo warunkowe dla zmiennej y przy znanej wartości x: P y yydy∣xxxdx Gęstość prawdopodobieństwa warunkowego: f x∣y = f g x ,xy Wówczas powyższe prawdopodobieństwo dane jest jako: f x∣y dy 25 Gęstość prawdopodobieństwa warunkowego Reguła całkowitego prawdopodobieństwa przybiera postać: ∞ ∞ h y =∫−∞ f x , y dx=∫−∞ f y∣x g x dx Analogicznie: ∞ g x=∫−∞ f x , y dy=∫∞−∞ f x∣y g y dy Dla zmiennych niezależnych: y f y∣x = f g x ,xy = g xh =h y g x Analogicznie: y f x∣y = f h x ,yy = g hxh =g x y Warunek narzucony na jedną zmienną nie może mieć wpływu na drugą zmienną. 26