prawo Laplace'a

Transkrypt

prawo Laplace'a
Ważne rozkłady i twierdzenia
Rozkład dwumianowy i wielomianowy
■ Częstość. Prawo wielkich liczb
■ Rozkład hipergeometryczny
■ Rozkład Poissona
■ Rozkład normalny i rozkład Gaussa
■ Centralne twierdzenie graniczne

Model Laplace'a błędów pomiarowych
■ Funkcja charakterystyczna rozkładu
■
KADD – Podstawowe rozkłady
1
Rozkład dwumianowy
■
Rozważmy doświadczenie, w którym możemy
uzyskać dwie wykluczające się wartości
E= A A
(np. rzut monetą). Ich prawdopodobieństwa to:
P  A =1 − p=q
P  A= p
■
Definiujemy zmienną losową X, która przyjmuje
wartości 1 i 0 dla zdarzeń A i A. Powtarzamy
zdarzenie n razy i badamy rozkład zmiennej
n
■
X =∑i=1 X i
Prawdopodobieństwo
zajścia najpierw k
zdarzeń A i reszty A to:
p k q n−k
KADD – Podstawowe rozkłady
2
Własności rozkładu dwumianowego
■
Ostatecznie, przy dowolnej kolejności zdarzeń:
n!
P k =W =
p k q n−k
k !  n−k  !
n
k
Jest to rozkład dwumianowy
■ Możemy obliczyć wartość średnią i wariancję Xi:
E { X i }=1 ⋅p0 ⋅q= p  2  X i =E { x i − p2 }=1− p2 p0− p2 q= pq
■ Podobnie dla ciągu n zdarzeń:
n
■
E { X }=∑i=1 p=np
■
Dla przykładu mamy wariancję ciągu 2 zdarzeń:



2 2
2
2 2
p 2 −2 p2 
pq 1 −2 p2 
q 0 −2 p2 =
2
1
0
2 p 2 4 −8 p4 p 2 2 p−2 p 2 1−2 p p 2  4 p 2 =2 p 1− p=2 pq
 2  X =
■
Ogólnie mamy:
 2  X  =npq
KADD – Podstawowe rozkłady
3
R. dwumianowy – rysunki
p=0.3
n=10
p=0.6
np=3.0
KADD – Podstawowe rozkłady
4
Rozkład wielomianowy
■
Rozszerzając definicję na wiele możliwych zdarzeń:
E= A1  A2  A3  An
które się wzajemnie wykluczają:
l
∑ j=1 p j =1
P  A j = p j ,
■
Mamy prawd. zajścia zdarzenia Aj k razy:
W
n
k 1, k 2, ... , k l
=
n!
l
∏ j=1 k j !
l
∏ j=1 p
kj
j
,
l
∑ j=1 k j =n
Jest to rozkład wielomianowy.
■ Definiujemy Xij=1, gdy wynikiem i-tego pomiaru
n
jest Aj i 0 w przeciwnym razie oraz X j =∑i=1 X ij
■ Wtedy wartość średnia i kowariancja to:
E { X j }= 
x j =n p j
c ij =np i  ij − p j 
■
KADD – Podstawowe rozkłady
5
Częstość. Prawo Wielkich Liczb
■
■
Częstość występowania zdarzenie Aj to:
1 n
1
H j = ∑i=1 X ij = X
n
n
Jest to zmienna losowa, dla której (przy n próbch):
{ }
xj

E { H j }= h j =E
=pj
n
■
j
  H j =
2
2
 
Xj
1 2
1
= 2   X j = p j 1− p j 
n
n
n
Wartość oczekiwana częstości jest równa jego
prawdopodobieństwu. Iloczyn pj(1-pj) jest zawsze
mniejszy od 1/4, więc standardowe odchylenie
częstości jest mniejsze niż 1/√n. Jest to prawo
wielkich liczb. Przeprowadzenie n prób umożliwia
pomiar prawdopodobieństwa zdarzenia Aj, kwadrat
błędu jest wtedy odwrotnie proporcjonalny do √n.
Jest to tzw. błąd statystyczny.
6
KADD – Podstawowe rozkłady
Rozkład hipergeomeryczny
■
W urnie jest N kul – K białych i N-K czarnych. W n
próbach wyciągamy (bez zwracania) k kul białych i
n-k=l czarnych. Kolejne próby są skorelowane.
Prawdopodobieństwo takiego zdarzenia wynosi:
W k=
  

K L
k l
N
n
Definiujemy zmienną losową X i =∑i=1 X i , gdzie Xi
przyjmuje wartość 1 dla białych i 0 dla czarnych.
■ Można udowodnić, że
■
■
n
nK  K −N  N −n
  X =
N 2  N −1
K
E { X }=n
N
2
Dla n«N przybliżamy rozkład dwumianowy:
K
p= ,
N
N −K
q=
,
N
K
=np ,
N
KADD – Podstawowe rozkłady
E { X }=n
npq  N −n
  X =
N −1
2
7
Przykłady rozkł. hipergeometrycznego
■
Można uogólnić rozkład
hipergeometryczny na
kilka spsobów:

Więcej własności niż
dwie (podobne do
przejścia od rozkładu
dwu- do wielomianowego.

Rozkład Polyi – po
każdym wylosowaniu
dorzucamy m kulek
danego koloru
KADD – Podstawowe rozkłady
8
Rozkład Poissona
■
Rozkład dwumianowy, dla n→∞ ale przy stałym
np=λ dąży do ściśle określonego rozkładu:

k

lim
W nk = f k = e−
k!
n ∞
■
W nk =
n k n−k
p q
k
Jest to rozkład Poissona. Badamy normalizację:
∞
∞
∑k =0 f k =∑k =0


k − −
 2 3
e =e 1   =e− e =1
k!
2 ! 3!
wartość oczekiwaną:
∞
k −
 j −
E { K }=∑k =0 k
e = ∑ j=0
e =
k!
j!
∞
wariancję:
E { K 2 }=  1 
i skośność:
3 =E {k − k 3 }=
2
2
{
}
  K =E K −[ E { K } ] =1−2 =
2
3

= 3 = 3 / 2 =−1/ 2
 
KADD – Podstawowe rozkłady
9
Rozkład Poissona - rysunek
■
Stosuje się go, gdy mamy dużą liczbę
niezależnych zdarzeń, z których tylko nieliczne
mają interesującą nas własność.
KADD – Podstawowe rozkłady
10
Rozkład Poissona – przykład
Mamy jądro promieniotwórcze o czasie życia τ.
Obserwujemy je w czasie T«τ.
Prawdopodobieństwo rozpadu jądra w tym czasie
W«1. Dzielimy czas T na n przedziałów. p=W/n.
■ Obserwujemy na raz wiele jąder N. Zliczamy ilość
przypadków nk, gdy w danym przedziale
zaobserwowano k=0, 1, 2, 3 itd. rozpadów.
Obliczamy częstość h(k) = nk/n.
■ Doświadczalnie zaobserwowano, że dla N→∞ i
dużych n rozkład h(k) dąży do rozkładu Poissona,
co stanowi bezpośredni dowód na niezależność i
statystyczny charakter rozpadów
promieniotwórczych.
11
■
KADD – Podstawowe rozkłady
Rozkład normalny standardowy
■
Rozkład normalny
standardowy opisuje wzór:
1
f  x=
e−x
2 
2
/2
Jego dystrybuanta nie ma
postaci analitycznej
■ Jest on poprawnie
unormowany:
∞
−x / 2
e
dx=  2 
∫−∞
■ Z symetrii i parzystości
rozkładu mamy:
■
2
∞
1
−x
x =
x
e
∫
 2  −∞
KADD – Podstawowe rozkłady
2
/2
dx=0
12
Parametry rozkładu normalnego
■
Całkując przez części otrzymujemy wariancję:
∞
1
2 −x
 =
x
e
∫
−∞
2 
2
2
/2
{
∞
1
−x / 2 ∞
dx=
[−xe
]−∞∫−∞ e−x
2 
2
2
/2
}
dx =1
Zauważmy, że rozkład normalny ma takie same
własności, jak standaryzowana zmienna u.
■ Zastąpmy X w rozkładzie normalnym uogólnioną
zmienną (X-a)/b. Otrzymamy rozkład Gausa:
■
{
2

x−a
1
f  x=
exp −
2
2

b
2
b

}
Jego wartość średnia wynosi x =a
■ Zaś jego wariancja
 2  X =b 2
■ Czynnik b powoduje rozszerzenie/zwężenie
rozkładu, zaś a – przesunięcie wzdłuż osi x.
■
KADD – Podstawowe rozkłady
13
Własności rozkładu normalnego
Rozkład normalny ma
punkty przegięcia w x=±1,
a r. Gaussa w x=a±b.
■ Mamy dystrybuantę F0(x).
Szukamy:
P ∣ X ∣ x=2 F 0 −∣x∣=2 {1 −F 0 ∣x∣ }
■ Możemy też odwrócić
wzór, otrzymując:
■
P ∣ X ∣≤ x=2 F 0 ∣x∣−1
■
Zależności można
uogólnić na r. Gaussa:
F  x=F 0
KADD – Podstawowe rozkłady
 
x−a
b
14
Rozkład Gaussa – własności
■
Szczególnie interesujące jest obliczenie
 
nb
∣
∣
P  X −a ≤n  =2 F 0
−1 =2 F 0 n−1
b
dla całkowitych wartości n, czyli dla wielokrotności
odchylenia standardowego:
P ∣ X −a∣≤  =68,3 %
P ∣ X −a∣ =31,7 %
P ∣ X −a∣≤2  =95,4 %
P ∣ X −a∣2  =4,6 %
P ∣ X −a∣≤3   =99,8 %
P ∣ X −a∣3  =0,2 %
■ Dyspersja σ rozkładu Gaussa nosi nazwę
odchylenia standardowego lub błędu
standardowego. Utożsamiając σ z błędem
pomiarowym widzimy, że wartość prawdziwa
mieści się w przedziale ±σ z prawd. 68,3 %.
■ Rozkład kwantyli to odwrotna dystrybuanta
15
KADD – Podstawowe rozkłady
Centralne twierdzenie graniczne
■
Jeżeli zmienne losowe Xi są zmiennymi
niezależnymi o wartościach średnich a i
wariancjach b2, to zmienna:
n
lim
X=
Xi
∑
i=1
n ∞
ma rozkład normalny z E{X}=na oraz σ2(X)=nb2
■ Ponadto zmienna
1
lim 1 n
= X =
Xi
∑
i=1
n
n ∞ n
też ma rozkład normalny z:
E { }=a
 2 =b 2 / n
KADD – Podstawowe rozkłady
16
Centralne tw. graniczne – przykład
■
Załóżmy, że Xi to proste zmienne przybierające
wartość 1 z prawd. p i 0 z prawd. 1-p. Jak wiemy
E{Xi}=p oraz σ2(Xi)=p(1-p). Zmienna
n
lim
X=
Xi
∑
i=1
n ∞
ma więc rozkład dwumianowy. P(X(n)=k) = Wkn.
■ Wprowadzimy zmienną unormowaną:
n
u =∑i=1
n
■
X i− p
1
=
 p 1− p  p 1− p
∑
n
i=1
X i −np

Prawdopodobieństwo wynosi:
P  X =k =P un=k −np/  np 1− p=W nk
■
Badamy rozkład zmiennej skokowej: P(u(n))/Δu(n) dla
n→∞ gdize Δu(n) to odległość między kolejnymi
wartościami
17
KADD – Podstawowe rozkłady
Przykład – ilustracja
n=5
n=50
p=0.1
n=10
n=151
KADD – Podstawowe rozkłady
18
Model Laplace'a błędów pom.
Załóżmy, iż istnieje wilekość prawdziwa m0. Jej
pomiar zakłóca wiele (n) niezależnych czynników,
z których każdy powoduje zakłócenie ε, z równym
prawd. dodatnie jak i ujemne. Błąd pomiarowy
jest wtedy sumą pojedynczych zakłóceń.
■ W oczywisty sposób dostajemy w wyniku rozkład
dwumianowy z p=1/2. (który w tym szczególnym
przypadku ma bezpośredni związek z trójkątem
Pascala). Stosując wzór z CTG i przechodząc z n
do nieskończoności mamy wielkość
■
n
u =2
∑
n
i=1

 X i −n / 2 /  n 
która ma rozkład normalny z wartością
oczekiwaną równą 0 i odchyleniem stand.  n / 2
KADD – Podstawowe rozkłady
19
Model Laplace'a – ilustracja
n=5
n=50
p=0.5
n=10
n=151
KADD – Podstawowe rozkłady
20
Funkcja charakterystyczna rozkładu
■
Mamy zmienną losową X o dystrybuancie F(x) i
funkcji gęstości prawdopodobieństwa f(x). Jej
funkcję charakterystyczną definiujemy jako:
t =E { exp itx  }
■
Czyli jest ona transformatą
Fouriera
gęstości
f(x):
∞
t =∫−∞ exp itx  f  x dx
■
Obliczmy momenty względem początku układu:
■
∞
n=E { X }=∫−∞ x n f  x dx
n
Można je otrzymać przez n-krotne różniczkowanie
funkcji charakterystycznej w punkcie t=0:
n
d
t  n ∞ n
n
 t =
=i ∫−∞ x exp itx  f  x dx
n
dt
■
Czyli
n 0=i n n
KADD – Podstawowe rozkłady
21
Funkcja charakterystyczna c.d.
■
Wprowadzamy przesuniętą zmienną y=x-E{x} i jej
funkcję charakterystyczną:
∞
■
 y t =∫−∞ exp { it  x− x  } f  x dx=t exp −it x 
Wtedy n-ta pochodna jest równa n-temu
momentowi względem wartości średniej:
ny 0=i n n=i n E { X − x n }
a w szczególności:
 2  x=− y ' ' 0
■
Odwracając transformatę Fouriera można z funkcji
charakterystycznej uzyskać gęstość prawd.:
1 ∞
f  x=
exp −itx t  dt
∫
−∞
2
KADD – Podstawowe rozkłady
22
Funkcja charakterystyczna – wyniki
Istnieje jednoznaczny związek pomiędzy
dystrybuantą i jej funkcją charakterystyczną. Stąd
można ich używać zamiennie i przechodzić od
jednej do drugiej w miarę potrzeb i konieczności.
■ Przykłady własności otrzymanych przez rachunki z
funkcją charakterystyczną:
it

t
=exp
e
−1 }
{
Rozkład Poissona:
it


t
=exp


e
−1 } jest
{
1
2
Suma rozkładów: sum
również r. Poissona o λ równej sumie λ1 i λ2.

F. charakterystyczna rozkładu normalnego:
t =exp itaexp −b 2 t 2 / 2  ma postać rozkładu
normalnego. Iloczyn ich wariancji wynosi 1.
■
KADD – Podstawowe rozkłady
23