Statystyka i eksploracja danych

Transkrypt

Statystyka i eksploracja danych
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Statystyka i eksploracja danych
Wykład IV:
Niezależność stochastyczna
10 marca 2014
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji
Definicja współczynnika korelacji
Współczynnikiem korelacji całkowalnych z kwadratem zmiennych
losowych X i Y nazywamy liczbę
r (X , Y )(= ρ(X , Y )) =


 cov (X , Y )
D(X )D(Y )

1
Statystyka i eksploracja danych
jeśli D(X ) · D(Y ) 6= 0,
jeśli D(X ) · D(Y ) = 0.
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji
Definicja współczynnika korelacji
Współczynnikiem korelacji całkowalnych z kwadratem zmiennych
losowych X i Y nazywamy liczbę
r (X , Y )(= ρ(X , Y )) =


 cov (X , Y )
D(X )D(Y )

1
jeśli D(X ) · D(Y ) 6= 0,
jeśli D(X ) · D(Y ) = 0.
Twierdzenie
|r (X , Y )| = 1 wtedy, i tylko wtedy, gdy istnieją stałe α, β takie, że
X = αY + β lub Y = αX + β.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji r (X , Y ) = −0, 013
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji r (X 2 , Y 2 ) = 0, 035
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji r (U, V ) = 0, 127
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Współczynnik korelacji r (U 2 , V 2 ) = −1
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność zmiennych losowych
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność zmiennych losowych
Definicja niezależności stochastycznej
Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli
Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ),
dla dowolnych funkcji ograniczonych fi takich, że
f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność zmiennych losowych
Definicja niezależności stochastycznej
Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli
Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ),
dla dowolnych funkcji ograniczonych fi takich, że
f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi.
Uwaga: Jeżeli rodzina {Xi }i∈I jest niezależna, to niezależna jest
również każda rodzina postaci {gi (Xi )}i∈I .
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność zmiennych losowych
Definicja niezależności stochastycznej
Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli
Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ),
dla dowolnych funkcji ograniczonych fi takich, że
f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi.
Uwaga: Jeżeli rodzina {Xi }i∈I jest niezależna, to niezależna jest
również każda rodzina postaci {gi (Xi )}i∈I .
Definicja
Dowolna rodzina zmiennych losowych {Xi }i∈I , określonych na tej
samej przestrzeni probabilistycznej, jest niezależna, jeśli dla każdego
skończonego podzbioru I0 ⊂ I zmienne losowe Xi , i ∈ I0 są niezależne.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność a brak korelacji
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność a brak korelacji
Twierdzenie (Niezależność pociąga nieskorelowanie)
Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn
XY jest całkowalną zmienną losową i EXY = EX · EY . W
szczególności niezależne zmienne losowe są nieskorelowane.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność a brak korelacji
Twierdzenie (Niezależność pociąga nieskorelowanie)
Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn
XY jest całkowalną zmienną losową i EXY = EX · EY . W
szczególności niezależne zmienne losowe są nieskorelowane.
Uwaga: Bez założenia o niezależności warunek dostateczny dla
całkowalności iloczynu XY odwołuje się do nierówności Höldera.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Brak korelacji a niezależność
Niezależność stochastyczna
Niezależność a brak korelacji
Twierdzenie (Niezależność pociąga nieskorelowanie)
Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn
XY jest całkowalną zmienną losową i EXY = EX · EY . W
szczególności niezależne zmienne losowe są nieskorelowane.
Uwaga: Bez założenia o niezależności warunek dostateczny dla
całkowalności iloczynu XY odwołuje się do nierówności Höldera.
Wniosek (Mnożenie wartości oczekiwanych)
Niech X1 , X2 , . . . , Xd będą niezależne. Jeżeli funkcje fi sa takie, że
f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są całkowalnymi zmiennymi losowymi,
tj. E |fi (Xi )| < +∞, i = 1, 2, . . . , d, to
Ef1 (X1 )f2 (X2 ) · · · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · · · · Efd (Xd ).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Rozkład łączny niezależnych zmiennych losowych
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Rozkład łączny niezależnych zmiennych losowych
Twierdzenie
Zmienne losowe X1 , X2 , . . . , Xd są niezależne wtedy, i tylko wtedy,
gdy dla dowolnych liczb a1 , a2 , . . . , ad ma miejsce równość
P(X1 ¬ a1 , X2 ¬ a2 , . . . , Xd ¬ ad )
= P(X1 ¬ a1 )P(X2 ¬ a2 ) · . . . · P(Xd ¬ ad ).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Rozkład łączny niezależnych zmiennych losowych
Twierdzenie
Zmienne losowe X1 , X2 , . . . , Xd są niezależne wtedy, i tylko wtedy,
gdy dla dowolnych liczb a1 , a2 , . . . , ad ma miejsce równość
P(X1 ¬ a1 , X2 ¬ a2 , . . . , Xd ¬ ad )
= P(X1 ¬ a1 )P(X2 ¬ a2 ) · . . . · P(Xd ¬ ad ).
Innymi słowy
F(X1 ,X2 ,...,Xd ) (a1 , a2 , . . . , ad ) = FX1 (a1 ) · FX2 (a2 ) · . . . · FXd (ad ),
tzn. dystrybuanta rozkładu łącznego niezależnych zmiennych
losowych jest iloczynem dystrybuant brzegowych.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Produkt rozkładów
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Produkt rozkładów
Definicja
Rozkład prawdopodobieństwa µ na Rd nazywamy produktem
rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem
dystrybuant Fµ1 , Fµ2 , . . . , Fµd :
Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Produkt rozkładów
Definicja
Rozkład prawdopodobieństwa µ na Rd nazywamy produktem
rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem
dystrybuant Fµ1 , Fµ2 , . . . , Fµd :
Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ).
Zapisujemy:
µ = µ 1 × µ2 × . . . × µ d .
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Produkt rozkładów
Definicja
Rozkład prawdopodobieństwa µ na Rd nazywamy produktem
rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem
dystrybuant Fµ1 , Fµ2 , . . . , Fµd :
Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ).
Zapisujemy:
µ = µ 1 × µ2 × . . . × µ d .
Wniosek
Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy
ich rozkład łączny jest produktem rozkładów brzegowych:
P(X1 ,X2 ,...,Xd ) = PX1 × PX2 × . . . × PXd .
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Przykład
Niech wyniki i-tego eksperymentu będą elementami skończonej
przestrzeni Ωi .
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Przykład
Niech wyniki i-tego eksperymentu będą elementami skończonej
przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie
klasycznym prawdopodobieństwem na Ω.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Przykład
Niech wyniki i-tego eksperymentu będą elementami skończonej
przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie
klasycznym prawdopodobieństwem na Ω.
Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe
Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi )
są stochastycznie niezależne.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Przykład
Niech wyniki i-tego eksperymentu będą elementami skończonej
przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie
klasycznym prawdopodobieństwem na Ω.
Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe
Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi )
są stochastycznie niezależne.
Uwaga: W tym szczególnym przypadku niezależność stochastyczna
pokrywa się z niezależnością funkcyjną (zmienne Xi w istocie są
funkcjami różnych argumentów).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Klasyczne prawdopodobieństwo na produkcie
Przykład
Niech wyniki i-tego eksperymentu będą elementami skończonej
przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie
klasycznym prawdopodobieństwem na Ω.
Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe
Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi )
są stochastycznie niezależne.
Uwaga: W tym szczególnym przypadku niezależność stochastyczna
pokrywa się z niezależnością funkcyjną (zmienne Xi w istocie są
funkcjami różnych argumentów). Przewaga niezależności
stochastycznej polega na uwolnieniu tej własności od konkretnej
przestrzeni funkcyjnej.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność dyskretnych zmiennych losowych
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność dyskretnych zmiennych losowych
Twierdzenie
Niech rozkłady zmiennych X1 , X2 , . . . , Xd będą dyskretne.
Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy
dla dowolnych x1 , x2 , . . . , xd ∈ R1 ma miejsce związek
P(X1 = x1 , X2 = x2 , . . . , Xd = xd )
= P(X1 = x1 )P(X2 = x2 ) · · · P(Xd = xd ).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność absolutnie ciągłych zmiennych losowych
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność absolutnie ciągłych zmiennych losowych
Twierdzenie
Niech rozkłady zmiennych X1 , X2 , . . . , Xd będą absolutnie ciągłe z
gęstościami p1 (x), p2 (x), . . . , pd (x).
Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy
rozkład łączny tych zmiennych jest absolutnie ciągły (tzn. posiada
gęstość względem miary Lebesgue’a na Rd ) i jego gęstość ma
postać
pX~ (x1 , x2 , . . . , xd ) = p1 (x1 )p2 (x2 ) · · · pd (xd ).
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność zdarzeń
Definicja
Rodzina zdarzeń {Ai }i∈I ⊂ F jest niezależna, jeśli dla dowolnego
skończonego podzbioru I0 ⊂ I
P
\
Ai
= Πi∈I0 P(Ai ).
i∈I0
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność a rozkład łączny
Kryteria niezależności
Niezależność zdarzeń
Niezależność zdarzeń
Definicja
Rodzina zdarzeń {Ai }i∈I ⊂ F jest niezależna, jeśli dla dowolnego
skończonego podzbioru I0 ⊂ I
P
\
Ai
= Πi∈I0 P(Ai ).
i∈I0
Uwaga: można pokazać, że rodzina zdarzeń jest niezależna, gdy
rodzina zmiennych losowych {1I Ai }i∈I jest niezależna.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność parami
Niezależność parami
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność parami
Niezależność parami
Definicja
Zmienne losowe {Xi }i∈I są niezależne parami, jeśli dla każdych
i, j ∈ I, i 6= j, zmienne Xi i Xj są niezależne. Podobnie, zdarzenia
{Ai }i∈I są niezależne parami, jeśli każde dwa zdarzenia Ai i Aj ,
i 6= j są niezależne.
Statystyka i eksploracja danych
Wykład IV: Niezależność
Niezależność
Podstawowe kryteria niezależności
Niezależność parami
Niezależność parami
Niezależność parami
Definicja
Zmienne losowe {Xi }i∈I są niezależne parami, jeśli dla każdych
i, j ∈ I, i 6= j, zmienne Xi i Xj są niezależne. Podobnie, zdarzenia
{Ai }i∈I są niezależne parami, jeśli każde dwa zdarzenia Ai i Aj ,
i 6= j są niezależne.
Zadanie: Podać przykład zdarzeń niezależnych parami, ale
zależnych zespołowo (np. przykład Bernsteina).
Statystyka i eksploracja danych
Wykład IV: Niezależność