Statystyka i eksploracja danych
Transkrypt
Statystyka i eksploracja danych
Niezależność Podstawowe kryteria niezależności Niezależność parami Statystyka i eksploracja danych Wykład IV: Niezależność stochastyczna 10 marca 2014 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji Definicja współczynnika korelacji Współczynnikiem korelacji całkowalnych z kwadratem zmiennych losowych X i Y nazywamy liczbę r (X , Y )(= ρ(X , Y )) = cov (X , Y ) D(X )D(Y ) 1 Statystyka i eksploracja danych jeśli D(X ) · D(Y ) 6= 0, jeśli D(X ) · D(Y ) = 0. Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji Definicja współczynnika korelacji Współczynnikiem korelacji całkowalnych z kwadratem zmiennych losowych X i Y nazywamy liczbę r (X , Y )(= ρ(X , Y )) = cov (X , Y ) D(X )D(Y ) 1 jeśli D(X ) · D(Y ) 6= 0, jeśli D(X ) · D(Y ) = 0. Twierdzenie |r (X , Y )| = 1 wtedy, i tylko wtedy, gdy istnieją stałe α, β takie, że X = αY + β lub Y = αX + β. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji r (X , Y ) = −0, 013 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji r (X 2 , Y 2 ) = 0, 035 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji r (U, V ) = 0, 127 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Współczynnik korelacji r (U 2 , V 2 ) = −1 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność zmiennych losowych Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność zmiennych losowych Definicja niezależności stochastycznej Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ), dla dowolnych funkcji ograniczonych fi takich, że f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność zmiennych losowych Definicja niezależności stochastycznej Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ), dla dowolnych funkcji ograniczonych fi takich, że f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi. Uwaga: Jeżeli rodzina {Xi }i∈I jest niezależna, to niezależna jest również każda rodzina postaci {gi (Xi )}i∈I . Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność zmiennych losowych Definicja niezależności stochastycznej Zmienne losowe X1 , X2 , . . . , Xd są niezależne, jeżeli Ef1 (X1 )f2 (X2 ) · . . . · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · . . . · Efd (Xd ), dla dowolnych funkcji ograniczonych fi takich, że f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są zmiennymi losowymi. Uwaga: Jeżeli rodzina {Xi }i∈I jest niezależna, to niezależna jest również każda rodzina postaci {gi (Xi )}i∈I . Definicja Dowolna rodzina zmiennych losowych {Xi }i∈I , określonych na tej samej przestrzeni probabilistycznej, jest niezależna, jeśli dla każdego skończonego podzbioru I0 ⊂ I zmienne losowe Xi , i ∈ I0 są niezależne. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność a brak korelacji Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność a brak korelacji Twierdzenie (Niezależność pociąga nieskorelowanie) Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn XY jest całkowalną zmienną losową i EXY = EX · EY . W szczególności niezależne zmienne losowe są nieskorelowane. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność a brak korelacji Twierdzenie (Niezależność pociąga nieskorelowanie) Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn XY jest całkowalną zmienną losową i EXY = EX · EY . W szczególności niezależne zmienne losowe są nieskorelowane. Uwaga: Bez założenia o niezależności warunek dostateczny dla całkowalności iloczynu XY odwołuje się do nierówności Höldera. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Brak korelacji a niezależność Niezależność stochastyczna Niezależność a brak korelacji Twierdzenie (Niezależność pociąga nieskorelowanie) Jeżeli zmienne losowe X i Y są niezależne i całkowalne, to iloczyn XY jest całkowalną zmienną losową i EXY = EX · EY . W szczególności niezależne zmienne losowe są nieskorelowane. Uwaga: Bez założenia o niezależności warunek dostateczny dla całkowalności iloczynu XY odwołuje się do nierówności Höldera. Wniosek (Mnożenie wartości oczekiwanych) Niech X1 , X2 , . . . , Xd będą niezależne. Jeżeli funkcje fi sa takie, że f1 (X1 ), f2 (X2 ), . . . , fd (Xd ) są całkowalnymi zmiennymi losowymi, tj. E |fi (Xi )| < +∞, i = 1, 2, . . . , d, to Ef1 (X1 )f2 (X2 ) · · · fd (Xd ) = Ef1 (X1 ) · Ef2 (X2 ) · · · · Efd (Xd ). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Rozkład łączny niezależnych zmiennych losowych Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Rozkład łączny niezależnych zmiennych losowych Twierdzenie Zmienne losowe X1 , X2 , . . . , Xd są niezależne wtedy, i tylko wtedy, gdy dla dowolnych liczb a1 , a2 , . . . , ad ma miejsce równość P(X1 ¬ a1 , X2 ¬ a2 , . . . , Xd ¬ ad ) = P(X1 ¬ a1 )P(X2 ¬ a2 ) · . . . · P(Xd ¬ ad ). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Rozkład łączny niezależnych zmiennych losowych Twierdzenie Zmienne losowe X1 , X2 , . . . , Xd są niezależne wtedy, i tylko wtedy, gdy dla dowolnych liczb a1 , a2 , . . . , ad ma miejsce równość P(X1 ¬ a1 , X2 ¬ a2 , . . . , Xd ¬ ad ) = P(X1 ¬ a1 )P(X2 ¬ a2 ) · . . . · P(Xd ¬ ad ). Innymi słowy F(X1 ,X2 ,...,Xd ) (a1 , a2 , . . . , ad ) = FX1 (a1 ) · FX2 (a2 ) · . . . · FXd (ad ), tzn. dystrybuanta rozkładu łącznego niezależnych zmiennych losowych jest iloczynem dystrybuant brzegowych. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Produkt rozkładów Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Produkt rozkładów Definicja Rozkład prawdopodobieństwa µ na Rd nazywamy produktem rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem dystrybuant Fµ1 , Fµ2 , . . . , Fµd : Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Produkt rozkładów Definicja Rozkład prawdopodobieństwa µ na Rd nazywamy produktem rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem dystrybuant Fµ1 , Fµ2 , . . . , Fµd : Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ). Zapisujemy: µ = µ 1 × µ2 × . . . × µ d . Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Produkt rozkładów Definicja Rozkład prawdopodobieństwa µ na Rd nazywamy produktem rozkładów µ1 , µ2 , . . . , µd na R1 , jeśli dystrybuanta Fµ jest iloczynem dystrybuant Fµ1 , Fµ2 , . . . , Fµd : Fµ (a1 , a2 , . . . , ad ) = Fµ1 (a1 ) · Fµ2 (a2 ) · . . . · Fµd (ad ). Zapisujemy: µ = µ 1 × µ2 × . . . × µ d . Wniosek Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy ich rozkład łączny jest produktem rozkładów brzegowych: P(X1 ,X2 ,...,Xd ) = PX1 × PX2 × . . . × PXd . Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Przykład Niech wyniki i-tego eksperymentu będą elementami skończonej przestrzeni Ωi . Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Przykład Niech wyniki i-tego eksperymentu będą elementami skończonej przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie klasycznym prawdopodobieństwem na Ω. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Przykład Niech wyniki i-tego eksperymentu będą elementami skończonej przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie klasycznym prawdopodobieństwem na Ω. Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi ) są stochastycznie niezależne. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Przykład Niech wyniki i-tego eksperymentu będą elementami skończonej przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie klasycznym prawdopodobieństwem na Ω. Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi ) są stochastycznie niezależne. Uwaga: W tym szczególnym przypadku niezależność stochastyczna pokrywa się z niezależnością funkcyjną (zmienne Xi w istocie są funkcjami różnych argumentów). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Klasyczne prawdopodobieństwo na produkcie Przykład Niech wyniki i-tego eksperymentu będą elementami skończonej przestrzeni Ωi . Połóżmy Ω = Ω1 × Ω2 × . . . × Ωd . Niech P będzie klasycznym prawdopodobieństwem na Ω. Wtedy dla dowolnych funkcji fi : Ωi → R1 , zmienne losowe Xi (ω1 , ω2 , . . . , ωd ) = fi (ωi ) są stochastycznie niezależne. Uwaga: W tym szczególnym przypadku niezależność stochastyczna pokrywa się z niezależnością funkcyjną (zmienne Xi w istocie są funkcjami różnych argumentów). Przewaga niezależności stochastycznej polega na uwolnieniu tej własności od konkretnej przestrzeni funkcyjnej. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność dyskretnych zmiennych losowych Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność dyskretnych zmiennych losowych Twierdzenie Niech rozkłady zmiennych X1 , X2 , . . . , Xd będą dyskretne. Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy dla dowolnych x1 , x2 , . . . , xd ∈ R1 ma miejsce związek P(X1 = x1 , X2 = x2 , . . . , Xd = xd ) = P(X1 = x1 )P(X2 = x2 ) · · · P(Xd = xd ). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność absolutnie ciągłych zmiennych losowych Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność absolutnie ciągłych zmiennych losowych Twierdzenie Niech rozkłady zmiennych X1 , X2 , . . . , Xd będą absolutnie ciągłe z gęstościami p1 (x), p2 (x), . . . , pd (x). Zmienne losowe X1 , X2 , . . . , Xd są niezależne dokładnie wtedy, gdy rozkład łączny tych zmiennych jest absolutnie ciągły (tzn. posiada gęstość względem miary Lebesgue’a na Rd ) i jego gęstość ma postać pX~ (x1 , x2 , . . . , xd ) = p1 (x1 )p2 (x2 ) · · · pd (xd ). Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność zdarzeń Definicja Rodzina zdarzeń {Ai }i∈I ⊂ F jest niezależna, jeśli dla dowolnego skończonego podzbioru I0 ⊂ I P \ Ai = Πi∈I0 P(Ai ). i∈I0 Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność a rozkład łączny Kryteria niezależności Niezależność zdarzeń Niezależność zdarzeń Definicja Rodzina zdarzeń {Ai }i∈I ⊂ F jest niezależna, jeśli dla dowolnego skończonego podzbioru I0 ⊂ I P \ Ai = Πi∈I0 P(Ai ). i∈I0 Uwaga: można pokazać, że rodzina zdarzeń jest niezależna, gdy rodzina zmiennych losowych {1I Ai }i∈I jest niezależna. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność parami Niezależność parami Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność parami Niezależność parami Definicja Zmienne losowe {Xi }i∈I są niezależne parami, jeśli dla każdych i, j ∈ I, i 6= j, zmienne Xi i Xj są niezależne. Podobnie, zdarzenia {Ai }i∈I są niezależne parami, jeśli każde dwa zdarzenia Ai i Aj , i 6= j są niezależne. Statystyka i eksploracja danych Wykład IV: Niezależność Niezależność Podstawowe kryteria niezależności Niezależność parami Niezależność parami Niezależność parami Definicja Zmienne losowe {Xi }i∈I są niezależne parami, jeśli dla każdych i, j ∈ I, i 6= j, zmienne Xi i Xj są niezależne. Podobnie, zdarzenia {Ai }i∈I są niezależne parami, jeśli każde dwa zdarzenia Ai i Aj , i 6= j są niezależne. Zadanie: Podać przykład zdarzeń niezależnych parami, ale zależnych zespołowo (np. przykład Bernsteina). Statystyka i eksploracja danych Wykład IV: Niezależność