Prawdopodobienstwo i statystyka
Transkrypt
Prawdopodobienstwo i statystyka
Informacje ogólne Co to jest... Formalizm TP i SM Prawdopodobieństwo i statystyka Wykład I: Formalizm teorii prawdopodonieństwa 6 października 2014 Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Forma zaliczenia Literatura Dostępność treści wykładów Forma zaliczenia przedmiotu 1 2 Zaliczenie ćwiczeń rachunkowych. Egzamin dwuczęściowy: Egzamin pisemny (rozwiązywanie zadań). Egzamin ustny z teorii. 3 Do wykładu są prowadzone kursy wyrównawcze, gdzie osoby mające trudności z rachunkami, będą mogły uzupełnić swoje umiejętności. 4 Podstawą zajęć wyrównawczych jest opracowanie „Statystyka i eksploracja danych. Repetytorium z teorii prawdopodobieństwa”. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Prawdopodobieństwo i statystyka Forma zaliczenia Literatura Dostępność treści wykładów Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Forma zaliczenia Literatura Dostępność treści wykładów Literatura podstawowa 1 J. Jakubowski i R. Sztencel „Wstęp do teorii prawdopodobieństwa”, Script, Warszawa 2004. 2 W. Niemiro „Rachunek prawdopodobieństwa i statystyka matematyczna”, Szkoła Nauk Ścisłych, Warszawa 1999. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Forma zaliczenia Literatura Dostępność treści wykładów Literatura uzupełniająca 1 J.L Johnson „Probability and Statistics for Computer Science”, Wiley 2003. 2 R. Zieliński „Siedem wykładów wprowadzających do statystyki matematycznej”, PWN Warszawa 1990. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Forma zaliczenia Literatura Dostępność treści wykładów Zagadnienia omawiane na wykładach będą dostępne: na mojej stronie www.mat.umk/∼adjakubo; w opracowaniu „Statystyka i eksploracja danych” w bibliotece WMiI. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Co to jest ... Prognozy wyborcze Co to jest ... Rachunek prawdopodobieństwa to sztuka (umiejętność) obliczania prawdopodobieństw zdarzeń. Teoria prawdopodobieństwa to dział matematyki, na którym opierają się praktyczne obliczenia dokonywane w rachunku prawdopodobieństwa. Statystyka to sztuka (umiejętność) wnioskowania na podstawie próby losowej. Statystyka matematyczna to dział matematyki, który rozwija metody uzasadniające poprawność wnioskowania statystycznego. Eksploracja danych (drążenie danych, ekstrakcja danych) to umiejętność wydobywania użytecznych informacji z wielkich zbiorów danych. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Co to jest ... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 PO PiS RP SLD PSL PJN Frekwencja OBOP 7.10.11 39,5% 29,1% 10,3% 9,2% 8,7% 1,8% 47,5% Prawdopodobieństwo i statystyka PKW wyniki 39,18% 28,89% 10,02% 8,24% 8,36% 2,19% 48,87 % Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Co to jest ... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 PO PiS RP SLD PSL PJN Frekwencja OBOP ”Exit pools” 39,6% 30,1% 10,1% 7,7% 8,2% 2,2% 47,7% Prawdopodobieństwo i statystyka PKW wyniki 39,18% 28,89% 10,02% 8,24% 8,36% 2,19% 48,87 % Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Co to jest ... Prognozy wyborcze Przykład. Wybory parlamentarne 9 października 2011 PO PiS RP SLD PSL PJN Homo Homini ”Exit pools” 37,3% 29,1% 8,6% 11,6% 9,5% 2,3% Prawdopodobieństwo i statystyka PKW wyniki 39,18% 28,89% 10,02% 8,24% 8,36% 2,19% Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady „Słowniczek” teorii prawdopodobieństwa Definicja przestrzeni probabilistycznej Przestrzenią probabilistyczną nazywamy trójkę (Ω, F, P), gdzie Ω jest zbiorem „zdarzeń elementarnych” (inaczej: elementy ω zbioru Ω nazywamy zdarzeniami elementarnymi). F jest σ-algebrą podzbiorów zbioru Ω. Elementy F nazywamy zdarzeniami. P : F → [0, 1] jest prawdopodobieństwem na (Ω, F). Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Interpretacja formalizmu Ω to zbiór wszystkich możliwych wyników eksperymentu losowego. Zdarzenia (elementy F) reprezentują fakty, których zajście możemy stwierdzić, tzn. dla A ∈ F zawsze możemy powiedzieć, czy wynik ω ∈ A, czy ω 6∈ A. W ten sposób F reprezentuje całość wiedzy, którą możemy uzyskać w wyniku realizacji eksperymentu losowego. ∅ ∈ F nigdy nie może zajść (jest zdarzeniem „niemożliwym”), więc P(∅) = 0. Ale idziemy dalej: P(A) = 0 oznacza, że zdarzenie A jest „niemożliwe”, choć może być A 6= ∅. Ω ∈ F zachodzi „zawsze” (jest zdarzeniem „pewnym”), więc P(Ω) = 1. Podobnie: P(A) = 1 oznacza, że zdarzenie A jest „pewne”, choć może być A Ω. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Definicje matematyczne Stwierdzenie „F jest σ-algebrą” oznacza, że: 1 ∅ ∈ F, Ω ∈ F. 2 Jeżeli A ∈ F, to również Ac ∈ F. 3 Jeżeli A1 , A2 , . . . ∈ F, to S∞ j=1 Aj ∈ F. Zauważmy związki działań na zbiorach i działań logicznych na „faktach”. Może być F = 2Ω , ale w ogólności F Prawdopodobieństwo i statystyka 2Ω (interpretacja!). Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Definicje matematyczne - cd. Stwierdzenie „P : F → [0, 1] jest prawdopodobieństwem” oznacza, że: 1 P(∅) = 0, P(Ω) = 1. 2 Jeżeli zdarzenia A1 , A2 , . . . , An są parami rozłączne (tzn. Ai ∩ Aj = ∅ dla i, j = 1, 2, . . . . , n, i 6= j), to n X P( Aj ) = j=1 3 n X P(Aj ). j=1 Jeżeli zdarzenia A1 , A2 , . . . ∈ F tworzą ciąg wstępujący (tzn. Ai ⊂ Ai+1 dla i = 1, 2, . . . .), to P( ∞ [ Aj ) = lim P(Aj ). j=1 Prawdopodobieństwo i statystyka j→∞ Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Definicje matematyczne - cd. Własność P( nj=1 Aj ) = nj=1 P(Aj ) dla ciągów parami rozłącznych nazywamy addytywnością prawdopodobieństwa. Własność P(∪∞ j=1 Aj ) = limj→∞ P(Aj ) dla ciągów rosnących nazywamy ciągłością z dołu prawdopodobieństwa. Warunki 1-3 w powyższej definicji nie są „minimalne”. Minimalny zbiór warunków określający prawdopodobieństwo możemy zapisać np. tak: P P P(Ω) = 1. Jeżeli A1 , A2 , . . . , są parami rozłączne, to ∞ ∞ X X P( Aj ) = P(Aj ). j=1 j=1 (prawdopodobieństwo jest σ- addytywne). Zauważmy, że P(∪Aj ) na sens w obu przypadkach, bo F jest σ-algebrą. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Własności prawdopodobieństwa Twierdzenie (Własności prawdopodobieństwa) 1 Jeżeli A, B ∈ F, A ⊂ B, to P(A) ¬ P(B). 2 Jeżeli A, B ∈ F, A ⊂ B, to P(B \ A) = P(B) − P(A). 3 W szczególności, jeżeli A ∈ F, to P(Ac ) = 1 − P(A). 4 (Własność subaddytywności) Dla dowolnych A1 , A2 , . . . ∈ F P( [ Aj ) ¬ j 5 X P(Aj ). j (Ciągłość z góry). Jeżeli zbiory A1 , A2 , . . . ∈ F są zstępujące, tzn. A1 ⊃ A2 ⊃ . . ., to P( ∞ \ Aj ) = lim P(Aj ). j=1 Prawdopodobieństwo i statystyka j→∞ Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Zasada włączen i wyłączeń Twierdzenie (Zasada włączeń i wyłączeń) Dla dowolnych A1 , A2 , . . . , An ∈ F P( n [ Aj ) = j=1 n X P(Aj ) j=1 − X P(Ai ∩ Aj ) 1¬i<j¬n + X P(Ai ∩ Aj ∩ Ak ) 1¬i<j<k¬n − . . . + (−1)n+1 P(A1 ∩ A2 ∩ . . . ∩ An ). Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Przykłady „Klasyczna definicja prawdopodobieństwa”. Niech Ω będzie zbiorem skończonym i niech F = 2Ω . Określamy P(A) = #A . #Ω („Zasada racji dostatecznej Laplace’a”.) „Prawdopodobieństwo dyskretne”. Niech Ω0 = {ω1 , ω2 , . . .} będzie podzbiorem przeliczalnym zbioru Ω. Niech P P p1 , p2 , . . . 0, j pj = 1. Przyjmując z definicji ∅ ≡ 0, określamy X P(A) = pj . {j : ωj ∈A} (F = 2Ω !) Prawdopodobieństwo i statystyka Wykład I: Formalizm TP Informacje ogólne Co to jest... Formalizm TP i SM Słowniczek TP Przykłady Przykłady cd. Niech Ω = R1 i p(x) 0 będzie funkcją na R1 taką, że −∞ p(x) dx = 1. Określamy: R +∞ Z b P((a, b]) = p(x) dx, a a < b, a, b ∈ R1 . Jak wygląda F? To problem badany przez teorię miary i całki Lebesgue’a. Można pokazać, że nie istnieje prawdopodobieństwo 1 Q : 2R → [0, 1] pokrywające się z P na odcinkach. Z drugiej strony istnieje σ-algebra B 1 (tzw. zbiorów borelowskich) na którą można rozszerzyć funkcję P, tak aby spełnione były własności prawdopodobieństwa. Prawdopodobieństwo i statystyka Wykład I: Formalizm TP