Zmienne losowe, statystyki próbkowe
Transkrypt
Zmienne losowe, statystyki próbkowe
Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność oceny 1 2 3 4 5 [30, 36) [36, 42) [42, 48) [48, 54) [54, 60) - dst dst + db db + bdb Program wykładu 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału. 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu. 3 Testowanie hipotez statystycznych o wartości średniej oraz dla wariancji z populacji o rozkładzie normalnym. 4 Testowanie hipotez statystycznych dla proporcji. 5 Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. 6 Test Studenta i jego odmiana dla porównań parami. 7 Testy rangowe (Wilcoxona, Fishera-Yatesa, van der Waerdena, medianowy). 8 Testowanie zgodności z rozkładem normalnym. 9 Testy zgodności (testy Kołmogorowa, Kołmogorowa-Smirnowa, χ2 -zgodności). 10 Testy χ2 Pearsona niezależnosci i jednorodności. 11 Testowanie hipotez dla współczynnika korelacji. 12 Porównanie k średnich (analiza wariancji). 13 Analiza wariancji - testy post-hoc. 14 Porównywanie testów. Teoria Neymana–Pearsona. Literatura Bartoszewicz J., Wykłady ze statystyki matematycznej, PWN, Warszawa 1989 Gajek L., Kałuszka M., Wnioskowanie statystyczne, WNT, Warszawa 2000, wyd. IV. Koronacki, J. Mielniczuk J., Statytyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa, 2004 Krzyśko M., Statystyka matematyczna, Wyd. UAM, Poznan, 1996. Lehmann E.L.,Testowanie hipotez statystycznych, PWN, Warszawa 1968. Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru. Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru. Zmienne losowe dzielimy na: dyskretne (typu skokowego) - zmienna przyjmuje dowolne wartości ze zbioru skończonego albo przeliczalnego typu ciągłego - zmienna przyjmuje dowolne wartości z określonego przedziału Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru. Zmienne losowe dzielimy na: dyskretne (typu skokowego) - zmienna przyjmuje dowolne wartości ze zbioru skończonego albo przeliczalnego typu ciągłego - zmienna przyjmuje dowolne wartości z określonego przedziału Zmienne losowe oznaczamy dużymi literami, np.: X , Y , Z , natomiast małymi literami (x, y , z) oznaczamy wartości zmiennych losowych. Rozkład zmiennej losowej Definicja: Rozkład zmiennej losowej Dystrybuantą rozkładu zmiennej losowej X nazywamy funkcję FX (t) zdefiniowaną dla wszystkich t jako FX (t) = P(ω : X (ω) ¬ t) Rozkład zmiennej losowej Definicja: Rozkład zmiennej losowej Dystrybuantą rozkładu zmiennej losowej X nazywamy funkcję FX (t) zdefiniowaną dla wszystkich t jako FX (t) = P(ω : X (ω) ¬ t) Własności dystrybuanty FX jest niemalejąca limt→∞ FX (t) = 1 limt→−∞ FX (t) = 0 FX jest prawostronnie ciągła Rozkład zmiennej losowej Warto zauważyć, że dla ciągłej zmiennej losowej i dowolnych liczb a, b ∈ R P(X ¬ a) = FX (a) P(X a) = 1 − FX (a) P(a ¬ X ¬ b) = FX (b) − FX (a) Gęstość zmiennej losowej Definicja: Funkcją gęstości rozkładu dyskretnej zmiennej losowej X nazywamy funkcję fX (t) zdefiniowaną dla wszystkich t jako fX (t) = P(ω : X (ω) = t) Definicja: Funkcją gęstości rozkładu ciągłej zmiennej losowej X nazywamy funkcję fX (t) zdefiniowaną dla wszystkich t jako Z t FX (t) = −∞ fX (s)ds Własności gęstości zmiennej losowej Uwaga! d FX (t) = fX (t) dt Każda funkcja, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład prawdopodobieństwa pewnej zmiennej. Własności gęstości zmiennej losowej Uwaga! d FX (t) = fX (t) dt Każda funkcja, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład prawdopodobieństwa pewnej zmiennej. Twierdzenie Funkcja f (x) jest gęstością pewnej zmiennej losowej wtedy i tylko wtedy, gdy 1 f (x) 0 2 R∞ −∞ f (t)dt =1 Próba losowa Definicja: Wektor zmiennych losowych X = (X1 , X2 , . . . Xn )0 nazywamy próbą losową rozmiaru n z rozkładu o gęstości fX (x) jeśli X1 , X2 , . . . , Xn są niezależnymi zmiennymi losowymi o wspólnym rozkładzie z gęstością f (x) Próba losowa Definicja: Wektor zmiennych losowych X = (X1 , X2 , . . . Xn )0 nazywamy próbą losową rozmiaru n z rozkładu o gęstości fX (x) jeśli X1 , X2 , . . . , Xn są niezależnymi zmiennymi losowymi o wspólnym rozkładzie z gęstością f (x) Niech X1 , X2 , . . . , Xn będą niezależnymi zmiennymi losowymi o gęstościach f (x1 ), f (x2 ), . . . , f (xn ) odpowiednio. Gęstość łączna wektora losowego X wygląda następująco: f (x) = f (x1 , x2 , . . . , xn ) = f (x1 )f (x2 ) · · · f (xn ) = n Y f (xi ), i=1 natomiast dystrubuanta łączna: F (x) = F (x1 , x2 , . . . , xn ) = F (x1 )F (x2 ) · · · F (xn ) = n Y i=1 F (xi ) Statystyki próbkowe Niech X = (X1 , X2 , . . . Xn )0 będzie n elementową próbą losową. Definicja: Średnią z próby nazywamy statystykę: n 1X X̄ = Xi n i=1 Definicja: Wariancją z próby nazywamy statystykę: S2 = n 1 X (Xi − X̄ )2 n − 1 i=1 Rozkłady statystyk próbkowych Jeżeli X = (X1 , X2 , . . . Xn )0 jest próbą losową z rozkładu normalnego, tj Xi ∼ N(µ, σ 2 ) to: X̄ = n 1X Xi ∼ N(µ, σ 2 /n) n i=1 nS 2 ∼ χ2 (n − 1) σ2 Zmienne X̄ i S 2 są niezależnymi zmiennymi losowymi Rozkłady statystyk próbkowych Twierdzenie Niech X1 , X2 , . . . Xn będzie n elementową próbą losową, o średniej EXi = µ, i wariancji VarXi = σ 2 < ∞ Wówczas: 1 E X̄ = µ 2 Var X̄ = 3 ES 2 = 4 VarS 2 = σ2 n σ2 2 4 n−1 σ Statystki dostateczne Definicja Statystyka T nazywa się statystyką dostateczną dla θ (statystyką dostateczną dla P), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy P(·|T = t) nie zależy od θ. Statystki dostateczne Definicja Statystyka T nazywa się statystyką dostateczną dla θ (statystyką dostateczną dla P), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy P(·|T = t) nie zależy od θ. Twierdzenie (kryterium faktoryzacji) Statystyka T jest dostateczna wtedy i tylko wtedy, gdy gęstość rozkładu prawdopodobieństwa próby X1 , X2 , . . . , Xn można przedstawić w postaci fθ (x1 , x2 , · · · , xn ) = gθ (T (x1 , x2 , . . . , xn ))h(x1 , x2 , · · · , xn ), gdzie funkcja h nie zależy od θ, a funkcjagθ , zależna od θ, zależy od x1 , x2 , · · · , xn tylko poprzez wartość statystyki T. Wykładnicze rodziny rozkładów Definicja Rodzina rozkładów prawdopodobieństwa {Pθ , θ ∈ Θ} nazywa się wykładniczą rodziną rozkładów, gdy gęstości tych rozkładów są postaci: n X f (x; θ) = C (θ) exp Qj (θ)Tj (x) · h(x), j=1 gdzie Qj , Tj , j = 1, 2, . . . , k, C i h są pewnymi funkcjami.