1. Rozkłady empiryczne UWAGA: Zadania 1.4.x pochodzą ze
Transkrypt
1. Rozkłady empiryczne UWAGA: Zadania 1.4.x pochodzą ze
1. Rozkłady empiryczne UWAGA: Zadania 1.4.x pochodzą ze skryptu do wykładu ze Statystyki prof. W. Niemiro. Zadanie 1.4.1 Niech X1 , . . . , Xn będzie próbą losową prostą z rozkładu o dystrybuancie F . Oblicz E F̂ (x), V arF̂ (x), Cov(F̂ (x), F̂ (y)). p Zadanie 1.4.2 Pokazać, że ciąg zmiennych losowych (n)(F̂n (x) − F (x)) jest zbieżny do rozkładu normalnego. Zidentyfikować parametry tego rozkładu. Zadanie 3 Mając następujący szereg rozdzielczy punktowy: xi ni 0 1 2 3 4 5 6 7 78 164 160 101 52 23 8 2 oblicz średnią z próby, wariancję próbkową i medianę. Porównaj rozkład empiryczny z prawdopodobieństwami rozkładu Poiss(2). Wyznacz dystrybuantę empiryczną. Zadanie 4 Czas oczekiwania na wizytę u specjalisty trzystu losowo wybranych pacjentów ma następujący rozkład empiryczny: Czas oczekiwania w minutach Liczba pacjentów 0-5 5-10 10-15 15-20 20-25 46 66 70 68 50 a) jaki jest przeciętny czas oczekiwania na wizytę? b) narysuj histogram, c) oblicz odchylenie próbkowe, drugi moment centralny. Zadanie 1.4.3 Pokazać, że zmienna losowa Xk:n ma dystrybuantę n X n P (Xk:n ≤ x) = F (x)i (1 − F (x))n−i . i i=k Zadanie 1.4.4 Pokaż, że jeśli zmienne losowe Xi mają gęstość f (x) = (d/dx)F (x), to k-ta statystyka pozycyjna ma gęstość n−1 d P (Xk:n ≤ x) = c f (x)F (x)k−1 (1 − F (x))n−k . dx k−1 Zadanie 1.4.5 Obliczyć EUk:n , gdzie Uk:n oznacza statystykę pozycyjną z rozkładu jednostajnego U (0, 1). Zadanie 1.4.6 Załóżmy (dla uproszczenia, to nie jest istotne), że dystrybuanta F jest funkcją ciągłą i ściśle rosnącą, a zatem istnieje funkcja odwrotna F −1 :]0, 1[−→ R. Pokazać, że jeśli U ∼ U (0, 1) to zmienna losowa X := F −1 (U ) ma dystrybuantę F . Zadanie 1.4.7 (Ciąg dalszy) Pokazać, że Xk:n = F −1 (Uk:n ). 1 Zadanie 1.4.8 Wskazać numer statystyki pozycyjnej, która jest p − tym kwantylem próbkowym. Która statystyka pozycyjna jest najmniejszym kwantylem (w sytuacji niejednoznaczności)? Która jest największym? Zadanie 11 Rejestrujemy wiek pacjentów zgłaszających się na badania profilaktyczne w zakresie chorób nowotworowych. Zaobserwowano następujące wyniki: 27, 48, 27, 53, 51, 31, 58, 40, 66, 46, 29, 42, 41, 38, 25, 33, 46, 57, 33, 63. Dokonaj odpowiedniej agregacji danych i sporządź histogram. Opisz charakter histogramu, wartości wskaźników położenia i rozproszenia dla danych pogrupowanych. Zadanie 12 Z partii bawełny pobrano próbkȩ złożona̧ z 64 włókien, a nastȩpnie zmierzono długości tych włókien (w mm). Otrzymano nastȩpuja̧ce wyniki: 23, 8, 15, 35, 21, 20, 10, 4, 28, 12, 9, 7, 24, 25, 31, 26, 23, 17, 13, 33, 29, 27, 24, 22, 32, 16, 9, 29, 22, 20, 8, 16, 21, 25, 31, 29, 23, 15, 32, 22, 23, 19, 24, 15, 21, 20, 29, 27, 23, 19, 16, 18, 24, 31, 28, 21, 8, 17, 24, 13, 12, 18, 23, 25. Zbudować szereg rozdzielczy, przyjmując liczbę klas k = 8, a jako początek pierwszej klasy liczbę 3,5. Narysować histogram, tak dobierając skalę na osi pionowej, aby pole histogramu było równe 1. Zadanie 1.4.9 Udowodnić następujące stwierdzenie z rachunku prawdopodobieństwa: Jeżeli EXn −→ a i V arXn −→ 0, to Xn −→P a (a jest liczbą). 2