1. Rozkłady empiryczne UWAGA: Zadania 1.4.x pochodzą ze

Transkrypt

1. Rozkłady empiryczne UWAGA: Zadania 1.4.x pochodzą ze
1. Rozkłady empiryczne
UWAGA: Zadania 1.4.x pochodzą ze skryptu do wykładu ze Statystyki prof. W. Niemiro.
Zadanie 1.4.1 Niech X1 , . . . , Xn będzie próbą losową prostą z rozkładu o dystrybuancie
F . Oblicz E F̂ (x), V arF̂ (x), Cov(F̂ (x), F̂ (y)).
p
Zadanie 1.4.2 Pokazać, że ciąg zmiennych losowych (n)(F̂n (x) − F (x)) jest zbieżny do
rozkładu normalnego. Zidentyfikować parametry tego rozkładu.
Zadanie 3 Mając następujący szereg rozdzielczy punktowy:
xi
ni
0
1
2
3
4 5 6 7
78 164 160 101 52 23 8 2
oblicz średnią z próby, wariancję próbkową i medianę. Porównaj rozkład empiryczny z
prawdopodobieństwami rozkładu Poiss(2). Wyznacz dystrybuantę empiryczną.
Zadanie 4 Czas oczekiwania na wizytę u specjalisty trzystu losowo wybranych pacjentów
ma następujący rozkład empiryczny:
Czas oczekiwania w minutach
Liczba pacjentów
0-5 5-10 10-15 15-20 20-25
46
66
70
68
50
a) jaki jest przeciętny czas oczekiwania na wizytę?
b) narysuj histogram,
c) oblicz odchylenie próbkowe, drugi moment centralny.
Zadanie 1.4.3 Pokazać, że zmienna losowa Xk:n ma dystrybuantę
n X
n
P (Xk:n ≤ x) =
F (x)i (1 − F (x))n−i .
i
i=k
Zadanie 1.4.4 Pokaż, że jeśli zmienne losowe Xi mają gęstość f (x) = (d/dx)F (x), to
k-ta statystyka pozycyjna ma gęstość
n−1
d
P (Xk:n ≤ x) = c
f (x)F (x)k−1 (1 − F (x))n−k .
dx
k−1
Zadanie 1.4.5 Obliczyć EUk:n , gdzie Uk:n oznacza statystykę pozycyjną z rozkładu jednostajnego U (0, 1).
Zadanie 1.4.6 Załóżmy (dla uproszczenia, to nie jest istotne), że dystrybuanta F jest
funkcją ciągłą i ściśle rosnącą, a zatem istnieje funkcja odwrotna F −1 :]0, 1[−→ R. Pokazać, że jeśli U ∼ U (0, 1) to zmienna losowa X := F −1 (U ) ma dystrybuantę F .
Zadanie 1.4.7 (Ciąg dalszy) Pokazać, że Xk:n = F −1 (Uk:n ).
1
Zadanie 1.4.8 Wskazać numer statystyki pozycyjnej, która jest p − tym kwantylem
próbkowym. Która statystyka pozycyjna jest najmniejszym kwantylem (w sytuacji niejednoznaczności)? Która jest największym?
Zadanie 11 Rejestrujemy wiek pacjentów zgłaszających się na badania profilaktyczne w
zakresie chorób nowotworowych. Zaobserwowano następujące wyniki: 27, 48, 27, 53, 51,
31, 58, 40, 66, 46, 29, 42, 41, 38, 25, 33, 46, 57, 33, 63. Dokonaj odpowiedniej agregacji
danych i sporządź histogram. Opisz charakter histogramu, wartości wskaźników położenia
i rozproszenia dla danych pogrupowanych.
Zadanie 12 Z partii bawełny pobrano próbkȩ złożona̧ z 64 włókien, a nastȩpnie zmierzono długości tych włókien (w mm). Otrzymano nastȩpuja̧ce wyniki: 23, 8, 15, 35, 21,
20, 10, 4, 28, 12, 9, 7, 24, 25, 31, 26, 23, 17, 13, 33, 29, 27, 24, 22, 32, 16, 9, 29, 22, 20,
8, 16, 21, 25, 31, 29, 23, 15, 32, 22, 23, 19, 24, 15, 21, 20, 29, 27, 23, 19, 16, 18, 24, 31,
28, 21, 8, 17, 24, 13, 12, 18, 23, 25. Zbudować szereg rozdzielczy, przyjmując liczbę klas
k = 8, a jako początek pierwszej klasy liczbę 3,5. Narysować histogram, tak dobierając
skalę na osi pionowej, aby pole histogramu było równe 1.
Zadanie 1.4.9 Udowodnić następujące stwierdzenie z rachunku prawdopodobieństwa:
Jeżeli EXn −→ a i V arXn −→ 0, to Xn −→P a (a jest liczbą).
2

Podobne dokumenty