Wykład 3
Transkrypt
Wykład 3
Wykład 3 - Statystyka matematyczna Widzew 2007/2008 ORGANIZACJA BADANIA STATYSTYCZNEGO Określenie: a) populacji b) jednostki populacji c) cechy populacji Metody badania statystycznego 1) Badanie pełne (badanie obejmuje całą populację) 2) Badanie częściowe (badanie odbywa się na pewnych losowo wyodrębnionych elementach populacji, czyli próbie losowej) a) metoda reprezentacyjna b) metoda monograficzna c) metoda ankietowa OPRACOWANIE MATERIAŁU STATYSTYCZNEGO Charakterystyki położenia - Średnia arytmetyczna: 1 n x1 + x2 + ... + xn X = ∑ Xi = n i =1 n 1 Wykład 3 - Statystyka matematyczna Widzew 2007/2008 - inne średnie: średnia harmoniczna średnia geometryczna - Mediana dla n nieparzystych dla n parzystych Charakterystyki rozproszenia - Odchylenie przeciętne 1 n d = ∑|xi − x | n i =1 - Wariancja 1 n s = ∑ ( xi − x )2 n i =1 2 - Odchylenie standardowe 2 s= s = 1 n 2 ( x − x ) ∑ i n i =1 2 Wykład 3 - Statystyka matematyczna Widzew 2007/2008 wartości typowe: (x – s , x + s) - współczynnik zmienności s CV = ⋅100% x - kwartyle, decyle, centyle Grupowanie danych - proste (jedna cecha np. wg wieku) - złożone (wiele cech np. wg wieku i płci) Wartości cechy (np. wiek) 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 Liczebność 5 8 5 1 1 3 Częstość 0.25 0.40 0.25 0.05 0.05 Wykład 3 - Statystyka matematyczna Widzew 2007/2008 Przedstawianie graficzne za pomocą histogramu 10 8 6 4 2 0 0 - 10 10-20 20 - 30 30 - 40 40 - 50 Estymacja - to dział wnioskowania statystycznego będący zbiorem metod pozwalających na uogólnianie wyników badania próby losowej na nieznaną postać i parametry rozkładu zmiennej losowej całej populacji oraz szacowanie błędów wynikających z tego uogólnienia. Metody estymacji parametrycznej można w zależności od sposobu szacowania szukanego parametru podzielić na dwie grupy: - estymacja punktowa (szacowanie wartości) - estymacja przedziałowa (szacowanie przedziałów ufności) 4 Wykład 3 - Statystyka matematyczna Widzew 2007/2008 Estymatory punktowe estymator wariancji n 1 s2 = ( x i − x )2 ∑ n − 1 i =1 suma kwadratów odchyleń od średniej n var X = ∑ ( x i − x )2 i =1 estymator odchylenia standardowego 2 s= s = 1 n 2 ( x x ) − ∑ i n − 1 i =1 Estymatory przedziałowe Przedział ufności dla średniej s s X − t (α ;n −1) , X + t (α ;n −1) n n t(α; n−1): wartość krytyczna rozkładu t - Studenta n-1lub v - stopnie swobody α - poziom istotności (zazwyczaj przyjmujemy α=0,05 5 Wykład 3 - Statystyka matematyczna Widzew 2007/2008 Poziom ufności: 1−α ustalone z góry prawdopodobieństwo z jakim ten przedział pokrywa nieznaną wartość parametru np. średniej Przedział ufności dla wariancji var X var X , 2 2 χ α ; n − 1 χ 1 − α ; n − 1 2 2 χ2 (α; n − 1) jest wartością krytyczna rozkładu chi–kwadrat z v stopniami swobody. Przedział ufności dla odchylenia standardowego var X χ 2 var X , χ α ; n −1 2 6 2 α 1− ;n −1 2