Wykład 3

Transkrypt

Wykład 3
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
ORGANIZACJA BADANIA STATYSTYCZNEGO
Określenie:
a) populacji
b) jednostki populacji
c) cechy populacji
Metody badania statystycznego
1) Badanie pełne (badanie obejmuje całą populację)
2) Badanie częściowe (badanie odbywa się na
pewnych losowo wyodrębnionych elementach
populacji, czyli próbie losowej)
a) metoda reprezentacyjna
b) metoda monograficzna
c) metoda ankietowa
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
Charakterystyki położenia
- Średnia arytmetyczna:
1 n
x1 + x2 + ... + xn
X = ∑ Xi =
n i =1
n
1
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
- inne średnie:
średnia harmoniczna
średnia geometryczna
- Mediana
dla n nieparzystych
dla n parzystych
Charakterystyki rozproszenia
- Odchylenie przeciętne
1 n
d = ∑|xi − x |
n i =1
- Wariancja
1 n
s = ∑ ( xi − x )2
n i =1
2
- Odchylenie standardowe
2
s= s =
1 n
2
(
x
−
x
)
∑ i
n i =1
2
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
wartości typowe: (x – s , x + s)
- współczynnik zmienności
s
CV = ⋅100%
x
- kwartyle, decyle, centyle
Grupowanie danych
- proste (jedna cecha np. wg wieku)
- złożone (wiele cech np. wg wieku i płci)
Wartości cechy (np. wiek)
0 - 10
10 - 20
20 - 30
30 - 40
40 - 50
Liczebność
5
8
5
1
1
3
Częstość
0.25
0.40
0.25
0.05
0.05
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
Przedstawianie graficzne za pomocą histogramu
10
8
6
4
2
0
0 - 10
10-20
20 - 30 30 - 40 40 - 50
Estymacja - to dział wnioskowania statystycznego
będący zbiorem metod pozwalających na uogólnianie
wyników badania próby losowej na nieznaną postać i
parametry rozkładu zmiennej losowej całej populacji
oraz szacowanie błędów wynikających z tego
uogólnienia.
Metody estymacji parametrycznej można w zależności
od sposobu szacowania szukanego parametru podzielić
na dwie grupy:
- estymacja punktowa (szacowanie wartości)
- estymacja przedziałowa (szacowanie przedziałów ufności)
4
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
Estymatory punktowe
estymator wariancji
n
1
s2 =
( x i − x )2
∑
n − 1 i =1
suma kwadratów odchyleń od średniej
n
var X = ∑ ( x i − x )2
i =1
estymator odchylenia standardowego
2
s= s =
1 n
2
(
x
x
)
−
∑ i
n − 1 i =1
Estymatory przedziałowe
Przedział ufności dla średniej

s
s 
 X − t (α ;n −1)
, X + t (α ;n −1)

n
n

t(α; n−1): wartość krytyczna rozkładu t - Studenta
n-1lub v - stopnie swobody
α - poziom istotności (zazwyczaj przyjmujemy α=0,05
5
Wykład 3 - Statystyka matematyczna
Widzew 2007/2008
Poziom ufności: 1−α ustalone z góry
prawdopodobieństwo z jakim ten przedział pokrywa
nieznaną wartość parametru np. średniej
Przedział ufności dla wariancji

 var X
var X
, 2
 2
 χ  α ; n − 1  χ  1 − α ; n − 1 
2
 2









χ2 (α;
n − 1) jest wartością krytyczna rozkładu chi–kwadrat z v
stopniami swobody.
Przedział ufności dla odchylenia standardowego





var X
χ
2
var X
,
χ
 α

; n −1 

2


6
2
α


 1− ;n −1 
2






