MIARY ZMIENNOŚCI

Transkrypt

MIARY ZMIENNOŚCI
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
CHARAKTERYSTYKI LICZBOWE
STRUKTURY ZBIOROWOŚCI
(c.d.)
1. miary połoŜenia - wykład 2
2. miary zmienności (dyspersji, rozproszenia)
3. miary asymetrii (skośności)
4. miary koncentracji
MIARY ZMIENNOŚCI
Miary zmienności charakteryzują stopień zróŜnicowania
jednostek zbiorowości pod względem badanej cechy.
Miary zmienności dzielą się na miary klasyczne i pozycyjne.
1. miary klasyczne (wariancja, odchylenie standardowe,
odchylenie przeciętne, współczynnik zmienności) oraz
2. miary pozycyjne (rozstęp, odchylenie ćwiartkowe,
współczynnik zmienności).
[1]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
[2]
Miary KLASYCZNE
Wariancja, odchylenie standardowe,
odchylenie przeciętne,
współczynnik zmienności (klasyczny)
2
Wariancję (s ) definiuje się jako średnią arytmetyczną
kwadratów odchyleń wartości cechy od średniej
arytmetycznej zbiorowości. Wariancja jest wielkością
mianowaną w kwadracie miana badanej cechy i
nie interpretujemy jej.
Odchylenie standardowe (s) jest pierwiastkiem
kwadratowym z wariancji. Jest ono wielkością mianowaną
tak samo jak badana cecha. Odchylenie standardowe określa
przeciętne zróŜnicowanie badanej cechy od średniej
arytmetycznej.
(d)
Odchylenie przeciętne
jest średnią arytmetyczną bezwzględnych
odchyleń wartości cechy od jej średniej arytmetycznej. Jest ono wielkością
mianowaną tak samo jak badana cecha. Odchylenie przeciętne
interpretujemy podobnie jak odchylenie standardowe.
Współczynnik zmienności (klasyczny) (Vs lub Vd) jest to
iloraz odchylenia standardowego (lub przeciętnego) przez
średnia arytmetyczną. Jest to wielkość niemianowana.
UŜywamy go do porównań zmienności w dwu lub więcej
zbiorowościach.
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Ocena rozproszenia
na podstawie obserwacji diagramów
Na rysunku pokazano dwa diagramy częstości (1) i (2).
Dla uproszczenia miary połoŜenia (średnia, mediana i
modalna) są sobie równe i identyczne dla obu zbiorowości.
• Mniejsze rozproszenie wokół średniej występuje
w zbiorowości (1).
Diagram jest smuklejszy i wyŜszy.
• Większe rozproszenie wokół średniej występuje
w zbiorowości (2).
Diagram jest bardziej rozłoŜysty i niŜszy.
Odchylenie standardowe w zbiorowości (1) jest mniejsze niŜ
w zbiorowości (2)
s1 < s2
[3]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Przedział TYPOWYCH wartości cechy
(miary klasyczne)
x − s < xtyp < x + s
Przedział taki ma tą własność, Ŝe około70% jednostek
badanej zbiorowości charakteryzuje się wartością cechy
naleŜącą do tego przedziału.
Reguła „3 sigma”
[4]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów szczegółowych
Wariancja
n
2
2
(
)
(
)
−
+
L
+
−
x
x
x
x
n
s2 = 1
n
2
(
)
x
−
x
∑ i
i =1
=
n
Odchylenie standardowe
n
(x1 − x )
2
s=
+ L + (xn − x )
=
n
2
2
(
)
x
−
x
∑ i
i =1
n
= s2
Odchylenie przeciętne
n
x1 − x + L + xn − x
d=
=
n
∑x −x
i
i =1
n
Współczynnik zmienności (klasyczny)
Vs =
s
x
lub
Vd =
d
x
PRZYKŁAD 1
Weźmy dane z przykładu 1 (wykład 2) o liczbie braków:
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4
Jak pamiętamy:
n=50
x = 0,8
[5]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Wariancja liczby braków:
2
2
(
)
(
)
x
−
x
+
L
+
x
−
x
50
s2 = 1
=
50
2
2
(0 − 0,8) + L + (4 − 0,8) = 68 = 1,36
=
50
50
Odchylenie standardowe:
s = s 2 = 1,36 ≈ 1,17
Odchylenie przeciętne:
x1 − x + L + x50 − x
d=
=
50
0 − 0,8 + L + 4 − 0,8 48
=
=
= 0,96
50
50
Współczynnik zmienności (klasyczny)
1,17
Vs =
= 1,46
0,8
lub
0,96
Vd =
= 1,2
0,8
[6]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów rozdzielczych punktowych
Wariancja
k
2
2
(
)
(
)
x
−
x
n
+
L
+
x
−
x
nk
1
k
s2 = 1
n
2
(
)
x
−
x
ni
∑ i
i =1
=
n
Odchylenie standardowe
k
(x1 − x )2 n1 + L + (xk − x )2 nk
s=
n
2
(
)
x
x
ni
−
∑ i
=
i =1
n
= s2
Odchylenie przeciętne
k
xi − x ni
x1 − x n1 + L + xk − x nk ∑
d=
= i =1
n
n
W przykładzie z liczbą braków obliczenia przedstawia poniŜsza tabela.
numer liczba
liczba
odchylenie
obliczenia dla wariancji
klasy braków wyrobów
przeciętne
xi − x ( xi − x )2 (xi − x )2 ni
xi − x ni
i
xi
ni
1
2
3
4
5
0
1
2
3
4
30
8
6
4
2
-0,8
0,2
1,2
2,2
3,2
0,64
0,04
1,44
4,84
10,24
19,20
0,32
8,64
19,36
20,48
24,0
1,6
7,2
8,8
6,4
razem
×
50
×
×
68,00
48,0
68
s =
= 1,36 s = 1,36 ≈ 1,17
50
Współczynnik zmienności (klasyczny)
2
1,17
Vs =
= 1,46
0,8
lub
48
d=
= 0,96
50
0,96
Vd =
= 1,2
0,8
[7]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów rozdzielczych przedziałowych
Wariancja
k
2
&
(
)
x
x
ni
−
∑ i
2
2
&
&
(
)
(
)
x
x
n
x
x
nk
−
+
L
+
−
2
1
1
k
s =
i =1
=
n
n
Odchylenie standardowe
k
(x&1 − x )2 n1 + L + (x&k − x )2 nk
s=
n
2
&
(
)
x
−
x
ni
∑ i
i =1
=
n
= s2
Odchylenie przeciętne
k
x&i − x ni
x&1 − x n1 + L + x&k − x nk ∑
d=
= i =1
n
n
PRZYKŁAD 2 - czas dojazdu pracowników firmy ZAUR
numer czas środek liczba
klasy dojazdu klasy pracow.
obliczenia dla wariancji
(x&i − x )2 (x&i − x )2 ni
odchylenie
przeciętne
i
x0i – x1i
x&i
ni
x&i − x
1
2
3
4
5
6
5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65
10
20
30
40
50
60
10
20
30
50
80
10
-30
-20
-10
0
10
20
900
400
100
0
100
400
9000
8000
3000
0
8000
4000
300
400
300
0
800
200
razem
×
×
200
×
×
32000
2000
Jak pamiętamy:
n=200
x = 40 [minut]
32000
s =
= 160 s = 160 ≈ 12,7
200
Współczynnik zmienności (klasyczny)
2
12,7
Vs =
= 0,32
40
x&i − x ni
lub
2000
d=
= 10
200
10
Vd =
= 0,25
40
[8]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
[9]
Miary POZYCYJNE
Rozstęp, odchylenie ćwiartkowe,
współczynnik zmienności (pozycyjny)
Rozstęp ( R )definiuje się jako róŜnicę pomiędzy największą i
najmniejszą wartością cechy:
R = xmax − xmin
Odchylenie ćwiatkowe (Q) jest miarą rozproszenia wartości
cechy od mediany. Definiuje się go jako połowę róŜnicy
pomiędzy trzecim i pierwszym kwartylem:
QIII − QI
Q=
2
Odchylenie ćwiartkowe mierzy poziom zróŜnicowania połowy
jednostek populacji. Odrzucane są jednostki o wartościach
badanej cechy poniŜej pierwszego kwartyla (25%) oraz
powyŜej trzeciego kwartyla (25%).
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
[10]
Współczynnik zmienności (pozycyjny) jest to iloraz
odchylenia ćwiartkowego przez medianę. Jest to wielkość
niemianowana. UŜywamy jej do porównań zmienności w dwu
lub więcej zbiorowościach.
Q
VQ =
Me
Przedział TYPOWYCH wartości cechy
(miary pozycyjne)
Definiujemy go podobnie jak w przypadku miar klasycznych
(rolę średniej przejmuje tutaj mediana, a rolę odchylenia
standardowego – odchylenie ćwiartkowe)
M e − Q < xtyp < M e + Q
Przedział ten będzie węŜszy od przedziału dla miar
klasycznych.
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów szczegółowych
PRZYKŁAD 3
Weźmy dane z przykładu 1 (liczba braków):
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4
Rozstęp:
R = xmax − xmin = 4 − 0 = 4
Odchylenie ćwiartkowe:
QI = x13 = 0
QII (Me) = (x25 + x26)/2 = (0+0)/2 = 0
QIII = x38 = 1
QIII − QI 1 − 0
=
= 0,5
Q=
2
2
Współczynnik zmienności (pozycyjny):
Q 0,5
VQ =
=
= ???
Me
0
Nie moŜna wyznaczyć !!!
Przedział typowych wartości cechy (pozycyjny):
M e − Q < xtyp < M e + Q
0 − 0,5 < xtyp < 0 + 0,5
− 0,5 < xtyp < 0,5
[11]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
PRZYKŁAD 4
Weźmy dane z przykładu 7 (wykład 2):
10, 10, 10, 12, 12,
13, 13, 14, 14, 15,
Rozstęp:
12, 12, 13, 13, 13,
15, 15
R = xmax − xmin = 15 − 10 = 5
Odchylenie ćwiartkowe:
QI = (x4 + x5)/2 = (12+12)/2 = 12
QII (Me) = x9 = 13
QIII = (x13 + x14)/2 = (14+14)/2 = 14
QIII − QI 14 − 12
Q=
=
=1
2
2
Współczynnik zmienności (pozycyjny):
Q
1
= ≈ 0,077
VQ =
M e 13
Przedział typowych wartości cechy (pozycyjny):
M e − Q < xtyp < M e + Q
13 − 1 < xtyp < 13 + 1
12 < xtyp < 14
[12]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów rozdzielczych punktowych
PRZYKŁAD 5
Dane z przykładu 5 (wykład 2).
czas
liczba
numer
klasy
obróbki
pracow[minuta]
ników
i
xi
ni
10
10
1
11
30
2
12
80
3
13
50
4
14
20
5
15
10
6
razem
R=x
×
liczebność
skumulowana
200
ni sk
10
40
120
170
190
200
×
− xmin = 15 − 10 = 5
max
Rozstęp:
Odchylenie ćwiartkowe:
QI = x3 = 12
QII (Me) = x3 = 12
QIII = x4 = 13
QIII − QI 13 − 12
Q=
=
= 0,5
2
2
Współczynnik zmienności (pozycyjny):
Q 0,5
VQ =
=
≈ 0,042
M e 12
Przedział typowych wartości cechy (pozycyjny):
12 − 0,5 < xtyp < 12 + 0,5
11,5 < xtyp < 12,5
[13]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
Dla szeregów rozdzielczych przedziałowych
PRZYKŁAD 6 Dane z przykładu 10 (wykład 2).
numer
klasy
liczba
pracowników
ni
10
20
30
50
80
10
skumul.
liczebność
i
1
2
3
4
5
6
czas
dojazdu
w ZAUR
x0i – x1i
5 – 15
15 – 25
25 – 35
35 – 45
45 – 55
55 – 65
razem
×
200
×
R=x
ni sk
10
30
60
110
190
200
− xmin = 65 − 5 = 60
max
Rozstęp:
Odchylenie ćwiartkowe:
QI ≈ 31,7
QII (Me) = 43
QIII = 50
QIII − QI 50 − 31,7
=
≈ 9,2
Q=
2
2
Współczynnik zmienności (pozycyjny):
Q 9,2
VQ =
=
≈ 0,213
M e 43
Przedział typowych wartości cechy (pozycyjny):
43 − 9,2 < xtyp < 43 + 9,2
33,8 < xtyp < 52,2
[14]
D. Miszczyńska, M.Miszczyński, Materiały do wykładu 3 ze Statystyki, 2009/10
[15]
Przykład 7 (praca domowa)
Płace (stawka godzinowa) w firmach A, B i C
klasa
i
1
2
3
4
5
×
Stawka
[zł/godz.]
x0i
x1i
2
4
4
6
6
8
8
10
10
12
razem
liczba pracowników (ni)
firma A
15
30
60
30
15
firma B
15
105
75
75
30
firma C
20
50
50
70
10
W ramach ćwiczenia wyznacz w kaŜdej z firm:
1. średnią
2. wariancję
3. odchylenie standardowe
4. medianę
5. modalną
6. na wspólnym wykresie narysuj diagramy częstości stawki
w firmach A, B i C
Uzyskany materiał będzie podstawą dla kolejnego wykładu.