Dwa odchylenia

Transkrypt

Dwa odchylenia
Joanna Kazana
Dwa odchylenia
Elementów statystyki naucza się już
w szkole podstawowej i w gimnazjum.
W szkole ponadgimnazjalnej uczniowie poznają sposoby opracowywania
danych, obliczania różnego rodzaju średnich, wariancji, czy odchylenia standardowego. Nabywają też umiejętność interpretowania tych wskaźników.
Na przykład, aby przeanalizować, ile
przyborów do pisania nosi średnio uczeń
do szkoły, mogą zebrać dane dotyczące
jednej klasy i obliczyć różne średnie
oraz odchylenie standardowe. Przy okazji takich analiz warto powiedzieć nieco
więcej o badaniach statystycznych dotyczących dużych populacji.
Zebranie danych z całej badanej grupy
byłoby bardzo pracochłonne, a czasem
wręcz niemożliwe. Wracając do przytoczonego przykładu, zbadanie średniej liczby przyborów do pisania wśród
uczniów np. wszystkich klas II byłoby
w dużej szkole sporym przedsięwzięciem, nie mówiąc już o opracowaniu
danych dotyczących całej szkoły lub
kilku szkół. Przy tak dużej populacji
konieczne jest analizowanie danych tylko
z pewnej losowo wybranej próby. Kwestia jej reprezentatywności jest dobrym
pretekstem do krótkiej dyskusji, która
może rozbudzić ciekawość uczniów.
Z którego wzoru liczyć?
W podręcznikach szkolnych odchylenie standardowe danych x1 , x2 , . . ., xn
o średniej arytmetycznej x oblicza się ze
wzoru:
σn =
(x1 −x)2 +(x2 −x)2 +...+(xn −x)2
n
Nie możemy jednak użyć tego wzoru,
gdy chcemy policzyć odchylenie standar-
32
dowe pewnej cechy populacji, a mamy
tylko dane dotyczące pewnej części tej
populacji (próbki). W wypadku, gdy
liczby x1 , x2 , . . ., xn reprezentują tylko
część elementów całej badanej populacji, odchylenie standardowe całej populacji powinniśmy obliczać z innego
wzoru: σn−1 =
(x1 −x)2 +(x2 −x)2 +...+(xn −x)2
n−1
Wzory różnią się tylko mianownikiem
wyrażenia pod pierwiastkiem: w pierwszym dzieli się przez n, a w drugim
przez n − 1. Możemy nawet obliczyć, że
z tego drugiego
otrzymamy liczbę
wzoru
większą o
n
n−1
· 100%.
Widać, że gdy danych jest dużo (liczba
n jest duża), wyniki otrzymane z tych
dwóch wzorów niewiele się różnią. Na
przykład, gdy mamy 10 danych, liczba
otrzymana z drugiego wzoru jest o około
5% większa, a gdy próbka ma 60 elementów, to liczba ta jest większa o mniej
niż 1%.
Kalkulatory o tym wiedzą
Na wielu kalkulatorach możemy obliczyć zarówno σn – „klasyczne” odchylenie standardowe, jak i σn−1 – odchylenie
standardowe liczone z próbki. Uczniowie mogą więc zadawać kłopotliwe pytania. Zwykle pytają się, po co dwa wzory,
skoro tak niewiele się od siebie różnią.
Może nawet uda nam się wyjaśnić, że
liczenie odchylenia standardowego pewnego zestawu liczb to zupełnie co innego
niż liczenie odchylenia standardowego
całej populacji na podstawie tylko części danych. Natychmiast jednak pojawi
STATYSTYKA
ML20 str. 32
sowane pojęcia rachunku prawdopodobieństwa. Warto jednak, byśmy sami
wiedzieli, skąd się bierze taki wzór na
σn−1 . Dlatego w poniższej ramce przedstawiam szkic rozumowania prowadzącego do tego wzoru.
się pytanie, skąd wiadomo, że to, co
obliczymy ze wzoru na σn−1 , rzeczywiście będzie odchyleniem standardowym
populacji. Niestety, w szkole średniej
nie mamy możliwości, by w pełni to
wyjaśnić, bo potrzebne są zbyt zaawan-
Niech X oznacza zmienną losową, zdefiniowaną za pomocą losowania ze zwracaniem
z badanej populacji. Przez Xi , gdzie i = 1, . . ., n, oznaczmy niezależne zmienne losowe
o takim samym rozkładzie jak X (za ich pomocą będziemy interpretować losowy wybór
n-elementowej próbki). Przyjmijmy też oznaczenia:
σ – odchylenie standardowe zmiennej X (i wszystkich zmiennych Xi ),
VarX = σ2 – wariancja zmiennych X, X1 , . . ., Xn ,
µ – wartość oczekiwana zmiennych losowych X, X1 , . . ., Xn , tzn. µ = EX = EXi dla i = 1, . . ., n.
Zarówno σ2 jak i µ są nieznane. Chcemy oszacować σ2 .
n
Definiujemy nową zmienną losową X: X = 1n
Xi
i=1
Będziemy korzystać ze wzoru: σ2 = VarX = EX 2 − (EX)2
(1)
Ze wzoru skróconego mnożenia mamy:
n
n
n
n
2
E(Xi − X)2 =
EXi2 − 2
E(Xi X) +
EX
(2)
Po skorzystaniu z równości (1), otrzymujemy:
n
n n
EXi2 =
(µ2 + σ2 ) = nµ2 + nσ2
(EXi )2 + VarXi =
(3)
i=1
i=1
i=1
i=1
i=1
i=1
n
i=1
n
X1 +...+Xn
n
(EXi X) =
EXi ·
i=1
i=1
n
n
1
2
= n
EXi +
EXi X j =
i=1
i = j
=
n
1
n
EXi
i=1
n
Xj
j=1
1 (n · EX 2
n
1
n
EXi X j =
= 1n
i, j = 1
+ n · (n − 1)EX1 X2 )
(4)
Ponieważ zmienne Xi są niezależne, to:
n
(EXi X) = 1n n · (µ2 + σ2 ) + n · (n − 1)µ2 = σ2 + nµ2
i=1
n
n
n
n
2
2
EX = n · EX = n · E 1n
Xi X = E
Xi X =
E(Xi X)
i=1
i=1
Stąd i z równości (5) wynika, że
i=1
n
(5)
i=1
2
EX = σ2 + nµ2
(6)
i=1
Po podstawieniu w równości (2) rezultatów otrzymanych w (3), (5) i (6) otrzymamy:
n
E(Xi − X)2 = nµ2 + nσ2 − 2 · (σ2 + nµ2 ) + σ2 + nµ2 = (n − 1)σ2
i=1
Stąd
1
σ2 = n−1
n
i=1
E(Xi − X)2 = E
1
n−1
n
(Xi − X)2
i=1
Inaczej mówiąc, „średnio” odchylenie standardowe zmiennej X (a więc i badanej populacji)
powinno być równe:
(X1 −X)2 +(X2 −X)2 +...+(Xn −X)2
n−1
STATYSTYKA
ML20 str. 33
33