Dwa odchylenia
Transkrypt
Dwa odchylenia
Joanna Kazana Dwa odchylenia Elementów statystyki naucza się już w szkole podstawowej i w gimnazjum. W szkole ponadgimnazjalnej uczniowie poznają sposoby opracowywania danych, obliczania różnego rodzaju średnich, wariancji, czy odchylenia standardowego. Nabywają też umiejętność interpretowania tych wskaźników. Na przykład, aby przeanalizować, ile przyborów do pisania nosi średnio uczeń do szkoły, mogą zebrać dane dotyczące jednej klasy i obliczyć różne średnie oraz odchylenie standardowe. Przy okazji takich analiz warto powiedzieć nieco więcej o badaniach statystycznych dotyczących dużych populacji. Zebranie danych z całej badanej grupy byłoby bardzo pracochłonne, a czasem wręcz niemożliwe. Wracając do przytoczonego przykładu, zbadanie średniej liczby przyborów do pisania wśród uczniów np. wszystkich klas II byłoby w dużej szkole sporym przedsięwzięciem, nie mówiąc już o opracowaniu danych dotyczących całej szkoły lub kilku szkół. Przy tak dużej populacji konieczne jest analizowanie danych tylko z pewnej losowo wybranej próby. Kwestia jej reprezentatywności jest dobrym pretekstem do krótkiej dyskusji, która może rozbudzić ciekawość uczniów. Z którego wzoru liczyć? W podręcznikach szkolnych odchylenie standardowe danych x1 , x2 , . . ., xn o średniej arytmetycznej x oblicza się ze wzoru: σn = (x1 −x)2 +(x2 −x)2 +...+(xn −x)2 n Nie możemy jednak użyć tego wzoru, gdy chcemy policzyć odchylenie standar- 32 dowe pewnej cechy populacji, a mamy tylko dane dotyczące pewnej części tej populacji (próbki). W wypadku, gdy liczby x1 , x2 , . . ., xn reprezentują tylko część elementów całej badanej populacji, odchylenie standardowe całej populacji powinniśmy obliczać z innego wzoru: σn−1 = (x1 −x)2 +(x2 −x)2 +...+(xn −x)2 n−1 Wzory różnią się tylko mianownikiem wyrażenia pod pierwiastkiem: w pierwszym dzieli się przez n, a w drugim przez n − 1. Możemy nawet obliczyć, że z tego drugiego otrzymamy liczbę wzoru większą o n n−1 · 100%. Widać, że gdy danych jest dużo (liczba n jest duża), wyniki otrzymane z tych dwóch wzorów niewiele się różnią. Na przykład, gdy mamy 10 danych, liczba otrzymana z drugiego wzoru jest o około 5% większa, a gdy próbka ma 60 elementów, to liczba ta jest większa o mniej niż 1%. Kalkulatory o tym wiedzą Na wielu kalkulatorach możemy obliczyć zarówno σn – „klasyczne” odchylenie standardowe, jak i σn−1 – odchylenie standardowe liczone z próbki. Uczniowie mogą więc zadawać kłopotliwe pytania. Zwykle pytają się, po co dwa wzory, skoro tak niewiele się od siebie różnią. Może nawet uda nam się wyjaśnić, że liczenie odchylenia standardowego pewnego zestawu liczb to zupełnie co innego niż liczenie odchylenia standardowego całej populacji na podstawie tylko części danych. Natychmiast jednak pojawi STATYSTYKA ML20 str. 32 sowane pojęcia rachunku prawdopodobieństwa. Warto jednak, byśmy sami wiedzieli, skąd się bierze taki wzór na σn−1 . Dlatego w poniższej ramce przedstawiam szkic rozumowania prowadzącego do tego wzoru. się pytanie, skąd wiadomo, że to, co obliczymy ze wzoru na σn−1 , rzeczywiście będzie odchyleniem standardowym populacji. Niestety, w szkole średniej nie mamy możliwości, by w pełni to wyjaśnić, bo potrzebne są zbyt zaawan- Niech X oznacza zmienną losową, zdefiniowaną za pomocą losowania ze zwracaniem z badanej populacji. Przez Xi , gdzie i = 1, . . ., n, oznaczmy niezależne zmienne losowe o takim samym rozkładzie jak X (za ich pomocą będziemy interpretować losowy wybór n-elementowej próbki). Przyjmijmy też oznaczenia: σ – odchylenie standardowe zmiennej X (i wszystkich zmiennych Xi ), VarX = σ2 – wariancja zmiennych X, X1 , . . ., Xn , µ – wartość oczekiwana zmiennych losowych X, X1 , . . ., Xn , tzn. µ = EX = EXi dla i = 1, . . ., n. Zarówno σ2 jak i µ są nieznane. Chcemy oszacować σ2 . n Definiujemy nową zmienną losową X: X = 1n Xi i=1 Będziemy korzystać ze wzoru: σ2 = VarX = EX 2 − (EX)2 (1) Ze wzoru skróconego mnożenia mamy: n n n n 2 E(Xi − X)2 = EXi2 − 2 E(Xi X) + EX (2) Po skorzystaniu z równości (1), otrzymujemy: n n n EXi2 = (µ2 + σ2 ) = nµ2 + nσ2 (EXi )2 + VarXi = (3) i=1 i=1 i=1 i=1 i=1 i=1 n i=1 n X1 +...+Xn n (EXi X) = EXi · i=1 i=1 n n 1 2 = n EXi + EXi X j = i=1 i = j = n 1 n EXi i=1 n Xj j=1 1 (n · EX 2 n 1 n EXi X j = = 1n i, j = 1 + n · (n − 1)EX1 X2 ) (4) Ponieważ zmienne Xi są niezależne, to: n (EXi X) = 1n n · (µ2 + σ2 ) + n · (n − 1)µ2 = σ2 + nµ2 i=1 n n n n 2 2 EX = n · EX = n · E 1n Xi X = E Xi X = E(Xi X) i=1 i=1 Stąd i z równości (5) wynika, że i=1 n (5) i=1 2 EX = σ2 + nµ2 (6) i=1 Po podstawieniu w równości (2) rezultatów otrzymanych w (3), (5) i (6) otrzymamy: n E(Xi − X)2 = nµ2 + nσ2 − 2 · (σ2 + nµ2 ) + σ2 + nµ2 = (n − 1)σ2 i=1 Stąd 1 σ2 = n−1 n i=1 E(Xi − X)2 = E 1 n−1 n (Xi − X)2 i=1 Inaczej mówiąc, „średnio” odchylenie standardowe zmiennej X (a więc i badanej populacji) powinno być równe: (X1 −X)2 +(X2 −X)2 +...+(Xn −X)2 n−1 STATYSTYKA ML20 str. 33 33