ĆWICZENIA nr 4

Transkrypt

ĆWICZENIA nr 4
ĆWICZENIA nr 4
Cel zajęć: Obliczanie oraz interpretacja parametrów statystycznych charakteryzujących
populację.
Wprowadzenie teoretyczne
Najważniejszą miarą zmienności populacji jest wariancja. Estymatorem wariancji jest tzw.
wariancja próbkowa:
s2 =
1 n
( x i − x )2
∑
n − 1 i =1
gdzie n jest liczebnością próby, xi jest elementem próby, jest średnią arytmetyczną z próby.
Mianem wariancji jest kwadrat miana badanej cechy. Aby uzyskać miarę zmienności o tym samym
mianie, co badana cecha, należy obliczyć odchylenie standardowe, czyli pierwiastek z wariancji:
= √ .
Miarą rozproszenia populacji są m.in. kwantyle. Kwantylem rzędu p nazywamy taką liczbę xp,
dla której 100p% populacji jest od niej nie mniejsze. Kwantylem rzędu 0.5 jest mediana. Kwartylem
górnym jest kwantyl rzędu 0.25. Kwartylem górnym jest kwantyl rzędu 0.75. Kwantyle rzędów 0.1,
0.2, …, 0.9 to decyle, a kwantyle rzędów 0.01, 0.02, …, 0.99 to percentyle.
Kolejnymi statystykami charakteryzującymi populację są tzw. momenty. Momentem zwykłym
pierwszego rzędu jest wartość oczekiwana. Momentem zwykłym rzędu l nazywamy średnią l-tych
potęg wartości próby:
1
= gdzie ∈ ℵ. Moment centralny rzędu l dany jest wzorem:
1
= − Widać, że momentem centralnym rzędu 2 jest wariancja. Moment centralny rzędu 3 służy do
obliczania współczynnika asymetrii (skośności):
= Czwarty moment centralny wykorzystywany jest do obliczania kurtozy (współczynnika koncentracji):
= Moment absolutny rzędu l dany jest wzorem:
1
= | |
Moment absolutny centralny rzędu l obliczamy jako:
1
= | − |
Momenty charakteryzują kształt rozkładu badanej cechy populacji.
Równie ważną informację uzyskujemy interpretując współczynnik zmienności oraz współczynnik
nierównomierności. Współczynnik zmienności ma wartość procentową:
= ∙ 100%
Współczynnik nierównomierności dany jest wzorem:
1 ∑| − |
#
"=
∙ 100% =
∙ 100%
gdzie d1 nazywamy odchyleniem przeciętnym od wartości średniej.
Zadania
1. Wykonać następujące czynności:
a. wczytać do Excela pliki średnia0_10.txt, średnia0_100.txt, średnia0_1000.txt,
b. wyznaczyć liczbę elementów prób,
c. wyznaczyć estymatory wartości oczekiwanej i wariancji dla każdej z prób,
d. porównać otrzymane wartości estymatorów z rzeczywistymi wartościami
parametrów,
e. obliczyć medianę dla każdej próby i zinterpretować jej wartość,
f. wyznaczyć maksymalną i minimalną wartość każdej próby,
g. czynności powtórzyć dla plików średnia5_10.txt, średnia5_100.txt,
średnia5_1000.txt.
2. Odpowiedzieć na następujące pytania.
a. Jak rozmiar próby wpływa na jakość estymatora?
b. Jak wartość wariancji wpływa na wartości elementów próby?
3. Poniższa tabela przedstawia procentową zawartość skrobi w każdym z 80 ziemniaków
wylosowanych z partii ziemniaków. Dla danego szeregu rozdzielczego obliczyć oraz
zinterpretować: średnią arytmetyczną, medianę, kwartyle, modę, odchylenie standardowe,
odchylenie przeciętne od średniej arytmetycznej, współczynnik asymetrii, kurtozy,
współczynnik zmienności, współczynnik nierównomierności.
zawartość procentowa skrobi
liczba ziemniaków
9 – 11
1
11 – 13
2
13 – 15
7
15 – 17
20
17 – 19
30
19 – 21
16
21 – 23
3
23 – 25
1
4. Dane są dwie próby:
I próba
80 40 40 80 40 80
II próba
40 80 120 80 120 40
Obliczyć, porównać i zinterpretować współczynniki zmienności i nierównomierności dla
obydwu prób.
Źródła:
Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek
prawdopodobieństwa i statystyka matematyczna w zadaniach – część II: Statystyka
matematyczna”, PWN, Warszawa 2004
Łomnicki A. „Wprowadzenie do statystyki dla przyrodników”, PWN, Warszawa 2007
Żuk B. „Biometria stosowana”, PWN, Warszawa 1989