Cw nr 5: Wstęp do statystyki opisowej (wzory, i zadania)

Transkrypt

Cw nr 5: Wstęp do statystyki opisowej (wzory, i zadania)
Statystyka opisowa
Wzory
Szereg rozdzielczy
Liczba klas przedziału rozdzielczego
n – liczba pomiarów
k n
Szerokość przedziału rozdzielczego
R = xmax – xmin - rozstęp
d
R xmax  xmin

k
k
Miary tendencji centralnej
a1  a2  ...  an
n
x
Średnia arytmetyczna
n
Średnia na podstawie częstości (fi) wyników w próbie:
Średnia arytmetyczna ważona
nm – liczebność grupy m
m – kolejny numer grupy pomiarów
xm – średnia obliczona dla grupy m
xw 
x
fx
i i
i 1
n
n1  x1  n2  x2  ...  nm  xm
n1  n2  ...  nm
Średnia geometryczna (kiedy rozkład wyników jest prawoskośny)
n
n – liczba pomiarów
g  x1  x2  x3  ...  xn 
n
x
i 1
i
n
Klasyczne miary rozproszenia
Wariancja
SD – odchylenie standardowe
SD2 - wariancja
xi – wartość i –tego pomiaru
x –średnia pomiarów
i – numer kolejnego pomiaru (od 1 do N)
N – liczba dokonanych pomiarów
Odchylenie standardowe
SD 2 
V
i
 X )2
N 1
(X
SD  SD 2 
Klasyczny współczynnik zmienności
(X
i
 X )2
N 1
SD
x
Odchylenie przeciętne (średnie odchylenie bezwzględne)
n
d
Pozycyjne miary rozproszenia
Rozstęp
R  xmax  xmin
Rozstęp międzykwartylowy
RQ  Q3  Q1
Odchylenie ćwiartkowe
Q
Typowy obszar zmienności
Me – mediana
Q – odchylenie ćwiartkowe
Q3  Q1
2
Me  Q  xtyp  Me  Q
 x x
i 1
i
n
Pozycyjny współczynnik zmienności
VQ 
Q
Me
Miary asymetrii
AS 
Klasyczny współczynnik asymetrii (skośności)
Q1  Q3  2Me
Współczynniki asymetrii (skośności) AQ  Q  Q
3
1
x  Mo
SD
 xi  x 
n


As 

(n  1)(n  2)  SD 
3
m3
SD 3
1 n
m3   ( xi  x) 3
n i 1
AS 
Miary kształtu
Kurtoza, współczynnik skupienia
n

n(n  1)
3n(n  1) 2
4
K 
(
x

x
)


 i
 (n  1)(n  2)(n  3) i 1
 (n  2)(n  3)
K
m4
SD 4
m4 
1 n
( xi  x) 4

n i 1
Statystyka opisowa
Zadania
Zadanie 1.
Zgodnie z danymi posiadanymi przez Powiatowego Lekarza Weterynarii na terenie powiatu znajduje się
15 stad kóz o różnej liczebności (78, 27, 30, 1, 2, 32, 41, 57, 46, 2, 24, 21, 67, 3, 39). Na spotkaniu
poświęconym zwalczaniu chorób zakaźnych lekarz ma scharakteryzować populację kóz w swoim
powiecie. Zaproponuj sposób prezentacji posiadanych danych.
Zadanie 2.
W chlewni w sąsiadujących kojcach znajdowały się 3 lochy z prosiętami. Lochy pochodziły z jednego
miotu (pełne siostry, jednakowy wiek) i oprosiły się tego samego dnia. Wszystkie prosięta w
poszczególnych kojcach zważono i otrzymano następujące wyniki:
kojec A: 5,1; 4,8; 4,5; 4,7; 4,8; 4,9; 4,3; 4,5
kojec B: 12,7; 4,5; 4,5; 4,3; 4,8; 4,8; 5,1; 4,9
kojec C: 3,1; 2,8; 3,1; 2,1; 5,1; 4,8; 4,5; 4,7
Oblicz średnią masę prosiąt w każdym z kojców. Skomentuj wyniki.
Zadanie 3.
Zważono 600 brojlerów kurzych pochodzących z jednego kurnika. Pracę wykonywały 3 osoby.
Otrzymano następujące wyniki:
osoba A zważyła 100 brojlerów, a średnia masa brojlera wyniosła 1,4 kg
osoba B zważyła 200 brojlerów, a średnia masa brojlera wyniosła 1,7 kg
osoba C zważyła 300 brojlerów, a średnia masa brojlera wyniosła 1,8 kg
Oblicz średnią masę brojlera.
Zadanie 4.
Po zmianie paszy w stadzie kur niosek pojawiły się zwiększone upadki. W pierwszym dniu padło 16
ptaków, a w następnych dniach odpowiednio 20 i 36. Podaj średni dzienny wzrost liczby upadków w
stadzie w omawianym okresie.
Zadanie 5.
Lekarz wraz z właścicielem stada analizują wyniki tuczu brojlerów indyczych (indyczki, typ ciężki BIG
6). Tucz był prowadzony przez 20 tygodni. Co można zasugerować właścicielowi stada na podstawie
poniższych danych?
2
18
19
20
10,85
11,43
11,97
16
9,56
17
15
8,87
10,22
14
13
7,4
8,15
12
6,64
10
5,07
11
9
4,28
5,86
8
3,51
7
1,02
2,77
4
0,64
6
3
0,35
2,09
2
0,15
5
1
masa ciała (kg)
1,51
długość tuczu (tyg.)
Zadanie 6.
Zważono prosięta znajdujące się w jednym kojcu i otrzymano wyniki:
4,3; 4,5; 4,5; 4,8; 4,8; 4,9; 5,1; 12,7
a. Oblicz średnią masę prosiąt.
b. Oblicz medianę.
c. Podaj wartość modalną.
Porównaj obliczone wartości i skomentuj wyniki.
Zadanie 7.
Próbki krwi pochodzące od chomików syryjskich są w praktyce lekarsko – weterynaryjnej rzadko
przedmiotem badania w laboratoriach. W ciągu 8 lat swego istnienia, laboratorium jedynie
dziesięciokrotnie określało liczbę erytrocytów w krwi obwodowej chomików. Wyniki zestawiono w
poniższej tabeli. We krwi chomika z podejrzeniem krwotoku wewnętrznego stwierdzono 4,5 mln
erytrocytów w mm3. Czy wynik ten może potwierdzać diagnozę kliniczną?
nr pacjenta
liczba erytrocytów mln/mm
3
1
2
3
4
5
6
7
8
9
10
4,2
9,4
7,7
9,3
9,0
2,5
7,9
7,8
8,7
5,3
Zadanie 8.
W oborze A utrzymywane jest pięć krów o wydajnościach 5900, 6000, 6000, 6000 i 6100 kg mleka. W
oborze B krowy osiągają wydajności 3300, 4100, 6000, 6000 i 10600 kg mleka. Porównaj obie obory pod
względem wydajności mlecznej. Wyznacz dla każdej obory średnią wydajność mleczną, medianę,
wartość modalną, odchylenie standardowe, współczynnik zmienności i odchylenie przeciętne (średnie
odchylenie bezwzględne).
Zadanie 9.
Na podstawie danych dotyczących liczebności stad kóz zwartych w zadaniu nr 1 oblicz:
a. rozstęp
b. rozstęp międzykwartylowy
Zadanie 10.
Na podstawie danych zawartych w zadaniu nr 7 dotyczących liczby erytrocytów we krwi chomików
syryjskich oblicz:
a. odchylenie ćwiartkowe
b. typowy obszar zmienności
c. pozycyjny współczynnik zmienności
Zadanie 11.
W ciągu jednego dnia lekarz weterynarii zbadał 20 psów i zanotował ich temperaturę wewnętrzną: 38,3;
38,8; 38,8; 38,9; 39,0; 39,0; 39,0; 39,1; 39,1; 39,2; 39,2; 39,3; 39,7; 39,9; 40,0; 40,1; 40,1; 40,5; 40,6;
40,8.
Przedstaw w postaci histogramów:
a. rozkład liczebności przyjmując szerokość przedziałów szeregu rozdzielczego: 0,2 oC, 0,4oC i
0,5oC
b. rozkład częstości dla szerokości przedziału szeregu rozdzielczego 0,5 oC
c. rozkład liczebności skumulowanej dla szerokości przedziału szeregu rozdzielczego 0,5oC
d. rozkład częstości skumulowanej dla szerokości przedziału szeregu rozdzielczego 0,5 oC.
Zadanie 12.
Na podstawie danych zawartych w zadaniu nr 11 dotyczących temperatury wewnętrznej zbadanych psów:
a. scharakteryzuj rozkład zmiennej 14 obliczając miary tendencji centralnej (średnią arytmetyczną,
medianę, kwartyle i dominantę) oraz miary rozproszenia (odchylenie standardowe i klasyczny
współczynnik zmienności).
b. ocen asymetrię rozkładu danych
c. oceń skupienie rozkładu danych
3