Statystyka Opisowa Wzory

Transkrypt

Statystyka Opisowa Wzory
Statystyka Opisowa
Wzory
Szereg rozdzielczy:
xi - wartości cechy
ni - liczebności wartości cechy
N   ni - liczebność całej zbiorowości
Wskaźnik natężenia przy rysowaniu wykresu szeregu rozdzielczego
przedziałowego o nierównych przedziałach:
wskaźnik
natężenia

liczebnosć klasy  rozpiętosć najwęższej (najszerszej ) klasy
rozpiętosć klasy
Liczba klas w szeregu rozdzielczym: k  5log N
Rozpiętość klas w szeregu rozdzielczym: i 
xmax  xmin
k
www.etrapez.pl Krystian Karczyński
Strona 1
I.
Miary średnie
xn
i i
Średnia arytmetyczna:
Średnia harmoniczna:
N
N

Średnia geometryczna:
N
1
x1
ni
x
ni
i
Dominanta: D  Wartość cechy xi , która ma największą liczebność ni .
W przypadku szeregu przedziałowego: D  xD 
nD  nD 1
i ,
 nD  nD1    nD  nD1  D
gdzie:
xD - dolna granica przedziału, w którym znajduje się dominanta
nD - liczebność przedziału, w którym znajduje się dominanta
nD 1 - liczebność przedziału, poprzedzającego ten z dominantą
nD 1 - liczebność przedziału, następującego po tym z dominantą
iD
- rozpiętość przedziału, w którym znajduje się dominanta
Mediana: Mediana dzieli zbiorowość na dwie równe połowy.
xN 1
(wartość cechy, która jest „pośrodku”
2
uporządkowanych rosnąco wartości cech)
Gdy N jest nieparzyste: Me 

1
Gdy N jest parzyste: Me   x N  x N  (średnia wartości cechy, będących
1
2 2
2

„pośrodku”)
www.etrapez.pl Krystian Karczyński
Strona 2
Kwartyle Q1 , Q2  Me, Q3 : Dzielą zbiorowość podobnie jak mediana, tylko że w proporcjach
odpowiednio 25% : 75%; 50% : 50%; 75% : 25%.
W przypadku szeregu przedziałowego:
N k 1
  ni
4 i 1
Q1  xQ1 
iQ1
nQ1
N k 1
  ni
2 i 1
Q2  Me  xMe 
iMe
nMe
3N k 1
  ni
4 i 1
Q3  xQ3 
iQ3
nQ3
xQ1 , xMe , xQ3 - dolne granice przedziałów, w którym znajduje się
kwartyl
k 1
 n - suma liczebności przedziałów POPRZEDZAJĄCYCH ten, w
i 1
i
którym znajduje się kwartyl
nQ1 , nMe , nQ3 - liczebności przedziałów, w którym znajduje się
kwartyl
iQ1 , iMe , iQ3 - rozpiętości przedziałów, w którym znajduje się kwartyl
Kwantyle: Dzielą zbiorowość podobnie jak mediana i kwartyle, ale w zupełnie dowolnych
proporcjach. Na przykład kwantyl rzędu 0, 4 , czyli x0,4 dzieli zbiorowość w
proporcji: 40% : 60%.
www.etrapez.pl Krystian Karczyński
Strona 3
II.
Miary zmienności (dyspersji)
Empiryczny obszar zbieżności: R  xmax  xmin
Odchylenie przeciętne: d 
 x Xn
i
i
N
Odchylenie ćwiartkowe: Q 
Q3  Q1
2
Typowy obszar zmienności przy pomocy miar pozycyjnych: Me  Q  xtyp  Me  Q
 x  X  n

2
Wariancja: S
2
i
i
N
Odchylenie standardowe: S  S 2
Typowy obszar zmienności: X  S  xtyp  X  S
Współczynnik zmienności: VS 
S
Q
100%, VQ 
100%
X
Me
www.etrapez.pl Krystian Karczyński
Strona 4
III.
Miary asymetrii
Wskaźnik asymetrii: WS  X  D, WS   Q3  Q2   Q2  Q1 
WS  0 - asymetria prawostronna
WS  0 - brak asymetrii, rozkład symetryczny
WS  0 - asymetria lewostronna
Współczynnik asymetrii (skośności): AS 
WS
,
S
AS 
WS
2Q
Oprócz kierunku asymetrii wskazuje na siłę asymetrii. Im
bliżej 0 , tym asymetria jest słabsza. Im bliżej 1 , tym
asymetria jest silniejsza.
 x  X 

3
Moment centralny trzeciego rzędu: m3
i
 ni
N
Interpretacja ujemności/dodatności taka sama jak WS .
Moment standaryzowany trzeciego rzędu: As 
m3
S3
Interpretacja siły asymetrii taka sama jak w AS .
www.etrapez.pl Krystian Karczyński
Strona 5
IV.
Miary koncentracji
Koncentracja w sensie podziału funduszu cechy:
Współczynnik koncentracji Lorenza: k 
a
, gdzie a to pole pomiędzy linią
5000
równomiernego podziału, a krzywą koncentracji
Lorenza.
k  0 oznacza zupełny brak koncentracji (każda
jednostka ma taką samą część funduszu cechy)
k  1 oznacza zupełną koncentrację (jedna jednostka
posiada cały fundusz cechy)
Koncentracja w sensie koncentracji wokół średniej:
Moment centralny czwartego rzędu: m4
 x  X 

i
Moment standaryzowany czwartego rzędu: a4 
4
 ni
N
m4
S4
Punktem odniesienia jest rozkład normalny.
a4  3 - wartości cechy są bardziej skoncentrowane wokół
średniej, niż w rozkładzie normalnym (wykres wysmukły)
a4  3 - wartości cechy tak samo skoncentrowane wokół
średniej, niż w rozkładzie normalnym (wykres identyczny)
a4  3 - wartości cechy są mniej skoncentrowane wokół
średniej, niż w rozkładzie normalnym (wykres spłaszczony)
www.etrapez.pl Krystian Karczyński
Strona 6

Podobne dokumenty