METODY OPISU STRUKTURY ZBIOROWOŚCI CZ

Transkrypt

METODY OPISU STRUKTURY ZBIOROWOŚCI CZ
METODY OPISU STRUKTURY ZBIOROWOŚCI CZ. II

Miary klasyczne – obliczane na podstawie wszystkich wyrazów szeregu

Miary pozycyjne – wyznaczane z niektórych wyrazów wybranych ze względu na pozycję, jaką w tym
szeregu zajmują.
MIARY
DYSPERSJI : KLASYCZNE , BEZWZGLĘDNE
Empiryczny obszar zmienności
Inaczej rozstęp. Stanowi różnicę pomiędzy minimalną a maksymalną wartością cechy. Wartośd poznawcza
obszaru zmienności jest nieduża. Jedynie wstępnie charakteryzuje zróżnicowanie badanego zjawiska.
R = xmax - xmin
Rozstęp jest stosowany głównie w tych przypadkach, gdy jest konieczne szybkie określenie obszaru zmienności
badanej cechy. Znajduje zastosowanie w kontroli jakości, gdzie jest utrzymana ciągła kontrola procesu
produkcyjnego.
Interpretacja: Wartości cechy w badanym szeregu obejmują obszar o długości R.
Wariancja
Stanowi średnią arytmetyczną kwadratów odchyleo poszczególnych wartości cechy od średniej arytmetycznej
zbiorowości
(Własności wariancji – źródło: wykład)
Wariancja
Szereg szczegółowy
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑( x  x)

∑n
∑(x  x)

∑n
∑(x  x)
2
sx 
2
i
i
i
sx
N
2
2
 ni
i
i
2
i
sx
2
i
 ni
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
x 0i + x 1i
- środek i-tego przedziału klasowego;
2 i
Wariancja jest wielkością mianowaną, przy czym mianem jest kwadrat jednostki fizycznej, w jakiej mierzona
jest dana zmienna. Stąd wariancja jest trudna do interpretacji merytorycznej.
Odchylenie standardowe
Miara zróżnicowania, wyrażona za pomocą jednostki (miana) badanej cechy. Jest obliczana jako pierwiastek
kwadratowy wariancji:
s x  s2x
Odchylenie jest wielkością mianowaną (jednostka badanej cechy ilościowej). Nie pozwala na porównanie
zróżnicowanie cech o różnych mianach.
Interpretacja: Wartości cechy X różniły się od jej średniego poziomu o +/- sx [jednostek]
(Własności odchylenia standardowego – źródło: wykład)
Odchylenie przeciętne
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 1 z 8
Jest średnią arytmetyczną bezwzględnych wartości odchyleo poszczególnych wartości zbiorowości statystycznej
od średniej arytmetycznej.
Odchylenie przeciętne
Szereg szczegółowy
∑| x
dx 
i
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑| x  x |

∑n
∑| x  x |

∑n
x|
i
i
dx
N
ni
i
i
dx
i
ni
i
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
x 0i + x 1i
- środek i-tego przedziału klasowego;
2 i
Pomiędzy odchyleniem przeciętnym i odchyleniem standardowym dla tego samego szeregu zachodzi zależnośd:
dx<sx
Interpretacja: Jednostki badanej zbiorowości *wskazad jednostki+ różnią się pod względem badanej cechy
*wskazad cechę+ średnio o dx *jednostek+ od poziomu średniej arytmetycznej.
Typowy obszar zmienności (klasyczny)
W obszarze tym mieści się 2/3 wszystkich jednostek badanej cechy statystycznej:
x  s x  x typowy  x  s x
Interpretacja: Dla 2/3 wszystkich obserwacji wartośd badanej cechy należały do przedziału …
Z odchyleniem standardowym łączy się reguła trzech sigm oparta na nierówności Czebyszewa odnosząca się do
własności rozkładu normalnego. Warunkiem stosowania poniższej reguły jest posiadanie przez badaną cechę
rozkładu normalnego:
x - sx  xi  x  sx
Przedział określa obszar zmienności cechy dla
68,26% badanych jednostek
x - 2sx  xi  x  2sx
Przedział zawiera wartości cech posiadanych przez
95,45% badanych jednostek
x - 3s x  x i  x  3sx
Poziom badanej cechy określony przez obszar
zmienności, przyjmuje 99,73% badanych jednostek
MIARY
DYSPERSJI : KLASYCZNE , WZGLĘDNE
Współczynnik zmienności
Stanowi procentowy udział odchylenia standardowego w średnim poziomie badanej cechy. Pozwala na
porównanie zróżnicowania wielu cech o różnych mianach. Im wyższa jego wartośd, tym silniejsze zróżnicowanie
(niejednorodnośd) badanej zbiorowości.
Przyjmuje się, że jeśli współczynnik zmienności Vs nie przekracza 10% to cechy wykazują zróżnicowanie
statystycznie nieistotne1.
Vs 
sx
 100
x
Gdzie: Vs – współczynnik zmienności;
Interpretacja: Zróżnicowanie mierzone odchyleniem standardowym wynosi Vs procent średniej arytmetycznej.
1
Por. Aleksander Zeliaś, Metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa 2000 r., s. 64.
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 2 z 8
Zadanie 1. [Excel]
MIARY
DYSPERSJI : POZYCYJNE , BEZWZGLĘDNE
Rozstęp dwiartkowy (międzykwartylowy)
Rozstęp dwiartkowy określa rozpiętośd tej części obszaru zmienności cechy, w której znajduje się “środkowe”
50% obserwacji.
RQ  Q 3 - Q 1
Gdzie: RQ – rozstęp dwiartkowy, Q3 – kwartyl III, Q1 – kwartyl I;
Interpretacja2: 50 % środkowych obserwacji obejmuje obszar zmienności badanej cechy o długości R Q
Odchylenie dwiartkowe
Odchylenie dwiartkowe mierzy średnią rozpiętośd w połowie obszaru zmienności. Stanowi połowę różnicy
między trzecim a pierwszym kwartylem:
Qx 
(Q 3  Me)  (Me  Q 1 ) Q 3  Q 1

2
2
Gdzie: Qx – dochylenie dwiartkowe, Q1 – kwartyl I, Q3 – kwartyl III;
Odchylenie dwiartkowe mierzy poziom zróżnicowania tylko części jednostek badanej zbiorowości tzn.
pozostałej po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% o wartościach największych. Miara
ta nie jest wrażliwa na skrajne (nietypowe wartości) i z tego powodu zaleca się jej stosowanie w praktyce.
Pomiędzy odchyleniami: dwiartkowym, przeciętnym i standardowym zachodzi zależnośd: Q<d x<sx
Interpretacja: Wartości badanej cechy różnią się od wartości mediany (środkowej) o +/- Qx jednostek w
zawężonym obszarze zmienności.
Typowy obszar zmienności (pozycyjny)
Warunki zastosowania:

opis tendencji centralnej za pomocą mediany,

oraz opis zróżnicowania za pomocą odchylenia dwiartkowego
Me  Q x  x typowy  Me  Q x
Gdzie: Me – mediana, Q – odchylenie dwiartkowe
MIARY
DYSPERSJI : POZYCYJNE , WZGLĘDNE
Współczynnik zmienności (pozycyjny)
VQ 
Qx
 100
Me
Gdzie: VQ – współczynnik zmienności dla miar pozycyjnych, Qx – odchylenie dwiartkowe, Me – mediana;
Interpretacja: Zróżnicowanie cechy X mierzone odchyleniem dwiartkowym wynosi VQ wartości mediany.
Zadanie 2. [Excel]
2
Por. Jarosław Podgórski, Statystyka dla studiów licencjackich, Polskie Wydawnictwo Ekonomiczne, Warszawa 2005 r., s. 65.
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 3 z 8
MIARY
ASYMETRII
Miary asymetrii (skośności) służą do określenia czy przeważająca liczba jednostek znajduje się powyżej, czy
poniżej przeciętnego poziomu badanej cechy. Asymetrię rozkładu najłatwiej określid przez porównanie
dominanty, mediany i średniej arytmetycznej.
ROZKŁAD SYMETRYCZNY
x  Me  Do
x  Me  Do
ASYMETRIA PRAWOSTRONNA (DODATNIA)
Do  Me  x
Do  x
x  Do  0
Mo=Do
ASYMETRIA LEWOSTRONNA (UJEMNA)
Do  Me  x
Do x
x  Do  0
Mo=Do
Wskaźnik skośności
Jest wielkością bezwzględną przyjętą do określania kierunku asymetrii.
Wskaźnik skośności dla miar klasycznych
x  Do
Wskaźnik skośności dla miar pozycyjnych
(Q 3  Me)  (Me  Q1 )  Q 3  2Me  Q1
x  Do  0 - rozkład symetryczny
x  Do  0 - asymetria prawostronna
x  Do  0 - asymetria lewostronna
Q 3  2Me  Q 1  0 - rozkład symetryczny
Q 3  2Me  Q 1  0 - asymetria prawostronna
Q 3  2Me  Q 1  0 - asymetria lewostronna
Interpretacja:

Szereg cechuje asymetria dodatnia *wskaźnik >0+ oznacza to, że większośd jednostek osiągnęło poziom
badanej cechy [X] poniżej przeciętnej.

Szereg cechuje asymetria ujemna *wskaźnik <0+ oznacza to, że większośd badanych jednostek
osiągnęło poziom badanej cech *X+ powyżej przeciętnej
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 4 z 8
Współczynnik asymetrii
Określa zarówno kierunek jak i siłę asymetrii. Jest miarą niemianowaną, co umożliwia porównanie asymetrii
rozkładów dwóch zbiorowości.
Współczynnik asymetrii dla miar klasycznych
x  Do
,
sx
x  Do
Ad 
dx
As 
Współczynnik asymetrii dla miar pozycyjnych
AQ 
Q 3  2Me  Q 1 Q 3  2Me  Q 1

Q 3  Q1
2Q x
Gdzie: x - średnia, Do – dominanta, Me – mediana, s x - odchylenie standardowe, dx - odchylenie przeciętne,
Q3 – kwartyl III, Q1 – kwartyl I, Qx – odchylenie dwiartkowe
Wartośd współczynnika asymetrii zawiera się w przedziale <-1,1>. W rozkładzie symetrycznym, przy określaniu
pozycyjnego współczynnika asymetrii korzysta się z faktu, iż kwartyl III jest tak samo odległy od mediany jak
kwartyl I.
Im większa wartośd bezwzględna współczynnika asymetrii, tym silniejsza jest asymetria badanego rozkładu. Dla
bezwzględnej wartości współczynnika asymetrii przyjmuje się że:

0,2 – niewielka siła asymetrii;

0,3-0,6 – przeciętna siła asymetria;

0,7 – 1,0 – rozkład o dużej asymetrii
Jeśli szereg nie jest skrajnie asymetryczny to pomiędzy miarami zachodzi przybliżona równośd:
Interpretacja: Szereg cechowała asymetria *dodatnia /ujemna – +,co oznacza, że większośd jednostek przyjmuje
wartości cechy ,poniżej/powyżej przeciętnej+. Szereg charakteryzuje się *wskazad na siłę asymetrii+.
Zadanie 3. [Excel]
MIARY
SPŁASZCZENIA I KONCENTRACJI
Statystyczny opis struktury zjawisk masowych może byd również dokonany pod względem koncentracji.
Koncentrację rozumie się dwojako:

jako nierównomierny podział zjawiska w zbiorowości;

jako koncentrację zbiorowości wokół średniej (tzw. kurioza)
Istnieje ścisły związek między koncentracją wartości zmiennej wokół średniej a ich zróżnicowaniem. Im większe
jest zróżnicowanie, tym mniejsza jest koncentracja.
Wielobok (krzywa) koncentracji Lorenza
Jest metodą graficzną badania siły koncentracji. Podstawę do wykreślenia krzywej koncentracji stanowią:

Skumulowane wskaźniki struktury (odsetki) jednostek (liczebności) na osi odciętych (0X);

Skumulowane łączne wartości cechy (środków przedziałów klasowych, warianty * ich liczebności) na
osi rzędnych (0Y);
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 5 z 8
W przypadku równomiernego rozdziału cechy między wszystkie jednostki zbiorowości, wszystkie punkty
leżałyby na przekątnej kwadratu o boku 100. Stąd linia ta nosi nazwę linii równomiernego rozdziału.
RYSUNEK 1. KRZYWA LORENZA KONCENTRACJI DOCHODÓW
Źródło: http://www.nbportal.pl/pl/np/artykuly/finanse/miary-nierownosci-w-dochodach
Powierzchnia koncentracji - powierzchnia pomiędzy linią równomiernego rozdziału a krzywą Lorenza.
Na podstawie wykresu można zorientowad się jak silna koncentracja występuje. Im większe pole tym mniejsza
równomiernośd w rozkładzie cechy.
Koncentracja całkowita
Koncentracja duża
Koncentracja słaba
Brak koncentracji
Wyznaczanie krzywej koncentracji Lorenza
Dane
1
2
Warianty Liczebności
cechy
Środki
przedziałów
klasowych
xid - xig
xsrodek
Zajęcia 3.
ni
3
4
5
6
Łączna
Wskaźnik
wartość cechy struktury
jednostek
(liczebności)
Odsetek łącznych wartości
cechy
Skumulowane
wskaźniki struktury
jednostek
Skumulowane
odsetki łącznych
wartości cechy
xśrodek*ni
zi=(xśreodek*ni)/(suma z ni) Cum w1
wi=ni/(suma z ni)
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Cum z1
Strona 6 z 8
Na odpowiednich osiach odkładamy wartości cum wi i cum zi;
Współczynnik koncentracji Lorenza
Wzór współczynnika koncentracji
0,5 
KL 
k

i1
cum _ zi  cum _ zi1 
  wi
2

0,5
Dla pierwszego wyrazu
cum _ zi  cum _ zi1 cum _ zi
=
2
2
KL należy do przedziału <0,1>; KL=0 – brak koncentracji, KL=1 – silna koncentracja.
Słaba koncentracja jest związana z dośd równomiernym podziałem łącznej wartości badanej cechy pomiędzy
jednostki statystyczne opisywane przez daną cechę.
Zadanie 4. [Excel]
Kurtoza – współczynnik koncentracji
Jest względną miarą skupienia poszczególnych wartości zmiennej wokół średniego poziomu wartości danej
cechy.
m4
K
s4x
s 4x - odchylenie standardowe do IV potęgi m4 - moment centralny czwartego rzędu:
Moment centralny czwartego rzędu
Szereg szczegółowy
∑(x  x)
i
m4 
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑(x  x)

∑n
∑(x  x)

∑n
4
i
N
i
m4
4
 ni
i
i
i
i
m4
4
 ni
i
i
i
Współczynnik ekscesu
K' 
m4
s4x
3
Gdzie: oznaczenia analogiczne jak w kurtozie
Współczynnik koncentracji oraz ekscesu informuje o tym, czy koncentracja wartości badanej zmiennej wokół
średniej w danym rozkładzie jest większa, czy mniejsza niż w zbiorowości o rozkładzie normalnym.
Ze względu na stopieo skupienia można wyróżnid następujące przedziały wartości współczynnika koncentracji
(kurt ozy) i ekscesu.
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 7 z 8
Rodzaj rozkładu
K
K’
Platokurtyczny (spłaszczony)
K<3
K’<0
Normalny
K=3
K’=0
Leptokurtyczny (wysmukły)
K>3
K’>0
RYSUNEK 2. KRZYWE LICZEBNOŚCI PRZY RÓŻNYM STOPNIU SKUPIENIA WOKÓŁ WARTOŚDI ŚREDNIEJ
Zajęcia 3.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 8 z 8