METODY OPISU STRUKTURY ZBIOROWOŚCI CZ
Transkrypt
METODY OPISU STRUKTURY ZBIOROWOŚCI CZ
METODY OPISU STRUKTURY ZBIOROWOŚCI CZ. II Miary klasyczne – obliczane na podstawie wszystkich wyrazów szeregu Miary pozycyjne – wyznaczane z niektórych wyrazów wybranych ze względu na pozycję, jaką w tym szeregu zajmują. MIARY DYSPERSJI : KLASYCZNE , BEZWZGLĘDNE Empiryczny obszar zmienności Inaczej rozstęp. Stanowi różnicę pomiędzy minimalną a maksymalną wartością cechy. Wartośd poznawcza obszaru zmienności jest nieduża. Jedynie wstępnie charakteryzuje zróżnicowanie badanego zjawiska. R = xmax - xmin Rozstęp jest stosowany głównie w tych przypadkach, gdy jest konieczne szybkie określenie obszaru zmienności badanej cechy. Znajduje zastosowanie w kontroli jakości, gdzie jest utrzymana ciągła kontrola procesu produkcyjnego. Interpretacja: Wartości cechy w badanym szeregu obejmują obszar o długości R. Wariancja Stanowi średnią arytmetyczną kwadratów odchyleo poszczególnych wartości cechy od średniej arytmetycznej zbiorowości (Własności wariancji – źródło: wykład) Wariancja Szereg szczegółowy Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑( x x) ∑n ∑(x x) ∑n ∑(x x) 2 sx 2 i i i sx N 2 2 ni i i 2 i sx 2 i ni i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Wariancja jest wielkością mianowaną, przy czym mianem jest kwadrat jednostki fizycznej, w jakiej mierzona jest dana zmienna. Stąd wariancja jest trudna do interpretacji merytorycznej. Odchylenie standardowe Miara zróżnicowania, wyrażona za pomocą jednostki (miana) badanej cechy. Jest obliczana jako pierwiastek kwadratowy wariancji: s x s2x Odchylenie jest wielkością mianowaną (jednostka badanej cechy ilościowej). Nie pozwala na porównanie zróżnicowanie cech o różnych mianach. Interpretacja: Wartości cechy X różniły się od jej średniego poziomu o +/- sx [jednostek] (Własności odchylenia standardowego – źródło: wykład) Odchylenie przeciętne Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 1 z 8 Jest średnią arytmetyczną bezwzględnych wartości odchyleo poszczególnych wartości zbiorowości statystycznej od średniej arytmetycznej. Odchylenie przeciętne Szereg szczegółowy ∑| x dx i Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑| x x | ∑n ∑| x x | ∑n x| i i dx N ni i i dx i ni i i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Pomiędzy odchyleniem przeciętnym i odchyleniem standardowym dla tego samego szeregu zachodzi zależnośd: dx<sx Interpretacja: Jednostki badanej zbiorowości *wskazad jednostki+ różnią się pod względem badanej cechy *wskazad cechę+ średnio o dx *jednostek+ od poziomu średniej arytmetycznej. Typowy obszar zmienności (klasyczny) W obszarze tym mieści się 2/3 wszystkich jednostek badanej cechy statystycznej: x s x x typowy x s x Interpretacja: Dla 2/3 wszystkich obserwacji wartośd badanej cechy należały do przedziału … Z odchyleniem standardowym łączy się reguła trzech sigm oparta na nierówności Czebyszewa odnosząca się do własności rozkładu normalnego. Warunkiem stosowania poniższej reguły jest posiadanie przez badaną cechę rozkładu normalnego: x - sx xi x sx Przedział określa obszar zmienności cechy dla 68,26% badanych jednostek x - 2sx xi x 2sx Przedział zawiera wartości cech posiadanych przez 95,45% badanych jednostek x - 3s x x i x 3sx Poziom badanej cechy określony przez obszar zmienności, przyjmuje 99,73% badanych jednostek MIARY DYSPERSJI : KLASYCZNE , WZGLĘDNE Współczynnik zmienności Stanowi procentowy udział odchylenia standardowego w średnim poziomie badanej cechy. Pozwala na porównanie zróżnicowania wielu cech o różnych mianach. Im wyższa jego wartośd, tym silniejsze zróżnicowanie (niejednorodnośd) badanej zbiorowości. Przyjmuje się, że jeśli współczynnik zmienności Vs nie przekracza 10% to cechy wykazują zróżnicowanie statystycznie nieistotne1. Vs sx 100 x Gdzie: Vs – współczynnik zmienności; Interpretacja: Zróżnicowanie mierzone odchyleniem standardowym wynosi Vs procent średniej arytmetycznej. 1 Por. Aleksander Zeliaś, Metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa 2000 r., s. 64. Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 2 z 8 Zadanie 1. [Excel] MIARY DYSPERSJI : POZYCYJNE , BEZWZGLĘDNE Rozstęp dwiartkowy (międzykwartylowy) Rozstęp dwiartkowy określa rozpiętośd tej części obszaru zmienności cechy, w której znajduje się “środkowe” 50% obserwacji. RQ Q 3 - Q 1 Gdzie: RQ – rozstęp dwiartkowy, Q3 – kwartyl III, Q1 – kwartyl I; Interpretacja2: 50 % środkowych obserwacji obejmuje obszar zmienności badanej cechy o długości R Q Odchylenie dwiartkowe Odchylenie dwiartkowe mierzy średnią rozpiętośd w połowie obszaru zmienności. Stanowi połowę różnicy między trzecim a pierwszym kwartylem: Qx (Q 3 Me) (Me Q 1 ) Q 3 Q 1 2 2 Gdzie: Qx – dochylenie dwiartkowe, Q1 – kwartyl I, Q3 – kwartyl III; Odchylenie dwiartkowe mierzy poziom zróżnicowania tylko części jednostek badanej zbiorowości tzn. pozostałej po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% o wartościach największych. Miara ta nie jest wrażliwa na skrajne (nietypowe wartości) i z tego powodu zaleca się jej stosowanie w praktyce. Pomiędzy odchyleniami: dwiartkowym, przeciętnym i standardowym zachodzi zależnośd: Q<d x<sx Interpretacja: Wartości badanej cechy różnią się od wartości mediany (środkowej) o +/- Qx jednostek w zawężonym obszarze zmienności. Typowy obszar zmienności (pozycyjny) Warunki zastosowania: opis tendencji centralnej za pomocą mediany, oraz opis zróżnicowania za pomocą odchylenia dwiartkowego Me Q x x typowy Me Q x Gdzie: Me – mediana, Q – odchylenie dwiartkowe MIARY DYSPERSJI : POZYCYJNE , WZGLĘDNE Współczynnik zmienności (pozycyjny) VQ Qx 100 Me Gdzie: VQ – współczynnik zmienności dla miar pozycyjnych, Qx – odchylenie dwiartkowe, Me – mediana; Interpretacja: Zróżnicowanie cechy X mierzone odchyleniem dwiartkowym wynosi VQ wartości mediany. Zadanie 2. [Excel] 2 Por. Jarosław Podgórski, Statystyka dla studiów licencjackich, Polskie Wydawnictwo Ekonomiczne, Warszawa 2005 r., s. 65. Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 3 z 8 MIARY ASYMETRII Miary asymetrii (skośności) służą do określenia czy przeważająca liczba jednostek znajduje się powyżej, czy poniżej przeciętnego poziomu badanej cechy. Asymetrię rozkładu najłatwiej określid przez porównanie dominanty, mediany i średniej arytmetycznej. ROZKŁAD SYMETRYCZNY x Me Do x Me Do ASYMETRIA PRAWOSTRONNA (DODATNIA) Do Me x Do x x Do 0 Mo=Do ASYMETRIA LEWOSTRONNA (UJEMNA) Do Me x Do x x Do 0 Mo=Do Wskaźnik skośności Jest wielkością bezwzględną przyjętą do określania kierunku asymetrii. Wskaźnik skośności dla miar klasycznych x Do Wskaźnik skośności dla miar pozycyjnych (Q 3 Me) (Me Q1 ) Q 3 2Me Q1 x Do 0 - rozkład symetryczny x Do 0 - asymetria prawostronna x Do 0 - asymetria lewostronna Q 3 2Me Q 1 0 - rozkład symetryczny Q 3 2Me Q 1 0 - asymetria prawostronna Q 3 2Me Q 1 0 - asymetria lewostronna Interpretacja: Szereg cechuje asymetria dodatnia *wskaźnik >0+ oznacza to, że większośd jednostek osiągnęło poziom badanej cechy [X] poniżej przeciętnej. Szereg cechuje asymetria ujemna *wskaźnik <0+ oznacza to, że większośd badanych jednostek osiągnęło poziom badanej cech *X+ powyżej przeciętnej Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 4 z 8 Współczynnik asymetrii Określa zarówno kierunek jak i siłę asymetrii. Jest miarą niemianowaną, co umożliwia porównanie asymetrii rozkładów dwóch zbiorowości. Współczynnik asymetrii dla miar klasycznych x Do , sx x Do Ad dx As Współczynnik asymetrii dla miar pozycyjnych AQ Q 3 2Me Q 1 Q 3 2Me Q 1 Q 3 Q1 2Q x Gdzie: x - średnia, Do – dominanta, Me – mediana, s x - odchylenie standardowe, dx - odchylenie przeciętne, Q3 – kwartyl III, Q1 – kwartyl I, Qx – odchylenie dwiartkowe Wartośd współczynnika asymetrii zawiera się w przedziale <-1,1>. W rozkładzie symetrycznym, przy określaniu pozycyjnego współczynnika asymetrii korzysta się z faktu, iż kwartyl III jest tak samo odległy od mediany jak kwartyl I. Im większa wartośd bezwzględna współczynnika asymetrii, tym silniejsza jest asymetria badanego rozkładu. Dla bezwzględnej wartości współczynnika asymetrii przyjmuje się że: 0,2 – niewielka siła asymetrii; 0,3-0,6 – przeciętna siła asymetria; 0,7 – 1,0 – rozkład o dużej asymetrii Jeśli szereg nie jest skrajnie asymetryczny to pomiędzy miarami zachodzi przybliżona równośd: Interpretacja: Szereg cechowała asymetria *dodatnia /ujemna – +,co oznacza, że większośd jednostek przyjmuje wartości cechy ,poniżej/powyżej przeciętnej+. Szereg charakteryzuje się *wskazad na siłę asymetrii+. Zadanie 3. [Excel] MIARY SPŁASZCZENIA I KONCENTRACJI Statystyczny opis struktury zjawisk masowych może byd również dokonany pod względem koncentracji. Koncentrację rozumie się dwojako: jako nierównomierny podział zjawiska w zbiorowości; jako koncentrację zbiorowości wokół średniej (tzw. kurioza) Istnieje ścisły związek między koncentracją wartości zmiennej wokół średniej a ich zróżnicowaniem. Im większe jest zróżnicowanie, tym mniejsza jest koncentracja. Wielobok (krzywa) koncentracji Lorenza Jest metodą graficzną badania siły koncentracji. Podstawę do wykreślenia krzywej koncentracji stanowią: Skumulowane wskaźniki struktury (odsetki) jednostek (liczebności) na osi odciętych (0X); Skumulowane łączne wartości cechy (środków przedziałów klasowych, warianty * ich liczebności) na osi rzędnych (0Y); Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 5 z 8 W przypadku równomiernego rozdziału cechy między wszystkie jednostki zbiorowości, wszystkie punkty leżałyby na przekątnej kwadratu o boku 100. Stąd linia ta nosi nazwę linii równomiernego rozdziału. RYSUNEK 1. KRZYWA LORENZA KONCENTRACJI DOCHODÓW Źródło: http://www.nbportal.pl/pl/np/artykuly/finanse/miary-nierownosci-w-dochodach Powierzchnia koncentracji - powierzchnia pomiędzy linią równomiernego rozdziału a krzywą Lorenza. Na podstawie wykresu można zorientowad się jak silna koncentracja występuje. Im większe pole tym mniejsza równomiernośd w rozkładzie cechy. Koncentracja całkowita Koncentracja duża Koncentracja słaba Brak koncentracji Wyznaczanie krzywej koncentracji Lorenza Dane 1 2 Warianty Liczebności cechy Środki przedziałów klasowych xid - xig xsrodek Zajęcia 3. ni 3 4 5 6 Łączna Wskaźnik wartość cechy struktury jednostek (liczebności) Odsetek łącznych wartości cechy Skumulowane wskaźniki struktury jednostek Skumulowane odsetki łącznych wartości cechy xśrodek*ni zi=(xśreodek*ni)/(suma z ni) Cum w1 wi=ni/(suma z ni) Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Cum z1 Strona 6 z 8 Na odpowiednich osiach odkładamy wartości cum wi i cum zi; Współczynnik koncentracji Lorenza Wzór współczynnika koncentracji 0,5 KL k i1 cum _ zi cum _ zi1 wi 2 0,5 Dla pierwszego wyrazu cum _ zi cum _ zi1 cum _ zi = 2 2 KL należy do przedziału <0,1>; KL=0 – brak koncentracji, KL=1 – silna koncentracja. Słaba koncentracja jest związana z dośd równomiernym podziałem łącznej wartości badanej cechy pomiędzy jednostki statystyczne opisywane przez daną cechę. Zadanie 4. [Excel] Kurtoza – współczynnik koncentracji Jest względną miarą skupienia poszczególnych wartości zmiennej wokół średniego poziomu wartości danej cechy. m4 K s4x s 4x - odchylenie standardowe do IV potęgi m4 - moment centralny czwartego rzędu: Moment centralny czwartego rzędu Szereg szczegółowy ∑(x x) i m4 Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑(x x) ∑n ∑(x x) ∑n 4 i N i m4 4 ni i i i i m4 4 ni i i i Współczynnik ekscesu K' m4 s4x 3 Gdzie: oznaczenia analogiczne jak w kurtozie Współczynnik koncentracji oraz ekscesu informuje o tym, czy koncentracja wartości badanej zmiennej wokół średniej w danym rozkładzie jest większa, czy mniejsza niż w zbiorowości o rozkładzie normalnym. Ze względu na stopieo skupienia można wyróżnid następujące przedziały wartości współczynnika koncentracji (kurt ozy) i ekscesu. Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 7 z 8 Rodzaj rozkładu K K’ Platokurtyczny (spłaszczony) K<3 K’<0 Normalny K=3 K’=0 Leptokurtyczny (wysmukły) K>3 K’>0 RYSUNEK 2. KRZYWE LICZEBNOŚCI PRZY RÓŻNYM STOPNIU SKUPIENIA WOKÓŁ WARTOŚDI ŚREDNIEJ Zajęcia 3. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 8 z 8