METODY OPISU STRUKTURY ZBIOROWOŚCI

Transkrypt

METODY OPISU STRUKTURY ZBIOROWOŚCI
METODY OPISU STRUKTURY ZBIOROWOŚCI
WSKAŹNIK
STRUKTURY I NATĘŻENIA
Wskaźnik natężenia
Iloraz liczby jednostek jednej zbiorowości (n i) do liczby jednostek drugiej zbiorowości (mi). Wyraża się wzorem:
Wn =
ni
mi
Gdzie: Wn – wskaźnik natężenie; ni – liczebnośd cechy n; mi – liczebnośd cechy m;
Przykłady: gęstośd zaludnienia = liczba ludności/jednostka powierzchni; stopa bezrobocia = liczba osób
bezrobotnych/liczbę osób aktywnych zawodowo;
Wskaźnik struktury
Stanowi udział liczebności (częstości występowania) wariantu (wartości) badanej cechy w łącznej liczbie
obserwacji
Wst =
ni
∑n
i
i
Gdzie: Wst – wskaźnik struktury; ni – liczebnośd (częstośd występowania) określonej i-tej wartości, wariantu
cechy
Przykłady: udział liczby rodzin posiadających jedno dziecko w całej badanej próbie; udział studentów UŁ
mających ukooczone 20 lat w liczbie wszystkich studentów na UŁ.
Wskaźnik podobieostwa struktur
Stosowany jest do porównywania różnych zbiorowości ze względu na jedną badaną cechę.
k
p = ∑min(Wsk1i , Wsk21 ) , przy czym 0< p ≤1
i =1
Gdzie:
p - wskaźnik podobieostwa struktur, Wsk1i , Wsk21 - wskaźnik struktury i-tej cechy w zbiorowości 1. I 2.
Dystrybuanta empiryczna
Rozkładem empirycznym badanej cechy nazywamy przyporządkowanie kolejnym wartościom cechy,
odpowiadających im liczebności.
Dystrybuanta empiryczna stanowi diagram liczebności skumulowanej (szereg skumulowany liczebności
przedstawiony za pomocą wykresu słupkowego)
Diagram jest wielobokiem liczebności, wykresem linowym liczebności (na osi Y) według środków przedziałów
klasowych (na osi X).
Histogram, w odróżnieniu od diagramu prezentuje zbiór prostokątów, których jeden bok leżący na osi poziomej
pokrywa się z rozpiętością poszczególnych przedziałów klasowych, drugi odpowiada liczebności tych klas
odłożonych na osi pionowej.
Zajęcia 2.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 1 z 6
Wyznaczanie:
1. Sporządzid szereg skumulowany badanej cechy
x 0i + x 1i
2
i
2.
Wyznaczyd środków przedziałów klasowych: x =
3.
Wygenerowad wykres liniowy zależności liczebności klasy od środka klasy
Agregacja i kumulacja szeregów statystycznych (poprzednie zajęcia)
Zadanie 1. [Excel]
MIARY
TENDENCJI CENTRALNEJ : KLASYCZNE
Średnia arytmetyczna
Średnia arytmetyczna jest to wartośd określonej cechy x, jaką przyjęłyby wszystkie obserwacje (jednostki
zbiorowości statystycznej) gdyby nie było między nimi różnic ze względu na poziom badanej cechy.
Nie stosujemy średniej arytmetycznej gdy:
1. W szeregu rozdzielczym o przedziałach klasowych przedziały skrajne są otwarte.
Warunek: Średnia arytmetyczna dla szeregu rozdzielczego przedziałowego z otwartymi przedziałami
klasowymi może byd obliczona jeśli przedziały klasowe mają niewielkie liczebności (praktycznie 5%
ogólnej liczebności). Jeśli ten warunek jest spełniony przedziały można domknąd, czyli przyjąd górne
granice przedziałów klasowych. Jeśli ten warunek nie jest spełniony nie wolno zamykad przedziałów i
obliczad średniej .
2. Występują w szeregu wartości nietypowe
3. Jeśli zbiorowośd jest niejednorodna
Własności średniej arytmetycznej (obowiązkowa znajomośd – źródło: wykłady)
Wzory:
Średnia arytmetyczna
Szereg szczegółowy
∑x
x=
i
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑x n
x=
∑n
∑x n
x=
∑n
i i
i
i
N
i
i i
i
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
x 0i + x 1i
- środek i-tego przedziału klasowego;
2
i
Interpretacja: Średni poziom badanego zjawiska wynosi
x
Zadanie 2. [Excel]
Średnia harmoniczna
Średnią harmoniczną stosuje się gdy wartości cechy podawane są w przeliczeniu na jednostkę innej cechy, czyli
w postaci tzw. wskaźników natężenia np. prędkośd pojazdu w km/h
Zajęcia 2.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 2 z 6
Wzory:
Średnia harmoniczna
Szereg szczegółowy
xh =
Szereg rozdzielczy punktowy
∑n
N
1
∑x
i =1 i
n
xh =
∑n
i
i
∑nx
i
Szereg rozdzielczy przedziałowy
xh =
i
i
i
i
∑nx
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
x 0i + x 1i
- środek i-tego przedziału klasowego;
2
i
Średnia geometryczna
Średnią geometryczną stosujemy do badania średniego tempa zmian zjawiska (nie średniego poziomu
badanego zjawiska), gdy zjawisko ujmowane jest dynamicznie.
Wzór dla szeregu czasowego dynamiki wzrostu badanej cechy:
n
x G = n x1
x 2 ... x n = n  x i
i =1
Xi- indywidualny indeks łaocuchowy cechy wyrażonej w czasie = wartośd z danego okresu (t)/wartośd z okresu
poprzedniego (t-1).
Przykład: Badanie średniego poziomu tempa wzrostu cen towarów i usług konsumpcyjnych
Zadanie 3. [Excel]
MIARY
TENDENCJI CENTRALNEJ : POZYCYJNE
Dominanta
Inaczej określana jako moda, wartośd najczęstsza, modalna, stanowi tę wartośd (wariant) cechy, który
występuje najczęściej w badanej zbiorowości statystycznej. Przy interpretacji modalnej należy pamiętad, że
charakteryzuje ona jednostki o typowym poziomie zmiennej, nie zaś wszystkie badane jednostki.
Wyznaczenie dominanty jest uzasadnione gdy:


jest dostatecznie dużo obserwacji;
rozkład empiryczny liczebności jest rozkładem jednomodalnym, (jeden ośrodek dominujący)


asymetria rozkładu liczebności jest umiarkowana,
przedziały klasowe, w których występuje dominanta oraz dwa sąsiednie przedziały mają jednakową
długośd;
dominantę można wyznaczyd na szeregach rozdzielczych przedziałowych otwartych (mniej niż 5 lat,
więcej niż 65 lat);
na jej wartośd nie maja wpływu wartości skrajne szeregu (x min i xmax);


Zajęcia 2.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 3 z 6
Dominanty nie wyznacza się gdy szeregi rozdzielcze są bimodalne (lewy panel) lub wielomodalne (prawy panel)
Rysunek 2. szereg rozdzielczy bimodalny (lewy panel), wielomodalny (prawy panel)
Dominanta
Szereg szczegółowy
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
(wzór interpolacyjny)
Wskazujemy wartośd najczęściej
występującą
Wskazujemy wartośd najczęściej
występującą
Do = X0 +
n0 - n-1
h
(n0 - n-1 ) + (n0 - n+1 ) 0
X 0 - dolna granica przedziału dominanty, h0 = x1i( górne ) - x 0i( do ln e ) - rozpiętośd przedziału dominanty, n0 liczebnośd przedziału dominanty,
n-1 - liczebnośd przedziału poprzedzającego liczebnośd dominanty,
Mediana
Dzieli zbiorowośd na dwie równe części. Połowa jednostek ma wartości cechy mniejsze lub równe medianie, a
połowa wartości cechy większe od mediany.
Mediana obok średniej arytmetycznej jest najczęściej stosowanym parametrem statystycznym. Może byd
obliczana w przypadkach, kiedy niemożliwe jest obliczenie średniej (np. otwarte przedziały klasowe) a także
modalnej – różne rozpiętości przedziałów klasowych.
Mediana
Szereg szczegółowy
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
(wzór interpolacyjny)
Nieparzysta liczba obserwacji
(N): Me  X(N1) / 2
Parzysta liczba obserwacji (N):
Me 
1
( x N / 2  x (N / 2 )1)
2
Wskazad jednostkę środkową i
odczytad wariant zmiennej
odpowiadający tej jednostce.
Przed wskazaniem jednostki
środkowej należy policzyd
liczebności skumulowane.
Me  X0 
ho
 (NMe  nsk 1 )
no
dla szeregu o parzystej liczbie
obserwacji:
NMe 
N
2
dla szeregu o nieparzystej liczbie
obserwacji:
NMe 
Gdzie: X 0 - dolna granica przedziału mediany;
N1
2
ho - rozpiętośd przedziału mediany; no - liczebnośd przedziału
mediany;
Zależności:

Zajęcia 2.
Pearsona: x  Do  3 * ( x  Me )
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 4 z 6

Symetrycznego rozkładu cechy:
x  Do  Me
Kwantyle
Definiuje się jako wartośd cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które
dzielą zbiorowośd na określone części pod względem liczby jednostek. Części te występują w stosunku do siebie
w określonych. Szeregi, z których wyznacza się kwantyle muszą byd uporządkowane według rosnacej lub
malejącej wartości cechy statystycznej. Do najczęściej stosowanych kwantyli należą: kwartyle, decyle, cenytyle.
Kwartyle

Kwartyl I Q1 – dzieli zbiorowośd uporządkowaną na dwie części w ten sposób, że 25% jednostek ma
wartości nie większe niż Q1, a pozostałe 75% równe lub wyższe od tego kwartyla;
Wzór na wyznaczenie kwartyla I w szeregach przedziałowych:
Q1  x Q1 
dla N parzystego: NQ 
1
hQ1
nQ1
 (NQ  nsk 1 )
1
N
N1
; dla N nieparzystego: NQ 
1
4
4

Kwartyl II Me (opis wyżej)

Kwartyl III Q3 – dzieli zbiorowośd uporządkowaną w ten sposób, że 75% jednostek ma wartości cechy
nie wyższe niż Q3 a pozostałe 25% nie niższe niż kwartyl III.
Q3  x Q3 
dla N parzystego: NQ 
3
hQ3
nQ3
 (NQ  nsk 1 )
3
3  (N  1)
3 N
; dla N nieparzystego: NQ 
1
4
4
Zadanie 4. [Excel]
MIARY
DYSPERSJI : KLASYCZNE , BEZWZGLĘDNE
Wariancja
Stanowi średnią arytmetyczną kwadratów odchyleo poszczególnych wartości cechy od średniej arytmetycznej
zbiorowości
(Własności wariancji – źródło: wykład)
Wariancja
Szereg szczegółowy
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑( x
∑( x  x)

∑n
∑( x  x)

∑n
sx 
2
i
 x )2
i
N
i
sx
2
2
 ni
i
i
i
i
sx
2
2
 ni
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
Zajęcia 2.
x 0i + x 1i
- środek i-tego przedziału klasowego;
2
i
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 5 z 6
Odchylenie standardowe
Miara zróżnicowania, która jest zgodna z jednostką (mianem) badanej cechy. Jest obliczana jako pierwiastek
kwadratowy wariancji.:
s x  s2x
(Własności odchylenia standardowego – źródło: wykład)
Odchylenie przeciętne
Jest średnią arytmetyczną bezwzględnych wartości odchyleo poszczególnych wartości zbiorowości statystycznej
od średniej arytmetycznej.
Odchylenie przeciętne
Szereg szczegółowy
∑| x
dx 
i
Szereg rozdzielczy punktowy
Szereg rozdzielczy przedziałowy
∑| x  x |

∑n
∑| x  x |

∑n
x|
i
i
dx
N
ni
i
i
dx
i
i
ni
i
i
i
x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości
występowania; x =
x 0i + x 1i
- środek i-tego przedziału klasowego;
2
i
Typowy obszar zmienności
W obszarze tym mieści się 2/3 wszystkich jednostek badanej cechy statystycznej:
x  s x  x typowy  x  s x
Empiryczny obszar zmienności
Inaczej rozstęp. Stanowi różnicę pomiędzy minimalną a maksymalną wartością cechy. Wartośd poznawcza
obszaru zmienności jest nieduża. Jedynie wstępnie charakteryzuje zróżnicowanie badanego zjawiska.
R = xmax - xmin
MIARY
DYSPERSJI : KLASYCZNE , WZGLĘDNE
Współczynnik zmienności
Pozwala na porównanie dwóch cech o różnych mianach. Im wyższa jego wartośd, tym silniejsze zróżnicowanie
badanej zbiorowości.
Vs 
sx
 100
x
Praca domowa:
1. Na podstawie szeregów czasowych i przestrzennych obliczyd i zinterpretowad: odpowiednią średnią (!),
odchylenie standardowe, wyznaczyd wartośd środkową badanej cechy oraz wskaźnik struktury.
2. Pozostałe zadania z pracy domowej do przesłania na [email protected] znajdowad się będą na
stronie prowadzącego : www.kep.uni.lodz.pl *zakładka Pracownicy+
Zajęcia 2.
Materiały pomocnicze do dwiczeo ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 6 z 6

Podobne dokumenty