METODY OPISU STRUKTURY ZBIOROWOŚCI
Transkrypt
METODY OPISU STRUKTURY ZBIOROWOŚCI
METODY OPISU STRUKTURY ZBIOROWOŚCI WSKAŹNIK STRUKTURY I NATĘŻENIA Wskaźnik natężenia Iloraz liczby jednostek jednej zbiorowości (n i) do liczby jednostek drugiej zbiorowości (mi). Wyraża się wzorem: Wn = ni mi Gdzie: Wn – wskaźnik natężenie; ni – liczebnośd cechy n; mi – liczebnośd cechy m; Przykłady: gęstośd zaludnienia = liczba ludności/jednostka powierzchni; stopa bezrobocia = liczba osób bezrobotnych/liczbę osób aktywnych zawodowo; Wskaźnik struktury Stanowi udział liczebności (częstości występowania) wariantu (wartości) badanej cechy w łącznej liczbie obserwacji Wst = ni ∑n i i Gdzie: Wst – wskaźnik struktury; ni – liczebnośd (częstośd występowania) określonej i-tej wartości, wariantu cechy Przykłady: udział liczby rodzin posiadających jedno dziecko w całej badanej próbie; udział studentów UŁ mających ukooczone 20 lat w liczbie wszystkich studentów na UŁ. Wskaźnik podobieostwa struktur Stosowany jest do porównywania różnych zbiorowości ze względu na jedną badaną cechę. k p = ∑min(Wsk1i , Wsk21 ) , przy czym 0< p ≤1 i =1 Gdzie: p - wskaźnik podobieostwa struktur, Wsk1i , Wsk21 - wskaźnik struktury i-tej cechy w zbiorowości 1. I 2. Dystrybuanta empiryczna Rozkładem empirycznym badanej cechy nazywamy przyporządkowanie kolejnym wartościom cechy, odpowiadających im liczebności. Dystrybuanta empiryczna stanowi diagram liczebności skumulowanej (szereg skumulowany liczebności przedstawiony za pomocą wykresu słupkowego) Diagram jest wielobokiem liczebności, wykresem linowym liczebności (na osi Y) według środków przedziałów klasowych (na osi X). Histogram, w odróżnieniu od diagramu prezentuje zbiór prostokątów, których jeden bok leżący na osi poziomej pokrywa się z rozpiętością poszczególnych przedziałów klasowych, drugi odpowiada liczebności tych klas odłożonych na osi pionowej. Zajęcia 2. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 1 z 6 Wyznaczanie: 1. Sporządzid szereg skumulowany badanej cechy x 0i + x 1i 2 i 2. Wyznaczyd środków przedziałów klasowych: x = 3. Wygenerowad wykres liniowy zależności liczebności klasy od środka klasy Agregacja i kumulacja szeregów statystycznych (poprzednie zajęcia) Zadanie 1. [Excel] MIARY TENDENCJI CENTRALNEJ : KLASYCZNE Średnia arytmetyczna Średnia arytmetyczna jest to wartośd określonej cechy x, jaką przyjęłyby wszystkie obserwacje (jednostki zbiorowości statystycznej) gdyby nie było między nimi różnic ze względu na poziom badanej cechy. Nie stosujemy średniej arytmetycznej gdy: 1. W szeregu rozdzielczym o przedziałach klasowych przedziały skrajne są otwarte. Warunek: Średnia arytmetyczna dla szeregu rozdzielczego przedziałowego z otwartymi przedziałami klasowymi może byd obliczona jeśli przedziały klasowe mają niewielkie liczebności (praktycznie 5% ogólnej liczebności). Jeśli ten warunek jest spełniony przedziały można domknąd, czyli przyjąd górne granice przedziałów klasowych. Jeśli ten warunek nie jest spełniony nie wolno zamykad przedziałów i obliczad średniej . 2. Występują w szeregu wartości nietypowe 3. Jeśli zbiorowośd jest niejednorodna Własności średniej arytmetycznej (obowiązkowa znajomośd – źródło: wykłady) Wzory: Średnia arytmetyczna Szereg szczegółowy ∑x x= i Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑x n x= ∑n ∑x n x= ∑n i i i i N i i i i i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Interpretacja: Średni poziom badanego zjawiska wynosi x Zadanie 2. [Excel] Średnia harmoniczna Średnią harmoniczną stosuje się gdy wartości cechy podawane są w przeliczeniu na jednostkę innej cechy, czyli w postaci tzw. wskaźników natężenia np. prędkośd pojazdu w km/h Zajęcia 2. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 2 z 6 Wzory: Średnia harmoniczna Szereg szczegółowy xh = Szereg rozdzielczy punktowy ∑n N 1 ∑x i =1 i n xh = ∑n i i ∑nx i Szereg rozdzielczy przedziałowy xh = i i i i ∑nx i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Średnia geometryczna Średnią geometryczną stosujemy do badania średniego tempa zmian zjawiska (nie średniego poziomu badanego zjawiska), gdy zjawisko ujmowane jest dynamicznie. Wzór dla szeregu czasowego dynamiki wzrostu badanej cechy: n x G = n x1 x 2 ... x n = n x i i =1 Xi- indywidualny indeks łaocuchowy cechy wyrażonej w czasie = wartośd z danego okresu (t)/wartośd z okresu poprzedniego (t-1). Przykład: Badanie średniego poziomu tempa wzrostu cen towarów i usług konsumpcyjnych Zadanie 3. [Excel] MIARY TENDENCJI CENTRALNEJ : POZYCYJNE Dominanta Inaczej określana jako moda, wartośd najczęstsza, modalna, stanowi tę wartośd (wariant) cechy, który występuje najczęściej w badanej zbiorowości statystycznej. Przy interpretacji modalnej należy pamiętad, że charakteryzuje ona jednostki o typowym poziomie zmiennej, nie zaś wszystkie badane jednostki. Wyznaczenie dominanty jest uzasadnione gdy: jest dostatecznie dużo obserwacji; rozkład empiryczny liczebności jest rozkładem jednomodalnym, (jeden ośrodek dominujący) asymetria rozkładu liczebności jest umiarkowana, przedziały klasowe, w których występuje dominanta oraz dwa sąsiednie przedziały mają jednakową długośd; dominantę można wyznaczyd na szeregach rozdzielczych przedziałowych otwartych (mniej niż 5 lat, więcej niż 65 lat); na jej wartośd nie maja wpływu wartości skrajne szeregu (x min i xmax); Zajęcia 2. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 3 z 6 Dominanty nie wyznacza się gdy szeregi rozdzielcze są bimodalne (lewy panel) lub wielomodalne (prawy panel) Rysunek 2. szereg rozdzielczy bimodalny (lewy panel), wielomodalny (prawy panel) Dominanta Szereg szczegółowy Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy (wzór interpolacyjny) Wskazujemy wartośd najczęściej występującą Wskazujemy wartośd najczęściej występującą Do = X0 + n0 - n-1 h (n0 - n-1 ) + (n0 - n+1 ) 0 X 0 - dolna granica przedziału dominanty, h0 = x1i( górne ) - x 0i( do ln e ) - rozpiętośd przedziału dominanty, n0 liczebnośd przedziału dominanty, n-1 - liczebnośd przedziału poprzedzającego liczebnośd dominanty, Mediana Dzieli zbiorowośd na dwie równe części. Połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy większe od mediany. Mediana obok średniej arytmetycznej jest najczęściej stosowanym parametrem statystycznym. Może byd obliczana w przypadkach, kiedy niemożliwe jest obliczenie średniej (np. otwarte przedziały klasowe) a także modalnej – różne rozpiętości przedziałów klasowych. Mediana Szereg szczegółowy Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy (wzór interpolacyjny) Nieparzysta liczba obserwacji (N): Me X(N1) / 2 Parzysta liczba obserwacji (N): Me 1 ( x N / 2 x (N / 2 )1) 2 Wskazad jednostkę środkową i odczytad wariant zmiennej odpowiadający tej jednostce. Przed wskazaniem jednostki środkowej należy policzyd liczebności skumulowane. Me X0 ho (NMe nsk 1 ) no dla szeregu o parzystej liczbie obserwacji: NMe N 2 dla szeregu o nieparzystej liczbie obserwacji: NMe Gdzie: X 0 - dolna granica przedziału mediany; N1 2 ho - rozpiętośd przedziału mediany; no - liczebnośd przedziału mediany; Zależności: Zajęcia 2. Pearsona: x Do 3 * ( x Me ) Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 4 z 6 Symetrycznego rozkładu cechy: x Do Me Kwantyle Definiuje się jako wartośd cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowośd na określone części pod względem liczby jednostek. Części te występują w stosunku do siebie w określonych. Szeregi, z których wyznacza się kwantyle muszą byd uporządkowane według rosnacej lub malejącej wartości cechy statystycznej. Do najczęściej stosowanych kwantyli należą: kwartyle, decyle, cenytyle. Kwartyle Kwartyl I Q1 – dzieli zbiorowośd uporządkowaną na dwie części w ten sposób, że 25% jednostek ma wartości nie większe niż Q1, a pozostałe 75% równe lub wyższe od tego kwartyla; Wzór na wyznaczenie kwartyla I w szeregach przedziałowych: Q1 x Q1 dla N parzystego: NQ 1 hQ1 nQ1 (NQ nsk 1 ) 1 N N1 ; dla N nieparzystego: NQ 1 4 4 Kwartyl II Me (opis wyżej) Kwartyl III Q3 – dzieli zbiorowośd uporządkowaną w ten sposób, że 75% jednostek ma wartości cechy nie wyższe niż Q3 a pozostałe 25% nie niższe niż kwartyl III. Q3 x Q3 dla N parzystego: NQ 3 hQ3 nQ3 (NQ nsk 1 ) 3 3 (N 1) 3 N ; dla N nieparzystego: NQ 1 4 4 Zadanie 4. [Excel] MIARY DYSPERSJI : KLASYCZNE , BEZWZGLĘDNE Wariancja Stanowi średnią arytmetyczną kwadratów odchyleo poszczególnych wartości cechy od średniej arytmetycznej zbiorowości (Własności wariancji – źródło: wykład) Wariancja Szereg szczegółowy Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑( x ∑( x x) ∑n ∑( x x) ∑n sx 2 i x )2 i N i sx 2 2 ni i i i i sx 2 2 ni i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = Zajęcia 2. x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 5 z 6 Odchylenie standardowe Miara zróżnicowania, która jest zgodna z jednostką (mianem) badanej cechy. Jest obliczana jako pierwiastek kwadratowy wariancji.: s x s2x (Własności odchylenia standardowego – źródło: wykład) Odchylenie przeciętne Jest średnią arytmetyczną bezwzględnych wartości odchyleo poszczególnych wartości zbiorowości statystycznej od średniej arytmetycznej. Odchylenie przeciętne Szereg szczegółowy ∑| x dx i Szereg rozdzielczy punktowy Szereg rozdzielczy przedziałowy ∑| x x | ∑n ∑| x x | ∑n x| i i dx N ni i i dx i i ni i i i x - wartośd średnia x i - wartośd i-tej cechy; ni - liczebnośd i-tej cechy lub danego przedziału – inaczej częstości występowania; x = x 0i + x 1i - środek i-tego przedziału klasowego; 2 i Typowy obszar zmienności W obszarze tym mieści się 2/3 wszystkich jednostek badanej cechy statystycznej: x s x x typowy x s x Empiryczny obszar zmienności Inaczej rozstęp. Stanowi różnicę pomiędzy minimalną a maksymalną wartością cechy. Wartośd poznawcza obszaru zmienności jest nieduża. Jedynie wstępnie charakteryzuje zróżnicowanie badanego zjawiska. R = xmax - xmin MIARY DYSPERSJI : KLASYCZNE , WZGLĘDNE Współczynnik zmienności Pozwala na porównanie dwóch cech o różnych mianach. Im wyższa jego wartośd, tym silniejsze zróżnicowanie badanej zbiorowości. Vs sx 100 x Praca domowa: 1. Na podstawie szeregów czasowych i przestrzennych obliczyd i zinterpretowad: odpowiednią średnią (!), odchylenie standardowe, wyznaczyd wartośd środkową badanej cechy oraz wskaźnik struktury. 2. Pozostałe zadania z pracy domowej do przesłania na [email protected] znajdowad się będą na stronie prowadzącego : www.kep.uni.lodz.pl *zakładka Pracownicy+ Zajęcia 2. Materiały pomocnicze do dwiczeo ze Statystyki mgr Emilia Modranka [email protected] Strona 6 z 6