Statystyka_2_2011 [tryb zgodnoœci]
Transkrypt
Statystyka_2_2011 [tryb zgodnoœci]
Wykład 2. 1. Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych. 3. Wykresy: histogram, diagram i ogiwa. Prezentacja materiału statystycznego Przy badaniu struktury zbiorowości punktem wyjścia jest obserwacja, jakie jej odmiany są reprezentowane przez poszczególne jednostki statystyczne. Materiał liczbowy pochodzący z takiej obserwacji jest z reguły obszerny i nieuporządkowany. Materiał ten naleŜy odpowiednio zaprezentować. Celowi temu słuŜą szeregi statystyczne, tablice oraz wykresy statystyczne. Szeregiem statystycznym nazywamy ciąg wartości liczbowych badanej cechy, uporządkowanych według określonych kryteriów, np.: rosnąco lub malejąco. WyróŜnia się następujące rodzaje szeregów: • proste ( wyliczające, szczegółowe), • rozdzielcze z cechą jakościową, • rozdzielcze z cechą ilościową (punktowe i przedziałowe), • kumulacyjne szeregi rozdzielcze, • geograficzne (przestrzenne), • czasowe (dynamiczne, chronologiczne) momentów i okresów. Szereg prosty przedstawia materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy. Uporządkowanie to polega wyłącznie na przedstawieniu liczb w kolejności rosnącej lub malejącej. W takim szeregu prostym mogą wystąpić wartości powtarzające się. Przykład Liczbę spoŜycia filiŜanek kawy w ciągu dnia pracowników firmy „M” przedstawia następujący szereg: 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3. Szeregiem rozdzielczym nazywamy ciąg wartości liczbowych według wariantów badanej cechy ilościowej lub jakościowej. Poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności (zwane wagami). Szereg rozdzielczy cechy jakościowej jest zestawieniem poszczególnych wariantów danej cechy i odpowiadających im wagom. Przykład Pracownicy przedsiębiorstwa „Y” we wrześniu 2011 roku wg poziomu wykształcenia: Poziom wykształcenia Liczba pracowników Podstawowe 13 Średnie 62 WyŜsze 25 Ogółem 100 Źródło: dane umowne Tworząc szeregi rozdzielcze dla cechy ilościowej, jej warianty moŜemy określić punktowo lub przedziałowo. Szeregi rozdzielcze punktowe buduje się dla cechy skokowej. Przykład Zbudujemy szereg dla danych określających liczbę spoŜycia filiŜanek kawy w ciągu dnia pracowników firmy „M” Szereg rozdzielczy punktowy liczby spoŜytych filiŜanek kawy w ciągu dnia Liczba filiŜanek kawy Liczba pracowników 0 4 1 5 2 3 3 2 Suma 14 Szeregi rozdzielcze przedziałowe dotyczą cechy ciągłej. Budując taki szereg musimy najpierw ustalić liczbę przedziałów klasowych (klas), ich rozpiętości oraz sposób oznaczania granic przedziałów. Przy ustalaniu liczby klas moŜna wykorzystywać następujące wzory: 1. k≈√N, gdzie k jest liczbą klas, 2. k≤5logN, a N – liczebnością 3. k≤√N/2, badanej zbiorowości. 4. k=1+3,222logN, Rozpiętość przedziału to róŜnica między górną a dolną wartością przedziału klasowego. Rozpiętości przedziałów mogą być równe lub róŜne. Przy ustalaniu rozpiętości wykorzystuje się relację: c=R/k, gdzie c jest rozpiętością przedziału klasowego, R – róŜnicą miedzy największą a najmniejszą wartością cechy, a k – liczbą przedziałów klasowych. Granice przedziałów klasowych mogą być oznaczone dwojako: dolna granica następnego przedziału równa jest górnej granicy przedziału poprzedniego (np.: 2-4,4-6,6-8 itd.) lub teŜ granice te róŜnią się (np.: 2-4, 5-6,7-8 itd.). Nie ma to większego znaczenia. Jednak waŜnym jest, aby jednostki o tych samych wartościach cechy zaliczać zawsze do tego samego przedziału. Przykład Szeregiem rozdzielczym przedziałowym jest szereg Wysok. premii (xid,xig> Liczba pracowników 750-770 290 770-790 910 790-810 1200 810-830 800 830-850 400 Razem 3600 Źródło: Dane umowne Kumulacyjne szeregi rozdzielcze otrzymujemy w drodze łączenia kolejnych przedziałów klasowych i dodawania odpowiadających im liczebności. Liczebność skumulowana ostatniego przedziału klasowego jest wówczas równa ogólnej liczebności badanej zbiorowości. Przykład Szereg rozdzielczy skumulowany pracowników Spółki Akcyjnej Piasek w Białymstoku w IV kwartale 2007 roku wg wysokości premii kwartalnej w zł ma postać Wysok. premii w zł Liczba pracowników (xid,xig> Obliczenia pomocnicze Szereg skumulowany 750-770 290 290 290 770-790 910 290+910=1200 1200 790-810 1200 1200+1200=2400 2400 810-830 800 2400+800=3200 3200 830-850 400 3200+400=3600 3600 Razem 3600 x x Kumulacyjne szeregi rozdzielcze informują o tym, ile jest w badanej zbiorowości statystycznej jednostek przyjmujących co najwyŜej określoną wartość cechy. Szereg geograficzny pozwala na przedstawienie przestrzennego rozmieszczenia badanego zjawiska w określonym czasie. Składa się z dwóch kolumn, w pierwszej z nich znajdują się jednostki geograficzne podziału zbiorowości, np. gminy, województwa, państwa… W drugiej kolumnie przedstawia się informacje o wielkości badanego zjawiska w odpowiednich jednostkach. Przykład Zbiory herbaty w 1994 roku Kraje Zbiory herbaty w tys. ton Świat w tym: 2645 Argentyna 44 Chiny 637 Gruzja 74 Indie 720 Indonezja 174 Japonia 92 Kenia 200 Sri Lanka 240 Turcja 15 Szeregi czasowe (dynamiczne, chronologiczne) prezentują rozwój zjawisk w czasie, przy czym moŜe być tu uwzględniony ściśle określony moment lub pewien przedział, jak lata czy miesiące, np.: liczba małŜeństw zawartych w Polsce w latach 1990-1994. Rok Liczba małŜeństw 1990 255 369 1991 233 206 1992 217 240 1993 207 674 1994 207 689 Graficzna prezentacja danych statystycznych pozwala na szybkie wyrobienie sobie zdania na temat kształtowania się poziomu badanego zjawiska. Narzędziem słuŜącym do graficznej prezentacji danych są róŜnego rodzaju wykresy. MoŜna je podzielić na: liniowe proste (przedstawiające tylko jedno zjawisko) i złoŜone słupkowe, powierzchniowe, przestrzenne, punktowe, obrazkowe, mapowe. Do celów analitycznych wykresy statystyczne sporządza się w prostokątnym układzie współrzędnych. W przypadku cechy ciągłej do tego rodzaju wykresów zalicza się m. in. histogram, diagram (wielobok liczebności) i krzywą liczebności (ogiwę). Histogram jest wykresem złoŜonym z prostokątów, których podstawy (równe przedziałom klasowym) spoczywają na osi odciętych, natomiast wysokości są określone na osi rzędnych przez liczebności. Pola prostokątów tworzących histogram są proporcjonalne do liczebności poszczególnych klas, a łączna powierzchnia wszystkich prostokątów reprezentuje ogólną liczebność badanej zbiorowości. Szczególną postacią histogramu jest histogram kumulacyjny. W tym przypadku odkłada się skumulowane liczebności absolutne lub względne. Przykład Histogram przedstawiający strukturę pracowników spółki „PIASEK” wg wysokości premii: Diagram (wielobok liczebności) otrzymujemy z histogramu przez połączenie odcinkami kolejnych środków przedziałów klasowych, reprezentujących punkty środkowe górnych boków poszczególnych prostokątów. Łącząc odcinkami kolejne górne granice przedziałów klasowych, otrzymujemy diagram kumulacyjny, zwany takŜe kumulacyjnym wielobokiem liczebności. W przypadku cechy ciągłej teoretycznie moŜna nieograniczenie zmniejszać rozpiętość przedziałów klasowych , zwiększając tym samym ich liczbę. W rezultacie takiego postępowania środki przedziałów klasowych będą tworzyć gęstą siatkę punktów. Łącząc te punkty otrzymujemy linię ciągłą, która nosi nazwę krzywej liczebności lub ogiwy. PowyŜsze wykresy słuŜą określonym celom. Histogram obrazuje strukturę badanej zbiorowości, wielobok liczebności i krzywa liczebności – jej rozkład.