Przedmiot statystyki - Politechnika Śląska
Transkrypt
Przedmiot statystyki - Politechnika Śląska
Statystyka opisowa Przedmiot statystyki Statystyka jest nauką zajmującą się metodami badania zjawisk (procesów) masowych. Zjawisko masowe będące przedmiotem badania statystycznego, jest stale powtarzających się związków między cechami charakterystycznymi, dla rozpatrywanych obiektów. Związki takie nazywamy prawidłowościami statystycznymi. Podstawowe pojęcia statystyczne Przedmiotem badań statystycznych są zbiorowości osób, rzeczy lub zjawisk. Zbiorowością statystyczną inaczej populacją lub masą statystyczną, jest zespół jednostek objętych badaniem statystycznym. Cel badania określa zbiorowość. Zbiorowość należy ściśle określić: • pod względem rzeczowym (czyli kogo lub co badamy), • pod względem terytorialnym, • pod względem czasowym. Jednostki wchodzące w skład zbiorowości nazywamy cechami statystycznymi, które najogólniej można podzieli na cechy stałe oraz cechy zmienne. Cechy statystyczne Cechy mierzalne ilościowe Cechy skokowe (dyskretne) Cechy niemierzalne jakościowe Cechy ciągłe Cechy stałe określają jednostki pod względem rzeczowym, czasowym oraz przestrzennym. Cechy zmienne są właściwościami, którymi różną się poszczególne jednostki statystyczne. Można je podzielić na cechy jakościowe (niemierzalne) oraz ilościowe (mierzalne). Cechy jakościowe można tylko wyrazić za pomocą opisu, natomiast cechy ilościowe można wyrazić za pomocą liczb o różnych mianach – wzrost (cm), waga (kg), dochód (PLN). Rodzaje badań statystycznych Badanie można nazwać badaniem statystycznym, jeśli spełnia określone warunki: (1) musi dotyczyć określonej zbiorowości statystycznej, (2) musi określać prawidłowości charakteryzujące cała zbiorowość, (3) prawidłowości muszą dotyczyć zmiennych w tej zbiorowości. Politechnika Śląska Wydział Organizacji i Zarządzania Katedra Informatyki i Ekonometrii 1 Statystyka opisowa Wśród badań statystycznych można wyróżnić trzy metody: 1) badania pełne (całkowite, wyczerpujące), Zarówno badania pełne jak i częściowe mogą być ciągłe, okresowe jak i doraźne. Z badaniami ciągłymi mamy do czynienia wówczas, kiedy zmieniające się w czasie zjawiska są obserwowalne i sukcesywnie badane w czasie. Badania okresowe przeprowadzone są w pewnych ściśle określonych odstępach czasu. Natomiast badania doraźne przeprowadzane są w pewnych szczególnych okolicznościach, spowodowanych z reguły nieprzewidzianymi przyczynami. 2) badania niepełne (częściowe) Badania częściowe można podzielić na badania ankietowe, monograficzne i reprezentatywne. Badania ankietowe przeprowadzane są wówczas, gdy informacje o zbiorowości są gromadzone za pomocą ankiety rozsyłanej do ściśle określonych osób lub instytucji. Badania monograficzne polegają na szczegółowym jednym z wielu punktów widzenia opisie i analizie wybranej jednostki statystycznej. Warunkiem koniecznym jest to, że badana jednostka powinna być typowa, powszechnie występująca lub wskazująca kierunek rozwoju, a nie przodująca. Metoda reprezentacyjna jest częściowym badaniem statystycznym opartym na próbie pobranej ze zbiorowości generalnej w sposób losowy. 3) szacunki interpolacyjne i ekstrapolacyjne Interpolacja polega na szacowaniu nieznanych wartości cechy na podstawie znanych wartości sąsiednich. Natomiast ekstrapolacja polega na szacowaniu wartości wykraczających poza przedział wartości znanych. Organizacja badań statystycznych Każde badanie statystyczne można podzielić na etapy: 1. Przygotowanie badania Etap ten obejmuje sformułowanie hipotezy merytorycznej stanowiącej cel badań, określenie przedmiotu badań, zdefiniowanie zbiorowości statystycznej i jednostek statystycznych, podjęcie decyzji mającej na celu określenie rodzaju badań, (czy prowadzimy badanie pełne czy częściowe), przedstawienie zakresu badań, (zbioru cech charakterystycznych dla badanego zjawiska masowego w rozpatrywanej zbiorowości), przedstawienie planu czynności zawierającego metody badawcze. 2. Obserwacja statystyczna Etap ten obejmuje zebranie wszelkich informacji o badanych obiektach. Wynikiem obserwacji jest liczbowy materiał statystyczny, stanowiący źródło informacji o tym jak w badanym zjawisku, kształtuje się struktura rozkładu zbiorowości pod względem badanych cech. Wynikiem tego badania jest materiał statystyczny, który powinien prawidłowy, rzetelny Politechnika Śląska Wydział Organizacji i Zarządzania Katedra Informatyki i Ekonometrii 2 Statystyka opisowa i kompletny. Od wiarygodności i dokładności zebranych danych silnie uzależniona jest precyzja oszacowanych wyników w późniejszej analizie statystycznej. 3. Opracowanie i prezentacja materiału liczbowego W tym etapie następuje opracowanie materiału statystycznego: grupowanie i klasyfikacja. Grupowanie obiektów polega na wprowadzaniu badanych obiektów do ustalonych grup bez stawiania wobec nich jakichkolwiek wymogów. Klasyfikacja wprowadza obiekt do podzbioru przy założeniu, że obiekt ten spełnia określone uwarunkowania, stanowiące założenia klasyfikacji, wynikające z ustalonego schematu klasyfikacyjnego. Uwarunkowania stawiane wobec obiektów mogą być jakościowe lub ilościowe. 4. opis lub wnioskowanie statystyczne Postawienie wniosków i oszacowanie wartości prognoz to przykład zastosowania analizy statystycznej. Wyróżnia się diagnozę i prognozę. Diagnoza to ocena stanu faktycznego zjawiska dokonana na podstawie danych historycznych. Prognoza to ocena kształtowania się zjawiska w przyszłości. Opracowany materiał statystyczny musi być odpowiednio zaprezentowany na przykład w postaci szeregów statystycznych. Szereg statystyczny jest uporządkowanym zbiorem wyników obserwacji jednostek statystycznych według pewnej cechy. Szeregi statystyczne można podzielić na szeregi szczegółowe oraz przedziałowe. Szereg szczegółowy prezentuje materiał statystyczny uporządkowany według wartości badanej cechy. Porządkowanie polega na ustawieniu wartości cechy według kolejności rosnącej lub malejącej. Przykład 2, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7 [kg] Szereg rozdzielczy to zbiór wartości liczbowych uporządkowanych wg wariantów pewnej badanej cechy, przy czym poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności. Tworząc szeregi rozdzielcze na podstawie cechy mierzalnej, jej warianty można określać punktowo lub przedziałowo. Szeregi rozdzielcze punktowe budowane są dla cechy skokowej, natomiast szeregi rozdzielcze przedziałowe przede wszystkim dla cechy ciągłej. Przykład - szereg rozdzielczy punktowy Liczba samochodów w rodzinie Liczba rodzin 0 15 1 105 2 55 3 30 4 5 - szereg rozdzielczy przedziałowy i 1 2 3 4 Politechnika Śląska Wydział Organizacji i Zarządzania Katedra Informatyki i Ekonometrii Wiedza ze statystyki (w punktach) x0i-x1i 10-20 20-30 30-40 50-60 Liczba studentów ni 3 30 10 5 3 Statystyka opisowa Liczba przedziałów (klas) w szeregu uzależniona jest od obszaru zmienności badanej cechy, od liczebności zbiorowości oraz celu badania. Liczbę klas można obliczy ze wzorów: k= n k = 1 + 3,322 ⋅ log n k = 5 ⋅ log n gdzie: k – liczba klas, n – liczebność zbiorowości. Rozpiętość przedziału klasowego (interwał lub rozstęp przedziałowy) jest różnicą między górną i dolną granicą klasy. Przybliżona wartośc interwału może być obliczana ze wzoru: x max − x min k −1 xmax − xmin h= 1 + 3,322 log n h= Politechnika Śląska Wydział Organizacji i Zarządzania Katedra Informatyki i Ekonometrii 4