Przedmiot statystyki - Politechnika Śląska

Transkrypt

Przedmiot statystyki - Politechnika Śląska
Statystyka opisowa
Przedmiot statystyki
Statystyka jest nauką zajmującą się metodami badania zjawisk (procesów) masowych.
Zjawisko masowe będące przedmiotem badania statystycznego, jest stale powtarzających się związków
między cechami charakterystycznymi, dla rozpatrywanych obiektów. Związki takie nazywamy
prawidłowościami statystycznymi.
Podstawowe pojęcia statystyczne
Przedmiotem badań statystycznych są zbiorowości osób, rzeczy lub zjawisk.
Zbiorowością statystyczną inaczej populacją lub masą statystyczną, jest zespół jednostek objętych
badaniem statystycznym. Cel badania określa zbiorowość. Zbiorowość należy ściśle określić:
•
pod względem rzeczowym (czyli kogo lub co badamy),
•
pod względem terytorialnym,
•
pod względem czasowym.
Jednostki wchodzące w skład zbiorowości nazywamy cechami statystycznymi, które najogólniej
można podzieli na cechy stałe oraz cechy zmienne.
Cechy statystyczne
Cechy mierzalne
ilościowe
Cechy
skokowe
(dyskretne)
Cechy niemierzalne
jakościowe
Cechy ciągłe
Cechy stałe określają jednostki pod względem rzeczowym, czasowym oraz przestrzennym.
Cechy zmienne są właściwościami, którymi różną się poszczególne jednostki statystyczne. Można je
podzielić na cechy jakościowe (niemierzalne) oraz ilościowe (mierzalne). Cechy jakościowe można
tylko wyrazić za pomocą opisu, natomiast cechy ilościowe można wyrazić za pomocą liczb o różnych
mianach – wzrost (cm), waga (kg), dochód (PLN).
Rodzaje badań statystycznych
Badanie można nazwać badaniem statystycznym, jeśli spełnia określone warunki:
(1) musi dotyczyć określonej zbiorowości statystycznej,
(2) musi określać prawidłowości charakteryzujące cała zbiorowość,
(3) prawidłowości muszą dotyczyć zmiennych w tej zbiorowości.
Politechnika Śląska
Wydział Organizacji i Zarządzania
Katedra Informatyki i Ekonometrii
1
Statystyka opisowa
Wśród badań statystycznych można wyróżnić trzy metody:
1) badania pełne (całkowite, wyczerpujące),
Zarówno badania pełne jak i częściowe mogą być ciągłe, okresowe jak i doraźne. Z badaniami
ciągłymi mamy do czynienia wówczas, kiedy zmieniające się w czasie zjawiska są
obserwowalne i sukcesywnie badane w czasie. Badania okresowe przeprowadzone są w
pewnych ściśle określonych odstępach czasu. Natomiast badania doraźne przeprowadzane są
w pewnych szczególnych okolicznościach, spowodowanych z reguły nieprzewidzianymi
przyczynami.
2) badania niepełne (częściowe)
Badania częściowe można podzielić na badania ankietowe, monograficzne i reprezentatywne.
Badania ankietowe przeprowadzane są wówczas, gdy informacje o zbiorowości są
gromadzone za pomocą ankiety rozsyłanej do ściśle określonych osób lub instytucji. Badania
monograficzne polegają na szczegółowym jednym z wielu punktów widzenia opisie i analizie
wybranej jednostki statystycznej. Warunkiem koniecznym jest to, że badana jednostka powinna
być typowa, powszechnie występująca lub wskazująca kierunek rozwoju, a nie przodująca.
Metoda reprezentacyjna jest częściowym badaniem statystycznym opartym na próbie
pobranej ze zbiorowości generalnej w sposób losowy.
3) szacunki interpolacyjne i ekstrapolacyjne
Interpolacja polega na szacowaniu nieznanych wartości cechy na podstawie znanych wartości
sąsiednich. Natomiast ekstrapolacja polega na szacowaniu wartości wykraczających poza
przedział wartości znanych.
Organizacja badań statystycznych
Każde badanie statystyczne można podzielić na etapy:
1. Przygotowanie badania
Etap ten obejmuje sformułowanie hipotezy merytorycznej stanowiącej cel badań, określenie
przedmiotu badań, zdefiniowanie zbiorowości statystycznej i jednostek statystycznych, podjęcie
decyzji mającej na celu określenie rodzaju badań, (czy prowadzimy badanie pełne czy
częściowe), przedstawienie zakresu badań, (zbioru cech charakterystycznych dla badanego
zjawiska masowego w rozpatrywanej zbiorowości), przedstawienie planu czynności
zawierającego metody badawcze.
2. Obserwacja statystyczna
Etap ten obejmuje zebranie wszelkich informacji o badanych obiektach. Wynikiem obserwacji
jest liczbowy materiał statystyczny, stanowiący źródło informacji o tym jak w badanym
zjawisku, kształtuje się struktura rozkładu zbiorowości pod względem badanych cech.
Wynikiem tego badania jest materiał statystyczny, który powinien prawidłowy, rzetelny
Politechnika Śląska
Wydział Organizacji i Zarządzania
Katedra Informatyki i Ekonometrii
2
Statystyka opisowa
i kompletny. Od wiarygodności i dokładności zebranych danych silnie uzależniona jest precyzja
oszacowanych wyników w późniejszej analizie statystycznej.
3. Opracowanie i prezentacja materiału liczbowego
W tym etapie następuje opracowanie materiału statystycznego: grupowanie i klasyfikacja.
Grupowanie obiektów polega na wprowadzaniu badanych obiektów do ustalonych grup bez
stawiania wobec nich jakichkolwiek wymogów. Klasyfikacja wprowadza obiekt do podzbioru
przy założeniu, że obiekt ten spełnia określone uwarunkowania, stanowiące założenia
klasyfikacji, wynikające z ustalonego schematu klasyfikacyjnego. Uwarunkowania stawiane
wobec obiektów mogą być jakościowe lub ilościowe.
4. opis lub wnioskowanie statystyczne
Postawienie wniosków i oszacowanie wartości prognoz to przykład zastosowania analizy
statystycznej. Wyróżnia się diagnozę i prognozę. Diagnoza to ocena stanu faktycznego zjawiska
dokonana na podstawie danych historycznych. Prognoza to ocena kształtowania się zjawiska
w przyszłości.
Opracowany materiał statystyczny musi być odpowiednio zaprezentowany na przykład w postaci
szeregów statystycznych. Szereg statystyczny jest uporządkowanym zbiorem wyników obserwacji
jednostek statystycznych według pewnej cechy. Szeregi statystyczne można podzielić na szeregi
szczegółowe oraz przedziałowe.
Szereg szczegółowy prezentuje materiał statystyczny uporządkowany według wartości badanej cechy.
Porządkowanie polega na ustawieniu wartości cechy według kolejności rosnącej lub malejącej.
Przykład
2, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7 [kg]
Szereg rozdzielczy to zbiór wartości liczbowych uporządkowanych wg wariantów pewnej badanej
cechy, przy czym poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im
liczebności. Tworząc szeregi rozdzielcze na podstawie cechy mierzalnej, jej warianty można określać
punktowo lub przedziałowo. Szeregi rozdzielcze punktowe budowane są dla cechy skokowej, natomiast
szeregi rozdzielcze przedziałowe przede wszystkim dla cechy ciągłej.
Przykład
- szereg rozdzielczy punktowy
Liczba samochodów w rodzinie
Liczba rodzin
0
15
1
105
2
55
3
30
4
5
- szereg rozdzielczy przedziałowy
i
1
2
3
4
Politechnika Śląska
Wydział Organizacji i Zarządzania
Katedra Informatyki i Ekonometrii
Wiedza ze statystyki
(w punktach)
x0i-x1i
10-20
20-30
30-40
50-60
Liczba
studentów
ni
3
30
10
5
3
Statystyka opisowa
Liczba przedziałów (klas) w szeregu uzależniona jest od obszaru zmienności badanej cechy, od
liczebności zbiorowości oraz celu badania. Liczbę klas można obliczy ze wzorów:
k= n
k = 1 + 3,322 ⋅ log n
k = 5 ⋅ log n
gdzie:
k – liczba klas,
n – liczebność zbiorowości.
Rozpiętość przedziału klasowego (interwał lub rozstęp przedziałowy) jest różnicą między górną
i dolną granicą klasy. Przybliżona wartośc interwału może być obliczana ze wzoru:
x max − x min
k −1
xmax − xmin
h=
1 + 3,322 log n
h=
Politechnika Śląska
Wydział Organizacji i Zarządzania
Katedra Informatyki i Ekonometrii
4

Podobne dokumenty