Podstawowe pojęcia statystyczne

Transkrypt

Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne
„Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka
i komunikat dyplomatyczny”
Jean Rigaux
Co to jest statystyka?
Nauka o metodach ilościowych badania zjawisk masowych.
Funkcje statystyki
- informacyjna, analityczna (szukanie przyczyn), prognostyczna.
Rodzaje statystyki
Opisowa: 1)analiza struktury zbiorowości, 2)analiza współzależności, 3)analiza
szeregów czasowych.
Matematyczna: zajmuje się metodami wnioskowania (estymacji i weryfikacji
hipotez) o populacji na podstawie próby.
Zbiorowość statystyczna
Zbiór elementów (pojedynczych jednostek statystycznych) – osób, przedmiotów,
faktów, jednostek czasowych i przestrzennych, posiadających jedną lub kilka cech
wspólnych (stałych) oraz wiele cech je różnicujących.
Przykłady: studenci z określonego województwa – różnią się ocenami; rolnicy
z danego województwa – różnią się pow. gospodarstw; kolejne lata, które
charakteryzują się różną średnią temperaturą (np. na stacji Łódź-Lublinek).
Rodzaje zbiorowości
Skończone // nieskończone
Statyczne (jednostki istniejące w danym momencie) // dynamiczne (jednostki
istniejące w przedziale czasu)
Jednorodne (jednostki niezróżnicowane pod względem cechy stałej – np.
pracownicy danego przedsiębiorstwa) // niejednorodne (cecha przedmiotowa
się zmienia – np. pracownicy plus klienci).
Generalna (populacja) // próbna (próba)
Przykłady: studenci UJ, komputery w firmie X,
katastrofy lotnicze w roku 1965.
Badanie statystyczne
Ogół prac mających na celu poznanie struktury zbiorowości,
współzależności i dynamiki.
Jednostka statystyczna = obiekt badany
Cechy opisujące jednostkę statystyczną: stałe i zmienne.
Cechy stałe
Wspólne dla jednostek statystycznych, które tworzą zbiorowość.
1) rzeczowe (przedmiotowe) – „czym jest to co badamy?” ; „jakie kryterium
musi spełniać jednostka, żeby wejść do zbiorowości?” (np. Polacy, studenci)
2) przestrzenne – określają miejsce znajdowania / pochodzenia jednostek
statystycznych (np. określone państwo).
3) czasowe – okres lub zbiór terminów.
Cechy zmienne
Różnią jednostki statystyczne, to one podlegają obserwacji.
1) mierzalne (ilościowe) [skokowe (dyskretne) – np. odległość elektronu od
jądra, ciągłe]
2) niemierzalne (jakościowe)
Wariant cechy
Wariantem cechy mierzalnej jest jej wartość liczbowa,
Wariantem cechy niemierzalnej jest jej wartość jakościowa (nazwa).
Skale pomiarowe
[system symboli kodujących wyniki pomiaru]
Rodzaje skal
[skale pomiarowe klasyfikuje się według sposobu w jaki można zestawić wyniki
dwóch pomiarów]
Nominalna [relacja: równe // różne]
Grupowanie jednostek w rozłączne klasy. Brak możliwości uporządkowania
wartości cech w kolejności wartościującej. Szczególny przypadek skali: skala
dychotomiczna (np. odpowiedź na pytanie lub brak odpowiedzi na pytanie; płeć).
Porządkowa [relacja: większa // mniejsza]
Porządkowanie obiektów ze względu na natężenie badanej cechy. Obiektom
przyporządkowuje się nazwy lub rangi (np. wykształcenie, stosunek do czegoś,
stanowisko w pracy, skala Richtera).
Interwałowa [relacja: większa o tyle]
Wartości cechy składają się z liczb rzeczywistych, przy czym wartość zero nie
oznacza braku zjawiska. Pozwala na określenie odległości między obiektami,
w rezultacie pozwala na wykonywanie dodawania i odejmowania – np. liczenie
amplitudy temperatury. Iloraz wartości nie ma sensownej interpretacji.
Przykład: stopnie Celsjusza, Fahrenheita.
Ilorazowa [relacja: tyle razy większa]
Pomiary charakteryzują się stałymi ilorazami i zerem bezwzględnym (np. ciężar,
Kelviny), można wykonywać wszystkie działania arytmetyczne.
Kolejne przykłady: zysk przedsiębiorstwa, cena baryłki ropy, opad.
Szereg statystyczny: zbiór zaobserwowanych wartości (wariantów) cech,
przyporządkowany jednostkom statystycznym.
Rodzaje szeregów:
1) szczegółowe – uporządkowane wartości danej cechy.
2) wyliczające – prezentuje różne cechy dotyczące tego samego obiektu.
3) rozdzielcze
3.1) cech mierzalnych
3.1.1) punktowe (dotyczy cechy dyskretnej, np. liczba rodzeństwa)
3.1.2) przedziałowe (dotyczy cech ciągłych), liczba klas (k=pierw(n);
rozpiętość przedziału c=(xmax-xmin)/k)
Histogram
3.2) cech niemierzalnych (zestawienie wariantów danej cechy
i odpowiadających im liczebności).
4) przestrzenne
5) czasowe (momentów; okresów)
Rozkład empiryczny (statystyczny)
Opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy
częstości ich występowania. Zestawienie ciągu par (wartość, częstość).
Histogram
Graficzny sposób przedstawienia rozkładu empirycznego.
Co jest ważne przy analizie histogramu? - skośność i modalność.
Skośność może świadczyć o sprzężeniach zwrotnych w systemie,
wielomodalność o połączeniu kilku zbiorowości.
Tablica statystyczna
Jest formą uporządkowania danych liczbowych dotyczących jednej lub więcej
zbiorowości według przyjętych kryteriów.
Tablica statystyczna powinna zawierać: numer, tytuł, treść, objaśnienia, źródło
danych.
Tablica kombinowana
Wtedy gdy jest więcej niż jedno kryterium podziału zbiorowości.
Etapy badań statystycznych
1) przygotowanie badania (cel, przedmiot badania, zakres – wybór cech
zmiennych)
2) obserwacja statystyczna
Gromadzenie danych o określonym zjawisku, jest rejestracją wielkości jakie
badane cechy przyjmują u poszczególnych jednostek zbiorowości statystycznej.
[zebranie materiałów statystycznych].
3) kontrola formalna (kompletność danych) i merytoryczna
(poprawność rachunkowa).
4) grupowanie statystyczne
Systematyzowanie materiału statystycznego, podział na możliwie jednorodne
grupy, ustalamy kolejność i nazwy grup → otrzymujemy wykaz klasyfikacyjny.
W przypadku gdy cecha ma charakter ciągły, warianty cech przedstawiamy
w postaci przedziałów liczbowych.
5) prezentacja danych (tablice i wykresy)
6) analiza statystyczna (wykrywanie prawidłowości w kształtowaniu zjawisk
statystycznych oraz związków między nimi + interpretacja wyników);
(analiza struktury; analiza współzależności; analiza zmian zjawisk w czasie).
Zadania
1) podaj przykład zbiorowości: skończonej, nieskończonej,
statycznej, dynamicznej,
jednorodnej oraz niejednorodnej.
(określ również cechę przestrzenną i czasową)
2) podaj po dwa przykłady cechy zmiennej:
mierzalnej dyskretnej, mierzalnej ciągłej oraz niemierzalnej.
3) podaj po dwa przykłady cech mierzonych w skalach:
nominalnej, porządkowej, interwałowej, ilorazowej.
4) wygeneruj 50-elementowy szereg losowy (funkcja randbetween – calc)
i skonstruuj szereg rozdzielczy przedziałowy, narysuj histogram.
5) podaj przykład szeregu czasowego (okresów, momentów).