Podstawowe pojęcia statystyczne
Transkrypt
Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne „Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny” Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk masowych. Funkcje statystyki - informacyjna, analityczna (szukanie przyczyn), prognostyczna. Rodzaje statystyki Opisowa: 1)analiza struktury zbiorowości, 2)analiza współzależności, 3)analiza szeregów czasowych. Matematyczna: zajmuje się metodami wnioskowania (estymacji i weryfikacji hipotez) o populacji na podstawie próby. Zbiorowość statystyczna Zbiór elementów (pojedynczych jednostek statystycznych) – osób, przedmiotów, faktów, jednostek czasowych i przestrzennych, posiadających jedną lub kilka cech wspólnych (stałych) oraz wiele cech je różnicujących. Przykłady: studenci z określonego województwa – różnią się ocenami; rolnicy z danego województwa – różnią się pow. gospodarstw; kolejne lata, które charakteryzują się różną średnią temperaturą (np. na stacji Łódź-Lublinek). Rodzaje zbiorowości Skończone // nieskończone Statyczne (jednostki istniejące w danym momencie) // dynamiczne (jednostki istniejące w przedziale czasu) Jednorodne (jednostki niezróżnicowane pod względem cechy stałej – np. pracownicy danego przedsiębiorstwa) // niejednorodne (cecha przedmiotowa się zmienia – np. pracownicy plus klienci). Generalna (populacja) // próbna (próba) Przykłady: studenci UJ, komputery w firmie X, katastrofy lotnicze w roku 1965. Badanie statystyczne Ogół prac mających na celu poznanie struktury zbiorowości, współzależności i dynamiki. Jednostka statystyczna = obiekt badany Cechy opisujące jednostkę statystyczną: stałe i zmienne. Cechy stałe Wspólne dla jednostek statystycznych, które tworzą zbiorowość. 1) rzeczowe (przedmiotowe) – „czym jest to co badamy?” ; „jakie kryterium musi spełniać jednostka, żeby wejść do zbiorowości?” (np. Polacy, studenci) 2) przestrzenne – określają miejsce znajdowania / pochodzenia jednostek statystycznych (np. określone państwo). 3) czasowe – okres lub zbiór terminów. Cechy zmienne Różnią jednostki statystyczne, to one podlegają obserwacji. 1) mierzalne (ilościowe) [skokowe (dyskretne) – np. odległość elektronu od jądra, ciągłe] 2) niemierzalne (jakościowe) Wariant cechy Wariantem cechy mierzalnej jest jej wartość liczbowa, Wariantem cechy niemierzalnej jest jej wartość jakościowa (nazwa). Skale pomiarowe [system symboli kodujących wyniki pomiaru] Rodzaje skal [skale pomiarowe klasyfikuje się według sposobu w jaki można zestawić wyniki dwóch pomiarów] Nominalna [relacja: równe // różne] Grupowanie jednostek w rozłączne klasy. Brak możliwości uporządkowania wartości cech w kolejności wartościującej. Szczególny przypadek skali: skala dychotomiczna (np. odpowiedź na pytanie lub brak odpowiedzi na pytanie; płeć). Porządkowa [relacja: większa // mniejsza] Porządkowanie obiektów ze względu na natężenie badanej cechy. Obiektom przyporządkowuje się nazwy lub rangi (np. wykształcenie, stosunek do czegoś, stanowisko w pracy, skala Richtera). Interwałowa [relacja: większa o tyle] Wartości cechy składają się z liczb rzeczywistych, przy czym wartość zero nie oznacza braku zjawiska. Pozwala na określenie odległości między obiektami, w rezultacie pozwala na wykonywanie dodawania i odejmowania – np. liczenie amplitudy temperatury. Iloraz wartości nie ma sensownej interpretacji. Przykład: stopnie Celsjusza, Fahrenheita. Ilorazowa [relacja: tyle razy większa] Pomiary charakteryzują się stałymi ilorazami i zerem bezwzględnym (np. ciężar, Kelviny), można wykonywać wszystkie działania arytmetyczne. Kolejne przykłady: zysk przedsiębiorstwa, cena baryłki ropy, opad. Szereg statystyczny: zbiór zaobserwowanych wartości (wariantów) cech, przyporządkowany jednostkom statystycznym. Rodzaje szeregów: 1) szczegółowe – uporządkowane wartości danej cechy. 2) wyliczające – prezentuje różne cechy dotyczące tego samego obiektu. 3) rozdzielcze 3.1) cech mierzalnych 3.1.1) punktowe (dotyczy cechy dyskretnej, np. liczba rodzeństwa) 3.1.2) przedziałowe (dotyczy cech ciągłych), liczba klas (k=pierw(n); rozpiętość przedziału c=(xmax-xmin)/k) Histogram 3.2) cech niemierzalnych (zestawienie wariantów danej cechy i odpowiadających im liczebności). 4) przestrzenne 5) czasowe (momentów; okresów) Rozkład empiryczny (statystyczny) Opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy częstości ich występowania. Zestawienie ciągu par (wartość, częstość). Histogram Graficzny sposób przedstawienia rozkładu empirycznego. Co jest ważne przy analizie histogramu? - skośność i modalność. Skośność może świadczyć o sprzężeniach zwrotnych w systemie, wielomodalność o połączeniu kilku zbiorowości. Tablica statystyczna Jest formą uporządkowania danych liczbowych dotyczących jednej lub więcej zbiorowości według przyjętych kryteriów. Tablica statystyczna powinna zawierać: numer, tytuł, treść, objaśnienia, źródło danych. Tablica kombinowana Wtedy gdy jest więcej niż jedno kryterium podziału zbiorowości. Etapy badań statystycznych 1) przygotowanie badania (cel, przedmiot badania, zakres – wybór cech zmiennych) 2) obserwacja statystyczna Gromadzenie danych o określonym zjawisku, jest rejestracją wielkości jakie badane cechy przyjmują u poszczególnych jednostek zbiorowości statystycznej. [zebranie materiałów statystycznych]. 3) kontrola formalna (kompletność danych) i merytoryczna (poprawność rachunkowa). 4) grupowanie statystyczne Systematyzowanie materiału statystycznego, podział na możliwie jednorodne grupy, ustalamy kolejność i nazwy grup → otrzymujemy wykaz klasyfikacyjny. W przypadku gdy cecha ma charakter ciągły, warianty cech przedstawiamy w postaci przedziałów liczbowych. 5) prezentacja danych (tablice i wykresy) 6) analiza statystyczna (wykrywanie prawidłowości w kształtowaniu zjawisk statystycznych oraz związków między nimi + interpretacja wyników); (analiza struktury; analiza współzależności; analiza zmian zjawisk w czasie). Zadania 1) podaj przykład zbiorowości: skończonej, nieskończonej, statycznej, dynamicznej, jednorodnej oraz niejednorodnej. (określ również cechę przestrzenną i czasową) 2) podaj po dwa przykłady cechy zmiennej: mierzalnej dyskretnej, mierzalnej ciągłej oraz niemierzalnej. 3) podaj po dwa przykłady cech mierzonych w skalach: nominalnej, porządkowej, interwałowej, ilorazowej. 4) wygeneruj 50-elementowy szereg losowy (funkcja randbetween – calc) i skonstruuj szereg rozdzielczy przedziałowy, narysuj histogram. 5) podaj przykład szeregu czasowego (okresów, momentów).