stat_wyk_1

Transkrypt

stat_wyk_1
Wykład ze statystyki
Maciej Wolny
T1: Zajęcia organizacyjne
Agenda
1. Program wykładu
2. Cel zajęć
3. Nabyte umiejętności
4. Literatura
5. Warunki zaliczenia
Program wykładu
T1: Zajęcia organizacyjne
T2: Przedmiot i zadania statystyki
T3: Metody analizy rozkładu cechy
T4: Badanie współzależności zjawisk
T5: Badanie dynamiki zjawisk
T6: Zmienne losowe i ich podstawowe rozkłady
T7: Rozkład normalny
T8: Estymatory i estymacja przedziałowa
T9: Hipotezy statystyczne i ich weryfikacja
Cel
Zaznajomienie z podstawowymi metodami
procesu badania statystycznego
umożliwiającymi wykrywanie prawidłowości
struktury, współzależności i dynamiki zjawisk
masowych oraz nauczenie wnioskowania
statystycznego
Umiejętności
• czytanie, przetwarzanie i przedstawianie danych statystycznych
• określanie i obliczanie charakterystyk badanych zbiorowości
• weryfikacja hipotez parametrycznych i nieparametrycznych
• wnioskowanie na podstawie przeprowadzonych weryfikacji
• konstruowanie modeli regresji i ich zastosowanie w naukach
społecznych
• prognozowanie na podstawie analizy dynamiki zjawisk
Literatura
• Maria Nawojczyk, Przewodnik po statystyce
dla socjologów, SPSS Polska, Kraków 2002.
• Biostatystyka, red. A. Stanisz, Wyd. UJ,
Kraków 2005.
• A.N. Oppenheim, Kwestionariusze, wywiady,
pomiary postaw, Wyd. Zysk i S-ka, Poznań
2004.
[1] Aczel A. Statystyka w zarządzaniu, PWN, Warszawa 2000
[2] Ostasiewicz S., Rusnak Z., Siedlecka K., Statystyka. Elementy
teorii i zadania, Wyd. AE we Wrocławiu, Wrocław 1999
[3] Sobczyk M., Statystyka, PWN, Warszawa 1997
Warunki zaliczenia
Egzamin
1. Pozytywna ocena z ćwiczeń i laboratorium
2. Egzamin pisemny (test wyboru)
•
50% krótkie zadania
•
50% teoria
3. Ocena: 60-68% dst, 68-76% dst plus, 76-84% db, 84-92% db
plus, 92-100% bdb.
4. Ocena końcowa: 40% egz.+ 30% lab.+ 30% ćw.
T2: Przedmiot i zadania statystyki
Agenda
1. Definicja
2. Geneza
3. Podstawowe pojęcia i zagadnienia
4. Proces badania statystycznego
Definicja
Statystyka jest to nauka o metodach badania zjawisk
masowych, nauka traktująca o metodach ilościowych
badania prawidłowości zjawisk masowych
Zjawiska masowe to zjawiska, które występują często
(np. zgony, urodzenia, małżeństwa, etc.)
Geneza
Statystyka – łac. status – państwo
Etapy rozwoju badania zjawisk masowych:
• do XVII w. – okres ewidencji i zliczania
(dane, informacje)
• XVII – XVIII w. – opisywanie zbiorowości według wzorca
podanego przez państwoznawców (wykrycie prawidłowości
w zjawiskach masowych np. zgonach)
• od XVIII w. – wprowadzenie rachunku prawdopodobieństwa
(rozwój metod statystycznych opartych na matematyce)
Podstawowe pojęcia (1)
Statystykę dzielimy na:
- opisową, która ukazuje metody gromadzenia, opracowania i
prezentacji danych wraz z ich sumarycznym opisem, przy
wykorzystaniu właściwych narzędzi statystycznych
- matematyczną zwaną wnioskowaniem statystycznym, która
powstała na gruncie rachunku prawdopodobieństwa
„Statystyka” ma zasadniczo cztery znaczenia:
• metoda poznawania zjawisk masowych
• nauka badająca zjawiska masowe
• zbiór liczb charakteryzujący zbiorowość (np. statystyka ludności)
• parametr opisowy rozumiany jako pewna wielkość
charakterystyczna (np. średnia arytmetyczna, odchylenie
standardowe)
Podstawowe pojęcia (2)
Przedmiot badania statystycznego
Zbiorowość statystyczna, populacja, masa statystyczna
Zbiorowością statystyczną nazywamy zespół jednostek objętych
badaniem statystycznym, posiadających jedną lub kilka cech wspólnych
(stałych) oraz wiele cech je różniących
Zbiorowość jednorodna to zbiorowość, którą tworzą jednostki
niezróżnicowane pod względem cechy stałej
Jednostka statystyczna to podstawowy element zbiorowości
statystycznej, który musi być jednoznacznie określony pod względem
rzeczowym (kogo lub co badamy), czasowym (kiedy badamy) i
przestrzennym (gdzie, na jakim terytorium badamy)
Podstawowe pojęcia (3)
Cechami statystycznymi nazywamy własności jednostek statystycznych
stałe
zmienne
przestrzenne
rzeczowe
czasowe
czasowe
przestrzenne
rzeczowe
ilościowe
ciągłe
skokowe
jakościowe
Pomiar, skale pomiarowe
Cech statystyczne (zmienne) można mierzyć na różnych
skalach pomiarowych, które klasyfikuje się według sposobu, w
jaki można zestawić wyniki dwóch pomiarów
SKALA NOMINALNA – wartości na tej skali nie mają oczywistego
uporządkowania (np. płeć), relacją umożliwiającą porównanie jest równoważność
(równość)
SKALA PORZĄDKOWA – wartości mają jasno określony porządek (np.
wykształcenie), oprócz równoważności możliwe są relacje porządkujące
SKALA INTERWAŁOWA (PRZEDZIAŁOWA) – różnice między wartościami mają
sensowną interpretację, ale ich iloraz nie ma sensu (np. data urodzenia,
temperatura w stopniach Celsjusza)
SKALA ILORAZOWA (STOSUNKOWA) – nie tylko różnice, ale także ilorazy
wielkości mają interpretację (np. masa – coś może być dwa razy cięższe),
wielkości w skali ilorazowej można dodawać, odejmować i dzielić przez siebie
Podstawowe pojęcia (4)
Szereg statystyczny to dane (liczby) odpowiednio uporządkowane
otrzymane w wyniku przeprowadzonego badania statystycznego
szczegółowy
z cechą
mierzalną
(ilościową)
punktowe
proste
rozdzielczy
czasowy
momentów
z cechą
niemierzalną
(jakościową)
przedziałowe
geograficzne
proste
skumulowane
skumulowane
inne
okresów
Szereg szczegółowy
Uporządkowany ciąg wartości badanej cechy
statystycznej
Np. wzrost [cm] w pewnej grupie studentów
159; 159,5; 160; 161; 161; 162; 162; 162,5; 162,5; 163; 163; 163;
163; 163,5; 163,5; 164; 165; 165; 167; 167;167,5; 168; 168; 168;
168,5; 169; 169; 169; 169; 169,5; 169,5; 170; 170; 170,5; 170,5;
170,5; 170,5; 171; 172; 172,5; 173; 174; 175; 176; 176; 176,5; 177;
177; 177; 178; 178,5; 179; 179; 179; 180; 180; 181; 181; 182
Szereg rozdzielczy punktowy
Szereg rozdzielczy stanowi zbiorowość statystyczną podzieloną
na części (klasy) według określonej cechy z podaniem liczebności
każdej z wyodrębnionych klas
Np. wzrost [cm] w pewnej grupie studentów
Szereg rozdzielczy przedziałowy
Np. wzrost [cm] w pewnej grupie studentów
Prezentacja graficzna szeregów
Histogram jest to zbiór prostokątów, których podstawy, wyznaczone na osi
odciętych, stanowią rozpiętości poszczególnych przedziałów klasowych,
natomiast wysokości są określone na osi rzędnych przez liczebności
odpowiadające przedziałom klasowym
Diagram jest łamaną powstałą przez połączenie punktów, których
współrzędnymi są środki przedziałów klasowych i odpowiadające im
liczebności
Proces badania statystycznego
Badanie statystyczne jest procesem złożonym obejmującym
całokształt czynności badawczych zmierzających do poznania
zjawisk masowych za pomocą metody statystycznej. Proces ten
obejmuje:
• przygotowanie badania
• obserwację statystyczną
• opracowanie statystyczne
• analizę statystyczną
Przygotowanie badania
• sformułowanie problemu badawczego
• określenie i poznanie przedmiotu badania – celu i zakresu
badania oraz postawienie hipotez roboczych, które będą
weryfikowane
• wybór metody obserwacji (pełna lub częściowa)
• konstrukcja formularza statystycznego (układ pytań,
odpowiednie części, koncepcja formularza)
Obserwacja statystyczna
Polega na uchwyceniu interesującego badacza zespołu cech
(określonych w formularzu statystycznym)
Materiał pierwotny – materiał źródłowy otrzymany w toku
specjalnego badania statystycznego
Materiał wtórny – materiał zebrany do innych celów wykorzystany
przez badacza do swoich celów
Opracowanie statystyczne
• kontrola formalna i merytoryczna otrzymanego materiału
• przełożenie treści na liczby
• opracowanie schematów klasyfikacyjnych dla badanych cech
• tablice robocze i wynikowe
• prezentacja graficzna rezultatów badania
Analiza statystyczna
Wykrycie prawidłowości w badanej zbiorowości
- analiza struktury
- analiza współzależności
- analiza dynamiki
- analiza przestrzenna
Podsumowanie
zjawiska masowe – prawidłowości
statystyka opisowa – statystyka matematyczna
szeregi statystyczne – szczegółowy, rozdzielczy punktowy,
rozdzielczy przedziałowy
Szereg statystyczny – rozkład zmiennej, rozkład cechy
(rozkład empiryczny zmiennej)
graficzna prezentacja wyników → różnorakie sposoby
(np. wykresy kołowe)
proces badania statystycznego (przygotowanie badania,
obserwacja statystyczna, opracowanie statystyczne, analiza
statystyczna)
Rozkład empiryczny zmiennej
Rozkładem empirycznym zmiennej nazywamy
przyporządkowanie kolejnym wartością zmiennej xi
odpowiadających im liczebności ni
szereg statystyczny zmiennej = rozkład zmiennej
graficzne przedstawienie rozkładu
Powró
t