analiza danych jakościowych

Transkrypt

analiza danych jakościowych
ECTS – Arkusz przedmiotu
Nazwa
ANALIZA DANYCH JAKOŚCIOWYCH
przedmiot
u Zbigniew Szkutnik, prof. nadzw.
Prowadzący przedmiot Dr hab.
Kod
Osoby prowadzące
zajęcia
Klasa przedmiotu
W
Rodzaj
przedmiotu
E
Wydział Matematyki Stosowanej
Kierunek Matematyka
Rodzaj studiów
Rodzaje zajęć *
Liczba godzin
stacjonarne
Suma
30
Stopień
studiów
drugi
Semestr
Konwersa
Wykłady Ćwiczenia Laboratoria
Projekty
toria
I
ECTS
30
2
WWW
Uwagi
Cel przedmiotu - zdobyte umiejętności
W praktycznych zastosowaniach statystyki pojawia się często konieczność analizy
danych o charakterze jakościowym. Wiele przykładów tego typu można znaleźć w
zagadnieniach biomedycznych (np. w genetyce), w psychologii, ale także w
zastosowaniach inżynierskich (np. związanych z kontrolą jakości) i finansowych (np.
tzw. credit-scoring). Celem przedmiotu będzie przedstawienie najważniejszych technik
modelowania i analizy danych jakościowych z wykorzystaniem pakietu statystycznego
R. Zajęcia będą miały w dużej części charakter praktyczny i będą ilustrowane dużą
liczbą przykładów.
Streszczenie przedmiotu
Wprowadzenie do systemu R, wnioskowanie w podstawowych modelach dyskretnych,
miary zależności dla zmiennych jakościowych, uogólnione modele liniowe, w
szczególności regresja logistyczna
Warunki uczestnictwa zaliczony kurs statystyki matematycznej, np. w zakresie
w przedmiocie oferowanym w programie studiów magisterskich na WMS
Forma zaliczenia projekt polegający na analizie rzeczywistych danych oraz
przedmiotu egzamin ustny
Zasada wystawiania średnia arytmetyczna ocen z projektu i z egzaminu
oceny końcowej
Program wykładów
1. Rodzaje danych jakościowych i ich podstawowe modele probabilistyczne.
2. Twierdzenie o związku optymalnych testów i optymalnych zbiorów ufności. Testy
Walda, testy wynikowe i testy ilorazu wiarogodności, oraz generowane przez nie zbiory
ufności.
3. Wnioskowanie w modelu dwumianowym i poissonowskim.
4. Wnioskowanie w modelu wielomianowym. Typy planów eksperymentu.
5. Ryzyko względne, ilorazy szans, zmienne ukryte i paradoks Simpsona.
6. Miary zależności dla zmiennych nominalnych: współczynniki Goodmana-Kruskala i
Theila.
7. Współczynnik gamma Goodmana-Kruskala zależności dla zmiennych o wartościach
uporządkowanych. Test niezależności chi-kwadrat i test ilorazu wiarogodności.
8. Dokładny test Fishera niezależności w tablicach kontyngencji.
9. Uogólnione modele liniowe (GLM): wstęp i przykłady. Dewiancja.
10. Momenty w rodzinach wykładniczych i funkcja wiarogodności w modelach GLM.
11. Metoda największej wiarogodności dla modeli GLM. Algorytm Newtona-Raphsona i
algorytm Fishera z interpretacją jako „iteracyjnie ważona metoda najmniejszych
kwadratów”.
12. Regresja logistyczna: estymacja, weryfikacja, interpretacja, przykłady.
13. Kodowanie nominalnych zmiennych objaśniających. Kontrasty proste i resztowe.
14. Kontrasty wielomianowe dla zmiennych jakościowych o wartościach
uporządkowanych. Modele GLM z funkcją wiążącą typu log-log.
Program pozostałych zajęć (ćwiczenia, laboratoria, projekty, seminaria)
Bibliografia
1.
A.Agresti, Categorical Data Analysis (2nd edition), Wiley, New York, 2002 (Rozdz.
1-7).
2.
J.Koronacki, J.Mielniczuk, Statystyka dla studentów kierunków technicznych i
przyrodniczych, WNT, Warszawa, 2001 (Rozdz. 6).
* Rodzaje zajęć: ćwiczenia – ćwiczenia audytoryjne, lektoraty, zajęcia wf,
laboratoria – ćwiczenia laboratoryjne, zajęcia praktyczne, zajęcia terenowe, seminaria –
seminaria, konwersatoria, projekty – ćwiczenia projektowe, prace kontrolne i przejściowe