analiza danych jakościowych
Transkrypt
analiza danych jakościowych
ECTS – Arkusz przedmiotu Nazwa ANALIZA DANYCH JAKOŚCIOWYCH przedmiot u Zbigniew Szkutnik, prof. nadzw. Prowadzący przedmiot Dr hab. Kod Osoby prowadzące zajęcia Klasa przedmiotu W Rodzaj przedmiotu E Wydział Matematyki Stosowanej Kierunek Matematyka Rodzaj studiów Rodzaje zajęć * Liczba godzin stacjonarne Suma 30 Stopień studiów drugi Semestr Konwersa Wykłady Ćwiczenia Laboratoria Projekty toria I ECTS 30 2 WWW Uwagi Cel przedmiotu - zdobyte umiejętności W praktycznych zastosowaniach statystyki pojawia się często konieczność analizy danych o charakterze jakościowym. Wiele przykładów tego typu można znaleźć w zagadnieniach biomedycznych (np. w genetyce), w psychologii, ale także w zastosowaniach inżynierskich (np. związanych z kontrolą jakości) i finansowych (np. tzw. credit-scoring). Celem przedmiotu będzie przedstawienie najważniejszych technik modelowania i analizy danych jakościowych z wykorzystaniem pakietu statystycznego R. Zajęcia będą miały w dużej części charakter praktyczny i będą ilustrowane dużą liczbą przykładów. Streszczenie przedmiotu Wprowadzenie do systemu R, wnioskowanie w podstawowych modelach dyskretnych, miary zależności dla zmiennych jakościowych, uogólnione modele liniowe, w szczególności regresja logistyczna Warunki uczestnictwa zaliczony kurs statystyki matematycznej, np. w zakresie w przedmiocie oferowanym w programie studiów magisterskich na WMS Forma zaliczenia projekt polegający na analizie rzeczywistych danych oraz przedmiotu egzamin ustny Zasada wystawiania średnia arytmetyczna ocen z projektu i z egzaminu oceny końcowej Program wykładów 1. Rodzaje danych jakościowych i ich podstawowe modele probabilistyczne. 2. Twierdzenie o związku optymalnych testów i optymalnych zbiorów ufności. Testy Walda, testy wynikowe i testy ilorazu wiarogodności, oraz generowane przez nie zbiory ufności. 3. Wnioskowanie w modelu dwumianowym i poissonowskim. 4. Wnioskowanie w modelu wielomianowym. Typy planów eksperymentu. 5. Ryzyko względne, ilorazy szans, zmienne ukryte i paradoks Simpsona. 6. Miary zależności dla zmiennych nominalnych: współczynniki Goodmana-Kruskala i Theila. 7. Współczynnik gamma Goodmana-Kruskala zależności dla zmiennych o wartościach uporządkowanych. Test niezależności chi-kwadrat i test ilorazu wiarogodności. 8. Dokładny test Fishera niezależności w tablicach kontyngencji. 9. Uogólnione modele liniowe (GLM): wstęp i przykłady. Dewiancja. 10. Momenty w rodzinach wykładniczych i funkcja wiarogodności w modelach GLM. 11. Metoda największej wiarogodności dla modeli GLM. Algorytm Newtona-Raphsona i algorytm Fishera z interpretacją jako „iteracyjnie ważona metoda najmniejszych kwadratów”. 12. Regresja logistyczna: estymacja, weryfikacja, interpretacja, przykłady. 13. Kodowanie nominalnych zmiennych objaśniających. Kontrasty proste i resztowe. 14. Kontrasty wielomianowe dla zmiennych jakościowych o wartościach uporządkowanych. Modele GLM z funkcją wiążącą typu log-log. Program pozostałych zajęć (ćwiczenia, laboratoria, projekty, seminaria) Bibliografia 1. A.Agresti, Categorical Data Analysis (2nd edition), Wiley, New York, 2002 (Rozdz. 1-7). 2. J.Koronacki, J.Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa, 2001 (Rozdz. 6). * Rodzaje zajęć: ćwiczenia – ćwiczenia audytoryjne, lektoraty, zajęcia wf, laboratoria – ćwiczenia laboratoryjne, zajęcia praktyczne, zajęcia terenowe, seminaria – seminaria, konwersatoria, projekty – ćwiczenia projektowe, prace kontrolne i przejściowe