biometria - theta.edu.pl
Transkrypt
biometria - theta.edu.pl
BIOMETRIA 1. Wykład wstępny 2. Opis danych przeznaczonych do analizy 3. Wprowadzenie do pakietu SAS 4. SAS Wykresy 5. SAS Test t 6. SAS Test c2 7. SAS Regresja liniowa 8. SAS Analiza wariancji 9. Wprowadzenie do pakietu R 10. R Wykresy 11. R Test t 12. R Test c2 13. R Regresja liniowa 14. R Analiza wariancji 15. R Wykład podsumowujący WSTĘP 1. SAS praca z programem 2. Wprowadzanie i edycja danych Copyright ©2015 Joanna Szyda SAS FUNKCJE • • • • • edycja analiza → różnorodne metody statystyczne wizualizacja → wykonywanie wykresów bazy danych ... PROGRAM KOMERCYJNY • roczna licencja ZALETY • stale wzbogacany • możliwość analizy bardzo dużych zbiorów danych Copyright ©2015 Joanna Szyda SAS STRUKTURA PAKIETU • • • zbiór "procedur" → wykonywanie konkretnych analiz / wykresów modyfikacja procedur → opcje tworzenie własnych programów SAS dla WINDOWS • interfejs graficzny → 3 okna SAS dla LINUX • interfejs graficzny + linia komend Copyright ©2015 Joanna Szyda PRACA Z PROGRAMEM Copyright ©2015 Joanna Szyda PRACA Z PROGRAMEM INSTRUKCJE WYKONANIE PROGRAM EDITOR BŁĘDY BRAK BŁĘDÓW LOG OUTPUT INTERPRETACJA Copyright ©2015 Joanna Szyda PRACA Z PROGRAMEM OKNO PROGRAM EDITOR Copyright ©2015 Joanna Szyda OKNO PROGRAM EDITOR → INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: • • • specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku Copyright ©2015 Joanna Szyda OKNO PROGRAM EDITOR → INSTRUKCJE WPISANIE INSTRUKCJI Copyright ©2015 Joanna Szyda OKNO PROGRAM EDITOR → INSTRUKCJE WPROWADZENIE INSTRUKCJI Z PLIKU Copyright ©2015 Joanna Szyda OKNO PROGRAM EDITOR → INSTRUKCJE WYKONANIE INSTRUKCJI Copyright ©2015 Joanna Szyda PRACA Z PROGRAMEM OKNO LOG Copyright ©2015 Joanna Szyda OKNO LOG → KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.: • • • • nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed ( ! ! ! ) interpretacją wyników Copyright ©2015 Joanna Szyda OKNO LOG → KOMUNIKATY BRAK BŁĘDU BŁĄD Copyright ©2015 Joanna Szyda PRACA Z PROGRAMEM OKNO OUTPUT OKNO OUTPUT → WYNIKI PRACA Z PROGRAMEM STRUKTURA PROGRAMU STRUKTURA PROGRAMU ZBIÓR DANYCH • • definicja zbioru danych wczytanie danych do programu OBLICZENIA • • • • edycja danych wybór procedur statystycznych wybór procedur graficznych + wybór opcji dla procedur Copyright ©2015 Joanna Szyda PROGRAM → EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ data ALCOHOL ; infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt' delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; if AGE_INTERVIEW gt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; /* data summary */ proc means data=ALCOHOL ; run ; proc univariate data=ALCOHOL ; run ; proc freq data=ALCOHOL ; tables SEX ; tables ETHNICITY ; run ; Copyright ©2015 Joanna Szyda PROGRAM → EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ komentarz data ALCOHOL ; nazwa zbioru danych infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ; ścieżka do pliku, struktura danych input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; nazwy zmiennych * define missing codes ; komentarz if FAMID eq 0 then delete ; usuwanie brakujących danych if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; kod brakujących danych if AGE_INTERVIEW gt AGE_ONSET then delete ; sprawdzanie poprawności … co jeszcze trzeba umieścić w tym miejscu ??? … jaka jest składnia programu ??? * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; modyfikacja zmiennych Copyright ©2015 Joanna Szyda PROGRAM → EDYCJA DANYCH PROCEDURY PODSUMOWANIA DANYCH /* data summary */ proc means data=ALCOHOL ; run ; proc univariate data=ALCOHOL ; run ; proc freq data=ALCOHOL ; tables SEX ; tables ETHNICITY ; run ; Copyright ©2015 Joanna Szyda LITERATURA http://support.sas.com/documentation/onlinedoc/91pdf/index.html Copyright ©2015 Joanna Szyda