biometria - theta.edu.pl

Transkrypt

biometria - theta.edu.pl
BIOMETRIA
1. Wykład wstępny
2. Opis danych przeznaczonych do analizy
3. Wprowadzenie do pakietu SAS
4. SAS Wykresy
5. SAS Test t
6. SAS Test c2
7. SAS Regresja liniowa
8. SAS Analiza wariancji
9. Wprowadzenie do pakietu R
10. R Wykresy
11. R Test t
12. R Test c2
13. R Regresja liniowa
14. R Analiza wariancji
15. R Wykład podsumowujący
WSTĘP
1. SAS praca z programem
2. Wprowadzanie i edycja danych
Copyright ©2015 Joanna Szyda
SAS
FUNKCJE
•
•
•
•
•
edycja
analiza → różnorodne metody statystyczne
wizualizacja → wykonywanie wykresów
bazy danych
...
PROGRAM KOMERCYJNY
•
roczna licencja
ZALETY
•
stale wzbogacany
•
możliwość analizy bardzo dużych zbiorów danych
Copyright ©2015 Joanna Szyda
SAS
STRUKTURA PAKIETU
•
•
•
zbiór "procedur" → wykonywanie konkretnych
analiz / wykresów
modyfikacja procedur → opcje
tworzenie własnych programów
SAS dla WINDOWS
•
interfejs graficzny → 3 okna
SAS dla LINUX
•
interfejs graficzny + linia komend
Copyright ©2015 Joanna Szyda
PRACA Z PROGRAMEM
Copyright ©2015 Joanna Szyda
PRACA Z PROGRAMEM
INSTRUKCJE
WYKONANIE
PROGRAM EDITOR
BŁĘDY
BRAK BŁĘDÓW
LOG
OUTPUT
INTERPRETACJA
Copyright ©2015 Joanna Szyda
PRACA Z PROGRAMEM

OKNO
PROGRAM EDITOR
Copyright ©2015 Joanna Szyda
OKNO PROGRAM EDITOR → INSTRUKCJE
TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ
WYKONANE PRZEZ PAKIET SAS
INSTRUKCJE MUSZĄ ZAWIERAĆ:
•
•
•
specyfikację pliku zawierającego dane
format danych w pliku
specyfikację metod statystycznych
wpisanie instrukcji
bezpośrednio w oknie
skopiowanie instrukcji z
zewnętrznego pliku
Copyright ©2015 Joanna Szyda
OKNO PROGRAM EDITOR → INSTRUKCJE
WPISANIE INSTRUKCJI
Copyright ©2015 Joanna Szyda
OKNO PROGRAM EDITOR → INSTRUKCJE
WPROWADZENIE INSTRUKCJI Z PLIKU
Copyright ©2015 Joanna Szyda
OKNO PROGRAM EDITOR → INSTRUKCJE
WYKONANIE INSTRUKCJI
Copyright ©2015 Joanna Szyda
PRACA Z PROGRAMEM

OKNO LOG
Copyright ©2015 Joanna Szyda
OKNO LOG → KOMUNIKATY
W OKNIE LOG ZAWARTE SĄ INFORMACJE
O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.:
•
•
•
•
nazwa pliku zawierającego dane
liczba analizowanych osobników
liczba osobników z brakującymi danymi
oraz informacje o ewentualnych błędach
komunikaty w oknie LOG należy przeanalizować po
wykonaniu instrukcji z okna PROGRAM EDITOR, a
przed ( ! ! ! ) interpretacją wyników
Copyright ©2015 Joanna Szyda
OKNO LOG → KOMUNIKATY
BRAK BŁĘDU
BŁĄD
Copyright ©2015 Joanna Szyda
PRACA Z PROGRAMEM

OKNO OUTPUT
OKNO OUTPUT → WYNIKI
PRACA Z PROGRAMEM

STRUKTURA PROGRAMU
STRUKTURA PROGRAMU
ZBIÓR DANYCH
•
•
definicja zbioru danych
wczytanie danych do programu
OBLICZENIA
•
•
•
•
edycja danych
wybór procedur statystycznych
wybór procedur graficznych
+ wybór opcji dla procedur
Copyright ©2015 Joanna Szyda
PROGRAM → EDYCJA DANYCH
/* 15.03.2011 JS read data on alcohol dependence */
data ALCOHOL ;
infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt'
delimiter='09'x firstobs=2 ;
input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND
AGE_ONSET MAXDRINK MAXCIGAR ;
* define missing codes ;
if FAMID eq 0 then delete ;
if
IID eq 0 then delete ;
if SEX ne 'F' or SEX ne 'M' then SEX=. ;
if AGE_INTERVIEW gt AGE_ONSET then delete ;
* modify data ;
AGE_INTERVIEW=AGE_INTERVIEW*12 ;
run ;
/* data summary */
proc means data=ALCOHOL ; run ;
proc univariate data=ALCOHOL ; run ;
proc freq data=ALCOHOL ;
tables SEX ;
tables ETHNICITY ;
run ;
Copyright ©2015 Joanna Szyda
PROGRAM → EDYCJA DANYCH
/* 15.03.2011 JS read data on alcohol dependence */ komentarz
data ALCOHOL ;
nazwa zbioru danych
infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ;
ścieżka do pliku, struktura danych
input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY
ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ;
nazwy zmiennych
* define missing codes ;
komentarz
if FAMID eq 0 then delete ;
usuwanie brakujących danych
if
IID eq 0 then delete ;
if SEX ne 'F' or SEX ne 'M' then SEX=. ;
kod brakujących danych
if AGE_INTERVIEW gt AGE_ONSET then delete ;
sprawdzanie poprawności
… co jeszcze trzeba umieścić w tym miejscu ???
… jaka jest składnia programu ???
* modify data ;
AGE_INTERVIEW=AGE_INTERVIEW*12 ;
run ;
modyfikacja zmiennych
Copyright ©2015 Joanna Szyda
PROGRAM → EDYCJA DANYCH
PROCEDURY PODSUMOWANIA DANYCH
/* data summary */
proc means data=ALCOHOL ; run ;
proc univariate data=ALCOHOL ; run ;
proc freq data=ALCOHOL ;
tables SEX ;
tables ETHNICITY ;
run ;
Copyright ©2015 Joanna Szyda
LITERATURA
http://support.sas.com/documentation/onlinedoc/91pdf/index.html
Copyright ©2015 Joanna Szyda