Wykład 7 - theta.edu.pl

Transkrypt

Wykład 7 - theta.edu.pl
PAKIETY STATYSTYCZNE
1. Wykład wstępny
2. Statistica wprowadzenie
3. Statistica elementy analizy danych
4. Statistica wykresy
5. SAS wprowadzenie - środowisko Windows
6. SAS wprowadzenie - środowisko Linux
7. SAS elementy analizy danych
8. SAS wykresy
9. SAS tworzenie zaawansowanych programów
10. R wprowadzenie
11. R elementy analizy danych
12. R wykresy
13. R zaawansowane elementy programowania
14. Manipulowanie dużymi zbiorami danych
15. Podsumowanie materiału
WSTĘP
1. SAS regresja liniowa
•
•
proc reg
proc glm
2. SAS jednoczynnikowa analiza wariancji
•
•
proc anova
proc glm
Copyright ©2011, Joanna Szyda
REGRESJA LINIOWA
REGRESJA LINIOWA
y   0  1 x
 yˆ
N
30
i 1
zaw. tłuszczu
29
F1, N  2 
28
27
i
y

2
N 1
błąd
N
2
ˆ


y

y
 i i
i 1
26
N  N
25
24
gradient
23
22
50
wyraz wolny
60
70
80
90
100
masa ciała
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → PROC REG
proc reg data=ALCOHOL ;
nazwa procedury, zbiór danych
eq1: model MAXDRINK=AGE_ONSET ;
równanie regresji
plot MAXDRINK*AGE_ONSET ;
wykres
run ;
maxdrinks   0  1age _ of _ onset
y   0  1 x
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → PROC GLM
proc glm data=ALCOHOL ;
nazwa procedury, zbiór danych
model MAXDRINK=AGE_ONSET ;
równanie regresji
output out=outdat r=residual ;
plik wynikowy
run ;
proc print data=outdat ;
var IID residual ;
run ;
wypisanie pliku wynikowego
specyfikacja zmiennych
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → WYNIKI
The REG Procedure
Model: eq1
Dependent Variable: MAXDRINK
nazwa procedury
Number of Observations Read
Number of Observations Used
Number of Observations with Missing Values
zmienna zależna
liczba obserwacji
1559
602
957
Parameter Estimates
Parameter
Variable
DF
Estimate
Standard
Error
t Value
Pr>|t|
Intercept
AGE_ONSET
1.99706
0.08303
18.03
-4.63
<.0001
<.0001
1
1
36.00663
-0.38452
maxdrinks   0  1age _ of _ onset
y   0  1 x
y  36.00663  0.38452 x
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → WYNIKI
maxdrinks   0  1age _ of _ onset
y   0  1 x
y  36.00663  0.38452 x
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → WYNIKI
The GLM Procedure
Dependent Variable: MAXDRINK
Source
DF
Model
1
Error
600
Corrected Total 601
Sum of
Squares
6129.6001
171468.5860
177598.1860
Mean Square F Value
Pr > F
6129.6001
285.7810
<.0001
Parameter
Estimate
Standard
Error
Intercept
AGE_ONSET
36.00662893
-0.38451848
1.99706375
0.08302670
21.45
wartość testu F
st. swobody
poziom istotności
t Value
Pr > |t|
18.03
-4.63
<.0001
<.0001
Copyrigt ©2011, Joanna Szyda
REGRESJA LINIOWA → WYNIKI
Obs
766
767
768
769
770
771
772
773
774
775
IID
residual
10000631
.
10000207
.
10000597
18.9147
10000611
67.6837
10001326
-3.9317
10001162
.
10000278
.
10001418
.
10000839
.
10001440
0.1457
nr
nr
obserwacji osobnika
wartość
błędu
Copyrigt ©2011, Joanna Szyda
ANALIZA WARIANCJI
ANALIZA WARIANCJI
Ng
 n i yi  y 
5
4
i 1
F
2
Ng 1
 y
Ng
ni
zawartość N
i 1 j1
y 
2
ij
i
N  Ng
3
2
1
0
A
B
C
lokalizacja
Copyrigt ©2011, Joanna Szyda
ANALIZA WARIANCJI → PROC ANOVA, PROC GLM
proc anova data=ALCOHOL;
class SEX ;
model MAXDRINK=SEX ;
run;
nazwa procedury, zbiór danych
zmienna klasyfikująca
model analizy
proc glm data=ALCOHOL;
class SEX ;
model MAXDRINK=SEX ;
run;
nazwa procedury, zbiór danych
zmienna klasyfikująca
model analizy
Copyrigt ©2011, Joanna Szyda
ANALIZA WARIANCJI → WYNIKI
The ANOVA Procedure
Dependent Variable: MAXDRINK
Source
DF
Model
1
Error
1337
Corrected Total 1338
źródło
stopnie
zmienności
swobody
Sum of
Squares
72285.0008
272661.7685
344946.7692
suma
kwadratów
Mean Square F Value Pr > F
72285.0008 354.45 <.0001
203.9355
średni
kwadrat
wartość
testu
poziom
istot.
The GLM Procedure
Dependent Variable: MAXDRINK
Sum of
Source
Model
Error
Corrected Total
DF
1
1337
1338
Squares
Mean Square F Value Pr > F
72285.0008 72285.0008 354.45 <.0001
272661.7685
203.9355
344946.7692
Copyrigt ©2011, Joanna Szyda
proc reg
proc glm
SAS
proc anova
Copyrigt ©2014, Joanna Szyda

Podobne dokumenty