Wykład 7 - theta.edu.pl
Transkrypt
Wykład 7 - theta.edu.pl
PAKIETY STATYSTYCZNE 1. Wykład wstępny 2. Statistica wprowadzenie 3. Statistica elementy analizy danych 4. Statistica wykresy 5. SAS wprowadzenie - środowisko Windows 6. SAS wprowadzenie - środowisko Linux 7. SAS elementy analizy danych 8. SAS wykresy 9. SAS tworzenie zaawansowanych programów 10. R wprowadzenie 11. R elementy analizy danych 12. R wykresy 13. R zaawansowane elementy programowania 14. Manipulowanie dużymi zbiorami danych 15. Podsumowanie materiału WSTĘP 1. SAS regresja liniowa • • proc reg proc glm 2. SAS jednoczynnikowa analiza wariancji • • proc anova proc glm Copyright ©2011, Joanna Szyda REGRESJA LINIOWA REGRESJA LINIOWA y 0 1 x yˆ N 30 i 1 zaw. tłuszczu 29 F1, N 2 28 27 i y 2 N 1 błąd N 2 ˆ y y i i i 1 26 N N 25 24 gradient 23 22 50 wyraz wolny 60 70 80 90 100 masa ciała Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → PROC REG proc reg data=ALCOHOL ; nazwa procedury, zbiór danych eq1: model MAXDRINK=AGE_ONSET ; równanie regresji plot MAXDRINK*AGE_ONSET ; wykres run ; maxdrinks 0 1age _ of _ onset y 0 1 x Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → PROC GLM proc glm data=ALCOHOL ; nazwa procedury, zbiór danych model MAXDRINK=AGE_ONSET ; równanie regresji output out=outdat r=residual ; plik wynikowy run ; proc print data=outdat ; var IID residual ; run ; wypisanie pliku wynikowego specyfikacja zmiennych Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → WYNIKI The REG Procedure Model: eq1 Dependent Variable: MAXDRINK nazwa procedury Number of Observations Read Number of Observations Used Number of Observations with Missing Values zmienna zależna liczba obserwacji 1559 602 957 Parameter Estimates Parameter Variable DF Estimate Standard Error t Value Pr>|t| Intercept AGE_ONSET 1.99706 0.08303 18.03 -4.63 <.0001 <.0001 1 1 36.00663 -0.38452 maxdrinks 0 1age _ of _ onset y 0 1 x y 36.00663 0.38452 x Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → WYNIKI maxdrinks 0 1age _ of _ onset y 0 1 x y 36.00663 0.38452 x Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → WYNIKI The GLM Procedure Dependent Variable: MAXDRINK Source DF Model 1 Error 600 Corrected Total 601 Sum of Squares 6129.6001 171468.5860 177598.1860 Mean Square F Value Pr > F 6129.6001 285.7810 <.0001 Parameter Estimate Standard Error Intercept AGE_ONSET 36.00662893 -0.38451848 1.99706375 0.08302670 21.45 wartość testu F st. swobody poziom istotności t Value Pr > |t| 18.03 -4.63 <.0001 <.0001 Copyrigt ©2011, Joanna Szyda REGRESJA LINIOWA → WYNIKI Obs 766 767 768 769 770 771 772 773 774 775 IID residual 10000631 . 10000207 . 10000597 18.9147 10000611 67.6837 10001326 -3.9317 10001162 . 10000278 . 10001418 . 10000839 . 10001440 0.1457 nr nr obserwacji osobnika wartość błędu Copyrigt ©2011, Joanna Szyda ANALIZA WARIANCJI ANALIZA WARIANCJI Ng n i yi y 5 4 i 1 F 2 Ng 1 y Ng ni zawartość N i 1 j1 y 2 ij i N Ng 3 2 1 0 A B C lokalizacja Copyrigt ©2011, Joanna Szyda ANALIZA WARIANCJI → PROC ANOVA, PROC GLM proc anova data=ALCOHOL; class SEX ; model MAXDRINK=SEX ; run; nazwa procedury, zbiór danych zmienna klasyfikująca model analizy proc glm data=ALCOHOL; class SEX ; model MAXDRINK=SEX ; run; nazwa procedury, zbiór danych zmienna klasyfikująca model analizy Copyrigt ©2011, Joanna Szyda ANALIZA WARIANCJI → WYNIKI The ANOVA Procedure Dependent Variable: MAXDRINK Source DF Model 1 Error 1337 Corrected Total 1338 źródło stopnie zmienności swobody Sum of Squares 72285.0008 272661.7685 344946.7692 suma kwadratów Mean Square F Value Pr > F 72285.0008 354.45 <.0001 203.9355 średni kwadrat wartość testu poziom istot. The GLM Procedure Dependent Variable: MAXDRINK Sum of Source Model Error Corrected Total DF 1 1337 1338 Squares Mean Square F Value Pr > F 72285.0008 72285.0008 354.45 <.0001 272661.7685 203.9355 344946.7692 Copyrigt ©2011, Joanna Szyda proc reg proc glm SAS proc anova Copyrigt ©2014, Joanna Szyda