Laboratorium Funkcje w pakiecie R: • lm() • abline() • boxcox(MASS

Transkrypt

Laboratorium Funkcje w pakiecie R: • lm() • abline() • boxcox(MASS
MODELOWANIE MATEMATYCZNE 2015
Laboratorium
Funkcje w pakiecie R:
• lm()
• abline()
• boxcox(MASS)
Zadanie 1
Wczytaj dane znajdujące się w pliku: http://www.ipipan.eu/~teisseyrep/TEACHING/MM/
DANE/SBP.txt. W zbiorze znajdują się zmienne Age (wiek pacjenta) oraz SBP (skurczowe ciśnienie krwi).
• Wykonaj wykres rozproszenia zmiennych Age i SBP.
• Dopasuj model regresji jednokrotnej opisujący zależność zmiennej SBP od wieku.
• Na podstawie dopasowanego modelu oblicz: estymatory β̂0 , β̂1 (oraz ich błędy standardowe), rezidua ei , wartości dopasowane ŷi , współczynnik determinacji R2 .
• Dorysuj wyznaczoną na podstawie modelu prostą do wykresu rozproszenia.
• Zidentyfikuj pacjenta o największej wartości SBP i usuń go zbioru danych. Na podstwie
nowych danych dopasuj model liniowy. Na wykres rozproszenia nanieś prostą związaną z
nowym modelem. Porównaj współczynniki determinacji R2 w obu modelach.
Zadanie 2 Wczytaj dane znajdujące się w pliku: http://www.ipipan.eu/~teisseyrep/
TEACHING/MM/DANE/windpower.txt. Modelujemy ilość wytworzonej energi (zmienna output)
w zależności od prędkości wiatru (zmienna speed).
• Wykonaj wykres rozproszenia dla pary zmiennych.
• Na podstawie wykresu rozproszenia zaproponuj kilka transformacji zmiennej speed. Dodaj
krzywe do wykresów rozproszenia oraz oblicz współczynniki determinacji R2 na podstawie
dopasowanych modeli.
Zadanie 3 (zadanie domowe) Wczytaj dane znajdujące się w pliku: http://www.ipipan.eu/
~teisseyrep/TEACHING/MM/DANE/geese.txt. Dane dotyczą oszacowania liczby gęsi lecących w
kluczu. Zmienna Bestimate to liczba oszacowana przez jednego ze znajdujących sie w samolocie
obserwatorów zaś zmienna photo to liczba oszacowana na podstawie zdjęcia. Badamy zależność
zmiennej Bestimate od zmiennej photo.
• Wykonaj wykres rozproszenia dla pary zmiennych. Zwróć uwagę na problem niestałej
wariancji (!).
• Na podstawie wykresu rozproszenia zaproponuj kilka transformacji jednej ze zmiennych
lub obu zmiennych. Dodaj krzywe do wykresów rozproszenia oraz oblicz współczynniki
determinacji R2 na podstawie dopasowanych modeli.
Zadanie 4 Dane pressure dotyczą zależności ciśnienia pary rtęci i temperatury. Wczytaj dane
używając polecenia data(pressure).
• Wykonaj wykres rozproszenia dla pary zmiennych. Dopasuj model liniowy opisujący zależność ciśnienia od temperatury. Oblicz współczynnik determinacji.
• Używając metody Boxa-Coxa zaproponuj przekształcenie zmiennej odpowiedzi, dopasuj
nowy model, oblicz współczynnik detemrinacji.