Zajęcia nr 6. Analiza regresji w programie SPSS - E-SGH

Transkrypt

Zajęcia nr 6. Analiza regresji w programie SPSS - E-SGH
Zajęcia nr 6. Analiza regresji w programie SPSS
Otwórz plik “Robin_data” w programie SPSS
1.
Wprowadź etykiety dla zmiennych X6 i X7 (“stan budynku”) oraz etykiety dla kategorii xvar6: 1bardzo dobry; 0- inny (nie bdb) i Xvar7: 1- zły 0- inny (nie zły)
2. Dokonaj oceny relacji między zmiennymi na podstawie wykresów punktowych oraz współczynnika
korelacji (r).
Aby wstępnie ocenić wpływ zmiennej ‘stan budynku’ można wykonać wykres boxplots lub histogram
3. Dokonaj weryfikacja oczekiwanych zależności z wykorzystaniem analizy regresji. Przed wykonaniem
analiz przedstaw formalny zapis hipotez w postaci funkcji regresji obejmujący:
A) model liniowy dla jednej zmiennej - Powierzchnia nieruchomości (area) w dużym stopniu
determinuje cenę nieruchomości (zakładamy zależność liniową).
:
B) model nieliniowy dla jednej zmiennej - Wpływ kolejnej jednostki powierzchni na cenę, przy dużych
nieruchomościach, jest coraz słabszy.
-> Utworzyć zmienną: area_2= area * area
-> (Regression) -> Dep: price; (Block1 of 1) Independent: area; (Block 2 of 2) Independent: area_2
C) model liniowy dla dwóch zmiennych - Cena nieruchomości może być opisana za pomocą regresji
liniowej względem powierzchni i wieku budynku
a) Sprawdzenie czy nie występuje interakcja pomiędzy zmiennymi area&age
-> Utworzyć zmienną: area*age
D) Model ze zmiennymi jakościowymi - Subiektywna ocena stanu budynku (xvar6, xvar7) ma wpływ
na cenę nieruchomości np. przy tym samym wieku budynku cena może być zdecydowanie niższa dla
budynków, których stan został oceniony jako zły
-> (Regression) -> Linear -> Dependent: price; Independent: age (Block 2 of 2) Independent: xvar7.
4. Analiza wartości nietypowych – Sprawdzanie czy nieruchomości o nietypowych wartościach rzutują
znacząco na wyniki regresji, np. budynki o najwyższych cenach sprzedaży mogą obciążać uzyskiwane
wyniki dla podstawowej grupy nieruchomości.
-> (Regression) -> Casewise diagnostics -> outliers np.2 SD
-> Save: Residuals –standardized
-> Select cases -> if condition, np. ->Function ABS (Standardized residual) <=2
-> Powtórzenie analiz (bez wartości nietypowych). Czy uzyskane relacje uległy zmianom?
5) Analiza reszt- weryfikacja założeń do modelu regresji
->(Regression) -> Plots ->scatter: Y: ZRESID; X:Dependent; Histogram x.
6) Stepwise regression
-> (Regression -> Independent: wiele zmiennych -->Method: Stepwise -> Options