Zajęcia nr 6. Analiza regresji w programie SPSS - E-SGH
Transkrypt
Zajęcia nr 6. Analiza regresji w programie SPSS - E-SGH
Zajęcia nr 6. Analiza regresji w programie SPSS Otwórz plik “Robin_data” w programie SPSS 1. Wprowadź etykiety dla zmiennych X6 i X7 (“stan budynku”) oraz etykiety dla kategorii xvar6: 1bardzo dobry; 0- inny (nie bdb) i Xvar7: 1- zły 0- inny (nie zły) 2. Dokonaj oceny relacji między zmiennymi na podstawie wykresów punktowych oraz współczynnika korelacji (r). Aby wstępnie ocenić wpływ zmiennej ‘stan budynku’ można wykonać wykres boxplots lub histogram 3. Dokonaj weryfikacja oczekiwanych zależności z wykorzystaniem analizy regresji. Przed wykonaniem analiz przedstaw formalny zapis hipotez w postaci funkcji regresji obejmujący: A) model liniowy dla jednej zmiennej - Powierzchnia nieruchomości (area) w dużym stopniu determinuje cenę nieruchomości (zakładamy zależność liniową). : B) model nieliniowy dla jednej zmiennej - Wpływ kolejnej jednostki powierzchni na cenę, przy dużych nieruchomościach, jest coraz słabszy. -> Utworzyć zmienną: area_2= area * area -> (Regression) -> Dep: price; (Block1 of 1) Independent: area; (Block 2 of 2) Independent: area_2 C) model liniowy dla dwóch zmiennych - Cena nieruchomości może być opisana za pomocą regresji liniowej względem powierzchni i wieku budynku a) Sprawdzenie czy nie występuje interakcja pomiędzy zmiennymi area&age -> Utworzyć zmienną: area*age D) Model ze zmiennymi jakościowymi - Subiektywna ocena stanu budynku (xvar6, xvar7) ma wpływ na cenę nieruchomości np. przy tym samym wieku budynku cena może być zdecydowanie niższa dla budynków, których stan został oceniony jako zły -> (Regression) -> Linear -> Dependent: price; Independent: age (Block 2 of 2) Independent: xvar7. 4. Analiza wartości nietypowych – Sprawdzanie czy nieruchomości o nietypowych wartościach rzutują znacząco na wyniki regresji, np. budynki o najwyższych cenach sprzedaży mogą obciążać uzyskiwane wyniki dla podstawowej grupy nieruchomości. -> (Regression) -> Casewise diagnostics -> outliers np.2 SD -> Save: Residuals –standardized -> Select cases -> if condition, np. ->Function ABS (Standardized residual) <=2 -> Powtórzenie analiz (bez wartości nietypowych). Czy uzyskane relacje uległy zmianom? 5) Analiza reszt- weryfikacja założeń do modelu regresji ->(Regression) -> Plots ->scatter: Y: ZRESID; X:Dependent; Histogram x. 6) Stepwise regression -> (Regression -> Independent: wiele zmiennych -->Method: Stepwise -> Options