Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu - E-SGH
Transkrypt
Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu - E-SGH
Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel Ćw. 1 (średnia i inne charakterystyki rozkładu cechy) Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi. a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych (wykorzystać: Analiza danych -> Statystyki opisowe) b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróŜnicowane? c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe. d) Określ występowanie danych odstających (nietypowych) na podstawie wartości standaryzowanych. Ćw. 2 (histogram) a) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek - ustal podstawę słupków i rozpiętość - podaj liczebności w kaŜdym z przedziałów oraz dystrybuantę. b) Dokonaj zliczenia częstości oraz wykres histogramu dla zmiennej ‘wiek’ korzystając z poleceń ’funkcji’. Cw. 3. Powtórz analizy z ćw. 1 i ćw. 2 w dwóch grupach: nieruchomości, których ocena była ‘bardzo dobra’ (Xvar6=1) oraz ‘pozostałych’ (Xvar6=0). Ćw.3 (ocena zaleŜności) Dokonaj oceny relacji między zmiennymi na podstawie: a) współczynnika korelacji Pearsona (r) b) wykresów punktowych (scatterplot) Ćw. 4 (analiza regresji) a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zaleŜności z wykorzystaniem analizy regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych zmiennych objaśniających, np. powierzchnia (area). b) Sprawdź, czy słusznie zakłada się, Ŝe jest to zaleŜność liniowa? Oceń dokładność oszacowanych modeli. c) Czy słuszne jest załoŜenie, Ŝe związek ten moŜe być słabszy dla nieruchomości o bardzo duŜych powierzchniach oraz starszych