Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu - E-SGH

Transkrypt

Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu - E-SGH
Zajęcia nr 4. Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróŜnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych.
Ćw. 2 (histogram)
a) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
- ustal podstawę słupków i rozpiętość
- podaj liczebności w kaŜdym z przedziałów oraz dystrybuantę.
b) Dokonaj zliczenia częstości oraz wykres histogramu dla zmiennej ‘wiek’ korzystając z
poleceń ’funkcji’.
Cw. 3. Powtórz analizy z ćw. 1 i ćw. 2 w dwóch grupach: nieruchomości, których ocena była
‘bardzo dobra’ (Xvar6=1) oraz ‘pozostałych’ (Xvar6=0).
Ćw.3 (ocena zaleŜności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 4 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zaleŜności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, Ŝe jest to zaleŜność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest załoŜenie, Ŝe związek ten moŜe być słabszy dla nieruchomości o bardzo
duŜych powierzchniach oraz starszych