Dr hab. prof. SGH Wiktoria Wróblewska Analiza danych z SPSS i

Transkrypt

Dr hab. prof. SGH Wiktoria Wróblewska Analiza danych z SPSS i
Dr hab. prof. SGH Wiktoria Wróblewska
Analiza danych z SPSS i Excel
http://www.e-sgh.pl/wroblewska/237870-0641
Zajęcia SMN
Ćw. 1 (tworzenie zbioru danych)
Na podstawie wyników mini-ankiety utwórz bazę danych zawierającą następujące zmienne:
1. płeć (1-kobieta; 2-mężczyzna)
2. czas dojazdu na SGH (w min)
3. ocena ze statystyki
Wykonaj listowanie zmiennych (statystyki opisowe->częstości). Dla której zmiennej można
liczyć statystyki opisowe?
Ćw. 2 (łączenie zbiorów)
a) Zapisz na dysku plik badanie.sav umieszczony na stronie e-sgh i otwórz go za pomocą programu
SPSS.
b) W pliku badanie1.sav znajduje się kolejnych 34 rekordów. Dołącz te obserwacje do bazy danych.
c) Zapisz całość na swoim koncie jako plik Badanie_T.sav.
Ćw. 3 (wybór danych, sortowanie, agrgowanie.)
1. Zmodyfikuj plik tak, aby pod uwagę były brane tylko przypadki osób urodzonych w roku 1981 lub
1982 – dane->wybierz obserwacje .
2. Podziel plik tak, aby w dalszych analizach roczniki 1981 i 1982 były rozpatrywane osobno. - dane>podziel na podzbiory
3. Posortuj plik rosnąco wg średniej ocen w ostatnim semestrze (zmienna e4).- dane->sortuj oberwacje
4. Utwórz zmienną zagregowaną „srednia ocen wg a) roku studiów b) płci dane->agreguj (Mean (Nzm)
Ćw. 4 (przekodowanie zmiennych)
Zmienna „Wielkość miejsca zamieszkania” posiada 10 kategorii wartości. Dokonaj agregacji
kategorii i utwórz nową zmienną a10_kod z 3 kategoriami (poniżej 20 tys., 20-100 tys., 100 tys. i
więcej); przekształcenia->przekodowanie->nowa zmienna->
Ćw. 5 (obliczanie podstawowych charakterystyk opisowych)
a) Na podstawie zbioru danych „Badanie_T.sav” oblicz średnią i medianę dla średniej ocen w ostatnim
semestrze studiów (e4). Podaj słowne interpretacje wyników.
b) Jaką ocenę miało 20% najlepszych studentów w tym badaniu?
c) Która grupa (studentki czy studenci) jest bardzie zróżnicowana ze względu na oceny?
d) Oceń asymetrię rozkładów ocen w obydwu grupach. Wykorzystaj miary liczbowe i wykres box-plot.
Wskaż wartości nietypowe (skrajne i odstające).
e) przekoduj zmienną ciągła e4 na zmienna skategoryzowana (5 kategorii)
Ćw. 6 (podstawowe wykresy w analizie struktury)
a) Zaproponuj i wykonaj wykresy liczebności oraz częstości dla zmiennych: ‘praca poza
studiami’, ‘jestem zadowolony ze swojego ciała’
Wykonaj zestawienia z pkt a) dla każdej z płci
b) Wykonaj histogram dla zmiennej e4 (srednia ocen):
- podstawa słupków o rozpiętości 0,5; podaj wartości liczebności w każdym z przedziałów
- narysuj krzywą normalną; - zmień kolorystykę
- wpisz tytuł wykresu np. studenci AE Wrocław według średniej ocen
c) Wykonaj wykres ‘piramidy wieku’ dla zmiennej ‘wzrost’ (waga) wg płci .
Ćw.7 (analizy opisowe dla zmiennej e28_wiek )
a) Wyznacz charakterystyki opisowe dla zmiennych ‘Wiek, w którym respondent. upił się po raz
pierwszy’(e28_wiek) (Przed analizą zapoznaj się z występującymi wartościami zmiennej w zbiorze i
dokonaj odpowiedniej selekcji danych)
b) Dokonaj analiz dla zmiennych z punktu a) odrębnie dla studentów i studentek. Skomentuj uzyskane
wartości średnich i mediany.
c) Wykonaj wykres skrzynkowy dla zmiennej „Wiek, w którym respondent. upił się po raz pierwszy”.
Oceń na jego podstawie rozkład obserwacji typowych i odstających.
e) Powtórz cw 3c) dla każdej z płci
f) Wykonaj wykres liczebności skumulowanych ( % skumulow.)
g) Przeliczanie zamiennych zawierających daty.
Cw. 8 (tabele kontyngencji i ocena zależności)
Dokonaj analizy zależności:
a) pomiędzy znaczeniem religii (c1) a oceną ważności małżeństwa (n50). – tablice
kontyngencji oraz test chi-kwadrat
b) dokonaj analizy jak w 1a) dodatkowo według płci respondentów; wykonaj wykres
słupkowy
c) Wykonaj analizę zależności dla innych grup zmiennych.
Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróżnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych
e) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
Ćw.2 (ocena zależności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 3 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zależności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, że jest to zależność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest założenie, że związek ten może być słabszy dla nieruchomości o bardzo
dużych powierzchniach oraz starszych
Cw. 4 (analizy regresji i korelacji w SPSS)
Dr hab. prof. SGH Wiktoria Wróblewska
Analiza danych z SPSS i Excel
http://www.e-sgh.pl/wroblewska/237870-0641
Zajęcia SMN
Ćw. 1 (tworzenie zbioru danych)
Na podstawie wyników mini-ankiety utwórz bazę danych zawierającą następujące zmienne:
1. płeć (1-kobieta; 2-mężczyzna)
2. czas dojazdu na SGH (w min)
3. ocena ze statystyki
Wykonaj listowanie zmiennych (statystyki opisowe->częstości). Dla której zmiennej można
liczyć statystyki opisowe?
Ćw. 2 (łączenie zbiorów)
a) Zapisz na dysku plik badanie.sav umieszczony na stronie e-sgh i otwórz go za pomocą programu
SPSS.
b) W pliku badanie1.sav znajduje się kolejnych 34 rekordów. Dołącz te obserwacje do bazy danych.
c) Zapisz całość na swoim koncie jako plik Badanie_T.sav.
Ćw. 3 (wybór danych, sortowanie, agrgowanie.)
1. Zmodyfikuj plik tak, aby pod uwagę były brane tylko przypadki osób urodzonych w roku 1981 lub
1982 – dane->wybierz obserwacje .
2. Podziel plik tak, aby w dalszych analizach roczniki 1981 i 1982 były rozpatrywane osobno. - dane>podziel na podzbiory
3. Posortuj plik rosnąco wg średniej ocen w ostatnim semestrze (zmienna e4).- dane->sortuj oberwacje
4. Utwórz zmienną zagregowaną „srednia ocen wg a) roku studiów b) płci dane->agreguj (Mean (Nzm)
Ćw. 4 (przekodowanie zmiennych)
Zmienna „Wielkość miejsca zamieszkania” posiada 10 kategorii wartości. Dokonaj agregacji
kategorii i utwórz nową zmienną a10_kod z 3 kategoriami (poniżej 20 tys., 20-100 tys., 100 tys. i
więcej); przekształcenia->przekodowanie->nowa zmienna->
Ćw. 5 (obliczanie podstawowych charakterystyk opisowych)
a) Na podstawie zbioru danych „Badanie_T.sav” oblicz średnią i medianę dla średniej ocen w ostatnim
semestrze studiów (e4). Podaj słowne interpretacje wyników.
b) Jaką ocenę miało 20% najlepszych studentów w tym badaniu?
c) Która grupa (studentki czy studenci) jest bardzie zróżnicowana ze względu na oceny?
d) Oceń asymetrię rozkładów ocen w obydwu grupach. Wykorzystaj miary liczbowe i wykres box-plot.
Wskaż wartości nietypowe (skrajne i odstające).
e) przekoduj zmienną ciągła e4 na zmienna skategoryzowana (5 kategorii)
Ćw. 6 (podstawowe wykresy w analizie struktury)
a) Zaproponuj i wykonaj wykresy liczebności oraz częstości dla zmiennych: ‘praca poza
studiami’, ‘jestem zadowolony ze swojego ciała’
Wykonaj zestawienia z pkt a) dla każdej z płci
b) Wykonaj histogram dla zmiennej e4 (srednia ocen):
- podstawa słupków o rozpiętości 0,5; podaj wartości liczebności w każdym z przedziałów
- narysuj krzywą normalną; - zmień kolorystykę
- wpisz tytuł wykresu np. studenci AE Wrocław według średniej ocen
c) Wykonaj wykres ‘piramidy wieku’ dla zmiennej ‘wzrost’ (waga) wg płci .
Ćw.7 (analizy opisowe dla zmiennej e28_wiek )
a) Wyznacz charakterystyki opisowe dla zmiennych ‘Wiek, w którym respondent. upił się po raz
pierwszy’(e28_wiek) (Przed analizą zapoznaj się z występującymi wartościami zmiennej w zbiorze i
dokonaj odpowiedniej selekcji danych)
b) Dokonaj analiz dla zmiennych z punktu a) odrębnie dla studentów i studentek. Skomentuj uzyskane
wartości średnich i mediany.
c) Wykonaj wykres skrzynkowy dla zmiennej „Wiek, w którym respondent. upił się po raz pierwszy”.
Oceń na jego podstawie rozkład obserwacji typowych i odstających.
e) Powtórz cw 3c) dla każdej z płci
f) Wykonaj wykres liczebności skumulowanych ( % skumulow.)
g) Przeliczanie zamiennych zawierających daty.
Cw. 8 (tabele kontyngencji i ocena zależności)
Dokonaj analizy zależności:
a) pomiędzy znaczeniem religii (c1) a oceną ważności małżeństwa (n50). – tablice
kontyngencji oraz test chi-kwadrat
b) dokonaj analizy jak w 1a) dodatkowo według płci respondentów; wykonaj wykres
słupkowy
c) Wykonaj analizę zależności dla innych grup zmiennych.
Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróżnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych
e) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
Ćw.2 (ocena zależności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 3 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zależności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, że jest to zależność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest założenie, że związek ten może być słabszy dla nieruchomości o bardzo
dużych powierzchniach oraz starszych
Cw. 4 (analizy regresji i korelacji w SPSS)
Dr hab. prof. SGH Wiktoria Wróblewska
Analiza danych z SPSS i Excel
http://www.e-sgh.pl/wroblewska/237870-0641
Zajęcia SMN
Ćw. 1 (tworzenie zbioru danych)
Na podstawie wyników mini-ankiety utwórz bazę danych zawierającą następujące zmienne:
1. płeć (1-kobieta; 2-mężczyzna)
2. czas dojazdu na SGH (w min)
3. ocena ze statystyki
Wykonaj listowanie zmiennych (statystyki opisowe->częstości). Dla której zmiennej można
liczyć statystyki opisowe?
Ćw. 2 (łączenie zbiorów)
a) Zapisz na dysku plik badanie.sav umieszczony na stronie e-sgh i otwórz go za pomocą programu
SPSS.
b) W pliku badanie1.sav znajduje się kolejnych 34 rekordów. Dołącz te obserwacje do bazy danych.
c) Zapisz całość na swoim koncie jako plik Badanie_T.sav.
Ćw. 3 (wybór danych, sortowanie, agrgowanie.)
1. Zmodyfikuj plik tak, aby pod uwagę były brane tylko przypadki osób urodzonych w roku 1981 lub
1982 – dane->wybierz obserwacje .
2. Podziel plik tak, aby w dalszych analizach roczniki 1981 i 1982 były rozpatrywane osobno. - dane>podziel na podzbiory
3. Posortuj plik rosnąco wg średniej ocen w ostatnim semestrze (zmienna e4).- dane->sortuj oberwacje
4. Utwórz zmienną zagregowaną „srednia ocen wg a) roku studiów b) płci dane->agreguj (Mean (Nzm)
Ćw. 4 (przekodowanie zmiennych)
Zmienna „Wielkość miejsca zamieszkania” posiada 10 kategorii wartości. Dokonaj agregacji
kategorii i utwórz nową zmienną a10_kod z 3 kategoriami (poniżej 20 tys., 20-100 tys., 100 tys. i
więcej); przekształcenia->przekodowanie->nowa zmienna->
Ćw. 5 (obliczanie podstawowych charakterystyk opisowych)
a) Na podstawie zbioru danych „Badanie_T.sav” oblicz średnią i medianę dla średniej ocen w ostatnim
semestrze studiów (e4). Podaj słowne interpretacje wyników.
b) Jaką ocenę miało 20% najlepszych studentów w tym badaniu?
c) Która grupa (studentki czy studenci) jest bardzie zróżnicowana ze względu na oceny?
d) Oceń asymetrię rozkładów ocen w obydwu grupach. Wykorzystaj miary liczbowe i wykres box-plot.
Wskaż wartości nietypowe (skrajne i odstające).
e) przekoduj zmienną ciągła e4 na zmienna skategoryzowana (5 kategorii)
Ćw. 6 (podstawowe wykresy w analizie struktury)
a) Zaproponuj i wykonaj wykresy liczebności oraz częstości dla zmiennych: ‘praca poza
studiami’, ‘jestem zadowolony ze swojego ciała’
Wykonaj zestawienia z pkt a) dla każdej z płci
b) Wykonaj histogram dla zmiennej e4 (srednia ocen):
- podstawa słupków o rozpiętości 0,5; podaj wartości liczebności w każdym z przedziałów
- narysuj krzywą normalną; - zmień kolorystykę
- wpisz tytuł wykresu np. studenci AE Wrocław według średniej ocen
c) Wykonaj wykres ‘piramidy wieku’ dla zmiennej ‘wzrost’ (waga) wg płci .
Ćw.7 (analizy opisowe dla zmiennej e28_wiek )
a) Wyznacz charakterystyki opisowe dla zmiennych ‘Wiek, w którym respondent. upił się po raz
pierwszy’(e28_wiek) (Przed analizą zapoznaj się z występującymi wartościami zmiennej w zbiorze i
dokonaj odpowiedniej selekcji danych)
b) Dokonaj analiz dla zmiennych z punktu a) odrębnie dla studentów i studentek. Skomentuj uzyskane
wartości średnich i mediany.
c) Wykonaj wykres skrzynkowy dla zmiennej „Wiek, w którym respondent. upił się po raz pierwszy”.
Oceń na jego podstawie rozkład obserwacji typowych i odstających.
e) Powtórz cw 3c) dla każdej z płci
f) Wykonaj wykres liczebności skumulowanych ( % skumulow.)
g) Przeliczanie zamiennych zawierających daty.
Cw. 8 (tabele kontyngencji i ocena zależności)
Dokonaj analizy zależności:
a) pomiędzy znaczeniem religii (c1) a oceną ważności małżeństwa (n50). – tablice
kontyngencji oraz test chi-kwadrat
b) dokonaj analizy jak w 1a) dodatkowo według płci respondentów; wykonaj wykres
słupkowy
c) Wykonaj analizę zależności dla innych grup zmiennych.
Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróżnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych
e) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
Ćw.2 (ocena zależności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 3 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zależności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, że jest to zależność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest założenie, że związek ten może być słabszy dla nieruchomości o bardzo
dużych powierzchniach oraz starszych
Cw. 4 (analizy regresji i korelacji w SPSS)
Dr hab. prof. SGH Wiktoria Wróblewska
Analiza danych z SPSS i Excel
http://www.e-sgh.pl/wroblewska/237870-0641
Zajęcia SMN
Ćw. 1 (tworzenie zbioru danych)
Na podstawie wyników mini-ankiety utwórz bazę danych zawierającą następujące zmienne:
1. płeć (1-kobieta; 2-mężczyzna)
2. czas dojazdu na SGH (w min)
3. ocena ze statystyki
Wykonaj listowanie zmiennych (statystyki opisowe->częstości). Dla której zmiennej można
liczyć statystyki opisowe?
Ćw. 2 (łączenie zbiorów)
a) Zapisz na dysku plik badanie.sav umieszczony na stronie e-sgh i otwórz go za pomocą programu
SPSS.
b) W pliku badanie1.sav znajduje się kolejnych 34 rekordów. Dołącz te obserwacje do bazy danych.
c) Zapisz całość na swoim koncie jako plik Badanie_T.sav.
Ćw. 3 (wybór danych, sortowanie, agrgowanie.)
1. Zmodyfikuj plik tak, aby pod uwagę były brane tylko przypadki osób urodzonych w roku 1981 lub
1982 – dane->wybierz obserwacje .
2. Podziel plik tak, aby w dalszych analizach roczniki 1981 i 1982 były rozpatrywane osobno. - dane>podziel na podzbiory
3. Posortuj plik rosnąco wg średniej ocen w ostatnim semestrze (zmienna e4).- dane->sortuj oberwacje
4. Utwórz zmienną zagregowaną „srednia ocen wg a) roku studiów b) płci dane->agreguj (Mean (Nzm)
Ćw. 4 (przekodowanie zmiennych)
Zmienna „Wielkość miejsca zamieszkania” posiada 10 kategorii wartości. Dokonaj agregacji
kategorii i utwórz nową zmienną a10_kod z 3 kategoriami (poniżej 20 tys., 20-100 tys., 100 tys. i
więcej); przekształcenia->przekodowanie->nowa zmienna->
Ćw. 5 (obliczanie podstawowych charakterystyk opisowych)
a) Na podstawie zbioru danych „Badanie_T.sav” oblicz średnią i medianę dla średniej ocen w ostatnim
semestrze studiów (e4). Podaj słowne interpretacje wyników.
b) Jaką ocenę miało 20% najlepszych studentów w tym badaniu?
c) Która grupa (studentki czy studenci) jest bardzie zróżnicowana ze względu na oceny?
d) Oceń asymetrię rozkładów ocen w obydwu grupach. Wykorzystaj miary liczbowe i wykres box-plot.
Wskaż wartości nietypowe (skrajne i odstające).
e) przekoduj zmienną ciągła e4 na zmienna skategoryzowana (5 kategorii)
Ćw. 6 (podstawowe wykresy w analizie struktury)
a) Zaproponuj i wykonaj wykresy liczebności oraz częstości dla zmiennych: ‘praca poza
studiami’, ‘jestem zadowolony ze swojego ciała’
Wykonaj zestawienia z pkt a) dla każdej z płci
b) Wykonaj histogram dla zmiennej e4 (srednia ocen):
- podstawa słupków o rozpiętości 0,5; podaj wartości liczebności w każdym z przedziałów
- narysuj krzywą normalną; - zmień kolorystykę
- wpisz tytuł wykresu np. studenci AE Wrocław według średniej ocen
c) Wykonaj wykres ‘piramidy wieku’ dla zmiennej ‘wzrost’ (waga) wg płci .
Ćw.7 (analizy opisowe dla zmiennej e28_wiek )
a) Wyznacz charakterystyki opisowe dla zmiennych ‘Wiek, w którym respondent. upił się po raz
pierwszy’(e28_wiek) (Przed analizą zapoznaj się z występującymi wartościami zmiennej w zbiorze i
dokonaj odpowiedniej selekcji danych)
b) Dokonaj analiz dla zmiennych z punktu a) odrębnie dla studentów i studentek. Skomentuj uzyskane
wartości średnich i mediany.
c) Wykonaj wykres skrzynkowy dla zmiennej „Wiek, w którym respondent. upił się po raz pierwszy”.
Oceń na jego podstawie rozkład obserwacji typowych i odstających.
e) Powtórz cw 3c) dla każdej z płci
f) Wykonaj wykres liczebności skumulowanych ( % skumulow.)
g) Przeliczanie zamiennych zawierających daty.
Cw. 8 (tabele kontyngencji i ocena zależności)
Dokonaj analizy zależności:
a) pomiędzy znaczeniem religii (c1) a oceną ważności małżeństwa (n50). – tablice
kontyngencji oraz test chi-kwadrat
b) dokonaj analizy jak w 1a) dodatkowo według płci respondentów; wykonaj wykres
słupkowy
c) Wykonaj analizę zależności dla innych grup zmiennych.
Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróżnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych
e) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
Ćw.2 (ocena zależności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 3 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zależności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, że jest to zależność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest założenie, że związek ten może być słabszy dla nieruchomości o bardzo
dużych powierzchniach oraz starszych
Cw. 4 (analizy regresji i korelacji w SPSS)
Dr hab. prof. SGH Wiktoria Wróblewska
Analiza danych z SPSS i Excel
http://www.e-sgh.pl/wroblewska/237870-0641
Zajęcia SMN
Ćw. 1 (tworzenie zbioru danych)
Na podstawie wyników mini-ankiety utwórz bazę danych zawierającą następujące zmienne:
1. płeć (1-kobieta; 2-mężczyzna)
2. czas dojazdu na SGH (w min)
3. ocena ze statystyki
Wykonaj listowanie zmiennych (statystyki opisowe->częstości). Dla której zmiennej można
liczyć statystyki opisowe?
Ćw. 2 (łączenie zbiorów)
a) Zapisz na dysku plik badanie.sav umieszczony na stronie e-sgh i otwórz go za pomocą programu
SPSS.
b) W pliku badanie1.sav znajduje się kolejnych 34 rekordów. Dołącz te obserwacje do bazy danych.
c) Zapisz całość na swoim koncie jako plik Badanie_T.sav.
Ćw. 3 (wybór danych, sortowanie, agrgowanie.)
1. Zmodyfikuj plik tak, aby pod uwagę były brane tylko przypadki osób urodzonych w roku 1981 lub
1982 – dane->wybierz obserwacje .
2. Podziel plik tak, aby w dalszych analizach roczniki 1981 i 1982 były rozpatrywane osobno. - dane>podziel na podzbiory
3. Posortuj plik rosnąco wg średniej ocen w ostatnim semestrze (zmienna e4).- dane->sortuj oberwacje
4. Utwórz zmienną zagregowaną „srednia ocen wg a) roku studiów b) płci dane->agreguj (Mean (Nzm)
Ćw. 4 (przekodowanie zmiennych)
Zmienna „Wielkość miejsca zamieszkania” posiada 10 kategorii wartości. Dokonaj agregacji
kategorii i utwórz nową zmienną a10_kod z 3 kategoriami (poniżej 20 tys., 20-100 tys., 100 tys. i
więcej); przekształcenia->przekodowanie->nowa zmienna->
Ćw. 5 (obliczanie podstawowych charakterystyk opisowych)
a) Na podstawie zbioru danych „Badanie_T.sav” oblicz średnią i medianę dla średniej ocen w ostatnim
semestrze studiów (e4). Podaj słowne interpretacje wyników.
b) Jaką ocenę miało 20% najlepszych studentów w tym badaniu?
c) Która grupa (studentki czy studenci) jest bardzie zróżnicowana ze względu na oceny?
d) Oceń asymetrię rozkładów ocen w obydwu grupach. Wykorzystaj miary liczbowe i wykres box-plot.
Wskaż wartości nietypowe (skrajne i odstające).
e) przekoduj zmienną ciągła e4 na zmienna skategoryzowana (5 kategorii)
Ćw. 6 (podstawowe wykresy w analizie struktury)
a) Zaproponuj i wykonaj wykresy liczebności oraz częstości dla zmiennych: ‘praca poza
studiami’, ‘jestem zadowolony ze swojego ciała’
Wykonaj zestawienia z pkt a) dla każdej z płci
b) Wykonaj histogram dla zmiennej e4 (srednia ocen):
- podstawa słupków o rozpiętości 0,5; podaj wartości liczebności w każdym z przedziałów
- narysuj krzywą normalną; - zmień kolorystykę
- wpisz tytuł wykresu np. studenci AE Wrocław według średniej ocen
c) Wykonaj wykres ‘piramidy wieku’ dla zmiennej ‘wzrost’ (waga) wg płci .
Ćw.7 (analizy opisowe dla zmiennej e28_wiek )
a) Wyznacz charakterystyki opisowe dla zmiennych ‘Wiek, w którym respondent. upił się po raz
pierwszy’(e28_wiek) (Przed analizą zapoznaj się z występującymi wartościami zmiennej w zbiorze i
dokonaj odpowiedniej selekcji danych)
b) Dokonaj analiz dla zmiennych z punktu a) odrębnie dla studentów i studentek. Skomentuj uzyskane
wartości średnich i mediany.
c) Wykonaj wykres skrzynkowy dla zmiennej „Wiek, w którym respondent. upił się po raz pierwszy”.
Oceń na jego podstawie rozkład obserwacji typowych i odstających.
e) Powtórz cw 3c) dla każdej z płci
f) Wykonaj wykres liczebności skumulowanych ( % skumulow.)
g) Przeliczanie zamiennych zawierających daty.
Cw. 8 (tabele kontyngencji i ocena zależności)
Dokonaj analizy zależności:
a) pomiędzy znaczeniem religii (c1) a oceną ważności małżeństwa (n50). – tablice
kontyngencji oraz test chi-kwadrat
b) dokonaj analizy jak w 1a) dodatkowo według płci respondentów; wykonaj wykres
słupkowy
c) Wykonaj analizę zależności dla innych grup zmiennych.
Podstawowe analizy statystyczne w arkuszu kalkulacyjnym Excel
Ćw. 1 (średnia i inne charakterystyki rozkładu cechy)
Otwórz plik danych „Robin_data”. Zapoznaj się ze strukturą zmiennych i danymi.
a) Wyznacz miary opisowe i dokonaj oceny struktury rozkładu dla wybranych zmiennych
(wykorzystać: Analiza danych -> Statystyki opisowe)
b) Ze względu na którą zmienną analizowane nieruchomości były najbardziej zróżnicowane?
c) Oceń asymetrię rozkładu ceny, powierzchni i wieku. Wykorzystaj miary liczbowe.
d) Określ występowanie danych odstających (nietypowych) na podstawie wartości
standaryzowanych
e) Wykonaj histogram dla zmiennych: cena, powierzchnia i wiek
Ćw.2 (ocena zależności)
Dokonaj oceny relacji między zmiennymi na podstawie:
a) współczynnika korelacji Pearsona (r)
b) wykresów punktowych (scatterplot)
Ćw. 3 (analiza regresji)
a) Dokonaj weryfikacja oczekiwanych relacji w zakresie zależności z wykorzystaniem analizy
regresji. Sformułuj słownie i zapisz oczekiwane relacje dla ceny mieszkań oraz wybranych
zmiennych objaśniających, np. powierzchnia (area).
b) Sprawdź, czy słusznie zakłada się, że jest to zależność liniowa? Oceń dokładność
oszacowanych modeli.
c) Czy słuszne jest założenie, że związek ten może być słabszy dla nieruchomości o bardzo
dużych powierzchniach oraz starszych
Cw. 4 (analizy regresji i korelacji w SPSS)

Podobne dokumenty