tutaj

Transkrypt

tutaj
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
STATYSTYKA OPISOWA
1. CZĘSTOŚCI
Częstości to inaczej rozkład wartości zmiennej – pokazuje nam jak układały się odpowiedzi w wybranej
grupie respondentów. Ponieważ analizujemy tylko jedną zmienną, to nie wiemy nic o ewentualnych
zależnościach rozkładu od innych zmiennych.
Przykład:
Rozkład częstości zmiennej ls12e „Polski rząd powinien wydawać więcej pieniędzy na sport”
ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI
 z lewego panelu do prawego przenieść wybraną zmienną i „OK.”
FREQUENCIES VARIABLES=ls12e
/ORDER=ANALYSIS.
W ten sposób otrzymamy tabelę częstości, w której kolejne wiersze ułożone są wg kodu zmiennych
(wartości rosnące) – jest to opcja domyślna.
Ten sposób uporządkowania wartości zmiennych można w razie potrzeby (bo np. tabelka ma być
czytelniejsza) zmienić za pomocą opcji „CZĘSTOŚCI: FORMAT” na
 Wartości rosnące
FREQUENCIES VARIABLES=ls12e
/ORDER=ANALYSIS.
 Wartości malejące
FREQUENCIES VARIABLES=ls12e
/FORMAT=DVALUE
/ORDER=ANALYSIS.
 Liczebności rosnące
FREQUENCIES VARIABLES=ls12e
/FORMAT=AFREQ
/ORDER=ANALYSIS.
1
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
 Liczebności malejące
FREQUENCIES VARIABLES=ls12e
/FORMAT=DFREQ
/ORDER=ANALYSIS.
Wygenerowana przykładowa tabela wygląda tak:
 Najpierw podstawowe informacje o analizowanym zbiorze odpowiedzi: ile zostało uznane za ważne,
a ile było określone jako braki danych
Statystyki
Polski rząd powinien wydawać więcej
pieniędzy na sport
Ważne
1292
N
Braki danych
16205
 Następnie sama tabela częstości
Polski rząd powinien wydawać więcej pieniędzy na sport
Częstość
Procent
Procent
Procent
ważnych
skumulowany
Zdecydowanie się zgadzam
302
1,7
23,3
23,3
Zgadzam się
451
2,6
34,9
58,2
Ani się zgadzam ani nie
261
1,5
20,2
78,4
118
,7
9,1
87,6
30
,2
2,3
89,9
131
,7
10,1
100,0
1292
7,4
100,0
1
,0
ND:PYT NIE ZADANE
16204
92,6
Ogółem
16205
92,6
17497
100,0
zgadzam
Ważne
Nie zgadzam się
Zdecydowanie się nie
zgadzam
TRUDNO POWIEDZIEĆ
Ogółem
BRAK DANYCH
Braki danych
Ogółem
WAŻNE:
 to, co wyżej jest tabelą surową;
 wklejana do docelowego tekstu raportu tabela surowa powinna być pozbawiona kolumn „procent” i
„procent skumulowany” oraz wierszy „brak danych”, „Nd:pyt nie zadane” oraz dwóch ostatnich
„ogółem”. Zostaje cała reszta (tu: zaznaczona na szaro).
 I tylko tę część interpretujemy, najczęściej wskazując na najmniej i najbardziej liczne kategorie
odpowiedzi. Nie trzeba opisywać wszystkich odsetek – tylko te, które są istotne dla naszych analiz.
2
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
 W tym przykładzie odpowiedź „trudno powiedzieć” jest uwzględniona w odpowiedziach ważnych.
Robi się tak wówczas, gdy z punktu widzenia naszych analiz jest to istotna informacja: ile osób nie
potrafiło/nie chciało odpowiedzieć na pytanie. Może to być wskaźnik:
o Brak wiedzy -> rzecz jest mało znana
o Niechęci do udzielania odpowiedzi -> bo rzecz jest wstydliwa, niepoprawna politycznie, tabu
etc.
o Dziwnego pytania -> respondenci nie rozumieją i „uciekają” w „trudno powiedzieć”
Obliczenie częstości może przydać się w jeszcze jednym wypadku – gdy chcemy sprawdzić, czy dana
zmienna może być zmienną niezależną i zależną. Oczywiście nie chodzi tu o jej przydatność merytoryczną,
ale analityczną. Dobra analitycznie zmienna
 niezależna to taka, która dzieli nam badanych na kilka grup, ale w miarę równych liczebnie -> w
wielu procedurach analitycznych równoliczność grup jest jednym z warunków wstępnych ich
wykonania.
 zależna to taka, która rzeczywiście różnicuje badanych -> jeśli większość z nich „wpada” do jednej
kategorii to nie będzie zróżnicowania opinii.
Taką właśnie sytuację można zaobserwować poniżej.
Zmienna re22 „W jakim wyznaniu/religii resp był wychowany”
i jej rozkład dla roku 2010:
W jakim wyznaniu/religii resp był wychowany
Częstość
W religii katolickiej
Ważne
Procent
ważnych
skumulowany
97,9
98,2
98,2
Protestanckiej
2
,1
,1
98,4
Prawosławnej
6
,5
,5
98,9
Świadków Jehowy
3
,2
,2
99,1
10
,8
,8
99,9
1
,1
,1
100,0
1258
99,6
100,0
5
,4
1263
100,0
Nie wiem
Ogółem
Ogółem
Procent
1236
W żadnym wyznaniu
Braki danych
Procent
BRAK DANYCH
Zdecydowana większość respondentów (98%) deklarowała wychowanie w religii katolickiej. Taka zmienna
nie nadaje się ani na niezależną, ani na zależną.
3
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
2. TABELE KRZYŻOWE
Tabele krzyżowe to podstawowy sposób prezentacji rozkładów zmiennych względem siebie. Krzyżować
możemy dwie zmienne lub więcej – jednak każda kolejna zmienna powyżej drugiej będzie wprowadzała do
tabeli nową warstwę i tym samym, niestety, zamazywała rozkład odpowiedzi i utrudniała interpretację.
Przykład:
Tabela krzyżowa zmiennych:
 q41a1 „Stan cywilny #2 (od 2002r.)”
 q49a „Liczba wszystkich dzieci respondenta” -> rekodowanie, gdzie liczba dzieci „4 i więcej” trafiła
do jednego przedziału
 dodatkowo zastosowany został filtr i dane są tylko dla roku 2010
ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE
Syntax
CROSSTABS
/TABLES=q41a1 BY q49a_rek
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
 Przy tworzeniu tabel warto trzymać się niepisanej zasady, że zmienna niezależna jest umieszczona w
wierszach, a zależna – w kolumnach (w syntax: niezależna BY zależna)
 Program tworząc tabele pomija tych respondentów, którzy przynajmniej w jednej zmiennej mają
odpowiedź uznaną za brak danych.
W ten sposób otrzymujemy zwykłą tabelę z rozkładem liczebności:
4
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały
Liczebność
liczba dzieci - przedziały
nie ma dzieci
Kawaler/panna
1 dziecko
2 dzieci
Ogółem
4 dzieci i więcej
3 dzieci
336
19
1
4
0
360
Konkubinat
22
14
16
3
2
57
Żonaty/zamężna
63
161
255
101
36
616
#2 (od 2002r.) Rozwiedziony(a)
14
30
27
8
3
82
1
7
5
2
1
16
12
30
47
20
11
120
448
261
351
138
53
1251
Stan cywilny
Separacja
Wdowiec/wdowa
Ogółem
Taka tabela jest mało użyteczna analitycznie, bo poszczególne liczebności trudno interpretować bez kontekstu. Np.
 Kawalerów/panien z jednym dzieckiem jest 19, a osób z jednym potomstwem i żyjących w konkubinacie – 14. Czy ta różnica jest ważna? Czy jest duża
albo mała?
 Osób, które mają jedno dziecko i są albo po rozwodzie, albo w stanie wdowieństwa jest po tyle samo: 30. Czy ta „30-stka” w obu kategoriach znaczy to
samo?
By uniknąć takich wątpliwości tabele krzyżowe tworzy się i interpretuje z uwzględnieniem odsetek.
ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W WIERSZU
Syntax:
CROSSTABS
/TABLES=q41a1 BY q49a_rek
/FORMAT=AVALUE TABLES
/CELLS=COUNT ROW
/COUNT ROUND CELL.
5
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały
liczba dzieci - przedziały
nie ma dzieci
Kawaler/panna
Konkubinat
Żonaty/zamężna
Stan cywilny
#2 (od 2002r.)
Rozwiedziony(a)
Separacja
Wdowiec/wdowa
Ogółem
Liczebność
% z Stan cywilny #2 (od 2002r.)
1
4
0
360
93,3%
5,3%
0,3%
1,1%
0,0%
100,0%
22
14
16
3
2
57
38,6%
24,6%
28,1%
5,3%
3,5%
100,0%
63
161
255
101
36
616
10,2%
26,1%
41,4%
16,4%
5,8%
100,0%
14
30
27
8
3
82
17,1%
36,6%
32,9%
9,8%
3,7%
100,0%
1
7
5
2
1
16
6,3%
43,8%
31,3%
12,5%
6,3%
100,0%
12
30
47
20
11
120
10,0%
25,0%
39,2%
16,7%
9,2%
100,0%
448
261
351
138
53
1251
35,8%
20,9%
28,1%
11,0%
4,2%
100,0%
Liczebność
% z Stan cywilny #2 (od 2002r.)
Liczebność
% z Stan cywilny #2 (od 2002r.)
Liczebność
% z Stan cywilny #2 (od 2002r.)
Liczebność
% z Stan cywilny #2 (od 2002r.)
4 dzieci i więcej
3 dzieci
19
Liczebność
% z Stan cywilny #2 (od 2002r.)
2 dzieci
336
Liczebność
% z Stan cywilny #2 (od 2002r.)
1 dziecko
Ogółem
Przy procentowaniu wierszami, 100% odnosi się do zmiennej niezależnej.
Czytamy zgodnie z zasadą [wiersz] [->] [kolumna], np.:
 Wśród kawalerów/panien 5,3% respondentów deklarowało posiadanie jednego dziecka. Z kolei wśród osób żyjących w konkubinacie prawie 20
punktów procentowych więcej: 24,6%.
Procentować można także podług zmiennej zależnej – wtedy 100% znajdzie się w kolumnach.
ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W KOLUMNIE
6
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Syntax:
CROSSTABS
/TABLES=q41a1 BY q49a_rek
/FORMAT=AVALUE TABLES
/CELLS=COUNT COLUMN
/COUNT ROUND CELL.
Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały
liczba dzieci - przedziały
nie ma dzieci
Kawaler/panna
Konkubinat
Żonaty/zamężna
Stan cywilny
#2 (od 2002r.)
Rozwiedziony(a)
Separacja
Wdowiec/wdowa
Ogółem
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
Liczebność
% z liczba dzieci - przedziały
1 dziecko
2 dzieci
Ogółem
4 dzieci i więcej
3 dzieci
336
19
1
4
0
360
75,0%
7,3%
0,3%
2,9%
0,0%
28,8%
22
14
16
3
2
57
4,9%
5,4%
4,6%
2,2%
3,8%
4,6%
63
161
255
101
36
616
14,1%
61,7%
72,6%
73,2%
67,9%
49,2%
14
30
27
8
3
82
3,1%
11,5%
7,7%
5,8%
5,7%
6,6%
1
7
5
2
1
16
0,2%
2,7%
1,4%
1,4%
1,9%
1,3%
12
30
47
20
11
120
2,7%
11,5%
13,4%
14,5%
20,8%
9,6%
448
261
351
138
53
1251
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
Czytamy zgodnie z zasadą [kolumna] [->] [wiersz], np.:

Wśród osób posiadających jedno dziecko 7,3% stanowili kawalerowie/panny, a 5,4% - osoby żyjące w konkubinacie.
7
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Ostatnia możliwość to procentowanie dla całości analizowanych danych
ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> PROCENT CAŁOŚCI
Syntax:
CROSSTABS
/TABLES=q41a1 BY q49a_rek
/FORMAT=AVALUE TABLES
/CELLS=COUNT TOTAL
/COUNT ROUND CELL.
Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały
liczba dzieci - przedziały
nie ma dzieci
Kawaler/panna
Konkubinat
Żonaty/zamężna
Stan cywilny
#2 (od 2002r.)
Rozwiedziony(a)
Separacja
Wdowiec/wdowa
Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
Liczebność
% z Ogółem
1 dziecko
2 dzieci
Ogółem
4 dzieci i więcej
3 dzieci
336
19
1
4
0
360
26,9%
1,5%
0,1%
0,3%
0,0%
28,8%
22
14
16
3
2
57
1,8%
1,1%
1,3%
0,2%
0,2%
4,6%
63
161
255
101
36
616
5,0%
12,9%
20,4%
8,1%
2,9%
49,2%
14
30
27
8
3
82
1,1%
2,4%
2,2%
0,6%
0,2%
6,6%
1
7
5
2
1
16
0,1%
0,6%
0,4%
0,2%
0,1%
1,3%
12
30
47
20
11
120
1,0%
2,4%
3,8%
1,6%
0,9%
9,6%
448
261
351
138
53
1251
35,8%
20,9%
28,1%
11,0%
4,2%
100,0%
8
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
W tym momencie 100% odnosi się do wszystkich branych pod uwagę respondentów.
Czytamy zgodnie z zasadą [wiersz] [i] [kolumna], np.:
 Osoby, które deklarowały bycie kawalerem/panną oraz posiadanie jednego dziecka wśród
wszystkich respondentów stanowią 1,5%. Z kolei osoby żyjące w konkubinacie i także posiadające
jedno dziecko to 1,1%.
3. WYKRESY
SPSS ma dość rozbudowany edytor wykresów i nie chcę omawiać go w całości – kto ciekawy, może
pobawić się sam. W tym miejscu chciałabym wskazać tylko na jedno ciekawe zastosowanie wykresu:
wizualną ocenę dopasowania rozkładu zmiennej do rozkładu normalnego.
Na przykładzie zmiennej q9age „Wiek”
ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> WYKRESY -> TYP WYKRESÓW ->
HISTOGRAMY -> POKAŻ KRZYWĄ NORMALNĄ NA HISTOGRAMIE
Syntax:
FREQUENCIES VARIABLES=q9age
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Otrzymujemy wykres, który pokazuje jak bardzo rozkład analizowanej zmiennej przypomina rozkład
normalny lub od niego odstaje:
9
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
4. STATYSTYKI OPISOWE
Parametry opisowe zbiorowości statystycznej:
1. Miary tendencji centralnej – służą do określania tej wartości zmiennej opisanej przez rozkład, wokół
której skupiają się wszystkie pozostałe wartości zmiennej;
a) średnie klasyczne
 średnia arytmetyczna
 średnia geometryczna
 średnia harmoniczna
b) średnie pozycyjne
 mediana
 dominanta (modalna)
 kwantyle (kwartyle, decyle, percentyle)
2. Miary dyspersji – służą do badania stopnia zróżnicowania wartości zmiennej;
a) rozstęp
b) odchylenie międzykwartylowe (odchylenie ćwiartkowe)
c) odchylenie standardowe
d) wariancje
e) odchylenie przeciętne
f) współczynniki zmienności
3. Miary asymetrii – służą do badania kierunku zróżnicowania wartości zmiennej;
a) kurtoza
b) skośność (współczynnik asymetrii)
4. Miary koncentracji – służą do badania stopnia nierównomierności rozkładu ogólnej sumy wartości
zmiennej
pomiędzy poszczególne jednostki
zbiorowości lub
analizy stopnia skupienia
poszczególnych jednostek wokół średniej;
a) współczynniki koncentracji
SPSS pozwala nam na wykonanie statystyk opisowych w różnych miejscach, a dwa podstawowe to:
a) ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI
Dostępne są:
 Średnia, mediana, dominanta, suma
 Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej
 Kwartyle, percentyle
 Kurtoza, skośność
10
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
b) ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE
Dostępne są:
 Średnia, suma
 Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej
 Kurtoza, skośność
WAŻNE: to od analityka zależy poprawność obliczeń! SPSS nie zaprotestuje, jeśli dla zmiennej np.
nominalnej zapragniemy wyliczyć średnią.
Miary opisu statystycznego a poszczególne skale pomiarowe:
Nominalna Porządkowa Interwałowa
Procenty / odsetki / stosunki
Ilorazowa
TAK
TAK
TAK
TAK


TAK
TAK
TAK
TAK
TAK
TAK
Mediana

TAK
TAK
TAK
Kwartyle

TAK
TAK
TAK
Rozstęp


TAK
TAK
Odchylenie przeciętne


TAK
TAK
Wariancja


TAK
TAK
Odchylenie standardowe


TAK
TAK
Odchylenie kwartylowe

(TAK) *
TAK
TAK
Współczynnik zmienności


TAK
TAK
Kurtoza


TAK
TAK
Skośność


TAK
TAK
Średnia arytmetyczna
Dominanta
* przy założeniu pewnej interwałowości, np. skala ocen: 5,0 ; 4,0 ; 3,0 itd.
11
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Przykład:
Statystyki opisowe dla zmiennej q9age „Wiek”.
Przed analizą należy łączyć filtr: dane tylko z 2010 roku.
Wersja nr 1.
ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI
i wszystkie dostępne statystyki
Syntax:
FREQUENCIES VARIABLES=q9age
/NTILES=4
/NTILES=3
/PERCENTILES=20 40 60 80
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN
MODE SUM SKEWNESS SESKEW
KURTOSIS SEKURT
/ORDER=ANALYSIS.
Dla wyjaśnienia co jest co w syntax:
/NTILES=4 -> kwartyle
/NTILES=3 -> punkty podziału na 3 równe grupy
/PERCENTILES=20 40 60 80 -> percentyle 20-ty, 40-ty, 60-ty i 80-ty
STDDEV -> odchylenie standardowe
VARIANCE -> wariancja
RANGE -> rozstęp
MINIMUM -> minimum
MAXIMUM -> maksimum
SEMEAN -> błąd standardowy średniej
MEAN -> średnia
MEDIAN -> mediana
MODE -> dominanta
SUM -> suma
SKEWNESS -> skośność
SESKEW -> błąd standardowy skośności
KURTOSIS -> kurtoza
SEKURT -> błąd standardowy kurtozy
12
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Otrzymujemy tabelkę z danymi:
Statystyki
Wiek respondenta
Ważne
1263
N
Braki danych
Średnia
0
44,78
Błąd standardowy średniej
Mediana
,478
44,00
Dominanta
26
Odchylenie standardowe
16,996
Wariancja
288,876
Skośność
,207
Błąd standardowy skośności
,069
Kurtoza
-1,040
Błąd standardowy kurtozy
,138
Rozstęp
62
Minimum
18
Maksimum
80
Suma
56558
Percentyle
20
27,00
25
30,00
33,33333333
34,00
40
37,00
50
44,00
60
50,00
66,66666667
54,00
75
58,00
80
61,00
Dane z tabeli interpretujemy następująco:
 Statystyki opisowe zostały policzone dla całego zbioru danych: 1263 respondentów.
 Najmłodszy respondent miał 18 lat, a najstarszy 80. Rozstęp wyniósł więc 62 lata. Najwięcej osób
miało 26 lat
 Średnia wieku wyniosła blisko 45 lat (z odchyleniem standardowym 16,996 i wariancją równą
288,876).
 Połowa osób miała przynajmniej 44 lata. ¼ osób miała maksymalnie 30 lat, a ¾ osób – maksymalnie
58 lat.
 Przy podziale zbiorowości na trzy równe części, to 1/3 osób miała maksymalnie 34 lata, a 2/3 osób –
maksymalnie 54 lata.
13
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
 Przy podziale zbiorowości na pięć równych części, to 1/5 osób miała maksymalnie 27 lat; 2/5 osób –
maksymalnie 37 lat; 3/5 osób – maksymalnie 50 lat, a 4/5 osób – maksymalnie 61 lat.
 Współczynnik kurtozy jest ujemny (-1,040), skąd można wnioskować, że rozkład zmiennej jest
bardziej spłaszczony niż krzywa rozkładu normalnego i wartości zmiennej nie grupują się wokół
średniej (jest więcej wartości skrajnych).
 Współczynnik skośności jest dodatni (0,207), skąd można wnioskować, że rozkład zmiennej jest
prawostronnie asymetryczny: jest więcej niższych niż wyższych wartości zmiennej – czyli wśród
badanych jest więcej osób młodszych niż starszych.
WAŻNE: do końcowego raportu tabeli z obliczonymi statystykami opisowymi nie wklejamy – wystarczy
tylko ich opis i interpretacja.
Wersja nr 2
ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE
i wszystkie dostępne statystyki.
Syntax:
DESCRIPTIVES VARIABLES=q9age
/STATISTICS=MEAN SUM STDDEV VARIANCE RANGE MIN MAX SEMEAN KURTOSIS
SKEWNESS.
Uzyskana tabela:
Statystyki opisowe
Wiek
N Ważnych
respondenta
(wyłączanie
obserwacjami)
N
Statystyka
1263
Rozstęp
Statystyka
62
Minimum
Statystyka
18
Maksimum
Statystyka
80
Suma
Statystyka
56558
Statystyka
44,78
Średnia
Błąd standardowy
,478
Odchylenie standardowe
Statystyka
16,996
Wariancja
Statystyka
288,876
Statystyka
,207
Błąd standardowy
,069
Skośność
Statystyka
Kurtoza
Błąd standardowy
1263
-1,040
,138
Nie będę już interpretowała danych z tabeli – jest to samo co wyżej.
14
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
I jedno wyjaśnienie: tabela generowana przez SPSS wygląda inaczej niż ta wyżej – jest trójwierszowa i
bardzo długa. Jej obecny wygląd uzyskałam poprzez panel przestawiania.
W oknie raportu należy kliknąć na tabeli prawym przyciskiem myszy, a potem wybrać „edytuj zawartość”:
 Jeśli w nowym oknie: pojawi się nowe okno, a na pasku poleceń polecenie „przestaw. Najprościej
wówczas kliknąć „transponuj wiersze i kolumny” i obie rzeczy zamienią się miejscami. Lub można
uruchomić panel przestawiania, o którym niżej.
 Jeśli w oknie raportu: na aktywowanej tabeli znów należy kliknąć prawym myszy i wybrać „panel
przestawiania”. Pojawi się nowe okno ze schematem naszej tabeli – teraz dowolnie przeciągając albo
kasując jej elementy możemy wpływać na kształt tabeli.
5. PROSTE PORÓWNANIE ŚREDNICH
Gdy analizujemy kilka zmiennych ilościowych (albo takich, które można uznać za ilościowe, czyli te z
kafeterią likertowską), to najbardziej użytecznymi miarami opisu są średnia i odchylenie standardowe.
Można porównywać średnie obliczone przy pomocy poleceń zaprezentowanych wyżej. Prościej jest jednak
skorzystać z dedykowanego temu polecenia.
Przykład:
 filtr: tylko dane dla 2010
Zmienne:
 re8a Zauf do sejmu
 re8b Zauf do org przemysł i handlowych
 re8c Zauf do kościołów i org wyznaniowych
 re8d Zauf do sądów i systemu prawnego
 re8e Zauf do szkolnictwa i syst kształcenia
Przed dokonaniem obliczeń należy odpowiedź „trudno powiedzieć” zdefiniować jako brak danych
 baza -> zakładka „zmienne” -> kolumna „braki” -> wartość dyskretna: 8
 w syntax można to zrobić za pomocą polecenia:
MISSING VALUES re8a (LO THRU -1, 8)
Gdzie re8a to nazwa zmiennej
LO THRU -1 oznacza, że do tej pory braki to było wartości od najniższej do -1 (można to odczytać z
arkusza “zmienne_baza” w przygotowanym przeze mnie pliku Excel; ważne jest, by dopisać tu już
istniejące braki, bo inaczej zostaną usunięte
8 to nowo dodany brak danych
Powtórzyć dla każdej zmiennej.
15
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Gdy spojrzymy na kafeterię tych pytań, to widać, że kolejność jest nieintuicyjna:
1 - Całkowite zaufanie
2 - Duże zaufanie
3 - Umiarkowane zaufanie
4 - Bardzo małe zaufanie
5 - W ogóle nie ma zaufania
Im mniejszy kod, tym większe zaufanie. Możemy to albo odwrócić rekodując zmienną, albo po prostu o tym
pamiętać analizując dane.
ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE
 Wybrać zmienne re8a-re8e
 W opcjach zostawić domyślnie wybrane: średnia, odchylenie standardowe, minimum, maksimum
Syntax:
DESCRIPTIVES VARIABLES=re8a re8b re8c re8d re8e
/STATISTICS=MEAN STDDEV MIN MAX
 Porządek wyświetlania:
o Lista zmiennych (domyślnie, nic nie trzeba dopisywać w poleceniu syntax)
o Alfabetycznie
Syntax - do głównej linii kodu podanej powyżej należy dopisać:
/SORT=NAME (A).
o Średnie rosnące
Syntax - do głównej linii kodu podanej powyżej należy dopisać:
/SORT=MEAN (A).
o Średnie malejące
Syntax - do głównej linii kodu podanej powyżej należy dopisać:
/SORT=MEAN (D).
 Z racji tego, że u nas im niższa średnia tym wyższe zaufanie, wybieramy porządek „średnie rosnące”
Otrzymujemy poniższą tabelę:
16
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań)
Statystyki opisowe
N
Minimum
Maksimum
Średnia
Odchylenie
standardowe
Zauf do szkolnictwa i syst
1195
1
5
2,53
,736
1225
1
5
2,86
,983
1195
1
5
2,97
,941
1151
1
5
3,23
,716
Zauf do sejmu
1197
1
5
3,60
,840
N Ważnych (wyłączanie
1071
kształcenia
Zauf do kościołów i org
wyznaniowych
Zauf do sądów i systemu
prawnego
Zauf do org przemysł i
handlowych
obserwacjami)
 Do raportu wklejamy całą tabelę (wcześniej poprawiając nazwy zmiennych by nie było w nich
skrótów), a pod spodem dajemy jej opis i interpretację.
Na co można zwrócić uwagę:
 Kolejność zmiennych wg średnich: zaufanie do szkolnictwa jest największe, zaufanie do sejmu –
najmniejsze;
 Interpretacja średnich: możemy posłużyć się kafeterią z analizowanych pytań – wówczas średnia ok.
2,5 będzie oznaczała opinię pomiędzy „duże zaufanie” a „umiarkowane zaufanie”
 Odchylenia standardowe: możemy porównać odchylenia między sobą – im większe, tym większe
rozbieżności w opiniach respondentów (tu największe w przypadku kościoła), im mniejsze – tym
bardziej respondenci byli jednomyślni (tu w przypadku organizacji przemysłowych i handlowych)
 Wartości minimum i maksimum: w przypadku wszystkich analizowanych instytucji pojawiały się
zarówno odpowiedzi wskazujące na całkowite zaufanie (wartość: 1), jak na brak zaufania w ogóle
(wartość: 5)
 Liczbę osób, których odpowiedzi zostały uwzględnione: im więcej osób, tym albo było łatwiej
oceniać (bo np. respondenci wiedzą, co oceniają), albo było mniejsze ryzyko ukrywania swoich
poglądów (nie blokowała badanych poprawność polityczna lub wstyd)
17

Podobne dokumenty