tutaj
Transkrypt
tutaj
Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) STATYSTYKA OPISOWA 1. CZĘSTOŚCI Częstości to inaczej rozkład wartości zmiennej – pokazuje nam jak układały się odpowiedzi w wybranej grupie respondentów. Ponieważ analizujemy tylko jedną zmienną, to nie wiemy nic o ewentualnych zależnościach rozkładu od innych zmiennych. Przykład: Rozkład częstości zmiennej ls12e „Polski rząd powinien wydawać więcej pieniędzy na sport” ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI z lewego panelu do prawego przenieść wybraną zmienną i „OK.” FREQUENCIES VARIABLES=ls12e /ORDER=ANALYSIS. W ten sposób otrzymamy tabelę częstości, w której kolejne wiersze ułożone są wg kodu zmiennych (wartości rosnące) – jest to opcja domyślna. Ten sposób uporządkowania wartości zmiennych można w razie potrzeby (bo np. tabelka ma być czytelniejsza) zmienić za pomocą opcji „CZĘSTOŚCI: FORMAT” na Wartości rosnące FREQUENCIES VARIABLES=ls12e /ORDER=ANALYSIS. Wartości malejące FREQUENCIES VARIABLES=ls12e /FORMAT=DVALUE /ORDER=ANALYSIS. Liczebności rosnące FREQUENCIES VARIABLES=ls12e /FORMAT=AFREQ /ORDER=ANALYSIS. 1 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Liczebności malejące FREQUENCIES VARIABLES=ls12e /FORMAT=DFREQ /ORDER=ANALYSIS. Wygenerowana przykładowa tabela wygląda tak: Najpierw podstawowe informacje o analizowanym zbiorze odpowiedzi: ile zostało uznane za ważne, a ile było określone jako braki danych Statystyki Polski rząd powinien wydawać więcej pieniędzy na sport Ważne 1292 N Braki danych 16205 Następnie sama tabela częstości Polski rząd powinien wydawać więcej pieniędzy na sport Częstość Procent Procent Procent ważnych skumulowany Zdecydowanie się zgadzam 302 1,7 23,3 23,3 Zgadzam się 451 2,6 34,9 58,2 Ani się zgadzam ani nie 261 1,5 20,2 78,4 118 ,7 9,1 87,6 30 ,2 2,3 89,9 131 ,7 10,1 100,0 1292 7,4 100,0 1 ,0 ND:PYT NIE ZADANE 16204 92,6 Ogółem 16205 92,6 17497 100,0 zgadzam Ważne Nie zgadzam się Zdecydowanie się nie zgadzam TRUDNO POWIEDZIEĆ Ogółem BRAK DANYCH Braki danych Ogółem WAŻNE: to, co wyżej jest tabelą surową; wklejana do docelowego tekstu raportu tabela surowa powinna być pozbawiona kolumn „procent” i „procent skumulowany” oraz wierszy „brak danych”, „Nd:pyt nie zadane” oraz dwóch ostatnich „ogółem”. Zostaje cała reszta (tu: zaznaczona na szaro). I tylko tę część interpretujemy, najczęściej wskazując na najmniej i najbardziej liczne kategorie odpowiedzi. Nie trzeba opisywać wszystkich odsetek – tylko te, które są istotne dla naszych analiz. 2 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) W tym przykładzie odpowiedź „trudno powiedzieć” jest uwzględniona w odpowiedziach ważnych. Robi się tak wówczas, gdy z punktu widzenia naszych analiz jest to istotna informacja: ile osób nie potrafiło/nie chciało odpowiedzieć na pytanie. Może to być wskaźnik: o Brak wiedzy -> rzecz jest mało znana o Niechęci do udzielania odpowiedzi -> bo rzecz jest wstydliwa, niepoprawna politycznie, tabu etc. o Dziwnego pytania -> respondenci nie rozumieją i „uciekają” w „trudno powiedzieć” Obliczenie częstości może przydać się w jeszcze jednym wypadku – gdy chcemy sprawdzić, czy dana zmienna może być zmienną niezależną i zależną. Oczywiście nie chodzi tu o jej przydatność merytoryczną, ale analityczną. Dobra analitycznie zmienna niezależna to taka, która dzieli nam badanych na kilka grup, ale w miarę równych liczebnie -> w wielu procedurach analitycznych równoliczność grup jest jednym z warunków wstępnych ich wykonania. zależna to taka, która rzeczywiście różnicuje badanych -> jeśli większość z nich „wpada” do jednej kategorii to nie będzie zróżnicowania opinii. Taką właśnie sytuację można zaobserwować poniżej. Zmienna re22 „W jakim wyznaniu/religii resp był wychowany” i jej rozkład dla roku 2010: W jakim wyznaniu/religii resp był wychowany Częstość W religii katolickiej Ważne Procent ważnych skumulowany 97,9 98,2 98,2 Protestanckiej 2 ,1 ,1 98,4 Prawosławnej 6 ,5 ,5 98,9 Świadków Jehowy 3 ,2 ,2 99,1 10 ,8 ,8 99,9 1 ,1 ,1 100,0 1258 99,6 100,0 5 ,4 1263 100,0 Nie wiem Ogółem Ogółem Procent 1236 W żadnym wyznaniu Braki danych Procent BRAK DANYCH Zdecydowana większość respondentów (98%) deklarowała wychowanie w religii katolickiej. Taka zmienna nie nadaje się ani na niezależną, ani na zależną. 3 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) 2. TABELE KRZYŻOWE Tabele krzyżowe to podstawowy sposób prezentacji rozkładów zmiennych względem siebie. Krzyżować możemy dwie zmienne lub więcej – jednak każda kolejna zmienna powyżej drugiej będzie wprowadzała do tabeli nową warstwę i tym samym, niestety, zamazywała rozkład odpowiedzi i utrudniała interpretację. Przykład: Tabela krzyżowa zmiennych: q41a1 „Stan cywilny #2 (od 2002r.)” q49a „Liczba wszystkich dzieci respondenta” -> rekodowanie, gdzie liczba dzieci „4 i więcej” trafiła do jednego przedziału dodatkowo zastosowany został filtr i dane są tylko dla roku 2010 ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE Syntax CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT /COUNT ROUND CELL. Przy tworzeniu tabel warto trzymać się niepisanej zasady, że zmienna niezależna jest umieszczona w wierszach, a zależna – w kolumnach (w syntax: niezależna BY zależna) Program tworząc tabele pomija tych respondentów, którzy przynajmniej w jednej zmiennej mają odpowiedź uznaną za brak danych. W ten sposób otrzymujemy zwykłą tabelę z rozkładem liczebności: 4 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały Liczebność liczba dzieci - przedziały nie ma dzieci Kawaler/panna 1 dziecko 2 dzieci Ogółem 4 dzieci i więcej 3 dzieci 336 19 1 4 0 360 Konkubinat 22 14 16 3 2 57 Żonaty/zamężna 63 161 255 101 36 616 #2 (od 2002r.) Rozwiedziony(a) 14 30 27 8 3 82 1 7 5 2 1 16 12 30 47 20 11 120 448 261 351 138 53 1251 Stan cywilny Separacja Wdowiec/wdowa Ogółem Taka tabela jest mało użyteczna analitycznie, bo poszczególne liczebności trudno interpretować bez kontekstu. Np. Kawalerów/panien z jednym dzieckiem jest 19, a osób z jednym potomstwem i żyjących w konkubinacie – 14. Czy ta różnica jest ważna? Czy jest duża albo mała? Osób, które mają jedno dziecko i są albo po rozwodzie, albo w stanie wdowieństwa jest po tyle samo: 30. Czy ta „30-stka” w obu kategoriach znaczy to samo? By uniknąć takich wątpliwości tabele krzyżowe tworzy się i interpretuje z uwzględnieniem odsetek. ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W WIERSZU Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT ROW /COUNT ROUND CELL. 5 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały liczba dzieci - przedziały nie ma dzieci Kawaler/panna Konkubinat Żonaty/zamężna Stan cywilny #2 (od 2002r.) Rozwiedziony(a) Separacja Wdowiec/wdowa Ogółem Liczebność % z Stan cywilny #2 (od 2002r.) 1 4 0 360 93,3% 5,3% 0,3% 1,1% 0,0% 100,0% 22 14 16 3 2 57 38,6% 24,6% 28,1% 5,3% 3,5% 100,0% 63 161 255 101 36 616 10,2% 26,1% 41,4% 16,4% 5,8% 100,0% 14 30 27 8 3 82 17,1% 36,6% 32,9% 9,8% 3,7% 100,0% 1 7 5 2 1 16 6,3% 43,8% 31,3% 12,5% 6,3% 100,0% 12 30 47 20 11 120 10,0% 25,0% 39,2% 16,7% 9,2% 100,0% 448 261 351 138 53 1251 35,8% 20,9% 28,1% 11,0% 4,2% 100,0% Liczebność % z Stan cywilny #2 (od 2002r.) Liczebność % z Stan cywilny #2 (od 2002r.) Liczebność % z Stan cywilny #2 (od 2002r.) Liczebność % z Stan cywilny #2 (od 2002r.) 4 dzieci i więcej 3 dzieci 19 Liczebność % z Stan cywilny #2 (od 2002r.) 2 dzieci 336 Liczebność % z Stan cywilny #2 (od 2002r.) 1 dziecko Ogółem Przy procentowaniu wierszami, 100% odnosi się do zmiennej niezależnej. Czytamy zgodnie z zasadą [wiersz] [->] [kolumna], np.: Wśród kawalerów/panien 5,3% respondentów deklarowało posiadanie jednego dziecka. Z kolei wśród osób żyjących w konkubinacie prawie 20 punktów procentowych więcej: 24,6%. Procentować można także podług zmiennej zależnej – wtedy 100% znajdzie się w kolumnach. ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W KOLUMNIE 6 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT COLUMN /COUNT ROUND CELL. Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały liczba dzieci - przedziały nie ma dzieci Kawaler/panna Konkubinat Żonaty/zamężna Stan cywilny #2 (od 2002r.) Rozwiedziony(a) Separacja Wdowiec/wdowa Ogółem Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały Liczebność % z liczba dzieci - przedziały 1 dziecko 2 dzieci Ogółem 4 dzieci i więcej 3 dzieci 336 19 1 4 0 360 75,0% 7,3% 0,3% 2,9% 0,0% 28,8% 22 14 16 3 2 57 4,9% 5,4% 4,6% 2,2% 3,8% 4,6% 63 161 255 101 36 616 14,1% 61,7% 72,6% 73,2% 67,9% 49,2% 14 30 27 8 3 82 3,1% 11,5% 7,7% 5,8% 5,7% 6,6% 1 7 5 2 1 16 0,2% 2,7% 1,4% 1,4% 1,9% 1,3% 12 30 47 20 11 120 2,7% 11,5% 13,4% 14,5% 20,8% 9,6% 448 261 351 138 53 1251 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% Czytamy zgodnie z zasadą [kolumna] [->] [wiersz], np.: Wśród osób posiadających jedno dziecko 7,3% stanowili kawalerowie/panny, a 5,4% - osoby żyjące w konkubinacie. 7 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Ostatnia możliwość to procentowanie dla całości analizowanych danych ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> PROCENT CAŁOŚCI Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT TOTAL /COUNT ROUND CELL. Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały liczba dzieci - przedziały nie ma dzieci Kawaler/panna Konkubinat Żonaty/zamężna Stan cywilny #2 (od 2002r.) Rozwiedziony(a) Separacja Wdowiec/wdowa Ogółem Liczebność % z Ogółem Liczebność % z Ogółem Liczebność % z Ogółem Liczebność % z Ogółem Liczebność % z Ogółem Liczebność % z Ogółem Liczebność % z Ogółem 1 dziecko 2 dzieci Ogółem 4 dzieci i więcej 3 dzieci 336 19 1 4 0 360 26,9% 1,5% 0,1% 0,3% 0,0% 28,8% 22 14 16 3 2 57 1,8% 1,1% 1,3% 0,2% 0,2% 4,6% 63 161 255 101 36 616 5,0% 12,9% 20,4% 8,1% 2,9% 49,2% 14 30 27 8 3 82 1,1% 2,4% 2,2% 0,6% 0,2% 6,6% 1 7 5 2 1 16 0,1% 0,6% 0,4% 0,2% 0,1% 1,3% 12 30 47 20 11 120 1,0% 2,4% 3,8% 1,6% 0,9% 9,6% 448 261 351 138 53 1251 35,8% 20,9% 28,1% 11,0% 4,2% 100,0% 8 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) W tym momencie 100% odnosi się do wszystkich branych pod uwagę respondentów. Czytamy zgodnie z zasadą [wiersz] [i] [kolumna], np.: Osoby, które deklarowały bycie kawalerem/panną oraz posiadanie jednego dziecka wśród wszystkich respondentów stanowią 1,5%. Z kolei osoby żyjące w konkubinacie i także posiadające jedno dziecko to 1,1%. 3. WYKRESY SPSS ma dość rozbudowany edytor wykresów i nie chcę omawiać go w całości – kto ciekawy, może pobawić się sam. W tym miejscu chciałabym wskazać tylko na jedno ciekawe zastosowanie wykresu: wizualną ocenę dopasowania rozkładu zmiennej do rozkładu normalnego. Na przykładzie zmiennej q9age „Wiek” ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> WYKRESY -> TYP WYKRESÓW -> HISTOGRAMY -> POKAŻ KRZYWĄ NORMALNĄ NA HISTOGRAMIE Syntax: FREQUENCIES VARIABLES=q9age /HISTOGRAM NORMAL /ORDER=ANALYSIS. Otrzymujemy wykres, który pokazuje jak bardzo rozkład analizowanej zmiennej przypomina rozkład normalny lub od niego odstaje: 9 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) 4. STATYSTYKI OPISOWE Parametry opisowe zbiorowości statystycznej: 1. Miary tendencji centralnej – służą do określania tej wartości zmiennej opisanej przez rozkład, wokół której skupiają się wszystkie pozostałe wartości zmiennej; a) średnie klasyczne średnia arytmetyczna średnia geometryczna średnia harmoniczna b) średnie pozycyjne mediana dominanta (modalna) kwantyle (kwartyle, decyle, percentyle) 2. Miary dyspersji – służą do badania stopnia zróżnicowania wartości zmiennej; a) rozstęp b) odchylenie międzykwartylowe (odchylenie ćwiartkowe) c) odchylenie standardowe d) wariancje e) odchylenie przeciętne f) współczynniki zmienności 3. Miary asymetrii – służą do badania kierunku zróżnicowania wartości zmiennej; a) kurtoza b) skośność (współczynnik asymetrii) 4. Miary koncentracji – służą do badania stopnia nierównomierności rozkładu ogólnej sumy wartości zmiennej pomiędzy poszczególne jednostki zbiorowości lub analizy stopnia skupienia poszczególnych jednostek wokół średniej; a) współczynniki koncentracji SPSS pozwala nam na wykonanie statystyk opisowych w różnych miejscach, a dwa podstawowe to: a) ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI Dostępne są: Średnia, mediana, dominanta, suma Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej Kwartyle, percentyle Kurtoza, skośność 10 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) b) ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE Dostępne są: Średnia, suma Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej Kurtoza, skośność WAŻNE: to od analityka zależy poprawność obliczeń! SPSS nie zaprotestuje, jeśli dla zmiennej np. nominalnej zapragniemy wyliczyć średnią. Miary opisu statystycznego a poszczególne skale pomiarowe: Nominalna Porządkowa Interwałowa Procenty / odsetki / stosunki Ilorazowa TAK TAK TAK TAK TAK TAK TAK TAK TAK TAK Mediana TAK TAK TAK Kwartyle TAK TAK TAK Rozstęp TAK TAK Odchylenie przeciętne TAK TAK Wariancja TAK TAK Odchylenie standardowe TAK TAK Odchylenie kwartylowe (TAK) * TAK TAK Współczynnik zmienności TAK TAK Kurtoza TAK TAK Skośność TAK TAK Średnia arytmetyczna Dominanta * przy założeniu pewnej interwałowości, np. skala ocen: 5,0 ; 4,0 ; 3,0 itd. 11 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Przykład: Statystyki opisowe dla zmiennej q9age „Wiek”. Przed analizą należy łączyć filtr: dane tylko z 2010 roku. Wersja nr 1. ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI i wszystkie dostępne statystyki Syntax: FREQUENCIES VARIABLES=q9age /NTILES=4 /NTILES=3 /PERCENTILES=20 40 60 80 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /ORDER=ANALYSIS. Dla wyjaśnienia co jest co w syntax: /NTILES=4 -> kwartyle /NTILES=3 -> punkty podziału na 3 równe grupy /PERCENTILES=20 40 60 80 -> percentyle 20-ty, 40-ty, 60-ty i 80-ty STDDEV -> odchylenie standardowe VARIANCE -> wariancja RANGE -> rozstęp MINIMUM -> minimum MAXIMUM -> maksimum SEMEAN -> błąd standardowy średniej MEAN -> średnia MEDIAN -> mediana MODE -> dominanta SUM -> suma SKEWNESS -> skośność SESKEW -> błąd standardowy skośności KURTOSIS -> kurtoza SEKURT -> błąd standardowy kurtozy 12 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Otrzymujemy tabelkę z danymi: Statystyki Wiek respondenta Ważne 1263 N Braki danych Średnia 0 44,78 Błąd standardowy średniej Mediana ,478 44,00 Dominanta 26 Odchylenie standardowe 16,996 Wariancja 288,876 Skośność ,207 Błąd standardowy skośności ,069 Kurtoza -1,040 Błąd standardowy kurtozy ,138 Rozstęp 62 Minimum 18 Maksimum 80 Suma 56558 Percentyle 20 27,00 25 30,00 33,33333333 34,00 40 37,00 50 44,00 60 50,00 66,66666667 54,00 75 58,00 80 61,00 Dane z tabeli interpretujemy następująco: Statystyki opisowe zostały policzone dla całego zbioru danych: 1263 respondentów. Najmłodszy respondent miał 18 lat, a najstarszy 80. Rozstęp wyniósł więc 62 lata. Najwięcej osób miało 26 lat Średnia wieku wyniosła blisko 45 lat (z odchyleniem standardowym 16,996 i wariancją równą 288,876). Połowa osób miała przynajmniej 44 lata. ¼ osób miała maksymalnie 30 lat, a ¾ osób – maksymalnie 58 lat. Przy podziale zbiorowości na trzy równe części, to 1/3 osób miała maksymalnie 34 lata, a 2/3 osób – maksymalnie 54 lata. 13 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Przy podziale zbiorowości na pięć równych części, to 1/5 osób miała maksymalnie 27 lat; 2/5 osób – maksymalnie 37 lat; 3/5 osób – maksymalnie 50 lat, a 4/5 osób – maksymalnie 61 lat. Współczynnik kurtozy jest ujemny (-1,040), skąd można wnioskować, że rozkład zmiennej jest bardziej spłaszczony niż krzywa rozkładu normalnego i wartości zmiennej nie grupują się wokół średniej (jest więcej wartości skrajnych). Współczynnik skośności jest dodatni (0,207), skąd można wnioskować, że rozkład zmiennej jest prawostronnie asymetryczny: jest więcej niższych niż wyższych wartości zmiennej – czyli wśród badanych jest więcej osób młodszych niż starszych. WAŻNE: do końcowego raportu tabeli z obliczonymi statystykami opisowymi nie wklejamy – wystarczy tylko ich opis i interpretacja. Wersja nr 2 ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE i wszystkie dostępne statystyki. Syntax: DESCRIPTIVES VARIABLES=q9age /STATISTICS=MEAN SUM STDDEV VARIANCE RANGE MIN MAX SEMEAN KURTOSIS SKEWNESS. Uzyskana tabela: Statystyki opisowe Wiek N Ważnych respondenta (wyłączanie obserwacjami) N Statystyka 1263 Rozstęp Statystyka 62 Minimum Statystyka 18 Maksimum Statystyka 80 Suma Statystyka 56558 Statystyka 44,78 Średnia Błąd standardowy ,478 Odchylenie standardowe Statystyka 16,996 Wariancja Statystyka 288,876 Statystyka ,207 Błąd standardowy ,069 Skośność Statystyka Kurtoza Błąd standardowy 1263 -1,040 ,138 Nie będę już interpretowała danych z tabeli – jest to samo co wyżej. 14 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) I jedno wyjaśnienie: tabela generowana przez SPSS wygląda inaczej niż ta wyżej – jest trójwierszowa i bardzo długa. Jej obecny wygląd uzyskałam poprzez panel przestawiania. W oknie raportu należy kliknąć na tabeli prawym przyciskiem myszy, a potem wybrać „edytuj zawartość”: Jeśli w nowym oknie: pojawi się nowe okno, a na pasku poleceń polecenie „przestaw. Najprościej wówczas kliknąć „transponuj wiersze i kolumny” i obie rzeczy zamienią się miejscami. Lub można uruchomić panel przestawiania, o którym niżej. Jeśli w oknie raportu: na aktywowanej tabeli znów należy kliknąć prawym myszy i wybrać „panel przestawiania”. Pojawi się nowe okno ze schematem naszej tabeli – teraz dowolnie przeciągając albo kasując jej elementy możemy wpływać na kształt tabeli. 5. PROSTE PORÓWNANIE ŚREDNICH Gdy analizujemy kilka zmiennych ilościowych (albo takich, które można uznać za ilościowe, czyli te z kafeterią likertowską), to najbardziej użytecznymi miarami opisu są średnia i odchylenie standardowe. Można porównywać średnie obliczone przy pomocy poleceń zaprezentowanych wyżej. Prościej jest jednak skorzystać z dedykowanego temu polecenia. Przykład: filtr: tylko dane dla 2010 Zmienne: re8a Zauf do sejmu re8b Zauf do org przemysł i handlowych re8c Zauf do kościołów i org wyznaniowych re8d Zauf do sądów i systemu prawnego re8e Zauf do szkolnictwa i syst kształcenia Przed dokonaniem obliczeń należy odpowiedź „trudno powiedzieć” zdefiniować jako brak danych baza -> zakładka „zmienne” -> kolumna „braki” -> wartość dyskretna: 8 w syntax można to zrobić za pomocą polecenia: MISSING VALUES re8a (LO THRU -1, 8) Gdzie re8a to nazwa zmiennej LO THRU -1 oznacza, że do tej pory braki to było wartości od najniższej do -1 (można to odczytać z arkusza “zmienne_baza” w przygotowanym przeze mnie pliku Excel; ważne jest, by dopisać tu już istniejące braki, bo inaczej zostaną usunięte 8 to nowo dodany brak danych Powtórzyć dla każdej zmiennej. 15 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Gdy spojrzymy na kafeterię tych pytań, to widać, że kolejność jest nieintuicyjna: 1 - Całkowite zaufanie 2 - Duże zaufanie 3 - Umiarkowane zaufanie 4 - Bardzo małe zaufanie 5 - W ogóle nie ma zaufania Im mniejszy kod, tym większe zaufanie. Możemy to albo odwrócić rekodując zmienną, albo po prostu o tym pamiętać analizując dane. ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE Wybrać zmienne re8a-re8e W opcjach zostawić domyślnie wybrane: średnia, odchylenie standardowe, minimum, maksimum Syntax: DESCRIPTIVES VARIABLES=re8a re8b re8c re8d re8e /STATISTICS=MEAN STDDEV MIN MAX Porządek wyświetlania: o Lista zmiennych (domyślnie, nic nie trzeba dopisywać w poleceniu syntax) o Alfabetycznie Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=NAME (A). o Średnie rosnące Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=MEAN (A). o Średnie malejące Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=MEAN (D). Z racji tego, że u nas im niższa średnia tym wyższe zaufanie, wybieramy porządek „średnie rosnące” Otrzymujemy poniższą tabelę: 16 Opracowanie: dr Agnieszka Figiel (IS UAM Poznań) Statystyki opisowe N Minimum Maksimum Średnia Odchylenie standardowe Zauf do szkolnictwa i syst 1195 1 5 2,53 ,736 1225 1 5 2,86 ,983 1195 1 5 2,97 ,941 1151 1 5 3,23 ,716 Zauf do sejmu 1197 1 5 3,60 ,840 N Ważnych (wyłączanie 1071 kształcenia Zauf do kościołów i org wyznaniowych Zauf do sądów i systemu prawnego Zauf do org przemysł i handlowych obserwacjami) Do raportu wklejamy całą tabelę (wcześniej poprawiając nazwy zmiennych by nie było w nich skrótów), a pod spodem dajemy jej opis i interpretację. Na co można zwrócić uwagę: Kolejność zmiennych wg średnich: zaufanie do szkolnictwa jest największe, zaufanie do sejmu – najmniejsze; Interpretacja średnich: możemy posłużyć się kafeterią z analizowanych pytań – wówczas średnia ok. 2,5 będzie oznaczała opinię pomiędzy „duże zaufanie” a „umiarkowane zaufanie” Odchylenia standardowe: możemy porównać odchylenia między sobą – im większe, tym większe rozbieżności w opiniach respondentów (tu największe w przypadku kościoła), im mniejsze – tym bardziej respondenci byli jednomyślni (tu w przypadku organizacji przemysłowych i handlowych) Wartości minimum i maksimum: w przypadku wszystkich analizowanych instytucji pojawiały się zarówno odpowiedzi wskazujące na całkowite zaufanie (wartość: 1), jak na brak zaufania w ogóle (wartość: 5) Liczbę osób, których odpowiedzi zostały uwzględnione: im więcej osób, tym albo było łatwiej oceniać (bo np. respondenci wiedzą, co oceniają), albo było mniejsze ryzyko ukrywania swoich poglądów (nie blokowała badanych poprawność polityczna lub wstyd) 17