tabela dla pytań wielokrotnego wyboru

Transkrypt

tabela dla pytań wielokrotnego wyboru
raportowanie
tabela dla pytań wielokrotnego wyboru
Przemysław Budzewski
spss polska
co to są pytania wielokrotnego wyboru?
W tym artykule zajmę się sposobami prezentacji szczególnej kategorii pytań — pytaniami
wielokrotnego wyboru. Pytania te stosuje się wtedy, gdy respondent może udzielić więcej
niż jednej „prawdziwej” odpowiedzi na pytanie, a co więcej, odpowiedzi te interesują mnie
z punktu widzenia celu badania.
Mógłbym np. zapytać respondentów o sposób spędzania wolnego czasu. Formułując
pytanie w następujący sposób: „ W jaki sposób najczęściej spędza Pan(i) czas wolny od
pracy?” oczekuję, że każdy z respondentów wskaże tylko jedną odpowiedź. Jednakże,
zadając pytanie nieco inaczej sformułowane: „W jaki sposób spędza Pan(i) czas wolny
od pracy?”, daję respondentom możliwość wskazania więcej niż jednej odpowiedzi. I tak
jeden z respondentów może odpowiedzieć:
1. czytam książki, 2. oglądam telewizję, 3. chodzę na spacery
a inny:
1. czytam książki, 6. po prostu leżę ;-)
W instrukcji do pytania w kwestionariuszu ankiety mogę również zawęzić liczbę możliwych
odpowiedzi, prosząc respondentów o podanie najwyżej 3 odpowiedzi, ale mogę tego
również nie robić, prosząc ich wręcz o podanie wszystkich prawdziwych odpowiedzi. Prosząc respondentów o wskazanie np. wszystkich znanych im chociażby ze słyszenia osób
publicznych narodowości niemieckiej, mogę otrzymać dziesiątki nazwisk, w tym również
„niepoprawne”, jak np. Adolf Hitler czy też Reinhold Messner. Stąd też istotne jest aby na
etapie projektowania badania i kwestionariusza rozważyć, jaki sposób zadawania tego
typu pytań jest celowy z punktu widzenia celu analizy.
jak kodować pytania wielokrotnego wyboru?
Pytania wielokrotnego wyboru kodowane są w edytorze danych w postaci zestawu zmiennych: albo w postaci tzw. wielokrotnych kategorii (mc ), albo w postaci wielokrotnych
dychotomii (md ).
1
Techniczne aspekty kodowania i zmiany sposobu kodowania pytań wielokrotnego wyboru w pasw Statistics
ujmuje materiał zamieszczony w numerze 6. biuletynu
ekspress pt.„Zamiana pytań kodowanych jako mc na md”
Ogólnie rzecz biorąc1 różnica polega na liczbie zmiennych oraz unikatowych kodów
numerycznych potrzebnych do zakodowania odpowiedzi. W przypadku kodowania md
zmiennych jest tyle ile wszystkich kategorii odpowiedzi (możliwych odpowiedzi w kafeterii)
i są one kodowane zero–jedynkowo (1 — respondent wskazał kategorię, 0 — respondent
nie wskazał kategorii). W przypadku kodowania mc zmiennych jest tyle, ile wynosi liczba
odpowiedzi udzielonych przez respondenta, który zaznaczył maksymalną liczbę odpowiedzi,
a każda kategoria odpowiedzi oznaczana jest unikatowym kodem. De facto, stwierdzenie,
iż te dwa sposoby kodowania różnią się liczbą zmiennych koniecznych do pełnego opisania
odpowiedzi jest nie do końca zgodne z prawdą. Może się zdarzyć, że znajdzie się osoba,
która wskaże wszystkie odpowiedzi. Anegdota głosi, że w pewnych badaniach na temat
zachowań ryzykownych, w pytaniu o stosowane metody antykoncepcji respondent wskazał
wszystkie możliwe odpowiedzi, i dodał jeszcze do tego „wstrzemięźliwość” (sic!).
Warto może zatem wspomnieć o jeszcze jednej sytuacji, to znaczy o sytuacji, w której
zbiór odpowiedzi jest otwarty gramatycznie — pozostawiam dodatkowo opcję Inne (jakie?)
i daję respondentowi możliwość swobodnej odpowiedzi jeśli lista pozycji na kafeterii nie jest
wyczerpująca. Takie podejście wynika zazwyczaj z dwóch względów: (a) lista możliwych
odpowiedzi jest długa i zbyt szczegółowa aby wprowadzać ją do narzędzia w całości
lub też (b) badacz ma świadomość, iż jego wiedza o zjawisku nie jest pełna a kafeteria,
potencjalnie, nie wyczerpuje tematu, w związku z tym uwzględnia możliwość pojawienia
porady i wskazówki
się istotnych kategorii spoza kafeterii. Jeśli rzeczywiście odpowiedzi pojawiające się w tej
kategorii są analitycznie istotne, należy przeprowadzić analizę treści tych odpowiedzi zanim
dokonamy kodowania zmiennej na potrzeby ostatecznej analizy. Można wtedy połączyć
niektóre bliskoznaczne kategorie odpowiedzi z już obecnymi na kafeterii, lub też utworzyć
dodatkowe kategorie.
W dalszej części artykułu zajmę się przede wszystkim sposobem prezentacji pytań wielokrotnego wyboru w tabelach, mając świadomość, że ten krótki, wstępny opis nie wystarcza
aby zaprezentować wszystkie aspekty związane z wykorzystaniem pytań wielokrotnego
wyboru w badaniach ankietowych.
przykład
tabela częstości dla pytania o korzystanie z produktów bankowych
W marketingu produktów, ale nie tylko, ważne jest by mieć możliwość oceny np. zasięgu
produktu na rynku/wśród klientów. Rzadko jednak zdarza się, że klient=produkt. Aby
zatem poprawnie ocenić „siłę przyciągania” (popularność) produktu na rynku powinienem
mieć możliwość odpowiedzenia na przynajmniej dwa pytania: jak wielu klientów korzysta
z danego produkt? oraz, jaki odsetek wszystkich produktów wykorzystywanych przez klientów stanowi ten produkt? Możecie spytać — po co mi wiedza o tym drugim (o odsetku wskazań liczonym w stosunku do wszystkich odpowiedzi, a nie w stosunku do respondentów)?
Np. ze względu na to, że chciałbym uwzględnić konkurencję pomiędzy produktami.
Nie jest to oczywiście odpowiedź uniwersalna. W przypadku różnych badań interpretacja
procentu odpowiedzi może wskazywać na nieco inne zależności. Niemniej, spróbuję
zobrazować tę zależność dodatkowo takim oto przykładem.
W badaniach na temat zachowań Polaków związanych ze spędzaniem wolnego czasu,
realizowanych dla dużej sieci oferującej usługi turystyczne w krajach północnej Afryki, zadaję
pytanie o kraje (regiony), które respondenci odwiedzili w ciągu ostatnich 3 lat podczas
urlopu. Okazuje się, że najpopularniejszymi odpowiedziami są Egipt (40% respondentów),
Tunezja (38%) i Krym (12%). Czy na podstawie tych informacji mogę, pomijając oczywiście
dodatkowe czynniki, prognozować podobną popularność każdego z tych miejsc w kolejnych sezonach? Wątpliwe, powinienem spodziewać się raczej, iż znaczna część osób
wskazujących „Egipt” była również w Tunezji (podobna jakość, cena i „bogactwo” oferty
biur turystycznych, podobne upodobania co do spędzania urlopu, typu atrakcji, itp.), i że
osoby te raczej nie były zainteresowane ofertą 34 godzinnej podróży koleją z Lwowa
do Simferopola w celu zobaczenia na własne oczy największego popiersia Lenina na
Ukrainie. Zatem, moim kontrahentom zaprezentuję obok procentu respondentów, również
zazwyczaj niższy procent odpowiedzi, który w sposób niedoskonały, niemniej na początek
wystarczająco dobry, pokaże im wielkości transferu turystów, którego mogą spodziewać się
w najbliższej przyszłości. (Zaznaczam, że to pierwszy, a nie ostatni krok w analizie.)
Powrócę teraz do przykładu, mając nadzieję, że powrót z ciepłych krajów do prozy produktów bankowych nie będzie zbyt bolesny. Poniżej zamieściłem wizualizację odpowiedzi na
pytanie o korzystanie z produktów/usług bankowych. Nieco archaiczne, jak na dzisiejsze
czasy, kategorie odpowiedzi wynikają z faktu, iż badania były realizowane w pierwszej
połowie lat 90.
2
porady i wskazówki
Tabela 1. Korzystanie z produktów
Resp
% Resp
Odp
% Odp
Książeczka oszczędnościowa
127
57%
127
18%
Kredyty na zakupy
82
37%
82
12%
Regularne opłaty
70
32%
70
10%
Wymiana walut
61
27%
61
9%
Rachunek czekowy/
oszczędnościowo rozliczeniowy
50
23%
50
7%
Rachunek terminowy
45
20%
45
6%
Rachunek walutowy
44
20%
44
6%
Przekazy krajowe
41
18%
41
6%
Informacja
40
18%
40
6%
Sprzedaż/skup bonów
21
9%
21
3%
Inne
20
9%
20
3%
Kredyty na działalność gospodarczą
17
8%
17
2%
Czeki złotowe
16
7%
16
2%
Przekazy z zagranicy
13
6%
13
2%
Usługi maklerskie
12
5%
12
2%
Przekazy za granicę
10
5%
10
1%
Rachunek przedsiębiorstwa
10
5%
10
1%
Czeki dewizowe
7
3%
7
1%
Przyjmowanie utargów
4
2%
4
1%
Karty kredytowe
4
2%
4
1%
Kredyt (ogólnie)
0
0%
0
0%
Kredyt mieszkaniowy
0
0%
0
0%
222
100%
694
100%
Ogółem
W zaprezentowanej tabeli „% Resp” oznacza procent respondentów, którzy korzystają
z danego produktu, natomiast „% Odp” oznacza procent, jaki w stosunku do wszystkich
odpowiedzi wszystkich respondentów stanowią wskazania na konkretny produkt. Statystyka „% Resp” nie sumuje się, co oczywiste, do 100% — respondent mógł udzielić więcej
niż jednej odpowiedzi. Bazę procentowania dla „% Resp” odczytać można z wiersza
„Ogółem” i kolumny „Resp” (222 respondentów), natomiast dla „% Odp” z tego samego
wiersza i kolumny „Odp” (694 odpowiedzi). Wartości w kolumnach „Resp” i „Odp” są
takie same, ponieważ każdy respondent mógł wskazać jeden produkt tylko raz. Wiersze
tabeli posortowane są względem liczebności („Resp”) w porządku malejącym.
krok po kroku
Aby utworzyć taką tabelę, muszę w pierwszej kolejności wskazać zmienne wchodzące
w skład zestawu wielokrotnych odpowiedzi. Do definiowania zestawu służy okno
analiza  tabele specjalne  zestawy odpowiedzi… lub polecenie mrset.
3
porady i wskazówki
Z listy po lewej stronie wybieram zmienne wchodzące w skład zestawu i przerzucam je przy
pomocy strzałki na listę w centralnej części okna. W przykładzie korzystam ze zmiennych
v45_1 do v45_16.
Ponieważ zmienne, których używam, kodowane są na zasadzie mc (wielokrotne kategorie),
poniżej listy zmiennych zaznaczam opcję „Kategorie”.
W polu tekstowym „Nazwa zestawu” wpisuję nazwę nowego zestawu wielokrotnych odpowiedzi, natomiast w polu „Etykieta zestawu” wprowadzam dłuższy opis, który wykorzystam
jako tytuł/nagłówek tabeli.
W ostatnim kroku, przy pomocy przycisku dodaj wprowadzam zestaw na listę „Zestawy
wielokrotnych odpowiedzi”. Wychodzę z okna przy pomocy przycisku ok, przez co zestaw
zostaje utworzony a w oknie edytora raportów pojawia się obiekt tabelaryczny podsumowujący dotychczasowe działania.
Skoro zestaw został zdefiniowany, mogę przejść do budowy tabeli w oknie analiza 
tabele specjalne  tabele użytkownika.
Zestaw wielokrotnych odpowiedzi na liście zmiennych widoczny jest jako standardowa
zmienna — opisuje go nazwa i etykieta. Jedynym elementem wyróżniającym go na tej liście
jest ikona — kwadrat z czterema polami wewnątrz, symbolizującymi wiele kategorii. Lista
„Kategorie” prezentuje wszystkie opisane etykietami produkty/usługi zaprezentowane
respondentom do wyboru.
4
porady i wskazówki
Wybieram zestaw z listy i wrzucam go w obszar wierszy w obszarze roboczym.
Następnie wchodzę do okna statystyki podsumowujące i wybieram odpowiednie
miary.
Lista statystyk dla zestawu wielokrotnych odpowiedzi różni się nieco od listy dla standardowych zmiennych jakościowych. Dodatkowymi miarami są w tym przypadku: Odpowiedzi — liczebność odpowiedzi, oraz szereg miar procentowych, wykorzystujących odpowiedzi
jako bazę procentowania (np. % z odpowiedzi w kolumnie).
W tym przykładzie skorzystam z dwóch miar standardowych: „Liczebności” oraz „% z N
w kolumnie”, które nazywam odpowiednio „Resp” i „% Resp” aby zaznaczyć, iż dotyczą
one respondentów. Ponadto skorzystam również z „Odpowiedzi” i „% z odpowiedzi
w kolumnie”, które nazywam „Odp” i „% Odp”. Zmieniam też liczbę miejsc dziesiętnych
prezentowanych dla miar procentowych.
Klikam „Zastosuj do wybranej” i wracam do głównego okna kreatora.
Teraz wchodzę w kategorie i podsumowania , aby ustalić porządek wyświetlania
kategorii w boczku tabeli oraz wyświetlić podsumowania „Ogółem”.
5
Porządek sortowania wyznaczać będzie „Liczebność” — ustalam porządek na malejący.
Zaznaczam też checkbox „Podsumowania ogółem” i akceptuję zmiany przyciskiem zastosuj.
W ostatnim kroku eliminuję prezentowanie etykiety zestawu w boczku tabeli natomiast
wprowadzam ją na karcie Tytuły w polu „Tytuł” (np. poprzez klikniecie przycisku „BY
reguła” w prawym górnym rogu okna). Mogę też dodać numer tabeli wprowadzając go
„żywym” tekstem.
Więcej na temat konstruowania tabel
w pasw Statistics można dowiedzieć się
na kursie an 2
spss polsk a
ul. Racławicka 58
30–017 Kraków
tel./faks 012.636.96.80
e–mail: info @ spss.pl
www.spss.pl
www.analizadanych.pl
www.webmining.pl
Struktura tabeli prezentuje się w następujący sposób. Wystarczy teraz tylko kliknąć ok .

Podobne dokumenty