OPRACOWANIE DANYCH W PSPP

Transkrypt

Zpracování dat v PSPP pro společenské vědy
KRAKOWSKA AKADEMIA
A . F. MODRZEWSKIEGO
BORIS KOŽUH
OPRACOWANIE DANYCH W
PSPP
KRAKÓW
2013
3
4
Boris Kožuh, Jaroslav Myslivec
9
Opracowanie danych w PSPP
ROZDZIAŁ PIERWSZY
1 Program PSPP
Opis programu PSPP
Program PSPP jest darmowym programem (shareware)
do statystycznych opracowań danych w badaniach. Jest bardzo
podobny do programu SPSS, umożliwia jedynie nieco mniej
statystycznych metod. Dla studentów jest jednak bardzo korzystny,
ponieważ pozwala na łatwe i proste korzystanie z obydwu programu.
Darmowy program PSPP możemy mieć na swoim domowym
komputerze, a dodatkowe opracowania w SPSS wykonywać na
uczelni. W domu można wprowadzić dane i wykonać wszystkie
podstawowe opracowania, a na uczelni dodatkowo wykonać w SPSS
te opracowania, których PSPP nie umożliwia. Dla zdecydowanej
większości studentów (kierunków humanistycznych) możliwości
programu PSPP będą w całości wystarczające do pracy dyplomowej,
a często nawet i do pracy doktorskiej. Jeżeli jednak będą potrzebne
bardziej skomplikowane opracowania, dane wprowadzone w PSPP
i zachowane na pamięci pendrive możno opracować na uczelni w
SPSS. Przynajmniej w tym zakresie oba programy są kompatybilne.
10
Boris Kožuh
Pobieranie programu
Program SPSS, z którego korzystają zarówno profesorowie,
jak i studenci niemal na wszystkich uniwersytetach świata, jest
programem profesjonalnym. Jest on jednak bardzo drogi, dlatego
nie kupują go ani profesorowie, ani studenci. Kupują go tylko firmy
i uniwersytety. Pierwsza wersja programu pojawiła się na rynku
1968 roku, a ostatnia wersja to 21 z roku 2012. Wraz z pojawieniem
sie systemu Windows, dostosowano też program SPSS do tego
systemu. Autor niniejszej książki w roku 1973 opracował dane do
swojej pracy dyplomowej za pomocą jednej z pierwszych wersji
(wówczas jeszcze nie było systemu Windows ani komputerów
domowych PC). Podręcznik do korzystania programu zawierał
wtedy ponad 2000 stron.
Program PSPP jest natomiast darmowym programem, który
może legalnie posiadać każdy. Program pobiera się z witryny
internetowej organizacji GNU. Do wyszukiwarki należy wprowadzić
adres: www.gnu.org. Otwiera się wtedy strona organizacji GNU:
Rysunek 1. Strona internetowa organizacji GNU
Należy kliknąć na Downloads. Otwiera się niemal taka sama
strona jak poprzednia.
11
Rysunek 2. Strona internetowa organizacji GNU z listą programów
Na tej stronie należy poszukać listy wszystkich dostępnych
programów. Znajduje się ona w dolnej części strony pod tytułem
All Gnu Packages. Lista zawiera dużo dobrych i użytecznych
programów. Wśród tych programów jest też PSPP (rysunek nr 3).
Rysunek 3. Lista programów
12
Boris Kožuh
Należy kliknąć na nazwę pspp. Otwiera się następująca strona:
Rysunek 4. Strona programu PSPP
Należy kliknąć na Get PSPP. Otwiera się kolejna strona tego
programu:
Rysunek 5. Wybór wersji programu PSPP
Górna część tej strony jest taka sama jak poprzednia, a niżej
znajduje się lista dostępnych wersji programu PSPP. Aby pobrać
13
wersję do Windows należy kliknąć na link: Mingw-based version
(rysunek nr 5). Otwiera się wówczas następne okno:
Rysunek 6. Wybór wersji programu PSPP
Najlepiej oczywiście wybrać i kliknąć na najnowszą wersję.
Program zostanie pobrany do naszego komputera. Rysunek nr 7
pokazuje ostatni etap całej procedury. Należy kliknąć na zapisz.
Po zapisaniu programu należy odszukać program w komputerze,
kliknąć na niego i już można korzystać z programu.
Rysunek 7. Pobieranie pliku zawierającego program PSPP
14
Boris Kožuh
Istnieje oczywiście krótsza procedura. Jeżeli czytelnika nie
interesują informacje o organizacji GNU, która proponuje darmowe
programy, można otrzymać program PSPP bezpośrednio z adresu:
http://pspp.michelboaventura.com/en/downloads-2/?lang=en
Praca w programie PSPP
Opracowanie danych za pomocą programu PSPP przebiega w
następujących fazach:
Krok
pierwszy
Krok drugi
Krok trzeci
Krok
czwarty
Przygotowanie listy zmiennych
Z kwestionariusza, arkuszu obserwacji,
protokołu wywiadu lub z innych narzędzi
należy zrobi pełną listę zmiennych, które będą
opracowywane za pomocą komputera.
Wprowadzanie danych do komputera
Przygotowane dane należy wprowadzić do
komputera. Program PSPP ma swój podprogram
do wprowadzania danych. Dane wprowadzone za
pomocą programu PSPP możn bez przygotowania
opracowywać takż w programie SPSS.
Opis zmiennych
Po wprowadzeniu danych do komputera
należy opisa zmienne: wpisa ich pełne imiona,
wpisa imiona kategorii, itd.
Opracowanie danych
Wybierając różne polecenia w PSPP uruchamia
się wybrane opracowania statystyczne. Po uruchomieniu poleceń otwiera się okno dialogowe. W tym
oknie ustawia się różne opcje opracowania.
Krok piąty
15
Przegląd wyników
Kilka sekund po uruchomieniu końcowego
polecenia otwiera się okno Data Editor, w którym
można zobaczyć wszystkie wyniki. Okno to
umożliwia przegląd wyników i eksport, a następnie
zachowanie wyników na dysku.
Krok szósty
Dodatkowe porządkowanie danych
Prawie zawsze po przeglądzie pierwszych
wyników powstaje potrzeba powrotu do danych
wyjściowych po to, aby je dodatkowo uporządkować
(pogrupować, selekcjonować itd.
Krok siódmy
Wykorzystanie wyników
Po opracowaniu wyników i ich przeglądzie,
plik z wynikami należy zapisa na dysk. Zapis
ten przebiega poprzez eksport pliku. Zapisane
wyniki będzie trzeba przenieść do tekstu, w
którym następnie będą analizowane, prezentowane
oraz interpretowane (do pracy magisterskiej,
dyplomowej, do raportu badań, artykułu itd.).
16
Boris Kožuh
17
ROZDZIAŁ DRUGI
2 Przygotowanie danych
Przed opracowaniem statystycznym należy uporządkować
dane. Ułatwia ono późniejsze opracowywanie danych. Od czasu,
kiedy pojawiły się komputery, procedury porządkowania danych
zmieniły się w sposób zasadniczy. Przed “ręcznym” opracowaniem
danych należy je uporządkować, natomiast do opracowania za
pomocą komputera, wystarczy je jedynie przygotować.
Przygotowanie danych do opracowania
komputerowego
W empirycznych badaniach edukacji badacz dysponuje
zwykle stosunkowo prostymi danymi. Najczęściej występujące
zmienne to zmienne nominalne i porządkowe. Należą do nich m.
in.: wykształcenie, płeć, narodowość, zadowolenie, powodzenie,
różne zdolności, życzenia, zainteresowania itd. Rzadziej spotyka się
zmienne przedziałowe lub ilorazowe. Zmienne przedziałowe lub
ilorazowe w tym podrozdziale (w celu łatwiejszego zrozumienia)
zostaną omówione wspólnie: liczba uczniów w klasie, wiek,
18
Boris Kožuh
wzrost, staż pracy, czas uczenia się, liczba przeczytanych książek,
itd. Niektóre zmienne, które należą do porządkowych, często
opracowuje się tak, jak zmienne przedziałowe (np. wyniki uczniów
w teście).
Dla wszystkich jednostek dane zbiera się najczęściej za
pomocą jednego narzędzia. Do najczęściej używanych narzędzi
w badaniach pedagogicznych należą kwestionariusze ankiety,
kwestionariusze wywiadu, skale postaw, skale szacowania, testy
socjometryczne, testy wiadomości i protokoły obserwacji. W
niniejszym opracowaniu osoby badane różnymi narzędziami określa
się pojęciem „respondent”. Na końcu badania dla wszystkich
respondentów istnieje taka sama ilość zmiennych, ponieważ dane
dla wszystkich respondentów zbiera się prawie zawsze tymi samymi
narzędziami. To ułatwia wprowadzanie danych do komputera,
ich opracowywanie i prezentowanie wyników. Jeżeli zastosowano
dwa kwestionariusze dla dwóch różnych grup respondentów (np.
dla nauczycieli i dla rodziców), to w takich przypadkach dane
wprowadza się odrębnie: do jednego pliku odpowiedzi nauczycieli,
a do drugiego pliku odpowiedzi rodziców.
W przypadku prostych kwestionariuszy dane wprowadzane
są bezpośrednio z kwestionariuszy do komputera. W przypadku
skomplikowanych kwestionariuszy lepiej wprowadzać dane
najpierw z kwestionariusza na przygotowane kartki (szablony).
Każdy respondent posiada wówczas swoją kartkę lub przynajmniej
swój wiersz na kartce. Z wypełnionych kartek dane wprowadza
się do komputera. O tym, czy dane wprowadza się bezpośrednio
czy pośrednio, decyduje doświadczenie i praktyka w posługiwaniu
się komputerem. Przy bezpośrednim wprowadzaniu jest mniej
pracy, ale jednocześnie pojawia się więcej błędów. Dane najlepiej
wprowadzać z kimś: jedna osoba czyta dane, a druga je zapisuje w
komputerze. Pozornie wydaje się, że dwie osoby potrzebują dwa
razy mniej czasu na wprowadzanie danych. Prawda jest jednak
zaskakująca: czas wprowadzania skraca się nawet o dziesięć razy.
19
Najlepiej wprowadzać dane za pomocą programu PSPP. Dane
wprowadzone za pomocą programu PSPP można bez przygotowania
opracowywać także w programie SPSS. Z danymi wprowadzonymi
za pomocą programu Excel jest nieznacznie więcej pracy, ale tylko
przy opracowywaniu w SPSS. Natomiast dane wprowadzone w
programie Word wymagają dość skomplikowanego przenoszenia
(importu) do programów SPSS i PSPP. Z tego powodu odradza
się wprowadzanie danych za pomocą programu Word pomimo,
że samo wprowadzanie wymaga mniej czasu niż w pozostałych
wymienionych programach.
Dane dla każdego respondenta zapisuje się w nowym wierszu.
W ten sposób powstaje baza danych. W wierszach bazy umieszcza
się respondentów, natomiast w kolumnach zmienne. Oto widok na
bazę danych w programie PSPP.
Rysunek 8. Baza danych w programie PSPP
Baza danych w programie SPSS jest niemal identyczna:
20
Boris Kožuh
Rysunek 9. Baza danych w programie SPSS
Bardzo podobnie wygląda też baza danych wprowadzonych za
pomocą programu Excel. Oto ona:
Rysunek 10. Baza danych w programie Excel
21
Jeżeli dane zostały wprowadzone za pomocą programu
Word (do pojawienia się programu PSPP było tak w większości
przypadków), baza danych wygląda zupełnie inaczej:
Rysunek 11. Baza danych w programie Word
Do opracowania takich danych używa się programów
statystycznych, takich jak np. PSPP, SPSS, Excel, Statistica, itp.
Spis zmiennych
Ważnym etapem przygotowania danych do wprowadzania do
komputera jest przygotowanie listy zmiennych. Lista zmiennych
powstaje na początku układania narzędzia – jest to pierwszy etap
układania. Niektóre zmienne mają proste i „naturalne” imiona,
takie jak: wiek, płeć, czas uczenia się, ilość błędów w dyktandzie,
itd. Innym trudno nadać proste imiona i (przynajmniej na początku)
nadaje się im “imiona techniczne” jak np. odpowiedź na czwarte
pytanie w ankiecie, pierwsza ocena, druga ocena, pogląd pierwszy,
22
Boris Kožuh
itp. Do wprowadzania imion w programie PSPP należy skrócić imię
każdej zmiennej do jednego słowa.
Zapisy wartości
Wartości większej części zmiennych z ankiet, skal szacowania,
protokołów obserwacji, itd. zostają zapisane w postaci liczb
jednocyfrowych. Zilustruje to przykład pytania ankietowego
zamkniętego z sześcioma proponowanymi odpowiedziami: A,
B, C, D, E i F. Do komputera nie wprowadza się liter – zawsze
tylko liczby. Odpowiedź A zapisana zostanie jako liczba 1. Dla
respondentów, którzy zakreślili odpowiedź B - zapisana zostanie
liczba 2, dla wszystkich, którzy zakreślili odpowiedź C, zostanie
zapisana liczba 3 i tak dalej do odpowiedzi F. Taka zmienna będzie
miała jednocyfrowy zapis i będzie zajmowała w szeregu danych
tylko jedno miejsce.
Oto przykład, w którym respondenci odpowiadali na pięć
takich pytań. Pierwszy respondent zakreślił przy pytaniu pierwszym
odpowiedź C, przy drugim A, przy trzecim A, przy czwartym D i
przy piątym C. Odpowiedzi drugiego respondenta to kolejno: B, C,
A, F, B; trzeciego: B, B, B, A, D i czwartego: C, C, E, A, F.
Należy to zapisać w następujący sposób:
pierwszy respondent
31143
drugi respondent
23162
trzeci respondent
22214
czwarty respondent
33516
itd.
Dla pięciu zmiennych istnieje pięć kolumn, ponieważ wszystkie
zapisy są jednocyfrowe.
Nie ma znaczenia, że wszystkie pytania w ankiecie nie są
ilościowe (numerycznie). W ten sposób zapisuje się dane także dla
wyłącznie jakościowych zmiennych. W przypadku płci należy np. dla
23
kobiet zapisać liczbę 1, dla mężczyzn liczbę 2. Takie postępowanie
nie zmienia natury zmiennych. Nie oznacza to, że nie uwzględnia
się właściwości zmiennych. Łatwiejsze jest jedynie wprowadzanie
danych do komputera, a także ich późniejsze opracowanie.
Proste rozwiązania są najlepsze i przynoszą najmniej błędów.
Dlatego też poszczególnym odpowiedziom na pytania w ankiecie
(kategoriom zmiennej) przyporządkowuje się liczby w tej samej
kolejności, według której były podane w ankiecie (pierwszej
odpowiedzi zawsze 1, drugiej 2, trzeciej 3, itd.). Przy takim
postępowaniu możliwość wystąpienia błędów jest najmniejsza.
Nawet w przypadku, jeżeli w pytaniu ankietowym nr 8
odpowiedzi zostały umieszczone w następujący sposób:
A. zawsze
B. czasami
C. nigdy
a w pytaniu nr 13:
A. nigdy
B. czasami
C. zawsze
w obydwu sytuacjach odpowiedź A należy zapisać jako 1 (bez
względu na to, że to dwie zupełnie przeciwne odpowiedzi).
Istnieje wprawdzie możliwość oznaczania jednakowych
odpowiedzi zawsze taką samą liczbą (bez względu na fakt, czy one
były w ankiecie na pierwszym, drugim, trzecim... miejscu), jednak
powoduje to komplikacje i zwiększa ilość błędów. Takie dylematy
należy przewidzieć i rozwiązywać wcześniej – już przy układaniu
pytań ankietowych.
Narzędzia do zbierania danych nie zawsze są tak proste, jak
powyżej. Problemy pojawiają się najczęściej w tych pytaniach
ankietowych, w których można zakreślić jednocześnie więcej
24
Boris Kožuh
niż niż
jedną
jedną
odpowiedź.
odpowiedź.
Niektórzy
Niektórzyrespondenci
respondenci zakreślają
zakreślają jedną
odpowiedź, niektórzy dwie lub więcej niż dwie, natomiast niektórzy
nie zakreślają żadnej. Stąd też dla niektórych respondentów pojawia
się więcej wartości, dla innych natomiast tylko jedna wartość.
Jak zatem zapisać odpowiedzi, aby zachować prostotę zapisu i
równocześnie umieścić wszystkie dane? Najprostsze rozwiązanie
jest następujące: z jednego pytania ankietowego zrobić więcej
zmiennych – tyle, ile jest proponowanych odpowiedzi. Powstałe w
ten sposób wszystkie zmienne będą jednocyfrowe. W przypadku,
gdy respondent zakreślił pewną odpowiedź zapisuje się 1, jeżeli
jej nie zakreślił zapisuje się 0. Ilustruje to przykład pytania
ankietowego z sześcioma proponowanymi odpowiedziami dla
ośmiu respondentów. W przykładzie istniała możliwość zakreślenia
dowolnej liczby odpowiedzi.
Tabela 1. Odpowiedzi ośmiu respondentów na pytanie ankietowe
pierwszy
A
B
C
D
E
F
drugi
A
B
C
D
E
F
trzeci
A
B
C
D
E
F
Respondenci
czwarty
piąty
A
A
B
B
C
C
D
D
E
E
F
F
Należy to zapisać następująco:
pierwszy respondent
drugi respondent
trzeci respondent
czwarty respondent
piąty respondent
szósty respondent
110101
011101
110110
111111
011001
101110
szósty
A
B
C
D
E
F
siódmy
A
B
C
D
E
F
ósmy
A
B
C
D
E
F
25
siódmy respondent
ósmy respondent
000000
101101
Siódmy respondent nie zakreślił żadnej odpowiedzi, więc
wpisano sześć razy zero. W ten sposób powstały wiersze danych
jednakowej długości dla wszystkich respondentów.
W programie PSPP zapis ten wygląda następująco:
Rysunek 12. Baza danych w programie PSPP
Zjawisko to występuje bardzo często i z tego powodu zostanie
dodatkowo wyjaśnione. W ankiecie pytano respondentów: Jakie są
motywy podjęcia przez Panią/Pana studiów na kierunku pedagogika?
Respondenci mogli zakreślić więcej niż jedną odpowiedź. Oto
proponowane odpowiedzi:
A będę miał możliwość awansu zawodowego
B lubię pracować z dziećmi
C lubię pracę grupową
26
Boris Kožuh
D moi rodzice są nauczycielami
E będę miał długie wakacje
Zadano tylko jedno pytanie, jednak każdy respondent mógł
udzielić kilku odpowiedzi. W celu wprowadzania i opracowywania
danych pytanie to w myślach należy przekształcić w kilka podobnych
pytań. Odpowiedzi traktuje się w taki sposób, jak gdyby kolejne
pytania brzmiały:
“Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu
możliwości awansu zawodowego?
TAK NIE
“Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi
pracę z dziećmi?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi
pracę grupową?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki, bo rodzice
są nauczycielami?”
TAK NIE
„Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu
długich wakacji?”
TAK NIE
Jeżeli respondent zakreślił A, to tak, jak gdyby na pierwsze
zasymulowane w myślach pytanie, udzielił odpowiedź TAK. W
przypadku, gdy go nie zakreślił, to jakby odpowiedział NIE.
Tak należy postępować od pierwszej do ostatniej proponowanej
odpowiedzi.
27
Ten rodzaj pytań można traktować jako jedną zmienną tylko
w przypadkach, jeżeli opracowuje się je samodzielnie (czyli bez
poszukiwania związków z innymi zmiennymi). Przy badaniu
związków i zależności z innymi pytaniami lub zmiennymi ten
rodzaj pytań należy traktować w powyżej opisany sposób (jako
więcej zmiennych). Nie można analizować np. różnic według płci
dla całego pytania, lecz dla każdej odpowiedzi oddzielnie (jedną po
drugiej). Czynność ta jest skomplikowana, jednak nie istnieje inne
rozwiązanie. Jeżeli współzależności nie są ważne, do kwestionariusza
można włączyć podobne pytania. Jeżeli jednak współzależności są
ważne dla badania, należy postępować w następujący sposób:
- w kwestionariuszu należy ograniczyć możliwość wyboru
odpowiedzi do jednej (np. który, z podanych motywów, był
najważniejszy przy wyborze studiów pedagogiki?),
- do kwestionariusza należy włączyć dwa podobne do siebie
pytania (jedno z nich dotyczy wszystkich motywów i istnieje
możliwość wyboru kilku odpowiedzi, drugie dotyczy jednego
– zwykle najsilniejszego motywu).
Jeszcze bardziej złożone przypadki nie będą tu omówione,
pomimo że mogą pojawić się w badaniach. Książka koncentruje się
na najczęściej spotykanych problemach i sytuacjach badawczych.
Prezentacja i porządkowanie danych jakościowych
Dane jakościowe porządkuje i prezentuje się tworząc
zestawy tabelaryczne. Dla każdej kategorii zmiennej należy
policzyć ilość jednostek (liczebność). Liczebność zwykle wyrażana
jest w postaci liczb absolutnych (np. ilu respondentów wybrało
pojedyncze odpowiedzi na pytanie w ankiecie) i liczb procentowych
(ile procent respondentów wybrało daną odpowiedź). Tak
uporządkowane dane nadają się do kolejnych opracowań. Już samo
uporządkowanie danych umożliwia pierwszą analizę.
28
Boris Kožuh
Tabele zawierające jedną zmienną
Tabele te pokazują stan każdej zmiennej w badanej populacji.
Oto przykład prostej tabeli, która ilustruje strukturę zmiennej
„płeć” wśród badanej populacji pracowników w Centrum
Kształcenia Kadr.
Tabela 2. Tabela grupy pracowników według płci
płeć
f
%
mężczyźni
26
39,4
kobiety
40
60,6
razem
66
100,0
Jeżeli zmienna jest porządkową i ma więcej niż dwa stopnie,
można dodać kolumnę liczebności skumulowanych F (lub F%).
Skumulowana liczebność jest sumą jednostek (lub %) do pewnej
kategorii. Dla każdej kategorii należy zsumować wszystkie
liczebności (zarówno jej, jak i niższych kategorii). Ma to jednak
sens jedynie wtedy, gdy jest to niezbędne.
Tabela 3. Tabela populacji uczniów według ocen z języka polskiego
ocena
liczebność
procent liczebności
2
5
5,8
skumulowany procent
liczebności
5,8
3
12
14,0
19,8
4
32
37,2
57,0
5
31
36,0
93,0
6
6
7,0
100,0
razem
86
100,0
Wyniki w statystyce na ogół zaokrągla się do dwóch miejsc
po przecinku. Istnieje jednak pewien wyjątek: procenty w tabelach
29
zaokrągla się do jednego miejsca po przecinku. Nie dotyczy to
procentów, z których oblicza się kolejne wyniki. Tam znowu
obowiązuje prawo dwóch miejsc po przecinku.
W taki sposób przebiega porządkowanie danych dla wszystkich
nominalnych i porządkowych zmiennych w badaniu. Te tabele
pokazują stan w badanej populacji.
Tabele zawierające dwie zmienne
Często oprócz stanu po pojedynczych zmiennych bada
się także związki między zmiennymi. Do takich celów należy
sporządzić tabele, które zawierają więcej zmiennych. Są to tabele
krzyżowe (korelacyjne). Najczęściej taka tabela zawiera dwie
zmienne, ponieważ tabela z trzema zmiennymi jest już bardzo
skomplikowaną i trudną do odczytania (nawet dla specjalistów).
Poniżej zaprezentowano przykład tabeli dwóch zmiennych:
wiek i poglądy dotyczące badanego zjawiska.
Tabela 4. Tabela korelacyjna populacji studentów według wieku i poglądów
zgadzam się
niezdecydowany
razem
18
nie zgadzam
się
37
młodszy
24
starszy
24
12
14
50
razem
48
30
51
129
79
Z tej tabeli trudno zrozumieć, jaki jest związek zmiennych.
Należy wyliczyć jeszcze procenty we wszystkich komórkach
tabeli. Procenty można obliczyć trzema sposobami, otrzymując
w ten sposób trzy odmienne tabele. Zostały one umieszczone na
kolejnych stronach.
W pierwszej z tabel procenty zostały obliczone według wieku,
w drugiej według odpowiedzi dotyczących poglądów, w tabeli
trzeciej z liczebności całej grupy (N=129).
30
Boris Kožuh
Tabela 5. Procenty według kategorii zmiennej niezależnej
zgadzam się niezdecydowany
nie zgadzam
się
razem
młodszy
24
30,4%
18
22,8%
37
46,8%
79
100,0%
starszy
24
48,0%
12
24,0%
14
28,0%
50
100,0%
razem
48
37,2%
30
23,3%
51
39,5%
129
100,0%
W tej tabeli w wierszach obliczano procenty z sumy na końcu
wiersza. W pierwszym wierszu liczebność 24 przedstawia 30,4% od
sumy 79 (na prawym krańcu wiersza). Wszystkie procenty w tym
wierszu dają razem 100,0% (30,4% + 22,8% + 46,8% = 100,0%).
Tak samo oblicza się procenty we wszystkich wierszach.
Tabela 6. Procenty według kategorii zmiennej zależnej
zgadzam się
niezdecydowany
nie zgadzam
się
razem
młodszy
24
50,0%
18
60,0%
37
72,5%
79
61,2%
starszy
24
50,0%
12
40,0%
14
27,5%
50
38,8%
razem
48
100,0%
30
100,0%
51
100,0%
129
100,0%
W tej tabeli w kolumnach obliczano procenty z sumy na dnie
kolumny. W pierwszej kolumnie liczebność 24 przedstawia 50,0%
od sumy 48 (na dnie kolumny). Wszystkie procenty w tej kolumnie
dają razem 100,0% (50,0% + 50,0% = 100,0%). Tak samo oblicza
się procenty we wszystkich kolumnach.
31
Tabela 7. Procenty z liczebności całej populacji (N=129)
zgadzam się
niezdecydowany
nie zgadzam
się
razem
młodszy
24
18,6%
18
14,0%
37
28,7%
79
61,2%
starszy
24
18,6%
12
9,3%
14
10,8%
50
38,8%
razem
48
37,2%
30
23,3%
51
39,5%
129
100,0%
W tej tabeli w komórkach obliczano procenty z liczebności
całej populacji (N=129). W pierwszej komórce (górna lewa)
liczebność 24 stanowi 18,6% wszystkich respondentów. Procenty
we wszystkich komórkach tworzą razem 100,0% (18,6% + 14,0% +
28,7% + 18,6% + 9,3% + 10,8% = 100,0%). Procenty w kolumnie
“razem” oraz w wierszu “razem” zostały też obliczone z N=129.
Pierwsza tabela pokazuje, jaki wpływ na poglądy ma wiek
respondentów. Z doświadczeń wiadomo, że ludzie w różnym wieku
mają odmienne poglądy, o które pytano w ankiecie. Ponieważ obie
zmienne są powiązane, należy określić, która z nich jest zmienną
niezależną, a która zależną. Można założyć, że w tej parze wiek jest
zmienną niezależną, a poglądy zależną. Dlatego akurat pierwsza
tabela jest najbardziej odpowiednia. Przy badaniu zależności
między zmiennymi, praktycznie zawsze należy obliczać procenty w
przedstawiony sposób, to znaczy według zmiennej niezależnej.
Druga tabela pokazuje, jaki wpływ mają poglądy na wiek.
Jest to oczywiście bezsensowny kierunek wpływu. Dlatego też nie
korzysta się z takich tabel.
Trzecia tabela nie nadaje się do analizy związku między
zmiennymi. Z tego powodu jest właśnie zupełnie niepotrzebna,
ponieważ niepotrzebne jest włączenie niezwiązanych zmiennych
do wspólnej tabeli.
32
Boris Kožuh
Tabele sporządza się tak, że zmienna niezależna umieszczona
jest w wierszach, a zmienna zależna w kolumnach. Wartości
procentowe oblicza się w każdym wierszu odrębnie. Oto przykład
takiego układu zmiennych:
Tabela 8. Tabela korelacyjna populacji zaocznych studentów
Zawsze
Często
Rzadko
Nigdy
Razem
Dziewczęta
26
31,7%
31
37,8%
16
19,5%
9
11,0%
82
100,0%
Chłopcy
19
25,0%
23
30,3%
21
27,6%
13
17,1%
76
100%
Razem
45
28,5%
54
34,2%
37
23,4%
22
13,9%
158
100,0%
Jeżeli zmienna zależna posiada tak wielką liczbę kategorii, że
tabela jest za szeroka i nie pomaga nawet technika komputerowa
(małe czcionki), należy odwrócić tę kolejność. W tym przypadku
umieszcza się zmienną zależną w wierszach i zmienną niezależną w
kolumnach. Ale uwaga: procenty należy i w tym przypadku obliczać
według kategorii zmiennej niezależnej, (czyli 100, 0% znajduje się
na dole każdej kolumny). Dodatkowo w tekście przed taką tabelą
należy czytelnikowi zwrócić uwagę na tak odwrócony układ.
Tabela 9. Sposób spędzania czasu wolnego
Piłka nożna
Piłka ręczna
Siatkówka
Koszykówka
Dziewczęta
Chłopcy
Razem
6
8,5%
8
11,3%
14
19,7%
7
9,9%
32
23,4%
11
8,0%
27
19,7%
9
6,6%
38
18,3%
19
9,1%
41
19,7%
16
7,7%
33
Narciarstwo
6
8,5%
6
8,5%
3
4,2%
7
9,9%
5
7,0%
9
12,7%
71
100,0%
Atletyka
Judo
Pływanie
Strzelectwo
Inny
Razem
9
6,6%
8
5,8%
5
3,6%
12
8,6%
6
4,4%
18
13,1%
137
100,0%
15
7,2%
14
6,7%
8
3,8%
19
9,1%
11
5,3%
27
13,0%
208
100,0%
Oto przykład upierania się przy regule: tabele sporządza się
tak, że zmienna niezależna umieszczona jest po lewej stronie
(w wierszach), a zmienna zależna u góry tabeli (w kolumnach).
Tabela 10. Sposób spędzania czasu wolnego
Piłka
nożna
Piłka
ręczna
Siatkówka
Koszykówka
Narciarstwo
Atletyka
Judo
Pływanie
Strzelectwo
Inny
Razem
Dziewczęta
6
8,5%
8
11,3%
14
19,7%
7
9,9%
6
8,5%
6
8,5%
3
4,2%
7
9,9%
5
7,0%
9
12,7%
71
100,0%
Chłopcy
32
23,4%
11
8,0%
27
19,7%
9
6,6%
9
6,6%
8
5,8%
5
3,6%
12
8,6%
6
4,4%
18
13,1%
137
100,0%
Razem
38
18,3%
19
9,1%
41
19,7%
16
7,7%
15
7,2%
14
6,7%
8
3,8%
19
9,1%
11
5,3%
27
13,0%
208
100,0%
Prezentacja i porządkowanie danych ilościowych
Uporządkowane dane nominalne lub porządkowe nadają się
już do interpretacji. Inaczej jest w przypadku danych ilościowych
(przedziałowych i ilorazowych), które porządkuje się tylko w
celach łatwiejszego opracowania. Korzystanie z komputera w
opracowaniu danych przyniosło radykalną zmianę: porządkowanie
danych ilościowych przed opracowaniem jest już zupełnie
niepotrzebne. Dlatego też zagadnienie dotyczące porządkowania
34
Boris Kožuh
danych ilościowych omawia się w sposób skrócony. Dane ilościowe
porządkuje się na dwa sposoby.
1. Tworzy się szereg szczegółowy prosty. Wartości zmiennej
porządkuje się rosnąco. Sposób ten, bez szczegółowego opisu,
zostanie zilustrowany jednym przykładem.
Oto odpowiedzi nauczycieli na pytanie o staż pracy:
Tabela 11. Staż pracy nauczycieli
x
2
4
5
6
7
9
10 11 12 14 17 21 23 24 27
R
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
2. Tworzy się szereg rozdzielczy z przedziałami klasowymi.
Tego sposobu używa się w sytuacjach, gdy liczebność grupy
przewyższa liczebność zwykłej klasy szkolnej.
Tabela 12. Wyniki testu z języka angielskiego
Przedziały
klasowe
Liczebność
Procent
liczebności
Liczebność
skumulowana
8 - 12
2
1,7
2
Skumulowany
procent
liczebności
1,7
13 - 17
5
4,2
7
5,8
18 - 22
8
6,7
15
12,5
23 - 27
11
9,2
26
21,7
28 - 32
17
14,2
43
35,8
33 - 37
21
17,5
64
53,3
38 - 42
15
12,5
79
65,8
43 - 47
15
12,5
94
78,3
48 - 52
12
10,0
106
88,3
53 - 57
10
8,3
116
96,7
58 - 62
4
3,3
120
100,0
N=120
35
Do prezentacji i interpretacji danych ilościowych nadają się
końcowe wyniki opracowań statystycznych (średnie arytmetyczne,
wariancje, współczynniki korelacji, itd.).
36
Boris Kožuh
37
ROZDZIAŁ TRZECI
3 Wprowadzanie danych
Dane można wprowadzać za pomocą kilka programów: Excel,
SPSS, PSPP, Word, itd. Do niedawna najlepszym rozwiązaniem
było wprowadzanie danych za pomocą edytora Word. Jednak dane
wprowadzone w programie Word wymagają złożonych operacji
importowania do programów PSPP lub SPSS. Dlatego odradza
się wprowadzanie danych za pomocą programu Word, pomimo
że wymaga ono mniej czasu niż w pozostałych wymienionych
programach.
Wprowadzanie danych w programie Excel jest proste, ale
wymaga więcej pracy niż w Wordzie. Przenoszenie bazy danych do
programu SPSS jest nadzwyczaj proste, ale do programu PSPP na
razie niemożliwe. Być może następne wersje programu PSPP będą
umożliwiały import danych z Excel.
Program PSPP posiada prosty podprogram do wprowadzania
danych. Dane wprowadzone za pomocą programu PSPP można
bez przygotowania opracowywać także w programie SPSS.
Trzeba jednak podkreślić jedną zaletę programu Word. W
przypadku bazy danych, która zawiera wielką liczbę zmiennych,
38
Boris Kožuh
program Word oszczędza czas. Wprowadzanie za pomocą
programów SPSS, PSPP lub Excel wymaga, po zapisaniu każdej
wartości, użycia strzałki kursora (w prawo). Jeżeli np. badanie
zawiera 200 prostych zmiennych (jednocyfrowych), przy
wprowadzaniu danych dla każdego respondenta należy nacisnąć
200 razy odpowiednią cyfrę i 199 razy strzałkę kursora. W Wordzie
wystarczy nacisnąć tylko 200 cyfr. Procedury wprowadzania danych
za pomocą programu Word i importowania do SPSS (lub PSPP)
zostały opisane w starszych podręcznikach (patrz: Kožuh 2006).
Wprowadzanie danych za pomocą programu PSPP
Przy uruchamianiu programu PSPP otwiera się okno Data
Editor. W lewym dolnym rogu okna znajdują się dwie zakładki:
Data View i Variable View. Pierwsza z nich otwiera widok na dane,
a druga na listę zmiennych. W oknie z widokiem na dane uruchamia
się opracowania statystyczne, a w oknie z listą zmiennych określa
się i opisuje zmienne.
Rysunek 13. Okno Data Editor
39
W otwartym oknie Data Editor jest oznaczona pierwsza
komórka (w lewym górnym rogu). W programie SPSS można od
razu zacząć wprowadzać dane, a w programie PSPP nie jest to
możliwe, ponieważ najpierw trzeba określić zmienne. Kliknij na
zakładkę Variable View. Otworzy się okno:
Rysunek 14. Okno Data Editor-Variable View
I w tym oknie oznaczona jest pierwsza komórka. Od razu
można wpisać imię pierwszej zmiennej. Imię nie może być dłuższe
od jednego słowa (nie wolno używać spacji). Oznacza to, że można
wpisać imię „ocenazmatematyki”, ale nie można wpisać „ocena
z matematyki”. Najlepiej nadać niektórym zmiennym ich krótkie
imiona (np. płeć, wiek, staż, itd.), a zmiennym z długimi imionami
tylko skróty np. z1, z2, z3 (zmienna pierwsza, zmienna druga,
zmienna trzecia, itd.). Po wpisie imienia należy kliknąć na Enter lub
przejść do kolejnego wiersza za pomocą myszki. Wpiszemy imię
drugiej zmiennej i tak do końca listy zmiennych. Listę dziesięciu
zmiennych prezentuje następny rysunek:
40
Boris Kožuh
Rysunek 15. Okno Variable View z listą dziesięciu zmiennych
Pierwsze cztery zmienne (płeć, wiek, klasa i wykształcenie
matki) to dane osobowe respondentów z metryczki ankiety.
Pozostałe zmienne to te, które bardzo często występują w
badaniach edukacji: oceny z dwóch przedmiotów, wyniki dwóch
testów i odpowiedzi na dwa pytania z kwestionariusza ankiety. Wiek
i wyniki testów to zmienne ilościowe, natomiast pozostałe zmienne
są zmiennymi jakościowymi.
Jeżeli wprowadzone zostało niepoprawne imię zmiennej,
należy kliknąć na odpowiednią komórkę, wpisać poprawne imię
i zatwierdzić klawiszem Enter. Po wpisie całej listy zmiennych,
najlepiej zapisać plik na dysk. Oczywiście, plik można zapisać też
później (po wprowadzeniu wszystkich danych), ale ostrożność
wymaga zapisów w trakcie pracy. W oknie Data Editor należy
otworzyć menu File i wybrać pozycje Save As (zapisz jako).
Rysunek 16. Menu File i Save As
Otworzy się okno Save As:
Rysunek 17. Okno Save As
41
42
Boris Kožuh
Do rybryki Name należy wprowadzić imię pliku (np. praca
magisterska) i wybrać miejsce na dysku, w którym plik ma zostać
zapisany. Wszystkie pozostałe ustawienia są automatyczne. Na
końcu należy jeszcze kliknąć na Save.
Rysunek 18. Okno Save As
Teraz jest wszystko przygotowane i można wprowadzać dane.
Należy kliknąć na zakładkę Data View. Otworzy się kolejne okno
(rysunek 19 na następnej stronie).
W pierwszym wierszu znajdują się imiona wszystkich
zmiennych, a pod nimi puste wiersze. Kliknij w komórce na
początku pierwszego pustego wiersza i wpisuj dane pierwszego
respondenta, przesuwając się po każdej wpisanej liczbie w prawo
za pomocą strzałki kursora. Na rysunku 20 (na następnej stronie)
pokazane są dane pierwszego respondenta.
Rysunek 19. Okno Data View przed wpisem pierwszej wartości
Rysunek 20. Okno Data View po wpisie danych pierwszego respondenta
43
44
Boris Kožuh
Po wpisie wszystkich danych pierwszego respondenta (pełny
pierwszy wiersz) naciśnij klawisz Tab. Oznaczona zostanie pierwsza
komórka drugiego wiersza i w taki sam sposób wprowadź dane
drugiego respondenta, trzeciego, czwartego, itd. do końca. Baza
danych wówczas wygląda tak, jak na rysunku 21.
Rysunek 21. Okno Data View po wpisie danych dziesięciu respondenów
W wierszach znajdują się respondenci, a w kolumnach
zmienne.
Błędy powstałe przy wprowadzaniu danych są łatwo
naprawialne. Tabela nr 13 zawiera instrukcje jak naprawić najczęstsze błędy.
45
Tabela 13. Poprawianie błędów
Co zrobić?
Poprawić
niewłaściwą
wartość
Jak to zrobić?
Kliknij na komórkę z niewłaściwą wartością.
Wpisz poprawną wartość.
Zatwierdź za pomocą klawisza Enter.
Usunąć cały
wiersz (wszystkie
dane jednego
respondenta)
Kliknij prawym przyciskiem myszki na numer
respondenta – otworzy się menu dwóch funkcji (Insert
Cases i Clear Cases).
Kliknij na Clear Cases.
Dodać nowego
respondenta
Kliknij prawym przyciskiem myszki na numer
respondenta, przed którym chcesz dodać nowego
– otworzy się menu dwóch funkcji (Insert Cases i Clear
Cases).
Kliknij na Insert Cases.
Otworzy się nowy pusty wiersz.
Kliknij myszką w pierwszej komórce tego wiersza i
wpisz stopniowo wszystkie dane nowego respondenta.
Dodać nową
zmienną
Kliknij prawym przyciskiem myszki na imię tej
zmiennej, przed którą chcesz dodać nową zmienną
– otworzy się menu czterech funkcji.
Kliknij na Insert Variable.
Otworzy się nowa pusta kolumna.
Kliknij myszką w pierwszej komórce tej kolumny i
wpisz stopniowo dane wszystkich respondentów.
Nowych respondentów najlepiej dodawać na końcu bazy
danych (za ostatnim wprowadzonym respondentem). W badaniach
edukacji kolejność respondentów jest bez znaczenia i dlatego
nic się nie osiąga dodawaniem respondentów pomiędzy już
wprowadzonych. To samo dotyczy też kolejności zmiennych – te
również najlepiej dodawać na końcu listy zmiennych.
Teraz można już zapisać plik, jednak lepiej przed tym jeszcze
załatwić kilka drobnych spraw. Na rysunku 21 widać, że wszystkie
46
Boris Kožuh
dane są zapisane z dokładnością do dwóch miejsc po przecinku. W
przypadku zmiennej płeć zamiast K i M wprowadzono liczby 1 i 2.
W bazie danych jest to zapisane jako 1,00 i 2,00. Nie ma to żadnego
znaczenia przy opracowywaniu danych, ale źle to wygląda. Aby
zlikwidować miejsca za przecinkiem, należy kliknąć na kolumnę
Decimals i zmienić wartość 2 na zero. Taką zmianę prezentuje
rysunek 22.
Rysunek 22. Okno Variable View - rubryka Decimals
W podobny sposób można zmienić też szerokość zapisu
(rubryka Width). Szerokość 8 jest za duża i można ją zmniejszyć.
Należy kliknąć na kolumnę Width i wprowadzić zamiast 8, mniejszą
liczbę. W większości przypadków wystarczy szerokość 1. Dla
zmiennych takich jak wiek, staż pracy, wyniki testowe, itd. zwykle
wystarczy szerokość dwa, a bardzo rzadko więcej niż dwa.
Na końcu wprowadzania danych należy ponownie zapisać plik.
Otwórz menu File i kliknij na Save.
47
ROZDZIAŁ CZWARTY
4 Opis zmiennych
Powstała baza danych zawiera tylko krótkie imiona lub nawet
skróty imion. Podobnie jest też z kategoriami zmiennych, gdzie
określenia opisowe zastępowane są liczbami. W przypadku płci,
zamiast kategorii kobieta i mężczyzna, w bazie danych istnieją tylko
liczby 1 i 2. Dotyczy to wszystkich zmiennych. Teraz można to
poprawić i dopełnić, czyli dodatkowo opisać zmienne.
W niektórych przypadkach dodatkowe określanie zmiennych
jest tylko korzystne, a w innych przypadkach natomiast koniecznie.
Dla zmiennych charakterystycznych w badaniach edukacji
najbardziej przydatne są trzy opcje: Label, Values i Missing (imiona
zmiennych, słowne opisy kategorii i brakujące dane).
Pełne imiona zmiennych
Opcja Label służy do nadawania zmiennym dłuższych imion.
Pełne imiona są szczególnie ważne w momencie, gdy wyniki
przenosi się do programu Word w celu interpretacji. Raz nadane
pełne imię zapisuje się wszędzie, gdzie pojawi się ta zmienna. Jako
48
Boris Kožuh
przykład może posłużyć zmienna, którą wprowadzono na początku
pod imieniem np. ocenachemia. W każdej tabeli z wynikami tej
zmiennej będzie zapisane imię ocenachemia. Po przeniesieniu
tabeli do tekstu w programie Word, należy w każdej tabeli usunąć
imię ocenachemia i napisać pełne imię zmiennej np. końcowa ocena
z chemii w pierwszej klasie liceum. Jeszcze gorsza sytuacja jest w
przypadku zmiennych oznaczonych na początku skrótami (np. z1,
z2, z3, itd.). Dla doświadczonego użytkownika programu Word,
być może nie przedstawia to większego problemu, ale i tak wymaga
więcej pracy niż w przypadku, gdy korzysta się z opcji Label nadając
pełne imię zmiennej (raz na zawsze).
Opcję Label uruchamia się w oknie z listą zmiennych:
Rysunek 23. Okno Data Editor- Variable View
Kliknij w okienku na skrzyżowaniu kolumny Label i wiersza tej
zmiennej, której chcesz nadać pełne imię. Od razu można wpisać
pełne imię zmiennej. Następnie należy zatwierdzić imię za pomocą
49
klawisza Enter, kliknąć w kolejnym okienku, wprowadzić imię
dalszej zmiennej itd. Oto przykład:
Rysunek 24. Okno z imionami zmiennych
Imię nie powinno przekraczać 256 znaków. Można używać
też polskich znaków ą, ę, ł, ś, ó, itd. Te znaki, dopóki pracuje się
w PSPP, nie będą zapisywane poprawnie, ale po przeniesieniu
tabel i wyników do tekstu w programie Word, zostaną zapisane
poprawnie.
Jeżeli imię jest długie i nie mieści się w komórce, to wyświetla
się tylko część imienia. Można sprawdzić, czy imię jest pełne i
poprawnie zapisane. Należy myszką chwycić prawą krawędź kolumny
(w wierszu z imionami zmiennych) i kolumnę rozszerzyć (i później
ponownie zwęzić). W komórce będzie widać tylko kilka pierwszych
liter imienia, jednak pełne imię już zostało wprowadzone.
50
Boris Kožuh
Rysunek 25. Okno Data Editor - Label
Pełne imiona kategorii
Przy pomocy funkcji Values można nadać imiona poszczególnym kategoriom zmiennej. W bazie danych wszystkie wartości są
zapisane w postaci liczb. W przypadku zmiennych ilościowych zapis
ten odpowiada rzeczywistości. Np. na pytanie „ile godzin student
się uczył”, poprawną odpowiedzią jest faktycznie 7 lub 25 lub
inna liczba. W przypadku zmiennych jakościowych np. w pytaniu
o płeć uczniów, liczby tylko zastępują prawdziwe odpowiedzi. W
tabelach oczywiście muszą znajdować się prawdziwe kategorie,
a nie zastępcze liczby. W pytaniu o płeć uczniów są to kategorie
kobieta i mężczyzna a nie 1 i 2. W pytaniach ankietowych mają być
umieszczone słowne odpowiedzi zamiast 1, 2, 3, 4, itd.
Kategoriom można nadać imiona używając funkcji Values
(wartości). Kliknij w komórce na skrzyżowaniu kolumny Values i
51
wiersza wybranej zmiennej (której chcesz nadać imiona kategorii).
W prawym rogu komórki pojawi się szary guzik.
Rysunek 26. Okno Data Editor - Values
Kliknij na ten guzik i otworzy się okno Value Labels:
Rysunek 27. Okno Value Labels
52
Boris Kožuh
W polu Value kliknij i wpisz pierwszą z wartości liczbowych
(np. 1), a w Value Label pełne imię tej kategorii (np. kobieta).
Następnie kliknij na przycisk Add (dodaj). Tym przyciskiem wpis
się potwierdza i przenosi do listy nowych imion. Ponownie kliknij
w polu Value i wpisz drugą z wartości liczbowych (np. 2), a w Value
Label imię drugiej kategorii (np. mężczyzna).
Następnie ponownie kliknij na przycisk Add. Po wprowadzeniu
wszystkich wpisów kliknij na OK. Oto przykład okna przed
kliknięciem OK:
53
Błędne wpisy można poprawić w każdej chwili. Na liście zmian
końcowych kliknij na błędnym wpisie, a następnie w górnych
rubrykach popraw wpis i potwierdź poprawkę przyciskiem Apply.
Wpis można też usunąć w następujący sposób: kliknąć na błędnym
wpisie, a następnie na przycisk Remove (usuń).
Braki danych
Przy wprowadzaniu danych może nastąpić sytuacja, że
respondent nie odpowiedział na pytanie ankietowe. Wówczas
komórkę zostawia się pustą (bez wpisu). Program PSPP
automatycznie traktuje puste komórki jako brakujące dane.
Przy wprowadzaniu danych w programie Word na miejsce
brakujących danych zapisuje się zero. Wtedy pojawia się problem
podwójnego znaczenia liczby zero. Nie ma już potrzeby korzystania
z programu Word do wprowadzania danych i dlatego sytuacja ta
została opisana tylko krótko:
54
Boris Kožuh
Na niektóre pytania zero stanowi prawdziwą (poprawną)
odpowiedź! Na pytanie o płe, zero oznacza brak odpowiedzi, ale na
pytanie, ile książek uczeń przeczytał, zero jest ważną odpowiedzią
(prawdziwą, poprawną). W niektórych przypadkach badacz chce mieć
w tabelach brakujące odpowiedzi w odrębnej kolumnie. W innych
przypadkach te odpowiedzi należycałkowicie usunąć –zarówno z
opracowania, jak i z tabeli. Właśnie do tego służy funkcja Missing.
Wszystko, co należy zrobi, to określić, dla których zmiennych zero jest
brakiem odpowiedzi.
W trakcie opracowywania danych wprowadzonych w programie
PSPP może też wystąpić potrzeba określenia brakujących danych.
Dla każdej zmiennej należy odrębnie określić, jak są oznaczone
brakujące dane. Dla niektórych zmiennych jest to pusta komórka,
dla drugich inny znak, dla innych wcale nie jest potrzebna ta
funkcja. Niekiedy istnieje potrzeba odróżnienia braku odpowiedzi
od niepoprawnych odpowiedzi. Niepoprawna odpowiedź to
przypadek, w którym respondent udzielił odpowiedzi, ale nie ma
możliwości jej jednoznacznego określenia (np. jeżeli zakreślił kilka
odpowiedzi na pytanie, gdzie wymagana jest tylko jedna odpowiedź
lub jeżeli odpowiedzi są zakreślone, następnie przekreślone i w
końcu nie wiadomo, której odpowiedzi respondent udzielił itd.).
W tych przypadkach dla brakujących odpowiedzi zostawia się
pustą komórkę, a dla niepoprawnych jakiś inny znak. Wybiera się
oczywiście znak, który nie pojawia się wśród odpowiedzi. Zwykle
jest to liczba 9, ponieważ wyjątkowo rzadko spotyka się pytania
ankietowe z dziewięcioma kategoriami. Wówczas puste komórki
będą automatycznie traktowane jako brakujące dane, a wartość
9 należy określić jako brakującą za pomocą funkcji Missing. W
tabelach otrzymuje się informacje o tym, ile jest jednych, a ile
drugich odpowiedzi (oczywiście obok wszystkich kategorii ważnych
odpowiedzi).
Należy jeszcze raz nadmienić, iż program PSPP automatycznie
traktuje puste komórki jako brak danych. Dlatego też dla zmiennych
55
z pustymi komórkami użytkownik nie musi w ogóle korzystać z
funkcji Missing (wszystko odbędzie się automatycznie).
Aby określić brak danych należy kliknąć w komórce na
skrzyżowaniu kolumny Missing i wiersza tej zmiennej, której określa
się brakujące dane. W komórce pojawi się szary guzik.
Rysunek 30. Okno Data Editor – Variable View
Po kliknięciu na szary guzik otworzy się okno Missing Values:
56
Boris Kožuh
Rysunek 31. Okno Missing Values
Jeżeli brakujące dane były wprowadzane jako jeden lub kilka
ściśle określonych znaków, należy wybrać rubrykę Discrete missing
values i w puste pole wpisać znak (jeżeli znaków jest kilka, to w
każdym polu umieszcza się jeden znak). Zwykle jest to tylko 9,
a pozostałe pola zostają puste. Jest to wystarczające prawie we
wszystkich przypadkach. Oto przykład:
57
Jeżeli brakujące dane określa się jako wartości »od...do«, wtedy
wybiera się rubrykę Range plus one optional discrete missing value.
W pole Low wpisuje się dolną granicę, a w pole High wpisuje się
górną granicę. Jeżeli jako brakujące dane określa się wszystkie
wartości pomiędzy trzy i siedem, do pierwszej rubryki wpisuje się
liczbę 3 i do dolnej liczbę 7 (rysunek 33).
Jeżeli oprócz przedziału od trzy do siedem brakującą wartością
ma być też dziewięć, wówczas w trzecią rubrykę wpisuje się
dodatkowo liczbę 9 (rysunek 34).
58
Boris Kožuh
Po wprowadzeniu wszystkich wartości należy kliknąć OK.
Opisane sposoby dodatkowego uporządkowania i określania
danych w pełni wystarczą w badaniach pedagogicznych. Nie jest
to jednak wszystko, co umożliwia program PSPP. Jego możliwości
są dużo większe, dlatego też książka, która opisywałaby wszystko,
co można zrobić przy pomocy programu PSPP byłaby kilkanaście
razy bardziej obszerna. Niech się Czytelnik nie boi – opisane
sposoby naprawdę wystarczą pedagogowi, a tylko w incydentalnych
przypadkach, będzie potrzebny lepszy podręcznik.

OPRACOWANIE DANYCH W PSPP

Transkrypt

Podobne dokumenty

tutaj - Personalitas

Tworzenie animacji postaci z wykorzystaniem klatek - Gimp

INWESTOR Państwowe Muzeum Auschwitz