STATYSTYKA OPISOWA (lab. 1) 1

Transkrypt

STATYSTYKA OPISOWA (lab. 1) 1
STATYSTYKA OPISOWA (lab. 1)
opr. Marek Sobolewski
Celem zajęć jest nabycie umiejętności tworzenie komputerowego arkusza danych w
programie STATISTICA na podstawie kwestionariusza badania ankietowego.
Załącznik do poniższych materiałów stanowi kwestionariusza badania ankietowego, które
zostało przeprowadzone w pierwszej części zajęć. Poniżej opisane zostaną najważniejsze czynności,
które należy wykonać, aby stworzyć arkusz danych, w którym będzie można zawrzeć informacje z
przeprowadzonego badania.
1. Określanie liczby zmiennych i przypadków
Po uruchomieniu programu STATISTICA otwiera się zazwyczaj ostatnio używany plik danych.
Proszę zamknąć ten plik a następnie utworzyć nowy arkusz (za pomocą polecenia PLIK / NOWY –
skrót Ctrl+N). W trakcie tworzenia pliku danych pojawi się okno, w którym będzie można
wprowadzić pewne informacje o nowym arkuszu. W szczególności, istotne jest określenie liczby
zmiennych i przypadków:
 PRZYPADKI odpowiadają wierszom arkusza danych i są powiązane z badanymi obiektami.
W przypadku badania ankietowego, ich ilość będzie wynikała z liczby przebadanych osób.
Oczywiście liczbę przypadków można w każdej chwili zwiększyć lub zmniejszyć. Proszę
ustalić liczbę przypadków na 30;
 ZMIENNE – najprościej rzecz ujmując, odpowiadają zadanym w badaniu ankietowym
pytaniom. Proszę ustalić ile w rozważanym kwestionariuszu znajduje się pytań (wbrew
pozorom nie jest to pytanie banalne!) i na tej podstawie określić liczbę zmiennych.
Proszę utworzyć arkusz danych o zadanej liczbie zmiennych i przypadków.
2. Nazywanie zmiennych
Kolejnym etapem jest nazwania zmiennych. Aby nazwać zmienną należy kliknąć dwukrotnie
nagłówek kolumny i wprowadzić odpowiedni tekst.
Nazwy te powinny odpowiadać treści pytań, z tym, że oczywiście wskazane jest pewne
skracanie ich rozbudowanej grzecznościowej formy (a więc kolejne zmienne będą się nazywać: Płeć,
Rodzaj studiów, Wiek, Wzrost, Masa ciała, Region, Miejsce zamieszkania, etc.).
Jak już wcześniej stwierdzono, aby zakodować odpowiedzi z pyt. 1 z drugiej części ankiety
należy wykorzystać 10 kolumn. Aby uprościć wprowadzanie nazw dla tych zmiennych, ustalmy, iż
będą one odpowiadały nazwom problemów społeczno-gospodarczych rozważanych w ankiecie. A
więc kolejne zmienne proszę nazwać: rozbudowa sieci dróg ekspresowych i autostrad, rewitalizacja
sieci kolejowej, etc.
3. Kodowanie wariantów odpowiedzi dla cech nominalnych
Wprowadzanie odpowiedzi na pytania, w których warianty odpowiedzi są opisane za pomocą
pewnego „tekstu” a nie wartości liczbowej, może być pracochłonne i powodować pojawienie się wielu
błędów. Dlatego też należy zakodować warianty odpowiedzi dla zmiennych mających charakter
tekstowy i podczas wprowadzania danych posługiwać się tylko kodami liczbowymi.
Dla przykładu, zakodujemy warianty zmiennej płeć jako: 1 – kobieta, 2 – mężczyzna; warianty
zmiennej rodzaj studiów jako: 1 – stacjonarne, 2 – niestacjonarne i tak dalej.
Odpowiedzi na pytanie 1 z drugiej części ankiety będą kodowane w następujący sposób: 1 –
nieważny, 2 – mało ważny, 3 – dość ważny, 4 – ważny, 5 – bardzo ważny.
Jak wprowadzić ten sposób kodowania dla kolumn arkusza danych w programie
STATISTICA? Należy w tym celu w tym samym oknie, w którym nadawane były nazwy zmiennych
znaleźć przycisk Etykiety tekstowe i w pojawiającej się po jego naciśnięciu tabelce wprowadzić kody
liczbowe i odpowiadające im „tekstowe” wartości zmiennych. Sposób kodowania dla zmiennej płeć
przedstawiono poniżej:
1
STATYSTYKA OPISOWA (lab. 1)
opr. Marek Sobolewski
W przypadku powtarzania się identycznych etykiet tekstowych dla kilku kolumn można je
skopiować i wkleić. Można też je powielić za pomocą polecenia Zastosuj do… dostępnego w oknie
edytora etykiet tekstowych.
4. Wprowadzanie danych
Po nazwaniu kolumn w arkuszu danych i wprowadzeniu etykiet tekstowych dla zmiennych nie
mających charakteru liczbowego (tzw. cech nominalnych lub jakościowych) można rozpocząć
wprowadzanie danych.
Należy przy tym przestrzegać następujących reguł:
 dane wprowadzamy wierszami – w przypadku badania ankietowego oznacza to, że
wprowadzamy wszystkie dane z ankiety (a nie na przykład najpierw informacje o płci ze
wszystkich ankiet, potem o rodzaju studiów, itd.);
 podczas wprowadzania danych używamy wyłącznie klawiszy z cyframi (0, 1, …, 9) – dzięki
zakodowaniu „tekstowym odpowiedzi” dla cech nominalnych, używanie innych symboli jest
niepotrzebne;
 do kolejnej komórki przechodzimy za pomocą klawisza Tab lub  (po zakończeniu wiersza
program automatycznie przejdzie do pierwszej kolumny w kolejnym wierszu).
2

Podobne dokumenty