STATYSTYKA OPISOWA (lab. 1) 1
Transkrypt
STATYSTYKA OPISOWA (lab. 1) 1
STATYSTYKA OPISOWA (lab. 1) opr. Marek Sobolewski Celem zajęć jest nabycie umiejętności tworzenie komputerowego arkusza danych w programie STATISTICA na podstawie kwestionariusza badania ankietowego. Załącznik do poniższych materiałów stanowi kwestionariusza badania ankietowego, które zostało przeprowadzone w pierwszej części zajęć. Poniżej opisane zostaną najważniejsze czynności, które należy wykonać, aby stworzyć arkusz danych, w którym będzie można zawrzeć informacje z przeprowadzonego badania. 1. Określanie liczby zmiennych i przypadków Po uruchomieniu programu STATISTICA otwiera się zazwyczaj ostatnio używany plik danych. Proszę zamknąć ten plik a następnie utworzyć nowy arkusz (za pomocą polecenia PLIK / NOWY – skrót Ctrl+N). W trakcie tworzenia pliku danych pojawi się okno, w którym będzie można wprowadzić pewne informacje o nowym arkuszu. W szczególności, istotne jest określenie liczby zmiennych i przypadków: PRZYPADKI odpowiadają wierszom arkusza danych i są powiązane z badanymi obiektami. W przypadku badania ankietowego, ich ilość będzie wynikała z liczby przebadanych osób. Oczywiście liczbę przypadków można w każdej chwili zwiększyć lub zmniejszyć. Proszę ustalić liczbę przypadków na 30; ZMIENNE – najprościej rzecz ujmując, odpowiadają zadanym w badaniu ankietowym pytaniom. Proszę ustalić ile w rozważanym kwestionariuszu znajduje się pytań (wbrew pozorom nie jest to pytanie banalne!) i na tej podstawie określić liczbę zmiennych. Proszę utworzyć arkusz danych o zadanej liczbie zmiennych i przypadków. 2. Nazywanie zmiennych Kolejnym etapem jest nazwania zmiennych. Aby nazwać zmienną należy kliknąć dwukrotnie nagłówek kolumny i wprowadzić odpowiedni tekst. Nazwy te powinny odpowiadać treści pytań, z tym, że oczywiście wskazane jest pewne skracanie ich rozbudowanej grzecznościowej formy (a więc kolejne zmienne będą się nazywać: Płeć, Rodzaj studiów, Wiek, Wzrost, Masa ciała, Region, Miejsce zamieszkania, etc.). Jak już wcześniej stwierdzono, aby zakodować odpowiedzi z pyt. 1 z drugiej części ankiety należy wykorzystać 10 kolumn. Aby uprościć wprowadzanie nazw dla tych zmiennych, ustalmy, iż będą one odpowiadały nazwom problemów społeczno-gospodarczych rozważanych w ankiecie. A więc kolejne zmienne proszę nazwać: rozbudowa sieci dróg ekspresowych i autostrad, rewitalizacja sieci kolejowej, etc. 3. Kodowanie wariantów odpowiedzi dla cech nominalnych Wprowadzanie odpowiedzi na pytania, w których warianty odpowiedzi są opisane za pomocą pewnego „tekstu” a nie wartości liczbowej, może być pracochłonne i powodować pojawienie się wielu błędów. Dlatego też należy zakodować warianty odpowiedzi dla zmiennych mających charakter tekstowy i podczas wprowadzania danych posługiwać się tylko kodami liczbowymi. Dla przykładu, zakodujemy warianty zmiennej płeć jako: 1 – kobieta, 2 – mężczyzna; warianty zmiennej rodzaj studiów jako: 1 – stacjonarne, 2 – niestacjonarne i tak dalej. Odpowiedzi na pytanie 1 z drugiej części ankiety będą kodowane w następujący sposób: 1 – nieważny, 2 – mało ważny, 3 – dość ważny, 4 – ważny, 5 – bardzo ważny. Jak wprowadzić ten sposób kodowania dla kolumn arkusza danych w programie STATISTICA? Należy w tym celu w tym samym oknie, w którym nadawane były nazwy zmiennych znaleźć przycisk Etykiety tekstowe i w pojawiającej się po jego naciśnięciu tabelce wprowadzić kody liczbowe i odpowiadające im „tekstowe” wartości zmiennych. Sposób kodowania dla zmiennej płeć przedstawiono poniżej: 1 STATYSTYKA OPISOWA (lab. 1) opr. Marek Sobolewski W przypadku powtarzania się identycznych etykiet tekstowych dla kilku kolumn można je skopiować i wkleić. Można też je powielić za pomocą polecenia Zastosuj do… dostępnego w oknie edytora etykiet tekstowych. 4. Wprowadzanie danych Po nazwaniu kolumn w arkuszu danych i wprowadzeniu etykiet tekstowych dla zmiennych nie mających charakteru liczbowego (tzw. cech nominalnych lub jakościowych) można rozpocząć wprowadzanie danych. Należy przy tym przestrzegać następujących reguł: dane wprowadzamy wierszami – w przypadku badania ankietowego oznacza to, że wprowadzamy wszystkie dane z ankiety (a nie na przykład najpierw informacje o płci ze wszystkich ankiet, potem o rodzaju studiów, itd.); podczas wprowadzania danych używamy wyłącznie klawiszy z cyframi (0, 1, …, 9) – dzięki zakodowaniu „tekstowym odpowiedzi” dla cech nominalnych, używanie innych symboli jest niepotrzebne; do kolejnej komórki przechodzimy za pomocą klawisza Tab lub (po zakończeniu wiersza program automatycznie przejdzie do pierwszej kolumny w kolejnym wierszu). 2