Dorota Witkowska Metody ilościowe w badaniach społeczno

Transkrypt

Dorota Witkowska
Metody ilościowe
w badaniach społeczno-ekonomicznych
Badanie statystyczne i jego organizacja
Materiały dydaktyczne
Katedra Finansów i Strategii Przedsiębiorstwa
Wydział Zarządzania
Uniwersytet Łódzki
Spis treści
1.
2.
3.
4.
Podstawowe pojęcia statystyczne
Badanie statystyczne
Metody doboru próby do badania
Metody zbierania informacji statystycznej, podstawowe źródła
danych
5. Grupowanie i prezentacja danych statystycznych
6. Przykład badania statystycznego
2
D. WITKOWSKA,
METODY ILOŚCIOWE W BADANIACH SPOŁECZNO-EKONOMICZNYCH
1.
Podstawowe pojęcia statystyczne
Statystyka jest nauką o metodach badania prawidłowości
występujących w zjawiskach masowych, tzn. takich, które mogą zachodzić
nieograniczoną ilość razy. Przedmiotem badań statystycznych są
zbiorowości statystyczne (populacje), które stanowią zbiór elementów
(jednostek) powiązanych ze sobą logicznie i jednocześnie nieidentycznych.
Zjawiskami masowymi nazywa się takie zjawiska, które w dużej
masie zdarzeń wykazują pewne prawidłowości, jakich nie można
zaobserwować w pojedynczym przypadku.
Przedmiotem badań statystycznych jest zbiorowość statystyczna,
często nazywana również populacją lub masą statystyczną. Pod tym
pojęciem rozumie się zbiór jednostek (osób, rzeczy lub zjawisk) objętych
badaniem statystycznym. Badana zbiorowość statystyczna musi być
jednoznacznie określona i wyodrębniona. Dokonuje się tego ustalając cel
badania i precyzując kto lub co należy do badanej zbiorowości.
Poszczególne jednostki (elementy), które wchodzą w skład badanej
zbiorowości statystycznej, posiadają wspólną cechę (właściwość), a
jednocześnie różnią się między sobą innymi, sobie właściwymi, cechami.
Wyniki otrzymane podczas analizy statystycznej odnoszą się jedynie
do badanej zbiorowości statystycznej. Wnioski wysnute na podstawie tych
wyników są poprawne (tj. mają charakter realny), jeżeli badana zbiorowość
jest jednorodna, tj. składa się z jednostek, które nie różnią się od siebie z
punktu widzenia celu badania. Jednostki stanowiące zbiorowość jednorodną
muszą pozostawać pod wpływem tych samych przyczyn głównych, a
występujące między nimi zróżnicowanie wynika z działania przyczyn
ubocznych.
W literaturze rozróżnia się dwa rodzaje zbiorowości: generalną i
próbną. Zbiorowość generalna jest zbiorem dowolnych elementów
(przedmiotów, zdarzeń) nieidentycznych z punktu widzenia badanej cechy,
obejmującym wszystkie elementy będące przedmiotem badania, w
odniesieniu do których chcemy formułować wnioski ogólne. Liczba
elementów zbiorowości generalnej może być skończona, wówczas jej
liczebność oznaczamy przez N, lub nieograniczona. Natomiast zbiorowość
próbna (próba statystyczna) jest podzbiorem zbiorowości generalnej,
obejmującym część jej elementów, wybranych w określony sposób.
Podzbiór ten podlega badaniu, a uzyskane wyniki są uogólniane na
zbiorowość generalną. Liczbę elementów próby (czyli liczebność próby)
oznaczamy przez n, przy czym n < N. W literaturze często wprowadza się
3
pojęcie małej próby liczącej do 30 elementów i dużej próby tj. powyżej
30 obserwacji.
Jednostkami statystycznymi (jednostkami badania lub obserwacji)
nazywamy elementy wchodzące w skład badanej zbiorowości statystycznej,
będące obiektami obserwacji podczas statystycznego badania zbiorowości.
Przy ustalaniu celu badania, określając zbiorowość statystyczną, należy
również ściśle ustalić, co jest w danym przypadku jednostką badaną pod
względem: rzeczowym (co lub kogo badamy), przestrzennym (gdzie
odbywa się badanie) oraz czasowym (jaki okres jest objęty badaniem lub w
jakiej chwili ono się odbywa). Niedokładne określenie jednostek
statystycznych może spowodować nieporównywalność otrzymanych
danych.
Podstawowym problemem w badaniach społecznych jest pomiar
analizowanych zjawisk lub obiektów, który polega na opisie
obserwowanego fragmentu rzeczywistości, wykorzystując w tym celu
wybrane właściwości (- atrybuty, charakterystyki, cechy), pod względem
których elementy grupy lub zbioru różnią się między sobą. W przypadku
badania statystycznego najwygodniej jest przypisać wartości liczbowe
pewnym elementom świata rzeczywistego.
Pod pojęciem cechy statystycznej rozumie się właściwości,
charakteryzujące jednostki wchodzące w skład badanej zbiorowości. Cechy
te stanowią kryterium podziału zbiorowości lub jej klasyfikacji. W
zależności od celu badania, w analizach uwzględnia się tylko te z nich, które
są istotne dla zjawisk będących przedmiotem badania. Najczęściej cechy
statystyczne dzieli się na:
– cechy mierzalne (ilościowe, wymierne) to jest takie, które można
wyrazić za pomocą liczb z podaniem odpowiednich jednostek miary (np.
wiek w latach, masa w kilogramach, długość w metrach, czas w
godzinach, wartość w złotówkach),
– cechy niemierzalne (jakościowe, niewymierne), których nie można
zmierzyć, a jedynie stwierdza się występowanie lub nie określonego
wariantu danej cechy (np. płeć, kolor, zawód, wykształcenie, dyscyplina
naukowa).
W związku z tym, że analizowane właściwości mogą mieć
zróżnicowany charakter wyróżnia się następujące skale pomiarowe:
⎯ nominalna,
⎯ porządkowa,
⎯ przedziałowa i
⎯ ilorazowa.
Skale porządkowa i nominalna są nazywane skalami słabymi, natomiast
dwie pozostałe skalami mocnymi.
Cecha jest mierzona na skali nominalnej, jeśli jej wartości można
podzielić na dwie lub więcej kategorii, między którymi występują tylko
relacje równości lub różności (np. płeć, odpowiedzi respondentów: „tak”
„nie” „nie wiem”, zawód: nauczyciel, lekarz, prawnik, kierowca, itp.).
Cecha jest mierzona na skali porządkowej, jeśli zbiór jej wartości można
4
D. WITKOWSKA,
uporządkować tj. określić relację miedzy wynikami pomiaru (np.
wykształcenie: podstawowe, średnie, wyższe).
Cecha jest mierzona na skali ilorazowej, jeśli zbiór jej możliwych
wartości zawiera się w zbiorze liczb rzeczywistych dodatnich R+ i wartości
te można uporządkować jednoznacznie na osi liczbowej z podaniem stałej
(ale nie dowolnej) jednostki. Dla takiej zmiennej istnieje naturalny punkt
„zerowy”, który oznacza zupełny brak wielkości mierzonej zmiennej.
Cecha jest mierzona na skali przedziałowej, jeśli zbiór jej wartości
zawiera się w zbiorze liczb rzeczywistych R i można (te wartości)
uporządkować jednoznacznie na osi liczbowej z podaniem stałej, ustalonej
jednostki. Różnica między skalą przedziałową a ilorazową polega na
występowaniu na skali ilorazowej naturalnej jednostki miary, dzięki czemu
za każdym razem pomiar daje ten sam wynik1.
Chcąc poznać badaną zbiorowość statystyczną z punktu widzenia danej
cechy, należy ustalić warianty tej cechy występujące u poszczególnych
elementów zbiorowości. Cecha ilościowa, z punktu widzenia
matematycznego, jest zmienną przyjmującą różne wartości dla
pojedynczych jednostek badania. Zmienna ta może być ciągła lub skokowa.
W pierwszym przypadku zmienna może przyjmować każdą wartość z
określonego, skończonego przedziału liczbowego xi ∈ <xmin, xmax>. W
drugim przypadku zmienna może przyjmować jedynie określone wartości z
tego przedziału, często należące do zbioru liczb całkowitych.
W celu przeprowadzenia poprawnej analizy statystycznej konkretnej
zbiorowości należy wybrać takie cechy, które w istotny sposób
charakteryzują badane zjawisko masowe. Jeżeli elementy zbiorowości
generalnej poddajemy badaniom ze względu na jedną cechę, to mamy do
czynienia ze zbiorowością jednowymiarową (jednocechową). W
przypadku rozpatrywania wielu cech mówimy o zbiorowości
wielowymiarowej (wielocechowej).
Przykład 1
Analizując strukturę demograficzną województwa łódzkiego
zbiorowością statystyczną są wszyscy mieszkańcy województwa. Jednostką
statystyczną w tej zbiorowości jest każdy mieszkaniec, a cechami
charakteryzującymi tę zbiorowość mogą być: płeć, miejsce zamieszkania (cechy niemierzalne) oraz wiek, dochód na osobę, wielkość (lub wartość)
1
por. Rószkiewicz M.: Metody ilościowe w badaniach marketingowych PWN Warszawa
2002 s.53.
5
spożycia na osobę (- cechy mierzalne).
Z danych opublikowanych w Biuletynie Statystycznym GUS w
styczniu 1994 roku, wynika że w dniu 30.09.1993 roku mieszkańców
województwa łódzkiego było 1127,1 tysięcy, co stanowiło liczebność tej
populacji generalnej. Stosując jako kryterium klasyfikacji cechę
niemierzalną jaką jest płeć stwierdzono, że kobiet było 603,7 tys.,
a mężczyzn - 523,4 tys. Z kolei klasyfikując jednostki statystyczne (tj.
mieszkańców województwa) z punktu widzenia miejsca zamieszkania
okazało się, że w miastach zamieszkiwało w tym czasie 1048,8 tys., a na
wsi - 78,3 tys. mieszkańców.
Ã
Badanie statystyczne
Przez badanie statystyczne rozumie się ogół prac mających na celu
poznanie określonej zbiorowości statystycznej. W statystyce wyróżnia się
dwa podstawowe działy:
– statystykę opisową, zajmującą się statystycznym opisem badanej
zbiorowości,
– statystykę matematyczną, która na podstawie informacji pochodzących
z wybranej próby, wykorzystując metody wnioskowania statystycznego,
umożliwia oszacowanie parametrów zbiorowości generalnej lub pozwala
zweryfikować hipotezy statystyczne o strukturze lub parametrach
zbiorowości generalnej na podstawie próby.
W zależności od przyjętych celów poznawczych, wyróżnia się dwie
podstawowe metody badań statystycznych:
– badania pełne (zwane inaczej badaniami wyczerpującymi lub
całkowitymi), obejmujące wszystkie jednostki danej zbiorowości
statystycznej,
– badania niepełne (częściowe), obejmujące niektóre jednostki badanej
zbiorowości statystycznej.
Wybór konkretnej metody jest ściśle związany z celem badania,
liczebnością zbiorowości statystycznej, możliwością dostępu do
poszczególnych jednostek statystycznych itp. W praktyce wybór metody
warunkowany jest terminem (- okresem czasu), w jakim należy
przeprowadzić badanie oraz środkami finansowymi przeznaczonymi na ten
cel. Badanie pełne mimo niewątpliwych zalet jest w wielu przypadkach
niemożliwe2, a czasem jest zupełnie niepotrzebne. Wówczas przeprowadza
się badania częściowe, co ma miejsce szczególnie w sytuacjach, kiedy:
– przeprowadzenie badania pełnego jest zbyt kosztowne lub wymagałoby
zbyt długiego okresu czasu (np. badanie opinii publicznej wszystkich
dorosłych mieszkańców Polski na wybrany temat),
– badanie powoduje uszkodzenie lub zniszczenie badanych jednostek (np.
kontrola jakości produktów mająca na celu określenie maksymalnego
czasu ich użytkowania),
– celem badania jest uzyskanie wyników przybliżonych - orientacyjnych
2
6
Chociażby dlatego, że mogłoby prowadzić do dezorganizacji życia społecznego.
D. WITKOWSKA,
(np. określenie zainteresowania nabywców nowym produktem mającym
wejść na rynek).
Przykładem badania pełnego są spisy statystyczne, rejestracje
statystyczne i sprawozdawczość statystyczna. Spośród metod badania
częściowego na uwagę zasługuje metoda reprezentacyjna, w której do
badania statystycznego wybiera się jedynie pewną liczbę jednostek (próbę
statystyczną) reprezentujących badaną zbiorowość. Metoda ta jest
najbardziej prawidłową formą badania częściowego, ponieważ zastosowanie
rachunku prawdopodobieństwa przy przenoszeniu wyników z losowej próby
na całą zbiorowość umożliwia określenie wielkości popełnianego błędu,
czego nie dają inne metody.
W każdym badaniu statystycznym można wymienić kilka etapów:
1) przygotowanie badania, czyli ustalenie celu oraz metody badania,
określenie zbiorowości statystycznej i cech, które zostaną objęte
badaniem,
2) zbieranie materiału statystycznego poprzez bezpośrednią obserwację
(pierwotne źródło) lub korzystanie ze sprawozdawczości statystycznej3
(wtórne źródło informacji),
3) opracowanie i prezentacja materiału statystycznego, obejmujące
grupowanie i zliczanie oraz odpowiednie przedstawienie danych
statystycznych w postaci szeregów statystycznych, tablic, wykresów,
diagramów itp.,
4) opis lub wnioskowanie statystyczne.
3.
Metody doboru próby do badań
Wykorzystywana w badaniach statystycznych próba powinna być
reprezentatywna, tzn. winna opisywać strukturę zbiorowości generalnej
z przyjętą dokładnością. Reprezentatywność próby zależy od dwóch
czynników: sposobu doboru próby oraz wielkości (liczebności) próby. Ogół
metod doboru próby do badań można podzielić na dwie grupy, a
mianowicie metody doboru losowego i metody doboru nielosowego.
Dobór losowy jest związany z dokonywaniem losowania
poszczególnych jednostek, przy czym każda jednostka badanej zbiorowości
musi mieć takie samo prawdopodobieństwo wejścia do próby. Dla
zastosowania metod doboru losowego nie jest wymagana znajomość
3
Przykładem dostępnych danych statystycznych są publikacje Głównego Urzędu
Statystycznego (Roczniki i Biuletyny Statystyczne) oraz Wojewódzkich Urzędów
Statystycznych.
7
parametrów całej zbiorowości. Jeżeli jednak parametry te są znane, to
możliwe jest wykorzystanie takich metod, które zmniejszą wielkość próby
(a tym samym koszty prowadzonych badań). O próbie, która spełnia
postulat losowego wyboru mówimy, że jest nieobciążona, tzn. że jej
struktura jest podobna do struktury zbiorowości generalnej. Jeśli próba jest
nieobciążona i odpowiednio duża (liczna), to jest reprezentatywna. Jeżeli
próba jest losowa, to wraz ze wzrostem liczebności wzrasta stopień
reprezentatywności. W tym przypadku działa prawo wielkich liczb.
W praktyce wykorzystuje się wiele różnych schematów losowania
elementów do próby. Losowanie może mieć charakter jednoetapowy lub
wieloetapowy. Należy przy tym zaznaczyć, że jednostki losowania nie
zawsze są równocześnie jednostkami badania (czyli jednostkami
statystycznymi). W związku z tym losowanie dzielimy na:
– losowanie indywidualne, w którym jednostka losowania jest
jednocześnie jednostką badania (jednostką zbiorowości),
– losowanie zespołowe, w którym jednostka losowania składa się z pewnej
liczby jednostek badania.
Innymi słowy, dobór zespołowy jest metodą polegającą na losowaniu
nie pojedynczych jednostek, lecz zespołów jednostek badania. Przy
losowaniu zespołowym jednostki losowania obejmują dwie lub więcej
jednostek badania. Przykładem losowania zespołowego może być
wylosowanie zespołu ulic danego miasta, zespołu mieszkańców danego
osiedla, grupy zawodowej itp. Operowanie różnymi kategoriami jednostek
powoduje, że to samo losowanie może być raz uważane za zespołowe, a
drugi raz za indywidualne w zależności od tego, czy odnosi się ono do
jednostek badania czy losowania. Na przykład losowanie pewnej liczby
gospodarstw domowych będzie losowaniem zespołowym w odniesieniu do
poszczególnych osób, natomiast losowaniem indywidualnym w odniesieniu
do gospodarstw domowych. Można zatem zauważyć, że losowanie
zespołowe ma cechy hierarchiczności.
Podstawowym warunkiem realizacji któregokolwiek ze schematów
losowania jest posiadanie tzw. operatu losowania próby, czyli wykazu
obejmującego wszystkie jednostki badanej zbiorowości i zawierającego
szczegółowe
informacje
umożliwiające
bezbłędną
identyfikację
wylosowanych jednostek zbiorowości. W przykładzie 1 operatem losowania
jest kompletny spis mieszkańców województwa łódzkiego.
Wyróżnia się dwa podstawowe schematy losowania do próby:
– losowanie nieograniczone, w którym wylosowanie pewnej jednostki
losowania nie ogranicza możliwości wylosowania do tej próby
jakiejkolwiek innej jednostki losowania,
– losowanie ograniczone, które pewnym jednostkom losowania nie
pozwala znaleźć się w tej próbie równocześnie.
Nieograniczony dobór losowy jest podstawową metodą uzyskiwania
reprezentatywnej zbiorowości próbnej. W metodzie tej każda jednostka ma
zapewnioną szansę dostania się do próby na zasadzie czystego przypadku.
8
D. WITKOWSKA,
Przykład 2
Przykładem losowania nieograniczonego są gry liczbowe w systemie
Lotto. W zależności od typu gry (np. “Mały Lotek”, “Duży Lotek” itp.), za
pomocą tzw. maszyny losującej, dokonuje się doboru zestawu kilku liczb.
W tym przypadku mamy do czynienia z losowaniem indywidualnym, a
operatem losowania są wszystkie liczby biorące udział w losowaniu (np.
liczby od 1 do 80), spośród których wybiera się kilkuelementową próbę. Ã
W praktyce stosuje się również inny podział schematów losowania,
a mianowicie losowanie niezależne, zwane inaczej losowaniem ze
zwracaniem oraz losowanie zależne, czyli losowanie bez zwracania. W
przypadku losowania ze zwracaniem prawdopodobieństwo wylosowania
danego elementu do próby jest zawsze takie samo, podczas gdy w
przypadku losowania zależnego, prawdopodobieństwo wylosowania
konkretnego elementu do próby zwiększa się wraz ze zmniejszaniem się
próby.
Przedstawiony w przykładzie 2 schemat losowania jest losowaniem
zależnym, bowiem każda z wylosowanych liczb ma być inna, w związku z
czym wylosowane wcześniej kuleczki z liczbami nie powracają do bębna
maszyny losującej. Innymi słowy gry liczbowe typu Lotto stanowią
przykład losowania indywidualnego, nieograniczonego i zależnego.
Losowanie indywidualne, nieograniczone i niezależne (tj. ze zwracaniem)
nosi nazwę losowania prostego (porównaj przykład 3.).
Przykład 3
Zapałki pakowane są do pudełek przy wykorzystaniu pewnego
urządzenia, które odlicza odpowiednią liczbę zapałek. Po zapakowaniu
pewnej partii zapałek konieczne jest sprawdzenie czy w losowo wybranych
pudełkach znajduje się określona ich liczba. W tym celu losuje się z partii
jedno pudełko, przelicza liczbę zapałek, a następnie wrzuca się to pudełko
do pojemnika z pozostałymi pudełkami, z którego losuje się kolejne
pudełko. Powracające do pojemnika, po przeliczeniu jego zawartości,
pudełko bierze udział w kolejnym losowaniu, etc. Jest to przykład
losowania ze zwracaniem, w którym prawdopodobieństwo wylosowania jest
zawsze takie samo. Może się też zdarzyć, że wielokrotnie będziemy losować
to samo pudełko zapałek. Jest to przykład losowania prostego, w którym
jednostkami losowania i badania są pudełka zapałek.
Ã
Do
najbardziej
rozpowszechnionych
schematów
losowania
9
ograniczonego można zaliczyć: dobór warstwowy, dobór wielostopniowy i
dobór wielofazowy.
Stosowanie losowania warstwowego zaleca się, w sytuacji gdy badana
zbiorowość wykazuje silne zróżnicowanie pewnej interesującej nas cechy.
Metoda ta wymaga podzielenia całej zbiorowości na warstwy (grupy), w
obrębie których następuje oddzielny dobór losowy. Losowania dokonuje się
zwykle w stosunku wprost proporcjonalnym do liczebności danej warstwy.
Efektywność stosowania tej metody zależy od przyjętego kryterium
warstwowania. Należy dążyć do tego, aby poszczególne warstwy były w
miarę jednorodne i jednocześnie różniły się między sobą w sposób istotny.
Maksymalny efekt warstwowania osiąga się wówczas, gdy za podstawę
podziału przyjmuje się cechy możliwie silnie skorelowane z cechami
badanymi. Stąd na przykład w badaniach marketingowych najczęściej, jako
kryterium podziału, przyjmuje się: dochód, wielkość gospodarstwa
domowego, wiek, płeć, region zamieszkania itp.
Przykład 4
Badanie czasu świecenia żarówek jest rutynowym działaniem, którego
celem jest kontrola jakości produktów firmy X, która wytwarza 4 typy
żarówek o różnej mocy. Dzienna produkcja żarówek o mocy 25 W wynosi
1000 szt., o mocy 40 W - 2000 szt., o mocy 60 W - 1500 szt. i o mocy 75 W
- 500 szt. Z uwagi na to, że w trakcie badania żarówki ulegają zniszczeniu,
kontrolą jakości objętych jest 1% dziennej produkcji. W celu zapewnienia
reprezentatywności próby wykorzystuje się losowanie warstwowe, w
którym podział na warstwy zdeterminowany jest asortymentem produkcji.
Następnie ustala się liczebności żarówek poszczególnych typów w próbie.
Liczebność całej próby wynosi 50 żarówek, co stanowi 1% całej produkcji
wynoszącej 5000 sztuk. W tej próbie powinno znaleźć się 10 żarówek o
mocy 25 W (co stanowi 1% produkcji żarówek tego typu), 20 żarówek o
mocy 40 W, 15 sztuk żarówek o mocy 60 W i 5 żarówek o mocy 75 W.
Wystarczy teraz wylosować odpowiednią liczbę żarówek każdego typu i
poddać je kontroli jakości.
Ã
Dobór wielostopniowy stosuje się, kiedy możliwe jest podzielenie
badanej zbiorowości (przy wykorzystaniu określonego kryterium) na
kolejne, coraz to mniejsze grupy, np.: podział kraju na województwa,
województw na gminy itd. Zatem jest metodą kolejnego losowania
jednostek do próby z zespołów coraz to niższego stopnia (powstających z
podziału zespołów wyższego stopnia). Najpierw wybiera się jednostki
losowania pierwszego stopnia, składające się z dużych zespołów jednostek
badania, następnie jednostki te dzieli się na mniejsze zespoły, zwane
jednostkami losowania drugiego stopnia itd., aż w końcu dochodzi się do
jednostek badania.
Przykład 5
Badając popyt na tzw. kredyty studenckie bank postanowił
10
D. WITKOWSKA,
przeprowadzić badanie ankietowe wśród studentów. Jednakże z uwagi na
ograniczone środki finansowe postanowiono skonstruować odpowiednią
próbę, stosując schemat losowania wielostopniowego. W pierwszym kroku
spośród kilku uczelni znajdujących się w mieście wylosowano jedną. W
kolejnym kroku wylosowano jeden spośród kilku wydziałów tej uczelni,
następnie dla każdego roku studiów wylosowano po jednej grupie
dziekańskiej. W końcowej fazie, w trakcie zajęć odbywanych w grupach
dziekańskich, przeprowadzono ankietę wśród studentów wylosowanych
grup.
Mamy tutaj do czynienia z losowaniem trzystopniowym. W pierwszej
fazie losowania jednostkami losowania były uczelnie. W drugim wydziały
wcześniej wylosowanej uczelni. W trzeciej fazie jednostkami losowania
były grupy dziekańskie dla każdego roku studiów. Natomiast jednostkami
badania byli studenci należący do wylosowanych grup.
Ã
Dobór wielofazowy jest podobny do doboru wielostopniowego, różni
się jedynie wyborem znacznie liczniejszej próby od pożądanej. Z tej to
próby można wybrać dwie lub więcej mniejszych prób, które mogą być
wykorzystywane w badaniach. Losowanie wielofazowe stosuje się, gdy
uzyskanie informacji jest trudne lub zbyt kosztowne i należy ograniczyć
badania do stosunkowo niewielkiej grupy. Wówczas dokonuje się
wstępnego losowania dużo większej próby, z której, po odpowiedniej
selekcji, wybiera się ostatecznie mniejszą próbę losową.
W praktyce losowanie do próby polega na ponumerowaniu wszystkich
jednostek danej zbiorowości i dokonaniu wyboru losowego pewnej ich
liczby. Najczęściej, oprócz losowania nieograniczonego, wykorzystuje się
dwie podstawowe techniki losowania, a mianowicie: losowanie za pomocą
tablic liczb losowych oraz metodę doboru systematycznego.
Losowanie za pomocą tablic liczb losowych4 polega na odczytaniu
w ustalonej kolejności liczb w nich zamieszczonych. Innymi słowy,
poczynając od jakiegokolwiek miejsca tablicy, wybieramy według ustalonej
zasady tyle liczb, ile jednostek ma liczyć dana próba losowa. Opuszczamy
przy tym wszystkie liczby, które są większe od liczebności badanej
zbiorowości, czyli większe od N. Wynotowane w ten sposób liczby losowe
wskazują numery jednostek, które zostały wylosowane do próby. Należy
przy tym zauważyć, że liczba np. 0027 oznacza 27. element zbiorowości
4
Tablice te są zbudowane na takiej zasadzie, że liczby czytane w dowolnym porządku
(pionowo, poziomo, wprzód, wstecz, całościowo lub segmentowo), zachowują zawsze
cechy przypadkowości, niezależnie od miejsca ich występowania.
11
statystycznej, 0005 oznacza element piąty itd.
Istnieje możliwość zautomatyzowania procesu wybierania elementów
do próby, wykorzystując w tym celu odpowiednie generatory liczb
losowych znajdujące się we wszystkich pakietach statystycznych oraz w
arkuszach
kalkulacyjnych
np.
w
EXCEL-u
(funkcje
LOS,
RANDBETWEEN). W przypadku korzystania z programów generujących
liczby losowe możemy albo wprowadzić charakterystyki wszystkich
jednostek statystycznych badanej zbiorowości i wówczas otrzymujemy
gotową listę jednostek należących do próby, albo wygenerować jedynie
zbiór liczb losowych, które będą numerami kolejnych elementów
zbiorowości generalnej wylosowanych do próby.
Przykład 6
Badając stan zdrowia mieszkańców pewnej miejscowości liczącej
7500 mieszkańców, postanowiono przebadać 100 osobową losowo wybraną
próbę. W tym celu ponumerowano wszystkich mieszkańców od 1 do 7500 i
przystąpiono do losowania za pomocą tablic losowych. W tablicach czytając
wierszami wynotowano z pierwszego wiersza następujące dziesięć liczb
losowych: 1534, 7106, 2836, 7873, 5574, 7545, 7590, 5574, 1202, 771 W
związku z tym, że liczba mieszkańców wynosi 7500, odrzucić należy
wszystkie liczby losowe większe od 7500, czyli w naszym przypadku są to
liczby: 7873; 7545; 7590; 771 Tak więc z dziesięciu odczytanych liczb
losowych otrzymaliśmy numery jedynie sześciu elementów próby
statystycznej, którymi są: 1534; 7106; 2836; 5574; 5574; 120 Odczytując
kolejne liczby z tablic liczb losowych (odrzucając te o wartościach
przekraczających 7500) uzyskamy odpowiednio liczną próbę statystyczną.
Dobór systematyczny polega na wyborze z uporządkowanego zbioru
odpowiedniej liczby jednostek w równych odstępach (interwałach).
Najpierw ustala się liczebność (N) całej zbiorowości, a następnie liczebność
(n) próby i na tej podstawie ustala się interwał losowania k = N / n.
Poczynając następnie od losowo obranej jednostki pierwszego interwału
dobiera się kolejno co “k” jednostek z każdego interwału po jednej
jednostce, aż osiągnie się pożądaną wielkość próby losowej.
Przykład 7
W pewnym supermarkecie dziennie robi zakupy około tysiąca osób.
Kierownictwo postanowiło zbadać opinię klientów na temat działalności
supermarketu. Zdecydowano się na przeprowadzenie ankiety wśród 50
losowo wybranych klientów, stosując przy tym systematyczny ich dobór.
Ustalono długość interwału losowania k = 1000/50 = 20. Następnie
wylosowano jedną liczbę ze zbioru od 1 do 20, którą okazała się być liczba
13. W związku z tym pierwszym badanym klientem był klient, który jako
13-ty opuszczał supermarket, następnym był klient o numerze 33, a dalej
53, 73,..., 993.
Ã
12
D. WITKOWSKA,
Jak wspomniano na początku tego rozdziału, drugą grupę metod
doboru jednostek do badań stanowią metody doboru nielosowego. Polegają
one na wyborze konkretnych jednostek o ustalonych z góry
charakterystykach. W metodach tych występuje duża doza subiektywizmu
związanego z samym dobieraniem jednostek do próby, przy jednoczesnym
zachowaniu obiektywizmu wyboru kryteriów doboru. Nie rządzi tu zatem
przypadek, ponieważ dobór nielosowy jest związany z takim sposobem
postępowania, w którym ostateczny wybór jednostek powierza się
subiektywnym decyzjom osób przeprowadzających badania. Decyzje te
powinny opierać się na znajomości parametrów danej zbiorowości. Metody
te należy wykorzystywać dopiero wtedy, gdy dobór losowy jest niemożliwy
lub ekonomicznie nieuzasadniony. Do najbardziej rozpowszechnionych
metod doboru nielosowego zalicza się: dobór jednostek typowych (dobór
celowy), dobór proporcjonalny (dobór kwotowy) oraz dobór na zasadzie
eliminacji.
Dobór jednostek typowych polega na tym, że osoby prowadzące
badania wybierają do próby (na podstawie własnych decyzji) te jednostki,
które uważają za typowe (odpowiadające przeciętnym) dla danej
zbiorowości. Mogą to być np. artykuły najczęściej kupowane przez
nabywców (koszyk zakupów), przedstawiciele określonych grup
zawodowych, typowe gospodarstwa domowe, osoby o przeciętnych
zarobkach. Metoda ta nie daje jednak właściwego obrazu zróżnicowania
badanych cech.
Dobór proporcjonalny (kwotowy) jest metodą polegającą na wyborze
liczbowo określonych segmentów próby, w proporcji odpowiadającej
strukturze zbiorowości generalnej. Liczebność segmentów próby ustala się
na podstawie procentowego rozkładu cech zbiorowości generalnej
pomnożonego przez ogólną liczebność próby. W ten sposób uzyskuje się
skład liczebny próby odpowiadającej warunkom normalnego losowania.
Jednakże sam dobór jednostek nie ma cech losowości zwłaszcza w fazie
końcowego kompletowania struktury zbioru. Im więcej wyróżnia się cech
zbiorowości, tym uzyskuje się więcej podziałów segmentowych i tym
trudniej skompletować odpowiedni skład zbiorowości próbnej. Dlatego
najczęściej poprzestaje się na dwóch, trzech cechach dających nie więcej niż
10 segmentów określonych kwotowo dla skompletowania składu liczebnego
zbiorowości. Reasumując, metoda ta polega na wyborze jednostek w taki
sposób, aby struktura próby, z punktu widzenia określonych cech
13
(najczęściej silnie skorelowanych z badanym zjawiskiem), była zbliżona do
struktury zbiorowości, z której została wybrana.
Dobór na zasadzie eliminacji jest przeciwieństwem doboru jednostek
typowych. W tym przypadku eliminuje się jednostki nietypowe odbiegające
znacznie od przeciętnych. Usuwając ze zbioru przypadki skrajne uzyskuje
się, podobnie jak przy metodzie doboru jednostek typowych, spłaszczenie
obrazu struktury zjawisk do wielkości przeciętnych. Dlatego metoda ta
bywa również rzadko stosowana.
W praktyce często wykorzystuje się kombinowane metody doboru
polegające na łączeniu różnych metod. Charakterystykę wybranych metod
doboru próby stosowanych w badaniach marketingowych przedstawia
tabela 1.
Tabela 1
Dobór losowy
Dobór nielosowy
Charakterystyka wybranych metod doboru próby do badań w przypadku
prowadzenia badań marketingowych
4.
Rodzaj
badania
Generowanie
błędu próby
Konieczność
posiadania spisu
zbiorowości
Badanie
pełne
nie
tak
Celowy
nie
nie
Na zasadzie
eliminacji
nie
nie
niski
Kwotowy
nie
nie
średni
Prosty losowy
Warstwowy
tak
tak
tak
tak
wysoki
wysoki
bardzo
wysoka
niska
średnia
Systematyczny
tak
nie zawsze
średni
średnia
Wielostopniowy
tak
tylko dla
wyodrębnionych
grup
średni do
wysokiego
bardzo
wysoka
Koszt
bardzo
wysoki
bardzo
niski
Praktyczna
częstość
stosowania
niska
wysoka
średnia
Metody zbierania informacji statystycznej,
podstawowe źródła danych
Informacje gromadzone w toku badań statystycznych mogą pochodzić
z tzw. źródeł pierwotnych lub wtórnych5. Wtórne źródła informacji
obejmują te wszystkie źródła, które nie zostały opracowane z myślą o
badanym problemie. Głównymi wtórnymi źródłami informacji są przede
5
W literaturze dość często stosuje się określenia “desk research” oraz “field research”.
14
D. WITKOWSKA,
wszystkim:
– publikacje organów państwowych,
– publikacje placówek naukowo-badawczych,
– materiały wewnętrzne przedsiębiorstw,
– biuletyny agencji badań opinii publicznej lub badań rynkowych.
Na szczególną uwagę zasługują publikacje Głównego Urzędu
Statystycznego (GUS) i Urzędów Wojewódzkich (WUS), takie jak Roczniki
i Biuletyny Statystyczne, w których znaleźć można dane statystyczne
dotyczące podstawowych charakterystyk społeczno-ekonomicznych w
ujęciu rocznym, kwartalnym i miesięcznym, w odniesieniu do analiz w skali
makro, regionalnej i branżowej, a także dotyczące sytuacji
międzynarodowej.
Wewnętrzne materiały przedsiębiorstw zawierają podstawowe dane
dotyczące m.in. przychodów i kosztów firmy, stanu zatrudnienia, majątku.
Są one wykorzystywane w analizach bieżącego funkcjonowania
przedsiębiorstwa oraz do planowania jego przyszłego rozwoju, bez których
niemożliwe byłoby chociażby uzyskanie kredytu bankowego. Zazwyczaj
dane te mają charakter poufny, co oznacza, że dostęp do nich posiadają
jedynie pracownicy danej firmy oraz przedstawiciele organów kontrolnych.
Publikacje organów państwowych lub terenowych, a także placówek
naukowo-badawczych najczęściej zawierają opracowany już materiał
statystyczny. Natomiast dostęp do danych źródłowych ma z reguły dość
ograniczony krąg odbiorców. W przypadku wyspecjalizowanych agencji
badania rynku lub opinii społecznej korzystanie z wyników badań wiąże się
z pewnymi (czasem znacznymi) kosztami, a zlecenie badań jest zazwyczaj
bardzo kosztowne. Podobnie zresztą jak udostępnianie danych źródłowych
przez np. Urzędy Statystyczne. Informacja statystyczna stała się dość
drogim “towarem”, czego dowodem jest funkcjonowanie wielu instytucji
(również prywatnych) zajmujących gromadzeniem i opracowywaniem
danych statystycznych.
Pierwotne źródła gromadzenia informacji obejmują te wszystkie
źródła, które zostały przygotowane specjalnie dla badania wybranego
problemu. Podstawowymi pierwotnymi źródłami informacji są przede
wszystkim studia empiryczne, takie jak obserwacja i badania
wykorzystujące kwestionariusze.
Ankieta jest najpopularniejszym i najbardziej masowym sposobem
zdobywania informacji, wykorzystywanym w badaniach opinii i postaw
ludzi oraz w badaniach masowych. Materiał ankietowy gromadzony jest
15
przez zbieranie odpowiedzi na przemyślany i z góry ustalony zespół pytań,
skierowanych do wybranej grupy respondentów, którą może być zarówno
wąska grupa ekspertów, jak szerokie rzesze osób zainteresowanych daną
problematyką. W tym przypadku nie bada się zbiorowości statystycznej
bezpośrednio, lecz zwraca się do instytucji lub osób z prośbą o udzielenie
informacji na konkretny temat6.
Podstawowym narzędziem jest kwestionariusz ankietowy, stanowiący
przygotowany i podporządkowany celom badania zbiór pytań. Zawarte
w ankiecie pytania powinny charakteryzować się rozłącznością, a
sugerowane warianty (odpowiedzi) wyczerpywać cały zbiór możliwych
odpowiedzi.
Przy zbieraniu danych za pomocą arkusza ankietowego niezmiernie
ważnym problemem jest to, aby został on właściwie zredagowany. Źle
sformułowane pytania powodują na ogół niewłaściwe odpowiedzi.
Sporządzenie dobrego formularza sprawia zazwyczaj dużo kłopotów,
dlatego przy jego redagowaniu należy stosować następujące zasady:
– pytania powinny być formułowane jasno i krótko, w sposób nie budzący
wątpliwości, a otrzymane odpowiedzi powinny być jednoznaczne,
– pytań powinno być możliwie mało; trzeba się ograniczyć do pytań
koniecznych z punktu widzenia prowadzonego badania, gdyż wielka
liczba pytań nuży wypełniającego formularz,
– pytania powinny być zrozumiałe, aby nie nastręczały zbytnich trudności
przy udzielaniu odpowiedzi,
– najlepiej formułować pytania tak, aby odpowiedź mogła brzmieć “TAK”
lub “NIE”,
– należy unikać pytań, które umożliwiałyby tendencyjność odpowiedzi
oraz pytań drażliwych, wymagających odpowiedzi poufnych,
– pytania należy uszeregować według jakiegoś porządku logicznego, aby
odpowiadający mógł zrozumieć cel badania,
– pytania powinny zostać uporządkowane pod kątem łatwości opracowania
zebranego materiału, co jest szczególnie ważne przy układaniu tablic
statystycznych,
– w formularzu konieczne jest umieszczenie pytania kontrolnego, które
mogłoby świadczyć o prawidłowości odpowiedzi,
– należy zadbać o stosowną formę formularza i odpowiedni druk.
Do formularza ankietowego zwykle dołącza się objaśnienia. Jeśli są
one krótkie, umieszcza się je bezpośrednio przy pytaniu. Jeśli pytanie
wymaga dodatkowego, dłuższego objaśnienia lub nawet podania przykładu
odpowiedzi, należy objaśnienie umieścić osobno, na końcu formularza.
Objaśnienia powinny obejmować m.in. informację, kto i kiedy ma
formularz wypełnić oraz kto i komu powinien go przekazać. Badania
ankietowe mogą być prowadzone w kilku formach, jako: wywiady
6
Jedynie w niektórych przypadkach stosuje się badanie pełne, przykładem były Spisy
Powszechne i Rolne, kiedy badaniu poddawało się całą zbiorowość statystyczną, chociaż
odpowiedzi na zadane w ankiecie pytania formułowali z reguły przedstawiciele
gospodarstw domowych.
16
D. WITKOWSKA,
bezpośrednie, ankiety komercyjne, ankiety prasowe, ankiety pocztowe, czy
prowadzone przez Internet.
W badaniach z użyciem kwestionariuszy źródłem informacji jest
wypowiedź badanej osoby odnośnie zjawiska będącego przedmiotem badań.
Dlatego zasadniczą sprawą jest redakcja formularza. W związku z tym
sporządzony projekt kwestionariusza wywiadu powinien być poddany
weryfikacji merytorycznej i formalnej. Dokonuje się tego zwykle w toku
badań próbnych (pilotażowych). Zadaniem tego typu badań jest eliminacja
błędów występujących w konstrukcji kwestionariusza i dostosowanie go do
celów i warunków ich przeprowadzania.
W badaniach ankietowych podstawowym problemem jest tzw. błąd
braku odpowiedzi, będący różnicą między wyznaczoną liczebnością próby a
liczbą otrzymanych ankiet, co ma miejsce zwłaszcza w sytuacji, gdy ankiety
są rozsyłane pocztą lub wręczane respondentom z prośbą o wypełnienie.
Dlatego też, zwłaszcza w przypadku złożonych ankiet, często wykorzystuje
się odpowiednio przeszkolonych ankieterów, których zadaniem jest
wypełnienie ankiety na podstawie udzielonych respondentowi pytań.
Badania ankietowe są bardzo rozpowszechnione ze względu na
relatywną łatwość ich przeprowadzenia. Za pomocą ankiet bada się np.:
stan zdrowotny młodzieży, poziom dobrobytu, strukturę gospodarstw
domowych, postawy konsumentów, popularność polityków, opinie na
tematy społeczne. W odróżnieniu od spisów, które dostarczają możliwie
pełnych informacji o badanym zjawisku, w ankiecie chodzi zawsze o
naświetlenie jakiegoś ściśle określonego zagadnienia. Warto jednak
podkreślić, że tego typu badania wymagają nie tylko wiele czasu, ale i
pochłaniają znaczne środki finansowe. Warunkiem bowiem uzyskania
wiarygodnych wyników badania jest nie tylko poprawnie zbudowanie
kwestionariusza, ale i odpowiedni dobór respondentów do próby, których
liczba musi uwzględniać oczekiwany poziom zwrotności ankiet.
Zapewnienie warunku pierwszego7 jest możliwe tylko jeśli posiadamy tzw.
operat losowania lub w przypadku przeprowadzenia odpowiednich analiz
poprzedzających badanie zasadnicze. Należy również określić szczegółowe
kryteria doboru elementów do próby badawczej, wraz z podaniem zasad ich
dobierania (np. losowanie warstwowe, dobór celowy). Drugi ze
wspomnianych warunków związany jest z dość powszechną awersją do
udziału w badaniach kwestionariuszowych, co wynika ze znacznego
wzrostu liczby badań tego typu, chociażby przez konieczność wypełnienia
7
O ile oczywiście badanie nie jest całkowite.
17
różnego rodzaju długich i zawiłych formularzy w wielu instytucjach np.
służby zdrowia (obowiązkowo przed badaniem lub zabiegiem), czy
finansowych (np. obowiązkowe określanie skłonności do ryzyka
inwestorów). Powoduje to niski poziom zwrotu ankiet, który jest
zróżnicowany w zależności od nośnika (np. Internet, telefon, poczta),
instytucji realizującej badanie lub wprowadzanych przez badaczy „zachęt”
(np. wypełnione ankiety uczestniczą w losowaniu nagród, albo respondenci
pobierają wynagrodzenie). Należy liczyć się z tym, że jeśli badanie nie jest
zlecone przez jednostkę nadrzędną (tzn. nie jest obowiązkowe) i nie
towarzyszą temu odpowiednie działania motywujące, to zazwyczaj
zwrotność kwestionariuszy wynosi od 5% do 30%.
Dodatkowo należy pamiętać, że uogólnianie otrzymanych wyników
badania na całą populację jest możliwe tylko w określonych warunkach
determinowanych m.in. sposobem doboru do próby. Dlatego badania
ankietowe o istotnym znaczeniu są zazwyczaj wykonywane przez
wyspecjalizowane instytucje (np.: Ośrodek Badania Opinii Publicznej OBOP, Centrum Badania Opinii Społecznej – CBOS).
Oprócz tego przy analizie materiałów uzyskanych na podstawie ankiety
należy zachować daleko idącą ostrożność. Wyciąganie zbyt pochopnych
wniosków i uogólnień jest bardzo niebezpieczne, gdyż zebrane dane
statystyczne odzwierciedlają jedynie opinię określonej grupy respondentów.
Reasumując, badania ankietowe – choć popularne, zwłaszcza przy
realizacji prac magisterskich i doktorskich – są niezmiernie trudne do
przeprowadzenia, bowiem ich wyniki mogą zostać podważone z powodu
zazwyczaj trudnych do obiektywnego i naukowego uzasadnienia przyjętych
na wstępie założeń badawczych (np. dotyczących kryterium i sposobu
doboru elementów do próby). Nie można też stwierdzić a priori jaka liczba
respondentów jest niezbędna, aby przeprowadzone badane było wiarygodne.
Zależy to bowiem od sposobu doboru próby badawczej, formy badania i
poziomu zwrotności ankiet. Co więcej, jeśli zwrot formularzy ankietowych
jest niepełny, to w celu utrzymania przyjętych zasad doboru do próby
badawczej, konieczne jest przeprowadzenie dodatkowych badań
ankietowych w celu spełnienia założeń dotyczących respondentów
uczestniczących w badaniu8, a to generuje dodatkowe koszty oraz wymaga
czasu. Zatem zanim przystąpi się do realizacji badania z udziałem
respondentów należy sprawdzić, czy nie da się osiągnąć celów badawczych
w oparciu o dane możliwe do pozyskania w inny sposób (niż badanie
kwestionariuszowe), np. poprzez przeszukiwanie stron internetowych.
Uwaga: samodzielne przeprowadzenie badania ankietowego, jest co
najwyżej prezentacją znajomości elementów warsztatu badawczego, ale nie
jest osiągnięciem na miarę doktoratu, a niska zwrotność ankiet nie stanowi
usprawiedliwienia dla nieudolnie przeprowadzonych badań. Poprawnie
przeprowadzone badanie tego typu jest pracochłonne i kosztowne, oraz
8
Takie dodatkowe działanie nie jest potrzebne jeśli przy zmniejszonej liczbie
respondentów (tj. tylko tych uczestniczących aktywnie w badaniu) zachowana została ich
struktura, co jest bardzo mało prawdopodobne.
18
D. WITKOWSKA,
obarczone wysokim ryzykiem.
5.
Grupowanie i prezentacja danych statystycznych
W wyniku obserwacji statystycznej otrzymujemy zbiór danych
liczbowych lub symbolicznych9, zwanych danymi statystycznymi, które
należy uporządkować. Systematyzacja materiału statystycznego jest
określana mianem grupowania statystycznego. Polega ono na (mniej lub
bardziej zróżnicowanym) podziale niejednorodnej zbiorowości na możliwie
jednorodne grupy według obranych kryteriów, charakteryzujących
poszczególne grupy, i odpowiednim zestawieniu danych statystycznych.
Klasyfikację jednostek zbiorowości statystycznej przeprowadza się
zazwyczaj według wybranych cech, których prawidłowa analiza jest
możliwa dopiero w ramach otrzymanych jednorodnych grup.
Podstawowymi czynnościami po dokonaniu segregacji materiału na grupy
jest zliczanie danych w poszczególnych grupach oraz prezentacja
opracowanego materiału w postaci szeregu statystycznego.
Szeregiem statystycznym nazywamy zbiór wyników obserwacji
uporządkowanych według określonych cech (kryteriów), których
miernikiem są zmienne. Inaczej mówiąc, szeregiem statystycznym
nazywamy ciąg liczbowy monotoniczny, ograniczony z góry i z dołu (tj.
taki, którego wyrazy występują tylko w pewnym przedziale wartości).
Szereg składa się zazwyczaj z dwóch kolumn, z których jedna podaje
wielkości cechy lub czas, druga zaś informuje o liczbie jednostek
przypadających na daną kategorię przedmiotów lub zjawisk lub mówi o ich
natężeniu występującym w danym czasie. Najczęściej wyróżnia się dwa
kryteria podziału szeregów:
– kryterium formalne, związane z budową szeregu, na podstawie którego
możemy wyodrębnić: szeregi szczegółowe, szeregi rozdzielcze i szeregi
kumulacyjne,
– kryterium merytoryczne, wynikające z typu badanej cechy
zbiorowości, wg którego wyróżnia się szeregi czasowe i szeregi
przestrzenne.
Podziały te jednak nie wykluczają się wzajemnie, gdyż np.: szereg
rozdzielczy może być jednocześnie szeregiem czasowym lub
9
Większość opracowań dotyczących porządkowania i prezentacji materiału statystycznego
odnosi się do danych liczbowych, ale metody ilościowe znajdują zastosowanie w wielu
różnych dyscyplinach badawczych, w tym również takich, gdzie analizie poddawane są
głównie dane jakościowe.
19
przestrzennym.
Szeregiem szczegółowym nazywamy uporządkowany, wyłącznie
według wartości badanej cechy, zbiór danych. Porządkowanie polega na
ustawieniu wartości określonej cechy danej zbiorowości lub próby według
kolejności rosnącej lub malejącej. Szereg szczegółowy obejmuje wartości
zmiennych występujących u wszystkich jednostek badanej zbiorowości.
Szeregiem szczegółowym jest np. lista płac, pod warunkiem, że przy
umieszczaniu na niej poszczególnych osób zastosowano określone
kryterium porządkowe. Duża przydatność szeregu szczegółowego tkwi w
tym, że daje on całkowity materiał statystyczny, od którego można
rozpocząć pracę badawczą. Jest on jednak mało przejrzysty, dlatego stosuje
się go tylko w tych przypadkach, gdy zależy nam na dużej dokładności, a
liczba obserwacji jest stosunkowo niewielka.
Chcąc właściwie scharakteryzować zebrany materiał statystyczny,
rozdziela się wszystkie wartości zmiennej X na klasy (grupy) pod względem
różnych wartości, jakie przybiera u poszczególnych jednostek badanej
zbiorowości interesująca nas cecha. W ten sposób otrzymuje się tak zwany
szereg rozdzielczy. Innymi słowy, szereg rozdzielczy przedstawia
empiryczny rozkład zmiennej, której wartości charakteryzują poszczególne
warianty badanej cechy statystycznej. Dla cechy skokowej jest to rozkład
punktowy, a dla cechy ciągłej jest to rozkład przedziałowy (ciągły).
Szeregiem rozdzielczym nazywamy uporządkowany i pogrupowany
(według przyjętych kryteriów) zbiór informacji dotyczących badanej cechy
występującej w określonej zbiorowości lub próbie. Otrzymuje się go dzieląc
zbiorowość statystyczną na klasy zbiorcze według pewnej cechy i podając
liczebności każdej z tych klas, zwane liczebnościami klasowymi ni,
i=1,2,...,k. Szeregi rozdzielcze mogą dotyczyć zarówno cechy jakościowej,
jak i ilościowej. Charakteryzują one strukturę danej zbiorowości stąd
nazywane są czasem szeregami strukturalnymi.
Grupując materiał badawczy, rozpatruje się wszystkie możliwe
warianty badanych cech statystycznych xi. W przypadku cech jakościowych
i mierzalnych skokowych, poszczególne warianty badanych cech xi można
wymienić jako: x1, x2,...,xk. W przeciwieństwie do cech ciągłych, które mogą
przyjmować nieskończenie wiele wartości xi ∈ <xmin, xmax>, a więc nie
można ich wszystkich wymienić. W takim przypadku tworzy się klasy
dzieląc obszar zmienności10: (xmin - xmax) cechy na tzw. przedziały klasowe,
określone przez ich dolną - xid i górną - xig granicę. Różnicę między
wartością xig - xid, nazywamy rozpiętością przedziału klasowego.
Przedziały klasowe zawierające po kilka wariantów badanej cechy
można również utworzyć dla cech skokowych. Tworzenie przedziałów
klasowych dla tego typu cech może być wynikiem grupowania
statystycznego, kiedy to z powodu dużej liczby wariantów cechy
decydujemy się na agregację niektórych z nich w klasy lub też może zostać
10
Obszar zmienności (rozstęp) cechy, definiowany jest jako różnica między najwyższą a
najniższą wartością należącą do danego szeregu, czyli: xmax - xmin.
20
D. WITKOWSKA,
narzucone jeszcze w trakcie zbierania danych statystycznych, kiedy to
zgodnie z celem badania w formularzu ankietowym pytamy się nie o
konkretne warianty danej cechy, a o przynależność do z góry określonych
przedziałów.
Przykład 8
Badając zakłady pracy z punktu widzenia liczby osób w nich
zatrudnionych można pytać o dokładną liczbę pracowników lub prosić o
wskazanie do jakiej grupy przedsiębiorstw dany zakład pracy należy,
uprzednio formułując odpowiednie przedziały klasowe np. do 5
pracowników, od 6 do 10, od 11 - 50, od 51 do 100 oraz powyżej 100
pracowników.
W pierwszym przypadku budując szereg statystyczny możliwe jest
wyodrębnienie konkretnej liczby pracowników występujących w badanych
zakładach pracy np. xi = 1, 2, 5, 10, 11, 19, 26, 50, 57, 72, 85, 100, 137.
Wówczas szereg rozdzielczy wyglądałby następująco:
Tabela 2
Szereg rozdzielczy z wyróżnionymi wariantami cechy skokowej,
opisującej liczbę zatrudnionych w badanych zakładach pracy
Wartości
1 2 5 10 11 19 26 50 57 72 85 100 137
cechy xi
Liczebności 1 1 6 7 12 7 14 21 15 17 14 2
1
ni
Źródło: Dane umowne
W drugiej sytuacji oczywiste jest, że w szeregu statystycznym nie
będzie się wyróżniać poszczególnych wariantów badanej cechy
statystycznej (brak stosownych danych), a jedynie przedziały w jakich może
się ona znajdować, czyli:
Tabela 3
Szereg rozdzielczy ze skumulowanymi wariantami cechy skokowej,
opisującej liczbę zatrudnionych w badanych zakładach pracy
Wartości
do 5
6-10 11-50 51-100
101 i
cechy xi
pracowników
więcej
Liczebności
8
7
54
48
1
ni
Źródło: Dane umowne
21
Oczywiście tabelę 3 można zbudować na podstawie danych
statystycznych zawartych w tabeli 2 poprzez ustalenie odpowiednich
przedziałów klasowych. Na podstawie tabeli 2 można również zbudować
inne szeregi rozdzielcze odpowiednio agregując dane indywidualne w nim
zawarte oraz odpowiadać na różne pytania szczegółowe (np. ile zakładów
pracy zatrudniało powyżej 20 pracowników), podczas gdy mając dane
statystyczne postaci 3, charakteryzujące strukturę badanych zakładów pracy
z punktu widzenia stanu zatrudnienia, nic więcej z nich się już nie odczyta,
bowiem niemożliwe jest przejście z tabeli 3 do danych zdezagregowanych
postaci
Ã
W przypadku badania cech jakościowych zazwyczaj wyróżnia się tyle
wariantów cech, ile jest koniecznych do realizacji celu badania. Czasem
jednak okazuje się, z reguły w trakcie opracowywania materiału
statystycznego, że pewne warianty cechy występują bardzo rzadko i
merytorycznie uzasadniona jest agregacja niektórych jej wariantów.
Wówczas można utworzyć klasy zawierające po kilka wariantów badanej
cechy, ponieważ oddzielne ich rozpatrywanie nie ma większego sensu.
Przykład 9
Rozważmy sytuację, kiedy badając opinie respondentów na wybrany
temat proponujemy kilka wariantów oceny: bardzo zła, zła, przeciętną,
dobra i bardzo dobra, a analizując zebrany materiał decydujemy się na
prezentację wyników badań w kategoriach ocen: negatywna (tj. bardzo zła i
zła), przeciętna i pozytywna (dobra i bardzo dobra). Warto w tym miejscu
wspomnieć o tzw. rangowaniu cech jakościowych, polegającym na tym,
że konkretnym wariantom cechy przypisuje się pewne charakterystyki
liczbowe zwane rangami. Dla omawianego przykładu badania opinii
respondentów można zastąpić słowny opis wariantów cechy, ocenami
punktowymi wyrażając skalę ocen w postaci np. od 1 do 5, gdzie 3 jest
równoznaczne ocenie przeciętnej lub skalę ocen -2, -1, 0, 1, 2, gdzie zero
oznacza swego rodzaju neutralny stosunek respondenta do badanego
zjawiska.
Ã
Budując szeregi rozdzielcze należy zdecydować o liczbie klas, ich
rozpiętości i sposobie określania granic przedziałów. Należy pamiętać, że
dobra klasyfikacja powinna spełniać dwa podstawowe warunki:
– musi być przeprowadzona w sposób rozłączny, co oznacza, że
poszczególne jednostki o określonych cechach powinny być w sposób
jednoznaczny przydzielone do poszczególnych klas (grup),
– musi być przeprowadzona w sposób zupełny, co oznacza, że klasy
powinny objąć wszystkie cechy występujące w danej zbiorowości. W
przeciwnym razie konieczne jest tworzenie klas zbiorczych, ujmujących
te cechy, które mają istotne znaczenie z punktu widzenia celu badania.
22
D. WITKOWSKA,
Tabela 4
Przykład szeregu rozdzielczego
Nr klasy Wartość zmiennej Liczebność klasy
(przedziały klasowe)
i
ni
(xid ; xig >
1
n1
(x1d ; x1g >
2
n2
(x2d ; x2g >
...
...
...
k
n
k
(xkd ; xkg >
W praktyce wybór liczby klas zależy od liczby obserwacji i od
charakteru danych. Należy ustalić takie przedziały klasowe, które obejmują
wszystkie dane oraz zadbać o to, aby każda jednostka mogła trafić tylko do
jednej klasy. Również ważną rolę odgrywa liczebność w przedziale
klasowym, gdyż zarówno mała liczba obserwacji podzielona na wiele klas,
jak i duża podzielona na nieliczne klasy nie ujawni obrazu struktury
zgodnego z rzeczywistością. Często postuluje się stosowanie następującej
zasady przy ustalaniu liczby klas w zależności od liczebności badanej
zbiorowości11 (tabela 5):
Tabela 5
Postulowana liczebność przedziałów klasowych w zależności od
liczebności próby
Liczba obserwacji (n) Liczba zalecanych klas (k)
40 - 60
6 -8
60 - 100
7 –10
100 - 200
9 –12
200 - 500
12 –17
Długość przedziału należy dobierać w taki sposób, aby wartości cechy
oscylowały wokół punktu środkowego klasy. Konstruowanie szeregu
rozdzielczego polega przede wszystkim na właściwym doborze wielkości
przedziału klasowego, przy ustalaniu którego należy wziąć pod uwagę
pewne kryteria (nie zawsze jednolite), pozwalające w prawidłowy sposób
ustalić strukturę badanej zbiorowości. Przy doborze przedziałów klasowych
11
Przy tworzeniu szeregów rozdzielczych, G. U. Yule i J. S. Neyman zalecają na ogół
podział całej zbiorowości na niewielką liczbę klas, około 10 -.
23
powinno się dążyć do tego, aby szereg rozdzielczy dawał możliwie
szczegółowy i przejrzysty obraz struktury zbiorowości statystycznej z
punktu widzenia celu badania.
Poza wielkością przedziałów, duży wpływ na rozkład liczebności ma
również przyjęcie odpowiedniej wartości dolnej granicy pierwszej klasy.
Gdy przedziały klasowe oznaczone są w taki sposób, że górna granica
przedziału poprzedzającego jest równa dolnej granicy przedziału następnego
(- przedziały otwarte), wówczas przyjmuje się zwykle, że wartości cechy
odpowiadające górnej granicy przedziału zalicza się do przedziału
następnego. Liczebności przedziałów klasowych mogą być wyrażone w
liczbach bezwzględnych (absolutnych) lub w liczbach względnych, tj. w
stosunku do liczebności całej zbiorowości (najczęściej w procentach). W
tym przypadku mamy do czynienia z liczebnością względną (częstością
względną) inaczej nazywaną wskaźnikiem struktury. Liczebności
względne stanowią jedną z form opisu rozkładu danej cechy, ułatwiają
również porównywanie struktury zbiorowości.
Reasumując, budując szeregi rozdzielcze możemy rozpatrywać albo
poszczególne warianty skokowych cech statystycznych, mówimy wtedy o
tzw. przedziałach klasowych jedno-jednostkowych, albo można formułować
przedziały klasowe dla cechy ciągłej, a także obejmujące po kilka
wariantów cechy skokowej, czyli tzw. przedziały wielo-jednostkowe. W
niektórych przypadkach wygodnie jest analizować cechy będące ze swej
natury cechami ciągłymi jako cechy skokowe, wówczas zamiast całego
przedziału podaje się zazwyczaj środek przedziału x!i (gdzie x!i = xig − xid ),
albo jego górną xig (jeśli szereg uporządkowany jest rosnąco) lub dolną xid
(dla szeregu malejącego) granicę. Przykładami cech ciągłych definiowanych
w postaci cech skokowych mogą być: staż pracy podany w pełnych latach
mierzonych od dnia zatrudnienia, czas dojazdu do pracy zaokrąglony do
pełnych minut, wydatki na zakup określonych dóbr zaokrąglone do pełnych
złotych lub setek złotych itd.
W praktyce wyróżnia się również szeregi rozdzielcze kumulacyjne,
które powstają przez dodanie liczebności kolejnych przedziałów i obliczając
procent liczebności kumulowanych w stosunku do liczebności całego
zbioru. Szeregi kumulacyjne informują, dla ilu jednostek badanej
zbiorowości zmienna przybiera wartości mniejsze od górnej granicy
konkretnego przedziału (szereg kumulacyjny rosnący), lub dla ilu jednostek
statystycznych zmienna przyjmuje wartości większe od dolnej granicy
określonego przedziału (szereg kumulacyjny malejący - kumulacyjny
rozkład malejący).
Podawane w szeregach statystycznych liczebności względne tzw.
wskaźniki struktury wi odpowiadają prawdopodobieństwu pojawienia się
określonego wariantu cechy w badanej zbiorowości. Natomiast
skumulowane wskaźniki struktury, opisujące częstość względną dla
wszystkich wariantów cechy mniejszych od górnej granicy wybranego
przedziału, czyli { xi: X < xi} nazywane są dystrybuantą empiryczną.
24
D. WITKOWSKA,
Szeregi statystyczne mogą przedstawiać badaną zbiorowość w układzie
statycznym, charakteryzując jej stan w ściśle określonym momencie (np.
w określonym dniu, miesiącu, roku). Zmiany zbiorowości lub zjawisk
w pewnym okresie opisują tzw. szeregi czasowe. Powstają one, gdy
podstawą grupowania jest czas, a celem badania jest analiza zmian pewnego
zjawiska w czasie (np. produkcja przemysłu w latach 1990 - 1995). Tak
więc szeregi czasowe przedstawiają badaną zbiorowość w układzie
dynamicznym.
Szeregi przestrzenne (geograficzne), opisują rozmieszczenie pewnych
zjawisk w przestrzeni (części świata, państwa, regiony gospodarcze,
jednostki administracyjne). Budując szereg przestrzenny można (podobnie
jak przy szeregach rozdzielczych) dzielić zbiorowość na większą lub
mniejszą liczbę grup (klas) w zależności od przyjętej jednostki terytorialnej.
Oprócz tabelarycznej formy prezentacji zebranego materiały
statystycznego (w postaci szeregów statystycznych), często stosuje się
prezentację graficzną w postaci wykresów, diagramów itp. Poniżej
przedstawiono przykład graficznej prezentacji dwóch szeregów czasowych
dotyczących miesięcznych przychodów i kosztów pewnej firmy w okresie
styczeń 1995 - maj 1997.
12
koszty
10
przychody
tys. zł
8
6
4
V
III
I
XI
IX
VII
miesiąc
V
III
I
XI
IX
VII
V
I
0
III
2
Źródło: Dane umowne.
Rys. 1. Przychody i koszty firmy X w okresie styczeń 1995 - maj 1996
Prezentacja graficzna materiału statystycznego stanowi uzupełnienie
formy tabelarycznej, bowiem mnogość danych zawartych w szeregach
statystycznych często jest mało czytelna, wówczas wygodnie jest korzystać
25
z różnego typu wykresów.
6.
Przykład badania statystycznego
W niniejszym rozdziale omówimy przykład12 badania statystycznego,
które zostało przeprowadzone w lipcu i sierpniu 1995r. na terenie Łodzi
i wybranych miast województwa łódzkiego, którego celem była analiza sieci
dystrybucji produktów chemii gospodarczej i spożywczej. Materiał
statystyczny został zebrany za pomocą specjalnie skonstruowanej ankiety,
którą wypełniali przeszkoleni w tym celu ankieterzy (metoda wywiadu
osobistego). Ankietę przeprowadzono w hurtowniach oraz sklepach branży
chemicznej i spożywczej. Innymi słowy, jednostkami statystycznymi w tym
badaniu były punkty sprzedaży o określonej branży. Brak danych (ze
względu na duże koszty uzyskania informacji z systemu Regon)
obejmujących badaną populację spowodował, że nie zostało
przeprowadzone formalne losowanie próby z populacji generalnej. Dobór
jednostek do próby odbył się na zasadzie łatwości dostępu. Oznacza to, że
ankieterzy w badaniu uwzględnili tylko te jednostki, do których mogli
dotrzeć i w których wyrażono chęć udzielenia odpowiedzi na zadawane
pytania.
Analiza sieci dystrybucji została przeprowadzona dla następujących
cech jakościowych: rodzaj punktu sprzedaży, branża, typ własności,
charakter punktu sprzedaży, forma sprzedaży, ocena lokalizacji placówki,
formy aktywizacji sprzedaży stosowane w ankietowanym punkcie
sprzedaży, kryteria wyboru dostawcy i potrzeba wprowadzenia na rynek
produktów ekologicznych oraz dla kilku cech ilościowych, a mianowicie:
liczby pracowników, wartości rocznego obrotu oraz powierzchni sprzedaży.
Badaniu poddano 501 punktów sprzedaży na terenie Łodzi, przy czym
z powodu braków odpowiedzi na niektóre pytania w analizach
uwzględniono 494 ankiety, które stanowiły pierwotne źródło informacji na
temat sieci dystrybucji w pięciu dzielnicach miasta. Badaniem objęto
również 414 placówek handlowych Pabianic, Zgierza, Ozorkowa,
Aleksandrowa i Konstantynowa Łódzkiego. Uzyskany materiał statystyczny
został poddany grupowaniu i zliczaniu.
Jak wspomniano, jedno z pytań umieszczonych w ankiecie dotyczyło
oceny lokalizacji punktów sprzedaży. Jest to przykład cechy niemierzalnej,
odzwierciedlającej opinie respondentów. Wyróżniono pięć możliwych ocen,
które wraz z liczbą odpowiedzi wskazujących na wybrany przez
respondentów wariant tej cechy przedstawiono w szeregu rozdzielczym.
12
Wyniki badań syntetycznie przedstawiono w pracach: Witkowska D., Witkowski J.,
Analiza sieci dystrybucji produktów chemii gospodarczej i spożywczej w Łodzi, Studia
Prawno - Ekonomiczne, Tom LV, 1997, s. 247 -259 oraz Witkowska D., Witkowski J.,
Analiza sieci dystrybucji produktów spożywczych i chemicznych w miastach województwa
łódzkiego (bez Łodzi), Studia Prawno - Ekonomiczne, t. LVI, 1997, s. 311-323.
26
D. WITKOWSKA,
Tabela 6
Ocena lokalizacji punktów sprzedaży
Ocena lokalizacji Liczba punktów sprzedaży
bardzo dobra
42
dobra
178
przeciętna
213
zła
41
bardzo zła
20
Źródło: Dane ankietowe
Inną badaną cechą była liczba osób zatrudnionych w ankietowanych
punktach sprzedaży, która jest przykładem cechy ilościowej skokowej. Dla
tej cechy określono przedziały klasowe już w trakcie badania ankietowego
(przy czym ostatni z przedziałów klasowych jest otwarty), co wynikało z
przyjętego podziału placówek handlowych.
Tabela 7
Liczba pracowników w badanych punktach sprzedaży w Łodzi
Liczba
pracowników
do 3
3-4
5 -8
powyżej 8
Liczba punktów
sprzedaży
290
85
42
77
Liczebności
skumulowane
290
375
417
494
Podane w ostatniej kolumnie liczebności skumulowane pozwalają
odpowiedzieć na pytanie: ile przebadanych jednostek zatrudniało
pracowników poniżej wartości górnej granicy przedziału. Przykładowo, w
375 przebadanych punktach handlowych zatrudniano do czterech
pracowników, podczas gdy w 290 placówkach zatrudniona była jedna lub
dwie osoby.
Kolejna tabela jest przykładem szeregu rozdzielczego, w którym
badanie dotyczyło cechy ciągłej, a liczebności podane zostały w liczbach
bezwzględnych i względnych (wskaźniki struktury), określających
procentowy udział jednostek charakteryzujących się określonym wariantem
cechy w całej badanej zbiorowości. W szeregu tym podano również
27
liczebności skumulowane.
Tabela 8
Powierzchnia badanych punktów sprzedaży w Łodzi
Powierzchnia
sprzedaży
(m2)
0 - 25
25 - 50
50 - 75
75 - 100
100 - 125
125 - 150
150 - 175
175 - 200
200 - 400
400 - 600
600 - 800
Suma
Liczba
punktów
sprzedaży
93
131
105
39
47
5
12
5
31
15
11
494
Liczebności
skumulowane
93
224
329
368
415
420
432
437
468
483
494
×
Wskaźniki
struktury
(%)
18,8
26,5
21,3
7,9
9,5
1,0
2,4
1,0
6,3
3,0
2,2
99,9 ≈ 100
Skumulowane
liczebności
względne (%)
18,8
45,3
66,6
74,5
84,0
85,0
87,4
88,4
94,7
97,7
99,9
×
Analizując dane zawarte w tabeli 8 widać, że skonstruowano przedziały
klasowe o różnej długości. Do 200 m2 rozpiętość przedziałów wynosi 25m2,
natomiast punkty sprzedaży posiadające powyżej 200 m2 klasyfikowano dla
przedziałów klasowych o rozpiętości 200 m2 . Wynikało to z faktu, że dane
te były szacunkowe, a w przypadku małej powierzchni większą wagę
przykłada się do każdego “metra” niż przy dużej powierzchni. Ponadto
obiekty handlowe o powierzchni do 200 m2 stanowiły 88,4% wszystkich
przebadanych jednostek, podczas gdy w ostatnim przedziale klasowym
znalazło się jedynie 11 analizowanych punktów sprzedaży, co stanowiło
2,2% ankietowanych obiektów handlowych.
Ostatni wiersz w tabeli 8 spełnia funkcje kontrolne, podając sumę
jednostek statystycznych, które zostały wyróżnione z punktu widzenia
konkretnych wariantów analizowanej cechy. Jak widać w przypadku
liczebności bezwzględnych suma jednostek równa jest liczbie ankiet,
natomiast w przypadku liczebności względnych mamy do czynienia z
błędem zaokrągleń (suma wynosi 99,9%, a nie 100%). Błąd ten jest tym
większy, im więcej wariantów danej cechy rozpatrujemy, niemniej jednak
nie powinien on przekraczać 0,3%. Podając liczebności skumulowane,
liczebność całej badanej zbiorowości uzyskujemy dla ostatniego wariantu
cechy, stąd dla kolumn wyrażających liczebności skumulowane nie
wypełnia się już danych w wierszu “Suma”, co oznaczono symbolem (×).
Przedstawione w tabeli 8 dane dotyczące powierzchni sprzedaży można
pogrupować w inny sposób, biorąc pod uwagę częstotliwości występowania
placówek handlowych o określonej powierzchni. Jak widać, 85% placówek
28
D. WITKOWSKA,
ma powierzchnię mniejszą niż 150 m Zbudujmy więc przedziały klasowe o
różnej rozpiętości i skonstruujmy na podstawie danych z tabeli 8. inny
szereg statystyczny.
Tabela 9
Powierzchnia badanych punktów sprzedaży w Łodzi
Powierzchnia
sprzedaży (m2)
0 - 50
50 - 100
100 - 150
150 - 200
200 - 800
Suma
Liczba
punktów
sprzedaży
224
144
52
17
57
494
Liczebności
skumulowane
224
368
420
437
494
×
Wskaźniki
struktury
(%)
45,3
29,2
10,5
3,4
11,5
99,9 ≈ 100
Skumulowane
liczebności
względne (%)
45,3
74,5
85,0
88,4
99,9
×
Źródło: Tabela 8
Jak widać, tabela 9 powstała poprzez zmianę długości przedziałów
klasowych (agregację danych), ale wciąż zawiera te same dane statystyczne,
co łatwo prześledzić na przykładzie liczebności skumulowanych.
Przedstawione dane statystyczne można również przedstawić na wykresach.
Pow ierzchnia punktów sprzedaży
250
Liczebność
200
150
100
50
0
0 - 50
50 - 100
100 - 150
150 - 200
Pow ierzchnia (m2)
200 - 800
Rys. 2. Wykres kolumnowy dla danych z tabeli 9.
Powyższy wykres przedstawia liczebności bezwzględne dla wyznaczonych
przedziałów klasowych.
29
Pow ierzchnia punktów sprzedaży
0 - 50
50 - 100
100 - 150
150 - 200
200 - 800
Rys. 3. Wykres kołowy danych z tabeli 9
Wykres kołowy obrazuje liczebności względne wyróżnionych
wariantów powierzchni sprzedaży. Natomiast przedstawiony na rysunku 4
wykres radarowy wskazuje na “nasycenie” poszczególnych wariantów
cechy wyrażone liczbą punktów sprzedaży charakteryzujących się
określonym wariantem badanej cechy. Wszystkie typy wykresów
przedstawione na rysunkach 1 - 4 są standardowymi wykresami
oferowanymi w pakiecie EXCEL i mogą zostać wzbogacone dodatkowymi
objaśnieniami.
Powierzchnia punktów sprzedaży
0-50
300
200
200-800
100
50-100
0
150-200
100-150
Rys. 4. Wykres radarowy danych z tabeli 9
Jak wcześniej wspomniano, zdefiniowanie niektórych cech jako ciągłe
lub skokowe może być dość umowne i w większym stopniu wynika z celu
badania, a co za tym idzie z formy prezentacji danych niż z samej “natury”
konkretnej cechy. Za przykład posłuży nam badanie powierzchni punktów
sprzedaży, zaokrąglonej do pełnych m2, co przedstawia poniższa tabela:
30
D. WITKOWSKA,
Tabela 10
Powierzchnia punktów sprzedaży w 40 badanych placówkach
handlowych w Ozorkowie
Powierzchnia
sprzedaży (m2)
17
20
25
26
27
30
32
40
Liczba punktów
sprzedaży
1
3
2
1
1
4
1
1
Powierzchnia
sprzedaży (m2)
45
50
52
60
70
80
100
400
Liczba punktów
sprzedaży
2
5
2
4
6
4
2
1
Jak łatwo zauważyć, analiza danych zawartych w tabeli 10 jest dość
trudna, a zbyt szczegółowa prezentacja wyników badania nie pozwala na
analizę struktury placówek handlowych z punktu widzenia wyróżnionej
cechy. Dlatego należałoby odpowiednio zagregować warianty cechy,
tworząc przedziały klasowe, aczkolwiek ich granice i rozpiętość muszą być
zupełnie inne niż dla obserwacji prezentowanych w tabelach 8 i 9,
chociażby dlatego, że 39 placówek handlowych w Ozorkowie (co stanowi
97,5%) miało powierzchnię mniejszą lub równą 100 m
W kolejnej tabeli podano przykład szeregu przestrzennego, w którym
przeprowadzona analiza dotyczyła cechy niemierzalnej, jaką była stosowana
forma sprzedaży.
Tabela 11
Stosowane formy sprzedaży w badanych placówkach handlowych na terenie
pięciu dzielnic Łodzi
Formy
Dzielnice
Łodzi
sprzedaży
Widzew Śródmieście Polesie Górna Bałuty ogółem
tradycyjna
52
84
99
48
151
434
samoobsługowa
8
7
7
2
10
34
inne
2
1
9
1
13
26
Suma
62
92
115
51
174
494
31
Przedstawione w tabeli 11 dane umożliwiają terytorialną analizę
zróżnicowania stosowanych form sprzedaży. W ostatnim wierszu podano
liczbę przebadanych jednostek w każdej z dzielnic, a ostatnia kolumna
informuje, ile obiektów handlowych w całej przebadanej zbiorowości
stosowało konkretną formę sprzedaży.
32

Dorota Witkowska Metody ilościowe w badaniach społeczno

Transkrypt

Podobne dokumenty

Temat: Metody badań statystycznych

Zbiorowości i grupy społeczne

Cw nr 5: Zadania do statystyki opisowej + odpowiedzi

Przedmiot statystyki - Politechnika Śląska

Statystyka_1_2011 [tryb zgodnoœci]

Plebiscyt na najlepszy spektakl I Festiwal Spektakli dla Dzieci „Na

Badania ilościowe w ewaluacji

SYLABUS SOCJOLOGII.Wykłady 2007-2008

Zakład Socjologii Zbiorowości Terytorialnych

mobbing molestowanie seksualne dyskryminacja