Badania sondażowe3(4). - E-SGH

Transkrypt

Badania sondażowe3(4). - E-SGH
Badania sondażowe
Schematy losowania
Agnieszka Zięba
Zakład Badań Marketingowych
Instytut Statystyki i Demografii
Szkoła Główna Handlowa
1
Próba
jako miniatura populacji
CELOWA
subiektywny dobór
jednostek do badania
LOSOWA
schemat losowy doboru
jednostek do badania
(wnioski z badania wyciągane są dla
populacji, jednak reprezentatywności
próby nie można udowodnić)
(wnioski z badania wyciągane są dla
populacji, a reprezentatywność próby
można naukowo udowodnić)
2
Cechy doboru losowego
W czasie losowania elementy populacji nie przemieszczają się
Dostęp do każdego elementu populacji jest jednakowy
Elementy populacji są „wymieszane”, lub kryteria ich uporządkowania są
znane, a zmienne porządkujące są zawarte w operacie
Próba ma charakter losowy gdy:
przyjęte kryterium doboru jednostek jest niezależne od badanych cech
każda jednostka zbiorowości ma różne od zera prawdopodobieństwo
znalezienia się w próbie
3
Techniki losowania
4
Metoda reprezentacyjna
Metoda reprezentacyjna – zajmuje się badaniami statystycznymi, w których
zamiast populacji bada się próbę, której reprezentatywność można naukowo
uzasadnić.
Obejmuje między innymi:
Techniki losowania
Estymację parametrów za pomocą których jesteśmy w stanie opisać
populację
Estymację błędów losowych szacowanych parametrów
5
Schemat losowania
Schemat losowania (plan losowania) – to sposób postępowania
prowadzący przy użyciu określonych technik losowania do
wyboru losowego jednostek do badania.
Wybór schematu losowania zależy od:
Posiadanych informacji o populacji
Kosztów badania
Warunków organizacyjno - technicznych
6
Kryteria sposobów losowania
Kryterium 1
- indywidualne – jednostka losowania to konkretna osoba z którą przeprowadzony zostanie wywiad
- zespołowe – jednostka losowania to grupa osób, z którymi przeprowadzony zostanie wywiad
PRZYKŁAD: losowanie indywidualne dla sklepów, zespołowe dla klientów tych sklepów
Kryterium 2
- niezależne (ze zwracaniem) – proste – prawdopodobieństwo wylosowania każdej jednostki jest identyczne
- zależne (bez zwracania) – prawdopodobieństwo wylosowania maleje w miarę losowania kolejnych jednostek
Kryterium 3
- z jednakowymi prawdopodobieństwami wyboru
- z różnymi prawdopodobieństwami wyboru
PRZYKŁAD: losowanie szpitali z prawdopodobieństwem proporcjonalnym do liczby pacjentów
Kryterium 4
- nieograniczone (jednostki pobierane równocześnie z całej zbiorowości – losowanie proste)
- ograniczone (jednostki pobierane są z części zbiorowości – losowanie warstwowe, systematyczne)
Kryterium 5
- jednostopniowe
- wielostopniowe
PRZYKŁAD: losowanie komisów samochodowych w 3 etapach – województwa – powiaty – komisy
7
Próba prosta
Próba, o której była mowa na statystyce to tzw. próba prosta,
która powstała w wyniku losowania:
jednostopniowego
indywidualnego
nieograniczonego
niezależnego (ze zwracaniem)
z jednakowym prawdopodobieństwem wyboru każdej jednostki
Schematy losowania stosowane w badaniach ekonomiczno –
społecznych to modyfikacje tego losowania.
Otaczająca rzeczywistość ma złożoną strukturę i dlatego są
potrzebne adekwatne do niej schematy losowania.
8
Techniki losowania
Dobór losowy bez zwracania
Dobór losowy ze zwracaniem
Dobór systematyczny
Losowanie nieograniczone –
wylosowanie do próby pewnych
jednostek nie ogranicza
wylosowania innych jednostek
Losowanie ograniczone –
wylosowanie do próby pewnych
jednostek ogranicza
wylosowanie innych jednostek
Dobór warstwowy
Dobór zespołowy
Dobór wielostopniowy
Losowanie z jednakowym prawdopodobieństwem wyboru:
tzw. próby samoważące się
Losowanie z różnymi prawdopodobieństwami wyboru:
konieczność konstrukcji wag w dalszym etapie analiz
9
Dobór losowy
Dobór losowy ze zwracaniem
Dobór losowy bez zwracania (efektywniejszy)
Stosowany, gdy:
Brak jakichkolwiek informacji o populacji
Populacje nie są zbyt liczne
Przebiega przy użyciu tablic liczb losowych lub generatora liczb
losowych
Zalety
Próby wyważone automatycznie
Proste metody obliczania precyzji
Łatwy w realizacji
Wady
Dogodny tylko dla małych populacji
Wymaga operatu losowania
10
Dobór systematyczny
Wybór co k-tej jednostki zbiorowości generalnej
Jednostka wyjściowa jest losowana.
k=
N
n
Stosowany, gdy:
Populacja jest bardzo liczna
Populacja jest homogeniczna
Zalety
Można stosować gdy jest dostępny
operat lub go brak
Łatwe – wyznaczany jest tylko punkt
startowy i interwał
Jest tak samo efektywna jak próba
prosta lub efektywniejsza
Wady
Wymaga wymieszania listy jeśli
istnieje
Układ elementów może być poza
kontrolą badacza – może wystąpić
ukryty podział na warstwy
Próba uzyskana w wyniku losowania systematycznego może być bardziej efektywna
(dawać większą precyzję oszacowań) od losowania prostego, gdy jednostki posortowane
zostaną wg pewnych kryteriów (skorelowanych z cechą badaną) – równomierniej od innych
schematów losowania pokrywa populację generalną i analiza przebiega wtedy jak dla
losowania warstwowego z proporcjonalną do wielkości warstwy liczbą jednostek w próbie.
11
Dobór warstwowy
Stosowany, gdy:
Istnieją dodatkowe informacje o populacji
Populacje są bardzo liczne
Aby być pewnym, że grupy składające się na populacje są
właściwie reprezentowane w próbie
Zalety
Bardziej efektywne niż losowanie proste
W każdej warstwie można stosować
inną technikę losowania
Warstwowanie można przeprowadzić
po wylosowaniu próby
Ułatwia organizację badania
Wady
Wymagana jest znajomość struktury
populacji
Jest tym efektywniejsze im mniejsze jest
zróżnicowanie cechy wewnątrz warstw
Wymaga operatu losowania
Dzieląc populację na warstwy musimy dążyć do tego, aby cechy warstwujące
wykazywały:
znaczną jednorodność cechy badanej wewnątrz warstw oraz
znaczną różnorodność między warstwami!
12
Dobór warstwowy
Populacja
18-24
25-45
46-64
Podział na warstwy
Losowanie z warstw
13
Dobór warstwowy – czemu służy?
Zagrożenia w doborze losowym:
Nadreprezentatywność:
gdy do małej próby wejdą jednostki nietypowe, które nie powinny się tam znaleźć –
zaburzają bowiem ocenę parametru
Niedoreprezentatywność:
gdy w dużej próbie nie pojawi się taki element (nietypowy), którego brak istotnie
wpłynie na wartość szacowanego parametru
PRZYKŁAD – REGON (wielkość zatrudnienia wpływa na cechę badaną)
Firmy małe
0-9 zatrudnionych
1 800 tys.
Firmy średnie
10-249 zatrudnionych
160 tys.
Firmy duże
250+ zatrudnionych
4 tys.
100,0%
91,6%
80,0%
64%
średnie
duże
60,0%
40,0%
20,0%
małe
28%
8%
8,1%
0,2%
0,0%
liczba
zatrudnionych
Eliminacja tych zagrożeń odbywa się poprzez warstwowanie
(stratyfikację) oraz odpowiednią alokację próby w warstwach.
liczba telefonów
komórkowych
14
Jednostka losowania
Może być tożsama z jednostką badania, np.:
Osoba indywidualna
Gospodarstwo domowe
Przedsiębiorstwo
Instytucja
Może zawierać kilka jednostek badania tworząc zespół, np.:
Szkoły (w przypadku badania uczniów)
Szpitale (w przypadku badania pacjentów)
Sklepy (w przypaku badania klientów)
15
Dobór zespołowy
Stosowany, gdy:
Populacje są bardzo liczne
Istnieją informacje o podgrupach (zespołach)
gdy brak jest jakichkolwiek informacji o jednostkach populacji
Zalety
Umożliwia ograniczenie operatu tylko
do listy zespołów
Generuje mało rozproszone
terytorialnie próby – ułatwia
organizację badania
Obniża koszty badania
Wady
Złożony schemat losowania na ogół
dwustopniowy: zespoły i jednostki
Zazwyczaj zmniejsza efektywność
badania
Efektywny tylko gdy w próbie znajdzie
się duża liczba zespołów o małych
rozmiarach każdy
Dzieląc populację na zespoły musimy dążyć do tego, aby zespoły wykazywały:
znaczną różnorodność cechy badanej w zespołach oraz
jednorodność cechy badanej między zespołami
16
Dobór zespołowy
Populacja
I rejon stat. II rejon
Podział na zespoły
Losowanie zespołów
III rejon IV rejon V rejon
18-24
25-45
46-64
17
Dobór proporcjonalny
z różnym prawdopodobieństwem wyboru
Stosowany, gdy:
Populacje są bardzo liczne
Istnieją zespoły o zdecydowanie różnych rozmiarach
Zalety
Można stosować gdy istnieje operat
ograniczony tylko do zespołów
Uwzględnia strukturę populacji
Wady
Wymaga znajomości struktur populacji
Wykorzystuje informacje z przeszłości
Może wymagać przeważenia danych
18
Dobór wielostopniowy
Stosowany gdy zbiorowości są złożone i bardzo duże.
Populacja
I rejon stat. II rejon
Podział na zespoły
III rejon IV rejon V rejon
Podział na warstwy
Losowanie zespołów
Losowanie z warstw
18-24
25-45
46-64
19
Dobór wielostopniowy
PRZYKŁAD:
Szacowany jest odsetek sklepów odzieżowych w Polsce reklamujących swoje towary w
prasie.
Losowanie dwustopniowe:
ETAP I:
Operat 1: ZESPOŁY
lista powiatów (379) – losowanie z różnym prawdopodobieństwem wyboru jednostki do
próby – w zależności od liczby sklepów w powiecie
ETAP II:
PODZIAŁ NA WARSTWY: 5 warstw wg poziomu sprzedaży za ubiegły rok
Operat 2: JEDNOSTKI BADANE
lista sklepów – losowanie w warstwach – proporcjonalne do wielkości warstwy
UWAGA! Tak skonstruowana próba wymaga ważenia.
20
SPSS: Complex Samples
21