Badania sondażowe2(4). - E-SGH

Transkrypt

Badania sondażowe2(4). - E-SGH
Badania sondażowe
Dobór próby do badania
Rodzaje błędów w badaniach
Agnieszka Zięba
Zakład Badań Marketingowych
Instytut Statystyki i Demografii
Szkoła Główna Handlowa
1
Konstrukcja próby badawczej
2
Dobór respondentów do badania
Analityk musi rozumieć podstawowe zasady projektowania badania
sondażowego i umieć je tak modyfikować, by mogły służyć określonym celom.
Aby odpowiednio dobrać jednostki do badania niezbędna jest znajomość
pojęć takich jak:
Populacja
Próba
- losowa
- celowa
Operat losowania
Błędy w badaniu
- losowe
- nielosowe
3
Populacja
Wywiad z kwestionariuszem ankietowym służy po to, aby na podstawie
zgromadzonych za jego pomocą informacji możliwe było wnioskowanie o
interesującej nas zbiorowości, czyli POPULACJI.
POPULACJA – wynika z celu badania, jest to zbiorowość, której jednostki
mają jedną cechę wspólną, zaś pozostałe – różne. Populacja musi być
określona precyzyjnie.
Przykład:
Rodziny (jak traktować kohabitantów)
Studenci SGH (co z przebywającymi na urlopie dziekańskim).
4
Cechy populacji
Populacja może być:
skończona (przeliczalna liczba jednostek – pracownicy zakładu – ich listę
imienną można sporządzić) lub
nieskończona (nieskończenie wiele jednostek – osoby zwiedzające stare
miasto Warszawy – zbiorowość nieewidencjonowana – np. bezdomni,
nabywcy zupek marki GERBER, wspinacze wysokogórscy).
Wiedza o populacji może być:
bardzo rozległa i opierać się na dostępnych danych lub zweryfikowanych
teoriach i hipotezach lub
wiedza taka może w ogóle nie istnieć
Skład populacji może być:
nieustannie lub okresowo weryfikowany w postaci spisów i innych
rejestrów (PESEL, REGON, TERYT, lista klientów banku) lub
może nie istnieć możliwość utworzenia imiennej listy jednostek tworzących
populację (kupujący proszki do prania marki VIZIR).
5
Badanie sondażowe
może być realizowane jako:
BADANIE PEŁNE
(obejmujące wszystkie jednostki populacji)
BADANIE FRAGMENTARYCZNE
(obejmujące niektóre jednostki populacji, tzw.
PRÓBĘ, jednostki te wybierane są wg określonych
zasad zwanych METODAMI DOBORU PRÓBY)
6
Sposoby doboru próby
DOBÓR LOSOWY
DOBÓR CELOWY
• Jest potrzeba oceny precyzji wyników
• Nie ma potrzeby dowodzenia
reprezentatywności i oceny precyzji
• Próba odzwierciedla populację
• Nie wiadomo na ile próba zgodna jest
z populacją
• Oczekiwana precyzja stanowi
podstawę określenia liczebności próby
• Koszty stanowią podstawę określenia
liczebności tej próby
każda jednostka ma taką samą szansę
trafienia do próby, mechanizm doboru
jednostki do próby jest całkowicie niezależny
(zewnętrzny) w stosunku do badacza
dobór jednostki jest subiektywny, szukamy
osób, które należą do grupy docelowej,
badacz odgórnie rozstrzyga, które jednostki
znajdą się w próbie
(np. rzetelna moneta przy wchodzeniu do sali)
(np. kierowcy i zauważalność bilboardu)
7
Dobór próby
O zastosowaniu określonej metody doboru próby decydują:
WARUNKI, w jakich realizowane będzie badanie
PRZEDMIOT BADANIA
PRÓBA REPREZENTATYWNA - to próba odzwierciedlająca strukturę
populacji – reprezentatywna ze względu na badane cechy (lub cechy
silnie skorelowane z cechą badaną)
Jeśli celem jest uzyskanie cech ilościowych, np. średniej, frakcji, ocen
poziomu zmienności, to wówczas potrzebne jest określenie precyzji i
wiarygodności uzyskanych wyników. Tylko dobór losowy stwarza takie
możliwości, dlatego jest tu zalecany.
PRÓBĘ LOSOWĄ jesteśmy w stanie zbudować jeżeli jest znana wielkość
populacji i istnieje możliwość nawiązania kontaktu z każdą jednostką!
8
Operat losowania
OPERAT LOSOWANIA wymagany jest w przypadku losowego doboru próby
jest to wykaz jednostek tworzących badaną zbiorowość (populację)
istnieje, jeśli możliwe jest sporządzenie imiennego wykazu jednostek badanej
zbiorowości
istnieje tylko dla populacji skończonej
jeśli istnieje potrzeba przeprowadzenia złożonego schematu losowania próby
powinien zawierać informacje dodatkowe, np. demograficzne jednostek
Operat można stworzyć np. na podstawie książki telefonicznej, spisu
mieszkańców danego miasta, listy członków organizacji państwowych itd.
Aby OPERAT był użyteczny musi być:
Kompletny
Aktualny
Gwarantujący identyfikowalność jednostki (kontakt z nią)
Jeśli operat nie istnieje stosowany jest celowy sposób doboru respondenta
9
(np. co dziesiąty turysta przechodzący bulwarem odwiedzający Kazimierz Dolny)
Procedura doboru próby
Zdefiniowanie populacji badanej
Określenie operatu losowania (jeżeli istnieje)
Określenie jednostki wyboru (czy pochodzi z operatu,
czy jest inny sposób określania jednostki badanej)
Wybór metody doboru jednostek (próba losowa, celowa)
Ustalenie wielkości próby (zależy od wielu aspektów – m.in.
technicznych, finansowych, wymaganej jakości pozyskanych danych)
10
Dobór celowy
Próba konstruowana jest w sposób SUBIEKTYWNY
Dobór może być:
KWOTOWY (kwota – udział podgrupy w próbie)
ustalenie kwot - w warstwach
TYPOWY lub PRZEZ ELIMINACJĘ
WG. KULI ŚNIEGOWEJ
oparty o punkt zaczepienia
PRZYPADKOWY
Zakłada się, że próba ma być miniaturą populacji,
jednak nie można dowieść, że jest reprezentatywna.
11
Dobór celowy:
PRZYKŁADY
KWOTOWY
Dobór osób posiadających telefony komórkowe ze względu typ oferty:
Wykształcenie
klienta
Liczba w populacji w tys.
(dane GUS za 2006r.)
(%)
Liczba w próbie
(kwoty)
Orange
11,738
33,7
337
Era
11,954
34,4
344
Plus
11,100
31,9
319
Suma
34.792
100,0
1000
TYPOWY – gospodarstwa domowe o przeciętnych dochodach
PRZEZ ELIMINACJĘ – eliminacja nietypowych – punktów
sprzedaży o najniższych tygodniowych obrotach
WG. KULI ŚNIEGOWEJ – uprawiający
sporty ekstremalne
PRZYPADKOWY – badanie percepcji
ulicznych przekazów reklamowych
12
Zagrożenia w doborze celowym
(co zarzuca się próbom celowym)
Błędny osąd i intuicja badacza, co do prawidłowości
występujących w populacji
Nadmierna chęć uczestnictwa w badaniach podyktowana
specjalnymi predyspozycjami respondentów, które nie zawsze
są zgodne z cechami populacji.
Jest to przyczyną SKRZYWIEŃ SYSTEMATYCZNYCH
Brak uzasadnienia wiarygodności wyników tego typu badań –
łatwo jest argumentować przeciw nim, jeśli są „niewygodne”
Próby celowe nie pozwalają ocenić reprezentatywności wyników
badania, nie można uogólniać wyników badania na populację
Nie można z góry zaplanować liczebności próby, która
zagwarantuje żądaną dokładność oszacowań
13
Dobór losowy
Istnieje wiele technik losowania – w zależności od warunków badania są one
mniej lub bardziej efektywne w sensie sprawdzanej precyzji szacowania.
W przypadku POPULACJI SKOŃCZONEJ – opracowane są wysoce
efektywne techniki losowania polegająca na dywersyfikacji szansy trafienia
do próby każdej jednostki
(np. eliminacja dysproporcji spowodowanych stopą odmów – jeśli wiemy, że
w Warszawie stopa odmów jest wyższa niż w Lublinie – próbę możemy
dobrać tak, aby w efekcie utrzymać proporcje z populacji)
W przypadku POPULACJI NIESKOŃCZONEJ stosowane są proste techniki
losowania o gorszej efektywności
14
Dlaczego próba powinna być losowana?
Jest najbardziej wiarygodną informacją o populacji
Losując próbę mamy największa szansę trafienia próby o strukturze
najbardziej podobnej do struktury populacji
Losując próbę kreujemy zmienną losową, co umożliwia wykorzystanie
twierdzeń rachunku prawdopodobieństwa w analizie wyników.
Twierdzenia rachunku prawdopodobieństwa definiują prawidłowości
dotyczące zmiennych losowych – dzięki nim możemy wnioskować na
temat całej populacji z określoną precyzją.
15
Dlaczego próba powinna być losowana?
PRÓBA LOSOWA = REPREZENTATYWNA
ROZKŁAD PRAWDOPODOBIEŃSTWA CECHY W PRÓBIE
(model wyjaśniający prawidłowości kształtowania się wartości ZMIENNEJ LOSOWEJ)
TWIERDZENIA RACHUNKU PRAWDOPODOBIEŃSTWA
ROZKŁAD PRAWDOPODOBIEŃSTWA DLA CECHY W POPULACJI
16
Błędy w badaniach sondażowych
17
Jakość danych statystycznych
Obszary oceny jakości danych (Eurostat 2003)
przydatność danych (reprezentatywność próby)
dokładność (błędy losowe i nielosowe)
aktualność i terminowość
dostępność i przejrzystość
porównywalność (w czasie i w przekroju przestrzennym)
spójność
kompletność
18
Błędy w badaniach ilościowych
Nie da się ustalić wielkości błędu całkowitego!
BŁĘDY W BADANIACH ILOŚCIOWYCH
Losowe
Nielosowe
gdy próba jest losowana
(konsekwencja decyzji o losowaniu)
każdy rodzaj próby
(czynnik ludzki)
Błąd losowy
Błędy pokrycia
Błędy treści
Struktury
Pomiaru
Wyboru
Analizy
Braku reakcji
Interpretacji
Zagubienia
Tylko poziom błędu losowego
jesteśmy w stanie określić
liczbowo i porównywać!
Odrzucenie
Zbiorowość Zbiorowość
zdefiniowana badana
Prawda
Wynik
badania
19
Błąd losowy
Wielkość błędu losowego zależy od:
Techniki losowania
Zróżnicowania populacji
Liczebności próby
S ( x)
n
20
Błędy nielosowe
Błędy pokrycia – badana grupa jest inną grupą niż tą którą chcemy zbadać
Struktury – def. populacji nie jest odpowiednio dobrana do rozwiązania problemu
badawczego – problem z operatem – badamy inne osoby niż chcemy:
PESEL – braki w adresach
Zbiorowość Zbiorowość
zdefiniowana badana
REGON – firmy zlikwidowane
KSIĄŻKA TELEFONICZNA – niereprezentatywna dla mieszkańców Warszawy
Wyboru – ankieter nie dotarł do jednostki
Braku reakcji – jednostka nie udzieliła wywiadu (odpowiedzi)
Zagubienia – kwestionariusz ginie
Odrzucenia – podczas kontroli realizacji badania – sprawdzanie kwestionariuszy
- logika odpowiedzi (ma dwoje dzieci i 14 lat)
- kompletność danych (jest wiek, a nie ma miejsca zamieszkania)
- tzw. „sufity” (kwestionariusze wypełnione przez inną osobę niż wskazaną do badania)
Błędy treści – wynik nie jest poprawną wartością
Prawda
zły pomiar – zły wpis, wadliwy skaner, zła skala pomiaru
zły lub kompromisowy dobór estymatorów, zła metoda analizy – brak wiedzy
analityka (niewłaściwe metody złe założenia) – mamy nic nie znaczące wyniki
zła interpretacja (niedopowiedzenia)
Wynik
badania
21
Błędy losowe
Przyczyną błędu losowego jest fakt korzystania z próby, a nie
przeprowadzanie badania na całej populacji.
Błąd losowy wyznaczamy na podstawie informacji dotyczących:
Szacowanych parametrów (np. wartość przeciętna cechy populacji)
Estymatorów tych parametrów (np. średnia arytmetyczna)
Schematu losowania (np. warstwowy, wielostopniowy)
Wielkości próby (np. 1000 jednostek)
22
Błąd w badaniu fragmentarycznym
Zmiana wielkości błędów w zależności od skali badania
(analiza zmian całkowitego błędu pomiaru)
Błąd losowy
(maleje)
wielkość próby =n1
wielkość próby = n2 >n1
wielkość próby = n3 >n2 >n1
Błędy nielosowe
(rosną)
Schemat L. Kish’a
23
Jak zapanować nad rozmiarem błędu?
Mając ustalone:
Parametry, które będziemy szacować
Estymatory tych parametrów (np. oszacowanie średniej, frakcji)
Należy:
Wybrać minimalną liczebność próby w stosunku do założonej precyzji wyników
Wybrać schemat losowania tak, aby oszacować parametry z możliwie
najniższym błędem losowym
Minimalizować błędy nielosowe przez odpowiednią organizację badania
24