GATS 2010 - Dobor proby

Transkrypt

GATS 2010 - Dobor proby
1
Zrekonstruowano na podstawie: Globalny sondaż dotyczący używania
tytoniu przez osoby dorosłe (GATS) Polska 2009-2010, MZ – WHO, Warwszawa, 2010
GATS 2010 – Dobór próby;
Spis treści
1. Populacja ....................................................................................................................................................... 1
2. Cel badania .................................................................................................................................................... 1
3. Operat ............................................................................................................................................................ 1
4. Schemat losowania ........................................................................................................................................ 2
Etap 1 ............................................................................................................................................................. 2
Etap 2 ............................................................................................................................................................. 2
Etap 3 ............................................................................................................................................................. 2
5. Liczebność próby........................................................................................................................................... 2
6. Prawdopodobieństwa doboru do próby i wagi analityczne ........................................................................... 3
Waga bazowa................................................................................................................................................. 4
Korekta uwzględniająca jednostkowy brak uczestnictwa ............................................................................. 5
Korekta poststratyfikacyjna (kalibracja) ....................................................................................................... 5
Szacowanie błędów losowych ....................................................................................................................... 6
■ Błąd standardowy (SE): ......................................................................................................................... 6
■ Efekt doboru proby (DEFT) ................................................................................................................... 6
Obliczanie błędu standardowego ............................................................................................................... 6
1. Populacja
Badanie dotyczyło populacji osob dorosłych (mężczyzn i kobiet w wieku 15 i więcej lat)
mieszkających w Polsce, ktore uważają Polskę za swoje głowne miejsce zamieszkania (nawet w przypadku,
gdy nie są obywatelami polskimi). Z badania wykluczono jedynie dorosłych przebywających w kraju
czasowo (np. turystow) oraz zamieszkujących w kwaterach zbiorowych (np. akademiki) lub w instytucjach i
zakładach zamkniętych. Badanie GATS w Polsce przeprowadzono we wszystkich 16 wojewodztwach.
Sondaż objął zasięgiem 99,4% badanej populacji (Załącznik B).
2. Cel badania
Sondaż został zaprojektowany tak, aby można było uzyskać precyzyjne szacunki:
• dla Polski jako ogółu,
• jak również dla rejonów wiejskich i miejskich
• oraz poszczególnych płci.
3. Operat
Operat losowania (o charakterze adresowym) wykorzystany w procesie doboru proby dla badania
GATS w Polsce (Załącznik B) opierał się na uaktualnionych danych Głownego Urzędu Statystycznego
zawierających informacje ze Spisu Powszechnego przeprowadzonego w 2002 roku. Dane te są uaktualniane
co kwartał na podstawie informacji dostarczanych przez Głowny Urząd Geodezji i Kartografii, ktory
rejestruje informacje o wszystkich nowopowstających oraz wyburzanych domach w Polsce.
Uaktualniony operat losowania składa się 33 691 regionow statystycznych (20 134 miast i 13 557
wsi), z wyłączeniem 3 172 regionow statystycznych składających się z mniej niż 100 gospodarstw
domowych.
1
2
4. Schemat losowania
Zastosowano trzystopniowy, warstwowy i wiązkowy dobor proby, gdzie regiony statystyczne
traktowane były jako podstawowe jednostki losowania (ang. Primary Sample Units - PSU).
Etap 1
W pierwszym etapie doboru proby wylosowano ogołem 200 miejskich jednostek losowania i 200
wiejskich z prawdopodobieństwem proporcjonalnym do ich wielkości.
Wiejskie podstawowe jednostki losowania obejmujące mniej niż 100 gospodarstw domowych
zostały wyłączone z planu doboru próby w celu zapewnienia dostępności wystarczającej liczby gospodarstw
domowych do drugiego etapu doboru próby i realizacji badania.
Wyłączone znajdowały się głównie w odległych i trudno dostępnych rejonach Polski.
Przeprowadzone analizy pokazały, iż tylko 2,8% wiejskich PSU zostało wyłączonych z planu doboru próby,
co stanowiło 0,6% ogółu wiejskich gospodarstw domowych.
Nie wyłączono żadnych miejskich PSU, gdyż wszystkie przekraczały założoną minimalną
liczebność.
Etap 2
W drugim etapie wytypowano:
36 gospodarstw domowych (19 męskich i 17 żeńskich) z każdej miejskiej PSU i
34 gospodarstw domowych (18 męskich i 16 żeńskich) z każdej wiejskiej PSU
na zasadzie losowania prostego bez zwracania z bazy danych TERYT,
Ogołem wytypowano:
6800 wiejskich gospodarstw domowych (3600 męskich i 3200 żeńskich) oraz
7200 miejskich gospodarstw domowych (3800 męskich i 3400 żeńskich),
co dało w sumie liczbę 14000 niezinstytucjonalizowanych gospodarstw domowych ze wszystkich 16
wojewodztw w Polsce.
Etap 3
Podział proby na gospodarstwa domowe męskie i żeńskie przeprowadzony został w sposob losowy
(sekwencyjny). Z każdego wybranego do badania gospodarstwa domowego, męskiego lub żeńskiego, została
wylosowana przy użyciu przenośnego urządzenia iPAQ (palmtop) jedna osoba (mężczyzna lub kobieta) do
wzięcia udziału w zasadniczej części wywiadu.
Nie dopuszczono żadnych zastępstw ani zmian w uprzednio wybranych
gospodarstwach domowych w czasie realizacji etapów badania dla uniknięcia
obciążenia wyników.
5. Liczebność próby
Badanie GATS zostało zaprojektowane tak, aby zapewnić szacunki zgodne z następującymi
wymogami dokładności:
■ Szacunki wyliczone w skali kraju według podziału na tereny miejskie i wiejskie z
uwzględnieniem płci powinny mieć 95% margines błędu w wysokości 3 lub mniej punktów procentowych
dla wskaźników użycia tytoniu wynoszących 40%.
■ Rozmiar próby powinien być wystarczająco duży, aby spełnić wymagania mocy statystycznej
testu dla wykrycia różnic między poszczególnymi edycjami sondażu dla niezależnie wybranych prób.
Przyjmując efekt schematu losowania jako 2.00 dla szacunków wyliczonych w skali kraju
według podziału na tereny miejskie i wiejskie, płeć oraz przecięcie płci z podziałem na tereny miejskie i
wiejskie, minimalny rozmiar próby konieczny dla spełnienie tych wymagań wynosił 2000 respondentów w
każdej z czterech grup (zdefiniowanych przez przecięcie płci z podziałem na tereny miejskie i wiejskie).
Wzięto pod uwagę następujące oczekiwane wskaźniki braku (odmowy) uczestnictwa na poziomie
gospodarstwa domowego i poziomie indywidualnym:
2
•
3
Współczynnik kwalifikacji gospodarstwa domowego (90%),
•
współczynnik realizacji dla gospodarstw domo-wych (90%),
•
współczynnik realizacji screeningu gospodarstwa domowego (95%),
•
współczynnik kwalifikacji indywidualnej (98%),
•
współczynnik realizacji na poziomie indywidualnym na terenach miejskich (70% wśród mężczyzn i
80% wśród kobiet)
•
współczynnik realizacji na poziomie indywidualnym na terenach wiejskich (75% wśród mężczyzn i
85% wśród kobiet).
Szacowany całościowy współczynnik realizacji z uwzględnieniem warstw wyniósł:
•
73,5% dla mężczyzn na terenach wiejskich,
•
68,8% dla mężczyzn na terenach miejskich,
•
83,3% dla kobiet na terenach wiejskich oraz
•
78,4% dla kobiet na terenach miejskich.
Całościowy współczynnik realizacji oparty na powyższych założeniach dla badania GATS w Polsce
wyniósł 60%.
6. Prawdopodobieństwa doboru do próby i wagi analityczne
W badaniu GATS założono, że podział na warstwy oparte na kryterium miast/wieś oraz płeć nie
będzie odpowiadał proporcjom populacyjnym (np. gospodarstwa domowe wiejskie miały stanowić 50%
próby, mimo że w populacji 15 lat i więcej, ludność mieszkająca na wsi stanowi 38%).
Przyjęto, że dopiero procedura ważenia danych zapewni rzeczywistą reprezentatywność próby
zarówno w skali kraju, jak i na poziomie warstwy próby (terenach miejskich/wiejskich). Proces ważenia
danych w badaniu GATS był 3-stopniowy:
(1) waga bazowa, obliczona na podstawie wszystkich etapów doboru próby
(2) korekta ze względu na brak uczestnictwa gospodarstw domowych oraz osób kwalifikujących się do
badania i
(3) korekta poststratyfikacyjna (kalibracja) na podstawie rozkładów określonych cech w badanej
populacji.
3
4
Waga bazowa
Odwrotnością prawdopodobieństwa bezwarunkowego znalezienia się w próbie była finalna waga
bazowa obliczona dla każdego respondenta. Jest ona odwrotnością iloczynu prawdopodobieństw doboru
łączonego z każdego etapem projektu. W celu obliczenia wag określono prawdopodobieństwo dostania się
do próby osobno dla każdego etapu doboru próby stosując poniższy wzór:
Bezwarunkowe
prawdopodobieństwo dla αpodstawowej jednostki losowania
(PSU) dostania się do próby w
obrębie danej warstwy na 1. etapie
doboru:
Warunkowe prawdopodobieństwo
dostania się do podpróby na
drugim etapie w wybranych
rejonach statystycznych
Warunkowe prawdopodobieństwo
kwalifikacji gospodarstwa
domowego do grupy męskiej
(żeńskiej) podpróby to:
Nα
Hα
Mα i Fα
to liczba podstawowych jednostek
losowania (PSU) w h-tej warstwie
to liczba gospodarstw domowych do
wylosowania do podpróby GATS w
rejonie statystycznym dobranym na 2.
etapie doboru,
to liczba gospodarstw domowych
włączonych odpowiednio do grupy
męskich i żeńskich
I
Lα
liczba podstawowych jednostek
losowania (PSU) dobranych do próby
z każdej warstwy na 1. etapie
to całkowita liczba gospodarstw
domowych w danym rejonie
statystycznym.
4
5
Końcowe warunkowe prawdopodobieństwo doboru danej osoby do próby w wybranym męskim lub
żeńskim gospodarstwie domowym jest obliczane jako:
gdzie Rα jest liczbą mężczyzn lub kobiet w wybranym gospodarstwie domowym.
Końcowe prawdopodobieństwo doboru do próby obliczone osobno dla każdej warstwy:
Całkowita waga próby dla każdego wybranego respondenta w kategoriach warstw to:
Korekta uwzględniająca jednostkowy brak uczestnictwa
Wagi bazowe skorygowano w oparciu o informację o brakach uczestnictwa na poziomie: podstawowych
jednostek losowania (PSU), gospodarstw domowych oraz indywidualnym.
(1) Współczynniki realizacji zostały obliczone na poziomie podstawowych jednostek losowania (PSU)
jako liczba wybranych podstawowych jednostek losowania (PSU) podzielona przez całkowitą liczbę
podstawowych jednostek losowania (PSU) wybranych w danej warstwie.
(2) Współczynnik realizacji na poziomie gospodarstw domowych obliczono jako całkowitą liczbę
wybranych gospodarstw domowych w każdej podstawowej jednostce losowania (PSU) podzieloną
przez całkowitą liczbę gospodarstw domowych w obrębie danego PSU.
(3) Współczynnik realizacji na poziomie osób indywidualnych obliczono w każdej warstwie według
grup wiekowych (15- 24 lata, 25-44 lata, 45-64 lata, 65 i więcej lat), terenów miejskich/wiejskich,
płci i postawy wobec palenia.
Wagi na poszczególnych poziomach doboru próby (PSU, gospodarstw domowych oraz osób
indywidualnych) obliczono jako jeden dzielone przez każdy odpowiednio zważony współczynnik
odpowiedzi.
Korekta poststratyfikacyjna (kalibracja)
Z zasady, celem kalibracji wag jest uzgodnienie zważonych danych pochodzących z realizacji próby
badawczej z odpowiadającymi wyliczeniami dla populacji docelowej.
Dane o całkowitej populacji osób w wieku 15 i więcej lat zamieszkałych na terenach miejskich i
wiejskich oraz o podanej przez respondenta płci i grupie wiekowej (15-24 lata, 25-44 lata, 45-64 lata i 65 i
więcej lat) zostały udostępnione przez Główny Urząd Statystyczny (GUS) i przedstawiały stan na czerwiec
2009 roku. Końcowa waga analizy (W) dla j-tego rekordu została obliczona na podstawie:
(1) wag bazowych,
(2) korekty uwzględniającej brak uczestnictwa oraz
(3) poststratyfikacyjnej kalibracji.
Wagi końcowe zostały użyte we wszystkich analizach aby otrzymać szacunki i przedziały ufności
5
6
Szacowanie błędów losowych
Dla każdego z wybranych wskaźnikow zastosowano następujące estymatory błędow losowych:
■ Błąd standardowy (SE):
Błędy losowe oblicza się zazwyczaj w związku z błędami standardowymi dla konkretnych danych
szacunkowych lub wskaźnikow (R) . Błąd standardowy danych szacunkowych jest pierwiastkiem
kwadratowym wariancji tych danych i jest liczony w takich samych jednostkach co dane szacunkowe dla
wartości średniej.
■ Efekt doboru proby (DEFT)
Pokazuje efektywność doboru proby i jest obliczany dla każdej wartości szacunkowej jako stosunek
błędu standardowego na podstawie podstawie danego doboru proby do błędu standardowego, ktory
powstałby przy użyciu proby losowej. Wartość DEFT na poziomie 1.0 oznacza, że dobor proby jest tak samo
efektywny jak proba losowa, podczas gdy wartość DEFT powyżej 1.0 oznacza wzrost błędu standardowego
spowodowany bardziej złożonym sposobem doboru proby. Generalnie, dla dobrze wykonanego badania,
wartość DEFT powinna wynosić zazwyczaj od 1 do 3. Nierzadko jednak zdarza się, że jego wartość wynosi
nawet 7 lub 8.
Obliczanie błędu standardowego
Dla obliczenia błędow losowych w danych do badania GATS Polska użyto SPSS (17.0) z module
Complex Sample. Metoda linearyzacji Taylora estymacji wariancji została zastosowana do danych
szacunkowych sondażu, ktore są wartościami średnimi lub odpowiednio proporcjami.
6