GATS 2010 - Dobor proby
Transkrypt
GATS 2010 - Dobor proby
1 Zrekonstruowano na podstawie: Globalny sondaż dotyczący używania tytoniu przez osoby dorosłe (GATS) Polska 2009-2010, MZ – WHO, Warwszawa, 2010 GATS 2010 – Dobór próby; Spis treści 1. Populacja ....................................................................................................................................................... 1 2. Cel badania .................................................................................................................................................... 1 3. Operat ............................................................................................................................................................ 1 4. Schemat losowania ........................................................................................................................................ 2 Etap 1 ............................................................................................................................................................. 2 Etap 2 ............................................................................................................................................................. 2 Etap 3 ............................................................................................................................................................. 2 5. Liczebność próby........................................................................................................................................... 2 6. Prawdopodobieństwa doboru do próby i wagi analityczne ........................................................................... 3 Waga bazowa................................................................................................................................................. 4 Korekta uwzględniająca jednostkowy brak uczestnictwa ............................................................................. 5 Korekta poststratyfikacyjna (kalibracja) ....................................................................................................... 5 Szacowanie błędów losowych ....................................................................................................................... 6 ■ Błąd standardowy (SE): ......................................................................................................................... 6 ■ Efekt doboru proby (DEFT) ................................................................................................................... 6 Obliczanie błędu standardowego ............................................................................................................... 6 1. Populacja Badanie dotyczyło populacji osob dorosłych (mężczyzn i kobiet w wieku 15 i więcej lat) mieszkających w Polsce, ktore uważają Polskę za swoje głowne miejsce zamieszkania (nawet w przypadku, gdy nie są obywatelami polskimi). Z badania wykluczono jedynie dorosłych przebywających w kraju czasowo (np. turystow) oraz zamieszkujących w kwaterach zbiorowych (np. akademiki) lub w instytucjach i zakładach zamkniętych. Badanie GATS w Polsce przeprowadzono we wszystkich 16 wojewodztwach. Sondaż objął zasięgiem 99,4% badanej populacji (Załącznik B). 2. Cel badania Sondaż został zaprojektowany tak, aby można było uzyskać precyzyjne szacunki: • dla Polski jako ogółu, • jak również dla rejonów wiejskich i miejskich • oraz poszczególnych płci. 3. Operat Operat losowania (o charakterze adresowym) wykorzystany w procesie doboru proby dla badania GATS w Polsce (Załącznik B) opierał się na uaktualnionych danych Głownego Urzędu Statystycznego zawierających informacje ze Spisu Powszechnego przeprowadzonego w 2002 roku. Dane te są uaktualniane co kwartał na podstawie informacji dostarczanych przez Głowny Urząd Geodezji i Kartografii, ktory rejestruje informacje o wszystkich nowopowstających oraz wyburzanych domach w Polsce. Uaktualniony operat losowania składa się 33 691 regionow statystycznych (20 134 miast i 13 557 wsi), z wyłączeniem 3 172 regionow statystycznych składających się z mniej niż 100 gospodarstw domowych. 1 2 4. Schemat losowania Zastosowano trzystopniowy, warstwowy i wiązkowy dobor proby, gdzie regiony statystyczne traktowane były jako podstawowe jednostki losowania (ang. Primary Sample Units - PSU). Etap 1 W pierwszym etapie doboru proby wylosowano ogołem 200 miejskich jednostek losowania i 200 wiejskich z prawdopodobieństwem proporcjonalnym do ich wielkości. Wiejskie podstawowe jednostki losowania obejmujące mniej niż 100 gospodarstw domowych zostały wyłączone z planu doboru próby w celu zapewnienia dostępności wystarczającej liczby gospodarstw domowych do drugiego etapu doboru próby i realizacji badania. Wyłączone znajdowały się głównie w odległych i trudno dostępnych rejonach Polski. Przeprowadzone analizy pokazały, iż tylko 2,8% wiejskich PSU zostało wyłączonych z planu doboru próby, co stanowiło 0,6% ogółu wiejskich gospodarstw domowych. Nie wyłączono żadnych miejskich PSU, gdyż wszystkie przekraczały założoną minimalną liczebność. Etap 2 W drugim etapie wytypowano: 36 gospodarstw domowych (19 męskich i 17 żeńskich) z każdej miejskiej PSU i 34 gospodarstw domowych (18 męskich i 16 żeńskich) z każdej wiejskiej PSU na zasadzie losowania prostego bez zwracania z bazy danych TERYT, Ogołem wytypowano: 6800 wiejskich gospodarstw domowych (3600 męskich i 3200 żeńskich) oraz 7200 miejskich gospodarstw domowych (3800 męskich i 3400 żeńskich), co dało w sumie liczbę 14000 niezinstytucjonalizowanych gospodarstw domowych ze wszystkich 16 wojewodztw w Polsce. Etap 3 Podział proby na gospodarstwa domowe męskie i żeńskie przeprowadzony został w sposob losowy (sekwencyjny). Z każdego wybranego do badania gospodarstwa domowego, męskiego lub żeńskiego, została wylosowana przy użyciu przenośnego urządzenia iPAQ (palmtop) jedna osoba (mężczyzna lub kobieta) do wzięcia udziału w zasadniczej części wywiadu. Nie dopuszczono żadnych zastępstw ani zmian w uprzednio wybranych gospodarstwach domowych w czasie realizacji etapów badania dla uniknięcia obciążenia wyników. 5. Liczebność próby Badanie GATS zostało zaprojektowane tak, aby zapewnić szacunki zgodne z następującymi wymogami dokładności: ■ Szacunki wyliczone w skali kraju według podziału na tereny miejskie i wiejskie z uwzględnieniem płci powinny mieć 95% margines błędu w wysokości 3 lub mniej punktów procentowych dla wskaźników użycia tytoniu wynoszących 40%. ■ Rozmiar próby powinien być wystarczająco duży, aby spełnić wymagania mocy statystycznej testu dla wykrycia różnic między poszczególnymi edycjami sondażu dla niezależnie wybranych prób. Przyjmując efekt schematu losowania jako 2.00 dla szacunków wyliczonych w skali kraju według podziału na tereny miejskie i wiejskie, płeć oraz przecięcie płci z podziałem na tereny miejskie i wiejskie, minimalny rozmiar próby konieczny dla spełnienie tych wymagań wynosił 2000 respondentów w każdej z czterech grup (zdefiniowanych przez przecięcie płci z podziałem na tereny miejskie i wiejskie). Wzięto pod uwagę następujące oczekiwane wskaźniki braku (odmowy) uczestnictwa na poziomie gospodarstwa domowego i poziomie indywidualnym: 2 • 3 Współczynnik kwalifikacji gospodarstwa domowego (90%), • współczynnik realizacji dla gospodarstw domo-wych (90%), • współczynnik realizacji screeningu gospodarstwa domowego (95%), • współczynnik kwalifikacji indywidualnej (98%), • współczynnik realizacji na poziomie indywidualnym na terenach miejskich (70% wśród mężczyzn i 80% wśród kobiet) • współczynnik realizacji na poziomie indywidualnym na terenach wiejskich (75% wśród mężczyzn i 85% wśród kobiet). Szacowany całościowy współczynnik realizacji z uwzględnieniem warstw wyniósł: • 73,5% dla mężczyzn na terenach wiejskich, • 68,8% dla mężczyzn na terenach miejskich, • 83,3% dla kobiet na terenach wiejskich oraz • 78,4% dla kobiet na terenach miejskich. Całościowy współczynnik realizacji oparty na powyższych założeniach dla badania GATS w Polsce wyniósł 60%. 6. Prawdopodobieństwa doboru do próby i wagi analityczne W badaniu GATS założono, że podział na warstwy oparte na kryterium miast/wieś oraz płeć nie będzie odpowiadał proporcjom populacyjnym (np. gospodarstwa domowe wiejskie miały stanowić 50% próby, mimo że w populacji 15 lat i więcej, ludność mieszkająca na wsi stanowi 38%). Przyjęto, że dopiero procedura ważenia danych zapewni rzeczywistą reprezentatywność próby zarówno w skali kraju, jak i na poziomie warstwy próby (terenach miejskich/wiejskich). Proces ważenia danych w badaniu GATS był 3-stopniowy: (1) waga bazowa, obliczona na podstawie wszystkich etapów doboru próby (2) korekta ze względu na brak uczestnictwa gospodarstw domowych oraz osób kwalifikujących się do badania i (3) korekta poststratyfikacyjna (kalibracja) na podstawie rozkładów określonych cech w badanej populacji. 3 4 Waga bazowa Odwrotnością prawdopodobieństwa bezwarunkowego znalezienia się w próbie była finalna waga bazowa obliczona dla każdego respondenta. Jest ona odwrotnością iloczynu prawdopodobieństw doboru łączonego z każdego etapem projektu. W celu obliczenia wag określono prawdopodobieństwo dostania się do próby osobno dla każdego etapu doboru próby stosując poniższy wzór: Bezwarunkowe prawdopodobieństwo dla αpodstawowej jednostki losowania (PSU) dostania się do próby w obrębie danej warstwy na 1. etapie doboru: Warunkowe prawdopodobieństwo dostania się do podpróby na drugim etapie w wybranych rejonach statystycznych Warunkowe prawdopodobieństwo kwalifikacji gospodarstwa domowego do grupy męskiej (żeńskiej) podpróby to: Nα Hα Mα i Fα to liczba podstawowych jednostek losowania (PSU) w h-tej warstwie to liczba gospodarstw domowych do wylosowania do podpróby GATS w rejonie statystycznym dobranym na 2. etapie doboru, to liczba gospodarstw domowych włączonych odpowiednio do grupy męskich i żeńskich I Lα liczba podstawowych jednostek losowania (PSU) dobranych do próby z każdej warstwy na 1. etapie to całkowita liczba gospodarstw domowych w danym rejonie statystycznym. 4 5 Końcowe warunkowe prawdopodobieństwo doboru danej osoby do próby w wybranym męskim lub żeńskim gospodarstwie domowym jest obliczane jako: gdzie Rα jest liczbą mężczyzn lub kobiet w wybranym gospodarstwie domowym. Końcowe prawdopodobieństwo doboru do próby obliczone osobno dla każdej warstwy: Całkowita waga próby dla każdego wybranego respondenta w kategoriach warstw to: Korekta uwzględniająca jednostkowy brak uczestnictwa Wagi bazowe skorygowano w oparciu o informację o brakach uczestnictwa na poziomie: podstawowych jednostek losowania (PSU), gospodarstw domowych oraz indywidualnym. (1) Współczynniki realizacji zostały obliczone na poziomie podstawowych jednostek losowania (PSU) jako liczba wybranych podstawowych jednostek losowania (PSU) podzielona przez całkowitą liczbę podstawowych jednostek losowania (PSU) wybranych w danej warstwie. (2) Współczynnik realizacji na poziomie gospodarstw domowych obliczono jako całkowitą liczbę wybranych gospodarstw domowych w każdej podstawowej jednostce losowania (PSU) podzieloną przez całkowitą liczbę gospodarstw domowych w obrębie danego PSU. (3) Współczynnik realizacji na poziomie osób indywidualnych obliczono w każdej warstwie według grup wiekowych (15- 24 lata, 25-44 lata, 45-64 lata, 65 i więcej lat), terenów miejskich/wiejskich, płci i postawy wobec palenia. Wagi na poszczególnych poziomach doboru próby (PSU, gospodarstw domowych oraz osób indywidualnych) obliczono jako jeden dzielone przez każdy odpowiednio zważony współczynnik odpowiedzi. Korekta poststratyfikacyjna (kalibracja) Z zasady, celem kalibracji wag jest uzgodnienie zważonych danych pochodzących z realizacji próby badawczej z odpowiadającymi wyliczeniami dla populacji docelowej. Dane o całkowitej populacji osób w wieku 15 i więcej lat zamieszkałych na terenach miejskich i wiejskich oraz o podanej przez respondenta płci i grupie wiekowej (15-24 lata, 25-44 lata, 45-64 lata i 65 i więcej lat) zostały udostępnione przez Główny Urząd Statystyczny (GUS) i przedstawiały stan na czerwiec 2009 roku. Końcowa waga analizy (W) dla j-tego rekordu została obliczona na podstawie: (1) wag bazowych, (2) korekty uwzględniającej brak uczestnictwa oraz (3) poststratyfikacyjnej kalibracji. Wagi końcowe zostały użyte we wszystkich analizach aby otrzymać szacunki i przedziały ufności 5 6 Szacowanie błędów losowych Dla każdego z wybranych wskaźnikow zastosowano następujące estymatory błędow losowych: ■ Błąd standardowy (SE): Błędy losowe oblicza się zazwyczaj w związku z błędami standardowymi dla konkretnych danych szacunkowych lub wskaźnikow (R) . Błąd standardowy danych szacunkowych jest pierwiastkiem kwadratowym wariancji tych danych i jest liczony w takich samych jednostkach co dane szacunkowe dla wartości średniej. ■ Efekt doboru proby (DEFT) Pokazuje efektywność doboru proby i jest obliczany dla każdej wartości szacunkowej jako stosunek błędu standardowego na podstawie podstawie danego doboru proby do błędu standardowego, ktory powstałby przy użyciu proby losowej. Wartość DEFT na poziomie 1.0 oznacza, że dobor proby jest tak samo efektywny jak proba losowa, podczas gdy wartość DEFT powyżej 1.0 oznacza wzrost błędu standardowego spowodowany bardziej złożonym sposobem doboru proby. Generalnie, dla dobrze wykonanego badania, wartość DEFT powinna wynosić zazwyczaj od 1 do 3. Nierzadko jednak zdarza się, że jego wartość wynosi nawet 7 lub 8. Obliczanie błędu standardowego Dla obliczenia błędow losowych w danych do badania GATS Polska użyto SPSS (17.0) z module Complex Sample. Metoda linearyzacji Taylora estymacji wariancji została zastosowana do danych szacunkowych sondażu, ktore są wartościami średnimi lub odpowiednio proporcjami. 6