Dobór próby w ESS6. Opis zmiennych zbioru doboru próby

Transkrypt

Dobór próby w ESS6. Opis zmiennych zbioru doboru próby
Instytut Filozofii i Socjologii PAN
Dobór próby w ESS6.
Opis zmiennych zbioru doboru próby
Próba do badania Europejski Sondaż Społeczny ma charakter losowy i jest
realizowana do wyczerpania. Przedmiotem doboru są osoby mieszkające w Polce. Populacja
badana obejmuje ludność w wieku 15 lub więcej lat. W fazie losowania przyjęto, że do osób
spełniających kryterium wieku zaliczone zostaną osoby urodzone 30 września 1997 roku lub
wcześniej. Próba do badania została dobrana z operatu PESEL prowadzonego przez
Ministerstwo Spraw Wewnętrznych i Administracji.
Dobór próby miał charakter losowania wielostopniowego. Zgodnie z założeniami
badania liczebność próby losowanej została wyznaczona w taki sposób, aby zapewnić
przynajmniej 1752 zrealizowanych wywiadów, co gwarantuje osiągnięcie tzw. efektywnej
wielkości próby na poziomie przynajmniej 1500 osób (tj, przy pewnych założeniach próba
1752 osób pozwala estymować parametry z dokładnością porównywalną do tej, jaką by
uzyskano przy próbie prostej bezzwrotnej o liczebności 1500 osób). Oszacowując liczebność
próby założono, że poziomem realizacji (response rate) – tj. stosunek liczby wywiadów
zakończonych sukcesem do liczby wylosowanych osób, które należą do badanej populacji –
wyniesie w przybliżeniu 70% (w praktyce okazało się, że uzyskano poziom realizacji 75%).
Dodatkowo należało uwzględnić, ze operat PESEL obejmuje osoby, które nie wchodzą w
zakres badanej populacji (tzw. kategorii ineligibles, m. in. osoby mieszkające w momencie
badania za granicą, osoby zmarłe pomiędzy momentem losowania próby a rozpoczęciem
badania). Na podstawie dostępnych źródeł i poprzednich edycji ESS ich odsetek został
oszacowany na 7,1%. Z tych względów liczebność losowanej próby została ustalona na 2706
osób. Poniżej pokrótce opisujemy najważniejsze kwestie związane z doborem próby w ESS6,
tj. kwestię przewidywanej wielkości próby w miejscowościach różnej wielkości, opis
schematu doboru próby i opis zmiennych ze zbioru doboru próby, których uwzględnienie
pozwala na poprawne wyznaczenie błędów standardowych szacowanych parametrów.
1
1. Przewidywana realizacja w miejscowościach różnej wielkości
Istotnym elementem metodologii doboru próby było uwzględnienie niejednakowych
współczynników realizacji w miejscowościach o różnej wielkości. Czynnik ten uwzględniono
określając liczbę losowanych osób w poszczególnych klasach wielkości miejscowości.
Poniższa tabela przedstawia przewidywany poziom realizacji w ESS 6. Ich estymacji
dokonano na podstawie analizy pracy sieci ORBS IFiS PAN w ostatnio realizowanych
badaniach, a także na podstawie informacji o trudnościach w realizacji badań występujących
w innych sieciach ankieterskich. W szczególności uwzględniono doświadczenia poprzednich
edycji badania ESS. Liczba osób losowanych w poszczególnych klasach wielkości
miejscowości została przemnożona przez odwrotność przewidywanego poziomu realizacji.
Tabela 1. Przewidywany poziom realizacji w kategoriach miejscowości o różnej wielkości
Kategoria wielkości miejscowości
Wsie
Miasta poniżej 10 tys. mieszkańców
Miasta 10-19 tys. mieszkańców
Miasta 20-49 tys. mieszkańców
Miasta 50-99 tys. mieszkańców
Miasta 100-199 tys. mieszkańców
Miasta 200-500 tys. mieszkańców
Miasta 500-999 tys. mieszkańców
Warszawa
Razem
Udział w populacji Przewidywany
Udział w
osób w wieku 15
poziom
wylosowanej próbie
lub więcej lat*
realizacji
38,2%
80%
33,32%
6,0%
75%
5,56%
6,9%
70%
6,87%
11,1%
70%
11,01%
8,5%
65%
9,07%
8,1%
60%
9,42%
9,4%
60%
10,92%
7,2%
60%
8,43%
4,6%
60%
5,38%
100%
69,96%
100%
*Dane GUS, 31 grudnia 2010.
2
2. Opis doboru próby
Specyfiką doboru próby do badania Europejski Sondaż Społeczny jest podział
populacji ludności Polski na dwie części, w ramach których losowanie przebiegało według
odmiennych schematów. Pierwsza część objęła populację osób mieszkających w miastach o
wielkości ponad 50 tys. mieszkańców, zaś druga osoby mieszkające w pozostałych
miejscowościach (miasta poniżej 50 tys. mieszkańców oraz wsie). Poniżej omawiamy
schemat doboru próby w obydwu podzbiorowościach.
2.1 Dobór próby w miastach ponad 50 tys. mieszkańców
Wielkość populacji ludności w wieku 15 lub więcej lat mieszkającej w miastach ponad
50 tys. mieszkańców wynosi 12 275 805 osób. Kategoria ta obejmuje 86 miast, w sumie
ludność tych miast obejmuje 37,8% ogółu populacji ludności Polski w wieku 15 lub więcej
lat.
Próba w tej części populacji została dobrana jako próba prosta losowana
bezzwrotnie w każdym mieście osobno. Mówiąc inaczej, próba w tej części miała charakter
warstwowy, przy czym każde miasto stanowiło odrębną warstwę. Osoby losowane były
bezpośrednio spośród wszystkich mieszkańców danego miasta1 , z pominięciem fazy
wiązkowania. Schemat prostej próby losowej zastosowano z tego względu, że jest on bardziej
efektywny niż wiązkowanie.
W każdym z 86 miast liczących ponad 50 tys. mieszkańców osobno określono liczbę
osób, która zostanie wylosowana. Liczby te ustalono jako proporcjonalne do udziału ludności
w wieku 15 lub więcej lat w danym mieście do ogółu populacji w tym wieku. Wyliczając
liczbę wylosowanych osób w poszczególnych miastach uwzględniono także niejednakowe
współczynniki realizowalności w różnych klasach wielkości miast (patrz powyżej). Dopiero
złożenie tych dwóch czynników pozwoliło obliczyć liczbę dobieranych osób. Informacje o
liczebności próby w poszczególnych miastach przedstawia tabela 2.
1
W przypadku największych polskich miast: Warszawy, Łodzi, Poznania i Wrocławia próbę losowano
spośród mieszkańców dzielnic tych miast. Dla przykładu, Warszawa dzieli się na 18 dzielnic; respondentów
losowano z każdej dzielnicy osobno.
3
Tabela 2. Wielkości populacji osób w wieku 15 lub więcej lat w miastach o liczebności populacji
ponad 50 tys. mieszkańców
Województwo
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Dolnośląskie
Kujawsko-Pomorskie
Kujawsko-Pomorskie
Kujawsko-Pomorskie
Kujawsko-Pomorskie
Kujawsko-Pomorskie
Lubelskie
Lubelskie
Lubelskie
Lubelskie
Lubuskie
Lubuskie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Łódzkie
Małopolskie
Małopolskie
Małopolskie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
TERYT Miasto
0203011 Głogów
0211011 Lubin
0219011 Świdnica
0221091 Wałbrzych
0261011 Jelenia Góra
0262011 Legnica
0264029 Wrocław Fabryczna
0264039 Wrocław Krzyki
0264049 Wrocław Psie Pole
0264059 Wrocław Stare Miasto
0264069 Wrocław Śródmieście
0407011 Inowrocław
0461011 Bydgoszcz
0462011 Grudziądz
0463011 Toruń
0464011 Włocławek
0661011 Biała Podlaska
0662011 Chełm
0663011 Lublin
0664011 Zamość
0861011 Gorzów Wielkopolski
0862011 Zielona Góra
1001011 Bełchatów
1008021 Pabianice
1016011 Tomaszów Mazowiecki
1020031 Zgierz
1061029 Łódź Bałuty
1061039 Łódź Górna
1061049 Łódź Polesie
1061059 Łódź Śródmieście
1061069 Łódź Widzew
1062011 Piotrków Trybunalski
1261011 Kraków
1262011 Nowy Sącz
1263011 Tarnów
1408011 Legionowo
1421021 Pruszków
1461011 Ostrołęka
1462011 Płock
1463011 Radom
1464011 Siedlce
1465028 Warszawa Bemowo
1465038 Warszawa Białołęka
4
Ludność 15+ Wielkość próby
57 659
5
63 876
5
51 681
4
105 814
10
74 392
6
89 769
8
173 699
17
146 728
14
81 410
8
48 266
4
106 133
10
65 774
6
310 464
30
84 603
7
178 128
17
101 023
10
49 131
4
58 478
5
30 3261
29
56 954
5
108 211
10
102 071
10
52 361
4
60 113
5
55 933
5
50 245
4
18 8816
18
153 576
15
127 062
12
65 029
6
121 610
12
66 384
6
659 913
64
71 294
6
99 682
9
43 728
4
48 212
4
45 628
4
108 224
10
190 749
18
65 278
6
99 311
9
73 259
7
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Mazowieckie
Opolskie
Opolskie
Podkarpackie
Podkarpackie
Podkarpackie
Podkarpackie
Podlaskie
Podlaskie
Podlaskie
Pomorskie
Pomorskie
Pomorskie
Pomorskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
Śląskie
1465048 Warszawa Bielany
118 672
1465058 Warszawa Mokotów
199 219
1465068 Warszawa Ochota
79 837
1465078 Warszawa Praga Południe 160 999
1465088 Warszawa Praga Północ 62 144
1465098 Warszawa Rembertów
20 161
1465108 Warszawa Śródmieście 113 207
1465118 Warszawa Targówek
107 715
1465128 Warszawa Ursus
42 621
1465138 Warszawa Ursynów
129 550
1465148 Warszawa Wawer
59 613
1465158 Warszawa Wesoła
18 947
1465168 Warszawa Wilanów
16 720
1465178 Warszawa Włochy
34 640
1465188 Warszawa Wola
122 956
1465198 Warszawa Żoliborz
42 422
1603011 Kędzierzyn Koźle
55 874
1661011 Opole
110 664
1811011 Mielec
52 070
1818011 Stalowa Wola
54 971
1862011 Przemyśl
56 957
1863011 Rzeszów
152 866
2061011 Białystok
255 185
2062011 Łomża
54 096
2063011 Suwałki
58 255
2214011 Tczew
50 419
2261011 Gdańsk
395 525
2262011 Gdynia
214 636
2263011 Słupsk
84 011
2401011 Będzin
51 069
2411011 Racibórz
48 999
2413041 Tarnowskie Góry
52 637
2416021 Zawiercie
45 135
2461011 Bielsko Biała
151 045
2462011 Bytom
158 057
2463011 Chorzów
96 970
2464011 Częstochowa
208 792
2465011 Dąbrowa Górnicza
111 933
2466011 Gliwice
171 409
2467011 Jastrzębie Zdrój
78 548
2468011 Jaworzno
82 332
2469011 Katowice
270 612
2470011 Mysłowice
64 293
2471011 Piekary Śląskie
50 542
2472011 Ruda Śląska
122 266
2473011 Rybnik
120 443
2474011 Siemianowice Śląskie
61 262
5
11
19
8
15
6
2
11
10
4
12
6
2
1
3
12
4
5
10
4
5
5
15
24
5
5
4
38
21
7
4
4
4
4
14
15
9
20
11
16
7
7
26
6
4
12
11
5
Śląskie
2475011 Sosnowiec
Śląskie
2476011 Świętochłowice
Śląskie
2477011 Tychy
Śląskie
2478011 Zabrze
Śląskie
2479011 Żory
Świętokrzyskie
2607011 Ostrowiec Świętokrzyski
Świętokrzyskie
2611011 Starachowice
Świętokrzyskie
2661011 Kielce
Warmińsko-Mazurskie 2805011 Ełk
Warmińsko-Mazurskie 2861011 Elbląg
Warmińsko-Mazurskie 2862011 Olsztyn
Wielkopolskie
3003011 Gniezno
Wielkopolskie
3017011 Ostrów Wielkopolski
Wielkopolskie
3019011 Piła
Wielkopolskie
3061011 Kalisz
Wielkopolskie
3062011 Konin
Wielkopolskie
3063011 Leszno
Wielkopolskie
3064029 Poznań Grunwald
Wielkopolskie
3064039 Poznań Jeżyce
Wielkopolskie
3064049 Poznań Nowe Miasto
Wielkopolskie
3064059 Poznań Stare Miasto
Wielkopolskie
3064069 Poznań Wilda
Zachodniopomorskie 3214011 Stargard Szczeciński
Zachodniopomorskie 3261011 Koszalin
Zachodniopomorskie 3262011 Szczecin
193 312
46 326
112 049
162 649
52 167
62 876
45 194
178 825
48 485
108 702
152 744
58 934
62 361
63 387
91 989
68 442
54 504
103 662
69 650
122 870
133 955
53 246
59 730
94 608
354 609
18
4
11
16
4
5
4
17
4
10
15
5
5
5
9
6
5
10
6
12
13
5
5
9
34
2.2 Dobór próby w miastach poniżej 50 tys. mieszkańców oraz na wsi
W przypadku pozostałej części populacji — obejmującej miasta o liczebności
populacji poniżej 50 tys. mieszkańców oraz ludność zamieszkałą na wsi — zastosowano
odmienny schemat losowania próby, a mianowicie dwustopniowy losowy dobór warstwowy.
W przypadku rozważanej klasy miejscowości w pierwszej fazie losowano nie pojedyncze
osoby, lecz miejscowości, z których następnie losowano wiązki 4-osobowe.
Dobór miejscowości miał charakter doboru warstwowego, przy czym warstwy
wyróżniono ze względu na (i) kategorię wielkości miejscowości (wieś, miasto do 10 tys.
mieszkańców, miasto 10-20 tys. mieszkańców, miasto 20-50 tys. mieszkańców) oraz (ii)
województwo. Łącznie wyróżniono więc 64 warstwy. W obrębie każdej warstwy
miejscowości
zostały
dobrane
metodą
losowania
ze
zwracaniem,
przy
czym
prawdopodobieństwa losowania poszczególnych miejscowości przyjęto jako proporcjonalne
do ich wielkości (tj. proporcjonalnie do liczby mieszkańców w wieku 15 lub więcej).
6
W kolejnym etapie w ramach każdej z wylosowanych miejscowości (miasta lub wsi)
losowana była wiązka 4 osobowa tj. losowano 4 osoby w sposób prosty bezzwrotny.
Schemat dwustopniowego doboru zawierający element wiązkowania jest mniej
efektywny od schematu prostej próby losowej. Niemniej, zastosowanie wiązkowania w
przypadku wsi i małych miast było uzasadnione kwestami organizacyjnymi i finansowymi.
Ponieważ fakt zastosowania dwustopniowego schematu losowania ma wpływ na wariancję
estymatorów i prowadzi do obniżenia tzw. efektywnej wielkości próby, czynnik ten nie może
być zignorowany podczas analizy wyników badania. Zamieszczamy zbiór z danymi
opisującymi prawdopodobieństwa wylosowania poszczególnych miejscowości, osób,
informacje o warstwach etc. („ESS6PL_dane_doboru_proby.csv”). Poniżej znajduje się opis
zmiennych zawartych w tym zbiorze.
Tabela 3. Opis zmiennych w zbiorze doboru próby (ESS6PL_dane_doboru_proby.csv)
NAZWA
OPIS
ZMIENNEJ
IDNO
Jest to zanoniminizowana zmienna identyfikująca poszczególne
jednostki obserwacji; Zmienną z taką samą nazwą można znaleźć w
zbiorach
danych
ESS
zamieszczonych
na
stronie
www.europeansocialsurvey.org. Możliwe jest więc zintegrowanie
zmiennych opisujących kwestie doboru próby z danymi dla polskiego
zbioru ESS6.
PROB1
Zmienna
określa
prawdopodobieństwo
wylosowania
danej
miejscowości. W przypadku miast o liczbie mieszkańców powyżej 50
tys. mieszkańców wynosi ono 1. W przypadku miast o liczbie
mieszkańców poniżej 50 tys. mieszkańców lub wsi jest ono mniejsze
od 1.
PROB2
Zmienna określa prawdopodobieństwo wylosowania osoby w obrębie
miejscowości (miasta lub wsi).
STRATEX1
Zmienna stratyfikująca. W przypadku miast poniżej 50 tys.
mieszkańców, warstwa jest kombinacją klasy wielkości miejscowości
(pierwsza cyfra - 1. wsie, 2. miasta poniżej 10 tys. mieszkańców, 3.
miasta 10-19 tys. mieszkańców, 4. miasta 20-49 tys. mieszkańców) i
województwa (kolejne dwie cyfry - zgodne z klasyfikacją TERYT). W
7
przypadku miast powyżej 50 tys. mieszkańców, zmienna ma
unikatową wartość dla każdego miasta (również w tym przypadku
pierwsza cyfra wskazuje na klasę wielkości miejscowości).
PSU
Oznaczenie danej miejscowości wylosowanej z poszczególnej
warstwy. W przypadku miast powyżej 50 tys. mieszkańców zmienna
jest tożsama ze zmienną STRATEX.
OUTCOME
Zmienna wskazuje na informacje dotyczące realizacji wywiadu dla
danej osoby (1-wywiad zrealizowany; 2-wywiad niezrealizowany; 3osoba nie wchodząca w skald populacji (tzw. kategorii ineligibles).
POP15_STRATEX1 Wielkość populacji odpowiadająca danej warstwie (na podstawie
danych GUS, 30 XII 2010) – liczba osób powyżej 15 roku życia.
8

Podobne dokumenty