Badania sondażowe3(4). - E-SGH
Transkrypt
Badania sondażowe3(4). - E-SGH
Badania sondażowe Schematy losowania Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa 1 Próba jako miniatura populacji CELOWA subiektywny dobór jednostek do badania LOSOWA schemat losowy doboru jednostek do badania (wnioski z badania wyciągane są dla populacji, jednak reprezentatywności próby nie można udowodnić) (wnioski z badania wyciągane są dla populacji, a reprezentatywność próby można naukowo udowodnić) 2 Cechy doboru losowego W czasie losowania elementy populacji nie przemieszczają się Dostęp do każdego elementu populacji jest jednakowy Elementy populacji są „wymieszane”, lub kryteria ich uporządkowania są znane, a zmienne porządkujące są zawarte w operacie Próba ma charakter losowy gdy: przyjęte kryterium doboru jednostek jest niezależne od badanych cech każda jednostka zbiorowości ma różne od zera prawdopodobieństwo znalezienia się w próbie 3 Techniki losowania 4 Metoda reprezentacyjna Metoda reprezentacyjna – zajmuje się badaniami statystycznymi, w których zamiast populacji bada się próbę, której reprezentatywność można naukowo uzasadnić. Obejmuje między innymi: Techniki losowania Estymację parametrów za pomocą których jesteśmy w stanie opisać populację Estymację błędów losowych szacowanych parametrów 5 Schemat losowania Schemat losowania (plan losowania) – to sposób postępowania prowadzący przy użyciu określonych technik losowania do wyboru losowego jednostek do badania. Wybór schematu losowania zależy od: Posiadanych informacji o populacji Kosztów badania Warunków organizacyjno - technicznych 6 Kryteria sposobów losowania Kryterium 1 - indywidualne – jednostka losowania to konkretna osoba z którą przeprowadzony zostanie wywiad - zespołowe – jednostka losowania to grupa osób, z którymi przeprowadzony zostanie wywiad PRZYKŁAD: losowanie indywidualne dla sklepów, zespołowe dla klientów tych sklepów Kryterium 2 - niezależne (ze zwracaniem) – proste – prawdopodobieństwo wylosowania każdej jednostki jest identyczne - zależne (bez zwracania) – prawdopodobieństwo wylosowania maleje w miarę losowania kolejnych jednostek Kryterium 3 - z jednakowymi prawdopodobieństwami wyboru - z różnymi prawdopodobieństwami wyboru PRZYKŁAD: losowanie szpitali z prawdopodobieństwem proporcjonalnym do liczby pacjentów Kryterium 4 - nieograniczone (jednostki pobierane równocześnie z całej zbiorowości – losowanie proste) - ograniczone (jednostki pobierane są z części zbiorowości – losowanie warstwowe, systematyczne) Kryterium 5 - jednostopniowe - wielostopniowe PRZYKŁAD: losowanie komisów samochodowych w 3 etapach – województwa – powiaty – komisy 7 Próba prosta Próba, o której była mowa na statystyce to tzw. próba prosta, która powstała w wyniku losowania: jednostopniowego indywidualnego nieograniczonego niezależnego (ze zwracaniem) z jednakowym prawdopodobieństwem wyboru każdej jednostki Schematy losowania stosowane w badaniach ekonomiczno – społecznych to modyfikacje tego losowania. Otaczająca rzeczywistość ma złożoną strukturę i dlatego są potrzebne adekwatne do niej schematy losowania. 8 Techniki losowania Dobór losowy bez zwracania Dobór losowy ze zwracaniem Dobór systematyczny Losowanie nieograniczone – wylosowanie do próby pewnych jednostek nie ogranicza wylosowania innych jednostek Losowanie ograniczone – wylosowanie do próby pewnych jednostek ogranicza wylosowanie innych jednostek Dobór warstwowy Dobór zespołowy Dobór wielostopniowy Losowanie z jednakowym prawdopodobieństwem wyboru: tzw. próby samoważące się Losowanie z różnymi prawdopodobieństwami wyboru: konieczność konstrukcji wag w dalszym etapie analiz 9 Dobór losowy Dobór losowy ze zwracaniem Dobór losowy bez zwracania (efektywniejszy) Stosowany, gdy: Brak jakichkolwiek informacji o populacji Populacje nie są zbyt liczne Przebiega przy użyciu tablic liczb losowych lub generatora liczb losowych Zalety Próby wyważone automatycznie Proste metody obliczania precyzji Łatwy w realizacji Wady Dogodny tylko dla małych populacji Wymaga operatu losowania 10 Dobór systematyczny Wybór co k-tej jednostki zbiorowości generalnej Jednostka wyjściowa jest losowana. k= N n Stosowany, gdy: Populacja jest bardzo liczna Populacja jest homogeniczna Zalety Można stosować gdy jest dostępny operat lub go brak Łatwe – wyznaczany jest tylko punkt startowy i interwał Jest tak samo efektywna jak próba prosta lub efektywniejsza Wady Wymaga wymieszania listy jeśli istnieje Układ elementów może być poza kontrolą badacza – może wystąpić ukryty podział na warstwy Próba uzyskana w wyniku losowania systematycznego może być bardziej efektywna (dawać większą precyzję oszacowań) od losowania prostego, gdy jednostki posortowane zostaną wg pewnych kryteriów (skorelowanych z cechą badaną) – równomierniej od innych schematów losowania pokrywa populację generalną i analiza przebiega wtedy jak dla losowania warstwowego z proporcjonalną do wielkości warstwy liczbą jednostek w próbie. 11 Dobór warstwowy Stosowany, gdy: Istnieją dodatkowe informacje o populacji Populacje są bardzo liczne Aby być pewnym, że grupy składające się na populacje są właściwie reprezentowane w próbie Zalety Bardziej efektywne niż losowanie proste W każdej warstwie można stosować inną technikę losowania Warstwowanie można przeprowadzić po wylosowaniu próby Ułatwia organizację badania Wady Wymagana jest znajomość struktury populacji Jest tym efektywniejsze im mniejsze jest zróżnicowanie cechy wewnątrz warstw Wymaga operatu losowania Dzieląc populację na warstwy musimy dążyć do tego, aby cechy warstwujące wykazywały: znaczną jednorodność cechy badanej wewnątrz warstw oraz znaczną różnorodność między warstwami! 12 Dobór warstwowy Populacja 18-24 25-45 46-64 Podział na warstwy Losowanie z warstw 13 Dobór warstwowy – czemu służy? Zagrożenia w doborze losowym: Nadreprezentatywność: gdy do małej próby wejdą jednostki nietypowe, które nie powinny się tam znaleźć – zaburzają bowiem ocenę parametru Niedoreprezentatywność: gdy w dużej próbie nie pojawi się taki element (nietypowy), którego brak istotnie wpłynie na wartość szacowanego parametru PRZYKŁAD – REGON (wielkość zatrudnienia wpływa na cechę badaną) Firmy małe 0-9 zatrudnionych 1 800 tys. Firmy średnie 10-249 zatrudnionych 160 tys. Firmy duże 250+ zatrudnionych 4 tys. 100,0% 91,6% 80,0% 64% średnie duże 60,0% 40,0% 20,0% małe 28% 8% 8,1% 0,2% 0,0% liczba zatrudnionych Eliminacja tych zagrożeń odbywa się poprzez warstwowanie (stratyfikację) oraz odpowiednią alokację próby w warstwach. liczba telefonów komórkowych 14 Jednostka losowania Może być tożsama z jednostką badania, np.: Osoba indywidualna Gospodarstwo domowe Przedsiębiorstwo Instytucja Może zawierać kilka jednostek badania tworząc zespół, np.: Szkoły (w przypadku badania uczniów) Szpitale (w przypadku badania pacjentów) Sklepy (w przypaku badania klientów) 15 Dobór zespołowy Stosowany, gdy: Populacje są bardzo liczne Istnieją informacje o podgrupach (zespołach) gdy brak jest jakichkolwiek informacji o jednostkach populacji Zalety Umożliwia ograniczenie operatu tylko do listy zespołów Generuje mało rozproszone terytorialnie próby – ułatwia organizację badania Obniża koszty badania Wady Złożony schemat losowania na ogół dwustopniowy: zespoły i jednostki Zazwyczaj zmniejsza efektywność badania Efektywny tylko gdy w próbie znajdzie się duża liczba zespołów o małych rozmiarach każdy Dzieląc populację na zespoły musimy dążyć do tego, aby zespoły wykazywały: znaczną różnorodność cechy badanej w zespołach oraz jednorodność cechy badanej między zespołami 16 Dobór zespołowy Populacja I rejon stat. II rejon Podział na zespoły Losowanie zespołów III rejon IV rejon V rejon 18-24 25-45 46-64 17 Dobór proporcjonalny z różnym prawdopodobieństwem wyboru Stosowany, gdy: Populacje są bardzo liczne Istnieją zespoły o zdecydowanie różnych rozmiarach Zalety Można stosować gdy istnieje operat ograniczony tylko do zespołów Uwzględnia strukturę populacji Wady Wymaga znajomości struktur populacji Wykorzystuje informacje z przeszłości Może wymagać przeważenia danych 18 Dobór wielostopniowy Stosowany gdy zbiorowości są złożone i bardzo duże. Populacja I rejon stat. II rejon Podział na zespoły III rejon IV rejon V rejon Podział na warstwy Losowanie zespołów Losowanie z warstw 18-24 25-45 46-64 19 Dobór wielostopniowy PRZYKŁAD: Szacowany jest odsetek sklepów odzieżowych w Polsce reklamujących swoje towary w prasie. Losowanie dwustopniowe: ETAP I: Operat 1: ZESPOŁY lista powiatów (379) – losowanie z różnym prawdopodobieństwem wyboru jednostki do próby – w zależności od liczby sklepów w powiecie ETAP II: PODZIAŁ NA WARSTWY: 5 warstw wg poziomu sprzedaży za ubiegły rok Operat 2: JEDNOSTKI BADANE lista sklepów – losowanie w warstwach – proporcjonalne do wielkości warstwy UWAGA! Tak skonstruowana próba wymaga ważenia. 20 SPSS: Complex Samples 21