Imputacja i kalibracja w badaniu DG-1
Transkrypt
Imputacja i kalibracja w badaniu DG-1
Imputacja i kalibracja w badaniu DG-1 Alina Szkop, O±rodek Statystyki Maªych Obszarów, Urz¡d Statystyczny w Poznaniu Adam Ambroziak Praca metodologiczna 3.207 Zaproponowane metody imputacji i kalibracji Imputacja i kalibracja w badaniu DG-1 jest Zaproponowano nast¦puj¡ce metody imputacji: jedn¡ z prac metodologicznych prowadzonych w OSMO w Poznaniu. Gªównym celem tej pracy Metoda I - imputacja na szczeblu grupy/dziaªu wg PKD (autor: Konik M.); Metoda II - imputacja dla klasy jednostek du»ych i ±rednich (autor: Konik M.) wg wzorów: jest ocena przydatno±ci imputacji i kalibracji Pn P z _mbi i=1 P Z _mb = LP Z ∗ Pn i=1 P p_3bi Pn wmi i=1 W m = P Z _mb ∗ Pn ; i=1 P z _mBi w badaniu dziaªalno±ci gospodarczej przedsi¦biorstw, ocena jako±ci uzyskanych wyników z zastosowaniem wymienionych technik, a tak»e sformuªowanie wytycznych co do mo»liwo±ci ich praktycznego wykorzystania. (3) (4) Metoda III - imputacja na szczeblu grupy/dziaªu wg PKD; Metoda IV - imputacja na podstawie jednostek ±rednich wg wzoru: Badanie DG-1 Pn wmi i=1 W m = LP S ∗ Pn i=1 P z _mbi Badanie DG-1 jest gªównym ¹ródªem uzyskiwania szybkich informacji o podstawowych miernikach dziaªalno±ci gospodarczej w przedsi¦biorstwach, jak i o sytuacji spoªeczno-gospodarczej Metoda V - imputacja ilorazowa: kraju i województw na potrzeby m.in. informacji publicznej, Narodowego Banku Polskiego Wm = czy organizacji mi¦dzynarodowych (Eurostat, OECD, Mi¦dzynarodowy Fundusz Walutowy, ONZ). Ponadto badanie to jest podstaw¡ do opracowywania komunikatów i obwieszcze« Prezesa Gªównego Urz¦du Statystycznego na temat (5) n X i=1 wmi ∗ Pk LP S j=1 LP Sj ; (6) Metoda VI - metoda imputacji ±redniej grupowej; Metoda VII - random hot-deck; Metoda VIII - kalibracja. przeci¦tnego miesi¦cznego wynagrodzenia w sekJako±¢ i spójno±¢ uzyskiwanych wyników s¡ nie- Rezultaty zwykle wa»nymi elementami w ramach caªego Poni»ej zaprezentowano wybrane wyniki prowadzonych prac - porównania uogólnionych siedmioma procesu prowadzenia badania. Dlatego te» wy- metodami warto±ci zmiennej Sa_1b w poszczególnych sekcjach. Zamieszczone jest równie» zestawie- bór optymalnej metody z zakresu imputacji i nie zakresów zmian dla tych metod. torze przedsi¦biorstw. kalibracji danych jest istotnym problemem metodologicznym. Uogólnianie danych w badaniu Kartoteka DG-1 + Baza B1 -> Baza B3 W bazie B3 dane uogólniane s¡ na poziomie: 1 grupy PKD dla sekcji F, G, H, I, M, N (w bazie B1 musi istnie¢ co najmniej jeden rekord dla ka»dej grupy w ramach ka»dej sekcji. 2 dziaªu PKD dla pozostaªych sekcji (w bazie B1 musi istnie¢ co najmniej jeden rekord dla ka»dego dziaªu w ramach ka»dej sekcji). 3 sekcji dla sektorów wªasno±ci (w bazie B1 musi istnie¢ co najmniej jeden rekord dla sektora prywatnego i publicznego w ramach ka»dej sekcji) Dane uogólnione w bazie B3 dla wy»szych szczebli agregacji s¡ sum¡ agregatów ni»szego szczebla. Przykªad: Na podstawie analizy uzyskanych wyników przypuszcza si¦, »e podej±cie zastosowane w metodzie V Do uogólniania w bazie B3 przycho- jest optymalne z punktu widzenia szybkiej i praktycznej implementacji do procesu badania DG-1. W dów ze sprzeda»y wyrobów i usªug w cenach ba- porównaniu do uogólnianych warto±ci zmiennej Sa_1b zgodnie z dotychczasow¡ metodologi¡ badania zowych DG-1 zmiany wyst¦puj¡ tylko na poziomie sektorów wªasno±ci. Sa stosowany jest wska¹nik Pn Wu = i=1 Wu : Pm LP Zi ∗ j=1 LP Sj Pn i=1 LP Zi (1) wyliczany dla ka»dego dziaªu lub grupy PKD. Uogólniaj¡c mamy: Sa_1b = Sa_1bA ∗ W u gdzie: (2) Sa_1bA-zagregowane przychody ze sprze- da»y wyrobów i usªug w cenach bazowych w danym miesi¡cu. Oznaczenia PZ_mB przeci¦tna liczba zatrudnionych, LPZ liczba pracuj¡cych w kartotece, Pz_mb -przeci¦tna liczba zatrudnionych w jednostce, która zªo»yªa sprawozdanie, Pp_3b -liczba pracuj¡cych w jednostce, która zªo»yªa sprawozdanie, n -liczba jednostek z obowi¡zkiem sprawozdawczym w agregacie, Wm -imputowana warto±¢ w jednostce imputowanej, wm -warto±¢ w jednostce, która zªo»yªa sprawozdanie, LPS liczba pracuj¡cych staªa, k liczba jednostek bez obowi¡zku sprawozdawczego w agregacie. Literatura 1.Estevao V.M., Särndal C-E., (2006), Survey Estimates by Calibration on Complex Auxiliary Information, "International Statistical Review", Vol. 74, 127-147. 2.Zaªo»enia i wytyczne do systemu informacji o jednostkach prowadz¡cych dziaªalno±¢ gospodarcz¡ na podstawie zawartych w sprawozdaniu miesi¦cznym DG1 w 2012 r., GUS, Warszawa, 2012.