Imputacja i kalibracja w badaniu DG-1

Transkrypt

Imputacja i kalibracja w badaniu DG-1
Imputacja i kalibracja w badaniu DG-1
Alina Szkop, O±rodek Statystyki Maªych Obszarów, Urz¡d Statystyczny w Poznaniu
Adam Ambroziak
Praca metodologiczna 3.207
Zaproponowane metody imputacji i kalibracji
Imputacja i kalibracja w badaniu DG-1 jest
Zaproponowano nast¦puj¡ce metody imputacji:
jedn¡ z prac metodologicznych prowadzonych w
OSMO w Poznaniu. Gªównym celem tej pracy
Metoda I - imputacja na szczeblu grupy/dziaªu wg PKD (autor: Konik M.);
Metoda II - imputacja dla klasy jednostek du»ych i ±rednich (autor: Konik M.) wg wzorów:
jest ocena przydatno±ci imputacji i kalibracji
Pn
P z _mbi
i=1
P Z _mb = LP Z ∗ Pn
i=1 P p_3bi
Pn
wmi
i=1
W m = P Z _mb ∗ Pn
;
i=1 P z _mBi
w badaniu dziaªalno±ci gospodarczej przedsi¦biorstw, ocena jako±ci uzyskanych wyników z
zastosowaniem wymienionych technik, a tak»e
sformuªowanie wytycznych co do mo»liwo±ci ich
praktycznego wykorzystania.
(3)
(4)
Metoda III - imputacja na szczeblu grupy/dziaªu wg PKD;
Metoda IV - imputacja na podstawie jednostek ±rednich wg wzoru:
Badanie DG-1
Pn
wmi
i=1
W m = LP S ∗ Pn
i=1 P z _mbi
Badanie DG-1 jest gªównym ¹ródªem uzyskiwania szybkich informacji o podstawowych miernikach dziaªalno±ci gospodarczej w przedsi¦biorstwach, jak i o sytuacji spoªeczno-gospodarczej
Metoda V
- imputacja ilorazowa:
kraju i województw na potrzeby m.in. informacji publicznej, Narodowego Banku Polskiego
Wm =
czy organizacji mi¦dzynarodowych (Eurostat,
OECD, Mi¦dzynarodowy Fundusz Walutowy,
ONZ). Ponadto badanie to jest podstaw¡ do
opracowywania komunikatów i obwieszcze« Prezesa Gªównego Urz¦du Statystycznego na temat
(5)
n
X
i=1
wmi ∗ Pk
LP S
j=1
LP Sj
;
(6)
Metoda VI - metoda imputacji ±redniej grupowej;
Metoda VII - random hot-deck;
Metoda VIII - kalibracja.
przeci¦tnego miesi¦cznego wynagrodzenia w sekJako±¢ i spójno±¢ uzyskiwanych wyników s¡ nie-
Rezultaty
zwykle wa»nymi elementami w ramach caªego
Poni»ej zaprezentowano wybrane wyniki prowadzonych prac - porównania uogólnionych siedmioma
procesu prowadzenia badania. Dlatego te» wy-
metodami warto±ci zmiennej Sa_1b w poszczególnych sekcjach. Zamieszczone jest równie» zestawie-
bór optymalnej metody z zakresu imputacji i
nie zakresów zmian dla tych metod.
torze przedsi¦biorstw.
kalibracji danych jest istotnym problemem metodologicznym.
Uogólnianie danych w badaniu
Kartoteka DG-1 + Baza B1 -> Baza B3
W bazie B3 dane uogólniane s¡ na poziomie:
1
grupy PKD dla sekcji F, G, H, I, M, N (w
bazie B1 musi istnie¢ co najmniej jeden
rekord dla ka»dej grupy w ramach ka»dej
sekcji.
2
dziaªu PKD dla pozostaªych sekcji (w bazie
B1 musi istnie¢ co najmniej jeden rekord
dla ka»dego dziaªu w ramach ka»dej sekcji).
3
sekcji dla sektorów wªasno±ci (w bazie B1
musi istnie¢ co najmniej jeden rekord dla
sektora prywatnego i publicznego w ramach ka»dej sekcji)
Dane uogólnione w bazie B3 dla wy»szych szczebli agregacji s¡ sum¡ agregatów ni»szego szczebla.
Przykªad:
Na podstawie analizy uzyskanych wyników przypuszcza si¦, »e podej±cie zastosowane w metodzie V
Do uogólniania w bazie B3 przycho-
jest optymalne z punktu widzenia szybkiej i praktycznej implementacji do procesu badania DG-1. W
dów ze sprzeda»y wyrobów i usªug w cenach ba-
porównaniu do uogólnianych warto±ci zmiennej Sa_1b zgodnie z dotychczasow¡ metodologi¡ badania
zowych
DG-1 zmiany wyst¦puj¡ tylko na poziomie sektorów wªasno±ci.
Sa
stosowany jest wska¹nik
Pn
Wu =
i=1
Wu
:
Pm
LP Zi ∗ j=1 LP Sj
Pn
i=1 LP Zi
(1)
wyliczany dla ka»dego dziaªu lub grupy PKD.
Uogólniaj¡c mamy:
Sa_1b = Sa_1bA ∗ W u
gdzie:
(2)
Sa_1bA-zagregowane przychody ze sprze-
da»y wyrobów i usªug w cenach bazowych w danym miesi¡cu.
Oznaczenia
PZ_mB przeci¦tna liczba zatrudnionych, LPZ liczba pracuj¡cych w kartotece, Pz_mb -przeci¦tna liczba zatrudnionych w
jednostce, która zªo»yªa sprawozdanie, Pp_3b -liczba pracuj¡cych w jednostce, która zªo»yªa sprawozdanie, n -liczba jednostek
z obowi¡zkiem sprawozdawczym w agregacie, Wm -imputowana warto±¢ w jednostce imputowanej, wm -warto±¢ w jednostce,
która zªo»yªa sprawozdanie, LPS liczba pracuj¡cych staªa, k liczba jednostek bez obowi¡zku sprawozdawczego w agregacie.
Literatura
1.Estevao V.M., Särndal C-E., (2006), Survey Estimates by Calibration on Complex Auxiliary Information, "International
Statistical Review", Vol. 74, 127-147.
2.Zaªo»enia i wytyczne do systemu informacji o jednostkach prowadz¡cych dziaªalno±¢ gospodarcz¡ na podstawie zawartych
w sprawozdaniu miesi¦cznym DG1 w 2012 r., GUS, Warszawa, 2012.