´ ı rozdelen´ ˇ ı roˇcn´ıch pˇr´ıjmu˚ Modelovan´ ´ cˇ esk´ych domacnost´ ı J. Bartoˇsova´ 1
M. Forbelska´ 2
1 Katedra managementu informac´ı Fakulta managementu v Jindˇrichoveˇ Hradci Vysoka´ sˇ kola ekonomicka´ v Praze 2´ Ustav matematiky a statistiky Oddˇelen´ı aplikovan´e matematiky ˇ Pˇr´ırodovedeck a´ fakulta MU Brno
Robust 2010 ´ ıky 31. ledna – 5. unora ´ 2010, Kral´
ˇ an´ ´ ı v´ysledku˚ sˇ etˇren´ı pˇr´ıjmu˚ Zobecnov ˇ ´ domacnost´ ı v CR ˇ a´ sˇ etˇren´ı Mikrocensus a cˇ eska´ modifikace sˇ etˇren´ı V´yberov ˇ ´ EU–SILC, Zivotn´ ı podm´ınky, pˇredstavuj´ı datovou zakladnu pro ´ an´ ´ ı informac´ı t´ykaj´ıc´ıch se pˇredevˇs´ım pˇr´ıjmu˚ cˇ esk´ych z´ıskav ´ domacnost´ ı. ´ ı v´yberov´ ˇ ych souboru˚ jsou take´ kalibraˇcn´ı vahy ´ Duleˇ ˚ zitou souˇcast´ ˇ na (veliˇcina PKOEF), ktere´ slouˇz´ı k pˇrepoˇctu v´ysledku˚ z v´yberu ˇ ı v´ysledky provad ´ en´ ˇ ych anal´yz. celou populaci a ktere´ ovlivnuj´
´ Otazkou je: Jak lze korektneˇ zapracovat kalibraˇcn´ı koeficienty ´ en´ ˇ ych anal´yz? do provad
´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ Konstrukce kalibraˇcn´ıch koeficientu˚ domacnost´ ı v Mikrocensu 2002 Pˇri konstrukci kalibraˇcn´ıch koeficientu˚ (veliˇcina PKOEF) byla pouˇzita iteraˇcn´ı metoda, ktera´ minimalizuje rozd´ıl mezi odhadnut´ymi a ˇ ymi charakteristikami vybran´ymi pro kaˇzd´y kraj pˇrepoˇc´ıtan´ymi v´yberov´ ´ sˇt, a to s pomoc´ı nasleduj´ ´ zvlaˇ ıc´ıch charakteristik1 : poˇcet trvale obydlen´ych bytu˚ poˇcet osob bydl´ıc´ıch v bytech poˇcet duchodc ˚ u˚ (pracuj´ıc´ıch i nepracuj´ıc´ıch ˇ poˇcet nezamestnan´ ych poˇcet samostatneˇ cˇ inn´ych osob
1 Zdroj:
Metodika. Mikrocensus 2002 ´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ Konstrukce kalibraˇcn´ıch koeficientu˚ domacnost´ ı v sˇ etˇren´ı EU-SILC ´ ktere´ byly pouˇzity pro pˇrepoˇcet K v´ysˇ e uveden´ym charakteristikam, v´ysledku˚ z Mikrocensu 2002, pˇribylo v sˇ etˇren´ı EU-SILC 2005 jeˇsteˇ ˇ ı domacnost´ ´ dalˇs´ı cˇ lenen´ ı, a to podle: ˇ osoby stoj´ıc´ı v cˇ ele domacnosti ´ veku velikostn´ı skupiny obc´ı ´ ı k asi 10%-n´ımu podhodnocen´ı pˇr´ıjmu, V sˇ etˇren´ı take´ dochaz´ ˚ a to proto, zˇ e dotazovan´ı si na vˇsechny sve´ pˇr´ıjmy nevzpomenou a maj´ı ´ snahu udavat niˇzsˇ ´ı pˇr´ıjmy neˇz jake´ odpov´ıdaj´ı skuteˇcnosti. Toto zkreslen´ı se velice obt´ızˇ neˇ kvantifikuje, a proto jsou hodnoty ´ po porovnan´ ´ ı s udaji ˇ ych hrub´ych mzdach. ´ korigovany ´ o prum ˚ ern´ ´ ıch davek, ´ ´ en ˇ e´ Podobneˇ se postupovalo v pˇr´ıpadeˇ socialn´ kde uvad hodnoty naopak pˇrekraˇcuj´ı skuteˇcnost2 . 2 Nekteˇ ˇ r´ı
´ eˇ zahrnuj´ı davky ´ ´ ı potˇrebnosti. respondenti sem nespravn socialn´ ´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ Zakladn´ ı charakteristiky kalibraˇcn´ıch vah ´ domacnost´ ı (EU-SILC 2007) ´ Zakladn´ ı statisticke´ charakteristiky kalibraˇcn´ıch vah PKOEF (EU–SILC 2007). minimum 100.0
1. kvartil 294.6 ˇ pr˚umer 417.9
´ median 369.8 ˇ odch. smer. 205.5
3. kvartil 493.6 suma vah 4043341
maximum 3475.0
´ PKOEF je (v EU–SILC 2005–2007) vˇzdy vetˇ ˇ s´ı kalibraˇcn´ı vaha nebo rovna 100 ´ souˇcet vah je cca 4 miliony
´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ ´ Ukazka zavislosti kalibraˇcn´ıch vah na vybran´ych ˇ ych (EU–SILC 2007) promenn´ Váhy vs. poč et č lenů domácnosti
2500 0
0
500
1500
Kalibrač ní váhy
1000 500
Kalibrač ní váhy
1500
3500
Váhy vs. příjem
400
600
800
1000
1
3
4
5
6
7
8
Poč et č lenů domácnosti
Váhy vs. typ obce
Váhy vs. sociální skupina
9
10
2000
Kalibrač ní váhy
0
500 1000
2000 500 1000 0
Kalibrač ní váhy
2
Č isté příjmy domácnosti [tis. Kč ]
3000
200
3000
0
hl.m. Praha
krajské obce
mě stské obce
venkovské obce
Typ obce
´ M. Forbelska´ J. Bartoˇsova,
nižší z.
s. č inný
vyšší z.
d. s EA d. bez EA nezam.
Sociální skupina osoby v č ele
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
ostatní
´ ı Metody anal´yzy a modelovan´
ˇ ´ rozdelen´ ı pˇr´ıjmu˚ (vydaj ´ u) ˚ domacnost´ ı (jednotlivcu) ˚ ´ ´ zavislosti pˇr´ıjmu˚ (vydaj ´ u) ˚ domacnost´ ı (jednotlivcu) ˚ na ruzn´ ˚ ych demografick´ych a spoleˇcensko-ekonomick´ych faktorech ˇ ´ sanc´ ı domacnost´ ı (jednotlivcu) ˚
´ Kl´ıcˇ ovou otazkou je: Jak lze korektneˇ zapracovat kalibraˇcn´ı koeficienty ´ en´ ˇ ych anal´yz? do provad
´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ zene´ popisne´ statistiky Vaˇ ˇ ı vahy ´ normovane´ kalibracn´ wi wi∗ = Pn
i=1
wi
,
´ ze souboru EU–SILC (tj. nenormovane), ´ kde wi jsou vahy ˇ ´ zeny´ prum ˇ vyb ´ erov y´ vaˇ ˚ er n X x¯ = wi∗ · xi ´ zeny´ rozptyl vaˇ
i=1
´ eˇ verohodn´ ˇ maximaln y odhad n X 2 sML = wi∗ · (xi − x¯ )2 i=1
ˇ ´ ´ zeneho ´ nevych´ylen´y odhad v´yberov eho vaˇ rozptylu n X n 2 sUN = wi∗ · (xi − x¯ )2 n−1 i=1
ˇ e´ X ´ zeny´ p%-n´ı kvantil je nejvyˇssˇ ´ı hodnota promenn vaˇ ˇ e´ vzestupne), ˇ jej´ızˇ kumulativn´ı vaha ´ (setˇr´ıden ˇ a´ a (setˇr´ıden ´ je menˇs´ı nebo rovna p. (V prostˇred´ı R na pˇr. normovana) v knihovneˇ HMisc) ´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ ı vaˇ ´ zen´ych a prost´ych odhadu˚ zakladn´ ´ Porovnan´ ıch charakteristik roˇcn´ıch pˇr´ıjmu˚ (EU-SILC 2007) ´ zene´ odhady zakladn´ ´ Proste´ a vaˇ ıch charakteristik cˇ ist´ych roˇcn´ıch ´ pˇr´ıjmu˚ domacnost´ ı (v Kˇc) podle typu obce. typ obce Hl. m. Praha ˇ krajska´ mesta ˇ mestsk e´ obce venkov. obce bez rozliˇsen´ı
obyˇcejn´y 332170.5 269649.7 268747.6 271349.3 275468.1
ˇ prum ˚ er ´ zen´y vaˇ 349557.6 290622.2 287025.9 292450.9 297598.7
ˇ smerodatn a´ odchylka ´ zena´ obyˇcejna´ vaˇ 230874.8 243909.5 183855.6 193654.1 188883.4 212320.2 172154.0 192697.8 187442.7 208833.5
typ obce Hl. m. Praha ˇ krajska´ mesta ˇ mestsk e´ obce venkov. obce bez rozliˇsen´ı
obyˇcejn´y 275645.0 222000.0 227354.5 235143.5 232864.0
´ median ´ zen´y vaˇ 302144.0 243500.0 243506.0 254005.0 253446.0
ˇ prum ˚ er vah 617.3 446.4 395.6 381.7 417.9
´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
poˇcet hodnot 864 1423 3952 3436 9675
´ ı vaˇ ´ zen´ych a prost´ych odhadu˚ zakladn´ ´ Porovnan´ ıch charakteristik roˇcn´ıch pˇr´ıjmu˚ (EU-SILC 2007) ´ zene´ charakteristiky cˇ ist´ych roˇcn´ıch pˇr´ıjmu˚ domacnost´ ´ Proste´ a vaˇ ı ´ ı skupiny. (v Kˇc) podle socialn´ ´ ı skupina socialn´ niˇzsˇ ´ı zamˇest. samost. cˇ inn´ı vyˇssˇ ´ı zamˇest. duchodci ˚ s EA duch. ˚ bez EA nezamˇestnan´ı ostatn´ı bez rozliˇsen´ı
prumˇ ˚ er ´ zen´y prost´y vaˇ 304047.1 314675.0 418465.6 435951.2 375554.9 386432.4 38958.3 353382.5 159761.9 162135.9 159139.3 162382.5 171766.3 172946.8 275468.1 297598.7
´ ı skupina socialn´ niˇzsˇ ´ı zamˇest. samost. cˇ inn´ı vyˇssˇ ´ı zamˇest. duchodci ˚ s EA duch. ˚ bez EA nezamˇestnan´ı ostatn´ı bez rozliˇsen´ı
´ median ´ zen´y prost´y vaˇ 284144.0 292871.0 349214.0 363412.0 345405.0 354063.0 323381.5 337618.0 142392.0 152520.0 138387.0 147647.0 124720.0 123432.0 232864.0 253446.0
´ M. Forbelska´ J. Bartoˇsova,
smˇerodatn´a prosta´ 139148.1 334487.1 186078.1 117133.1 70998.9 118090.8 220989.5 187442.7 prumˇ ˚ er vah 420.4 630.1 433.6 429.2 332.3 731.1 380.4 417.9
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
odchylka ´ zen´a vaˇ 144471.9 354580.3 189254.2 126796.6 70866.1 120612.9 217403.1 208833.5 poˇcet hodnot 2385 802 2279 418 3423 258 110 9675
´ ı vaˇ ´ zen´ych a prost´ych odhadu˚ monetarn´ ´ ı Porovnan´ ´ chudoby cˇ esk´ych domacnost´ ı v letech 2002 – 2007 ´ ı chudoby za pouˇzit´ı Vliv kalibraˇcn´ıch vah na hranici rizika monetarn´ ´ ruzn´ ˚ ych jednotek pro urˇcen´ı pˇr´ıjmu˚ domacnosti. Rok 2002
2005
2006
2006
Typ spotˇrebn´ı jednotky ´ na domacnost na osobu ´ na domacnost na osobu def. EU def. OECD ´ na domacnost na osobu def. EU def. OECD ´ na domacnost na osobu def. EU def. OECD
´ ı chudoby Hranice rizika monetarn´ ´ zen´y odhad vaˇ prost´y odhad 116909 114554 52000 53522 132549 123246 58200 58230 78786 76500 68223 67199 139743 128088 60912 60384 83052 79568 72000 69926 152069 139718 65850 65246 89611 86129 77662 75600
´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ ı vaˇ ´ zen´ych a prost´ych odhadu˚ monetarn´ ´ ı Porovnan´ ´ chudoby cˇ esk´ych domacnost´ ı v letech 2002 – 2007 ´ Vliv kalibraˇcn´ıch vah na pod´ıl domacnost´ ı pod hranic´ı rizika ´ ı chudoby za pouˇzit´ı ruzn´ monetarn´ ˚ ych jednotek pˇr´ıjmu. ˚
Rok
2002
2005
2006
2007
Typ spotˇrebn´ı jednotky ´ na domacnost na osobu ´ na domacnost na osobu def. EU def. OECD ´ na domacnost na osobu def. EU def. OECD ´ na domacnost na osobu def. EU def. OECD
ˇ Cetnost pod hranic´ı chudoby ´ zeny´ odhad vaˇ prosty´ odhad absolutn´ı relativn´ı absolutn´ı relativn´ı 1833 22.99 % 1782 22.35 % 672 8.43 % 757 9.49 % 1095 25.17 % 1012 23.26 % 439 10.09 % 439 10.09 % 331 7.61 % 291 6.69 % 176 4.05 % 167 3.84 % 1878 25.10 % 1691 22.60 % 753 10.06 % 733 9.80 % 570 7.62 % 469 6.27 % 297 3.97 % 253 3.38 % 2409 24.90 % 2193 22.67 % 858 8.87 % 832 8.60 % 697 7.20 % 566 5.85 % 363 3.75 % 324 3.35 % ´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
Pearsonuv ˚ test nez. Statistika p-hodnota χ2 0.894 0.3443 5.424 0.0199 4.211 0.0402 0.001 0.9716 2.634 0.1046 0.194 0.6594 12.729 0.0004 0.270 0.6035 10.343 0.0013 3.490 0.0617 13.179 0.0003 0.405 0.5244 14.315 0.0002 2.179 0.1400
1.0 0.8 0.6 0.2
0.4
vážený odhad obyč ejný odhad
0.0
Jádrový odhad CDF
0.0030 0.0015
vážený odhad hustoty obyč ejný odhad hustoty
0.0000
Jádrový odhad hustoty
ˇ ı pˇr´ıjmu˚ cˇ esk´ych Vliv kalibraˇcn´ıch vah na rozdelen´ ´ domacnost´ ı (EU–SILC 2007)
0
200
400
600
800
1000
Č istý roč ní příjem domácnosti (v tisících Kč )
0
200
400
600
800
Č istý roč ní příjem domácnosti (v tisících Kč )
´ ˇ ´ Jadrov e´ odhady hustoty pravdepodobnosti (gaussovske´ jadro) a pˇr´ısluˇsne´ empiricke´ distribuˇcn´ı funkce vypoˇctene´ s vyuˇzit´ım kalibraˇcn´ıch vah a bez ˇ ı cˇ ist´ych roˇcn´ıch pˇr´ıjm˚u domacnost´ ´ jejich vyuˇzit´ı. Jedna´ se o odhady rozdelen´ ı v roce 2007. ´ M. Forbelska´ J. Bartoˇsova,
1000
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´
´ ery ˇ Zav ˇ V´ysledky sˇ etˇren´ı Mikrocensus a EU–SILC nelze pˇr´ımo zobecnovat na ´ celou populaci, neboˇt vybrane´ domacnosti nepˇredstavuj´ı reprezentativn´ı ´ eru ˇ vede porovnan´ ´ ı s v´ysledky sˇ etˇren´ı Sˇc´ıtan´ ´ ı lidu, vzorek. K tomuto zav ˇ an´ ´ ı informac´ı z´ıskan´ych bytu˚ a domu˚ (SLBD). Proste´ zobecnov ˇ ´ ke zkreslen´ı, a proto je z v´yberov´ ych soubor˚u by proto mohlo vest ´ provad ´ et ˇ pˇrepoˇcet pomoc´ı kalibraˇcn´ıch vah. potˇreba pˇri anal´yzach ´ ı na mnoha faktorech. Velikost Ukazuje se, zˇ e vliv kalibrace zavis´ kalibraˇcn´ıch vah napˇr. roste s rustem ˚ pˇr´ıjmu, ˚ i kdyˇz tento rust ˚ se u velmi ´ ı cˇ i zeslabovan´ ´ ı vlivu kalibrace vysok´ych pˇr´ıjmu˚ zastavuje. Na zesilovan´ ´ ´ ı ma´ vliv take´ poˇcet cˇ len˚u domacnosti a dalˇs´ı faktory, jako je socialn´ ´ skupina osoby stoj´ıc´ı v cˇ ele domacnosti, typ obce, v n´ızˇ zˇ ije apod. ´ sˇ etˇren´ı take´ vypl´yva, ´ zˇ e kalibraˇcn´ı vahy ´ maj´ı vliv jak na Z provedeneho ˇ ı pˇr´ıjmu˚ brane´ z globaln´ ´ ıho pohledu (hustotu rozdelen´ ˇ ı, cˇ i rozdelen´ distribuˇcn´ı funkci), tak i na jeho souhrnne´ charakteristiky a dalˇs´ı ˇ ı vychazej´ ´ ı. statistiky, ktere´ z tohoto rozdelen´
´ k otazce: ´ Mus´ıme se proto vratit Jak lze korektneˇ zapracovat kalibraˇcn´ı koeficienty ´ en´ ˇ ych anal´yz? do provad ´ M. Forbelska´ J. Bartoˇsova,
´ ı rozdelen´ ˇ ı pˇr´ıjmu˚ Modelovan´