Modellpontok képzése és használata Dr. Kovács Erzsébet egyetemi tanár Budapesti Corvinus Egyetem A jogosultságszerzés modellezése szekció 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
1
Szakmai kihívás és érdekes feladat Murphy szerint Booker törvénye: Egy gramm alkalmazás felér egy tonna elvonatkoztatással. Modellpont= adatbányászat vagy statisztikai elemzés??? 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
2
Előzmények
NYIKA Jelentés 2010 (Szerk: Holtzer Péter) Ennek 7. melléklete: A hatásvizsgálat mikroszimulációs modellje (Horváth Gyula)
Modellpontok szerinti kalkuláció
A jogosultságszerzők és a teljes népesség összevetése (Rétallér Orsolya) Felkérés modellpontok képzésére Modellpontok kialakítása az aktívakra és az ellátottakra (Kovács Erzsébet és Vékás Péter) Forrás: ONYF Adminisztratív adatai és KSH 2015.05.28.
3
MIDAS_HU Workshop: Modellpontok képzése
A feladat kettőssége
2012-ig tartó 9 321 199 adatból a jövőbeni modellpontok? Jogosultság-szerzőkről sok egyedi adat, de
Személyi jellemzők kevéssé ismertek Nem reprezentatív része a népességnek – életkor szerint nagy eltérések
Ellátottakról
2015.05.28.
Korábbi személyi adatok (pl. foglalkozás, szolgálati idő hossza) nem ismertek Részletes adat: az ellátás típusa és a járadék nagysága MIDAS_HU Workshop: Modellpontok képzése
4
ONYF 5 kohorsz követése: max 80%
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
5
A teljes népesség
Sok egyedi adatot (is) tudunk, amit az ONYF nem tart nyilván (pl. iskolai végzettség, családi állapot) Viszonyítási pontot jelent
a jogosultságszerzők adatainak és megoszlásának ellenőrzésére az újonnan belépők modellpontjainak képzésében
Néhány ábra következik a tendenciák áttekintésére (életkor nemek szerint, családi állapot, szülések száma, stb.) – a változás nem ért véget!
2015.05.28.
6
MIDAS_HU Workshop: Modellpontok képzése
Munkakezdők (keveset tud az ONYF róluk) és nyugdíjba vonulók várható száma Magyarországon 2300000 2100000 1900000 1700000 15-24 évesek
1500000
nyugdíjba menők száma
1300000 1100000 900000
20 0 20 0 0 20 2 0 20 4 0 20 6 0 20 8 1 20 0 1 20 2 1 20 4 1 20 6 1 20 8 2 20 0 2 20 2 2 20 4 2 20 6 2 20 8 3 20 0 3 20 2 3 20 4 3 20 6 3 20 8 4 20 0 4 20 2 4 20 4 4 20 6 4 20 8 50
700000
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
7
A népesség száma nem és kor szerint, hatalmas változás volt 1910. január 1.
2011. január 1.
100–X
100–X
90
90
Férfi
Nő
80
Nő
Férfi 80
70
70
60
60
50
50
40
40
30
30
20
20
10
10
0 120 100 80 60 40 Ezer lakos
2015.05.28.
20
0
0 0
20
40
60
80 100 120 120 100 80 60 40 Ezer lakos Ezer lakos
20
0
MIDAS_HU Workshop: Modellpontok képzése
0
20
40
60
80 100 120
Ezer lakos
8
A népesség száma nem, életkor és családi állapot szerint, 2011. január 1. Nem stabil arány és nem szimmetrikus 100–X Férfi
Nő
90 80 70 60 50 40 30 20 10 0
100
80
60
Házas
2015.05.28.
40
Ezer lakos
20
Nőtlen, hajadon
0
0
20
Elvált
40 60 Ezer lakos
80
100
Özvegy
MIDAS_HU Workshop: Modellpontok képzése
9
40 és 60 éves korban várható átlagos élettartam, 1960–2010
A növekedés (hogyan) folytatódik? 40 éves korban várható átlagos élettartam
60 éves korban várható átlagos élettartam 0
(e60)
0
(e40)
Férfi
2015.05.28.
2010
2005
2000
1995
1990
1985
1980
1975
1970
Év
1965
2010
13
2005
25
2000
15
1995
28
1990
17
1985
31
1980
19
1975
34
1970
21
1965
37
1960
23
1960
Év 40
Nő
MIDAS_HU Workshop: Modellpontok képzése
10
Az eltérés tartós máshol is: 80 éves angol adatsor 85 Females
80 75
Males
EOLB Years
70 65 60 55 50 45 40 1911
2015.05.28.
1921
1931
1941
1951 1961 Year
1971
MIDAS_HU Workshop: Modellpontok képzése
1981
1991
11
A szülő nők átlagos életkora 1990–2010
Élveszületések az anya életkora szerint (f x )
(x)
Ezer nőre
Év
180
33
150
31
120
29
90
27
60
25
30
23
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Korév
1990
2015.05.28.
2000
2010
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
21
0
Első
MIDAS_HU Workshop: Modellpontok képzése
Második gyermeknél
Harmadik
12
Modellpont képzés módszerei 1.
Mintavételi módszerek
2.
Véletlen, egyszerű vagy rétegzett mintavételi eljárások Gond: A mintába kerülő személyek, családfők száma lényegesen kisebb, mint a modellpontok száma. A kérdőíves megkeresés és adatgyűjtés időigényes és drága.
Klaszterező eljárások
Struktúrafeltárás Gond: Klaszterek a modellpontok, de jellemzőikhez nem adhatók meg kategória-határok. A változók mérési skálája nagyon különböző.
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
13
Modellpont képzés módszerei 3. Kategória-kombinációk képzése változónként kategóriákat képezünk kategória-összevonásokkal, több változó kategóriáinak lehetséges kombinációból alkotunk csoportokat=modellpontokat, egy-egy csoportban a gyakoriság „megfelelő” legyen
Nem üres kategóriák Egymást át nem fedő csoportok. Statisztikai tulajdonságaikkal írjuk el a MP-ket.
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
14
Életkor szerinti elhatárolás: 16-61 évesek modellpontjai
7 ismert adat:életkor (46 korév), nem (2), régió (3), településtípus (3), jövedelem (5 kvintilis), foglalkozás (4) és foglalkoztatás (10)* E hét változó kategóriáiból képezhető kombinációk száma: 165 600 modellpont.
*Foglalkoztatás szerint három főprofil (magasan, közepesen és alacsonyan foglalkoztatottak)+ellátottak és a pszeudó jogviszonnyal rendelkezők: öt főprofil 2011-hez képest változott-e
„Üresek” összevonása után 92 720 aktív modellpont, egy pont átlagosan 58 fő 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
15
Aktívak foglalkoztatása (Vékás Péter előadása) és jövedelme Kvintilis
Átlag
Szórás
Alsó határ
1
250 191 Ft
128 828 Ft
0 Ft
2
673 278 Ft
130 441 Ft
451 321 Ft
3
1 125 859 Ft
132 876 Ft
901 609 Ft
4
1 753 731 Ft
246 260 Ft
1 373 359 Ft
5
4 227 766 Ft
5 053 477 Ft
2 249 233 Ft
1 606 165 Ft
2 663 972 Ft
Teljes
állomány 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
16
Életkor szerinti elhatárolás: 61 év felettiek modellpontjai – 2 elő-lépés Az állomány 2 689 521 főt tartalmaz, benne a passziválási kód szerint: 1=halott és 2=egyéb, 1)a még élő személyek: 2 591 811 fő (96,4%) 2) a 16-61 évesek mind aktív korúak az átfedések elkerülése miatt a nyugellátás modellpontjaiban nem vesszük figyelembe ezt a kortartományt.
A 2012-es adatok miatt az 1950-ben és előtte született személyek 62+ évesek, 1 541 981 fő adatai alapján képezhetők modellpontok 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
17
Nyugdíjas modellpontok
1 538 965 fő maradt, akik 62 év felettiek, még élnek (max 104 év), és részesültek is nyugdíjban 3 változó: kor, nem, profil kategória valamennyi lehetséges kombinációja: 43 x 2 x 2= 172 modellpont képezhető Régió és település nem használható, csak 30%-nak ismert a régiós besorolása, a településtípus adat Néhány üres kategóriakombináció
156 modellpont, egy pont átlagosan 9865 egyént tartalmaz
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
18
Nyugdíjkifizetések: átlagok 3016 főnek végig nulla Ft kifizetés férfi nő Összes
férfi nő Összes
N
Átlag
Szórás
Std. hiba
Minimum
Maximum
649332
122984,78
52334,823
64,947
140
1507350
889633
104039,86
41526,253
44,027
175
746965
1538965
112033,25
47328,801
38,151
140
1507350
N
Átlag
Szórás
Std. hiba
Minimum
Maximum
77
149606,34
36791,82
4192,82
92270,00
331035,00
79
116283,98
17415,70
1959,42
91810,00
194882,50
156
132731,55
33101,22
2650,22
91810,00
331035,00
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
19
Belső ellenőrzés – problémák kezelése
Az alacsony létszámú modellpontok összevonása Hiányzó változó-értékek kezelése feltételes eloszlások szerint A nyilvántartásból hiányzók kezelése KSH adatokból (különösen a fiatalok, pályakezdés előtt állók)
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
20
2011-es Népszámlálás adatainak 10%-os mintája
Adatok a KSH Kutatószobájából A 10%-os véletlen minta háromszintű: lakás, háztartás (kiválasztás alapja), ezen belül személy Háztartás és személy szintű anonimizált adatokat használtunk
2011-es népszámlálásból 2012-es ONYF adatok egy évnyi eltérés áthidalása: a népszámlálási adattáblában a személyeket egy évvel megöregítettük
Cél: ellenőrzés és teljeskörűsítés 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
21
Az összehasonlítás tanulságai
A „középső” életkorokban és a tipikus foglalkoztatás mellett jól megfelel egymásnak a KSH minta és az ONYF adatbázis. Jelentősebb eltérések:
a szélső életkorokban, a fiatalok és a nyugdíj előtt állók korcsoportjaiban, a nem szabályos foglalkoztatási kategóriákban
Érdemes lenne a teljes népszámlálás adatait elkérni a KSH-tól 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
22
Teljeskörűsítés lépései
Az aktívak teljessé tétele a KSH adatok felhasználásával: az aktívak 92720 modellpontjára négy kategória szerint arányosítottuk az emberek számát: életkor, nem, régió és aktivitás (6,3 millió főt fed le) Az ellátottak teljessé tétele az ONYF állományi adatok felhasználásával: életkor és nem alapján (2 millió fő)
2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
23
Források
http://www.demografia.hu/index.php/kiadvanyok/mhelytanulmanyok Kamarás Ferenc sok írása, pl. http://www.ksh.hu/docs/hun/xftp/gyor/nep/nep21201.pdf Cragg, R.: The Demographic Investor, Financial Times, Pitman Publishing, 1998. http://www.penzugyiszemle.hu/vitaforum/gyermekvallalas-esnyugdijrendszer-a-reform-10-alaptetele (Botos József és Botos Katalin) Kovács Erzsébet: A nyugdíjreform demográfiai korlátai http://www.bankszovetseg.hu/wpcontent/uploads/2012/10/HSz2_128_149ig.pdf Nyugdíj és gyermekvállalás Tanulmánykötet, Gondolat 2012. (szerk: Kovács Erzsébet, 16 szerző írása) Nyika Jelentés (2010), Szerk: Holtzer Péter, MEH, Budapest Modellpont csoportosítás az ONYF mikroszimulációs modelljéhez (Tanulmány, 2014. december, Kovács Erzsébet)
2015.05.28.
24
MIDAS_HU Workshop: Modellpontok képzése
Köszönöm a modellpontok iránti figyelmet!
[email protected] 2015.05.28.
MIDAS_HU Workshop: Modellpontok képzése
25