A mikroszimuláció alkalmazási lehetőségei
Az adatbányászat eredményeinek gyakorlati felhasználása Csicsman József Budapesti Műszaki és Gazdaságtudományi Egyetem Információ- és Tudásmenedzsment Tanszék Mikroszimulációs Kutatócsoport Új Calculus Számítógép-alkalmazási Bt.
Bevezetés A mikroszimulációs módszertan lényege: a sokaság adatait elemi szinten az idő függvényében továbbírjuk (valószínűség-számítási eszközök, törvények, utasítások) Első hazai alkalmazások a KSH-ban Kutatócsoport a BME ITM tanszékén (2001-) SAS alapú Mikroszimuláció szolgáltató rendszer
Csoportos alkalmazásfejlesztés Oktatás támogatás Nagy adatállományok kezelése Széleskörű elemzési lehetőség
Adatbányászat
2
2010
A mikroszimuláció… Reprezentatív minta
Szimuláció
Mintavétel Alapsokaság (Népesség)
Reprezentatív mintára vonatkozó előrejelzés Előrejelzés
Összevetés
Adatbányászat
Népesség a döntések hatásainak elemzése után
3
2010
Felhasználási területek Statisztikai felvételek adatállományának javítása, korábbi felvétel adatállományának továbbírása Várható eredmények pontosabb előrejelzése Intézkedési tervek demográfiai, társadalmi, illetve gazdasági következményeinek hatásvizsgálata Nemzetközi összehasonlítások (versenyképesség, adó és támogatási rendszerek…) Adatbányászat
4
2010
A szolgáltató rendszerrel szemben támasztott követelmények Többnyelvű végfelhasználói felület és csoportos alkalmazásfejlesztési technológia Jogosultságkezelés Metainformációs rendszer Adatkezelés Mikromodul tervezés Táblázatkezelés, becslési eljárások Futtatórendszer és verziókezelés Adatbányászat
5
2010
Statistical Matching A Mikroszmulációs Rendszer új funkciója Hogyan párosítsunk össze közös kulcs nélküli adathalmazokat?
Statisztikai alapon, más változók eloszlása szerint
Példa: Házasságkötések szimulációja, Hiányzó, hibás adatok pótlása más adatfelvételekből Adatbányászat
6
2010
A Háztartási költségvetési felvétel 2002-es adatállományának javítása mikroszimulációs módszer alkalmazásával Felvételi hibák és megtagadások korrekciója mikroszimulációval és Statisztical matching eljárással Készítették: a KSH Háztartás-, jövedelem- és fogyasztás-statisztikai osztály és a BME ITM Mikroszimulációs Kutató- csoport munkatársai
Az egy főre jutó jövedelem főbb forrásonként a bruttó jövedelem %-ában, 2002 90,0 80,0 70,0 60,0
Százalék
50,0 40,0 30,0 20,0 10,0 0,0
Kereset (főáll.m.v.br.jöv.)
Vállalkozásból szárm.jöv.
Munkajövedelem Társadalmi jövedelem Egyéb jövedelem össz.
J övedelemforrások
Adatbányászat
Kiadvány adat
Nettó jövedelem
Mikroszimulációs adat
8
2010
Összes fogyasztási kiadás és a tartós fogyasztási cikkekkel kapcsolatos kiadások
90 80 70 60 50 Százalék 40 30 20 10 0
83,8 63,4
Hkf állomány (mikro)/makro adatok, %
51,2 33,3
Összesen
Szimuláció után mikro/makro adatok, %
Tartós fogyasztási cikkek
Adatbányászat
9
2010
Üzemanyaggal és személygépkocsival kapcsolatos kiadások 100
94,6
85,3
Hkf állomány (mikro)/makro adatok, %
90 80
Százalék
70 60 50
Szimuláció után mikro/makro adatok, %
40,9 31,7
40 30 20 10 0 Üzemanyag
Személygépkocsi
Adatbányászat
10
2010
Nőtt a jövedelmi és kiadási egyenlőtlenség a legfelső és a legalsó decilisben élők között Jövedelem és kiadás egyenlőtlenség, 2002 Kiadvány adat Megnevezés
Mikroszimuláció s adat
10. decilis/1. decilis Egy főre jutó nettó jövedelem
550,0
969,8
Egy főre jutó kiadás
367,6
399,7
Adatbányászat
11
2010
Fogyasztás szerkezet decilisenként a mikroszimuláció előtt (%), 2002 100 Lakásberuházás
90 Egyéb személyes célú kiadás
80 Művelődés, üdülés, szórakozás
70 Közlekedés, hírközlés
60 Egészségügy, testápolás
50
Háztartásvitel, lakásfelszerelés
40 30
Lakásfenntartás
20
Ruházkodás
10
Élvezeti cikkek
0 1.
2.
3.
4.
5.
6.
7.
8.
Adatbányászat
9.
10.
Élelmiszerek
12
2010
Fogyasztás szerkezet decilisenként a mikroszimuláció után (%), 2002 Lakásberuházás
100 90 80 70 60 50 40 30 20 10 0
Egyéb személyes célú kiadás Művelődés, üdülés, szórakozás Közlekedés, hírközlés Egészségügy, testápolás Háztartásvitel, lakásfelszerelés Lakásfenntartás Ruházkodás Élvezeti cikkek
1. 2. 3. 4. 5.
6. 7. 8. 9. 10.
Adatbányászat
Élelmiszerek
13
2010
„Adóváltoztatások hatásai” – az ECOSTAT vállalati adatbázisán alapuló mikroszimulációs lehetőségek Három változat szerinti adóváltoztatási elképzelése a versenyképesség növelésére Készítették: az ECOSTAT és a BME ITM Mikroszimulációs Kutató- csoport munkatársai
Szimulációs adatállomány előkészítése: A kettős könyvvitelű cégek Törzsszám alapján társasági adó és ÁFA adatok párosítása. 80% céghez találtunk ÁFA adatokat.
Az adat-állományokról:
1. adatállomány - 2002. évi társasági adóbevallás, kettős könyvvitel (kb. 202000 rekord) 2. adatállomány: 2002. évi ÁFA bevallás (kb. 400000 rekord)
Adatbányászat
15
2010
A szimuláció első menete: A vállalkozások adóbefizetésének mértékében 2002-ről 2003. évre bekövetkezett változások szimulálása nemzet-gazdasági ágazatok szerint a tényleges adószintek mellett. Az APEH és VPOP adatai szerint 2002-ről 2003-ra az átlagos növekedés a következők voltak: TB: 1.08 Fizetendő ÁFA: 1,12 Visszaigényelhető ÁFA: 1,1 Import ÁFA: 1,1012
Társasági adóbevételek növekedése egyes nemzetgazdasági ágakban: Gép, berendezés gyártása Villamos gép, műszer gyártása Járműgyártás
1,205 1,335 2,170
Adatbányászat
16
2010
2. menetben: Társasági adó és TB változtatás: TASA:
18%-ról 16%-ra csökkentve,
TB:
39%-ról 30%-ra csökkentve.
A TB változtatás közvetlenül hatással van a társasági adóbevételekre, a személyi jellegű ráfordítások csökkenésével az adózás előtti eredmény nő, ezáltal a társasági adó is. Adatbányászat
17
2010
3. menetben: előzőt kiegészítve az ÁFA változtatással: TASA: 0.18 -> 0.16 TB: 0.39 -> 0,30 25%-os ÁFA 20,5-ra csökkentve. Az ÁFA változtatás nem jelenik meg közvetlenül a társasági adóbevételekben, de közvetett hatásként szimuláltuk, hogy a nettó árbevétele nőhet a cégeknek, hiszen a fogyasztások bruttó értéke nem fog 4%-kal csökkenni. A szimuláció szerint 2%-kal nő a nettó árbevétel, többi pedig a megtakarításokat növeli. Adatbányászat
18
2010
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai főbb adónemenként (Mrd Ft) 1600 1400 1200 Társasági adó
1000
TB járulék
800
Fizetendő ÁFA Visszaigényelhető ÁFA
600
Import ÁFA
400 200 0 2002 tény
2003 becsült
2003*
2003**
Megjegyzés: */ Tasa=0.2, TB=0.3 **/ Tasa=0.2, TB=0.3, ÁFA=0.2
Adatbányászat
19
2010
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai ágazatonként, 2002-ről 2003-ra (Mrd Ft) 120 110 100 90 80
MEZŐGAZDASÁG
70
BÁNYÁSZAT
60
FELDOLGOZÓIPAR
50
VILLAMOSENERGIA
40
ÉPÍTŐIPAR
30 20 10 0 2002 tény
2003 becsült
2003*
2003**
Megjegyzés: */ Tasa=0.2, TB=0.3 **/ Tasa=0.2, TB=0.3, ÁFA=0.2
Adatbányászat
20
2010
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai ágazatonként, 2002-ről 2003-ra (Mrd Ft) 90 80 70 60
KERESKEDELEM, JAVÍTÁS
50
SZÁLLÁSHELY, VENDÉGLÁTÁS
40
SZÁLLÍTÁS, RAKTÁR, TÁVKÖZL PÉNZÜGYI KÖZVETÍTÉS
30 20 10 0 2002 tény
2003 becsült
2003*
Adatbányászat
2003**
21
2010
Az egységes tőkejövedelemadó bevezetésének hatásvizsgálata mikroszimuláció segítségével 2005 Kutatói adatállomány létrehozása szimulációval (2002->2005) Hipotézisbecslések és társadalmi hatásvizsgálat Készítették: az ECOSTAT és az Új Calculus Bt munkatársai
Adatbányászat
22
2010
ECOSTAT felmérés eredménye a megtakarító-képességről 2005 elején
Válaszolók megoszlása Eladósodunk 6% Hozzá kell nyúlnunk a tartalékokhoz 17% Éppen csak kijövünk a pénzünkből 48% Minimális összeget (5–10%) tartalékolni tudunk 25% Jelentős megtakarítás lesz 2% Nem tudja, nem válaszol 2%
Adatbányászat
23
2010
Az állami bevétel becslése különböző adószintek mellett Megtakarítások kamatai(%): 2004 2005 Kp.betét 8.53 5.4 Részvény 57 10 Kötvény 12.2 8 Tulajd rész 10.8 7.8 Biztosítás 10.2 6
Adatbányászat
24
2010
A 2004. évi Mikrocenzushoz kapcsolódó Jövedelmi felvétel Adatimputálás statistical matchinggel és korrekció mikroszimulációval Készítették: a KSH Háztartás-, jövedelem- és fogyasztásstatisztikai osztály és az Új Calculus Számítógépalkalmazási Bt. munkatársai
Adatbányászat
25
2010
Néhány fontosabb jövedelemegyenlőtlenségi mutatók alakulása Egyenlőtlenségi mutatók
1982
1987 1995 2004
3,8
4,6
7,5
7,5
A felső ötöd és az alsó ötöd átlagjövedelmének aránya
..
..
4,7
4,8
A felső és az alsó huszad átlagjövedelmének aránya
..
..
11,6
11,6
Éltető-Frigyes-index 1,82 Adatbányászat
1,99
2,36 26
A felső és az alsó tized átlagjövedelmének aránya
2,41 2010
A 2004. évi Mikrocenzushoz kapcsolódó Kutatói adatállomány létrehozása A 2004-s HKF és jövedelemfelvétel összekapcsolása Az adatállományok aktualizálása, dinamikus mikroszimuláció Az alkalmazhatóság biztosítás
Készítik: a KSH Háztartás-, jövedelem- és fogyasztásstatisztikai osztály és a BME ITM Mikroszimulációs Kutató- csoport munkatársai
Adatbányászat
27
2010
Jövőkép Mikroszimulációs módszerek alkalmazása a költségvetés előreszámításainál A módszer alkalmazása az üzleti szektorban (telekommunikáció, bank, biztosítás,…) Nemzetközi kooperáció (IST, Norvég alap) cél, hogy legyen egy naprakész módszertan és adatbázis a kutatók, döntéshozók számára
Adatbányászat
28
2010
Application development for microsimulation technology
SAS based framework systems
Universities
Research centers
Cambridge Univ . UK Budapest Univ . (BME) HU Scandinavian Universities ...
Ecostat HU Planning Office NL
Application developers Amadeus UK Calculus HU ...
Generalized framework system for microsimulation (End-user applications , WEB, open source softwares, etc.)
Real govermental applications (Tax- and social insurance systems, etc.)
Cooperative Partners Statistical Officies (HCSO HU,…) UK Treasury Tax Officies ...
...
Results
End-users
Multi-lingual modelling system Reports , International comparisons , ...
Local govermental institutions OECD, EUROSTAT,...
Adatbányászat
29
2010
A kutatóállomány felhasználása
A Diákhitel előrejelzése A Demográfiai változások előrejelzése 2010-ig A Karrier és jövedelem adatok továbbírása Az új adótörvények előreszámítása, a 16%-os személyi jövedelemadó Diplomamunkák a BMEn és az SZTE-n A statisztika és az adatbányászat gyakorlati alkalmazásai kurzusok Adatbányászat
30
2010
Háztartások személyi jövedelemadózottságának mértéke a háztartások jövedelem deciliseinként Románia: szinte mindegyik decilisben ugyanakkora az adózottság mértéke, kedvezmények köre szűk, csak a gazdagoknak kedvez Magyarország: az igazán szegény réteg nem fizet adót (adójóváírás, adókedvezmények ) Németország: a háztartások 90%-a jobban járna ezzel az adórendszerrel
Adatbányászat
31
Almási Adrienn Nóra: Föbb adónemek nemzetközi összehasonlítása mikroszimulációs módszerrel
2010
Személyi jövedelemadóból származó állami bevételek a háztartási jövedelem decilisenként
Adatbányászat
32
Almási Adrienn Nóra: Föbb adónemek nemzetközi összehasonlítása mikroszimulációs módszerrel
2010
Alkalmazások a telefóniában
Hiányzó demográfiai adatok pótlása statistical matchinggel Marketing felmérések adatainak korrigálása A lemorzsolódások elkerülésére kidolgozandó marketingstratégiák hatásának előrejelzése A csalók felderítésének támogatása
Adatbányászat
33
2010
Pénzintézeti lehetőségek
Hiányzó adatok pótlása Üzleti termékek eredményének előrejelzése A Credit Scoring elemzések támogatása A stresszteszt vizsgálatok elkészítése (hirtelen árfolyamváltozás, munkanélküliség növekedés,…)
Adatbányászat
34
2010
Köszönöm a figyelmet!
www.itm.bme.hu
[email protected] [email protected]
Adatbányászat
35
2010