G´epi tanul´as, predikci´o ´es oks´ag a t´arsadalomtudom´anyokban Murak¨ ozy Bal´azs (MTA KRTK)
Bemutatkozik a Sz´am´ıt´ og´epes T´arsadalomtudom´any t´emacsoport, MTA, 2017
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban
Empirikus k¨ozgazdas´agi k´erd´esek I
I
Felv´altja-e automatikusan a g´epi tanul´as a ”hagyom´anyos” k¨ozgazdas´agi, ¨okonometriai modellez´est? Modern empirikus k¨ ozgazdas´agtan I I
I
G´epi tanul´as I
I
F´ okusza els˝ osorban oks´agi F˝ o kih´ıv´as az, hogy nem k´ıs´erleti adatokb´ ol oks´agi hat´asokat becs¨ ulj¨ on C´elja a mint´an k´ıv¨ ulre el˝ orejelz´es
Az elt´er˝o c´el miatt a k´et szeml´elet nem automatikusan helyettes´ıt˝o, sokkal ink´abb sokszor kieg´esz´ıthetik egym´ast
2/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban
V´azlat Mi´ert nem ad j´o oks´agi becsl´est az a modell, ami j´ol jelez el˝ore? Amikor a k´et m´odszer kieg´esz´ıti egym´as Adatok az internetr˝ ol ´es a m˝ uholdakr´ ol Sok k´erd´es val´oj´aban predikt´ıv Az oks´agi elemz´esekben is vannak predikt´ıv l´ep´esek Alkalmaz´as: v´allalati EU-t´amogat´asok hat´asa K¨ovetkeztet´esek
3/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
Mi´ert nem ad j´o oks´agi becsl´est az a modell, ami j´ol jelez el˝ore? Amikor a k´et m´odszer kieg´esz´ıti egym´as Adatok az internetr˝ ol ´es a m˝ uholdakr´ ol Sok k´erd´es val´oj´aban predikt´ıv Az oks´agi elemz´esekben is vannak predikt´ıv l´ep´esek Alkalmaz´as: v´allalati EU-t´amogat´asok hat´asa K¨ovetkeztet´esek
4/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
Oks´agi k´erd´esek
I
Oks´agi k´erd´esek I I I
N¨ oveli a b´ereket az, ha valaki jobb iskol´aba j´ar? Gyorsabban n˝ onek-e azok a v´allalatok egy t´amogat´as hat´as´ara? Az ´arfolyam le´ert´ekel˝ od´ese befoly´asolja-e az infl´aci´ot?
I
C´el egy egy¨ utthat´ o becsl´ese, ami k´et v´altoz´ o k¨oz¨otti oks´agi kapcsolatot mutat
I
Alapvet˝o m´odszere a regresszi´ o, ami kisz˝ uri a f¨ ugg˝o v´altoz´ora hat´o egy´eb t´enyez˝ oket
5/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
”Term´eszetes k´ıs´erletek” I
Kv´azi-k´ıs´erleti megk¨ ozel´ıt´es I
I
I
Bizonyos egyedek valamifajta ”kezel´esben” r´eszes¨ ultek (jobb iskol´aba j´artak, t´amogat´asban r´eszes¨ ultek, le´ert´ekel˝od¨ott a valut´ajuk) A kezel´es ´es a kimenet k¨ oz¨ otti korrel´aci´ o egyszerre tartalmazza az oks´agi hat´ast ´es a ”szelekci´ os torz´ıt´ast” - m´as t´ıpus´ u egy´enek ”v´alaszt´ odnak ki” a kezel´esre
”Hiteless´egi forradalom” I
I
I
Keress¨ unk a kezelteknek olyan kontrollcsoportot, ami a legink´abb hasonl´ıt hozz´ajuk A becsl´es l´enyege, hogy a kezelt csoport kimeneteit (pl j¨ ovedelem) ¨ osszehasonl´ıtjuk a kontrollcsoport´eval Minden olyan v´altoz´ o hat´as´at ki kell sz˝ urni, ami egyszerre befoly´asolja a kezel´es val´ osz´ın˝ us´eg´et ´es a kimenetet
6/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
K´et kv´azi-k´ıs´erleti m´odszer I
Szakad´asos regresszi´ o I
I
I
Akiket pontsz´amuk alapj´an pont nem vettek fel az egyetemre szinte pont olyanok, mint akiket ´epp felvettek - j´o kontrollcsoport Megfigyelhet˝ o ´es nem megfigyelhet˝ o jellemz˝ oikben hasonl´o
P´aros´ıt´as I
I
I
A rendelkez´es¨ unkre ´all´ o inform´aci´ ok alapj´an megbecs¨ ulj¨ uk, hogy ki milyen val´ osz´ın˝ us´eggel r´eszes¨ ul kezel´esben Minden kezeltnek ez alapj´an keres¨ unk p´art, ezek ker¨ ulnek a kontrollcsoportba Ha csak a megfigyelt v´altoz´ ok befoly´asolj´ak a kezel´est, akkor j´o becsl´est ad
7/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
G´epi tanul´as I
I
C´elja: min´el pontosabb el˝ orejelz´es a becsl´esre haszn´alt mint´an k´ıv¨ ul F˝o ´atv´alt´as I I
Alulilleszt´es: nem fogja meg az adatban l´ev˝ o mint´akat T´ ulilleszt´es: A zajra is r´ailleszti a modellt, ´ıgy a mint´an k´ıv¨ ul nem j´ ol jelez el˝ ore
I
Soksz´ın˝ u m´odszertan: f´ak, regresszi´ ok, neur´alis h´al´ok stb. ´es ezek kombin´aci´oi
I
Akkor j¨onnek ki k¨ ul¨ on¨ osen az el˝ onyei, ha nagyon sok v´altoz´o van
8/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Mi´ ert nem ad j´ o oks´ agi becsl´ est az a modell, ami j´ ol jelez el˝ ore?
Mi´ert nem ad automatikusan j´o oks´agi becsl´est a j´o predikt´ıv modell? I
Sok g´epi tanul´asos m´ odszerben egy´altal´an nem vil´agos, hogy mi felel meg a becs¨ ulni sz´and´ekozott egy¨ utthat´onak (pl. f´ak vagy neur´alis h´al´ok)
I
A t´ ulilleszt´es kik¨ usz¨ ob¨ ol´es´ere kidob olyan v´altoz´okat, amelyek hat´as´at ki kellene sz˝ urni az oks´agi becsl´eshez
I
Ha kisz´amolhat´o is a sz¨ uks´eges param´eter, az nagyon instabil lehet att´ol f¨ ugg˝oen, hogy ´eppen milyen m´as v´altoz´ok ker¨ ultek be a modellbe (Mullainathan and Spiess, 2017)
9/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Amikor a k´ et m´ odszer kieg´ esz´ıti egym´ as
Mi´ert nem ad j´o oks´agi becsl´est az a modell, ami j´ol jelez el˝ore? Amikor a k´et m´odszer kieg´esz´ıti egym´as Adatok az internetr˝ ol ´es a m˝ uholdakr´ ol Sok k´erd´es val´oj´aban predikt´ıv Az oks´agi elemz´esekben is vannak predikt´ıv l´ep´esek Alkalmaz´as: v´allalati EU-t´amogat´asok hat´asa K¨ovetkeztet´esek
10/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Amikor a k´ et m´ odszer kieg´ esz´ıti egym´ as Adatok az internetr˝ ol ´ es a m˝ uholdakr´ ol
´ adatok Uj I
T´ ul sok v´altoz´o eset´en az oks´agi becsl´esben is sz¨ uks´eg van v´altoz´oszelekci´ora a t´ ulilleszt´es elker¨ ul´es´ere I
I
Ilyenkor a regresszi´ oba a v´altoz´ ok kiv´alaszt´asa t¨ort´enjen g´epi tanul´assal (Chernozhukov ´es szerz˝ ot´arsai, 2016)
A big data-b´ol g´epi tanul´assal el˝ o´all´ıthat´ ok olyan v´altoz´ok, amelyek az ¨okonometriai elemz´es magyar´az´ o vagy f¨ ugg˝o v´altoz´oi lehetnek I
I
A m˝ uholdakr´ ol sz´armaz´ o f´enykibocs´at´as-adatokb´ol nagy ter¨ uleti ´es id˝ obeli r´eszletess´eggel predikt´alhat´o a GDP g´epi tanul´assal (Henderson ´es szerz˝ ot´arsai, 2012; Donaldson ´es Storeygard, 2016) Sokfajta k´erd´eshez haszn´alhat´ ok a Google Trends adatok (Varian, 2014; Stephen-Davidovitz, 2017)
11/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Amikor a k´ et m´ odszer kieg´ esz´ıti egym´ as Sok k´ erd´ es val´ oj´ aban predikt´ıv
Sok k´erd´es val´oj´aban predikt´ıv I
I
Hagyom´anyosan a k¨ ozgazd´aszok minden k´erd´est regresszi´os m´odszerekkel vizsg´altak, de jobban belegondolva n´eh´any tiszt´an predikt´ıv P´eld´aul a p´enz¨ ugy k¨ ozponti elm´elete, a hat´ekony piacok elm´elete szerint m´ ultbeli inform´aci´ ok alapj´an nem lehet el˝orejelezni az ´arak j¨ ov˝ obeli alakul´as´at I I
I
Ez a k´erd´es tiszt´an predikt´ıv Moritz ´es Zimmermann (2016) p´eld´aul megmutatja, hogy az amerikai t˝ ozsdeindexek el˝ orejelzhet˝ ok g´epi tanul´assal Seg´ıt meg´erteni, milyen piaci t¨ ok´eletlens´egek lehetnek
12/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Amikor a k´ et m´ odszer kieg´ esz´ıti egym´ as Az oks´ agi elemz´ esekben is vannak predikt´ıv l´ ep´ esek
Az oks´agi elemz´esben is vannak predikt´ıv l´ep´esek I
P´aros´ıt´as I
Els˝ o l´ep´es: Ki milyen val´ osz´ın˝ us´eggel r´eszes¨ ul kezel´esben (propensity score)? I I
I
I
I
Predikt´ıv C´elszer˝ u g´epi tanul´ ast haszn´ alni
M´asodik l´ep´es: Minden kezelt embernek keres¨ unk olyan nem kezelt p´art, aki a propensity score alapj´an a legjobban hasonl´ıt r´a (ez a kontrollcsoport) ¨ Harmadik l´ep´es: Osszehasonl´ ıtjuk a kezelt ´es kontrollcsoport kimeneteit
Instrument´alis v´altoz´ ok: Keres¨ unk egy olyan v´altoz´ot, ami ¨osszef¨ ugg a kezel´essel, de nem hat k¨ ozvetlen¨ ul a kimenetre (instrumentum) I
Els˝ o l´ep´es: hogy f¨ ugg ¨ ossze az instrumentum a kezel´essel
I
M´asodik l´ep´es: hogy f¨ ugg ¨ ossze az els˝ o egyenletb˝ol predikt´alt ´ert´eke a kimenet-v´altoz´ oval
I
Predikt´ıv, g´epi tanul´ as hasznos
13/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Alkalmaz´ as: v´ allalati EU-t´ amogat´ asok hat´ asa
Mi´ert nem ad j´o oks´agi becsl´est az a modell, ami j´ol jelez el˝ore? Amikor a k´et m´odszer kieg´esz´ıti egym´as Adatok az internetr˝ ol ´es a m˝ uholdakr´ ol Sok k´erd´es val´oj´aban predikt´ıv Az oks´agi elemz´esekben is vannak predikt´ıv l´ep´esek Alkalmaz´as: v´allalati EU-t´amogat´asok hat´asa K¨ovetkeztet´esek
14/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Alkalmaz´ as: v´ allalati EU-t´ amogat´ asok hat´ asa
Eu t´amogat´asok I
I I I
I
Az EU-t´amogat´asok sz´amottev˝ o r´esz´et k¨ olt¨ otte Magyarorsz´ag v´allalati t´amogat´asokra pl. g´epv´as´arl´as, ISO-tan´ us´ıtv´any bevezet´ese Ezek f˝o c´elja a foglalkoztat´as ´es a versenyk´epess´eg n¨ovel´ese Az adatok v´allalati szinten tartalmazz´ak a t´amogat´asokat ´es a v´allalatok m´erlegeit A k´erd´es az, hogy a 2007-ben t´amogatott v´allalatok gyorsabban n˝ottek-e a k¨ ovetkez˝ o 3 ´evben, mint a nem t´amogatottak P´aros´ıt´asos becsl´es, k¨ ul¨ onf´ele g´epi tanul´asi m´odszerek felhaszn´al´as´aval a propensity score becsl´esben I
I
I
D¨ ont´esi fa: a kontrollcsoport az lesz, ami a f´anak ugyanazon a level´en van Boosting: sok d¨ ont´esi fa eredm´eny´eb˝ ol sz´amolhat´o a propensity score Logisztikus regresszi´ o, a v´altoz´ ok g´epi tanul´assal v´alasztva
15/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Alkalmaz´ as: v´ allalati EU-t´ amogat´ asok hat´ asa
A becs¨ult d¨ont´esi fa
16/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Alkalmaz´ as: v´ allalati EU-t´ amogat´ asok hat´ asa
Kiegyens´ulyozotts´agi teszt
17/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban Alkalmaz´ as: v´ allalati EU-t´ amogat´ asok hat´ asa
Becs¨ult hat´as
18/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban K¨ ovetkeztet´ esek
Mi´ert nem ad j´o oks´agi becsl´est az a modell, ami j´ol jelez el˝ore? Amikor a k´et m´odszer kieg´esz´ıti egym´as Adatok az internetr˝ ol ´es a m˝ uholdakr´ ol Sok k´erd´es val´oj´aban predikt´ıv Az oks´agi elemz´esekben is vannak predikt´ıv l´ep´esek Alkalmaz´as: v´allalati EU-t´amogat´asok hat´asa K¨ovetkeztet´esek
19/20
G´ epi tanul´ as, predikci´ o´ es oks´ ag a t´ arsadalomtudom´ anyokban K¨ ovetkeztet´ esek
K¨ovetkeztet´esek
I
A g´epi tanul´as ´es az oks´agi elemz´es c´elja elt´er˝o, nem fogja kiszor´ıtani az egyik a m´asikat
I
A kett˝o viszont t¨obb ter¨ uleten is kieg´esz´ıtheti egym´ast, k¨ ul¨on¨osen a big data t´ernyer´es´evel
20/20