Financial Fraud Detection using Social Network Analysis Andry Alamsyah1,2, Budi Rahardjo2, Kuspriyanto2 1
Sekolah Manajemen Telekomunikasi dan Media, Institut Manajemen Telkom 2
Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung
[email protected]
Abstrak Salah satu ancaman besar terhadap suatu perusahaan adalah kejahatan penyelewengan keuangan / financial fraud. Terdapat beberapa aktivitas yang termasuk ke dalam kategori kejahatan ini yaitu: corruption, asset misappropriation dan fraudulent statements. Pencegahan bisa dilakukan dengan hanya mengawasi aktor aktor tertentu di dalam jaringan perusahaan yang mempunyai nilai centrality yang besar. Jika kejahatan sudah dilakukan, maka tantangan yang dihadapi adalah bagaimana mendeteksi aliran hasil kejahatan menggunakan metode penelusuran ego-centric network dan community detection. Metoda metoda yang disebutkan diatas merupakan bagian dari metodologi Social Network Analysis (SNA), yang memodelkan hubungan antar manusia di dalam jaringan sosial. SNA menyediakan metrik metrik untuk kuantifikasi hubungan hubungan tersebut. Dalam paper ini akan dijelaskan kemungkinan skenario financial fraud dan bagaimana menggunakan metrik di dalam metodologi SNA untuk pencegahan dan penelusuran financial fraud berdasarkan topologi jaringan.
Kata Kunci : financial fraud, social network analysis, graph theory, community detection, centrality, ego-centric
I.
PENDAHULUAN
Financial fraud adalah salah satu jenis kejahatan yang dilakukan karyawan internal dalam suatu perusahaan, dan pada umumnya dilakukan oleh mereka yang mempunyai kekuasaan / posisi strategis atau dilakukan secara kolektif antar beberapa orang dalam satu kelompok dengan kekuasaan yang cenderung merata [1]. Posisi strategis merupakan hal yang mendominasi seorang karyawan untuk menyalahgunakan wewenang untuk kepentingan pribadi atau kelompoknya [2]. Interaksi antar karyawan dengan lingkungannya kita modelkan menjadi suatu model jaringan berdasarkan hubungan atau interaksi antar mereka. Pada paper ini, kami membahas bagaimana mencegah terjadinya financial fraud dan mendeteksi aliran hasil kejahatan berdasarkan perilaku individu dan kelompok
menggunakan metrik dan metodologi Social Network Analysis (SNA), baik yang bersifat khusus seperti tiestrenght, reciprocal, transitivity atau yang umum seperti centrality dan community detection [3]. Sejauh pengamatan kami, paper kami ini yang pertama kali menjabarkan ide deteksi financial fraud menggunakan pendekatan topologi / struktur jaringan SNA. Uniform Occupational Fraud Classification System yang diterbitkan oleh Association of Certified Fraud Examiners (ACFE) mendefinisikan kejahatan financial fraud dan membaginya menjadi tiga klasifikasi aktivitas utama yaitu : corruption, asset misappropriation dan fraudulent statements seperti pada gambar 1. Paper ini tidak membahas detail masing masing aktivitas tersebut, karena ide penelitian ini di fokuskan pada pola aktivitas kejahatan dan pertukaran informasi antar aktor dan pendukungnya. Ketiga aktivitas diatas bisa dilakukan oleh individu dengan dukungan orang lain. Dukungan
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
II. SOCIAL NETWORK ANALYSIS DAN
tersebut hanya bisa terjadi jika ada hubungan antar dua individu tersebut kuat, yang di representasikan sebagai tie-strenght [4]
SKENARIO
SNA memodelkan hubungan antar individu pada suatu jaringan sosial tertentu. Pada SNA individu direpresentasikan sebagai titik / node dan hubungan antar individu direpresentasikan sebagai garis / edge. SNA dikembangkan dari teori graph di matematika, dan merupakan bagian dari network science [3], yang tujuan utamanya adalah untuk memahami dan merepresentasikan perilaku dari jaringan yang ada di dunia nyata. Pengamatan struktur jaringan model pada SNA bisa dipakai sebagai dasar untuk mendeteksi anomali yang mungkin terjadi pada jaringan dimana financial fraud terjadi. Aplikasi metrik SNA untuk financial fraud secara singkat bisa dilihat pada tabel 1. Berikut ini beberapa ukuran yang dipakai pada penelitian ini. ll.1 Tie Strenght, Reciprocity dan Transitivity gambar 1. diagram peta kategori financial fraud, sumber http://www.acfe.com
Permasalahan umum pada riset yang berkenaan dengan kejahatan financial fraud adalah ketersediaan dataset. Hal ini terjadi karena sifat umum perusahaan yang sedang mengalami masalah financial fraud cenderung tidak menerbitkan kondisi keuangan yang sesungguhnya karena khawatir akan merugikan kepercayaan pelanggan dan harga saham. Satu satunya dataset terbesar dan komprehensif berkenaan dengan kasus korupsi adalah dataset email dari perusahaan Enron, yang merupakan dataset ukuran besar. Untuk keperluan riset ini, kami melakukan proses pembersihan / kategorisasi data tersebut, dan proses tersebut masih berlangsung sampai saat paper ini dibuat. Untuk mensimulasikan skenario ide paper ini, kami menggunakan dataset ego-network dari facebook yang kami peroleh dari Stanford LargeNetwork Dataset Collection (SNAP).
gambar 2.a reciprocity 4/7, 4 relasi timbal balik dari keseluruhan total 7 relasi. 2.b transitivity A mempunyai berteman dengan B dan C, maka besar kemungkinan B berteman dengan C
Tie Strenght atau kekuatan hubungan menggambarkan seberapa kuat hubungan antar dua individu. Suatu hubungan yang pertemanan yang kuat bisa dilihat dari frekuensi komunikasi antar dua individu. Hubungan pertemanan yang dekat memfasilitasi transfer pengetahuan dan cenderung mempunyai motivasi tinggi untuk saling membantu [6]. Tie Strenght pada umumnya direpresentasikan sebagai bobot (weight) garis pada model SNA Reciprocity adalah hubungan interaksi timbal balik antar aktor yang sering ditemukan pada suatu komunitas. Reciprocity merupakan faktor penting untuk koordinasi suatu proyek, berkolaborasi, dan pengembangan jalur komunikasi yang efektif. Suatu jaringan yang kaya dengan komunikasi reciprocal memungkinkan individu didalamnya untuk saling melakukan klarifikasi, memperpanjang, dan menyempurnakan ide. Reciprocity juga mengurangi ketidakpastian antar individu dengan mengutamakan tingkat kepercayaan dan solidaritas [7]. Dalam skala yang lebih luas reciprocity juga berguna untuk koordinasi grup / kelompok / komunitas dalam suatu jaringan. Banyak jaringan sosial dunia nyata mempunyai karakteristik yang didominasi oleh komunikasi reciprocal.
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
Transitivity adalah kecenderungan dua individu yang mana keduanya terhubung / berteman dengan orang ketiga, sehingga kedua individu pertama tersebut juga berteman [3]. Jika satu individu menyarankan hubungan antar alternya, maka tingkat kohesi grup (Group Cohesion) mereka akan meningkat. Kohesi suatu grup akan dibahas lebih mendalam perannya pada pembahasan mengenai Community Detection. Gambar 2 memberikan ilustrasi dan penjelasan singkat mengenai transitivity dan reciprocity. II.2 Ego-centric Network Ego-centric network adalah analisa jaringan yang berfokus kepada sifat dari satu individu (ego) berdasarkan analisa dari beberapa node yang menjadi tetangganya (alter) [5]. Dengan kata lain ego-centric network digunakan untuk memahami perilaku individu dalam satu jaringan. Hubungan level-1 dari suatu egocentric network, merupakan hubungan yang terkuat, dimana individu mengetahu bagaimana kondisi alter mereka, demikian juga para alter saling mengetahui kondisi individu yang berhubungan langsung dengannya. Individu akan lebih sulit memahami hubungan dengan level yang lebih jauh dan kekuatan pertukaran informasi serta pengaruh akan menjadi berkurang. Marsden [8] menyatakan bahwa hubungan ego-centric network dibawah 2 level disebut sebagai sphere of influence, yang artinya batas pengaruh langsung dari satu ego network.
hubungan yang ada dalam pada jaringan sosial, kita mungkin bisa memperoleh lebih dari satu jenis hubungan, hal ini juga berarti kita mempunyai banyak model SNA dalam satu jaringan yang sama. Deteksi komunitas bersifat subyektif, selama ini kita diberikan rambu rambu bagaimana menentukan komunitas, akan tetapi keputusan terakhir kembali ke model yang sesuai dengan kebutuhan kita. Komunitas ditentukan oleh beberapa ukuran, diantaranya adalah group cohesion, yaitu bagaimana suatu grup bisa terus bertahan, jika kohesi bagus maka grup tersebut akan terus bersama, sebaliknya jika kohesi tidak bagus / kurang kuat maka grup tersebut akan terpecah. Kekuatan suatu grup ditentukan oleh kekuatan reciprocity dan transitivity anggota di dalamnya. Ukuran lain dari komunitas adalah clustering coefficient yang mengukur peluang dua individidu berada pada grup yang sama. Ukuran terakhir adalah modularity, yaitu ukuran kekuatan pembagian suatu jaringan menjadi satu atau beberapa komunitas. Semakin besar nilai modularity artinya semakin kuat hubungan node dengan lingkungannya dan membentuk dense network . Dense network akan membentuk komunitas, sedangkan lawannya sparse network akan menjadi penghubung antar komunitas atau tidak terhubung sama sekali. Dari berbagai metrik yang tersedia pada SNA untuk pengukuran terhadap jaringan, ide utama pendeteksian berdasarkan tiga hal berikut
II.3 Centrality dan Community Detection Centrality adalah ukuran untuk menentukan siapakah aktor utama di dalam suatu network yang mempunyai peran yang central terhadap semua individu di dalam satu jaringan [3]. Terdapat beberapa jenis centrality, beberapa yang terpenting adalah centrality dalam hal jumlah koneksi ke individu lainnya di dalam jaringan, centrality dalam hal lokasi di dalam suatu jaringan relatif terhadap semua individu lainnya, centrality posisi individu terhadap komunitas yang ada didalam suatu jaringan, dan juga ranking centrality. Community Detection adalah suatu metode untuk mendeteksi keberadaan komunitas di dalam suatu jaringan. Sifat alami dari jejaring sosial adalah multilayer / multi-dimensional [9], dimana jenis hubungan antar dua individu mungkin bukan satu satunya jenis hubungan yang ada. Dengan melakukan ekstraksi
1. 2. 3.
frekuensi komunikasi antar individu, banyaknya komunikasi dua arah antar individu (reciprocal) struktur atau kohesi dari komunitas yang ada di dalam jaringan tersebut.
Ide kami berdasarkan dari asumsi bahwa pada jaringan financial fraud terdapat irregularities atau ketidaknormalan dibandingkan dengan jaringan normal. Kondisi tidak normal bisa diterjemahkan sebagai kondisi dimana frekuensi komunikasi yang lebih tinggi dari biasanya, alur komunikasi yang reciprocal atau simetris antar aktor. Perubahan frekuensi komunikasi menjadi lebih tinggi dan reciprocal merupakan akibat perubahan struktur jaringan karena pelaku kejahatan melakukan koordinasi secara intensif. Pada kasus financial fraud, posisi posisi central dalam suatu jaringan patut diawasi karena berpotensi kuat untuk
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
mempengaruhi individu lainnya. Selain itu posisi central mempunyai kecenderungan untuk memanipulasi lingkungannya karena mempunyai pengetahuan yang luas tentang bagaimana sistem perusahaan bekerja. Ada dua kemungkinan skenario yang berhubungan dengan posisi central, yaitu yang pertama seseorang yang mempunyai posisi central bekerja sendiri dalam melakukan kejahatan, yang kedua adalah beberapa orang pada posisi central melakukan kejahatan secara kolektif dan saling melindungi. Kejahatan kolektif bisa dideteksi dari metrik community detection yang berfungsi untuk melihat berapa banyak grup yang ada didalam jaringan, sehingga memudahkan kita mengawasi jaringan dengan mengecilkan jumlah individi yang harus dicurigai. Secara umum pencegahan financial fraud bisa dilakukan dengan bantuan metrik centrality dan community detection.
divisualisasikan pada gambar 3. Degree average adalah sebesar 15,129 dan maksimum degree adalah 77. Node dengan degree diatas 60 sebanyak 11 node (3.3%) dan edges sebanyak 54 (2.14%). Urutan node dengan degree diatas 60 dapat dilihat pada pada tabel 2. Tabel 2. Degree node lebih besar dari 60, dengan informasi nilai BC = Betweeness Centrality, CC = Closeness Centrality dan EC = Eigenvector Centrality
Node 56 67 271 322 25 26 252 277 21 122 119
Jika kejahatan financial fraud telah terjadi, kita bisa menggunakan pengukuran ego-centric network untuk melacak aliran hasil kejahatan atau diseminasi informasi dari pelaku yang ke alter ego-centric network pelaku tersebut. Probabilitas terbesar adalah alter langsung dari pelaku atau mereka yang ada pada level-1 ego-centric network.
Degree 77 75 72 71 68 67 64 64 64 62 61
BC 0.002 0.002 0.002 0 0.002 0.002 0.002 0.002 0.002 0.002 0
CC 1 1 1 0.909 1 1 1 1 1 1 0.909
EC 1 0.997 0.977 0.82 0.789 0.938 0.892 0.826 0.817 0.836 0.691
Tabel 1. Peran metrik SNA pada deteksi financial fraud
Metrik SNA Tie Strenght Reciprocity Transitivity Ego-centric Network Centrality Community Detection
Fungsi Mengukur kekuatan hubungan antar karyawan Mengukur rasio banyaknya hubungan timbal balik antar karyawan dalam suatu perusahaan Mengukur kecenderungan terbentuknya hubungan baru antar dua karyawan yang terhubung dengan satu karyawan yang sama Mengukur sifat atau properti jaringan dimulai dari satu karyawan tertentu yang kita curigai sebagai pelaku Mengukur karywan yang mempunyai peran central dalam satu perusahaan Mendeteksi kelompok karyawan, baik jumlah dan karakteristiknya dalam satu perusahaan
III. SIMULASI
Simulasi pada paper ini menggunakan dataset anonim facebook undirected network sebanyak 333 individu (node) dan 2509 hubungan (edge). Dataset
gambar 3. visualisasi dataset menggunakan algoritma FruchtermanReingold (atas) dan Force Atlas (bawah) pada Gephi. Degree
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
Untuk penelurusan kejahatan dengan analisa ego-centric network, kami menggunakan node 56 sebagai dasar node ego dengan alasan node tersebut adalah node dengan degree terbesar dan nilai centrality (BC, CC dan EC) terbesar (tabel 2). Kami asumsikan node 56 adalah aktor yang mempunyai peran penting dan kemungkinan merupakan pelaku kejahatan. Asumsi kami juga berdasarkan perhitungan bahwa jika pelaku adalah node lain maka skala kerugian tidak akan sebesar node 56. Analisa ego-centric network level 1 dan 2 dari node 56 bisa dilihat pada gambar 4. Untuk level 1 terdapat 78 (23,42%) node dan 1074 (41,56%) edge. Untuk level 2 terdapat 192 (57,66%) node dan 1952 (77,49%) edge.
Dengan simulasi ego-centric network, kita mendapatkan hasil bahwa kita hanya perlu memeriksa sebesar 23,42%57,66% dari keseluruhan karyawan yang kemungkinan terlibat kerjasama atau menerima aliran dana dari financial fraud. Persentase diatas adalah adalah persentase maksimum yang bisa kita peroleh (worstcase), untuk node yang lain maka persentase yang diperoleh akan lebih kecil. Pencegahan financial fraud menggunakan pendekatan topologi jaringan SNA berdasarkan skenario di bab ll, adalah dengan menentukan dan menemukan komunitas komunitas yang ada pada suatu perusahaan. Komunitas terbentuk dari tie-strenght, reciprocity, transitivity, group cohesion. Dari simulasi kita berhasil menemukan 13 komunitas (gambar 4.) dengan persentase komposisi banyaknya node yang ada didalam komunitas tersebut seperti tercantum pada tabel 3 berikut ini. Tabel 3. komunitas, persentase dan node dengan degree terbesar pada komunitas.
gambar 4. ego-centric level-1 (atas) dan level-2 (bawah) dari node 56
Komunitas
Persentase (%)
2 7 3 1 0 4 5 8 10 9 12 11 6
31,23 13,51 12,61 12,31 10,21 8,11 3,9 3 2,4 0,9 0,6 0,6 0,6
Node dengan Degree Terbesar (a) 56 312 175 271 53 119 320 275 89 179 233 282 33
Degree Node (a) 77 25 16 72 30 61 20 9 7 2 1 1 1
Node dengan degree terbesar pada tabel 2, mayoritas menjadi anggota komunitas 2, kecuali node 271 yang menjadi anggota komunitas 1. Hasil ini sudah bisa diduga, karena node dengan degree besar cenderung terhubung dengan node dengan degree besar lainnya. Komunitas 2 sering disebut sebagai giant component [4], karena mendominasi jaringan dan konektifitas yang antar anggota yang sangat kuat. Dengan terdeteksinya komunitas dalam jaringan dan node yang dominan di masing masing komunitas, kita pada akhirnya memperoleh lingkup pengawasan yang lebih kecil dan fokus. Dalam hal dataset diatas kita hanya perlu melakukan pengawasan ketat terhadap komunitas 1 & 2,
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
karena mempunyai node yang masuk ke dalam 10 besar node dengan degree terbesar (tabel 2.) Pendekatan komunitas ini juga bisa dipakai untuk mendeteksi aliran kejahatan dengan menggunakan algoritma sebagai berikut 1.
2.
Memilih beberapa komunitas yang mempunyai node yang masuk ke dalam daftar node dengan degree terbesar. Analisa ego-centric network pada komunitas di langkah 1, dengan node ego adalah node dengan degree terbesar
Saran untuk penelitian selanjutnya adalah membangun model yang bisa mengakomodasi beberapa skenario / pattern pada topologi jaringan. Sedangkan untuk perbaikan paper ini, bisa dilakukan dengan menambahkan eksperimen menggunakan dataset kasus financial fraud sebenarnya, sehingga meningkatkan validitas metode.
DAFTAR PUSTAKA [1]
[2]
[3] [4]
[5]
[6]
gambar 4. 13 komunitas pada dataset facebook dikelompokkan berdasarkan warna
[7]
[8] IV. KESIMPULAN DAN SARAN [9] Metode yang kami tawarkan bertujuan untuk memperkecil ruang pencarian dan pencegahan kejahatan financial fraud. Metode ini membantu usaha usaha penyelidikan seperti proses audit dan digital forensics. Ide kami berdasar kepada asumsi bahwa struktur jaringan berubah drastis dengan adanya aktivitas kejahatan. Asumsi ini pada kenyatannya justru bisa terjadi sebaliknya dimana jaringan akan menjadi lebih “diam” atau berkurang interaksi dan frekuensi komunikasi karena adanya usaha untuk menjaga kerahasiaan.
e-Indonesia Initiatives (eII-Forum) 2013, Institut Teknologi Bandung ICT For Smart Society | Think Ecosystem Act Convergence
A. Barr, D. Serra. 2006. Culture and Corruption. Global Poverty Research Group. University of Oxford Takacs, P. Csapodi, K. Gyorgy-Takacs. 2011. Corruption as Deviant Social Attitude. Journal of Public Finance Quarterly No. 56 vol.1. num. 27-43. P. Newman, M.E.J. 2011. Network: An Introduction. Oxford University Press Waserman, S., Faust K. 1994. Social Network Analysis: Methods and Application. New York: Cambridge University Press Moustafa, W.E, Deshpande, A, Getoor, L. Egocentric Graph Pattern Census. 2012. IEEE 28th International Conference on Data Engineering Gravonetter, M. The Strenght of Weak Ties. 1973. The American Journal of Sociology, 78: 1360 – 1380 Molm, L., Schaeffer, D., Collet, J. 2007. The Value of Reciprocity. Social Psychology Quaterly, 70: 199-217 Marsden, P. 2002. Egocentric and Sociocentric Measures of Network Centrality. Social Networks, 24: 407-422 S. Fortunato. 2010. Community Detection in Graph. Physics Report 486:75-174