Analisis Teori Matrik Acak untuk data Saham dan IHSG Yun Hariadi Dept. Dynamical System Bandung Fe Institute
Abstrak Melalui teori matrik acak paper ini memfokuskan pada perilaku vektor eigen pada saat nilai eigen berada di luar batas matrik acak dengan menggunakan kumpulan data saham dalam rentang waktu dan kepadatan data yang berbeda. Hasil yang diperoleh menunjukkan kesesuaian antara perilaku nilai eigen dengan vektor eigen dalam bentuk distribusi. Proyeksi vektor eigen terhadap IHSG menunjukkan tingkat kesesuaian yang tinggi pada saat nilai eigen terbesar dan kemudian tingkat kesesuain ini menurun drastis pada nilai eigen terbesar ke dua meskipun masih di luar batas atas matrik acak. Dengan perhitungan IPR (Inverse Participation Ratio) diperoleh bahwa lebih dari separoh saham berkontribusi dalam pembentukkan nilai eigen terbesar. Dan kumpulan saham yang berperan dalam pembentukkan nilai eigen terbesar ini didominasi oleh saham-saham likuid LQ45. Kata kunci: teori matrik acak, vektor eigen, nilai eigen, IPR.
1. Pendahuluan Paper ini mengembangkan paper sebelumnya [1] dengan lebih memfokuskan pada vektor eigen. Vektor eigen ini penting untuk melihat lebih jauh tentang perilaku nilai eigen yang berada di luar batas matrik acak. Beberapa kemungkinan yang bisa diperoleh dalam analisis pada vektor eigen ini adalah jumlah saham yang berperan penting dalam pembentukkan nilai eigen di luar matrik acak dan kumpulan saham yang bersesuaian dengan indeks saham gabungan. Untuk yang terakhir ini berguna dalam penyusunan portfolio. Teori matrik acak telah digunakan secara luas khususnya terhadap obyek yang melibatkan interaksi di dalamnya, parkir [2] partikel[3], optimasi portfolio [4], korelasi data keuangan dan saham [4],[5],[6]. Hasil analisis pada paper ini menunjukkan bahwa lebih dari separoh saham dalam data berkontribusi dalam pembentukkan nilai eigen terbesar. Dan kumpulan saham yang berperan dalam pembentukkan nilai eigen di luar batas matrik acak dan nilai eigen terbesar di dominasi oleh saham-saham likuid LQ45. Paper ini tersusun atas dua bagian, pada bagian pertama akan diketengahkan metodologi dalam teori matrik acak dan beberapa turunannya meliputi IPR, model portfolio sederhana melaui proyeksi vektor eigen terbesar terhadap IHSG. Bagian ke dua merupakan analisis dari hasil yang diperoleh dengan menggunakan metodologi teori matrik acak. Dan akan ditutup dengan kesimpulan. Data yang digunakan mencakup 78 saham dalam rentang waktu 5/31/2000 s.d 2/3/2006.
1
2. Metode
Untuk matrik A yang berukuran nxn bisa kita peroleh nilai eigen λ dan vektor eigen x yang bisa kita tulis Ax = λx …(i)
Sedangkan untuk data deret waktu akan kita susun melalui matrik korelasi antar saham. Misalkan untuk saham j = 1… N dengan perubahan waktu Δt dan nilai saham j pada saat t adalah S j (t ) , nilai return didefinisikan sebagai
G j (t ) ≡ ln S j (t + Δt ) − ln S j (t ) …(ii)
Nilai return dinormalkan
g j (t ) ≡
Dengan σ j =
G 2j − G j
G j (t ) − G j
σj
…(iii)
2
Dan C ij = g i (t ) g j (t ) …(iv)
Persamaan ini bisa ditulis sebagai
1 GG T ...(v) L ≡ g j (mΔt ), j = 1… N , m = 0 … L − 1} C=
Dengan G = {g jm
Dan untuk matrik acak ukuran LxN R=
Untuk nilai N → ∞, L → ∞ ∋ Q ≡ L
N
1 AAT …(vi) L
>> 1 maka distribusi nilai eigen dari matrik
acak P(λ ) =
Q 2π
(λmax − λ )(λ − λmin ) λ
Dengan
2
…(vii)
λmax/ min = 1 +
1 1 ±2 …(viii) Q Q
Sedangkan untuk vektor eigen dari matrik acak akan memenuhi P(u ) =
⎛ − u2 exp⎜⎜ 2π ⎝ 2 1
⎞ ⎟⎟ …(ix) ⎠
Hubungan antara nilai eigen terbesar dengan vektor eigen Proyeksi vektor eigen pada nilai eigen terbesar untuk 78
G 78 (t ) = ∑ u 78 j G j (t ) …(x) j =1
Selanjutnya sekumpulan saham yang tergabung dalam data ini akan dilihat hubungan korelasinya dengan IHSG pada nilai eigen terbesar, akan dilihat juga hubungan tersebut pada nilai eigen dalam rentang matrik acak. Untuk melihat berapa banyak saham yang tergabung dalam data1 tersebut memberi sumbangan dalam pembentukkan nilai eigen akan dilihat melalui fungsi Inverse Participation Ratio (IPR) N
[ ] …(xi)
I k ≡ ∑ u lk
4
l =1
Dengan u lk merupakan vektor eigen dari nilai eigen. Nilai eigen yang kecil akan menghasilkan IPR yang relatif lebih besar. Dan nilai 1 / I k menyatakan jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar.
Data Δt
data 1a 1b 1c
rentang waktu 5/31/2000 s.d 5/31/2002 5/31/2002 s.d 5/31/2004 5/31/2004 s.d 12/29/2004
4x/hari 4x/hari 4x/hari
2a 2b 2c
5/31/2000 s.d 5/31/2002 5/31/2002 s.d 5/31/2004 5/31/2004 s.d 2/3/2006
1hari 1hari 1hari
data yang digunakan dalam analisis ini terdiri dari 78 saham yaitu: 'aali','admg','amfg','antm','asii','auto','bbca','bbld','bbni','bcic','bdmn','bfin','bhit','bksl','bl ta','bmtr','bnbr','bnga','bnii','bnli','brpt','bumi','cmnp','ctra','ctrs','davo','duti','epmt','fasw'
3
,'ggrm','gjtl','gsmf','hero','hits','hmsp','imas','inco','indf','inkp','inpc','intp','isat','jihd','jrpt' ,'kija','klbf','lpbn','lpkr','lsip','medc','mega','mkdo','mlbi','mppa','myor','nisp','plin','pnbn' ,'pnin','pnlf','rals','rmba','shda','smar','smcb','smgr','smma','smra','tcid','tlkm','tins','tkim', 'tspc','turi','ultj','unic','untr','unvr', dan 'ihsg'
3. Analisis Perilaku distribusi peluang nilai eigen dari data 1a dan 1b tidak menunjukkan perbedaan yang berarti. Hadirnya nilai eigen yang berada di luar batas matrik acak berada pada nilai yang hampir sama untuk ke dua kondisi dan perbedaan antara data. Dalam kasus ini menunjukkan bahwa perbedaan kerapan data dalam selang waktu yang sama tidak memberi perbedaan yang cukup besar, namun untuk perbedaan kerapatan yang cukup tinggi (detik atau menit) hal ini masih perlu diuji. Secara umum, sebagian besar data saham berada di dalam rentang batas matrik acak [λ + , λ − ] . Analisis selanjutnya akan kita fokuskan pada kondisi nilai eigen berada di luar rentang matrik acak. Nilai yang berada di luar batas matrik acak merupakan informasi yang berguna dalam melihat hubungan antara saham yang tergabung dalam data tersebut. data 1a 1b 1c
λ78 λ +
1 I 78
4.85 6.21 6.16
38 44 41
2a 2b 2c
Perbandingan antara
λ78 λ +
4.94 38 6.18 44 6.59 43 Tabel 1 untuk melihat sejauh mana data berbeda dengan matrik acak, besarnya
perbandingan tersebut menyatakan “informasi”. Hal ini bisa menjadi pembanding antara satu data dengan data lainnya, terlihat bahwa kerapatan data tidak begitu berpengaruh terhadap perbedaan λ78 λ + .
4
Gambar 1 Distribusi peluang nilai eigen λ jika dibandingkan dengan matrik acak, terlihat sebagian besar dari data saham memiliki nilai eigen yang mendekati dengan matrik acak (tanda *). Dan terdapat sebagian kecil data yang berada di luar batas nilai eigen dari matrik acak.
Selanjutnya kita lihat pengaruh dari vektor eigen pada beberapa kondisi nilai eigen. Lebih khusus, analisis pada vektor eigen ini ingin menjawab apakah antara nilai eigen dengan vektor eigen berhubungan positif. Artinya, apakah ada kesesuaian antara nilai eigen di luar rentagn matrik acak dengan perilaku vektor eigennya? Hasil yang ditunjukkan oleh gambar 2a menyatakan bahwa nilai eigen berhubungan positif dengan vektor eigen dalam hal penyimpangan terhadap matrik acak. Terlihat untuk perilaku vektor eigen pada saat berada dalam rentang matrik acak, distribusinya akan berimpit dengan distribusi normal ini sesuai dengan persamaan (ix). Namun pada saat nilai eigen berada di luar matrik acak, distribusi vektor eigen menyimpang dari distribusi matrik acak. Menarik kita amati perilaku vektor eigen ini jika nilai eigen berada di luar rentang matrik acak. Ternyata penyimpangan terhadap distribusi acak akan lebih besar pada nilai eigen di atas batas matrik acak dibandingkan dengan yang di bawah matrik acak. Sekali lagi penyimpangan ini menegaskan bahwa nilai eigen yang berada di rentang matrik acak merupakan informasi yang sifatnya berguna (bukan gangguan) dibanding dengan nilai eigen yang berada dalam rentang matrik acak.
5
Gambar 2a Berbagai macam distribusi peluang dari vektor eigen untuk data 1b. perhatikan penyimpangan distribusi vektor eigen pada saat nilai eigennya berada di luar batas matrik acak, baik pada saat di bawah batas nilai eigen matrik acak λ < λ − dan pada saat di atas batas nilai eigen matrik acak
λ+ < λ
Lantas bagaimana perilaku distribusi vektor eigen untuk nilai eigen terbesar untuk masing-masing data?. Ternyata untuk data dalam selang waktu yang sama namun berbeda kepadatannya menunjukkan adanya kemiripan bentuk distribusi vektor eigen. Dan jelas terjadi perbedaan antara data yang berbeda selang waktunya. Perbedaan selang waktu menyebabkan perbedaan penyimpangan terhadap distribusi matrik acak (persamaan ix). Dan tentu saja besarnya penyimpangan terhadap matrik acak ini menyatakan kadar informasi.
6
Gambar 2b Distribusi peluang dari vektor eigen untuk nilai eigen yang paling besar menyimpang dari batas maksimal matrik acak untuk beberapa data yang berbeda kerapatannya. Perhatikan bahwa distribusi peluang vektor eigen tidak begitu berbeda antara data yang memiliki perbedaan kerapatan (kanan atas dan kanan bawah). Dan jelas berbeda untuk selang waktu yang berbeda (kiri atas dan kiri bawah)
Pertanyaan selanjutnya dari penyimpangan vektor eigen untuk nilai eigen terbesar adalah, tentang berapa banyak unsur vektor eigen ini yang berkontribusi besar dalam penyimpangan? Dari gambar 2a&2b kita hanya bisa melihat bahwa terjadi penyimpangan untuk nilai eigen terbesar. Untuk hal ini kita bisa menjawabnya berdasarkan pengaruh vektor eigen dalam analisis IPR. Terlihat pada gambar 3 bahwa nilai IPR yang besar berada pada nilai eigen terkecil dan menyimpang di bawah batas matrik acak. Dan kita perhatikan bahwa untuk nilai eigen yang berada dalam rentang matrik acak, nilai IPRnya mengumpul/tidak begitu menyimpang. Sedangkan untuk nilai eigen yang menyimpang di atas batas atas matrik acak, nilai IPR nya relatif tidak berbeda dengan data matrik acak. Juga bisa kita lihat bahwa ternyata lebih banyak nilai eigen yang di bawah rentang matrik acak dibandingkan dengan nilai eigen yang berada di atas rentang matrik acak. Berapa banyak kumpulan saham tersebut yang berperan besar dalam pembentukkan vektor eigen yang menyimpang tersebut (pada nilai eigen terbesar)? Hal ini bisa kita lihat pada tabel 1, pada kolom 1 I 78 , menyatakan jumlah saham yang berperan dalam pembentukkan nilai eigen terbesar tersebut, dan kita peroleh lebih dari separoh saham berperan dalam nilai eigen terbesar.
7
Juga bisa kita lihat bahwa kepadatan data tidak begitu berpengaruh terhadap pembentukkan IPR(gambar 3) dan 1 I 78 (tabel 1 kolom 3). Hasil ini mirip dengan yang kita peroleh pada gambar 2b.
Gambar 3 Hampir mirip dengan gambar 2b, bahwa perilaku dari nilai eigen yang menyimpang dari batas matrik acak (ditandai dengan daerah berwarna gelap) juga menunjukkan kemiripan pada data yang dalam rentang waktu sama meski memiliki kerapatan data yang berbeda. Namun secara umum bisa dilihat bahwa IPR cukup besar dihasilkan pada nilai eigen di bawah batas minimal matrik acak.
Selanjutnya kita akan melihat hubungan antara kumpulan data saham dengan IHSG. Melalui persamaan (x) kita akan melihat bagaimana susunan saham ini bersesuaian dengan IHSG. Jika kita amati hasil yang diperoleh dari persamaan (x) untuk nilai eigen yang berbeda-beda makin menegaskan peran dari nilai eigen terbesar. Terlihat untuk nilai eigen terbesar λ78 yang membentuk G 78 memiliki kesesuaian dengan IHSG, hal ini terlihat dengan nilai fitting yang mendekati 1. bandingkan dengan hasil yang diperoleh untuk nilai eigen yang lain. Bahkan untuk nilai eigen lainnya yang berada di atas batas matrik acak pun ( λ77 ), fitting antara G 77 dengan IHSG membentuk sudut yang sangat kecil. Dari sini bisa kita tarik kesimpulan bahwa hanya pada nilai eigen terbesar unsur-unsur vektor eigennya memiliki hubungan yang positif dengan IHSG.
8
Gambar 4a Proyeksi vektor eigen terhadap IHSG untuk nilai eigen yang berbeda-beda. Untuk nilai eigen 78
terbesar,proyeksi vektor eigen G dengan IHSG membentuk kemiringan yang jauh lebih besar dibandingkan dengan nilai eigen yang lainnya. Bahkan terhadap nilai eigen G luar batas maksimal matrik acak.
77
yang sama-sama di
Selanjutnya bagaimana perilaku G 78 terhadap IHSG untuk beberapa rentang waktu tertentu? Hasil ditunjukkan pada gambar 4b. terlihat bahwa untuk rentang waktu berbeda-beda menunjukkan kemiringan yang hampir mirip. Dan untuk rentang waktu 5/31/04 s.d 2/3/06 terjadi kemiringan terbesar yang mendekati 1. Secara umum hasil yang kita peroleh pada fitting antara G 78 dengan IHSG menyatakan kesesuaian antara sekumpulan saham (78 saham) terhadap IHSG. IHSG sebagai indek saham gabungan yang mencakup keseluruhan saham dan G 78 yang mencakup 78 saham ternyata memiliki nilai fitting yang mendekati 1. hal ini menunjukkan bahwa ke 78 data saham memiliki peran yang cukup penting dalam pembentukkan IHSG. Pertanyaan ini bisa dilanjutkan tentang jumlah saham yang terlibat sebagai pembanding terhadap IHSG. Apakah pengurangan atau penambahan saham akan berakibat ketepatan fitting terhadap IHSG?
9
Gambar 4b Proyeksi vektor eigen terhadap IHSG untuk nilai eigen terbesar pada rentang waktu yang berbeda-beda, kemiringan atau tingkat kesesuaian ditunjukkan oleh α. Perhatikan bahwa untuk keseluruhan rentang waktu (kanan bawah) fitting antara G
78
dengan IHSG masih mendekati 1.
Selanjutnya kita akan melihat susunan saham yang berperan besar dalam pembentukkan nilai eigen besar sehingga berada di luar batas matrik acak. Pada analisis untuk semua saham kita peroleh bahwa hanya terdapat dua nilai eigen terbesar yang berada di luar batas matrik acak, yaitu λ77 & λ78 . Dari nilai eigen ini kita akan melihat unsur-unsur terbesar dalam vektor eigen, tabel 2a menampilkan lima unsur vektor eigen terbesar untuk setiap nilai eigen di luar batas matrik acak.
u 78 asii auto untr tlkm klbf
tlkm klbf ggrm untr bbca
tlkm asii klbf untr ggrm
asii auto untr tlkm klbf
tlkm klbf ggrm untr bbca
asii tlkm untr klbf isat
ctrs ctra smra inkp jrpt 2b
inkp tkim ctra kija smra 2c
u 77 tkim inkp bnii smma kija 1a
ctrs ctra smra inkp jrpt 1b
inkp tkim ctra kija smra 1c
tkim inkp bnii smma kija 2a
Tabel 2a 78
77
Lima unsur vektor eigen terbesar untuk vektor eigen u & u . Perbedaan kerapatan tidak begitu berpengaruh terhadap susunan saham-saham pembentuk nilai eigen terbesar. Juga terlihat dominasi
10
78
77
saham-saham likuid sebagai saham penyusun vektor eigen terbesar u & u . Perbedaan rentang waktu menyebabkan urutan saham berubah tetapi tidak sampai mengganti dengan saham baru.
Selanjutnya apakah terjadi perbedaan antara susunan di atas dengan hanya memfokuskan pada nilai eigen terbesar?
u 78 asii auto untr tlkm klbf isat ggrm hmsp epmt rals 1a
tlkm klbf ggrm untr bbca asii isat smcb intp pnbn 1b
tlkm asii asii auto klbf untr untr tlkm ggrm klbf isat isat auto ggrm hmsp hmsp pnbn epmt rals rals 1c 2a Tabel 2b
tlkm klbf ggrm untr bbca asii isat smcb intp pnbn 2b
asii tlkm untr klbf isat ggrm auto pnbn indf rals 2c
78
Sepuluh unsur vektor eigen terbesar u . Jika kita bandingkan dengan tabel 2a, terjadi perbedaan terhadap saham yang terlibat pada saham ke-6 s.d ke-10. namun semuanya masih dalam dominasi saham-saham likuid.
Dengan hanya terdapat dua nilai eigen yang di luar batas atas matrik acak menyulitkan untuk melakukan klasifikasi terhadap kumpulan saham. Hasil yang kita peroleh dan ditampilkan pada tabel 2a&2b memberi informasi bahwa pengelompokkan saham yang kita peroleh baik berdasarkan semua nilai eigen yang ada di luar batas atas matrik acak maupun hanya pada nilai eigen terbesar menunjukkan bahwa secara keseluruhan didominasi oleh saham-saham likuid.
4. Kesimpulan Terdapat sebagian kecil dari nilai eigen yang berada di luar batas matrik acak, untuk keseluruhan data yang dianalisis terdapat dua nilai eigen yang berada di atas batas matrik acak. Hasil analisis menunjukkan bahwa perbedaan kerapatan data tidak berpengaruh terhadap jumlah nilai eigen yang berada di luar batas atas matrik acak dan tidak berpengaruh juga terhadap perbandingan nilai eigen maksimal dari data terhadap nilai eigen maksimal dari matrik acak. Analisis dengan menggunakan teori matrik acak akan memfokuskan diri pada nilai eigen yang berada di luar batas matrik acak, sehingga jumlah nilai eigen yang berada di luar batas matrik acak menjadi variabel yang penting dalam analisis. Variabel yang ada di luar batas matrik acak dikategorikan sebagai informasi yang berguna sedangkan variabel yang berada dalam rentang matrik acak merupakan informasi yang sifatnya gangguan. Hal ini bisa dilihat dengan lebih jelas pada hasil yang ditampilkan dalam gambar 4a&4b. Analisis selanjutnya dengan menggunakan vektor eigen menunjukkan kesesuaian antara sifat nilai eigen dengan vektor eigen. Kesesuaian ini ditunjukkan oleh perilaku
11
distribusi vektor eigen yang bersesuaian dengan nilai eigen. Hasil yang diperoleh pada analisis vektor eigen juga menunjukkan hasil yang mirip dengan nilai eigen, yaitu tidak berpengaruhnya kepadatan data terhadap perilaku distribusi vektor eigen. Hal ini bisa dilihat pada tabel 1 dan gambar 2a. Dari perhitungan IPR bisa diperoleh jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar (nilai eigen yang berada di luar batas matrik acak). pada tabel 1 kolom ke tiga terlihat bahwa separoh lebih dari saham yang tergabung dalam data berkontribusi dalam pembentukkan nilai eigen terbesar. Juga bisa kita amati bahwa kepadatan data tidak berpengaruh terhadap jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar. Juga bisa kita lihat bahwa nilai IPR terbesar diperoleh pada saat nilai eigen terkecil, dan nilai eigen ini juga berada di bawah batas matrik acak. Proyeksi vektor eigen terhadap IHSG bertujuan melihat kesesuaian antara sekumpulan saham yang tergabung dalam data terhadap IHSG. Hasil analisis menunjukkan bahwa pada nilai eigen terbesar maka proyeksi vektor eigen terhadap IHSG memiliki tingkat kesesuaian yang tinggi ( α ≈ 1 ). Dan kondisi ini sangat sensitif terhadap perubahan, untuk nilai eigen terbesar ke dua yang juga berada di luar matrik acak tingkat kesesuaian ini menjadi begitu rendah ( α ≈ 0 ) yang tidak begitu berbeda dengan kondisi nilai eigen yang berada dalam rentang matrik acak. secara umum ini makin menegaskan bahwa informasi yang berguna berada pada nilai eigen yang berada di luar matrik acak. Pengelompokkan saham berdasarkan vektor eigen terbesar menunjukkan dominasi dari saham-saham likuid yang tergabung dalam LQ45. Hal ini ditunjukkan baik oleh dua nilai eigen yang berada di luar matrik acak maupun hanya pada nilai eigen terbesar. Hal ini menunjukkan bahwa saham-saham tersebut berperan penting dalam pembentukkan nilai eigen terbesar dan di luar matrik acak. Daftar Pustaka 1. Hariadi, Y.,&Surya, Y. LQ45* dalam TMA. Working Paper Bandung Fe Institute. WP2004i.(2004). 2. Abul-Magd, A.Y. Modelling gap-size distribution of parked cars using random-matrix theory. Elsevier B.V. doi:10.1016/j.physa.2005.10.059. (2006). 3. Zieglera. K. & Kolokolovab, L. Light scattering in an ensemble of complex particles:a random-matrix approach. Elsevier. doi:10.1016/j.jqsrt.2004.01.006. (2004). 4. Shari', S., Crane,M., Shamaie, A., Ruskin. Random matrix theory for portfolio optimization: a stability approach. Elsevier. doi:10.1016/j.physa.2003.12.016. (2003). 5. Malevergnea, Y.,& Sornettea, D. Collective originof the coexistence ofapparent random matrix theory noise and of factors inlarge sample correlationmatrices. Elsevier B.V. doi:10.1016/j.physa.2003.09.004.( 2003). 6. Plerou,V., Gopikrishnan,P., Rosenow,B.,Luı´s A., Amaral, N., Guhr,T.,& Stanley, H.E. Random matrix approach to cross correlations in financial data. PHYSICAL REVIEW E, VOLUME 65, 066126. (2002).
12