2 BAB II LANDASAN TEORI
2.1
TEORI UMUM 2.1.1 Pasar Modal Menurut definisi oleh Bursa Efek Indonesia (www.idx.co.id), pasar modal adalah pasar untuk berbagai instrumen keuangan jangka panjang yang bisa diperjualbelikan, baik surat utang (obligasi), ekuiti (saham), reksa dana, instrumen derivatif maupun instrumen lainnya. Sementara itu, Undang-Undang Pasar Modal No. 8 tahun 1995 tentang Pasar Modal mendefinisikan pasar modal sebagai kegiatan yang bersangkutan dengan penawaran umum dan perdagangan efek, perusahaan publik yang berkaitan dengan efek yang diterbitkannya, serta lembaga dan profesi yang berkaitan dengan efek. Sedangkan definisi pasar atau bursa modal oleh Kamus Besar Bahasa Indonesia (KBBI) adalah kegiatan memperjualbelikan surat berharga yang berjangka waktu lebih dari satu tahun. Dengan demikian, secara umum pasar modal dapat didefinisikan sebagai suatu kegiatan penawaran dan perdagangan efek atau surat berharga, yang mencakup surat utang (obligasi), ekuitas (saham), reksa dana, dan berbagai instrumen derivatif maupun instrumen lain, dengan jangka waktu lebih dari satu tahun.
7
8
Menurut Bursa Efek Indonesia, pasar modal memiliki peran yang sangat penting dalam perekonomian, dimana pasar modal menjadi sarana pendanaan usaha dan sarana bagi perusahan untuk memperoleh dana tambahan, untuk pengembangan usaha atau modal kerja, dari investasi masyarakat. Di sisi masyarakat sendiri, pasar modal menjadi sarana untuk berinvestasi
pada
berbagai
instrumen
keuangan.
Masyarakat
dapat
mengalokasikan dana yang dimilikinya berdasarkan karakteristik keuntungan dan risiko dari masing-masing instrumen. 2.1.2 Saham Menurut Bursa Efek Indonesia (www.idx.co.id), saham dapat didefinisikan sebagai tanda penyertaan modal seseorang atau pihak (badan usaha) dalam suatu perusahaan atau perseroan terbatas. Sementara itu, berdasarkan definisi oleh Kamus Besar Bahasa Indonesia (KBBI), saham adalah hak yang dimiliki orang (pemegang saham) terhadap perusahaan berkat penyerahan bagian modal sehingga dianggap berbagi dalam pemilikan dan pengawasan. Menurut BEI, saham merupakan salah satu instrumen pasar keuangan yang paling popular karena saham mampu memberikan tingkat keuntungan yang menarik bagi para investor. Dalam perdagangan saham sehari-hari, harga saham terus berfluktuasi. Harga saham dibentuk oleh permintaan dan penawaran terhadap saham yang bersangkutan, baik yang sifatnya spesifik terhadap saham tersebut, seperti kinerja perusahaan atau industri dimana perusahaan bergerak, maupun faktor makro seperti tingkat suku bunga, inflasi, kondisi sosial politik, dan sebagainya.
9
2.1.3 Indeks Harga Saham Berdasarkan definisi oleh BEI, indeks harga saham adalah indikator atau cerminan pergerakan harga saham yang menjadi salah satu pedoman bagi investor untuk melakukan investasi di pasar modal, khususnya saham. Hingga saat ini, Bursa Efek Indonesia memiliki 11 jenis indeks harga saham, yaitu sebagai berikut: 1. Indeks Harga Saham Gabungan (IHSG) Indeks ini menggunakan semua Perusahaan Tercatat sebagai komponen perhitungan indeksnya. Agar IHSG dapat memberi gambaran kondisi pasar yang wajar, Bursa Efek Indonesia berwenang mengeluarkan atau tidak memasukkan satu atau beberapa Perusahaan Tercatat dari perhitungan IHSG dengan pertimbangan bahwa apabila jumlah pemilikan saham oleh publik (free float) terhadap perusahaan yang bersangkutan relatif kecil sementara kapitalisasi pasarnya cukup besar, perubahan harga saham Perusahaan Tercatat tersebut berpotensi mempengaruhi kewajaran pergerakan IHSG. 2. Indeks Sektoral Indeks
sektoral
menggunakan
semua Perusahaan
Tercatat yang
termasuk dalam masing-masing sektor. Saat ini terdapat 10 sektor di BEI, yaitu sektor Pertanian, Pertambangan, Industri Dasar, Aneka Industri, Barang Konsumsi, Properti, Infrastruktur, Keuangan, Perdangangan dan Jasa, dan Manufatur.
10
3. Indeks LQ45 Indeks LQ45 terdiri dari 45 saham Perusahaan Tercatat yang dipilih berdasarkan pertimbangan likuiditas dan kapitalisasi pasar, dengan kriteria-kriteria yang sudah ditentukan. Review dan penggantian saham dilakukan setiap 6 bulan. 4. Jakarta Islamic Index (JII) Indeks ini menggunakan 30 saham yang dipilih dari saham-saham yang masuk dalam kriteria syariah (Daftar Efek Syariah yang diterbitkan oleh Bapepam-LK) dengan mempertimbangkan kapitalisasi pasar dan likuiditas. 5. Indeks Kompas100 Indeks ini terdiri dari 100 saham Perusahaan Tercatat yang dipilih berdasarkan pertimbangan likuiditas dan kapitalisasi pasar, dengan kriteria-kriteria yang sudah ditentukan. Review dan penggantian saham dilakukan setiap 6 bulan. 6. Indeks BISNIS-27 Indeks yang diluncurkan oleh kerja sama antara BEI dan harian Bisnis Indonesia ini terdiri dari 27 saham Perusahaan Tercatat yang dipilih berdasarkan kriteria fundamental, teknikal atau likuiditas transaksi dan Akuntabilitas dan tata kelola perusahaan. 7. Indeks PEFINDO25 Indeks PEFINDO25 diluncurkan oleh kerja sama antara BEI dan lembaga rating PEFINDO untuk memberikan tambahan informasi bagi pemodal khususnya untuk saham-saham emiten kecil menengah.
11
Indeks ini terdiri dari 25 saham Perusahaan Tercatat yang dipilih dengan mempertimbangkan kriteria-kriteria seperti: Total Aset, tingkat pengembalian modal dan opini akuntan public, serta faktor likuiditas dan jumlah saham yang dimiliki publik. 8. Indeks SRI-KEHATI Indeks ini dibentuk atas kerja sama antara BEI dengan Yayasan Keanekaragaman Hayati Indonesia (KEHATI) dengan harapan mampu memberi tambahan informasi kepada investor. SRI merupakan singkatan dari Sustainable Responsible Investment. Indeks ini terdiri dari
25
saham
Perusahaan
Tercatat
yang
dipilih
dengan
mempertimbangkan kriteri-kriteria seperti: Total Aset, Price Earning Ratio (PER) dan Free Float. 9. Indeks Papan Utama Indeks ini menggunakan saham-saham Perusahaan Tercatat yang masuk dalam Papan Utama. 10. Indeks Papan Pengembangan Indeks ini menggunakan saham-saham Perusahaan Tercatat yang masuk dalam Papan Pengembangan. 11. Indeks Individual Indeks individual merupakan indeks harga saham masing-masing Perusahaan Tercatat.
12
2.2
TEORI KHUSUS 2.2.1 Prediksi Saham Prediksi saham merupakan salah satu akvititas predictive modeling yang mencakup proses pengumpulan data, formulasi model prediksi, dan kemudian pelaksanaan prediksi serta validasi model. Predictive modeling dasarnya melibatkan sejumlah teknik data mining dan statistik untuk menganalisa fakta-fakta masa kini dan historikal untuk memprediksi kejadian di masa depan (Mishra, Das, Mausumi, & Mishra, 2010). 2.2.1.1 Data yang Digunakan Dalam aktivitas prediksi saham, data yang digunakan pada dasarnya terbagi dalam dua kategori, yaitu data teknikal dan data fundamental (Hellström & Holmström, 1998). Data teknikal adalah data harga saham itu sendiri, yang terdiri dari harga pembukaan, harga penutupan, harga tertinggi, dan harga terendah dari saham yang bersangkutan. Sementara itu, data fundamental adalah data yang memiliki pengaruh terhadap harga saham yang diperdagangkan. Data fundamental dapat berupa: •
Ekonomi makro, seperti inflasi, nilai suku bunga, dan sebagainya.
•
Kondisi industri dimana perusahaan bergerak, misalnya harga saham lain dalam sektor industri yang sama, harga komoditas yang terkait, seperti minyak, logam, atau nilai tukar mata uang.
13
•
Kondisi dari perusahaan yang menerbitkan saham, yaitu dalam kaitan dengan data finansial perusahaan, seperti net profit margin, debt ratio, dan lain-lain.
2.2.1.2 Teknik Prediksi Saham Secara umum, teknik-teknik prediksi saham dibagi dalam empat jenis: 1) pendekatan teknikal, 2) pendekatan fundamental, 3) prediksi deret waktu, dan 4) metode berbasis machine learning. Pendekatan teknikal merupakan pendekatan grafikal dimana prediksi dilakukan berdasarkan harga historikal dari saham yang bersangkutan. Sementara itu, pendekatan fundamental dilakukan dengan mencari harga saham yang sesungguhnya, membandingkannya dengan tingkat perdagangan yang sedang terjadi, dan merekomendasikan pembelian saham yang diperdagangkan
dengan
harga
yang
lebih
rendah
dari
harga
sesungguhnya. Pada pendekatan deret waktu, suatu model prediksi linear dibangun berdasarkan pola harga historikal saham, bisa dengan melibatkan hanya satu variabel saja (univariate) atau beberapa variabel (multivariate). Salah satu teknik prediksi deret waktu yang terkenal adalah ARIMA yang bersifat univariate. Terakhir, metode prediksi dengan memanfaatkan teknik machine learning dilakukan dengan mempelajari sejumlah sampel data untuk menghasilkan suatu ekspresi atau fungsi yang dapat menghasilkan data prediksi. Beberapa contoh algoritma machine learning yang telah dikembangkan, antara lain K-nearest neighbor classification, Naïve
14
Bayes, neural network, Support Vector Machines (SVM) dan Least Squares Support Vector Machines (LSSVM). Untuk membangun model prediksi dengan metode machine learning, perlu disediakan suatu data set yang berisi variabel atau deret waktu yang menjadi objek prediksi serta variabel-variabel lain yang relevan jika ada. Data set tersebut kemudian dibagi menjadi dua, yaitu training dan testing set (Huang, Lai, Nakamori, & Wang, 2004). Training set digunakan untuk membangun model dan prosesnya disebut proses training. Ketika proses training, model akan “mempelajari” pola dari data di dalam training set, yakni bagaimana data-data yang relevan (variabel input) dapat menghasilkan data yang akan diprediksi (variabel output). Dalam hal ini, variabel output dalam training set telah diketahui nilainya. Proses training biasanya juga mencakup penentuan parameter yang tepat bagi model. Setelah model dihasilkan, model akan digunakan pada proses testing, dimana berdasarkan data dari variabel input di dalam testing set, model akan benar-benar memprediksi variabel output. Dalam hal ini, variabel output dalam testing set seolah-olah belum diketahui nilainya. Kinerja
prediksi
dari
model
kemudian
akan
diukur
dengan
membandingkan data hasil prediksi dengan data aktual di dalam testing set. Pada kebanyakan kasus, akan jauh lebih baik apabila dilakukan estimasi awal terhadap kinerja model sebelum digunakan dalam proses testing dilakukan dengan tujuan untuk mencegah overfitting, yaitu situasi
15
dimana model yang dihasilkan memiliki kompleksitas yang terlalu tinggi akibat terlalu memperhitungkan bias atau varian di dalam data (Hellström & Holmström, 1998). Proses estimasi awal terhadap kinerja model ini disebut sebagai proses validation dan data set yang digunakan disebut validation set (Huang, Lai, Nakamori, & Wang, 2004). Mekanisme di dalam proses validation pada dasarnya sama dengan pada proses testing. 2.2.2 Support Vector Machines (SVM) Pada dasarnya, pendekatan SVM bertujuan untuk menghasilkan suatu optimal separating hyperplane untuk pattern recognition. Rumusan asli SVM oleh Vapnik & Lerner pada tahun 1963 dan Vapnik & Chervonenkis pada tahun 1964 ditujukan bagi data yang sifatnya linear atau separable (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002). Pengembangan untuk kasus nonlinear kemudian diperkenalkan oleh Vapnik pada tahun 1995 (Vapnik, 2000). Selanjutnya, pada tahun 1997, versi SVM untuk regresi diperkenalkan oleh Vapnik, Steven Golowich, dan Alex Smola (Basak, Pal, & Patranabis, 2007). SVM regresi merupakan versi SVM yang paling banyak digunakan terutama untuk prediksi deret waktu, termasuk prediksi finansial seperti harga saham. 2.2.2.1 SVM Linear Misalkan data training yang direpresentasikan dengan ,
,…,
,
,
,
dapat dipisahkan oleh suatu hyperplane
1, 1
(2.1)
16
.
0
(2.2)
Untuk suatu training set, bisa diperoleh lebih dari satu hyperplane seperti contoh pada Gambar 2.1 di bawah.
Gambar 2.1 Contoh Banyaknya Alternatif Hyperplane untuk Suatu Masalah Klasifikasi (Suykens et al., 2002)
Gambar 2.2 Pendefinisian Hyperplane yang Unik Berdasarkan Konsep Optimal Hyperplane (Suykens et al., 2002) Model SVM bertujuan untuk membangun suatu fungsi yang menghasilkan hyperplane yang optimal, yaitu hyperplane dengan margin terbesar (Gambar 2.2), yang dirumuskan sebagai berikut: · ·
1
jika 1
atau dalam bentuk singkat:
jika
1, 1,
17
·
1,
1, 2, … ,
(2.3)
Dengan tetap memenuhi kondisi (2.2), suatu hyperplane yang optimal harus memecahkan masalah pemrograman kuadratik, yaitu mencapai nilai minimum untuk fungsi berikut: ·
1, 1 2
Φ
1, 2, … ,
(2.4) (2.5)
·
Solusi untuk masalah di atas dapat diperoleh dengan fungsi Lagrange: , , dimana
1 2
·
·
1
(2.6)
adalah Lagrange multipliers. Fungsi Lagrange di atas harus
diminimalkan untuk w dan b dan dimaksimalkan untuk max min
0.
, ,
,
,
Dengan demikian,
(2.7) , dan
,
,
,
,
harus memenuhi kondisi berikut: 0 0
Dari persamaan-persamaan di atas, diperoleh karakteristik dari harus memenuhi Persamaan (2.8)
hyperplane optimal, yaitu koefisien
dan hyperplane optimal merupakan kombinasi linear dari vektor-vektor dalam training set (Persamaan (2.9)). 0,
0,
1, … ,
(2.8)
18
,
0,
1, … ,
(2.9)
Karena hanya support vectors yang bisa memberikan nilai bukan nol untuk koefisien
bagi
, maka Persamaan (2.9) dapat dirumuskan
secara lebih spesifik sebagai berikut: ,
0,
1, … ,
(2.10)
Berdasarkan teori Kühn-Tucker, hyperplane optimal juga harus memenuhi kondisi ·
1
0,
Dengan mensubstitusikan persamaan
1, … ,
(2.11)
ke dalam fungsi Lagrange dan
mengikuti kondisi Kühn-Tucker, diperoleh fungsi 1 2
·
(2.12)
,
dimana persyaratan pada Persamaan (2.8) harus tetap dipenuhi. Dengan demikian, untuk memperoleh hyperplane optimal, harus diselesaikan
suatu
masalah
pemrograman
kuadratik,
yakni
memaksimalkan bentuk kuadratik (2.12) dalam batasan Persamaan (2.8). Aturan separasi berdasarkan hyperplane optimal yang diperoleh selanjutnya dapat dihasilkan dari fungsi berikut: ·
(2.13)
19
dimana
adalah support vectors,
adalah koefisien Lagrange yang
adalah konstanta (threshold) yang dapat diperoleh
bersangkutan, dan dari rumus 1 2
1
·
·
(2.14)
1
1 merepresentasikan support vector yang masuk dalam
dimana
1
kelas pertama dan
merepresentasikan support vector yang
masuk ke dalam kelas kedua. 2.2.2.2 SVM Nonlinear Untuk memperoleh hyperplane yang optimal untuk kasus dimana data tidak dapat dipisahkan secara linear, Vapnik menambahkan suatu 0 serta fungsi
variabel nonnegative
0.
dengan parameter Fungsi
kemudian
diminimalkan
dengan
menuruti
ketentuan 1
·
,
1, 2, … ,
(2.15)
Generalized optimal hyperplane ditentukan oleh vektor dengan meminimalkan fungsi Φ
,
1 2
·
dengan memenuhi syarat (2.15).
(2.16)
20
Teknik untuk memecahkan masalah kuadratik di sini hampir sama dengan yang digunakan dalam kasus separable, dimana untuk menemukan koefisien dari generalized optimal hyperplane, harus dicari parameter
,
1, … , , yang memaksimalkan bentuk kuadratik yang
sama dengan kasus separable, yaitu 1 2
· ,
namun dengan syarat yang sedikit berbeda, yakni 0
,
1, … ,
0 Sama seperti pada kasus separable, hanya beberapa koefisien
,
1, … , yang tidak sama dengan nol, yaitu yang menghasilkan support vectors. Vapnik kemudian mengembangkan teori SVM lebih jauh dengan memperkenalkan teknik nonlinear yang dilakukan dengan memetakan data input ke dalam ruang fitur dengan dimensi yang lebih tinggi, dan tanpa batas (Gambar 2.3). Hyperplane pemisah kemudian akan dibangun pada ruang fitur high dimensional tersebut.
21
Gambar 2.3 Pemetaan Input In Space pada p High D Dimensional Feature Spacce d funnction yang Dengann teknik kernnel tersebut, dibangun decision nonnlinear di daalam ruang innput, yaitu
(2.17)
nam mun ekuivallen dengan decision funnction yang linear di daalam ruang fitu ur high-dimeensional. Koefisiien
dapatt diperoleh dengan mencari nilai maksimum m
unttuk fungsi (2.18) denngan memennuhi syarat (2.19)
22
Fungsi ini sama dengan fungsi untuk memperoleh hyperplane optimal kecuali pada bagian inner products, dimana inner products ·
,
digantikan dengan
.
Terdapat beberapa pilihan fungsi Kernel
·,· , antara lain
(Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002): •
SVM linear ,
•
·
SVM polynomial dengan derajat . ·
, •
Kernel RBF ,
•
⁄
exp
Kernel MLP ,
tanh
·
2.2.2.3 SVM untuk Estimasi Fungsi (SVM Regresi) Pada dasarnya SVM dibagi menjadi dua kategori, yakni SVM klasifikasi, yang telah diuraikan pada subbab 2.2.2.1 dan 2.2.2.2, dan SVM regresi (Basak, Pal, & Patranabis, 2007). SVM regresi intinya bertujuan untuk mengestimasi fungsi dependensi dari variabel dependen berdasarkan sekumpulan variabel independen (StatSoft, Inc., 2013). Pada ε-SVM regresi, fungsi f(x) yang diperoleh harus menghasilkan deviasi maksimal ε dari target yang diobservasi, yi, untuk keseluruhan data pada training set, namun dengan flatness yang sebesar mungkin. Rumusan ε-SVM regresi untuk kasus linear, yaitu:
23
·
,
1, 2, … ,
(2.20)
Flatness pada rumusan di atas dapat diperoleh dengan meminimalkan panjang dari vektor ·
, yakni dengan meminimalkan
dan memenuhi kriteria: ·
(2.21)
·
Pada kasus dimana tidak dapat dihasilkan fungsi f yang mampu memprediksi seluruh pasangan (xi, yi) dengan presisi ε, maka dengan mengadaptasi loss function dengan soft margin, diperkenalkan slack dan
variables
. Dengan demikian optimasi kemudian dapat
diperoleh dengan meminimalkan: 1 2
·
(2.22)
dan memenuhi kriteria: · · ,
(2.23) 0
Konstanta C berfungsi sebagai trade-off antara flatness dari fungsi f dengan batas toleransi dari deviasi yang lebih besar daripada ε. Untuk memecahkan permasalahan optimasi di atas, digunakan fungsi Langrange sehingga diperoleh rumusan sebagai berikut: 1 2
·
·
(2.24) ·
24
dimana
,
,
,
> 0. Untuk memperoleh nilai optimal, berlaku
kondisi berikut: 0
(2.25)
0
(2.26)
0
(2.27)
Dengan mensubstitusikan Persamaan (2.25), (2.26), dan (2.27) ke dalam
Persamaan
(2.24),
diperoleh
rumusan
optimasi
dengan
memaksimalkan: 1 2
· ,
(2.28)
dan memenuhi: 0 ,
(2.29)
0,
Dengan tereliminasinya variabel ,
, Persamaan (2.26) dapat
dituliskan kembali menjadi:
dan dengan demikian, diperoleh:
(2.30)
25
·
(2.31)
Konstanta dapat dihitung menggunakan rumus: ·
0,
untuk
(2.32)
·
0,
untuk
Pada kasus nonlinear, dapat diaplikasikan trik kernel, sehingga Persamaan (2.30) dan (2.31) dituliskan kembali menjadi: (2.33)
,
(2.34)
Teknik kernel yang dapat digunakan sama seperti yang telah disebutkan pada subbab 2.2.2.2, yakni linear, polinomial, RBF, dan MLP. Namun, teknik yang paling banyak digunakan adalah RBF karena cenderung memberikan hasil yang lebih baik. 2.2.3 Least Squares Support Vector Machines (LSSVM) LSSVM merupakan versi modifikasi dari SVM oleh Suykens et al. (2002) yang bertujuan untuk memecahkan persamaan-persamaan linear dengan cara yang lebih sederhana dibandingkan masalah pemrograman kuadratik yang dihadapi dalam SVM Vapnik (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002). Selain kompleksitas kalkulasi yang lebih rendah, proses training LSSVM dalam permalasahan berskala besar juga lebih cepat dan menggunakan resource komputasi yang lebih sedikit dibandingkan SVM (Mustaffa & Yusof, 2011). Selain itu, untuk penggunaan kernel RBF, jumlah
26
parameter yang harus dioptimalkan pada LSSVM juga lebih sedikit dibandingkan SVM, dimana pada LSSVM hanya dua variabel yang perlu ), sedangkan pada SVM terdapat tiga parameter, yaitu
ditentukan, yaitu ( , ( ,
,
) (Ou & Wang, 2009; Suykens, Gestel, Brabanter, Moor, &
Vandewalle, 2002). Sama
seperti
pada
SVM,
LSSVM
dapat
digunakan
untuk
permasalahan klasifikasi dan regresi baik pada kasus linear maupun nonlinear. Pada kasus nonlinear, teknik kernel juga dapat diaplikasikan di dalam LSSVM. Pilihan kernel yang dapat digunakan sama seperti pada SVM, yakni linear, polinomial, RBF, dan MLP. 2.2.3.1 LSSVM untuk Klasifikasi Pada permasalahan klasifikasi, decision function dari model dalam primal space dirumuskan sebagai berikut: sign
·φ x
b
·
dimana
(2.35)
adalah pemetaan ke ruang fitur high
dimensional seperti pada SVM standar. Berikut adalah rumusan problema optimasi dalam LSSVM yang diperkenalkan oleh Suykens et al. (2002): min
,
, ,
1 2
1 2
·
(2.36)
sedemikian sehingga ·
1
,
1, … ,
(2.37)
Terlihat dua hal yang membedakan hasil modifikasi ini terhadap formulasi asli oleh Vapnik. Yang pertama adalah pada penggunaan
27
fungsi persamaan yang menggantikan pertidaksamaan dimana nilai 1 di bagian kanan lebih merupakan suatu nilai target alih-alih nilai threshold. Untuk mentolerir kesalahan, persamaan dilengkapi dengan suatu variabel kesalahan
yang memiliki peran yang sama seperti variabel
dalam
rumus SVM. Perbedaan kedua yaitu pada penggunaan fungsi kuadrat untuk variabel kesalahan tersebut. Untuk kasus nonlinear, diturunkan rumus Lagrangian berikut: , , ;
,
·
1
(2.38)
adalah Lagrange multipliers, yang bisa bernilai positif
dimana nilai
maupun negatif. Untuk mencapai nilai optimal, kondisi berikut harus terpenuhi: 0 0
0
0
,
0
1, … ,
·
Dengan mengeliminasi
1
⁄
;…; 1
1; … ; 1
1, … ,
(2.40)
dimana: ·
0,
dan , diperoleh sistem linear: 0 1
0 Ω
(2.39)
;…;
·
28
;…; ;…; dan Ω
. Trik kernel dapat diaplikasikan di dalam matriks Ω: ·
Ω , untuk ,
1, … , .
Dengan demikian, model LSSVM yang dihasilkan dalam dual space adalah sebagai berikut: sign
,
(2.41)
2.2.3.2 LSSVM untuk Estimasi Fungsi Penurunan rumus pada LSSVM untuk estimasi fungsi pada dasarnya sama seperti pada LSSVM untuk klasifikasi karena LSSVM klasifikasi sebenarnya dapat dipahami sebagai kasus regresi dengan target +1 dan -1. Misalkan decision function dari model LSSVM dalam primal space dirumuskan sebagai berikut (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002): ·φ x dimana
·
(2.42) adalah pemetaan ke ruang fitur high
dimensional seperti pada SVM standar. Maka, dapat dirumuskan problema optimasi dalam LSSVM regresi, yaitu:
29
min
1 2
,
, ,
1 2
·
(2.43)
sedemikian sehingga ·
,
1, … ,
(2.44)
Rumus Lagrangian yang dibangun untuk kasus nonlinear sebagai berikut: , , ;
dimana nilai
(2.45)
·
,
adalah Lagrange multipliers. Kondisi optimal yang harus
dipenuhi antara lain: 0 0
0
0
,
0
1 Ω
1, … ,
·
Setelah mengeliminasi 0
(2.46)
0,
dan , diperoleh: 0
⁄
dimana: ;…; 1
1; … ; 1 ;…;
Trik kernel dapat diaplikasikan sebagai berikut: ·
Ω ,
1, … ,
(2.47)
30
untuk ,
1, … , .
Dengan demikian, fungsi estimasi yang dihasilkan adalah: ,
(2.48)
2.2.4 Autoregressive Integrated Moving Average (ARIMA) ARIMA adalah suatu model prediksi deret waktu univariate, dimana ARIMA hanya menggunakan satu variabel atau deret waktu dan model dihasilkan dengan membangun suatu fungsi linear berdasarkan nilai-nilai historikal dan/atau loncatan-loncatan acak di dalam deret waktu (Tsitsika, Maravelias, & Haralabous, 2007). ARIMA merupakan salah satu model prediksi deret waktu yang paling banyak digunakan karena fleksibilitasnya dalam merepresentasikan berbagai bentuk deret waktu, antara lain autoregressive murni (AR), moving average murni (MA), dan kombinasi antara AR dan MA (ARMA) (Abdullah, 2012). Pembangunan model ARIMA melibatkan tiga tahap utama (Abdullah, 2012; Tsitsika, Maravelias, & Haralabous, 2007). Tahap pertama adalah identifikasi model, yaitu menentukan apakah deret waktu bersifat stasioner dan tranformasi yang diperlukan, dalam hal ini berupa derajat diferensiasi (d), apabila deret waktu belum stasioner. Tahap selanjutnya adalah estimasi parameter, yakni menentukan apakah deret waktu merupakan deret autoregresif (AR), moving average (MA), atau keduanya, yang dinotasikan dalam orde p dan q. Pada kasus seasonal ARIMA, serangkaian parameter serupa juga perlu ditentukan untuk komponen seasonal, yang dinotasikan sebagai P, D, dan Q. Representasi
31
umum untuk seasonal ARIMA dalah ARIMA (p, d, q) x (P, D, Q)s dimana s adalah periode (Ayinde & Abdulwahab, 2013). Langkah terakhir adalah pengecekan diagnostik untuk melakukan verifikasi terhadap model. Model yang baik diharapkan memiliki residual yang mengandung white noise. Statistik Q oleh Ljung-Box biasanya digunakan untuk menguji normalitas residual yang dihasilkan model ARIMA (Abdullah, 2012), yakni dengan menguji hipotesis berikut: Ho : Kesalahan bersifat acak (white noise) H1 : Kesalahan tidak bersifat acak (bukan white noise) Agar suatu model ARIMA dianggap baik, nilai statistik Q yang dihasilkan harus lebih kecil dibandingkan nilai kritikal dari distribusi chisquare dengan derajat kebebasan s, dimana s adalah jumlah koefisien dalam pengujian (Clement, 2013). Dengan kata lain, model ARIMA dikatakan baik apabila hipotesa nol (H0) diterima. Selain statistik Q Ljung-Box, indikator lain yakni Bayesian information criterion (BIC) juga digunakan umum dalam pemilihan model ARIMA. Sama seperti statistik Q Ljung-Box, indikator BIC juga bertujuan untuk mengukur kecocokan model dengan deret waktunya (Clement, 2013). Semakin kecil nilai BIC berarti model semakin dekat dengan deret waktunya.
2.3
PENELITIAN SEBELUMNYA Banyak peneliti mencoba untuk melakukan prediksi tren harga saham
dengan menerapkan pendekatan statistik dan grafikal (Abdullah, 2012; Moghaddasi & Badr, 2008; Jakaša, Andročec, & Sprčić, 2011). Namun
32
pendekatan tersebut kurang efektif dibandingkan prediksi dengan pendekatan yang berbasis kecerdasan komputasi. Besarnya data yang dihasilkan oleh pasar modal secara tidak langsung menuntut peneliti untuk memanfaatkan teknik data mining (Prasanna & Ezhilmaran, 2013). Cukup banyak penelitian yang telah dilakukan terkait prediksi harga saham dengan pendekatan data mining. Salah satunya adalah penelitian oleh (Olaniyi, Adewole, & Jimoh, 2011) yang mengkombinasikan metode regression analysis dan moving average untuk memprediksi tren harga saham dari tiga bank di Nigeria dengan menggunakan data harga seluruh saham yang diperdagangkan di Nigerian Stock Exchange. Selain oleh (Olaniyi, Adewole, & Jimoh, 2011), penelitian tentang prediksi saham pada Nigerian Stock Exchange juga dilakukan oleh (Akinwale, Arogundade, & Adekoya, 2009) dengan menggunakan algoritma error back propagation dan regression analysis. Penelitian yang serupa juga dilakukan oleh (Magaji, Waziri, Isah, & R., 2012) dengan metode Naïve Bayes. Penelitian lain oleh (Kannan, Sekar, Sathik, & Arumugam, 2010) mengusulkan algoritma yang dapat memprediksi apakah harga penutupan saham di hari yang bersangkutan akan mengalami peningkatan atau penurunan dari hari sebelumnya. Algoritma tersebut dibangun dengan mengkombinasikan lima metode analisis saham, yaitu Typical Price (TP), Bollinger Bands, Relative Strength Index (RSI), CMI dan Moving Average (MA). Selain itu, pada tahun 2011, Kara, Boyacioglu, & Baykan melakukan penelitian yang membandingkan kinerja ANN dan SVM dalam memprediksi pergerakan indeks harga saham di Istanbul Stock exchange, sementara Kumar &
33
Thenmozhi (2005) yang membandingkan teknik SVM dan Random Forest dalam memprediksi pergerakan indeks saham S&P CNX NIFTY Market Index. Beberapa penelitian lain yang secara spesifik relevan terhadap penelitian ini, antara lain penelitian oleh (Deng & Yeh, 2011) yang memanfaatkan LSSVM untuk mengestimasi biaya produksi, (Gestel, et al., 2001) yang melakukan prediksi terhadapat beberapa macam data finansial dan memperoleh hasil prediksi yang lebih akurat menggunakan LSSVM dibandingkan dengan model AR dan model nonparametrik lain, serta (Yu, Chen, Wang, & Lai, 2009) yang memprediksi pergerakan harga saham dan menyimpulkan bahwa model LSSVM memiliki kinerja prediksi yang lebih baik dibandingkan model ARIMA, LDA, BPNN, dan SVM. Sementara itu, penelitian yang lebih komprehensif dilakukan oleh Ou & Wang (2009) yang membandingkan kinerja sepuluh teknik data mining dalam memprediksi arah pergerakan indeks Hang Seng berdasarkan lima faktor, yaitu harga pembukaan, harga penutupan, indeks S&P 500, dan harga kurs antara dolar HK dan dolar AS. Sepuluh teknik yang dibandingkan adalah Linear discriminant analysis (LDA), Quadratic discriminant analysis (QDA), K-nearest neighbor classification, Naïve Bayes berbasis kernel, Logit model, Tree based classification, neural network, Bayesian classification dengan Gaussian process, Support vector machines (SVM) dan Least squares support vector machines (LSSVM). Hasil perbandingan menunjukkan bahwa model SVM dan LSSVM menghasilkan akurasi prediksi yang jauh lebih baik dibandingkan model lainnya, dan di antara kedua model tersebut, SVM menghasilkan prediksi yang lebih baik
34
daripada LSSVM untuk prediksi in-sample, sedangkan untuk prediksi out-ofsample, LSSVM memberikan prediksi yang lebih baik daripada SVM.