IMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM
M. Zulfikar1 Alimin Bado2, Kresna Jaya2, Md Rafiul Hassan and Baikunth Nath2 Program Studi Sarjana Statistika – Universitas Hasanuddin,
[email protected] SARI BACAAN Proses Markov adalah proses stokastik dimana masa lalu tidak mempunyai pengaruh pada masa yang akan datang bila masa sekarang telah diketahui. Hidden Markov Model didefinisikan sebagai kumpulan lima parameter (N,M,A,B,π). Jika dianggap λ = {A, B,π} adalah parameter tidak tetap. N dan M merupakan parameter tetap pada HMM. Hidden Markov Model merupakan perkembangan dari rantai markov dengan keadaan pada masa yang akan datang dari suatu urutan tidak hanya ditentukan oleh keadaan saat ini, tetapi juga perpindahan dari suatu urutan state ke urutan state yang lainnya. Urutan state inilah yang merupakan suatu bagian yang tersembunyi dari suatu Hidden Markov Model. Pendekatan peramalan data saham dengan memperhatikan urutan pengamatan yang tersedia kemudian diaplikasikan menjadi salah satu implementasi Hidden Markov Model. Data yang digunakan dalam penelitian ini adalah data saham yang berasal dari Yahoo! Finance pada alamat http://finance.yahoo.com, yang akan menghasilkan interpretasi lanjut atas pergerakan data saham. Kata kunci :
Peramalan, Hidden Markov Model, Pergerakan Data Saham
ABSTRACT Markov Process are one stochastik process where the future not only one term that influence present that was known. Hidden Markov Model is defined as five parameters (N,M,A,B,π). If λ = {A, B,π} are variable parameters. N and M are HMM fixed parameter. Hidden Markov Model are developed from markov chain where term and present situation not only determined by currently situation from the another term and future situation but also sequence change. The sequence are one hidden part from Hidden Markov Model. One kind of Stock Market Forecasting will concern on available sequence then applied it on the Hidden Markov Model. In this research, using data that came from stock market which come from “Yahoo! Finance” in the web “http://finance.yahoo.com”, that will result the interpretation of stock market movement. Key word : Forecasting, Hidden Markov Model, StockMarket Movement
PENDAHULUAN
manajemen
Peramalan (forecasting) merupakan
signifikan. Peramalan menjadi dasar bagi
salah satu bagian vital bagi setiap organisasi
perencanaan jangka panjang perusahaan.
bisnis
Dalam area fungsional keuangan, peramalan
I.
dalam
pengambilan
keputusan
yang
manfaatnya
sangat
memberikan
dasar
dalam
menentukan
yang menginterpretasikan kelakuan atas data
anggaran dan pengendalian biaya. Pada
saham
bagian pemasaran, peramalan penjualan
beberapa aspek keperluan. Dalam beberapa
dibutuhkan untuk merencanakan produk
kasus, kadang terdapat kesalahan ataupun
baru,
dan
ketidak sesuaian dalam beberapa metode.
lainnya.
Baik itu perilaku yang dipengaruhi oleh
kompensasi
beberapa
tenaga penjual,
keputusan
penting
Selanjutnya, pada bagian produksi dan
perencanaan
kapasitas,
fasilitas,
sangat
diinginkan
dalam
faktor internal maupun faktor eksternal. Konsep Markov Model yang telah
operasi menggunakan informasi peramalan untuk
akan
diperluas menjadi Hidden Markov Model
produksi, penjadwalan, dan pengendalian
(Model
persedian (inventory control).
observasi merupakan fungsi probabilitas dari
Peramalan memang tidak akan pernah tepat
100
%,
mengandung
karena
masa
banyak
Markov
Tersembunyi)
dimana
status. Model ini kemudian diaplikasikan
depan
pada kasus yang prosesnya tidak dapat
masalah
diobservasi secara langsung (tersembunyi)
ketidakpastian. Namun demikian, dengan
tetapi
pemilihan metode yang tepat, dapat dibuat
kumpulan proses stokastik yang lain yang
peramalan dengan tingkat kesalahan yang
sedapat mungkin menghasilkan tahapan
kecil atau memberikan perkiraan yang
observasi (Rosadi. 2006).
diobservasi
hanya
melalui
konsep Markov Model yang telah
sebaik mungkin terhadap keadaan masa
diperluas menjadi Hidden Markov Model
yang akan datang. Peramalan
bisa
bisa
dilakukan
secara
(Model
Markov
Tersembunyi)
dimana
kualitatif maupun kuantitatif. Adapun salah
observasi merupakan fungsi probabilitas dari
satu kajian data multivariate time series
status. Model ini kemudian diaplikasikan
yang menarik bagi beberapa kalangan
pada kasus yang prosesnya tidak dapat
adalah data pasar saham atau data saham.
diobservasi secara langsung (tersembunyi)
Pergerakan data saham kadang menjadi
tetapi
salah satu tantangan yang menarik. Dalam
kumpulan proses stokastik yang lain yang
metode
sedapat mungkin menghasilkan tahapan
peramalannya
selalu
terdapat
beberapa kendala karena perilakunya yang tak terduga. Jadi, sebuah prediksi model yang cerdas dalam peramalan data saham
bisa
diobservasi
hanya
melalui
observasi (Rosadi. 2006). Dengan
beberapa
pertimbangan
tersebut, maka dalam tulisan ini akan dikaji
bagaimana
pengembangan
(forecast)
serta
peramalan
implementasi
Hidden
Markov Model (HMM) dalam metode
Hidden Markov adalah 4 sampai dengan 5 State. Data yang digunakan adalah data dari saham ATX pada bursa pasar saham dari
peramalan atas Pergerakan Data Saham. Hidden
tanggal 31 Agustus 2010 sampai dengan
akan
tanggal 31 Agustus 2011 sebanyak 367 data.
ditemukan pola dataset dari masa lalu yang
Pada implementasi Hidden Markov Model
sesuai dengan perilaku atau kondisi atas pola
ini akan digunakan 4 buah Fitur Input
data hari ini, kemudian menginterpolasi
(Masukan) yaitu : Harga pembukaan (Open),
kedua dataset dengan tepat atas nilai unsur-
Harga penutupan (Close), Harga tertinggi
unsur ketetanggannya dan akan dihasilkan
(High), dan Harga terendah (Low).
Pada Markov
prinsipnya, Model
dalam
pertama-tama
prerdiksi atas perilaku atau kondisi atas pola
Sebelum melakukan prediksi, terlebih
data kedepan berdasarkan satu ataupun
dahulu ditentukan bentuk tabel transisi data
beberapa variabel acuan (Hassan dan Nath.
(). Dalam menentukan tabel transisi data
2005).
pada saham ini gejala pergerakan harga saham yang bertindak sebagai
II.
METODOLOGI Dalam
hidden
states, kemudian dapat juga disebut sebagai
penelitian
ini
dilakukan
state. Pada Data Saham ini digunakan tiga
peramalan data saham dengan menggunakan
gejala umum yang berlaku pada Data
Hidden Markov Model. Adapun hal yang
Saham. Yaitu Naik, Turun, Tetap. Yang
perlu dipertimbangkan adalah bagaimana
ditunjukkan tabel 1 : Gejala Data Saham
prinsip kerja dari Hidden Markov Model
(Fitur Input Data Saham ATX)
tersebut.
State
Menurut tesisnya
Yingjian
menerapkan
Zhang
dalam
kombinasi
antara
metode Hidden Markov dengan Gaussian sebagai fungsi observasi (HMGM) perlu
Fitur Input Open High Low Close
Naik
Turun
Tetap
Total
119 127 134 119
131 121 115 131
116 118 117 116
366 366 366 366
dalam memprediksi pasar sekuritas. Salah satu hal yang sangat menarik dalam tesisnya
Untuk menghasilkan tabel peluang awal ini,
adalah ia menemukan bahwa jumlah state
gejala Data Saham ini akan dibagi dengan
yang paling baik untuk sebuah model
jumlah total data. Adapun tabel peluang
awal Data Saham tersebut ditunjukkan
satu terhadap Fitur Input Data Saham yang
dalam tabel tabel 2 : Peluang Awal (Fitur
lainnya. Sehingga dari tabel emisi tersebut,
Input Data Saham ATX)
akan dibentuk tabel peluang emisi yang merupakan perbandingan antara jumlah
State Fitur Input
Naik
Turun
Tetap
Total
Open
0,3251 0,3579 0,3169 1
High
0,3470 0,3306 0,3224 1
Low
0,3661 0,3142 0,3197 1
Close
0,3251 0,3579 0,3169 1
emisi yang berpindah dari suatu state ke state lainnya dengan state itu masingmasing.
III. HASIL DAN PEMBAHASAN Setelah property awal Hidden Markov
Jumlah data sebanyak 366 data ini kemudian akan menghasilkan transisi. Dimana, transisi merupakan pergerakan Data Saham dari hari pertama ke hari berikutnya. Maka dengan ini dapat diketahui banyaknya Transisi adalah Jumlah data dikurangi satu (366 – 1 = 365 Transisi). Transisi ini akan membentuk suatu pola perpindahan atas gejala Data
Dari tabel transisi tersebut
akan
dihasilkan peluang perpindahan dari masingmasing state yang disebut sebagai peluang Peluang
transisi
merupakan
perbandingan antara jumlah transisi yang berpindah dari suatu state ke state lainnya
asumsi λ = {A, B,π}
maka
HMM
mempunyai parameter tertentu N dan M. Dimana, λ = {A, B,π} dapat pula ditulis sebagai berikut : λ = {[Pr. Transisi], [Pr. Emisi],
[Pr.
Awal]}.
Jadi
untuk
mengaplikasikan data saham ini masih
Pada permasalahan Hidden Markov Model, selain entri-entri dari tabel Peluang Awal dan Tabel Peluang Transisi, juga Tabel
Emisi.
Tabel
keadaan model) dan M (jumlah
dari
simbol observasi/keadaan). Kemudian dari pergerakan masingmasing Data Saham ini akan diselesaikan dengan algoritma Viterbi. Inputnya berasal dari parameter λ tersebut yaitu {[Pr. Transisi], [Pr. Emisi], [Pr. Awal]}.
dengan state itu masing-masing.
dibutuhkan
lima parameter (N,M,A,B,π) dan dengan
dibutuhkan dua parameter yakni N (jumlah
Saham.
transisi.
Model yang didefinisikan sebagai kumpulan
Emisi
merupakan tabel pengaruh Fitur Input yang
Setelah
parameter λ yaitu {[Pr.
Transisi], [Pr. Emisi], [Pr. Awal]} sudah tersedia, maka akan digunakan Algoritma Viterbi untuk menginferensi
pergerakan
masing-masing Data Saham ini berdasarkan
Observasi yang tersedia yakni dari tanggal
berakhir pada observasi yang terakhir.
31
Proses Terminasi dilakukan sebagai berikut:
Agustus
2011
sampai
dengan
26
∗ |∅ = max δ N (t )
September 2011.
1≤t ≤ N ε
Dari tabel Observasi tersebut dapat
ࡺ ∗ |∅ = arg
diperoleh parameter tertentu N dan M. Dimana, N (jumlah keadaan model) dan M (jumlah dari simbol observasi/keadaan).
max δ (t ) N
1≤ t ≤ N ε
Setelah proses Terminasi maka akan
Dengan Algoritma Viterbi, maka hal yang
dilakukan
dilakukan pertama kali adalah, Inisialisasi.
bagaimana kondisi yang paling mungkin
Dimana Inisialisasi adalah mengidentifikasi
terjadi pada masing-masing Fitur Input.
bentuk nilai dasar dari masing-masing Fitur
Proses Pelacakan kembali dilakukan sebagai
Input. Adapun Inisialisasi Fitur Input dapat
berikut :
dilakukan
sebagai
δ (t ) = π t bt ; t = 1,2,..., N
berikut: dan
ψ (t ) = 0 .
Setelah proses Inisialisasi akan dilakukan
proses
Pelacakan
kembali
∗ ଵ∗ , ଶ∗ , … , ே∗ sehingga ∗ , ∗ = ାଵ ାଵ
proses berikutnya, yakni Rekursif. Proses
= − 1 , − 2 , … , 1
Rekursif ini akan menampikan nilai Trend dan pergerakan masing-masing Fitur Input
Dengan proses pelacakan kembali ini
berdasarkan state. Proses Rekursif dilakukan
atau biasa juga disebut Backtracking, maka
sebagai berikut :
Algoritma Viterbi ini telah selesai. Setelah
δ n ( j ) = max (δ n−1 (t ) atj )b jxn
untuk
1≤t ≤ Nε
selesai, maka dapat ditunjukkan Hasil
1 ≤ j ≤ Nε dan 2 ≤ n ≤ N ψ n ( j ) = arg
Identifikasi pergerakan Data Saham dengan menggunakan Hidden Markov Model.
max (δ (t ) a ) n −1
tj
Untuk
1≤ t ≤ N ε
Dengan
Setelah proses Rekursif maka akan Proses
Terminasi
memudahkan,
digunakan
software HMM berbasis Matlab.
untuk 1 ≤ j ≤ Nε dan 2 ≤ n ≤ N
dilakukan
semua Proses dari Algoritam Viterbi ini
yang
memunculkan kemungkinan nilai peluang paling besar dari suatu observasi yang
dihasilkan kemungkinan
bantuan keluaran yang
software berupa
terjadi
Properti fitur input tersebut.
akan barisan
berdasarkan
dengan Hidden Markov Model adalah
penggunaan algoritma Viterbi pada data ini,
sebagai berikut:
akan dilakukan pengujian terhadap output
Uji Akurasi (Fitur Input CLOSE | OPEN
yang dihasilkan. Nilai akurasi tersebut
Data Saham ATX )
Turun
hasil pembagian tersebut dikalikan dengan
Turun
100%. Sebagai contoh bila jumlah prediksi
Turun
Historical Data
Ke-4
dengan total panjang barisan yang diuji dan
Observasi Ke-6
Tetap Ke-8
prediksi tersebut kemudian nilainya dibagi
Ke-10
Naik
Ke-12
sebenarnya (historical data). Dari jumlah
Ke-14
Naik
Ke-16
prediksi yang tepat berdasarkan harga saham
Ke-18
Naik
Ke-20
jumlah
Ke-22
menghitung
Ke-24
dengan
Ke-26
diperoleh
Ke-2
Untuk mengetahui tingkat ketepatan
Output HMM
yang tepat sebanyak 15 dari 20 hari, maka nilai akurasinya adalah (15/20 x 100% =
Uji Akurasi (Fitur Input CLOSE | HIGH
75%).
Data Saham ATX )
Turun
Historical Data
Ke-2
Historical Data diberi bobot 1 sementara
Ke-4
Turun
Ke-6
keadaan Output HMM yang sama dengan
Ke-8
Turun
Observasi Ke-10
tidak sama. Dengan mengasumsikan bahwa
Ke-12
Tetap Ke-14
dengan historical data, sementara 19 lainnya
Ke-16
Naik
Ke-18
perkiraan yang ada, terdapat 7 yang sama
Ke-20
Naik
Ke-22
prediksi, dapat ditunjukkan bahwa dari 26
Ke-24
Naik
Ke-26
Untuk mengetahui tingkat akurasi
Output HMM
keadaan yang tidak sama diberi bobot 0,
pergerakan harga saham yang dihasilkan
Tetap
Turun Historical Data Turun
Output HMM
Ke-2
Ke-4
Turun
Observasi Ke-6
(Historical Data) dan grafik perkiraan
Naik
Ke-8
Grafik pergerakan harga saham sebenarnya
Naik
Ke-10
diperoleh hasil 0,730769231 (sekitar 73 %).
Naik
Ke-12
jumlah bobot keseluruhan yaitu 26.Sehingga
Data Saham ATX )
Ke-14
akurasinya, hasil tersebut dibagi dengan
Uji Akurasi (Fitur Input CLOSE | LOW
Ke-16
menghitung
Ke-18
Untuk
Ke-20
19.
Ke-22
yaitu
Ke-24
cocok
Ke-26
maka diperoleh jumlah bobot keadaan yang
Theoretical and Applied Econometrics, Kluwer Academic Publishers, NEW YORK, BOSTON, DORDRECHT, LONDON, MOSCOW.
DAFTAR PUSTAKA Dr.rer.nat. Dedi Rosadi, M.Sc.Eng., 2006. DIKTAT KULIAH PENGANTAR ANALISA RUNTUN WAKTU, Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Gadjah Mada, Yogyakarta. L.R.Rabiner, Fellow, 1989. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Md Rafiul Hassan and Baikunth Nath, 2005. Stock Market Forecasting Using Hidden Markov Model : A New Aproach. Papoulis, Athanasius, 1992. Probabilitas, Variabel Random, dan Proses Stokastik, Gadjah Mada university Press edisi ke-2, Yogyakarta. Ramaprasad Bhar and Shigeyuki Hamori, 2004. Hidden Markov Models (Applications to Financial Economics) Advanced Studies in
Sheldon M. Ross, 2010. INTRODUCTION TO PROBABILITY MODELS TENTH EDITION, University of Southern California, Los Angeles, California. Toto
Haryanto, 2011. Pengembangan Hidden Semi Markov Model Dengan Distribusi Durasi State Empiris Untuk Prediksi Struktur Sekunder Protein, Sekolah Pascasarjana Institut Pertanian Bogor, Bogor.
Yingjian Zhang, 2004. PREDICTION OF FINANCIAL TIME SERIES WITH HIDDEN MARKOV MODELS, ftp :// fas.sfu.ca/ pub/ cs/ TH/ 2004/ sfu.ca/ pub/ cs/ TH/ 2004/ YingjianRockyZhangMsc.pdf