PREDIKSI DATA TIME SERIES DENGAN MENGGUNAKAN ALGORITMA ANT SYSTEM (Studi Kasus Prediksi Harga Saham)
TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung
Oleh
LALA SEPTEM RIZA NIM: 23205301 Program Studi Teknik Elektro
INSTITUT TEKNOLOGI BANDUNG 2008
ABSTRAK PREDIKSI DATA TIME SERIES DENGAN MENGGUNAKAN ALGORITMA ANT SYSTEM (Studi Kasus Prediksi Harga Saham) oleh
Lala Septem Riza NIM: 23205301 PROGRAM STUDI TEKNIK ELEKTRO Prediksi data time series banyak dilakukan pada bidang finansial, biologi, astronomi, kedokteran, meteorologi dan lain – lain. Tujuan melakukan prediksi ini adalah untuk mendapatkan petunjuk lebih awal mengenai kondisi/kejadian masa depan sehingga dengan mengetahui lebih dini diharapkan dapat merespon kejadian tersebut dengan tepat. Dalam penelitian ini akan dikaji salah satu permasalahan prediksi data time series dalam bidang finansial yaitu memprediksi pergerakan harga saham. Dua pendekatan yang biasa dilakukan oleh para analisis saham dalam memprediksi harga saham adalah analisa technical yang berdasarkan data masa lampau dan analisa fundamental yang berdasarkan kondisi makroekonomi dan perusahaan. Dalam tesis ini dikembangkan model yang menggabungkan kedua pendekatan tersebut. Penelitian ini menggunakan metoda similar sequence matching (SSM) untuk mencari pola dari data masa lampau. Metoda similar sequence matching melakukan pencarian dan pencocokan pola pada data terdahulu berdasarkan sampel pola yang telah ditentukan, sedangkan parameter untuk mengukur kecocokan digunakan jarak Euclidean. Metoda max – min ant system digunakan untuk mengkombinasikan metoda SSM dengan faktor fundamental yang terlibat. Empat hal yang penting di dalam membangun metoda ant system yaitu melakukan konstruksi graph yang merepresentasikan masalah, mengembangkan model fungsi heuristic dan transition rule, mengembangkan model pheromone updating, dan metoda untuk kriteria pemberhentian. Fungsi heuristik yang diimplementasikan dalam metoda ant system merupakan representasi dari pengaruh data pergerakan harga saham masa lampau dan pengaruh kondisi saat ini yaitu faktor pengukuran kondisi perusahaan (price earning ratio, dividend yield, dan lain - lain), kondisi makroekonomi (tingkat inflasi, tingkat suku bunga, harga minyak, dan lain - lain) dan kondisi nonekonomi (berita kondisi dalam negeri, pergerakan indeks saham luar negeri, dan lain - lain). Keluaran penelitian ini adalah model dan perangkat lunak untuk memprediksi harga saham. Simulasi yang telah dilakukan memberikan hasil yang memuaskan
i
untuk memprediksi tren pergerakan harga saham dan memberikan galat/error yang dapat ditolerir untuk memprediksi nilai return/harga saham. Kata kunci: data time series; data mining; similar sequence matching; max-min ant system
ii
ABSTRACT PREDICTION OF TIME SERIES DATA USING ANT SYSTEM ALGORITHM (Case Study of Stock Price Prediction) by
Lala Septem Riza NIM: 23205301 Study Program of Electrical Engineering Prediction of time series data is often conducted in finance, biology, astronomy, medical, meteorology, etc. The aim of this prediction is to obtain early clue about the future condition so that precise response could be taken. This research would examine one of time series data prediction problem in finance, i.e. prediction of stock price fluctuation. Two approximations commonly conducted by asset analysis expert in predicting the stock price are technical analysis based on histories data and fundamental analysis based on macroeconomic and the company condition. This thesis develops a model clustering those two approximations. This research uses similar sequence matching (SSM) method to investigate the pattern of histories data. SSM method conducts pattern investigation and classification in previous data based on pattern sample that has been determined, whereas Euclidean distance is used as parameter to measure similarity. Furthermore, this research also uses max – min ant system method to combine SSM method with fundamental factors i.e. company condition, macroeconomic and non economic factor involved. There are four significant aspects in building ant system method, i.e. conducting graph construction representing the faced problem, developing heuristic function model and transition rule, developing pheromone updating model, and method used as discharge iteration criteria. Heuristic function implemented in ant system method is a representation of influence of stock price fluctuation data in past and influence of present condition i.e. measurement of company condition factor (price earning ratio, dividend yield, etc), macroeconomic condition (inflation level, interest level, oil price, etc), and non-economy condition (domestic condition, fluctuation of foreign stock index, etc). The outputs of this research are model and software to predict stock price. The simulation which has been carried out shows satisfying result to predict pattern of the stock price fluctuation and give tolerate error to predict return value/stock price.
iii
Keyword: time series data; data mining; similar sequence matching; max – min ant system
iv
PREDIKSI DATA TIME SERIES DENGAN MENGGUNAKAN ALGORITMA ANT SYSTEM (Studi Kasus Prediksi Harga Saham)
Oleh Lala Septem Riza NIM: 23205301
Program Studi Teknik Elektro Institut Teknologi Bandung
Menyetujui Pembimbing Tanggal……………………………….
Dr. Bambang Riyanto
v
PEDOMAN PENGGUNAAN TESIS
Tesis S2 yang tidak dipublikasikan, terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada pengarang. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seizin pengarang dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya.
Memperbanyak atau menerbitkan sebagian atau seluruh tesis haruslah seizin Direktur Program Pascasarjana, Institut Teknologi Bandung.
Perpustakaan yang meminjam tesis ini untuk keperluan anggotanya harus mengisi nama dan tanda tangan peminjam dan tanggal pinjam.
vi
Dipersembahkan kepada Alfitriana Mufida dan M. Alfarisal Azhar R.
vii
KATA PENGANTAR Alhamdulillah, puji syukur penulis panjatkan ke hadirat Allah SWT, yang atas rahmat, karunia dan petunjukNya penulis dapat menyelesaikan tesis ini. Shalawat dan salam tercurah kepada Rasulullah Muhammad SAW beserta keluarganya. Selama melaksanakan dan menyelesaikan kuliah dan tesis ini, penulis mendapat bantuan dan dukungan dari berbagai pihak. Untuk itu, penulis ingin mengucapkan terima kasih kepada : 1. Kedua orangtua, Sholeh Choiri dan Nisbah yang senantiasa memberikan perhatian, semangat dan do’anya. 2. Dr. Bambang Riyanto, selaku pembimbing tesis, yang telah mencurahkan perhatian, waktu dan kesabarannya serta mendukung penuh penulisan tesis ini. 3. Prof. Dr. Septoratno Siregar dan Prof. Dr. Edy Soewono, selaku pimpinan Research Consortiums OPPINET, yang telah memberikan kesempatan dan beasiswa kepada saya, untuk dapat kuliah di S-2 Teknologi Informasi ini. 4. Dr. Kuntjoro Adji Sidarto, yang selama 10 tahun ini telah membimbing dan memberikan ilmunya. 5. Yang tercinta dan tersayang, Istriku, Alfitriana Mufida dan anakku, M. AlFarisal Azhar Riza, yang senantiasa memberikan dorongan, inspirasi, semangat, kesabaran, dan pengertian serta do’anya. 6. Bapak dan ibu mertuaku, Surahono Latief dan Umi Saadah, yang dari awal mendorong untuk terus melanjutkan sekolah. 7. Teman-teman seangkatan Teknologi Informasi angkatan 2005-Genap, Anton Wiguna, Fetty Fitrianti L., Yudha Nurdin, Bram, dan Bambang Triyogo, yang sama-sama sebahagia dan ‘sependeritaan’ selama masa perkuliahan di Teknologi Informasi STEI-ITB. 8. Bapak-bapak peneliti dan teman – teman asisten peneliti di RC-OPPINET yang telah memberikan bantuan dan perhatiannya.
viii
9. dan semua pihak yang membantu, yang tidak dapat penulis sebutkan satu persatu.
Penulis menyadari bahwa tesis ini bukanlah tanpa kelemahan, untuk itu kritik dan saran sangat diharapkan.
Akhir kata, semoga tesis ini dapat bermanfaat bagi para pembacanya.
Bandung, Juni 2008
Penulis
ix
DAFTAR ISI
ABSTRAK ............................................................................................................... i ABSTRACT ........................................................................................................... iii PEDOMAN PENGGUNAAN TESIS ................................................................... vi KATA PENGANTAR ......................................................................................... viii DAFTAR ISI ........................................................................................................... x DAFTAR LAMPIRAN ........................................................................................ xiii DAFTAR GAMBAR DAN ILUSTRASI ............................................................ xiv DAFTAR TABEL ................................................................................................ xvi BAB I. PENDAHULUAN ...................................................................................... 1 I.1 Latar Belakang ............................................................................................... 1 I.2 Rumusan Masalah .......................................................................................... 2 I.3 Tujuan Penulisan............................................................................................ 3 I.4 Batasan Masalah ............................................................................................ 4 I.5 Metodologi Penelitian .................................................................................... 4 I.6 Sistematika Pembahasan ................................................................................ 4 BAB II. LANDASAN TEORI ................................................................................ 6 II.1 Data Time Series Finansial .......................................................................... 6 II.1.1 Faktor yang Mempengaruhi Pergerakan Harga Saham ......................... 8 II.1.2 Efficient Market Hypothesis ................................................................ 13 II.1.3 Jenis prediksi berdasarkan penggunaan datanya ................................. 14 II.2 Data Mining - Pattern Matching and Classification.................................. 14 II.3 Metoda Ant Colony ..................................................................................... 17
x
II.4 Pengukuran Akurasi Prediksi ..................................................................... 20 II.4.1 Mean Absolute Deviation (MAD) ........................................................ 20 II.4.2 Mean Square Error (MSE) dan Root Mean Square Error (RMSE) .. 21 II.4.3 Percent Error....................................................................................... 21 BAB III. SISTEM MODEL PREDIKSI HARGA SAHAM ................................ 22 III.1 Representasi Data ...................................................................................... 23 III.2 Pattern Classification (Proses 1) .............................................................. 24 a)
Sampel Pola ........................................................................................ 24
b)
Metoda Similar Sequence Matching (SSM) ....................................... 24
c)
Klasifikasi Data Berdasarkan Kelas ................................................... 25
III.3 Prediksi Berdasarkan Data Terdahulu....................................................... 26 III.4 Perhitungan Pengaruh Faktor Eksternal .................................................... 26 III.5 Metode Max – Min Ant System ................................................................. 29 III.5.1 Konstruksi Graph ............................................................................... 29 III.5.2 Model Transition Rule ....................................................................... 30 III.5.3 Model Pheromone Updating .............................................................. 32 III.6 Pengukuran Akurasi Prediksi .................................................................... 34 BAB IV. MODEL PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK ................................................................................................................. 36 IV.1 System Requirement .................................................................................. 36 IV.1.1 Overall Description ........................................................................... 36 IV.1.2 Data Masukan .................................................................................... 36 IV.1.3 Batasan ............................................................................................... 38 IV.2 Tahap Analisis .......................................................................................... 38 IV.2.1 Data Flow Diagram ................................................................................ 38 IV.2.2 Struktur Data .......................................................................................... 40
xi
IV.3 Tahap Desain ............................................................................................ 42 IV.3.1 PseudoCode Program ........................................................................... 42 IV.3.2 Implementation Diagram ....................................................................... 43 IV.3.3 Desain Interface .................................................................................... 44 BAB V. HASIL UJI COBA DAN ANALISA ...................................................... 50 V.1 Uji Kasus Skenario Pertama...................................................................... 51 V.1.1 Uji Kasus pada Tanggal 24 Maret 2008 .............................................. 51 V.2 Uji Kasus Skenario Kedua ......................................................................... 53 V.2.1 Uji Kasus Tanggal 8 April 2008 ......................................................... 53 V.2.2 Uji Kasus Tanggal 17 April 2008 ....................................................... 56 V.3 Analisa Hasil Simulasi ............................................................................... 58 BAB VI. KESIMPULAN DAN REKOMENDASI .............................................. 63 VI.1 Kesimpulan ............................................................................................... 63 VI.2 Rekomendasi ............................................................................................. 63 DAFTAR PUSTAKA ........................................................................................... 65
xii
DAFTAR LAMPIRAN LAMPIRAN A. Pseudo Code Program LAMPIRAN B. Data Historis IHSG o Lampiran B1. IHSG : 1 Juli 1997 sampai dengan 19 Maret 2008 o Lampiran B2. IHSG : 1 Juli 1997 sampai dengan 7 April 2008 o Lampiran B3. IHSG : 1 Juli 1997 sampai dengan 16 April 2008 LAMPIRAN C. Data Berita o LAMPIRAN C1. DATA BERITA Kasus 24 Maret 2008 o LAMPIRAN C2. DATA BERITA Kasus 8 April 2008 o LAMPIRAN C3. DATA BERITA Kasus 17 April 2008
xiii
DAFTAR GAMBAR DAN ILUSTRASI Gambar II.1 Pergerakan saham pada index Dow Jones dari tanggal 3 Desember 1962 sampai 31 Desember 1986……………………………………………..........7 Gambar II.2 Pergerakan saham yang memperlihatkan peristiwa “black Monday” (19 Oktober 1987) pada index Dow Jones………………………...………………8 Gambar II.3 Grafik Keseimbangan antara supply dan demand…………………...8 Gambar II.4 Grafik kondisi increase in demand…………………………………..9 Gambar II.5 Grafik kondisi increase in supply…………………………………..10 Gambar II.6 Langkah – langkah proses data mining…………………………….15 Gambar II.7 Contoh pembagian sequence S……………………………………..17 Gambar II.8 Dua Percobaan a) Pada permulaan percobaan. b) pada waktu selanjutnya………………………………………………………………………..18 Gambar II.9 Flow chart secara umum untuk Algorithma Ant System…………...20 Gambar III.1 Sistem Model Prediksi Harga Saham……………………………...23 Gambar III.2 Konstruksi Graph dari Metode Ant System……………………….30 Gambar IV.1 Contoh format penulisan data masukan dalam format excel……...37 Gambar IV.2 DFD level 0………………………………………………………..39 Gambar IV.3 DFD level 1………………………………………………………..39 Gambar IV.4 DFD Level 2……………………………………………………….40 Gambar IV.5 Diagram Komponen dari system software………………………...44 Gambar IV.6 GUI software: tampilan utama…………………………………….45 Gambar IV.7 GUI software: input data historis saham…………………………..46 Gambar IV.8 GUI software : input data scoring berita…………………………..47
xiv
Gambar IV.9 GUI software : input data koefiesien parameter berita……………48 Gambar IV.10 GUI software : input data parameter metode…………………….49 Gambar IV.11 GUI software : input data dan tombol running…………………..49 Gambar IV.12 GUI software : tampilan output…………………………………..49 Gambar V.1 Grafik Pergerakan Saham Kasus Tanggal 24 Maret 2008…………51 Gambar V.2 Grafik Pergerakan Saham Kasus Tanggal 8 April 2008…………...54 Gambar V.3 Grafik Pergerakan Saham Kasus 17 April 2008……………………56
xv
DAFTAR TABEL Tabel II.1 Pengaruh aktifitas non ekonomi terhadap pergerakan index S&P, 19411987………………………………………………………………………………11 Tabel V.1 Penilaian (scoring) Berita Kasus Tanggal 24 Maret 2008……………52 Tabel V.2 Parameter Kasus Tanggal 24 Maret 2008…………………………….52 Tabel V.3 Hasil Simulasi Kasus Tanggal 24 Maret 2008………………………..53 Tabel V.4 Scoring Kondisi Terkini pada Kasus 8 April 2008…………………...54 Tabel V.5 Parameter Kasus Tanggal 8 April 2008………………………………55 Tabel V.6 Hasil Simulasi Kasus 8 April 2008…………………………………...56 Tabel V.7 Parameter Kasus Tanggal 17 April 2008……………………………..57 Tabel V.8 Parameter Kasus 17 April 2008………………………………………58 Tabel V.9 Hasil Simulasi Kasus 17 April 2008………………………………….58 Tabel V.10 Rekapitulasi Hasil Simulasi…………………………………………60 Tabel V.11 Perbandingan Hasil Simulasi………………………………………..62
xvi