TESIS – KI2361
PENCARIAN METODE ELIMINASI PENCILAN TERBAIK UNTUK MEMPERBAIKI KINERJA FUZZY TIME SERIES PADA PERAMALAN HARGA SAHAM BURSA EFEK INDONESIA AKHMAD TAJUDDIN THOLABY MS 5113202007 DOSEN PEMBIMBING Prof. Ir. Arif Djunaidy, M.Sc, Ph.D
PROGRAM MAGISTER BIDANG KEAHLIAN SISTEM INFORMASI JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2017
Halaman ini sengaja dikosongkan
TESIS – KI2361
PENCARIAN METODE ELIMINASI PENCILAN TERBAIK UNTUK MEMPERBAIKI KINERJA FUZZY TIME SERIES PADA PERAMALAN HARGA SAHAM BURSA EFEK INDONESIA AKHMAD TAJUDDIN THOLABY MS 5113202007 DOSEN PEMBIMBING Prof. Ir. Arif Djunaidy, M.Sc, Ph.D
PROGRAM MAGISTER BIDANG KEAHLIAN SISTEM INFORMASI JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2017
Halaman ini sengaja dikosongkan
THESIS – KI2361
CHOOSING THE BEST OUTLIER ELIMINATION METHOD TO ENHANCE FUZZY TIME SERIES PERFORMANCE ON FORECASTING OF SHARE PRICE ON INDONESIA STOCK EXCHANGE AKHMAD TAJUDDIN THOLABY MS NRP. 5113202007
SUPERVISOR Prof. Ir. Arif Djunaidy, M.Sc, Ph.D
POSTGRADUATE PROGRAM CONCENTRATION OF INFORMATION SYSTEMS DEPARTMENT OF INFORMATICS FACULTY OF INFORMATION TECHNOLOGY SEPULUH NOPEMBER INSTITUTE OF TECHNOLOGY SURABAYA 2017
Halaman ini sengaja dikosongkan
LEMBAR PENGESAHAN Tesis disusun untuk memenuhi salah satu syarat memperoleh gelar Magister Komputer (M.Kom) di Institut Teknologi Sepuluh Nopember oleh: Akhmad Tajuddin Tholaby MS Nrp. 5113202007
Tanggal Ujian: 19 Januari 2017 Periode wisuda :Maret 2017
Disetujui oleh : l. Prof. Ir. Arif Djunaidy, M.Sc, Ph.D NIP: 195810051986031003
(Pembimbing)
2. Dr. Eng Febriliyan Samopa, S.Kom., M.Kom NIP: 197302191998021001
3. Dr. Apol Pribadi Subriadi, S.T., M.T NIP: 197002252009121001
Direktur Program Pasca Sarjana,
Prof. lr. Djauhar Manfaat,M. Sc.,Ph.D NIP.196012021987011001 111
Halaman ini sengaja dikosongkan
iv
PENCARIAN METODE ELIMINASI PENCILAN TERBAIK UNTUK MEMPERBAIKI KINERJA FUZZY TIME SERIES PADA PERAMALAN HARGA SAHAM BURSA EFEK INDONESIA Nama Mahasiswa NRP Pembimbing
: Akhmad Tajuddin Tholaby MS : 5113202007 : Prof. Ir. Arif Djunaidy M.Sc, Ph.D
ABSTRAK Metode peramalan Fuzzy Time Series (FTS) merupakan salah satu metode peramalan yang paling banyak digunakan terutama untuk mengolah data dengan tingkat variasi tinggi dan tidak linier terhadap waktu. Namun, peluang untuk mengembangkan dan memperbaiki kinerja peramalan dengan menggunakan metode FTS masih terbuka lebar. Kinerja suatu metode peramalan dapat dilihat dari distribusi kesalahannya. FTS tidak melihat dan tidak memilah jenis data masukan seperti apa yang akan di prosesnya menjadi suatu nilai peramalan, apakah data masukannya memiliki variasi kecil atau besar, atau memiliki data pencilan (outlier), semuanya diproses untuk menjadi nilai peramalan. Tentu saja jika data masukan memiliki pencilan, maka pencilan itu dapat merusak distribusi kesalahan sehingga dapat menjadikan kinerja peramalan menjadi tidak bagus. Salah satu upaya untuk meningkatkan kinerja peramalan FTS adalah dengan melakukan filterisasi data pencilan. Dalam penelitian ini dilakukan perbandingan hasil filterisasi pencilan dengan metode Cook’s distance, Leverage value, DFiTs dan Boxplot untuk meningkatkan kinerja peramalan FTS. Langkah berikutnya adalah melakukan observasi dan perhitungan untuk menentukan metode filterisasi pencilan yang paling baik untuk meningkatkan kinerja peramalan FTS, yaitu yang menghasilkan nilai kesalahan MSE dan MAPE paling kecil. Dari hasil penelitian dapat dilihat bahwa kinerja FTS yang menggunakan metode filterisasi DFiTs dan Cook’s Distance memberikan hasil peramalan yang lebih baik dibandingkan tanpa filterisasi pencilan. Pada uji coba 1 DFiTs menghasilkan distribusi kesalahan paling baik yaitu dengan nilai MSE 20,40701411 dan MAPE 2,4797393%. Sedangkan pada uji coba 2 Cook’s Distance menghasilkan distribusi kesalahan paling baik, yaitu dengan nilai MSE 23,92471475 dan MAPE 2,887437375%. Kata kunci: Fuzzy Time Series, pencilan, peramalan harga saham
v
CHOOSING THE BEST OUTLIER ELIMINATION METHOD TO ENHANCE FUZZY TIME SERIES PERFORMANCE ON FORECASTING OF SHARE PRICE ON INDONESIA STOCK EXCHANGE By Student Identity Number Supervisor
: Akhmad Tajuddin Tholaby MS : 5113202007 : Prof. Ir. Arif Djunaidy M.Sc, Ph.D
ABSTRACT Fuzzy time series (FTS) is one of forecasting methods that is usually used to compute high variation and time invariant data. The performance of FTS can be enhanced. The performance of FTS can be seen from the error distribution. FTS proceeds all kind of input data, low or high variance data, data with outlier and other. If there are outliers in data, then it will make the error distribution to become larger and the forecast performance becomes worse. One way that can enhance the performance of FTS is filtering the outliers before the forecast process. The methods that is used to identify outlier in this reserch are Cook's Distance, Leverage Value, DfFITS and Boxplot. After computing and finding outliers from the methods, then the next step is finding the lowest MSE and MAPE values that show the best outlier identifier method. The research results that DfFITS and Cook's Distance produce error distribution of forecast value better than without filtering of outliers. In the first observation, DfFITS produces the best error distribution with MSE 20,40701411 and MAPE 2,4797393%. While in the second observation, Cook’s Distance produces the best error distribution with MSE 23,92471475 and MAPE 2,887437375%. Keyword: Fuzzy Time Series, outlier, forecasting of share price
vi
KATA PENGANTAR Alhamdulillahirobbil’alamin ditujukan kepada Allah yang telah melimpahkan kasih sayang dan karunia-Nya sehingga penulis dapat menyelesaikan Tesis berjudul “Pencarian Metode Eliminasi Pencilan Terbaik Untuk Memperbaiki Kinerja Fuzzy Time Series pada Peramalan Harga Saham Bursa Efek Indonesia” Dengan ini, penulis hendak menyampaikan penghormatan dan terima kasih kepada pihak-pihak yang telah memberikan bantuan dan dukungan secara langsung maupun tidak langsung antara lain kepada: 1. Bapak, Ibu, Kakak dan Adik penulis serta seluruh keluarga besar yang selalu memberikan doa, semangat, dan motivasi selama pengerjaan tesis. 2. Bapak Prof. Ir. Arif Djunaidy M.Sc, Ph.D, selaku dosen pembimbing tesis, terima kasih yang tak terhingga atas ilmu, pencerahan, motivasi, arahan dan kesabaran yang telah diberikan selama bimbingan dari awal hingga tesis ini selesai. 3. Bapak Dr. Eng Febriliyan Samopa, S.Kom., M.Kom. dan Bapak Dr. Apol Pribadi Subriadi, S.T., M.T selaku dosen penguji yang telah bersedia menguji dan memberikan masukan bagi penulis. 4. Bapak dan Ibu dosen Jurusan Sistem Informasi-ITS yang telah dengan sabar memberi ilmunya selama kuliah. 5. Berbagai pihak yang belum sempat penulis sebutkan jasa-jasanya dalam mendukung penyusunan tesis ini. Apabila pada tesis ini terdapat kekurangan, dengan kerendahan hati, penulis mengharapkan saran dan kritik yang membangun dari pembaca.
Surabaya, Januari 2017
Akhmad Tajuddin Tholaby MS
vii
Halaman ini sengaja dikosongkan
viii
DAFTAR ISI v ABSTRAK ……………………………………………………………… ABSTRACT……………………………………………………………... KATA PENGANTAR…………………………………………………… DAFTAR ISI ……………………………………………………………. DAFTAR GAMBAR ……………………………………………………. DAFTAR TABEL……………………………………………………….. BAB 1 PENDAHULUAN………………………………………………. 1.1 Latar Belakang……………………………………………………… 1.2 Perumusan Masalah………………………………………………… 1.3 Tujuan Penelitian …………………………………………………... 1.4 Manfaat Penelitian …………………………………………………. 1.5 Batasan Penelitian………………………………………………….. 1.6 Sistematika Penulisan………………………………………………. BAB 2 DASAR TEORI DAN KAJIAN PUSTAKA ………………….. 2.1 Dasar Teori…………………………………………………………. 2.1.1 Index LQ45……………………………………………………….. 2.1.2 Fuzzy Time Series ……………………………………………….. 2.1.3 Ukuran Kesalahan Peramalan ……………………………………. 2.1.4 Pencilan (outlier) …………………………………………………. 2.2 Kajian Pustaka ……………………………………………………… BAB 3 METODOLOGI PENELITIAN ………………………………... 3.1 Studi Literatur ……………………………………………………… 3.2 Perumusan Masalah ………………………………………………... 3.3 Pengumpulan Data …………………………………………………. 3.4 Perumusan Hipotesis ……………………………………………..... 3.5 Perancangan Sistem ………………………………………………… 3.6 Pembuatan Program ………………………………………………… 3.7 Pengolahan Data ……………………………………………………. 3.8 Analisa Hasil Penelitian ……………………………………………. 3.9 Kesimpulan ………………………………………………………… BAB 4 HASIL DAN PEMBAHASAN…………………………………. 4.1 Pengambilan Data…………………………………………………… 4.2 Perhitungan Filterisasi Pencilan…………………………………….. 4.2.1 Filterisasi Boxplot…………………………………………………. 4.2.2 Filterisasi Leverage Value………………………………………… 4.2.3 Filterisasi DFiTs…………………………………………………… 4.2.4 Filterisasi Cook’s Distance………………………………………… 4.3 Perhitungan Peramalan FTS………………………………………… 4.4 Perhitungan dan Perbandingan MSE dan MAPE…………………… 4.4.1 Perbandingan kinerja FTS tanpa Filterisasi dan Dengan Filterisasi
vi vii ix xi xiv 1 1 4 4 4 5 5 7 7 7 9 11 11 15 19 19 20 20 21 21 22 22 22 23 25 25 26 26 28 33 38 41 47 55 ix
pencilan 2011-2013……………………………………………… 4.4.2 Perbandingan kinerja FTS tanpa Filterisasi dan Dengan Filterisasi pencilan 2011-2014……………………………………………… 4.4.3 Analisa Grafik Uji Coba 1………………………………………… 4.4.4 Analisa Grafik Uji Coba 2………………………………………… 4.5 Analisa Hasil Penelitian…………………………………………….. 4.6 Manfaat Penelitian Bagi Pemain Saham……………………………. BAB 5 KESIMPULAN…………………………………………………. DAFTAR PUSTAKA …………………………………………………...
x
55 56 59 61 63 65 67
DAFTAR GAMBAR Gambar 1.1 Skema identifikasi pencilan menggunakan IQR atau boxplot Gambar 3.1 alur penelitian………………………………………………. Gambar 4.1 gambar tampilan lembar kerja SPSS……………………….. Gambar 4.2 gambar SPSS yang diisi 2 variabel…………………………. Gambar 4.3 gambar SPSS merubar variable view………………………. Gambar 4.4 kotak dialog “Linear Regression”………………………….. Gambar 4.5 gambar output SPSS tabel “Residuals Statistics”………….. Gambar 4.6 halaman untuk menentukan panjang interval………………. Gambar 4.7 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, tanpa filterisasi pencilan……………………………………. Gambar 4.8 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Boxplot………………………………….. Gambar 4.9 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Leverage Value………………………….. Gambar 4.10 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi DFiTs………………………………….. Gambar 4.11 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Cook’s Distance………………………. Gambar 4.12 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, tanpa filterisasi pencilan…………………………………. Gambar 4.13 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Boxplot……………………………….. Gambar 4.14 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Leverage Value……………………….. Gambar 4.15 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi DFiTs…………………………………. Gambar 4.16 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Cook’s Distance……………………… Gambar 4.17 Kinerja FTS untuk periode data 2011-2013 Tanpa filterisasi pencilan…………………………………………………. Gambar 4.18 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi Boxplot (b)……………………………………………………….. Gambar 4.19 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi Leverage Value (b)………………………………………………… Gambar 4.20 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi DFiTs (b) Gambar 4.21 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi (a) dan dengan filterisasi Cook’s Distance (b)……………………………………………………….. Gambar 4.22 Kinerja FTS untuk periode data 2011-2014 Tanpa filterisasi pencilan………………………………………………….
2 19 34 35 35 36 36 41 44 44 44 45 45 45 46 46 46 47 57 57 58 58 59 59
xi
Gambar 4.23 Perbandingan kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi Leverage Value (b)…………………………………………………. Gambar 4.24 Perbandingan Kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi DFiTs (b) Gambar 4.25 Perbandingan kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi Cook’s Distance (b)……………………………………………….
xii
60 60 61
DAFTAR TABEL Tabel 3.1 Tahap perhitungan peramalan dengan metode FTS…………….. Tabel 3.2 Tahap perhitungan peramalan dengan metode FTS yang disertai metode eliminasi pencilan………………………………………. Tabel 4.1 Data saham BEI…………………………………………………. Tabel 4.2 Perhitungan filterisasi Boxplot pada uji coba 1…………………. Tabel 4.3 Perhitungan filterisasi Boxplot pada uji coba 2…………………. Tabel 4.4 Perhitungan filterisasi Leverage Value pada uji coba 1………… Tabel 4.5 Perhitungan filterisasi Leverage Value pada uji coba………….. Tabel 4.6 Contoh Tabel Interval…………………………………………… Tabel 4.7 data linguistic pada BEI………………………………………… Tabel 4.8 hasil perhitungan data BEI dengan metode FTS………………. Tabel 4.9 Perbandingan hasil nilai error dari kinerja FTS dengan dan tanpa filterisasi pencilan periode tahun 2011-2013………………….. Tabel 4.10 Perbandingan hasil nilai error dari kinerja FTS dengan dan tanpa filterisasi pencilan periode tahun 2011-2014………………....... Tabel 4.11 tabel posisi pergerakan harga saham pada uji coba 1………….. Tabel 4.12 tabel posisi pergerakan harga saham pada uji coba 2…………..
21 21 25 26 27 30 33 42 42 43 55 55 62 62
xiii
xiv
BAB 1 PENDAHULUAN 1.1
Latar Belakang Setiap perusahaan yang menghasilkan produk baik dalam bentuk barang
maupun jasa pasti menginginkan perusahaannya dapat berjalan dengan baik dan terus mengalami kemajuan. Untuk mencapai kondisi tersebut, maka semua perusahaan tanpa terkecuali secara berkelanjutan harus melakukan tiga siklus utama manajemen, yaitu perencanaan, pelaksanaan dan evaluasi yang nantinya hasil evaluasi yang dihasilkan akan menjadi input dasar perencanaan tahap berikutnya. Salah satu wujud evaluasi tersebut adalah melakukan perhitungan peramalan permintaan akan produk yang dihasilkan oleh perusahaan. Ada banyak sekali metode peramalan yang dapat diaplikasikan. Salah satunya adalah metode peramalan Fuzzy Time Series (FTS). Metode peramalan FTS merupakan salah satu metode peramalan yang paling banyak digunakan terutama untuk mengolah data dengan tingkat variasi tinggi dan tidak linier terhadap waktu. Namun, peluang untuk mengembangkan dan memperbaiki kinerja peramalan dengan menggunakan metode FTS masih terbuka lebar. Kinerja suatu metode peramalan dapat dilihat dari distribusi error-nya. FTS tidak melihat dan tidak memilah jenis data input seperti apa yang akan di prosesnya menjadi suatu nilai peramalan, apakah data inputnya memiliki variasi kecil atau besar, atau memiliki data pencilan, semuanya di proses untuk menjadi nilai peramalan. Tentu saja jika data input memiliki pencilan, maka pencilan itu bisa merusak distribusi error sehingga menjadikan kinerja peramalannya menjadi tidak bagus. Salah satu upaya untuk meningkatkan kinerja peramalan FTS adalah dengan melakukan Filterisasi data-data pencilan. Pencilan adalah data yang tidak menggambarkan karakteristik data secara keseluruhan, atau dengan kata lain pencilan adalah data yang nilainya jauh melenceng dari karakteristik data secara keseluruhan.
1
Salah satu penelitian yang melakukan hal tersebut adalah S. Sureh dan K. Senthamarai Kannan [1] yang melakukan filterisasi dan mengidentifikasi pencilan dengan menggunakan metode Cook’s distance. Namun ternyata pencilan yang dihasilkan melenceng dari definisi pencilan itu sendiri. Sehingga sangat perlu dilakukan observasi dan penghitungan lebih dalam untuk memperbaiki kondisi tersebut. Di dalam ilmu statistik, disebutkan bahwa ada beberapa metode identifikasi pencilan, salah satunya adalah metode Boxplot [2]. Metode ini dapat mengidentifikasi adanya pencilan yang dapat merusak distribusi error pada kinerja peramalan FTS. Metode ini menggunakan nilai kuartil dan jangkauan. Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi empat bagian. Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil 1 terhadap kuartil 3, atau IQR = Q3 – Q1. Data-data pencilan dapat ditentukan yaitu nilai yang kurang dari 1.5*IQR terhadap kuartil 1 dan nilai yang lebih dari 1.5*IQR terhadap kuartil 3. Salah satu penelitian yang menggunakan metode ini adalah R. Dawson [2] dan Soemartini [3] yang sama-sama melakukan filterisasi data pencilan pada data untuk mengetahui dampak keberadaan dan ketiadaan pencilan dalam analisis data (analisis regresi).
Gambar 1.1 Skema identifikasi pencilan menggunakan IQR atau boxplot
2
Selain metode boxplot, dalam ilmu statistik ada juga metode identifikasi pencilan lainnya yaitu metode Cook's distance, Leverage value dan DFiTs. Adapun penjelasan dari masing-masing metode adalah sebagai berikut:
Metode DFiTs atau Standardized DfFIT menampilkan nilai perubahan dalam harga yang diprediksi bilamana case tertentu dikeluarkan, yang sudah distandarkan, dimana data dari hasil perhitungan DFiTs yang lebih besar dari 2*sqrt(p/n) akan dihitung sebagai pencilan. Salah satu penelitian yang menggunakan metode ini adalah Mintu Kr.Das dan Bipin Gogoi [4] yang melakukan filterisasi pengukuran influential observations (pengamatan berpengaruh/pencilan) pada data yang diperkenalkan oleh Atkinson [5], untuk menfilterisasi pencilan hasil dari observasi ke-i dari suatu peramalan.
Metode cook’s distance menampilkan nilai jarak cook. Nilai jarak cook yang lebih besar dari tabel distribusi F(0.5; p, n-p) maka data tersebut adalah data pencilan. Salah satu penelitian yang menggunakan metode ini adalah Mintu Kr.Das dan Bipin Gogoi [4] yang melakukan filterisasi pengukuran informasi studentized residuals, nilai varian untuk mendeteksi adanya pencilan pada data berdasarkan besar kecilnya jarak cook.
Metode Leverage Values menampilkan nilai leverage (pengaruh) terpusat, dimana data hasil perhitungan dari Leverage Values yang lebih besar dari (2p-1)/n akan dihitung sebagai pencilan. Salah satu penelitian yang menggunakan metode ini adalah Rousseeuw [6] yang melakukan Diagnostic Plot pada pencilan regresi dan Leverage Point. Untuk mengidentifikasi adanya pencilan berdasarkan ukuran leverage pada data.
Ket: n = Jumlah observasi (sampel); p = jumlah parameter Data yang akan disaring menggunakan tiap metode-metode eliminasi pencilan di atas nantinya akan dihitung pada peramalan FTS setelah itu akan dihitung distribusi error-nya.
3
Dari beberapa pembahasan diatas dapat ditarik permasalahan bagaimana cara memcari metode eliminasi pencilan terbaik untuk memperbaiki kinerja peramalan FTS. Dalam penelitian ini akan dilakukan perbaikan kinerja FTS melalui optimasi metode identifikasi pencilan pada peramalan permintaan. Optimasi metode identifikasi pencilan yang dimaksud adalah melakukan perhitungan identifikasi pencilan dengan metode Boxplot, Cook's distance, Leverage value dan DFiTs, yang kemudian akan diobservasi apakah nilai pencilan yang dihasilkan sama atau tidak. Jika tidak sama, maka akan diobservasi yang mana diantara lima metode tersebut yang menghasilkan nilai peramalan yang terbaik. 1.2
Perumusan Masalah Dari beberapa pembahasan diatas,
maka perumusan masalah dalam
penilitian ini adalah
Bagaimana menemukan pencilan pada data Harga Saham BEI dengan metode Boxplot, Cook's Distance, Leverage Value dan DFiTs.
Bagaimana mengeliminasi pencilan yang dihasilkan dari masingmasing metode tersebut untuk dilakukan proses peramalan menggunakan metode FTS.
Bagaimana menghitung dan menganalisa nilai kesalahan MSE dan MAPE yang dihasilkan dari peramalan FTS dari masing-masing data yang sudah dilakukan filterisasi pencilan untuk mencari metode eliminasi pencilan terbaik.
1.3
Tujuan Penelitian Tujuan dari penelitian ini adalah mencari metode eliminasi pencilan
terbaik untuk memperbaiki kinerja peramalan FTS berdasarkan nilai MSE dan MAPE yang paling kecil.
4
1.4
Manfaat Penelitian Manfaat dari penelitian ini adalah:
Kinerja peramalan FTS yang dilakukan filterisasi metode filterisasi pencilan (Boxplot, Cook's distance, Leverage value dan DFiTs) menjadi lebih baik.
1.5
Batasan Penelitian Pada penelitian ini dikarenakan keterbatasan waktu, tenaga dan biaya,
maka peneliti memberikan batasan penelitian sebagai berikut:
Penelitian ini hanya akan diujikan pada satu studi kasus saja, yaitu meramalkan Harga saham Bursa Efek Indonesia
Data harga saham yang digunakan adalah Indeks Harga Saham LQ45 dengan rentang waktu untuk data yang digunakan adalah selama empat tahun terakhir, terhitung mulai 1 januari 2011 – 31 desember 2014.
Data yang digunakan untuk penelitian tesis ini diambil dari data harga saham BEI LQ45 di http://www.duniainvestasi.com/bei/prices/stock/LQ45
Penelitian ini hanya bertujuan untuk meningkatkan kinerja peramalan FTS dan tidak memperbaiki kekurangan dari perhitungan peramalan FTS
Kinerja peramalan FTS hanya akan diperbaiki dengan metode identifikasi pencilan
Metode identifikasi pencilan yang akan dilakukan untuk memperbaiki kinerja peramalan pada penelitian ini hanya sebatas empat metode, yaitu Boxplot, Cook's distance, Leverage Value dan DFiTs.
1.6
Sistematika Penulisan
Bab I Pendahuluan. Bab ini berisi pendahuluan yang menjelaskan latar belakang permasalahan, perumusan masalah, tujuan penelitian, manfaat penelitian, kontribusi penelitian, batasan penelitian serta sistematika penulisan.
Bab II Dasar Teori dan Kaijan Pustaka. Bab ini berisi tinjauan pustaka yang meliputi dasar teori dan kajian pustaka.
5
Bab III Metodologi Penelitian. Bab ini berisi berisi tahapan, metode dan penelitian yang akan digunakan serta jadwal kegiatan penelitian.
Bab IV Hasil dan Pembahasan. Bab ini berisi tentang konsep penelitian yang akan dilakukan meliputi konseptual model, hipotesis penelitian, definisi operasional, kuesioner, klasifikasi objek penelitian.
Bab V Penutup. Bab ini berisi tentang kesimpulan dari hasil dan pembahasan yang dilakukan pada Bab 4.
6
BAB 2 DASAR TEORI DAN KAJIAN PUSTAKA Pada bab ini akan dibahas mengenai dasar teori serta kajian pustaka dari penelitian-penelitian sebelumnya yang berkaitan dengan pencarian metode eliminasi pencilan terbaik untuk memperbaiki kinerja Fuzzy Time Series (FTS) pada peramalan harga saham BEI. 2.1
Dasar Teori Dasat teori yang peneliti gunakan dalam penelitian ini bertujuan sebagai
acuan penelitian guna membantu menjawab rumusan permasalahan penelitian yang berkaitang dengan pencarian metode identifikasi pencilan terbaik untuk memperbaiki kinerja FTS pada peramalan harga saham BEI. Adapun saham BEI yang digunakan pada penelitian tesis ini adalah Index LQ45, karena index LQ45 merupakan nilai kapitalisasi pasar dari 45 saham yang paling likuid dan memiliki nilai kapitalisasi yang besar. 2.1.1 Indeks LQ 45 Indeks LQ45, menggunakan 45 saham yang terpilih berdasarkan Likuiditas perdagangan saham dan disesuaikan setiap enam bulan (setiap awal bulan Februari dan Agustus). Dengan demikian saham yang terdapat dalam indeks tersebut akan selalu berubah. Beberapa kriteria seleksi untuk menentukan suatu emiten dapat masuk dalam perhitungan indeks LQ45 adalah: a. Kriteria yang pertama adalah:
Berada di TOP 95% dari total rata-rata tahunan nilai transaksi saham di pasar reguler.
Berada di TOP 90% dari rata-rata tahunan kapitalisasi pasar.
b. Kriteria yang kedua adalah:
Merupakan urutan tertinggi yang mewakili sektornya dalam klasifikasi industri BEJ sesuai dengan nilai kapitalisasi pasarnya.
Merupakan urutan tertinggi berdasarkan frekuensi transaksi.
7
Indeks LQ45 hanya terdiri dari 45 saham yang telah terpilih melalui berbagai kriteria pemilihan, sehingga akan terdiri dari saham-saham dengan likuiditas dan kapitalisasi pasar yang tinggi. Saham-saham pada indeks LQ45 harus memenuhi kriteria dan melewati seleksi utama sebagai berikut:
Masuk dalam ranking 60 besar dari total transaksi saham di pasar reguler (rata-rata nilai transaksi selama 12 bulan terakhir).
Ranking berdasar kapitalisasi pasar (rata-rata kapitalisasi pasar selama 12 bulan terakhir)
Telah tercatat di BEJ minimum 3 bulan
Keadaan keuangan perusahaan dan prospek pertumbuhannya, frekuensi dan jumlah hari perdagangan transaksi pasar reguler. Saham-saham yang termasuk didalam LQ45 terus dipantau dan setiap
enam bulan akan diadakan review (awal Februari, dan Agustus). Apabila ada saham yang sudah tidak masuk kriteria maka akan diganti dengan saham lain yang memenuhi syarat. Pemilihan saham-saham LQ45 harus wajar, oleh karena itu BEJ mempunyai komite penasehat yang terdiri dari para ahli di BAPEPAM, Universitas, dan Profesional di bidang pasar modal. Faktor yang berperan dalam pergerakan Indeks LQ45, yaitu:
Tingkat suku bunga SBI sebagai patokan (benchmark) portofolio investasi di pasar keuangan Indonesia,
Tingkat toleransi investor terhadap risiko, dan
Saham-saham penggerak indeks (index mover stocks) yang notabene merupakan saham berkapitalisasi pasar besar di BEJ. Faktor-faktor yang berpengaruh terhadap naiknya Indeks LQ45 adalah:
Penguatan bursa global dan regional menyusul penurunan harga minyak mentah dunia, dan
Penguatan nilai tukar rupiah yang mampu mengangkat indeks LQ 45 ke zone positif. Tujuan indeks LQ 45 adalah sebagai pelengkap IHSG dan khususnya
untuk menyediakan sarana yang obyektif dan terpercaya bagi analisis keuangan,
8
manajer investasi, investor dan pemerhati pasar modal lainnya dalam memonitor pergerakan harga dari saham-saham yang aktif diperdagangkan. 2.1.2 Fuzzy Time Series (FTS) Fuzzy Time Series adalah sebuah konsep baru yang diusulkan oleh Song dan Chissom [7] berdasarkan teori Fuzzy Set dan konsep variabel linguistik dan aplikasinya oleh Zadeh. FTS digunakan untuk menyelesaikan masalah peramalan yang mana data historis adalah nilai-nilai linguistik. Misalnya, dalam masalah peramalan, data historis tidak dalam bentuk angka real, namun berupa data linguistik. Dalam hal ini, tidak ada model time series konvensionalyang dapat diterapkan, akan tetapi model FTS dapat diterapkan dengan lebih tepat. Berdasarkan teori himpunan Fuzzy, logika Fuzzy dan penalaran perkiraan, Song dan Chissom [7] mengajukan definisi FTS dan garis besar pemodelan dengan cara persamaan relasional Fuzzy dan penalaran perkiraan. Kemudian oleh Chen [8] diperkenalkan sebuah metode peramalan FTS menggunakan operasi Arithmetic. Song dan Chissom [9], menyajikan model Heuristic untuk peramalan Time Series menggunakan Heuristic Increasing and Decreasing Relations untuk memperbaiki peramalan Enroll-ments dan Exchange di Taiwan. Kemudian oleh Chen and Chung [10], diajukan algoritma komputasi sederhana, sehingga dapat mengurangi waktu untuk menghasilkan persamaan relasi dengan menggunakan operasi komposisi max-min yang kompleks dan mengurangi waktu untuk proses defuzzifikasi pada metode Song dan Chissom [7]. Metode Chen and Chung [10] dapat menyelesaikan masalah dalam mencari prosedur defuzzifikasi yang cocok untuk menghasilkan nilai output crisp dengan akurasi yang lebih baik. Konsep Dasar Fuzzy Time Series (FTS) Bagian ini menjelaskan secara singkat konsep Fuzzy dasar dan FTS. Perbedaan utama antara FTS dan Traditional Time Series adalah bahwa nilai dari FTS direpresentasikan dengan set Fuzzy. Misalkan U merupakan kelompok universal dengan U = {u1 ,u2 ,....,un}. maka set Fuzzy dinyatakan dalam U mengikuti representasi berikut ini:
9
A = fA(u)/ u1 + fA(u2)/u2 + ...... + fA(un)/un
(2.1)
Dengan fA menyatakan fungsi keanggotaan dari set Fuzzy A fA :U →[0,1] dan fA(ui) menyatakan derajatkeanggotaan ui yang termasuk set Fuzzy A dan fA(ui) [0,1] f A ui and 1
i
Definisi 1. Asumsikan Y(t)
n.
R (real line), t = ..., 0, 1, 2, ..., n menjadi bentuk
universal yang dinyatakan dengan set Fuzzy fi (t) . F(t) yang mengandung fi (t) , i = 1, 2, ..., n didefinisikan sebagai FTS pada Y( t ). Dalam hal ini, F(t) dapat dipahami sebagai linguistic variable, dengan fi (t) i = 1, 2, ..., n adalah nilai-nilai linguistic yang memungkinkan dari F(t) [11] [12]. Definisi 2. Jika F(t) dipengaruhi oleh F (t - 1) dan dinyatakan dengan F(t - 1) → F(t) maka hubungan ini dapat direpresentasikan dengan F(t) = F(t - 1) 。R(t, t - 1) dengan simbol “。” menyatakan simbol operator; R(t, t – 1) adalah hubungan Fuzzy antara F(t) dan F(t-1) dan disebut sebagai first-order model dari F(t), [8]. Definisi 3. Dengan menyatakan F(t-1) dengan Ai dan F(t) dengan Aj maka hubungan antara F(t-1) dan F(t) dapat dinyatakan dengan logical relationship Ai → Aj [11]. Definisi 4. Misalkan R(t; t-1) sebagai first-order model dari F(t). Jika untuk nilai t sembarang, R(t; t-1) = R(t - 1; t - 2), maka F(t) disebut time-invariant FTS [12]. Definisi 5. Hubungan logis Fuzzy, yang memiliki sisi ruas kiri yang sama dapat dikelompokkan bersama kedalam kelompok relasi logis Fuzzy [11]: 2.1.3
Ukuran Kesalaham Peramalan Karena permintaan dipengarui oleh banyak faktor, dan nilai di masa
mendatang tidak dapat diketahui secara pasti sehingga tidak masuk akal jika ingin mendapatkan peramalan yang tepat setiap waktu. Perhitungan rata-rata kesalahan yang dibuat oleh model peramalan setiap waktu merupakan ukuran seberapa tepat
10
peramalan. Dua pengukuran kesalahan yang sering dipakai adalah Mean Absolute Percentage Error (MAPE) dan Mean Squared Error (MSE). Hal yang pertama digunakan karena sangat berguna untuk menentukan tracking signal. MAD merupakan nilai rata-rata error dalam peramalan menggunakan nilai absolute, Metode Peramalan, melalui tahapan berikut [11]: Jika Xt merupakan data aktual untuk periode t dan Ft merupakan ramalan (fitted value) untuk periode yang sama, maka kesalahan (et) didefinisikan sebagai berikut:
et = D(t) - F(t)
(2.2)
Pertimbangan diterimanya sebuah metode peramalan adalah melalui kriteria berikut ini: a.
Persentase kesalahan (PE) PE = ((D(t) - F(t)) / D(t)) x 100%
b.
(2.3)
Mean Squared Error (MSE)
(2.4) c.
Mean Absolute Percentage Error (MAPE)
(2.5) Dimana:
D(t)
= Harga aktual pada periode t
F(t)
= Harga peramalan pada periode t
m
= Jumlah periode peramalan
2.1.4 Pencilan (Outlier) Pencilan adalah suatu data yang menyimpang dari sekumpulan data yang lain. Pencilan adalah pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data. Jika terdapat masalah yang berkaitan dengan pencilan, maka diperlukan alat diagnosis yang dapat mengidentifikasi masalah
11
pencilan, salah satunya dengan menyisihkan pencilan dari kelompok data kemudian menganalisis data tanpa pencilan. a. Dampak pencilan (outlier) Keberadaan data pencilan akan mengganggu dalam proses analisis data dan harus dihindari dalam banyak hal. Dalam kaitannya dengan analisis regresi, Pencilan dapat menyebabkan hal-hal berikut [13]: Residual yang besar dari model yang terbentuk atau E[e] ≠ 0 Varians pada data tersebut menjadi lebih besar Taksiran interval memiliki rentang yang lebar b. Identifikasi pencilan (outlier) Dalam statistik ruang, data pencilan harus dilihat terhadap posisi dan sebaran data yang lainnya sehingga akan dievaluasi apakah data pencilan tersebut perlu dihilangkan atau tidak. Terdapat beberapa metode untuk menentukan batasan pencilan dalam sebuah analisis, yaitu: metode Boxplot, Leverage Value, DFiTs dan Cook’s Distance. 1) Metode Boxplot Metode ini merupakan yang paling umum yakni dengan mempergunakan nilai kuartil dan jangkauan. Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi empat bagian. Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil 1 terhadap kuartil 3, atau IQR = Q3 – Q1. Data-data pencilan dapat ditentukan yaitu nilai yang kurang dari 1.5*IQR terhadap kuartil 1 dan nilai yang lebih dari 1.5*IQR terhadap kuartil 3 [2]. 2) Metode Leverage Values, DfFITS dan Cook’s Distance Leverage Values, menampilkan nilai leverage (pengaruh) terpusat [6]. DFiTs atau Standardized DfFIT yang menampilkan nilai perubahan dalam harga yang diprediksi bilamana case tertentu dikeluarkan, yang sudah distandarkan [4]. 12
Cook’s Distance, menampilkan nilai jarak Cook [4]. Leverage point memberikan informasi tentang apakah sebuah pengamatan dari data varibel independen (predictor) dikelompokkan sebagai data yang luar biasa (ekstrim/outlier) jika dibandingkan dengan data lainnya. Leverage adalah sebuah ukuran jarak antara sebuah data dalam variabel independen dengan nilai rata-rata untuk semua pengamatannya. Sebuah data disebut sebagai high leverage point (HLP) jika menunjukkan nilai pengamatan yang sangat jauh dari rata-rata untuk semua pengamatan. Suatu data yang mengandung HLP dapat memberikan pengaruh yang besar terhadap garis regresi atau model regresi. Nilai Leverage point terletak antara 0 dan 1. Selain itu untuk melihat apakah sebuah atau beberapa data disebut sebagai pencilan, dapat diketahui dengan nilai Rstudenti. Nilai ini berdistribusi t dengan derajat bebas (db) = n-p-1. Aapabila nilai studentized residual ini lebih besar daripada nilai t(n-p-1,α/2), maka data tersebut dapat dikatakan sebagai data pencilan. Cook’s distance dan DFiTs digunakan sebagai ukuran untuk menentukan apakah sebuah atau beberapa pengamatan dikatakan sebagai influential point (sebuah pengamatan yang berpengaruh pada model).Nilai Cook’s distance kemudian dibandingkan dengan nilai distribusi F (0.5;p,n-p). jika:
Cook’s distance >F (0.5;p,n-p) maka data itu dikatakan sebagai influential point [13].
Seperti halnya dengan Cook’s distance, sebuah pengamatan dikatakan sebagai influential point jika DFITs > 2
[13].
3) Rumus Filterisasi Leverage Value, DFiTs dan Cook’s Distance Adapun rumus yang digunakan untuk menghitung nilai Leverage Value, DFiTs dan Cook’s Distance adalah sebagai berikut:
13
Nilai Leverage Value (H)
Hi =
Rstudenti =
Rstandardi =
Cook’s distancei =
DFiTsi = Rstudenti
(2.6) , dimana Si = ,
(2.7) (2.8)
x
(2.9)
(2.10)
Adapun langkah-langkah untuk menentukan nilai p adalah sebagai berikut:
Hal pertama yang dilakukan adalah melakukan pengurutan data yang paling kecil sampai data yang paling besar. Setelah itu ditentukan nilai Q1 dan Q3. Dari nilai Q1 dan Q3 maka didapatkan nilai IQR. Dimana nilai IQR adalah Q3-Q1.
Setelah itu dilakukan perhitungan nilai standart deviasi dari semua data yang akan digunakan (Sx). Untuk mengetahui nilai Sx pada Exel, dapat dilakukan dengan rumus “=stdev(dataawal:dataakhir)”.
Setelah itu dilakukan seleksi dari nilai Sx dan nilai IQR.
p akan bernilai 1,5 jika nilai Sx < 1/3 x IQR
(2.11)
p akan bernilai 2 jika nilai Sx < 2/3 * IQR dan Sx > 1/3 * IQR
(2.12)
p akan bernilai 2,5 jika nilai Sx < IQR dan Sx > 2/3 * IQR
(2.13)
p akan bernilai 3 jika nilai Sx < 4/3 * IQR
(2.14)
Dimana:
14
Xi
= Nilai data ke-i
X
= Nilai rata-rata data
n
= Jumlah data
ei
= Nilai error data ke-i
Se
= Nilai standart deviasi error data
Adapun ketentuan yang berlaku dalam pengambilan keputusan adanya pencilan atau tidak adalah sebagai berikut:
Jika nilai hasil perhitungan Leverage Value > (2p -1)/n, maka data tersebut adalah pencilan.
Jika nilai hasil perhitungan DFiTs > 2 * sqrt(p/n), maka data tersebut adalah pencilan.
(2.16)
Jika nilai hasil perhitungan Cook’s Distance > F(0.5;p,n-p) pada tabel F, maka data tersebut adalah pencilan.
2.2
(2.15)
(2.17)
Kajian Pustaka Penelitian yang dilakukan oleh P. Arumugam, V. Anithakumari adalah
melakukan metode Fuzzy Time Series untuk Peramalan Ekspor Data Taiwan yang sangat besar [14]. Namun, penelitian tersebut masih belum ditindak lanjuti dengan metode identifikasi pencilan. Penelitian yang dilakukan oleh Haneen Talal Jasim, Abdul Ghafoor Jasim Salim dan Kais Ismail Ibraheem adalah memperbaiki kekurangan dari peramalan permintaan metode FTS dengan menambahkan algoritma novel [15]. Namun, penelitian tersebut masih belum ditindak lanjuti dengan metode identifikasi pencilan. Penelitian yang dilakukan oleh Ufuk Yolcu adalah meramalkan pasar Saham di Istanbul dengan “High Order Multivariate Fuzzy Time Series Forecasting Model” [16]. Namun, penelitian tersebut masih belum ditindak lanjuti dengan metode identifikasi pencilan.
15
Penelitian yang dilakukan oleh Usman Amjad, Tahseen A. Jilani dan Farah Yasmeen adalah memperbaiki kekurangan dari peramalan Fuzzy Time Series dengan menambahkan dua fase algoritma yaitu “algoritma genetika” dan “Particle Swarm Optimization Techniques” [17]. Namun, penelitian tersebut masih belum ditindak lanjuti dengan metode identifikasi pencilan. Penelitian yang dilakukan oleh Ming-Tao Chou adalah menjelaskan tentang prediksi nilai interval jangka panjang pada peramalan FTS [18]. Namun, penelitian tersebut masih belum ditindak lanjuti dengan metode identifikasi pencilan. Penelitian yang dilakukan oleh S. Sureh dan K. Senthamarai Kannan adalah melakukan filterisasi dan mengidentifikasi pencilan dengan menggunakan metode Cook’s distance [1]. Namun ternyata pencilan yang dihasilkan melenceng dari definisi pencilan itu sendiri. Sehingga sangat perlu dilakukan observasi dan penghitungan lebih dalam untuk memperbaiki kondisi tersebut. Di dalam ilmu statistik, disebutkan bahwa ada beberapa metode identifikasi pencilan, salah satunya adalah metode Boxplot [2]. Metode ini dapat mengidentifikasi adanya pencilan yang dapat merusak distribusi error pada kinerja peramalan FTS. Metode ini menggunakan nilai kuartil dan jangkauan. Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi empat bagian. Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil 1 terhadap kuartil 3, atau IQR = Q3 – Q1. Data-data pencilan dapat ditentukan yaitu nilai yang kurang dari 1.5*IQR terhadap kuartil 1 dan nilai yang lebih dari 1.5*IQR terhadap kuartil 3. Salah satu penelitian yang menggunakan metode ini adalah R. Dawson [2] dan Soemartini [3] yang sama-sama melakukan filterisasi data pencilan pada data untuk mengetahui dampak keberadaan dan ketiadaan pencilan dalam analisis data (analisis regresi). R. Dawson menggunakan simulasi spreadsheet untuk menemukan pencilan pada suatu populasi dengan menggunakan metode boxplot. Dari 10.000 anggota populasi, diambil sampel dengan jumlah sampel bervariasi, lalu kemudian dari sejumlah sampel tersebut dicari pencilan yang terkandung dalam populasi tersebut. Paper tersebut melakukan penguujian dengan jumlah
16
sampel 5, 9, 13, 17 dan 21. Populasi yang diobservasi terdistribusi normal dan terdistribusi uniform. Hasil simulasi menunjukkan bahwa semakin besar jumlah sampel yang diambil dari suatu populasi, maka jumlah pencilan yang ditemukan semakin sedikit. Selain itu, jumlah pencilan pada data yang didistribusikan secara uniform lebih sedikit dibandingkan pada data yang didistribusikan secara normal. Selain metode boxplot, dalam ilmu statistik ada juga metode identifikasi pencilan lainnya yaitu metode Cook's distance, Leverage value dan DfFITS. Metode DFiTs atau Standardized DFiT menampilkan nilai perubahan dalam harga yang diprediksi bilamana case tertentu dikeluarkan, yang sudah distandarkan, dimana data dari hasil perhitungan DFiTs yang lebih besar dari 2*sqrt(p/n) akan dihitung sebagai pencilan. Salah satu penelitian yang menggunakan metode ini adalah Mintu Kr.Das dan Bipin Gogoi [4] yang melakukan
filterisasi
pengukuran
influential
observations
(pengamatan
berpengaruh / pencilan), untuk menfilterisasi pencilan hasil dari observasi ke-i dari suatu peramalan. Mintu Kr.Das dan Bipin melakukan observasi untuk menemukan pencilan pada analisa regresi yang kemudian menampilkannya dalam tampilan grafik 2 dimensi. Grafik tersebut dibagi menjadi 4 kuadran yaitu atas kanan, atas kiri, bawah kanan dan bawah kiri. Metode identifikasi outlier yang digunakan adalah Cook's Distance, Covratio, DFFITS, Hat Matrix Diagonal, Potential dan Robust Residual Analysis. Hasil observasi menunjukkan metode identifikasi pencilan yang berbeda bisa menghasilkan pencilan yang berbeda. Metode cook’s distance menampilkan nilai jarak cook. Nilai jarak cook yang lebih besar dari tabel distribusi F(0.5; p, n-p) maka data tersebut adalah data pencilan. Salah satu penelitian yang menggunakan metode ini adalah Mintu Kr.Das dan Bipin Gogoi [4] yang melakukan filterisasi pengukuran informasi studentized residuals, nilai varian untuk mendeteksi adanya pencilan pada data berdasarkan besar kecilnya jarak cook. Mintu Kr.Das dan Bipin Gogoi melakukan observasi untuk menemukan pencilan pada analisa regresi yang kemudian menampilkannya dalam tampilan grafik 2 dimensi. Grafik tersebut dibagi menjadi 4 kuadran yaitu atas kanan, atas kiri, bawah kanan dan bawah kiri. Metode identifikasi pencilan yang digunakan adalah Cook's Distance, Covratio, DFiTs, Hat Matrix Diagonal, Potential dan Robust Residual Analysis. Hasil observasi 17
menunjukkan metode identifikasi pencilan yang berbeda bisa menghasilkan pencilan yang berbeda. Metode Leverage Values menampilkan nilai leverage (pengaruh) terpusat, dimana data hasil perhitungan dari Leverage Values yang lebih besar dari (2p-1)/n akan dihitung sebagai pencilan. Salah satu penelitian yang menggunakan metode ini adalah Soemartini [3] yang melakukan Diagnostic Plot pada pencilan regresi dan Leverage Point. Untuk mengidentifikasi adanya pencilan berdasarkan ukuran leverage pada data. Setelah membandingkan dan mempertimbangkan dari banyak penelitian tersebut akan dilakukan perbaikan kinerja FTS melalui optimasi metode identifikasi pencilan pada peramalan permintaan. Optimasi metode identifikasi pencilan yang dimaksud adalah melakukan perhitungan identifikasi pencilan dengan metode Boxplot, Cook's distance, Leverage value dan DFiTs, yang kemudian akan diobservasi apakah nilai pencilan yang dihasilkan sama atau tidak. Jika tidak sama, maka akan diobservasi yang mana diantara lima metode tersebut yang menghasilkan nilai peramalan yang terbaik.
18
BAB 3 METODOLOGI PENELITIAN Pada bab ini akan dijelaskan mengenai desain penelitian serta metode penelitian
yang akan
digunakan dalam membahas
dan
menyelesaikan
permasalahan penelitian. Adapun desain penelitian yang dilakukan oleh peneliti dalam menyelesaikan permasalahan dapat dilihat dalam bentuk diagam alur pada Gambar 3.1. Mulai Studi Literatur Perumusan masalah Pengumpulan Data Perumusan Hipotesis Perancangan Sistem Pembuatan program Pengolahan Data Analisa Hasil Penelitian Kesimpulan Selesai
Gambar 3.1 alur penelitian 3.1
Studi Literatur Pada tahap ini peneliti mengumpulkan dan mendalami berbagai macam
literatur untuk memperkaya pustaka yang sudah diteliti oleh peneliti sebelumnya.
19
Peneliti tertarik untuk mencari literature yang berhubungan dengan peramalan FTS. Peneliti menemukan jurnal yang berjudul:
Fuzzy Time Series Method for Forecasting Taiwan Export Data [14]
A Novel Algorithm to Forecast Enrollment Based on Fuzzy Time Series [15]
The Forecasting of Istanbul Stock Market with a High Order Multivariate Fuzzy Time Series Forecasting Model [16]
A Two Phase Algorithm for Fuzzy Time Series Forecasting using Genetic Algorithm and Particle Swarm Optimization Techniques [17]
3.2
Identifying Outliers in Fuzzy Time Series [1]
Perumusan masalah Peneliti tertarik dengan yang diteliti S. Sureh dan K. Senthamarai Kannan
dengan judul “Identifying Outliers in Fuzzy Time Series” (Journal of Modern Applied Statistical Methods) [1]. Pada jurnal itu S. Sureh dan K. Senthamarai Kannan melakukan filterisasi dan mengidentifikasi pencilan dengan menggunakan metode Cook’s distance. Namun ternyata pencilan yang dihasilkan melenceng dari definisi pencilan itu sendiri. Sehingga sangat perlu dilakukan observasi dan penghitungan lebih dalam untuk memperbaiki kondisi tersebut. Adapun perumusan masalah yang akan diobservasi dalan penelitian ini adalah bagaimana cara memcari metode eliminasi pencilan terbaik untuk memperbaiki kinerja peramalan FTS. Sedangkan objek penelitian sebagai studi kasus adalah Harga Saham BEI. 3.3
Pengumpulan Data Setelah merumuskan masalah, peneliti mengumpulkan data-data penelitian
dan berbagai literatur yang berhubungan dengan:
20
Fuzzy Time Series
Metode perhitungan residu terutama MSE dan MAPE
Metode Eliminasi pencilan terutama metode Boxplot, Cook’s Distance, Leverage Value dan DfFITS
3.4
Data Emiten harga saham BEI.
Perumusan Hipotesis Hipotesis dari penelitian ini adalah kinerja FTS akan menjadi lebih baik
jika sebelumnya dilakukan identifikasi dan eliminasi pencilan. Akan tetapi, peneliti masih belum dapat memastikan apakah hasil pencilan yang diperoleh pada masing-masing metode eliminasi pencilan sama atau tidak. Oleh karena itu peneliti menguji seluruh metode eliminasi pencilan, untuk mengetahui metode eliminasi pencilan yang terbaik. 3.5
Perancangan Sistem Setelah merumuskan hipotesis, peneliti merancang sistem dari tahap awal
perhitung sistem sampai akhir perhitungan. Adapun rancangan sistem dapat dilihar pada gambar dibawah ini. Data Input harga saham BEI
Perhitungan FTS
Menghitung Distribusi Error
Gambar 3.2 Tahap perhitungan peramalan dengan metode FTS
21
Data Input (Harga Saham BEI)
Filterisasi Boxplot, Leverage Value, DFiTs dan Cook’s Distance
Perhitungan Peramalan FTS
Perhitungan nilai MSE dan MAPE
Membandin gkan dan Menganalisa distribusi MSE dan MAPE untuk tiap metode filterisasi pencilan
Gambar 3.3 Tahap perhitungan peramalan dengan metode FTS yang disertai metode eliminasi pencilan
3.6
Pembuatan Program Setelah rancangan sistem sudah dibuat, peneliti membuat program
pencarian metode eliminasi pencilan terbaik untuk meningkatkan kinerja FTS pada harga saham BEI dengan menggunakan bahasa pemrograman seperti MS. Exel dan PHP. 3.7
Pengolahan Data Adapun langkah-langkah pengolahan data yang akan diproses adalah
sebagai berikut: 1.
Memasukkan data harga saham BEI kedalam sistem untuk dilakukan filterisasi pencilan dengan menggunakan metode yaitu Boxplot, Cook’s Distance, Leverage Value dan DFiTs untuk menghilangkan data pencilan.
2.
Menghitung nilai peramalan FTS dan nilai kesalaha MSE dan MAPE untuk setiap data yang sudah dilakukan filterisasi pencilan. setelah itu membandingkan dan menganalisa nilai kesalahan MSE dan MAPE dari masing-masing data yang sudah dilakukan filterisasi pencilan untuk mencari metode eliminasi pencilan terbaik
22
3.8
Analisis Hasil Penelitian Setelah melakukan perhitungan peramalan FTS dan distribusi kesalahan
dari hasil filterisasi setiap metode eliminasi pecilan, peneliti menganalisa dengan membandingkan distribusi kesalahan dari hasil filterisasi pencilan pada tiap metode dan melakukan pencarian metode eliminasi pencilan terbaik untuk meningkatkan kinerja peramalan FTS, yaitu yang paling kecil distribusi kesalahannya. 3.9
Kesimpulan Menarik kesimpulan dari analisa hasil penelitian yang sudah dilakukan.
Untuk mengetahui filterisasi pencilan terbaik pada peramalan FTS.
23
24
BAB 4 HASIL DAN PEMBAHASAN Bab ini akan membahas tentang perbandingan dari penelitian filterisasi pencilan untuk memperbaiki kinerja perhitungan peramalan Fuzzy Time Series (FTS) pada BEI dan membandingkannya dengan hasil kinerja peramalan FTS pada BEI tanpa filterisasi pencilan pada 2 uji coba periode 2011-2013 dan 20112014. Adapun tahapan yang akan dilakukan adalah sebagai berikut:
Pengambilan data
Perhitungan filterisasi pencilan (Boxplot, Leverage Value, DFiTs dan Cook’s Distance)
Perhitungan peramalan FTS
Perhitungan dan Perbandingan MSE dan MAPE
Hasil penelitian
4.1
Pengambilan Data Data yang digunakan untuk penelitian tesis ini diambil dari data harga
saham BEI LQ45 di (http://www.duniainvestasi.com/bei/prices/stock/LQ45). Adapun data yang akan diujikan pada penelitian tesis ini terdiri dari 2 periode, yaitu periode tahun 2011-2013 sebanyak 737 data untuk uji coba 1 yang digunakan untuk meramalkan periode tahun 2014 dan periode 2011-2014 sebanyak 978 data untuk uji coba 2 yang digunakan untuk meramalkan periode tahun 2015. Adapun 10 data pertama harga saham BEI dapat dilihat pada Tabel dibawah ini.
25
Tabel 4.1 Data saham BEI
Data yang akan difilterisasikan adalah nilai “Close” sebagai x dan nilai “Change” sebagai y. 4.2
Perhitungan filterisasi pencilan Pada semua perhitungan, nilai kinerja FTS yang menggunakan filterisasi
pencilan akan dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan. 4.2.1 Filterisasi Boxplot Untuk melakukan filterisasi Boxplot, langkah pertama adalah melakukan pengurutan dataa dari terkecil sampai terbesar. Perhatikan Tabel 4.2. Tabel 4.2 Perhitungan filterisasi Boxplot pada uji coba 1.
Setelah dilakukan pengurutan, langkah selanjutnya adalah mencari Q1 dan Q3. Dimana Q1 dan Q3 adalah nilai kuartil 1 dan kuartil 3 dari seluruh data. 26
Adapun nilai Q1 dan Q3 pada uji coba 1 adalah 673,575 dan 766,8. Sedangkan nilai Q1 dan Q3 pada uji Coba 2 adalah 682,045 dan 814,445. untuk lebih jelasnya perhatikan Tabel 4.2. Setelah Q1 dan Q3 sudah diketahui, langkah selanjutnya adalah menentukan nilai IQR (IQR = Q3 – Q1). Adapun nilai IQR untuk uji coba 1 adalah = 766,8 – 673,575 = 93,225 dan nilai IQR untuk uji coba 2 adalah = 814,445 – 682,045 = 132,4 . Setelah itu dilakukan filterisasi pencilan. nilai data yang lebih kecil dari batas bawah filterisasi akan dianggap pencilan dan data yang lebih besar dari batas atas filterisasi pencilan akan dianggap pencilan. Adapun nilai batas bawah filterisasi Boxplot adalah = Xi < Q1 – 1,5 * IQR dan nilai batas atas filterisasi pencilan adalah = Xi > Q3 + 1,5 * IQR. Uji coba 1 filterisasi Boxplot: Nilai filterisasi Boxplot pada uji coba 1 untuk batas atas adalah = 746,8 + 1,5 * 93,225 = 856,6375 dan nilai batas bawah adalah = 673,575 – 1,5 * 93,225 = 563,7375. Perhitungan yang sama dilakukan pada uji coba 2. Setelah dilakukan filterisasi pencilan, langkah selanjutnya adalah melakukan perhitungan FTS. 4.2.2 Filterisasi Leverage Value Pada sub Bab ini akan dijelaskan tahap-tahap perhitungan metode filterisasi pencilan Leverage Value. Metode ini menampilkan nilai leverage (pengaruh) terpusat. Uji coba 1 filterisasi Leverage Value: Diketahui nilai n = 737, nilai Xrata-rata = 712,4924953, nilai IQR pada perhitungan filterisasi Boxplot = 93,225 dan nilai Sx = 60,71411363. Adapun untuk menentukan nilai p adalah dengan melakukan perbandingan Sx dan IQR.
27
Adapun perbandingan nilai Sx dan IQR adalah 60,71411363 < 93,225. Perbandingan tersebut sesuai dengan seleksi persamaan rumus (2.12) yaitu p akan bernilai 2 jika Sx < 2/3 * IQR dan Sx > 1/3 * IQR Contoh perhitungan: Data ke-1 Adapun untuk menghitung metode filterisasi Leverage Value dapat digunakan persamaan rumus (2.6). H1 = Hi =
dimana X1= 667,951.
H1= 1/737+((667,951-712,4924953)2)/(737-1)*60,71411363= 0,04575472. Hasil perhitungan diatas akan dibandingkan dengan seleksi filterisasi Leverage Value sesuai dengan persamaan rumus (2.15). Adapun hasil perhitungan diatas akan bernilai pencilan jika nilai hasil perhitungan Leverage Value > (2p - 1) / n = (2*2 - 1) / 737 = 0,004070556. Nilai Leverage Value 0,04575472 lebih besar dari pada 0,004070556. Dari hasil seleksi diatas dapat disimpulkan bahwa nilai data X1 adalah pencilan. Perhitungan yang sama dilakukan pada uji coba 2. 4.2.3 Filterisasi DFiTs Pada sub Bab ini akan dijelaskan tahap-tahap perhitungan metode filterisasi DFiTs. Metode ini merupakan metode filterisasi pencilan yang menampilkan nilai perubahan dalam harga yang diprediksi bilamana case tertentu dikeluarkan dan sudah distandarkan. Pada sub Bab ini akan dijelaskan tahap-tahap perhitungan metode filterisasi pencilan DFiTs untuk memperbaiki kinerja peramalan FTS pada BEI. Adapun rumus DFiTs yang digunakan untuk menghitung filterisasi pencilan adalah persaan rumus (2.7) untuk menghitung Rstudent, rumus (2.8) untuk menghitung Rstandart dan rumus (2.10) untuk menghitung DFiTs. Untuk menentukan nilai Y digunakan variabel yang mempengaruhi nilai X (X = close) yaitu nilai “change” (Y = close - prev) Untuk mengetahui Ytaksiran (e
28
= Y - Ytaksiran) dibutuhkan perangkat lunak SPSS dengan langkah-langkah sebagai berikut:
Buka perangkat lunak SPSS
Gambar 4.1 gambar tampilan lembar kerja SPSS
Masukkan nilai data BEI sebagai X dan Change BEI sebagai Y (yang mempengaruhi X)
Gambar 4.2 gambar SPSS yang diisi 2 variabel
Setelah itu klik tab “Variable View”, lalu nama “VAR00001” diganti “x” dan “VAR00002” diganti “y”. setelah itu type ke 2 variabel diganti “Comma” (jika variabelnya menggunakan koma).
29
Gambar 4.3 gambar SPSS merubar variable view
Setelah itu klik menu “analyze”, lalu pilih “regression”, lalu pilih “linear”, maka akan muncul kotak dialog “linear regression”
Gambar 4.4 kotak dialog “Linear Regression”
Setelah itu kotak “dependent” diisi “y” dan kotak “independent(s)” diisi “x”. setelah itu pada tombol “plots” dicentang “histogram” dan “normal probability plot”, lalu klik continue dan klilk “OK”, maka akan muncul kotak output kotak dokumen SPSS. Dari tabel resibual statistics dapat diketahui nilai Ytaksiran = 0,999*Y.
30
Ytaksiran
Gambar 4.5 gambar output SPSS tabel “Residuals Statistics” Uji coba 1 filterisasi DFiTs Contoh perhitungan X1: Diketahui nilai p pada perhitungan Leverage Value adalah = 2, nilai n = 737, MSE = 0,000107277, Se2 = 0,000107418 (dihitung dari seluruh standart deviasi e) e1 = Y – Ytaksiran = 6,573 – (0,999*6,573) = 0,006573 dan nilai H1 pada perhitungan Leverage Value = 0,04575472. Hal pertama yang harus dilakukan adalah mencari nilai Rstandard1 sesuai dengan persamaan (2.7) =
= 0,006573 / (0,000107277*(1 - 0,04575472)
= 62,72317703. Setelah itu dilakukan perhitungan S, dinama S1 = = ((0,000107418)2*(737 – 2 – (62,72317703)2)) / (737 – 2 - 1) = -0,00046819. Setelah itu, dilakukan perhitungan Rstudent, dinmana Rstudent1 sesuai dengan persamaan (2.8) =
= 0,006573 / (-0,00046819 * (1 - 0,04575472)0,5) = -
14,37182472. Setelah nilai Rstudent sudah diketahui, langkah selanjutnya adalah menghitung nilai DFiTs1 sesuai dengan persamaan (2.10). DFiTs = Rstudent1
= -14,37182472 (0,04575472/(1 - 0,04575472))0,5
= -3,147022519. Hasil perhitungan DFiTs akan bernilai pencilan jika nilai hasil perhitungan > 2*sqrt(p / n) sesuai dengan persamaan rumus (2.16). Adapun hasil perhitungan
31
DFiTs diatas akan bernilai pencilan jika nilai hasil perhitungan DFiTs > 2 * sqrt(p/n) = 2*(2 / 737)0,5 = 0,104186452. Nilai DFiTs -3,147022519 lebih kecil dari pada 0,104186452. Dari hasil seleksi diatas dapat disimpulkan bahwa nilai data X1 adalah bukan pencilan. Perhitungan yang sama dilakukan pada uji coba 2. 4.2.4 Filterisasi Cook’s Distance Pada sub Bab ini akan dijelaskan tahap-tahap perhitungan metode filterisasi Cook’s Distance. Metode cook’s distance adalah metode filterisasi pencilan yang menampilkan nilai jarak cook. Nilai jarak cook yang lebih besar dari tabel distribusi F(0.5; p, n-p) maka data tersebut adalah data pencilan. Pada sub Bab ini akan dijelaskan tahap-tahap perhitungan metode filterisasi pencilan Cook’s Distance untuk memperbaiki kinerja peramalan FTS pada BEI. Adapun rumus yang digunakan unntuk menghitung filterisasi Cook’s Distance adalah persamaan rumus (2.8) untuk menghitung Rstandart dan rumus (2.9) untuk menghitung Cook’s Distance. Uji Coba 1 filterisasi Cook’s Distance: Diketahui nilai p pada perhitungan Leverage Value adalah = 2, nilai n = 737, MSE = 0,000107277, Se2 = 0,000107418 (dihitung dari seluruh standart deviasi e) e1 = Y – Ytaksiran = 6,573 – (0,999*6,573) = 0,006573 dan nilai H1 pada perhitungan Leverage Value = 0,04575472. Hal pertama yang harus dilakukan adalah menentukan nilai Rstandart sesuai dengan persamaan rumus (2.8) = Rstandard1 =
= 0,006573 /
((0,000107277 * (1 - 0,04575472)) = 62,72317703. Setelah itu dilakukan perhitungan Cook’s Distance sesuai dengan persamaan rumus (2.9). Cook’s Distance1 =
x
0,04575472)) = 94,31960601
32
= ((62,72317703)2 / 2) * ((0,04575472)/(1-
Hasil perhitungan Cook’s Distance akan bernilai pencilan jika nilai hasil perhitungan > F(0.5; p, n-p) (dapat dilihat pada tabel F) sesuai dengan persamaan rumus (2.17). nilai F(0.5; 2, 737-2) pada tabel F adalah 3. Adapun hasil perhitungan Cook’s Distance diatas akan bernilai pencilan jika nilai hasil perhitungan Cook’s Distance > 3. Nilai Cook’s Distance 94,31960601 lebih besar dari pada 3. Dari hasil seleksi diatas dapat disimpulkan bahwa nilai data X1 adalah pencilan. 4.3
Perhitungan peramalan FTS Pada sub bab ini akan dijelaskan tahap-tahap perhitungan kinerja FTS
pada BEI. Adapun langkah-langkah untuk melakukan peramalan FTS adalah: 4.3.1 Penentuan Interval Fuzzy Sebelum menghitung peramalan menggunakan metode FTS maka diperlukan untuk menentukan interval fuzzy terlebih dahulu. Pada tahap ini diperlukan batas ideal minimal (D1) dan batas ideal maksimal (D2) yang nantinya akan digunakan untuk rentang pembagian kelas.
Gambar 4.6 halaman untuk menentukan panjang interval
33
Setelah interval sudah dibuat, maka dilakukan pengelompokan data pada interval yang sesuai berupa linguistik. Tabel 4.6 Contoh Tabel Interval
Tabel 4.7 data linguistic pada BEI
………
34
Untuk menentukan nilai peramalan FTS pada periode berikutnya adalah dengan memilih data yang memiliki nilai linguistik terbanyak, dan dicari nilai rata-rata dari seluruh data yang memiliki nilai linguistic tersebut. Tabel 4.8 hasil perhitungan data BEI dengan metode FTS.
…….
Nilai linguistik terbanyak terdapat pada data interval A(9). Sehingga dilakukan perhitungan nilai rata-rata untuk semua data yang memiliki nilai linguistik A(9). Peramalan untuk periode berikutnya adalah 881,5377. Perhitungan peramalan. Untuk peramalan pada periode berikutnya dilakukan berulang – ulang sampai jumlah periode mencapai satu tahun. Adapun hasil perhitungan FTS untuk setiap metode filterisasi pencilan pada semua uji coba, dapat dilihat pada gambar-gambar dibawah ini:
35
Untuk uji coba 1:
Hasil Peramalan
Gambar 4.7 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, tanpa filterisasi pencilan
Hasil Peramalan
Gambar 4.8 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Boxplot
Hasil Peramalan
Gambar 4.9 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Leverage Value
36
Hasil Peramalan
Gambar 4.10 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi DFiTs
Hasil Peramalan
Gambar 4.11 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 1, dengan filterisasi Cook’s Distance
Untuk uji coba 2:
Hasil Peramalan
Gambar 4.12 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, tanpa filterisasi pencilan
37
Hasil Peramalan
Gambar 4.13 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Boxplot
Hasil Peramalan
Gambar 4.14 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Leverage Value
Hasil Peramalan
Gambar 4.15 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi DFiTs
38
Hasil Peramalan
Gambar 4.16 Hasil peramalan FTS, MSE dan MAPE untuk uji coba 2, dengan filterisasi Cook’s Distance
Untuk melihat hasil perhitungan FTS pada BEI dan hasil perhitungan data dengan metode FTS dapat dilihat pada halaman lampiran . 4.4
Perhitungan dan Perbandingan MSE dan MAPE Setelah dilakukan peramalan FTS, langkah selanjutnya adalah menghitung
nilai MSE dan MAPE pada semua uji coba. Untuk mengukur tingkat akurasi kinerja peramalan, maka dihitung nilai Mean Square Error (MSE) dan Mean Absolute Percentage Error (MAPE). Adapun untuk menghitung MSE dan MAPE digunakan rumus persamaan (2.4) untuk menghitung MSE dan (2.5) untuk menghitung MAPE. Contoh MSE dan MAPE untuk filterisasi Boxplot pada uji coba 1: Diketahui nilai D1 = 723,516, nilai F1 = 710,7463, nilai D2 = 709,347, F2= 710,7739, nilai D3 = 699,558, nilai F3 = 710,7708 dan nilai m = 241. Langkah pertama adalah menghitung nilai e (error) untuk setiap data yang sudah diketahui hasil peramalannya, dimana e =D-Y. |e1| = ((D1 – F1)2)0,5 = ((723,516 - 710,7463)2)0,5 = 12,7697. |e2| = ((D2 – F2)2)0,5 = ((709,347 710,7739)2)0,5 = 1,4269 |e3| = ((D3 – F3)2)0,5 = ((699,558 - 710,7708)2)0,5 = 11,2128. Setelah itu dilakukan perhitungan MSE sesuai dengan persamaan rumus (2.4). MSE = (e1 + e2 + e3 + … + e241) / m = (12,7697 + 1,4269 + 11,2128 + … + 16,7194) / 241 = 21,99105104. 39
Untuk menghitung nilai MAPE, hal pertama yang harus dilakukan adalah menghitung nilai PE sesuai dengan persamaan rumus (2.3). PE1 = |e1| / D1 x 100% = 12,7697 / 723,516 x 100% = 1,764950602 %. PE2 = |e2| / D2 x 100% = 1,4269 / 709,347 x 100% = 0,201156839 %. PE3 = |e3| / D3 x 100% = 11,2128 / 699,558 x 100% = 1,602840651 %. Setelah nilai itu dilakukan perhitungan nilai MAPE sesuai dengan persamaan rumus (2.5). MAPE = (PE1 + PE2 + PE3 + … + PE241) / m = (1,764950602 % + 0,201156839 % + 1,602840651 % + ... + 1,860644728 %) / 241 = 2,671010015 %. Setelah dilakukan perhitungan, nilai MSE dan MAPE dari kinerja FTS pada BEI dari awal tahun 2011 sampai akhir 2013 dengan filterisasi Boxplot secara berurutan adalah MSE = 21,99105104 dan MAPE = 2,671010015 %. nilai MSE dan MAPE untuk data yang tanpa filterisasi pencilan dan data yang menggunakan filterisasi lainnya juga dilakukan perhitungan yang sama. 4.4.1 Perbandingan kinerja FTS tanpa Filterisasi dan Dengan Filterisasi pencilan 2011-2013 Setelah melakukan perhitungan perhitungan filterisasi seperti yang sudah dibahas diatas, maka didapatkan nilai error (MSE dan MAPE) sebagai berikut: Tabel 4.9 Perbandingan hasil nilai error dari kinerja FTS dengan dan tanpa filterisasi pencilan periode tahun 2011-2013. Kinerja FTS (2011no. 2013) Tanpa Filterisai 1 Pencilan 2 Boxplot 3 Leverage Value 4 DFiTs 5 Cook's Distance
40
MSE
MAPE(%)
Keterangan
21,36249129 2,597803459 Kinerja FTS lebih 21,99105104 2,671010015 jelek Kinerja FTS lebih 26,23329253 3,160100746 jelek Kinerja FTS lebih 20,40701411 2,4797393 baik Kinerja FTS lebih 23,93176515 2,864345537 jelek
4.4.2 Perbandingan kinerja FTS tanpa Filterisasi dan Dengan Filterisasi pencilan 2011-2014 Setelah melakukan perhitungan perhitungan filterisasi seperti yang sudah dibahas diatas, makadidapatkan nilai error (MSE dan MAPE) sebagai berikut: Tabel 4.10 Perbandingan hasil nilai error dari kinerja FTS dengan dan tanpa filterisasi pencilan periode tahun 2011-2014 Kinerja FTS (2011no. 2014) Tanpa Filterisai 1 Pencilan 2 Boxplot 3 Leverage Value 4 DFiTs 5 Cook's Distance
MSE
MAPE(%)
Keterangan
31,36563074 31,36563074
3,73457323 3,73457323 Kinerja FTS lebih 25,56021598 3,136422149 baik Kinerja FTS lebih 29,22886598 3,501641225 baik Kinerja FTS lebih 23,92471475 2,887437375 baik
Adapun kriteria untuk setiap filterisasi pencilan dari penelitian-penelitian sebelumnya adalah sebagai berikut:
Metode filterisasi Boxplot bagus digunakan untuk data yang memiliki variasi yang besar dan tidak memiliki arus data yang naik atau turus.
Metode filterisasi Leverage Value bagus digunakan untuk data yang memiliki variasi yang tidak terlalu besar dan jumlah data yang banyak
Metode filterisasi DFiTs bagus digunakan untuk data dengan jumlah yang banyak, variasi yang kecil dan menampilkan nilai perubahan dalam harga (untuk tiap naik-turun yang ekstrim) yang diprediksi bilamana case tertentu dikeluarkan dan sudah distandarkan.
Metode filterisasi Cook’s Distance bagus digunakan untuk data dengan jumlah banyak, variasi yang kecil atau sedang dan memiliki periode naik secara tidak berurutan.
41
4.4.3 Analisa Grafik Perhitungan 1 Dibawah ini akan dijelaskan analisa perbandingan kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi pencilan pada perhitungan 1 (20112013). Adapun grafik dari tiap kinerja FTS yang sudah terpaparkan pada tabel 4.9 adalah sebagai berikut:
Gambar 4.17 Kinerja FTS untuk periode data 2011-2013 Tanpa filterisasi pencilan
(a)
(b)
Gambar 4.18 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi Boxplot (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi Boxplot, yang ditunjukkan pada Gambar 4.18 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
42
(a)
(b)
Gambar 4.19 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi Leverage Value (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi Leverage Value, yang ditunjukkan pada Gambar 4.19 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
(a)
(b)
Gambar 4.20 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi pencilan (a) dan dengan filterisasi DFiTs (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi DFiTs, yang ditunjukkan pada Gambar 4.20 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
43
(a)
(b)
Gambar 4.21 Perbandingan kinerja FTS untuk periode data 2011-2013 tanpa filterisasi (a) dan dengan filterisasi Cook’s Distance (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi Cook’s Distance, yang ditunjukkan pada Gambar 4.21 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan. 4.4.4 Analisa Grafik Perhitungan 2 Dibawah ini akan dijelaskan analisa perbandingan kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi pencilan pada perhitungan 2 (20112014). Adapun grafik dari tiap kinerja FTS yang sudah terpaparkan pada tabel 4.10 adalah sebagai berikut:
Gambar 4.22 Kinerja FTS untuk periode data 2011-2014 Tanpa filterisasi pencilan
44
(a)
(b)
Gambar 4.23 Perbandingan kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi Leverage Value (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi Leverage Value, yang ditunjukkan pada Gambar 4.23 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
(a)
(b)
Gambar 4.24 Perbandingan Kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi DFiTs (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi DFiTs, yang ditunjukkan pada Gambar 4.24 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
45
(a)
(b)
Gambar 4.25 Perbandingan kinerja FTS untuk periode data 2011-2014 tanpa filterisasi pencilan (a) dan dengan filterisasi Cook’s Distance (b)
Gambar perbandingan grafik kinerja FTS tanpa filterisasi pencilan dan dengan filterisasi Cook’s Distance, yang ditunjukkan pada Gambar 4.25 menunjukkan kinerja FTS yang menggunakan filterisasi pencilan memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan. 4.5
Analisis Hasil Penelitian Setelah melihat nilai error (MSE dan MAPE) dan grafik perbandingan
kinerja FTS dari hasil perhitungan yang sudah dilakukan pada seluruh uji coba, maka dapat ditarik hasil penelitian sebagai berikut:
Dari segi analisa grafik: seluruh kinerja FTS yang menggunakan metode filterisasi pencilan pada uji coba 1 dan 2 memiliki alur grafik yang lebih halus jika dibandingkan dengan kinerja FTS yang tanpa menggunakan filterisasi pencilan.
Metode Boxplot tidak cocok untuk data yang sangat banyak terutama mengenai harga saham, karena kemungkinan munculnya pencilan sangat kecil atau bahkan tidak muncul sama sekali. Boxplot cocok jika digunakan untuk jumlah data yang sedikit dan diaplikasikan untuk peramalan jangka pendek.
46
Metode Leverage Value tidak cocok untuk data yang memiliki perubahan yang sangat besar, seperti halnya pada Gambar 4.23 yang nilai varians-nya tinggi dibagian ahir peramalan.
Metode filterisasi DFiTs bagus digunakan untuk data dengan jumlah yang banyak, variasi yang kecil dan menampilkan nilai perubahan dalam harga (untuk tiap naik-turun yang ekstrim) yang diprediksi bilamana case tertentu dikeluarkan dan sudah distandarkan.
Metode filterisasi Cook’s Distance bagus digunakan untuk menfilter data yang sangat banyak dan digunakan untuk peramalan dengan periode jangka panjang seperti halnya pada Gambar 4.25.
Dari segi perbandingan MSE dan MAPE: a. pada uji coba 1: nilai MSE dan MAPE paling kecil adalah DFiTs b. pada uji coba 2: nilai MSE dan MAPE paling kecil adalah Cook’s Distance. Tabel posisi pergerakan harga saham ditinjau dari data awal X1 sampai
Xterahir: Tabel 4.11 tabel posisi pergerakan harga saham pada perhitungan 1
Tabel 4.12 tabel posisi pergerakan harga saham pada perhitungan 2
47
Keterangan: X1 = data ke-1;
X737 = data ke-737;
X978 = data ke-978;
X’737 = data peramalan ke-737;
X’978 = data peramalan ke-978 Analisa pada Tabel 4.11 menunjukkan bahwa pergerakan nilai saham dari data awal (X1) sampai data ahir (X737) memiliki kecenderungan naik. Nilai peramalan pada periode berikutnya (X’737) ternyata juga mengalami kenaikan relatif terhadap X1. Nilai periode berikutnya yaitu X738 juga naik. Hal ini menunjukkan bahwa sebenarnya hasil peramalan yang muncul sangat sesuai dengan tren kecenderungan kenaikan harga saham tersebut. Sehingga walaupun ada nilai error peramalan yang relatif kecil terhadap nilai sebenarnya, maka itu menjadi tidak masalah selama dalam jalur tren yang benar. Hal yang sama juga terjadi pada uji coba 2. 4.6
Manfaat Penelitian Bagi pemain Saham Adapun manfaat yang didapatkan bagi pemain saham adalah sebagai
berikut:
Dari segi analisa grafik: a. mengetahui kecenderungan harga saham relatif selama perjalanan periode pengambilan data jangka panjang b. pengguna dapat memilih metode filterisasi pencilan yang cocok sebelum digunakan untuk memperbaiki kinerja peramalan FTS dengan cara melihat alur grafik data harga saham beberapa periode sebelumnya (dengan moving data beberapa periode terakhir)
48
BAB 5 KESIMPULAN Setelah melakukan penelitian yang sudah dibahas pada Bab 4, maka diperoleh kesimpulan sebagai berikut:
Kinerja FTS yang menggunakan metode filterisasi DFiTs dan Cook’s Distance memberikan hasil peramalan yang lebih baik dibandingkan tanpa filterisasi pencilan. Pada uji coba 1 DFiTs menghasilkan distribusi kesalahan paling baik yaitu dengan nilai MSE 20,40701411 dan MAPE 2,4797393%. Sedangkan pada uji coba 2 Cook’s Distance menghasilkan distribusi kesalahan paling baik, yaitu dengan nilai MSE 23,92471475 dan MAPE 2,887437375%..
Grafik hasil filterisasi pencilan memililki fitur dengan tingkat variasi yang lebih halus dari pada tanpa filterisasi pencilan. Metode DFiTs dan Cook's Distance
cocok digunakan untuk mendukung sistem peramalan yang
melibatkan jumlah data yang relatif sangat banyak atau untuk mendukung sistem peramalan jangka panjang atau sistem investasi, sehingga walaupun hasil peramalan yang dihasilkan tetap menghasilkan error yang relatif kecil, tetap saja hasilnya baik, karena posisi nilai peramalan dan nilai yang muncul adalah sama-sama mengalami kenaikan dibandingkan dengan data awal X1.
49
50
DAFTAR PUSTAKA
Bibliography [1]
Suresh, S., & Senthamarai Kannan, K. (2011). ” Identifying Outliers in Fuzzy Time Series”. Journal of Modern Applied Statistical Methods. India:. ManonmaniamSundaranar University, Tirunelveli
[2]
Dawson, R. (2011), “How Significant Is A Boxplot Outlier?”. Journal of Statistics Education, Volume 19, Number 2(2011)
[3]
Soemartini (2007), “Pencilan (outlier)” Universitas Padjajaran, Jatinangor
[4]
Kr.Das, Mintu & Gogoi, Bipin (2015), “Usage of Graphical Displays to Detect Outlying Observations in Linear Regression”. Indian Journal of Applied Research. Volume: 5, Issue: 5, May 2015, ISSN - 2249-555X
[5]
Atkinson A.C (1981). Two Graphical Display for Outlying and Influential Observation in Regression. Technometricss
[6]
Rousseeuw, P.J. (1991), “Diagnostic Plot for Regression Outlier and Leverage Point,” Statistical Software Newsletter, 127-129
[7]
Song, Q., & Chissom, B. S. (2003a). Fuzzy time series and its model. An International Journal of Fuzzy Sets and Systems, 54(3), 269–277.
[8]
Chen, S. M. and Hsu, C. C. (2004). A New Method to Forecast Enrollments Using Fuzzy Time Series, International Journal of Applied Science and Engineering, No. 2, Vol. 3, pp. 234-244..
[9]
Song, Q., & Chissom, B. S. (2003b). Forecasting enrollments with fuzzy time series –Part I. An International Journal of Fuzzy Sets and Systems, 54(1), 1–9.
[11]
Şah, M. and Degtiarev, Y.K. (January, 2005). Forecasting Enrollment Model Based on First-Order Fuzzy Time Series, World Academy of Science, Engineering and Technology. Vol. 1, pp. 375-378, The Board of Trustees The University of Alabama.
[12]
Chen, S. M. and Chung, N. Yi (2006). Forecasting Enrollments of Students by Using Fuzzy Time Series and Genetic Algorithms, Information and Management Sciences, No.3, Vol.17, pp. 1-17.
[13]
Awallun, NK.; & Delyana, S (2012). ” Analisis Residual dengan Leverage Values, DfFITS, dan Cook’s Distance”. Jakarta: Sekolah Tinggi Ilmu Statistik Jakarta hal: 3-10.
51
[14]
Arumugam, P., & Anithakumari, V. (2013). “Fuzzy Time Series Method for Forecasting Taiwan Export Data”. International Journal of Engineering Trends and Technology (IJETT) - Volume4 Issue8- August 2013. India: Manonmaniam Sundaranar University.
[15]
Talal Jasim, H.; Ghafoor Jasim Salim, Abd.; & Ismail Ibraheem, K (1989). “A Novel Algorithm to Forecast Enrollment Based on Fuzzy Time Series”. Applications and Applied Mathematics: An International Journal (AAM). ISSN: 1932-9466. Vol. 7, Issue 1 (June 2012), pp. 385 – 397. Iraq: Mosul University
[16]
Yolcu, Ufuk (2012). The Forecasting of Istanbul Stock Market with a High Order Multivariate Fuzzy Time Series Forecasting Model. TJFS: Turkish Journal of Fuzzy Systems (eISSN: 1309–1190). An Official Journal of Turkish Fuzzy Systems Association. Vol.3, No.2, pp. 118-135, 2012. Turkey: University of Giresun, Faculty of Arts and Science, Department of Statistics
[17]
H Amjad, Usman.; A. Jilani, Tahseen., & Yasmeen, Farah. (2012). A Two Phase Algorithm for Fuzzy Time Series Forecasting using Genetic Algorithm and Particle Swarm Optimization Techniques. International Journal of Computer Applications (0975 – 8887) Volume 55– No.16, October 2012. University of Karachi
[18]
Alpaslan, Faruk.; Cagcag, Ozge.; Aladag, C.H.; Yolcu, U.; and Egrioglu, E.. (2012). ” A Novel Seasonal Fuzzy Time Series Method” Hacettepe Journal of Mathematics and Statistics Volume 41 (3) (2012), 375 – 385. Turkey: Statistics Department, Ondokuz Mayis University, Samsun
52