PERBANDINGAN ALGORITMA NEURAL NETWORK (NN) DAN SUPPORT VECTOR MACHINES (SVM) DALAM PERAMALAN PENDUDUK MISKIN DI INDONESIA
Tri Ginanjar Laksana –NIDN : 0407088502 Teknik Informatika, Sekolah Tinggi Manajemen dan Komputer (STMIK IKMI) Cirebon Jl. Perjuangan No. 10B Cirebon 45173 E-mail :
[email protected]. +6283824979266 ABSTRAK Penelitian – penelitian yang dilakukan berbagai studi seperti Badan Pusat Statistik (BPS), Pemerintah , dan Bank dunia dalam memprediksi kemiskinan di indonesia menunjukan perbedaan yang signifikan, tetapi berdasarkan hasil survey (Dadan Kuswaharja, 2005) mengatakan prediksi yang dilakukan tersebut belum teruji ke validitasannya karena tidak ditunjang dari studi lapangan . Untuk itu peneliti menerapkan model Data mining menggunakan perbandingan algoritma Neural Network (NN) dan Support Vector Macine (SVM) menggunakan data set penduduk miskin di Indonesia dari tahun 2008 – 2012 yang di peroleh dari data BP, hal tersebut dilakukan untuk mencari algoritma yang sesuai dalam peramalan penduduk miskin di indonesia. Dari serangkaian penerapan model dan pemilihan serta pengujian model, maka hasil penelitian diperoleh untuk peramalan penduduk miskin di Indonesia menggunakan algoritma Neural Network (NN) menghasilkan Absolute Error (AE) = 0.997 +/- 0.000 (mikro: 0.997 +/- 0.000), Relative Error (RE) = 99.73% +/- 0.04% (mikro: 99.73% +/- 0.04%) dan Root Mean Square Error (RMSE) = 0.997 +/- 0.000 (mikro: 0.997 +/- 0.000) dan hasil yang diperoleh dari penerapan Support Vector Machine (SVM) Menunjukan hasil Absolute Error (AE) = 15.968 +/- 4.996 (mikro: 15.535 +/9.243), Relative Error (RE) = 97.27% +/- 0.51% (mikro: 97.26% +/- 0.91%) dan Root Mean Square Error (RMSE) = 17.652 +/- 5.026 (mikro: 18.077 +/- 0.000), hasil tersebut menunjukan nilai validitas yang diperoleh Algoritma Neural Network (NN) lebih sesuai diterapkan dalam peramalan penduduk indonesia Kata Kunci : Algoritma, Neural Network (NN), Support Vector Macine (SVM), Peramalan, AR, RE, RMSE, Data Mining ABSTRACT Studies conducted various studies such as the Central Statistics Agency (BPS), the Government, and the World Bank in predicting poverty in Indonesia showed a significant difference, but based on the results of the survey (Dadan Kuswaharja, 2005) says the range predicted untested due to not supported from field studies. To the researchers applied the model using data mining algorithms comparison Neural Network (NN) and Support Vector Macine (SVM) algorithm in finding appropriate in forecasting the poor in Indonesia. Of a series of models and the selection and application of model testing, the results were obtained for the prediction of poor people in Indonesia using the algorithms of Neural Network (NN) produces Absolute Error (AE) = 0.997 + / - 0.000 (mikro: 0.997 + / - 0.000), Relative Error (RE) = 99.73% + / - 0:04% (micro: 99.73% + / - 0:04%) and Root Mean Square Error (RMSE) = 0.997 + / 0.000 (mikro: 0.997 + / - 0.000) and the results obtained from the application of Support Vector Machine (SVM) Shows the results of Absolute Error (AE) = 15 968 + / - 4,996 (micro: 15 535 + / - 9243), Relative Error (RE) = 97.27% + / - 0:51% (micro: 97.26% + / - 0.91%) and the Root Mean Square Error (RMSE) = 17 652 + / - 5,026 (micro: 18 077 + / - 0.000), the results showed the validity of the values obtained by
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
49
algorithm Neural Network (NN) is more appropriate to be applied in the Indonesian population forecasting Keywords : Algorithm, Neural Network (NN), Support Vector Macine (SVM), Predction, AR, RE, RMSE, Data Mining A. Latar Belakang Kemiskinan sebagai suatu penyakit sosial ekonomi tidak hanya dialami oleh negara-negara yang sedang berkembang,tetapi juga negaranegara maju seperti inggris dan amerika serikat.Negara mengalami kemiskinan di penghujung tahun 1700an pada era kebangkitan revolusi industri yang muncul di eropa.Pada masa itu kaum miskin di inggris berasal dari tenaga-tenaga kerja pabrik yang sebelumnya sebagai petani yang yang mendapat upah rendah.Mereka umumnya tinggal di perumahan kumuh yang rawan terhadap penyakit sosial lainnya,seperti prostitusi, kriminilitas, pengangguran. Berikut sedikit penjelasan mengenai kemiskinan yang sudah menjadi dilema mengglobal yang sangat sulit di cari cara pemecahan terbaikya(Penabugis, 2013) Manurut (BPS, 2006) dikatakan bahwa, untuk menuju solusi kemiskinan penting bagi kita untuk menulusuri secara detail indikatorindikator kemiskinan tersebut.Adapun indikatorindikator kemiskinan : 1. 2.
3.
4. 5. 6.
Ketidakmampuan memenuhi kebutuhan konsumsi dasar (sandang,pangan dan papan) Tidak adanya akses terhadap kebutuhan hidup dasar lainnya (kesehatan,pendidikan,sanitasi,air bersih dan transportasi) Tidak adanya jaminan masa depan (karena tiadanya inventasi untuk pendidikan keluarga). Kerentanan terhadap goncangan yang bersifat individual maupun massa. Rendahnya kualitas sumber daya manusia dan terbtasnya sumber daya alam. Kurangnya apresiasi dalam kegiatan sosial masyarakat.
7.
Tidak adanya akses dalam lapangan kerja dan mata pencaharian yang berkesinambungan. 8. Ketidakmampuan berusaha karena cacat fisik maupun mental. 9. Ketidakmampuan dan ketidaktergantungan sosial(anak-anak terlantar, wanita korban kekerasan rumah tangga,janda miskin, kelompok marginal dan terpencil). Dan menurut (Hidayatullah, 2012)Berikut beberap factor yang mempengaruhi kemerosotan standar perkembangan pendapatan per kapita: 1) Naiknya standar perkembangan suatu daerah. 2) Politik ekonomi yang tidakn sehat 3) Faktor-faktor luar negeri,di antara lainnya: a) Rusakya syarat-syarat perdagangan b) Beban hutang c) Kurangnya bantuan luar negeri,dan d) Perang Badan Pusat Statistik mencatat, indeks keparahan pada Maret 2012 sebesar 0,36. Padahal, pada September 2012 menjadi 0,61. Kenaikan indeks ini menunjukan dua hal, yaitu semakin melebarnya kesenjangan antarpenduduk miskin dan, juga, semakin rendahnya daya beli dari masyarakat kelompok miskin karena ketidakmampuan mereka memenuhi kebutuhan dasar untuk hidup sampai dengan batas pengeluaran garis kemiskinan yang hanya sebesar Rp 259.520 per bulan. Kondisi penduduk miskin di wilayah pedesaan yang semakin parah ini, tambah Arif, diakibatkan karena tingginya tingkat inflasi wilayah pedesaan, yakni 5,08 persen, jika dibandingkan dengan inflasi nasional sebesar 4,3 persen selama tahun 2012. "Inflasi di pedesaan yang tinggi disumbangkan oleh kenaikan harga-harga bahan makanan, makanan jadi, perumahan, sandang, dan kesehatan. Sementara, di sisi lain, kenaikan upah yang diterima buruh tani ataupun buruh hanya antara 1 persen dan 3 persen dalam tahun 2012. Tidak seimbangnya antara kenaikan upah yang
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
50
diterima dan kenaikan harga kebutuhan dasar tersebut menjadi salah satu penyebab keadaan kemiskinan di Indonesia tak berubah banyak dari waktu-ke waktu," ungkapnya. Menurut Arif, selama delapan tahun penduduk miskin hanya berkurang rata-rata 7,51 juta setiap tahun. Dia menyarankan, untuk mempercepat penurunan kemiskinan, kebijakan penanggulan kemiskinan harus dirumuskan ulang. "Pencapaian swasembada pangan yang diprioritaskan untuk wilayah pedesaan adalah kata kunci yang harus dilakukan segera. Pemerintah harus memberikan prioritas yang lebih kepada petani, terutama dengan melalui program intensifikasi yang bersifat menyeluruh dan tak partikulatif. Ini harus dimulai dari pengembangan riset dan teknologi yang berbasis pertanian pangan, pengembangan infrastruktur pertanian, insentif kepada petani, sampai dengan program industrialisasi perdesaan. Ditambahkan, dengan pencapaian swasembada pangan, pemerintah dapat lebih mudah menjaga stabilistas harga pangan. "Stabilitas harga pangan yang terkendali akan mempercepat proses penurunan kemiskinan karena orang miskin 73,5 persen pengeluarannya dipergunakan untuk membeli bahan makanan,"
Menurut (Provertyindonesia, 2013) dalam mengukur kemiskinan memiliki Tahapan pengukuran kemiskinan :
Gambar 1. Tahapan Pengukuran Kemiskinan
Bank Dunia memperkirakan bahwa sekitar satu miliar orang masih akan berada dalam taraf kemiskinan ekstrim pada tahun 2015 meski terdapat kemajuan dalam mengatasi berbagai kemiskinan ekstrim di berbagai negara berkembang. ada laju kemajuan (mengatasi kemiskinan ekstrim) sekarang ini, diperkirakan sekitar satu miliar orang tetap akan hidup dalam kemiskinan ekstrim pada tahun 2015 (Ravallion, 2012). Dan menurut (BPS, 2006) Kebijakan penanggulangan kemiskinan yang ditempuh pemerintah dilakukan melalui jalur mekanisme ekonomi dan fasilitas bantuan pemerintah. Penanggulangan kemiskinan melalui mekanisme ekonomi dilakukan dengan membuat kebijakan ekonomi yang mendukung penciptaan lapangan kerja bagi masyarakat miskin. Kebijakan ini sangat terkait dengan kebijakan ekonomi makro yang disusun dalam rangka percepatan dan perluasan pertumbuhan ekonomi. Sedangkan penanggulangan kemiskinan melalui fasilitas bantuan pemerintah, dilakukan melalui kegiatan yang afirmatif/keberpihakan, yaitu melalui peningkatan dan perluasan program kemiskinan yang selama ini telah dilaksanakan Dengan berbagai program dan kebijakan tersebut, tingkat kemiskinan pada 2012 diperkirakan menurun pada kisaran 10,5-11,5%. Serta menurut (Budimanta & Arif, 2013) memprediksi angka kemiskinan pada tahun 2006 bakal meningkat. Salah satu pemicunya adalah naiknya harga bahan pokok dan bahan bakar minyak. "Kita perhatikan bahwa harga beras, sebagai salah sat bahan pokok naik cukup tinggi," kata juru bicara Kepresidenan Andi Malarangeng di Nusa Dua, Sabtu. Padahal, kata dia, beras adalah bahan pokok yang menjadi belanja utama bagi orang miskin. Kalau belanja ini meningkat secara signifikan maka kategori orang tersebut akan berubah dari tidak miskin menjadi miskin. Tetapi semua itu disangkal menurut pendapat (Kuswaraharja, 2005) Niat pemerintah untuk memberikan subsidi tunai terancam tersendat. Sebab, angka kemiskinan lebih tinggi dari prediksi pemerintah. "Kondisi di lapangan ternyata memang ada rumah tangga yang
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
50
memiliki kemiripan karakter dengan keluarga miskin”. Pentingnya memprediksi kemiskinan di Indonesia merupakan suata cara/ alat untuk mengurangi kemiskinan yang ada di Indonesia dari tahun ke tahun , dalam hal tersebut dikatakan bahwa : pemerintah agar lebih tegas dalam mengurangi jumlah kemiskinan di Indonesia, untuk hal tersebut peneliti ingin mengetahui algortima yang sesuai diantara algoritma Neural Network (NN) dan Support Vector Machine (SVM) dalam meramalkan kemiskinan di Indonesia dari tahun 2008 s.d 2012 (Data BPS).
B. Perumusan Masalah 1. Bagaimana membangun algoritma Neural Network (NN) dan Support Vector Macine (SVM) dengan data set BPS time series tentang kemiskinan di Indonesia? C. Algoritma apa yang sesuai antara Neural Network (NN) dan Support Vector Machine (SVM) untuk peramalan kemiskinan di Indonesia menggunakan data set BPS dari tahun 2008 s.d 2012 ? D. Tujuan dan Manfaat 1. Tujuan a. Mengetahui bagaimana membangun model algoritma Neural Network (NN) dan Support Vector Macine (SVM) menggunakan data set kemiskinan di Indonesia. b. Mengetahui kinerja model algoritma Neural Network (NN) dan Support Vector Macine (SVM) yang lebih baik dalam meramalkan kemiskinan di Indonesia menggunakan data set BPS dari tahun 2008 s.d 2012. 2.
Manfaat a. Sebagai acuan peneliti yang akan datang dalam penggunaan model algoritma Neural Network (NN) dan Support Vector Macine (SVM) untuk melakuka peramalan penduduk miskin di Indonesia. b. Dan dapat dipergunakan sebagai acuan mencari model yang sesuai dalam
pengembangan model algoritma Neural Network (NN) dan Support Vector Macine (SVM) untuk peramalan penduduk miskin di Indonesia. E. LANDASAN TEORI Penelitian tentang NN dan SVM Penelitian yang dilakukan (Pintowati & Otok, 2012) Masalah kemiskinan merupakan salah satu permasalahan utama pemerintah yang diprioritaskan dalam menyusun strategi pembangunan setiap negara termasuk Indonesia. Selama ini telah banyak program-program atau kebijakan khusus yang dibuat oleh pemerintah guna menanggulangi masalah kemiskinan namun belum juga terpecahkan. Penelitian ini dilakukan untuk mengetahui model kemiskinan di Propinsi Jawa Timur dengan pendekatan MARS ensemble. Kemiskinan sendiri oleh BPS diukur dengan tiga indikator yaitu persentase penduduk miskin, indeks kedalaman kemiskinan, dan indeks keparahan kemiskinan. Ketiga indikator kemiskinan tersebut dijadikan sebagai variabel respon dalam penelitian ini yang dimodelkan dengan faktor yang diduga mempengaruhinya baik dari kualitas ekonomi, kualitas sumber daya manusia, dan kesehatan. Hasil penelitian menunjukkan bahwa pendekatan MARS ensemble memberikan hasil yang lebih baik dibandingkan dengan pendekatan MARS pada ketiga pemodelan tersebut. Dan berdasarkan penelitian yang dilakukan (Huang & Shyu, 2010)PendekatanLS-SVM lebih rendahkesalahanprediksi. Dan berdasarkan penelitian (Deb, Student Member, Senior Member, Gopal, & Chandra, 2007)SVM pohon-tipe NN yang menjamin pembelajaran lengkapdata ditetapkan untuk tugas klasifikasi biner, telah membantu Amelio-menilai beberapa dari masalah ini. Ini juga memfasilitasi pembelajaranperistiwa langka seperti negara gagal, yang penting dalam ACDpengaturan.SVMs mengatasi masalah memaksimalkan generalisasisekaligus meminimalkan kesalahan klasifikasi. ANNmetode pelatihan biasanya
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
51
didasarkan pada meminimalkan meankuadrat kesalahan lebih dari satu set eksemplar pelatihan. Menurut (Kraipeerapun & Fung, 2008)SVMsdimodifikasimemberikanhasil yangsebanding denganhasildiperoleh dariSVMtradisional.Namun, merekadapat melakukancepatataumenyediakan kompleksitaskurang dariSVMtradisional.Integrasi jaringansarafdan beberapalainnyayang adaTeknik ini jugadapat meningkatkan kinerjaklasifikasidibandingkan denganjaringan saraftradisional.diusulkankamiTeknikini juga menggunakanintegrasitradisionalbackjaringan syarafpropagasi(BPNN) danteori yang ada disebutIntervalsetneutrosophic.Oleh karena itu, jika klasifikasiyangterlibat dalaminformasi yang tidak pastimakapendekatan (BPNN) adalah teknik yang dapatdipilih untukprediksi.
Algoritma Algoritma adalah sebuah deskripsi pelaksanaan suatu proses dimana algoritma disusun oleh sederetan instruksi yang logis, kata logis merupakan suatu kunci dalam sebuah algoritma yang berarti didalam algoritma terdapat langkah – langkah yang logis atau masuk akal / secara sequencial (berurutan). Itu menandakan bahwa urutan – urutan tersebut harus ditentukan benar atau salah, langkah – langkah yang tidak benar dapat menghasilkan nilai yang salah.
Data Mining Menurut (Lia Zailia, 2007), data mining merupakan sebuah proses ekstraksi pengetahuan dari data yang besar. Sesuai fungsinya, data mining adalah proses pengambilan pengetahuan dari volume data yang besar yang disimpan dalam basis data, data warehouse atau informasi yang disimpan dalam repositori.
Gambar 1 Tahap – Tahap Proses Data Mining (Lia Zailia, 2007) Data mining merupakan suatu rangkaian proses yang dibagi menjadi beberapa tahap seperti yang diilistrasikan di Gambar 1. Tahap – tahapnya sebagai berikut: 1. Pembersihan data. Pembersihan data dilakukan untuk membuang data yang tidak konsisten atau data yang tidak dibutuhkan. 2. Integrasi data. Integrasi data merupakan penggabungan data dari berbagai sumber. Tren populer di industri informasi adalah untuk melakukan integrasi data dan data pembersihan sebagai langkah awal, dimana data yang dihasilkan disimpan dalam warehouse. 3. Seleksi data. Data yang sesuai dengan analisis yang akan dipakai, diambil dari database. 4. Transformasi data. Data diubah ke dalam bentuk yang sesuai untuk pertambangan data. 5. Aplikasi teknik data mining. Proses penting yang dilakukan untuk menemukan pola data. 6. Evaluasi pola yang ditemukan. Untuk mengidentifikasi atau menemukan pola – pola yang bernilai. 7. Presentasi pengetahuan. Presentasi pengetahuan dilakukan dengan teknik visualisasi kepada pengguna. Time Series Time series adalah himpunan nilai-nilai hasil pengamatan X(t) yang diamati
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
52
berdasar periode waktu dan disusun untuk melihat pengaruh perubahan dalam rentang waktu tertentu. Prediksi data time series adalah pendugaan data yang akan datang yang dilakukan berdasarkan nilai data masa lalu dari suatu variable. Prediksi data time series dapat diterapkan bila terdapat tiga kondisi berikut : - Tersedia informasi tentang masa lalu. - Informasi dapat dikuantitatifkan dalam bentuk data numerik. - Dapat diasumsikan bahwa beberapa aspek pola masa lalu akan terus berlanjut di masa mendatang Time Series Neural Network (NN Artificial Neural Network (ANN) telah banyak digunakan untuk memecahkan berbagai masalah dalam berbagai disiplin ilmu seperti bidang komputer, teknik, perdagangan dan lain – lain. ANN juga dapat digunakan untuk melakukan prediksi atau peramalan. ANN adalah sebuah model matematis atau model komputasi yang terinspirasi oleh struktur dan/atau aspek fungsional dari jaringan saraf biologi. Sebuah jaringan saraf terdiri dari sebuah kelompok yang saling berhubungan dari neuron buatan dan memproses informasi menggunakan penghubung untuk melakukan perhitungan. Sebuah ANN merupakan sistem adaptif yang merubah strukturnya berdasarkan informasi eksternal maupun internal yang mengalir melalui jaringan selama fase pembelajaran. ANN ditentukan oleh tiga hal, yaitu: pola hubungan antar neuron, metode untuk menentukan bobot penghubung dan fungsi aktivasi.Arsitektur ANN secara umum dibagi menjadi empat, yaitu: Single-Layer Feedforwad Network (SLFN), Multi-Layer Feedforward Network (MLFN), Recurrent Network dan Lattice Structure. a. Arsitektur Neural Network
b.
Model arsitektur dasar Neural Network (NN) Model arsitektur dasar dari JST tersebut dapat diamsusikan sebagai berikut: 1. Masukan sebagai input (xn) yang berfungsi sebagai penerima sinyal. 2. Bobot koneksi (Wjn) untuk menyimpan informasi. 3. Bias (W0) yang berfungsi mengatur daerah nilai ambang. 4. Elemen pemroses (J) dan fungsi aktifasi (F1) untuk memroses informasi. 5. Keluaran sebagai output (Y1) yang akan menyampaikan hasil pemrosesan informasi ke sel berikutnya.
c.
Rumus Neural Network (NN) Secara garis besar, training jaringan dengan metode backpropagation meliputi 3 (tiga) tahap: 1. Tahap maju (feedforward) 2. Tahap perhitungan eror propagasi-balik (backpropagation of error) 3. Tahap pembaharuan bobot dan bias (adjustment of the weights and biases)
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
Fungsi aktivasi Fungsi aktivasi digunakan adalah fungsi sigmoid biner yang mempunyai interval [0 , 1] dan difenisikan sebagai berikut :
53
𝑓1 =
1 1 + exp (−x)
Dengan : 𝑓1′ (𝑥) = 𝑓1(𝑥) [1 − 𝑓1(𝑥)] Secara umum arsitektur jaringan model NN dapat dimodelkan sesuai dengan fungsi aktivasi sigmoid pada hidden layer dan fungsi linier pada output. Dengan jumlah neuron pada hidden layer sebanyak 4 dengan fungsi aktivasi sigmoid, maka persamaan matematik yang didapatkan adalah :
Model Neural Network a. Menentukan arsitektur NN yaitu menentukan banyak input, jumlah neutron dalam hidden layer, bobot awal dan fungsi aktivasi. b. Melakukan pelatihan (insample training) pada data pelatihan dengan menentukan bobot awal dan arsitektur NN yang telah ditentukan. c. Melakukan peramalan dan menghitung nilai AE, RE dan RMSE data in-sample dan data out-sample. d. Memilih model terbaik
SVM berada dalam satu kelas dengan ANN dalahal fungsi dan kondisi permasalahan yang bisa diselesaikan. Keduanya masuk dalam kelas supervised learning. Baik para ilmuwan maupun praktisi telah banyak menerapkan teknik ini dalam menyelesaikan masalah - masalah nyata dalam kehidupan sehari-hari. Baik dalam masalah gene expression analysis, finansial, cuaca hingga di bidang kedokteran. Terbuktidalam banyak implementasi, SVM memberi hasil yang lebih baik dari ANN, terutama dalam hal solusi yang dicapai. ANN menemukan solusi berupa local optimal sedangkan SVM menemukan solusi yang global optimal.Tidak heran bila kita menjalankan ANN solusi dari setiap training selalu berbeda. Hal ini disebabkan solusi local optimal yang dicapai tidak selalu sama. SVM selalu mencapi solusi yang sama untuk setiap running. Dalam teknik ini, kita berusaha untuk menemukan fungsi pemisah(klasifier) yang optimal yang bisa memisahkan dua set data dari dua kelas yang berbeda. Teknik ini menarik orang dalam bidang data mining maupun machine learning karena performansinya yang meyakinkan dalam memprediksi kelas suatu data baru. a.
Rumus perhitungan Vektor Machine)
SVM
(Support
Support Vector Macine (SVM) Support vector machine (SVM) adalah suatu teknik yang relatif baru (1995) untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang sangat populer belakangan ini.
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
54
Prediksi/ Peramalan Estimasi dan Prediksi. Estimasi menerka sebuah nilai yang belum diketahui, misalnya penghasilan seseorang, ketika informasi lain mengenai orang tersebut diketahui. Prediksi memperkirakan nilai untuk masa mendatang, misalnya probabilitas orang untuk membeli sebuah mobil baru tahun depan, ketika orang itu belum melakukannya. Atau nilai saham yang akan dibeli tahun depan. AE (Absolute Error) Menurut (Xia & Pan, 2010) Absolute Error (AE) dapat dugunakan sebagai cerminan dari prediksi akurasi. JadiKriteriakesalahanmutlakminimisasibah wakesalahan prediksiabsolutsebagaistandarakurasi prediksi. RE (Relative Error) Relative Error (RE) digunakan untuk mengetahui seberapa jauh perbedaan makespan yang dihasilkan oleh kedua metode, Sedangkan makespan adalah jangka waktu penyelesaian seluruh analisa yang telah di eksekusi yang merupakan jumlah dari seluruh waktu proses (waktu).
RMSE (Root Mean Square Error) Menurut (Sri Wahyunigsih, 2012) Kriteria yang digunakan untuk mengukur kebaikan model setelah diperoleh suatu model adalah root mean square error (RMSE). RMSE merupakan alat seleksi model berdasarkan pada error hasil estimasi.
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
55
Error yang ada menunjukkan seberapa besar perbedaan hasil estimasi dengan nilai yang akan diestimasi. Nilai ini akan digunakan untuk menentukan model mana yang terbaik. Definisi RMSE dapat ditulis sebagai berikut : RMSE = √
∑𝑛 𝑖=1(𝑦𝑖−i)2 𝑛
Dengan : b. RMSE N yi i
: Root Mean Square Error : Jumlah Sampel : Nilai Aktual : Nilai Prediksi
F. METODOLOGI PENELITIAN
tentang Jumlah dan Persentase Penduduk Miskin, Garis Kemiskinan, Indeks Kedalaman Kemiskinan (P1), dan Indeks Keparahan Kemiskinan (P2) Menurut Provinsi, dari bulan Maret 2008 s.d Bulan Maret 2012, tetapi yang peneliti ambil sebagai data set yaitu data persentasependuduk miskin kota dan desa dari tahun 2008 s.d 2012.. Variabel – variabel Variabel – variabel yang digunakan untuk menganalisa dan meramalkan penduduk miskin di indonesia memiliki 7 variabel : Tabel 1 Data Set (Time Series) Kemiskinan di Indonesia X1
X2
X3
X4
X5
Total_2008
Total_2009
Total_2010
Total_2011
No
Metode penelitian yang dilakukan adalah sebagai berikut: a. Pengumpulan data b. Pengolahan data awal c. Metode yang diusulkan d. Eksperimen dan pengujian metode yang diusulkan e. Evaluasi dan validasi hasil
3.1 Sumber Data dan Variabel Penelitian Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari hasil pendataan Survei Badan Pusat Statistik (BPS) Indonesia pada tahun 2012 (Data Set Time Series dari tahun 2008 s.d 2012). Unit observasi dalam penelitian ini adalah 33 Provinsi di Indonesia. Variabel yang digunakan dalam penelitian ini ada dua yaitu variabel respond an prediktor. Variabel respon yang digunakan yaitu satu indikator yaitu Sample Provinsi (X1), sedangkan variabel prediktor yang digunakan ada lima variabel yaitu persentase total penduduk desa dan kota tiap provinsi tahun 2008 (X2), persentase total penduduk desa dan kota tiap provinsi tahun 2009 (X3), persentase total penduduk desa dan kota tiap provinsi tahun 2010 (X4), persentase total penduduk desa dan kota tiap provinsi tahun 2011 (X5), persentase total penduduk desa dan kota tiap provinsi tahun 2012 (X6). a.
Data Set Data set yang digunakan penulis kumpulkan dari website BPS tahun 2012
Provinsi
Keterangan : No : Menerangkan banyaknya sample data yang dianalisa X1 : Menerangkan nama – nama provinsi yang ada di wilayah Indonesia X2 : Total Jumlah Penduduk Miskin kota dan desa tahun 2008 X3 : Total Jumlah Penduduk Miskin kota dan desa tahun 2009 X4 : Total Jumlah Penduduk Miskin kota dan desa tahun 2010 X5 : Total Jumlah Penduduk Miskin kota dan desa tahun 2011 X6 : Total Jumlah Penduduk Miskin kota dan desa tahun 2012 Langkah Analisa Langkah analisis yang dilakukan untuk mencapai tujuan penelitian ini adalah sebagai berikut. 1. Download original data dari website BPS 2012 time series (data testing). 2. Klasifikasi data set yang ingin di evaluasi dan teliti dari tahun ke tahun yaitu data time series dari tahun 2008 s.d 2012 persentase penduduk miskin di Indonesia 3. Normalisasi data untuk memudahkan penamaan pada variabel 4. Membuat Klasifikasi antara variabel respon dengan variabel prediktor. 5. Membuat data training time series (data training)
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
56
6.
7. 8. 9. 10. 11. 12. 13.
Exsport data training dari data ber extention XLS menjadi CSV agar bisa di baca oleh rapidminer Import data set kedalam tools rapidminer Inputkan model Validasi Masukan Model NN di dalam validasi view traning / SVM Masukan apply model dan performance Di dalam model performance validasi AR, RE, RMSE di checklist Kemudian klik start, proses dan hasil
Vector Machine (SVM) Menunjukan hasil Absolute Error (AE) = 15.968 +/- 4.996 (mikro: 15.535 +/- 9.243), Relative Error (RE) = 97.27% +/- 0.51% (mikro: 97.26% +/- 0.91%) dan Root Mean Square Error (RMSE) = 17.652 +/- 5.026 (mikro: 18.077 +/- 0.000), hasil tersebut menunjukan nilai validitas yang diperoleh Algoritma Neural Network (NN) lebih sesuai diterapkan dalam peramalan penduduk indonesia
Kerangka Pemikiran
H. DAFTAR PUSTAKA
BPS.
G.KESIMPULAN HASIL algoritma yang sesuai dalam peramalan penduduk miskin di indonesia. Dari serangkaian penerapan model dan pemilihan serta pengujian model, maka hasil penelitian diperoleh untuk peramalan penduduk miskin di Indonesia menggunakan algoritma Neural Network (NN) menghasilkan Absolute Error (AE) = 0.997 +/0.000 (mikro: 0.997 +/- 0.000), Relative Error (RE) = 99.73% +/- 0.04% (mikro: 99.73% +/0.04%) dan Root Mean Square Error (RMSE) = 0.997 +/- 0.000 (mikro: 0.997 +/- 0.000) dan hasil yang diperoleh dari penerapan Support
(2006). Pemerintah Telah Prediksi Peningkatan Angka Kemiskinan, 1-2. Budimanta, A., & Arif, M. (2013). Kemiskinan di Indonesia Semakin Kronis, 1-2. Deb, A. K., Member, Student, Member, Senior, Gopal, M., & Chandra, S. (2007). SVMBased Tree-Type Neural Networks as a Critic in Adaptive Critic Designs for Control. IEEE, 18(4), 1016-1030. Hidayatullah. (2012). Prediksi Kemiskinan di Indonesia, 1-1. Huang, Z., & Shyu, M.-ling. (2010). k-NN Based LS-SVM Framework for Long-Term Time Series Prediction. System, 4-6, 69-74. Kraipeerapun, P., & Fung, C. C. (2008). Comparing Performance of Interval Neutrosophic Sets and Neural Networks with Support Vector Machines for Binary Classification Problems. Learning, 34-37. Kuswaraharja, D. (2005). Prediksi Angka Kemiskinan Meleset , Dana Subsidi Tunai Kurang, 451791-451791. Penabugis. (2013). Kemiskinan, 1-7. Pintowati, W., & Otok, W. (2012). Pemodelan Kemiskinan di Propinsi Jawa Timur dengan Pendekatan Multivariate Adaptive, 1(1), 2-7. Provertyindonesia. (2013). Mengukur kemiskinan, 1-4.
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
57
Ravallion, M. (2012). Prediksi Bank Dunia : 1 Miliar Orang Dibawah Garis Kemiskinan Pada 2015, 13-14. Sri Wahyunigsih, D. (2012). Pemodelan Nilai Tukar Petani Pada Palawija Dengan Pendekaran Fungsi Transfer dan Multivariete Adaptive Regresion Multi Variate. ITS, 1-11. Xia, L., & Pan, H. (2010). Inferential Estimation of Polypropylene Melt Index Using Stacked Neural Networks Based on Absolute Error Criteria. Control, 216-218. Lia Zailia. (2007). Penerapan Data Mining Untuk IDS, 7010, 1-33.
Jurnal Online ICT STMIK IKMI – Vol. 1-No. 1 Edisi Juli 2013
58