Kartika Fitriasari dan Putri Susanti Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
APLIKASI JARINGAN SYARAF TIRUAN PADA DATA MULTIVARIATE Dra. Kartika Fitriasari, M.Si 1 dan Putri Susanti 1
Dosen Jurusan Statistika FMIPA-ITS, Surabaya
[email protected]
ABSTRAK Jaringan Syaraf Tiruan adalah suatu metoda yang sering digunakan pada kasus peramalan. Pada kasus peramalan untuk data multivariate data input didasarkan pada lag yang keluar pada parsial korelasi silang.. Sebagai pembanding digunakan AIC, SBC, MAPE dan RMSE. Sebagai studi kasus adalah peramalan permintaan obat. Dalam aplikasi ini jaringan syaraf tiruan yang digunakan adalah Backpropagation Neural Network . Fungsi aktivasi yang digunakan pada aplikasi ini adalah fungsi aktivasi sigmoid dengan arsitektur Multilayer Feed Forward. Kata kunci :Jaringan Syaraf Tiruan,Multivariate, Backpropagation.
1. Pendahuluan Time series atau data deret waktu merupakan suatu deretan observasi yang diambil secara berurutan berdasarkan waktu dengan interval yang sama. Dalam memodelkan data time series, tidak cukup hanya dengan satu variabel saja, karena pada dasarnya suatu variabel dapat dipengaruhi oleh variabel lain. Metode time series yang dikenalkan oleh Box dan Jenkins pada tahun 1970-an adalah model linear, akan tetapi banyak teori yang menyatakan hubungan antar variabel dalam kasus riil adalah nonlinear. Pada tahun 1990-an berkembang model-model nonlinear, diantaranya adalah model Jaringan Syaraf Tiruan (Neural network). Fleksibilitas dalam model Jaringan Syaraf Tiruan yang memungkinkan memasukkan variabel lain dalam model peramalan, tentunya akan memberikan hasil yang lebih dapat menggambarkan situasi yang ada. Obat merupakan salah satu kebutuhan paling penting pada sebuah rumah sakit. Kesehatan pasien pada suatu rumah sakit tergantung pada ketersediaan obat. Oleh karena itu pihak rumah sakit harus menyediakan obat dalam jumlah yang cukup bagi pasiennya. Namun menyimpan persediaan obat dalam waktu terlalu lama juga kurang baik karena obat terdiri dari bahan-bahan kimia yang jika masa kadaluar-sanya habis akan berbahaya untuk dikonsumsi. Menurut penelitian Suryani, dkk (2008), penyediaan obat perlu di manajemen untuk menyeimbangkan antara pembelian dan penjualan obat di apotik. Banyaknya pasien yang membutuhkan obat pada suatu waktu tertentu tidaklah pasti, namun menurut penelitian yang dilakukan Saptono (2007), perkiraan besarnya volume penjualan obat pada waktu mendatang dapat dihi-tung dan dianalisis dengan menggunakan Moving Average, Weighted Moving Average, Single Exponen-tial Smoothing dan Trend. Sedangkan menurut penelitian Arna Fariza (2003), selain menggunakan pende-katan statistik, teknik peramalan time series juga dikembangkan dengan Algoritma Genetika dan Simula-ted Annealing pada distributor alat kesehatan dan obat-obatan. Berdasarkan 1
Kartika Fitriasari dan Putri Susanti
penelitian Adi Saptono dan Arna Fariza maka untuk meramalkan banyaknya penjualan obat pada waktu tertentu dapat didekati de-ngan metode klasik yaitu time series dengan Auto Regressive Integrated Moving Average (ARIMA), Weighted Moving Average (WMA), Single Exponential Smoothing, Trend, Algoritma Genetika, Simula-ted Annealing dan metode-metode lain pada neural network. Pada kasus persediaan obat, dimana antara obat yang satu mempunyai korelasi dengan obat yang lain, maka input pada model peramalan harus melibatkan variabel lain. Dalam Backpropagation Neural Network dapat disusun model peramalan dengan menasukkan data lain sehingga diharapkan mampu memodelkan data dalam kasus multivariate. 2. Model Neural Network Neural Network atau jaringan syaraf tiruan adalah salah satu representasi buatan dari otak manu-sia yang selalu mencoba untuk mensimulasikan proses pembelajaaran pada otak manusia. Backpropaga-tion merupakan algoritma pembelajaran yang terawasi dan biasanya digunakan oleh perceptron dengan banyak lapisan untuk mengubah bobot-bobot yang terhubung dengan neuron-neuron yang ada pada lapi-san tersembunyinya. Algoritma Backpropagation menggunakan error output untuk mengubah nilai bobot-bobotnya dalam arah mundur (backward). Untuk mendapatkan error ini, tahap perambatan maju (forward propagation) harus dikerjakan terlebih dahulu.(Cheng, P.J, dkk, 2000; Kusumadewi, 2004). Adapun algoritmanya adalah sebagia berikut. 1. Tiap-tiap unit input menerima sinyal xi dan meneruskan sinyal tersebut ke semua unit pada lapisan yang ada di atasnya (lapisan tersembunyi). 2. Tiap-tiap unit pada lapisan tersembunyi menjumlahkan sinyal-sinyal input berbobot (Kusumadewi, 2004; Terasvirta, dkk, 2005) n
z _inj b1j
xi vij
(1)
i 1
gunakan fungsi aktivasi untuk menghitung sinyal outputnya:
zj
f (z _inj )
dengan fungsi aktivasi tansig
z j f z _ inj
ez _inj e z _ inj ez _ inj ez _ inj
(2)
dan meneruskan sinyal tersebut ke semua unit pada lapisan yang ada di atasnya (lapisan output).Tiap-tiap unit output menjumlahkan sinyal-sinyal input berbobot: n
y _ink b2k
zi wjk
(3)
i 1
gunakan fungsi aktivasi untuk menghitung sinyal outputnya:
yk 2
f ( y _ink )
(4)
Kartika Fitriasari dan Putri Susanti
dengan fungsi aktivasi identitas
yk f y _ ink
y _ ink
(5)
dan meneruskan sinyal tersebut ke semua unit pada lapisan yang ada di atasnya (lapisan output).
v11
x1
z1
x2
z2
y1 yk y2
zj
yk
w11
x3
vij
xi
wjk
b1j input
b2k Hidden layer
output
Gambar 1 Arsitektur Jaringan Backpropagation Arsitektur jaringan Backpropagation seperti terlihat pada Gambar 1 dimana jaringan terdiri atas i unit (neuron) pada lapisan input, yaitu x1 , x2 , x3 dan xi bobot input yaitu v11, v12 , ... vij ; bobot bias input yaitu b11, b12, ... b1j; dengan satu lapisan tersembunyi yang terdiri dari j neuron yaitu z1 , z2 , ... z j bobot lapisan tersembunyi yaitu w11, w12, ... wjk ; bobot bias lapisan tersembunyi yaitu b21, b22, ... b2k serta k unit pada lapisan output yaitu y1 , y2 , ... yk . (Kusumadewi, 2004). 3. Kriteria Pemilihan Model Terbaik Kriteria pemilihan dalm menentukan model terbaik terdiri dari kriteria data training dan data testing. Kriteria data training meliputi penggunaan kriteria Akaike’s Information (AIC) dan Schwaz’s Bayesian (SBC) yang memiliki nilai terkecil. Berikut akan diuraikan cara perhitungan nilai kriteria AIC, SBC, dan BIC pada persamaan (6) sampai dengan (7). (Lutkepohl, 2005) 1. Nilai AIC dirumuskan sebagai
AIC p logdet
~ u
p
2 2 pK p
(6)
logT 2 pK T
(7)
2. Nilai SBC dirumuskan sebagai
SBC p logdet
~ u
3
p
Kartika Fitriasari dan Putri Susanti
Kriteria data testing yang digunakan adalah berdasarkan nilai Mean Absolut Percentage Error (MAPE) dan Root Mean Square Error (RMSE) terkecil yang dapat dirumuskan sebagai berikut. 1 n Yt Yˆt (8) MAPE 100% nt 1 Yt dan
RMSE
1 n (Y Yˆ )2 . nt1 t t
(9)
4. Metodologi Penelitian Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari rumah sakit ‘X’ Surabaya. Data tersebut adalah data harian penjualan obat ‘I’, ‘J’ dan ‘K’ pada apotik rumah sakit ‘X’ Surabaya dari 1 Januari 2008 sampai dengan 21 April 2008. Obat ‘I’ merupakan obat resep (golongan G) yang dikemas dalam bentuk tablet 500 mg. Indikasi obat ini untuk NIDDM (diabetes meli-tus yang tidak bergantung dengan Insulin) : terapi tunggal atau dikombinasi dengan antidiabetik oral lain-nya. Dan untuk NIDDM & IDDM (diabetes melitus yang bergantung dengan Insulin). Obat ‘J’ merupa-kan obat resep (golongan G) yang dikemas dalam bentuk tablet 500 mg. Obat ini memiliki indikasi untuk menurunkan kadar kolesterol total dan kolesterol LDL pada hiperkolesterolemia primer dan sekunder. Karena obat J merupakan obat untuk hiperkolesterolemia, dimana hiperkolesterolemia meliputi pe-nyakit seperti diabetes melitus yang tidak terkontrol, hipotiroid, sindrom nefrotik, disproteine-mia, penyakit hati obstruktif, terapi dengan obat lain, alkoholism maka obat ini dapat pula dikon-sumsi oleh penderita diabetes yang mengkonsumsi obat I. Obat ‘K’ merupakan obat bebas (golong-an B) yang dikemas dalam bentuk tablet 5000 mg. Indikasi obat ini untuk pengobatan penunjang pada hepatitis, polineuritis (degenerasi saraf-saraf tepi secara serentak dan simetris) toksis dan non toksis. Me-nurut Whetherill dan Kereiakes (2001) serta Bull dan Morrell (2005) meningkatnya kolesterol dapat memperparah resiko diabetes begitu pula sebaliknya sehingga selain mengkonsumsi obat I untuk diabe-tes, pasien juga mengkonsumsi obat J untuk menurunkan kadar kolesterol. Dan menurut Tjokropra-wiro (1988) karena tingginya kadar gula dalam darah, maka hal tersebut akan merusak urat syaraf pende-rita diabetes. Kelainan urat syaraf akibat diabetes disebut neuropati diabetik. Gejalanya seperti kesemu-tan, kram, rasa tebal dan panas pada kaki serta penderita akan pincang (polineuropati diabetik). Sehingga untuk mengatasi kerusakan syaraf akibat diabetes dan mengatasi efek samping dari obat J diperlukan vita-min yang terkandung dalam obat K. Metode analisis data yang digunakan dalam penelitian ini adalah membagi data menjadi dua yaitu data training dan data testing. Data training adalah data yang digunakan untuk membentuk model sebanyak 100 data sedangkan data testing adalah data yang digunakan untuk mengecek ketepatan model sebanyak 12 data. Kemudian menginterpo-lasi data training yang missing untuk dibuat model Backpropagationnya. Setelah itu melakukan peramalan untuk data testing dengan metode Backpropagation. Untuk melakukan pemilihan model terbaik data training dengan kriteria pemilihan mode AIC dan SBC sedangkan untuk data testing dengan kriteria MAPE dan RMSE. 4
Kartika Fitriasari dan Putri Susanti
Langkah metode Backpropagation secara rinci sebagai berikut. a. Menentukan input, jumlah neuron pada hidden layer, bobot dan fungsi aktivasi yang akan digunakan untuk membentuk model Backpropagation. b. Membuat model Backpropagation dengan data training. c. Melakukan peramalan untuk data testing dengan metode Backpropagation d. Memilih model terbaik berdasarkan kriteria testing e. Membandingkan kebaikan peramalan pada metode Backpropagation untuk data testing dengan kriteria MAPE dan RMSE 5. Statistik Deskriptif Deskripsi secara statistik dari data menunjukkan bahwa nilai rata-rata data selama 100 hari untuk penjualan obat I, J, dan K terdapat data missing. Sehingga data yang missing dicari terlebih dahulu dengan interpolasi. Selain itu interpolasi dilakukan karena penyebab data missing tidak dapat diketahui. Tabel 1 Deskriptif Statistik Setelah Interpolasi Koefisien Variabel Mean StDev Min Max Variasi I 406,6 302,5 5 1485 74,39 J 495,4 272,8 5 1055 55,08 K 766,7 464,8 10 2012 60,62 Dari hasil interpolasi didapatkan deskriptif data secara keseluruhan sebagai berikut. Variabel penjualan obat I mengalami nilai penjualan terendah, sebesar 5 tablet pada 3 Februari 2008 dan pada 16 Maret 2008.Variabel penjualan obat J mengalami nilai penjualan terendah, sebesar 5 tablet pada 7 Februari 2008. Variabel penjualan obat K mengalami nilai penjualan terendah, sebesar 10 tablet pada 16 Maret 2008. Variabel penjualan obat I mencapai nilai penjualan tertinggi, sebesar 1486 tablet pada 15 Januari 2008. Variabel penjualan obat J mencapai nilai penjualan tertinggi, sebesar 1900 tablet pada 1 Januari 2008. Variabel penjualan obat K mencapai nilai penjualan tertinggi, sebesar 2012 tablet pada 27 Maret 2008. yakni 2012 pada 27 Maret 2008. Plot data dapat dilihat secara ringkas pada Gambar 2. Time Series Plot of J
Time Series Plot of I
2000
1000
1400 1200
1500
800
J
800 600
600
K
1000
I
Time Series Plot of K
1200
1600
1000
400
400
500
200
200
0
0
0
08 2008 08 08 08 08 08 08 08 08 08 /20 / /20 /20 /20 /20 /20 /20 /20 /20 /20 /01 0/01 /01 /01 /02 /02 /02 /03 /03 /03 /04 01 1 20 30 09 19 29 10 20 30 09 Tanggal
08 08 08 08 08 08 08 08 08 08 08 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /01 0/01 /01 /01 /02 /02 /02 /03 /03 /03 /04 01 1 20 30 09 19 29 10 20 30 09 Tanggal
08 08 08 08 08 08 08 08 08 08 08 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /20 /01 0/01 /01 /01 /02 /02 /02 /03 /03 /03 /04 01 1 20 30 09 19 29 10 20 30 09 Tanggal
(a) (b) (c) Gambar 2. Time Series Plot untuk Data (a). Penjualan obat I, (b). Penjualan obat J, dan (c). Penjualan obat K 6. Pemodelan Backpropagation Neural Network Pemodelan Backpropagation diterapkan untuk mendapatkan arsitektur terbaik untuk peramalan. Pemilihan arsitektur terbaik ini dilakukan dengan menentukan kombinasi terbaik dari input dan jumlah unit pada hidden layer. Input yang digunakan dalam pemodelan data penjualan 5
Kartika Fitriasari dan Putri Susanti
obat ini menggunakan berbagai cara yaitu berdasarkan input lag musiman 7 dan 14, dan lag-lag yang keluar pada PACF sete-lah differencing 7 dan 14. Dari kelima model yang diuji, model yang sesuai ada dua yaitu model model NN(5,1,3) dengan input lag PACF dengan differencing karena model tersebut mempunyai nilai AIC, SBC terkecil yang memenuhi asumsi kebaikan model. Untuk data testingnya model NN(5,1,3) memiliki satu kriteria kebaikan model terkecil MAPE untuk untuk obat I maka selanjutnya peneliti menggunakan model NN(5,1,3) dalam menentukan nilai ramalan periode dua belas hari ke depan. Nilai AIC, SBC, MAPE dan RMSE untuk kedua model disajikan secara lengkap pada Tabel 2. Hasil peramalan dari model NN(5,1,3) dapat dilihat pada Tabel 3. Tabel 2. Kriteria Model Berdasarkan AIC dan SBC AIC SBC MAPE RMSE I 431,33 1396,01 NN(21,4,3) J 35,14 36,94 227,45 1333,03 K 1179,31 115,80 I 287,38 1204,06 NN(42,1,3) J 38,01 38,41 2121,80 65,05 K 119,00 1023,13 I 292,23 1077,79 NN(8,1,3) J 12,91 12,33 129,85 1969,74 K 360,66 975,76 I 1204,29 286,72 NN(5,1,3) J 12,88 12,25 270,82 1731,17 K 303,98 1941,86
Tabel 3. Data Hasil Peramalan Tanggal 26/3/08 27/3/08 28/3/08 29/3/08 30/3/08 31/3/08 1/4/08 2/4/08 3/4/08 4/4/08 5/4/08 6/4/08
I 526 322 526 322 322 322 322 322 526 322 526 322
NN(5,1,3) J K 744 1211 387 615 744 1211 387 615 387 615 387 615 387 615 387 615 744 1211 387 615 744 1211 387 615
7. Kesimpulan Dan Saran Berdasarkan analisis data dan pembahasan, kesimpulan penelitian ini adalah model Backpropagation yang sesuai adalah model NN(5,1,3) dengan input lag PACF dengan 6
Kartika Fitriasari dan Putri Susanti
differencing karena model tersebut mempunyai nilai SBC terkecil. Untuk data testingnya model NN(5,1,3) memiliki satu kriteria kebaikan model terkecil MAPE untuk untuk obat I. Karena ratarata error model Backpropagation masíh cukup besar, kemungkinan masih ada metode lain yang lebih sesuai untuk menyelesaikan kasus ini. Salah satu model yang mungkin bisa digunakan adalah model Back-propagation dengan tambahan variabel lain untuk penelitian selanjutnya.
8. Daftar Pustaka Bull, E. dan Morrell, J. (2005), Simple Guide Kolesterol. Erlangga : Jakarta. Cheng, P. J. and Lin, S. C. (2000), Using neural networks to predict bending angle of sheet metal formed by laser, International Journal of Machine Tools and Manufacture, 40 (8), Pages 1185-1197 Fariza, A. (2003). Perbandingan Kinerja Algoritma Genetika, Simulated Annealing dan Metode Statistik Moving Average untuk Peramalan Penjualan Time Series, EEPIS Journal Online System, 8 (1) Hair, dkk. (2006). Multivariate Data Analysis, 5rd ed. Prentice Hall : New Jersey. Kusumadewi, S. (2004). Membangun Jaringan Syaraf Tiruan Menggunakan Matlab dan Excel Link.Yog-yakarta : Graha Ilmu Saptono, A. (2007). Analisis Peramalan Penjualan Kaitannya Dalam Perencanaan Laba Obat Herba Pa-da Pt Na-Tura Health Center Di Depok, Tugas Akhir, Strata 1 Fakultas Ekonomi yang tidak di-publikasikan, Universitas Gunadarma Suryani, A., Hasanbasri, M., dan Priyatni, N. (April 2008). Pelaksanaan Kebijakan Obat Generik Di Apo-tik Kabupaten Pelalawan Propinsi Riau, disertasi, Magister Kebijakan dan Manajemen Pelayan-an Kesehatan yang tidak dipublikasikan, Universitas Gajah Mada. Terasvirta, T., Van Dijk., dan Medeiros, Marcelo C. (2005). Linear models, smooth transition autoregres-sions, and neural networks for forecasting macro economic time series: A reexamination, Inter-national Journal of Forecasting, 21 (4), 755-774 Tjokroprawiro, A. (1988). Diabetes Millitus Dan Macam-Macam DIIT-Diabetes B, B1, B dan B1, Puasa, B2, B3 dan Be. Edisi kesebelas. Airlangga University Press : Surabaya. Wei, W. W. S. (1994). Time Series Analysis Univariate and Multivariate Methods. Addison Wesley Pub-lishing Company, Inc : Canada. Wetherill, D. dan Kerelakes, D. (2001). Yang Perlu Anda Ketahui Diabetes. Elex Media Komputindo : Jakarta.
7