PENINGKATAN FEATURE SELECTION DENGAN WINDOWED MOMENTUM UNTUK PREDIKSI KANKER PAYUDARA

130

Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016

PENINGKATAN FEATURE SELECTION DENGAN WINDOWED MOMENTUM UNTUK PREDIKSI KANKER PAYUDARA Evy Priyanti Program Studi Komputerisasi Akuntansi AMIK BSI Jakarta Jalan RS Fatmawati No 24 Pondok Labu, Jakarta Selatan [email protected] Abstract  Breast cancer is increasing in every countries in the world, especially in developing countries like Indonesia. Neural Network is able to solve problems with the accuracy of data and not linear. Neural Network optimization tested weeks to produce the best accuracy value, applying neural network with feature selection methods such as Wrapper with Backward Elimination to raise the accuracy produced by Neural Network. Experiments conducted to obtain optimal architecture and to increase the value of accuracy. Results of the research is a confusion matrix to prove the accuracy of Neural Network before optimized by Backward Elimination was 96.42% and 96.71% after becoming optimized. This proves the estimation of feature selection trials using neural network-based method Backward Elimination more accurate than the individual neural network method. Windowed momentum can increase the classification of feature selection that gained momentum over the maximum. Intisari  Kanker payudara meningkat di setiap negara di dunia , terutama di negara-negara berkembang seperti Indonesia . Neural Network mampu memecahkan masalah dengan akurasi data dan tidak linear . Neural Network optimasi diuji minggu untuk menghasilkan yang terbaik nilai akurasi , menerapkan jaringan saraf dengan metode seleksi fitur seperti Wrapper dengan Penghapusan Mundur untuk meningkatkan akurasi yang dihasilkan oleh Neural Network. Percobaan yang dilakukan untuk mendapatkan arsitektur yang optimal dan meningkatkan nilai akurasi . Hasil dari penelitian ini adalah matriks kebingungan untuk membuktikan keakuratan Neural Network sebelum dioptimalkan oleh Backward Elimination adalah 96,42 % dan 96,71 % setelah menjadi dioptimalkan. Hal ini membuktikan estimasi uji seleksi fitur menggunakan metode berbasis jaringan saraf Backward Elimination lebih akurat dibandingkan dengan metode jaringan saraf tiruan. Windowed momentum dapat meningkatkan waktu pengklasifikasian feature selection sehingga didapat momentum yang lebih maksimal.

Kata Kunci : Data Mining, Kanker Payudara, Neural Network. PENDAHULUAN Di seluruh dunia, kanker payudara terdiri 22,9% dari semua kanker di dunia.kanker payudara meningkat di setiap negara di dunia terutama di negara-negara berkembang seperti Indonesia. Pada tahun 1940, peningkatan risiko kanker payudara pada wanita adalah 5%, atau satu dari 20 orang. The American Cancer Society memperkirakan bahwa risiko menjadi 13% pada tahun 2012, atau satu dari 8 orang akan terinfeksi. Penelitian telah menunjukkan bahwa faktor-faktor tertentu, yang disebut risiko faktor, meningkatkan kemungkinan bahwa seorang wanita akan lebih mudah terkena kanker payudara. Banyak faktor risiko yang paling penting untuk kanker payudara berada di luar kendali seperti usia, riwayat keluarga, dan riwayat kesehatan. Namun, ada beberapa faktor risiko yang dapat dicegah, Seperti berat badan, aktivitas fisik, dan mengkomsumsi alkohol (Lakshmi, 2012). Neural Network (NN) adalah teknik peramalan yang paling umum digunakan, karena NN bisa cepat dan akurat, banyak peneliti menggunakan NN untuk memecahkan masalah peramalan (Liao,2007). Neural Network mempunyai kelebihan yaitu jaringan syaraf mampu menyelesaikan problem nonlinear, mempunyai toleransi yang cukup tinggi terhadap data yang mengandung noise dan mampu menangkap hubungan yang sangat kompleks antara variabel-variabel prediktor dan outputnya, namun Neural Network juga mempunyai kekurangan yaitu adanya overgeneralisasi, dimana penggunaan jumlah data yang banyak, Neural Network melakukan dengan sangat baik untuk data pelatihan, tetapi gagal untuk melakukan dengan baik untuk data validasi. Masalah ini mungkin disebabkan oleh jumlah neuron yang berlebihan, durasi pelatihan yang berlebihan, atau alasan lain yang serupa. Generalisasi yang berlebihan terjadi ketika Neural Network, dengan algoritma pelatihan, mulai meniru fungsi yang sangat kompleks di

ISSN 1978-1946 | Peningkatan Neural Network…


tempat yang sederhana (Shukla, Tiwari & Kala, 2010). Feature Selection adalah masalah yang berterkaitan erat dengan pengurangan dimensi. Tujuan Feature Selection adalah untuk mengidentifikasi fitur dalam kumpulan data yang sama pentingnya, dan membuang semua fitur lain seperti informasi yang tidak relevan dan berlebihan. Karena feature selection mengurangi dimensi dari data, sehingga memungkinan operasi yang lebih efektif & algoritma data mining yang cepat (yaitu data algoritma mining dapat dioperasikan lebih cepat dan lebih efektif dengan menggunakan feature selection) (Maimon&Rokach,2010). Penelitian menggunakan feature selection yang pernah dilakukan oleh Yuanning Liu, Gang Wang, Huiling Chen, Hao Dong, Xiaodong Zhu & Sujing Wang tahun 2011, dimana hasil penilitan menunjukan bahwa penggunaan metode Improved feature selection (IFS) menunjukan hasil yang signifikan lebih baik daripada tiga metode lain yang digunakan dalam penelitian tersebut (GA, SVM, PSO) dalam hal akurasi prediksi dengan subset feature yang lebih kecil. BAHAN DAN METODE

Neural network terdiri dari input layer, satu atau lebih hidden layer, dan output layer. Berikut penjelasan masing-masing layer : (Vercellis, 2009) Input layer digunakan untuk menerima nilai masukan dari tiap record pada data. Jumlah simpul input sama dengan jumlah variabel prediktor. Hidden layer mentransformasikan nilai input di dalam network. Tiap simpul pada hidden layer terhubung dengan simpul-simpul pada hidden layer sebelumnya atau dari simpul-simpul pada input layer dan ke simpul-simpul pada hidden layer berikutnya atau ke simpul-simpul pada output layer. Jumlah hidden layer bisa berapa saja. Garis yang terhubung dengan Output Layer berasal dari Hidden Layer atau Input Layer dan mengembalikan nilai keluaran yang bersesuain dengan variabel prediksi.

I2

W2

I3

W3

I4

W4

I5

Data mining atau disebut juga Knowledge Discovery in Database (KDD) adalah ekstrasi pola secara otomatis mewakili pengetahuan yang disimpan atau ditangkap secara tersembunyi di dalam sebuah database besar (Han & Kamber, 2007). Berdasarkan tugasnya, data mining dikelompokkan menjadi (Larose, 2005): a). Klasifikasi, b). Estimasi, c). Prediksi, d). Clustering, e). Asosiasi. Klasifikasi (Han & Kamber, 2007) adalah proses penemuan model (atau fungsi) yang menggambarkan dan membedakan kelas data atau konsep yang bertujuan agar bisa digunakan untuk memprediksi kelas dari objek yang label kelasnya tidak diketahui. Hidden

Input 1 Hidden Output

Input 2

Hidden

Hidden

Output

Input 3

Hidden

Sumber : (Maimon & Rokach, 2010). Gambar 1. Struktur Neural Network

W1

I1

∑

t

f (x)

o

W5

Sumber : (Shukla,Tiwari & Kala, 2010) Gambar 2. Proses Neural Network Korelasi antara ketiga komponen pada persamaan di atas yaitu: Signal x berupa vektor berdimensi n (x1 ,x2,…,xn) T akan mengalami penguatan oleh synapse w (w1,w2,…,wn)T. Selanjutnya akumulasi dari penguatan tersebut akan mengalami transformasi oleh fungsi aktifasi f. Fungsi f ini akan memonitor, bila akumulasi penguatan signal itu telah melebihi batas tertentu, maka sel neuron yang semula berada dalam kondisi “0”, akan mengeluarkan signal “1”. Berdasarkan nilai output tersebut (y), sebuah neuron dapat berada dalam dua status: “0” atau “1”. Neuron disebut dalam kondisi firing bila menghasilkan output bernilai “1”. Menurut Heaton (2008), Neural Network adalah jaringan saraf yang mensimulasikan jaringan saraf biologis manusia kedalam arsitektur komputer dan arsistektur algoritma baru terhadap komputer konvensional. Hal ini memungkinkan penggunaan operasi komputasi (penambahan, pengurangan, dan elemen logika fundamental) yang sangat sederhana untuk memecahkan masalah yang kompleks, matematis yang tidak jelas, masalah nonlinear atau masalah stokastik.


131

132


Neural network adalah (Han & Kamber,2007) satu set unit input/output yang terhubung dimana tiap relasinya memiliki bobot. Neural network dimaksudkan untuk mensimulasikan perilaku sistem biologi susunan syaraf manusia, yang terdiri dari sejumlah besar unit pemroses yang disebut neuron, yang beroperasi secara paralel. Neuron mempunyai relasi dengan synapse yang mengelilingi neuronneuron lainnya. Susunan syaraf tersebut dipresentasikan dalam neural network berupa grafik yang terdiri dari simpul (neuron) yang dihubungkan dengan busur, yang berkorespondensi dengan synapse (Alpaydin,2010). Sejak tahun 1950-an (Vecellis,2009), neural network telah digunakan untuk tujuan prediksi, bukan hanya klasifikasi tapi juga untuk regresi dengan atribut target kontinu. Menurut Kohonen, neural network dibuat pertama kali oleh Warren McCulloh dan Walter Pitts pada tahun 1943 dan dianggap sebagai basis neural network modern saat ini (Gorunescu,2011). Pada tahun 1950, Rosenblatt dan peneliti lainnya membuat sebuah kelas neural network yang disebut perceptron yang merupakan model neuron biologi tapi hanya bisa menyelesaikan masalah linearly separable. Kemudian perceptron yang dihasilkan Minsky dan papert pada tahun 1969 memecahkan masalah nonlinearly separable dengan membuat multilayer network dengan unit hidden, tapi training terhadap network tidak bisa dilakukan. Multilayer perceptron (MLP) disebut juga multilayer feedforward neural network merupakan algoritma yang paling luas digunakan. Menurut Wong, Bodnovich dan Selvi pada tahun 1997,sekitar 95% aplikasi bisnis yang menggunakan neural network, memakai algoritma ini (Vecellis,2009). Salah satu algoritma yang dipakai dalam proses peramalan adalah Neural network yang merupakan satu set unit input/output yang terhubung dimana tiap relasinya memiliki bobot (Han & Kamber,2007). Bobot relasi dalam jaringan dimodifikasi untuk meminimalkan nilai Mean Square Error (MSE) antara nilai prediksi dari jaringan syaraf tersebut dilakukan dalam arah mundur, dari output layer hingga layer pertama dari hidden layer sehingga metode ini disebut backpropagation (Han & Kamber, 2007). Penemuan algoritma backpropagation untuk multilayer perceptron, merupakan metode yang sistematis untuk training sehingga bisa dilakukan dan lebih efisien. Algoritma backpropagation berasal dari learning rule Window dan Hoff, disusun oleh Werbos pada tahun 1974, dibuat oleh Parker pada tahun 1985,

Rumelhart Hinton dan Williams pada tahun 1986 dan peneliti lainnya (Maimon & Rokach, 2010).

Sumber : (Han & Kamber, 2007) Gambar 3. Arsitektur Jaringan Backpropagation Pada gambar 2.3 terdiri dari lapisan input yaitu Y1, Y2 sampai dengan Yn; seluruhnya dijumlahkan dengan bobot masing-masing dan ditambahkan bias dengan satuan j. Fungsi aktivasi yang digunakan, antara lapisan input dan lapisan tersembunyi, dan antara lapisan tersembunyi dengan lapisan output adalah fungsi aktivasi sigmoid biner. Dalam backpropagation, fungsi aktivasi yang dipakai harus memenuhi beberapa syarat yaitu: kontinu, terdiferensial dengan mudah dan merupakan fungsi tidak turun, salah satu fungsi yang memenuhi ketiga syarat tersebut sehingga sering dipakai adalah fungsi sigmoid biner yang memiliki batasan (0,1) Pelatihan backpropagation meliputi tiga fase, yaitu: Fase pertama adalah fase maju dimana pola masukan dihitung maju mulai dari layar masukan hingga layar keluaran menggunakan fungsi aktivasi yang ditentukan. Fase kedua adalah fase mundur, dimana selisih antara keluaran jaringan dengan target yang diinginkan merupakan kesalahan yang terjadi. Kesalahan tersebut dipropagasikan mundur, dimulai dari garis yang berhubungan langsung dengan unit-unit diayar keluaran. Fase ketiga adalah modifikasi bobot untuk menurunkan kesalahan yang terjadi. Ketiga fase diatas diulang-ulang terus hingga kondisi penghentian dipenuhi (jumlah iterasi atau kesalahan). Peningkatan akurasi dan performa yang ada didalam Neural network dapat dilakukan dengan pengurangan fitur yang tidak relevan (Maimon & Rokach,2010). Feature selection yang digunakan dengan metode wrapper dalam proses mundur atau Backward. Setelah dilakukan pengujian akan dianalisa dan dievaluasi dengan menggunakan Confusion matrix.



Metode Penelitian Dataset yang digunakan oleh peneliti diperoleh dari UCI Machine Learning Repository yang dibuat oleh Dr. William H. Wolberg pada 15 Juli 1992. Survei dataset dari Wisconsin Hospitals dengan total 699 data dan atribut berjumlah 11 atribut yang terdiri dari: Sample code number, Clump Thickness, Uniformity of Cell Size, Uniformity of Cell Shape, Marginal Adhesion, Single Epithelial Cell Size, Bare Nuclei, Bland Chromatin, Normal Nucleoli, Mitoses, Class (class attribute). Dataset ini akan dilatih dan diuji dengan Backpropagation. Parameter yang berpengaruh selanjutnya adalah penentuan Hidden layer. Pada dasarnya Backpropagation dengan satu Hidden layer sudah cukup untuk mampu mengenali sembarang pasangan antara input dan target. Akan tetapi, penambahan jumlah layar tersembunyi kadangkala membuat pelatihan lebih mudah (Siang, 2009). Parameter-parameter yang ada akan diukur seberapa tingkat akurasi dalam prediksi penentuan kanker payudara. Beberapa metode untuk mengukur performa dari hasil suatu prediksi dalam bentuk perhitungan kesalahan. Perhitungan kesalahan merupakan pengukuran bagaimana jaringan dapat belajar dengan baik sehingga jika dibandingkan dengan pola yang baru akan mudah dikenali. Kesalahan pada keluaran jaringan merupakan selisih antara keluaran sebenarnya dan target atau disebut metode pembelajaran Supervised learning (Maimon & Rokach, 2010). Evaluasi terhadap model yang terbentuk akan dilakukan dengan pengukuran akurasi. Akurasi diukur dengan menggunakan confusion matrix. Confusion matrix akan menggambarkan hasil akurasi mulai dari prediksi positif yang benar, prediksi positif yang salah, prediksi negatif yang benar, dan prediksi negatif yang salah (Han& Kamber, 2007). Nilai akurasi dari model akan dibandingkan antara model yang terbentuk dengan algoritma neural network dan algoritma neural network yang sudah dioptimasi. Windowed momentum dapat menentukan seberapa banyak pengaruh momentum yang harus dimiliki. Analisa performa dari algoritma windowed momentum dimulai dengan level bobot (Istook & Martinez, 2002).

Dataset Kanker Payudara

Data Preprocessing Transformasi Data Aktifasi Sigmoid

10 Folds Cross Val

Training Data 90%

Learning Method Backward

Learning Rate

Momentum

Penentuan Hidden Layer

Neural Network

Atribut-atribut kanker Payudara

Benign

Malignant

Training Windowed Momentum

Testing Data 10 %

Model Evaluation Confusion Matrix

Sumber : Hasil Penelitian (2015) Gambar 4. Model Pemikiran Penelitian Gambar 4. merupakan model pemikiran penelitian dimana data yang diperoleh dari UCI Machine Learning Repository tentang Breast Cancer pada data processing akan ditransformasi kedalam bentuk biner dalam fungsi aktivasi sigmoid, untuk dapat diproses kedalam algoritma Neural network untuk mendapatkan jaringan terbaik dari Neural network yang nantinya akan dilakukan proses feature selection dengan metode. Hasil pengujian berupa Confusion matrix dan kurva ROC. Dikarenakan fungsi aktivasi yang dipakai fungsi aktivasi sigmoid (biner), data harus ditransformasikan dulu karena batasan keluaran fungsi aktivasi sigmoid adalah [0,1], tapi akan lebih baik jika ditransformasikan ke interval yang lebih kecil, misal pada interval [0.1,0.9] (Siang,2009). Maka, pada data penentuan kanker payudara yang ada dilakukan transform data


133

134


dengan interval [0.1,0.9], dengan rumus sebagai berikut: 0. ( ) 1 0.1 x1=0.8(x-a)………………..(1) Berikut perhitungan transform dengan menggunakan fungsi aktivasi sigmoid: Berdasarkan data penentuan kanker payudara pada atribut Clump Thickness diketahui nilai minimum (a) = 1 nilai maximum (b) = 10 data kanker payudara atribut Clump Thickness yang akan di transform x=5 1

0. ( 10 1

0.

1) 1

0.1

Selanjutnya seluruh data ditransformasi dari bentuk tabel 1 menjadi tabel 2, maka didapat pola data pelatihan yang dipakai dalam bentuk aktivasi sigmoid. Aktivasi sigmoid kemudian akan diolah dengan penggabungan antara algoritma neural network, backward elimination. Setelah itu akan diuji seberapa banyak momentum yang dibutuhkan dengan windowed momentum, dengan rumus sebagai berikut: ………………..(2) Dengan windowed momentum maka bobot akan lebih jelas dalam optimasi momentum. Start

Variabel input dan target didataset

Stop

HASIL DAN PEMBAHASAN

Windowed Momentum compute

Eksperimen yang dilakukan dengan penentuan beberapa parameter penunjang seperti training cycle, learning rate, momentum dan hidden layer perlu dilakukan untuk mendapatkan hasil yang lebih akurat. Setelah itu akan muncul nilai akurasi, precision, recall, AUC (Optimistic), AUC, AUC (Pessimistic) yang didapat dari hasil eksperimen yang telah dilakukan. Penggabungan antara Neural network, Feature selection dan Windowed Momentum akan menghasilkan nilai akurasi sebesar 96.71 %, Precision 94.31%, recall 96.22%, AUC (Optimistic) 0.990%, AUC 0.990%, AUC (Pessimistic 0.990%.).

Ubah sample yang sudah dilatih

Hapus P- value

Yes

Yes

P- value > target?

Kondisi stop yang ditemukan ? No No

No No

Perbaiki model

More inputs in data set ?

Yes

Semua P- value < target?

Yes

Gambar 5 menggambarkan metode algoritma yang diusulkan dalam penelitian ini yaitu Neural Network berbasis backward elimination, pada tahap preprocessing menggunakan algoritma Backward Elimination dengan memproses variabel input dan target dataset, setiap dihasilkan sebuah bagian maka akan diseleksi dengan algoritma Neural Network yang digunakan dan dibandingkan dengan bagian terbaik sebelumnya. Salah satu parameter yang paling berpengaruh adalah penentuan bobot yang ada didalam jaringan. Bobot yang menghasilkan nilai turunan aktivasi kecil sedapat mungkin dihindari karena akan menyebabkan perubahan bobot menjadi sangat kecil, demikian pula dengan nilai bobot awal yang terlalu besar karena akan menyebabkan nilai subset menjadi sangat kecil juga. Oleh karena itu dalam standar Backpropagation bobot dan bias diisi dengan bilangan acak kecil. Jika ditemukan subset terbaik maka itulah adalah subset terbaik saat ini, perulangan evaluasi akan berakhir sampai ditemukan subset terbaik dari hasil sebelumnya. Agar jaringan dapat belajar dengan baik maka dibuatlah pola pembelajaran sehingga jika dibandingkan dengan pola yang baru akan mudah dikenali. Beberapa metode untuk mengukur performa dari hasil suatu prediksi dalam bentuk perhitungan kesalahan. Perhitungan kesalahan merupakan pengukuran bagaimana jaringan dapat belajar dengan baik. Kesalahan pada keluaran jaringan merupakan selisih antara keluaran sebenarnya dan target atau disebut metode pembelajaran Supervised learning (Maimon & Rokach, 2010).

Hitung output pada fase maju

Error = Target- output

Data(FS) Propagasi error dengan fase mundur, modifikasi bobot dan bias , layer by layer

Sumber : Hasil Penelitian (2015) Gambar 5. Algoritma Penggabungan Neural Network, Backward Elimination, windowed Momentum



135

Tabel 1. Data Kanker Payudara yang Digunakan Sample code number

Clump Thickness

1000025

Uniformity of Cell Size

Uniformity of Cell Shape

Marginal Adhesion

Single Epithelial Cell Size

1

1

1

2

5

Bare Nuclei

1

Bland Chromatin

Normal Nucleoli

3

1

Mitoses

1

Tabel 2. Data Uji Pemilihan Kanker Payudara yang Digunakan Sampl e code numb er

Clump Thickn ess

1000 025

0.455 55555 6

Unifor mity of Cell Size

Uniformi ty of Cell Shape

Margin al Adhesio n

Single Epithelial Cell Size

Bare Nuclei

Bland Chromatin

Normal Nucleoli

0.1

0.1

0.188888 889

0.1

0.2777777 78

0.1

0.1

Mitoses

0.1

Tabel 3. Nilai Bobot Akhir Untuk Hidden Layer Node

Hidden Layer (Sigmoid) A

B

C

D

E

F

G

H

I

J

Threshold

1

-1.338

2.155

1.715

5.319

0.788

2.588

4.689

-2.623

-3.202

-4.189

0.206

8.936

2.832 -2.201

1.908

2.886

3.107 0471

-4.333

2 3

3.648

2.355 1.701 1.780

-3.020

-2.376

0.084

-0.696

1.638

0.064

0.875

3.886

-4.775

0.954

-2.691

-3.250

0.432

-1.931

1.888

0.809

0.943

4 5

0.825

6.655

0.010

0.848

-4.077

0.940

-0.106

4.003

6

-0.680

-4.551

5.274

2.734

7

6.085

-1.607

3.326

-2.813

-4.263

CLASS Benign

1 -6.975

2.742

0.889

8.417

-7.045

4.007

-2.446

-3.532

Tabel 1 menunjukkan data awal dari UCI Repository tentang Breast Cancer yang kemudian diubah ke bentuk aktivasi Tabel 2. dengan aktivasi sigmoid supaya data dapat diuji dan dilatih. Setelah data diubah menjadi bentuk aktivasi sigmoid maka akan didapat nilai untuk tiap bobot pada setiap node. Untuk output didapat nilai bobot sesuai dengan output layer yang ada seperti output untuk benign pada hidden layer satu bernilai -6.975, pada hidden

-3.970

6.989

3.961

5.835

-2.691

-1.198

5.685

0.532

-8.047

-4.505 -4.782

-5.556

Tabel 4. Nilai Bobot Akhir Untuk Output Layer OUTPUT SIGMOID 2 3 4 5 6 8.313 3.507 3.995 -6.988 8.046

Malignant 6.975 -8.314 Sumber : Hasil Penelitian (2015)

3.683

-3.685

0.680 -1.604

-6.238

THRESHOLD 7 3.258

-5.837

-3.260

5.838

layer dua bernilai 8.313, pada hidden layer tiga 3.507 dengan nilai bias -5.837. Bobot untuk output Malignant pada hidden layer satu bernilai 6.975, pada hidden layer dua bernilai -8.314, pada hidden layer tiga -3.532 dengan nilai bias 5.838. Setelah semua nilai bobot diketahui maka akan diuji nilai akurasi pada data penentuan jenis kanker payudara dengan menggunakan Rapidminer, berikut nilai akurasi terbaik yang didapat:


136


Tabel 5. Nilai Akurasi Terbaik Trainin Learning Moment Size Akur g Cycle Rate um asi 500 0.3 0.2 7 96.42 Sumber : Hasil Penelitian (2015) Nilai akurasi yang terbaik yang terbentuk adalah 96.42% dengan nilai Training Cycle 500, Learning Rate 0.3, Momentum 0.2 dan Size hidden layer sebanyak 7.

Sumber : Hasil Penelitian (2015) Gambar 6. Hasil Akurasi Neural Network Pada RapidMiner Setelah data diolah dengan beberapa parameter yang ada didapatkan hasil arsitektur jaringan yang dianggap terbaik yaitu dengan nilai akurasi yang paling besar, sebagai berikut:

hidden layer. Inisialisasi bobot secara acak untuk input, hidden dan bias. Untuk setiap data pada data training pada tabel 1, dihitung input untuk simpul berdasarkan nilai input dan bobot jaringan saat itu, kemudian berdasarkan nilai input yang didapat untuk membangkitkan output untuk simpul dengan fungsi aktivasi. Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya. Selanjutnya backpropagated yaitu balik ke layer sebelumnya. untuk menghitung error pada hidden layer (hal ini untuk perbaharui bobot pada relasi). Hasil perhitungan akhir backpropagation fungsi aktivasi untuk simpul pada hidden layer terdapat pada tabel 3. Nilai akhir pada output layer dihitung menggunakan fungsi aktivasi linear terdapat pada tabel 2. Eksperimen neural network berbasis backward elimination spesifikasi pada backward elimination yaitu pemilihan pada feature selection (optimize selection) dengan selection direction terdiri dari forward elimination dan backward elimination yang akan dipilih kemudian ditentukan limit generation without improval dan generation without improval sebanyak 1, tanpa disertai limit number of generation dan keep best sebanyak 1. Hasil eksperimen untuk menentukan hasil akurasi terbesar pada hidden layer 1 penggabungan antara neural network dan backward elimination terdapat pada training cycle 500, learning rate 0.3, momentum 0.2, Hidden layer 7 dengan nilai akurasi 96.71%.

Sumber : Hasil Penelitian (2015) Gambar 7. Arsitektur Jaringan yang didapat dari Hasil Eksperimen Neural Network Arsitektur jaringan hasil eksperimen seperti yang terlihat pada gambar 7. dimana pada jaringan tersebut terdiri dari input layer dengan jumlah neuron 10, hidden layer dengan jumlah neuron 7, dan output layer dengan 2 neuron. Node bias (threshold) terdiri dari 2 , yaitu terdiri dari 1 node bias pada input layer dan 1 node bias

Sumber : Hasil Penelitian (2015) Gambar 8. Plot Nilai Bobot Setiap Atribut Pada Hidden Layer 1 ukuran 3



Pada gambar 8. menunjukan, atribut yang dipakai setelah Neural Network berbasis backward Elimination di jalankan dengan hidden layer 1 dengan ukuran 7 maka, setiap atribut terlihat memiliki ukuran weight yang berbedabeda Implementasi dataset hasil Backward Elimination kedalam metode Neural Network, hal ini guna mendapatkan arsitektur jaringan yang terbaik.Setelah didapatkan arsitektur jaringan yang terbaik dari hasil eksperimen adalah sebagai berikut:

peningkatan dengan feature selection berbasis backward elimination, dimana nilai akurasi naik menjadi 96.71%, precision 94.31% dan recall 96.22%.

Sumber : Hasil Penelitian (2015) Gambar 11. Hasil Akurasi untuk Neural Network dan Backward Elimination Perhitungan Akurasi, Precision, Recall dan F-Measure sebagai berikut : 2 2

Akurasi =

2 2 1

Precision = Recall Sumber : Hasil Penelitian (2015) Gambar 9. Performance Vector yang Didapat Dari Hasil Eksperimen Neural Network Gambar 9. menunjukkan Performance vector yang didapat dari hasil eksperimen neural network, dan mendapatkan hasil akurasi sebesar 96.42%.

Sumber : Hasil Penelitian (2015) Gambar 10. Performance Vector yang Didapat Dari Hasil Eksperimen Neural Network Dengan Backward Elimination Performance Vector yang ditampilkan pada gambar 10. menunjukkan bahwa nilai akurasi dataset kanker payudara mengalami

=

2 2 1

2 2

2 2

F-Measure=

2 2

0.

0. 0.

2

2 (

2 0. )

0.

2 0. 2 0.

=0.952=95.2%

Sumber : Hasil Penelitian (2015) Gambar 12. AUC yang Didapat Dari Hasil Eksperimen Neural Network Dengan Backward Elimination Berdasarkan gambar 4.6 dan gambar 4.7, model yang didapat adalah model dengan pola 10-7-2 akurasi 96.71% dan terlihat kurva ROC yang ada pada AUC dan pada confusion matrix precision dan recall.


137

138


20 10 0 NN+BE

NN+BE+WM

NN+BE Sumber : Hasil Penelitian (2015) Gambar 13. ProcessLog yang Didapat Dari Hasil Eksperimen Neural Network Dengan Backward Elimination Perbandingan eksperimen yang telah dilakukan dengan metode Neural Network dan metode Neural Network berbasis Backward Elimination maka didapatkan hasil sebagai berikut: Tabel 6. Perbandingan Akurasi Trai Lear Mome Hid ning ning ntum den Cycle Rate Lay er NN+ 500 0.3 0.2 1 BE NN 500 0.3 0.2 1 Met hod

Si ze

Aku rasi

7

96.7 1% 96.4 2%

7

Berdasarkan tabel 6, Hasil penelitian menunjukkan metode jaringan syaraf tiruan berbasis backward elimination menghasilkan peningkatan akurasi 0.29% dibandingkan hanya dengan menggunakan metode jaringan syaraf tiruan saja. Akurasi yang dihasilkan dengan metode Neural Network berbasis Backward Elimination dapat meningkatkan hasil akurasi lebih tinggi yaitu 96.71% jika dibandingkan dengan Akurasi yang dihasilkan dengan metode Neural Network yaitu 96.42%. Hal ini menunjukan bahwa penentuan jenis kanker payudara dengan menggunakan Neural Network berbasis Backward Elimination lebih akurat. Windowed momentum akan melihat seberapa banyak momentum yang diperlukan, berikut perbandingannya:

Series1

20

NN+BE+W M 14

Sumber : Hasil Penelitian (2015) Gambar 14. Windowed momentum KESIMPULAN Penelitian ini dilakukan pengujian model dengan menggunakan neural network dan neural network dengan feature selection berupa metode Wrapper dengan penyeleksian berupa Backward Elimination dengan menggunakan data dari UCI yaitu Breast Cancer, setelah itu momentum akan difilter dengan Windowed Momentum agar performa dari feature selection lebih maksimal. Pada penelitian ini secara umum penerapan model NN dan BE dapat meningkatkan akurasi pada prediksi kanker payudara, akan tetapi karena keterbatasan penelitian ini perlu disarankan untuk melakukan penelitian lanjutan yang berkaitan dengan prediksi untuk mendapatkan akurasi yang lebih baik. Adapun saran-saran yang perlu diberikan yaitu: 1. Perlu dilakukan penelitian yang sejenis dengan variasi proses model misalnya dengan penambahan Cross validation. 2. Perlu dilakukan penelitian yang sejenis dengan variasi metode seleksi dalam pengklasifikasian misalnya feature selection dengan metode embedded atau filter sehingga dapat digunakan untuk perbandingan dari hasil penelitian ini. REFERENSI Alpaydin, Ethem. (2010). Introduction to Machine Learning. The MIT Press, London UK. Asliyan, Rifat. (2011). Syllable Based Speech Recognition. Computer and Information Science. Diambil dari: http://www.intechopen.com/books/spe ech-technologies/syllable-based-speechrecognition. (3 Desember 2014). Bevan, Nigel. (1997). Quality and Usability: A New Framework. National Physical Laboratory. UK.



Ciampi, Antonio. Zhang, Fulin. (2002). A New Approach to Training Backpropagation Artificial Neural Network: Empirical Evaluation on Tens Dataset on Clinical Studies. McGill University. Canada. Gorunescu, Florin. (2011). Data Mining: Concepts, Models and Techniques. Verlag Berlin Heidelberg, Springer. Jerman. Guillet, Fabrice. Hamilton, Howard J. (2007). Quality Measures in Data Mining. Verlag Berlin Heidelberg, Springer. Jerman. Han,J & Kamber, Micheline. (2007). Data Mining Concepts, Models and Techniques. Second Edition, Morgan Kaufmann Publisher. Elsevier. Heaton, Jeff. (2010). Programming Neural Networks With Encog 2 In Java. Heaton Research.Inc, USA. Hong, X., Harris, C., Brown, M., & Chen, S. (2002). Backward Elimination Methods for Associative Memory Network Pruning. Computers and Technology, (Reed 1993). Istook, Martinez. (2002). Improved Backpropagation Learning in Neural Networks with Windowed Momentum. International Journal of Neural System, Vol 12, no 3&4, pp 303-318. Kadhim, Jehan & Abdulrazzaq, Mohammad (2015). Forecasting USD/IQD Future Values According to Minimum RMSE Rate. Thi_Qar University. pg.271–285 Kohavi, R., & John, H. (1997). Artificial Intelligence Wrappers for feature subset selection. elsevier, 97(97), 273–324. Kusumadewi, Sri & Hartati, Sri. (2010). NeuroFuzzy Integrasi Sistem Fuzzy & Jaringan Syaraf. Second Edition. Yogyakarta: Graha Ilmu. Lakshmi, R, Raju Athira, Joy Teena Mary, S. Vijayalakshmi. (2012). Breast Cancer Factor Preventable and Non-Preventable. Departement of Pharmacy Practice. India. Larose, D. (2005). Discovering Knowledge in Data. New Jersey, John Willey & Sons.Inc. Liao, Warren. T. & Triantaphyllou. Evangelos. (2007). Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications. Series: Computer and Operation Research. 6. 190. Lim TS, Loh WY, Shih YS. (1999). A comparison of prediction accuracy, complexity, and training time of thirty-three old and new classification algorithms. Kluwer Academic Publishers: Boston. Liu, Huan, Yu, Lei.(2005). Toward Integrating Feature Selection Algorithms for Classification and Clustering. Department of Computer Science and Engineering. Arizona State University.

Liu, Yuaning, Wang G., Chen, M., Dong, M., Zhu, X., Wang, S. (2011). An Improved Particle Swarm Optimization for Feature Selection. College of Computer Science and Technology. China. Maimon, Oded & Rokach, Lior. (2010). Data Mining and Knowledge Discovery Handbook, Springer, New York. Myatt, Glenn J. (2007). Making sense of data : A Practical Guide to Exploratory data analysis and Data Mining. John Wiley & Sons Inc, New Jersey. Shukla, Anupam. Tiwari, Ritu. & Kala, Rahul. (2010). Real Life Application of Soft Computing. New York: Taylor and Francis Groups, LLC. Siang, Jong Jek (2009). Jaringan Syaraf Tiruan dan Pemrogramannya menggunakan MATLAB. Penerbit Andi. Yogjakarta. Vercellis,C. (2009). Business Intelligence: Data Mining and Optimization for Decision Making. Wiley. Witten,I. Frank, E., & Hall. (2011). Data Mining: Practical Machine Learning and tools. Morgan Kaufmann Publisher, Burlington. BIODATA PENULIS Evy Priyanti, M.Kom. Lahir di Jakarta, 1 Februari 1986. Kuliah DIII di AMIK BSI lulus tahun 2007. Kuliah S1 di STMIK Kuwera lulus tahun 2008. Kuliah S2 di STMIK Nusa Mandiri lulus Tahun 2015. Paper yang pernah dipublikasi : Jurnal PARADIGMA Volume : XVII Nomor 2 Bulan September Tahun 2015. Judul “Peningkatan Backward Elimination Dengan Windowed Momentum Untuk Prediksi Kontrasepsi”. Jurnal Swabumi Volume IV no 1 maret 201 . Judul “Peningkatan Neural Network Dengan Feature Selection Untuk Prediksi Kanker Payudara”


139

PENINGKATAN FEATURE SELECTION DENGAN WINDOWED MOMENTUM UNTUK PREDIKSI KANKER PAYUDARA

Recommend Documents