PERBANDINGAN METODE REGRESI LOGISTIK ORDINAL DENGAN JARINGAN SYARAF TIRUAN FUNGSI RADIAL BASIS Studi Kasus: Klasifikasi Rumahtangga Miskin Kota Pasuruan Tahun 2008 Oleh YENITA MIRAWANTI NRP. 1310201705 DOSEN PEMBIMBING DR. BRODJOL SUTIJO SUPRIH ULAMA, M.Si
SEMINAR THESIS PROGRAM MAGISTER - JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) LOGO INSTITUT TEKNOLOGI SEPULUH NOVEMBER SURABAYA 5 JANUARI 2012
OUTLINE 1. PENDAHULUAN 2. TINJAUAN PUSTAKA 3. METODOLOGI PENELITIAN 4. HASIL DAN PEMBAHASAN 5. KESIMPULAN DAN SARAN
SEMINAR TESIS – 5 JANUARI 2012
2
PENDAHULUAN (1) LATAR BELAKANG: Kemiskinan merupakan salah satu tolak ukur keberhasilan pembangunan di suatu wilayah. Pentingnya data kemiskinan sebagai salah satu acuan penentuan kebijakan pemerintah. Ketepatan sasaran dalam penentuan arah kebijakan pemerintah dalam pengentasan kemiskinan
SEMINAR TESIS – 5 JANUARI 2012
3
PENDAHULUAN (2) RUMUSAN MASALAH 1. Bagaimana mendapatkan metode yang paling optimal untuk mengklasifikasikan ruta miskin menggunakan metode regresi logistik ordinal dan JST fungsi radial basis
SEMINAR TESIS – 5 JANUARI 2012
2. Bagaimana menentukan suatu rumahtangga dalam kategori miskin melalui program aplikasi
4
PENDAHULUAN (3) TUJUAN PENELITIAN 1. Membandingkan klasifikasi ruta miskin dengan metode regresi logistik ordinal dan metode radial basis function dengan pendekatan k-mean kluster.
SEMINAR TESIS – 5 JANUARI 2012
2. Membuat GUI untuk mempermudah pengguna
5
PENDAHULUAN (4)
1. Memberikan informasi tentang kemiskinan sampai tingkat rumahtangga
3. Menambah wawasan penulis terutama tentang regresi Logistik dan RBF Neural Nerwork
SEMINAR TESIS – 5 JANUARI 2012
MANFAAT PENELITIAN
6
TINJAUAN PUSTAKA (1) KONSEP KEMISKINAN WORLD BANK
WORLD BANK
BAPPENAS
Kemiskinan absolut adalah seseorang yang hidup dengan pendapatan dibawah USD $1 per hari
Kemiskinan menengah adalah seseorang yang hidup dengan pendapatan dibawah USD $2 per hari
Kemiskinan adalah ketidakmampuan seseorang dalam memenuhi kebutuhannya (lebih pada kebutuhan dasar seseorang)
SEMINAR TESIS – 5 JANUARI 2012
7
TINJAUAN PUSTAKA (2) KONSEP KEMISKINAN
BPS
Mendefinisikan garis kemiskinan sebagai nilai rupiah yang harus dikeluarkan seseorang dalam sebulan agar dapat memenuhi kebutuhan dasar asupan kalori sebesar 2.100 kkal/hari per kapita (garis kemiskinan makanan) ditambah kebutuhan minimum non makanan yang merupakan kebutuhan dasar seseorang, yaitu papan, sandang, sekolah, dan transportasi serta kebutuhan individu dan rumahtangga dasar lainnya (garis kemiskinan non makanan).
SEMINAR TESIS – 5 JANUARI 2012
8
TINJAUAN PUSTAKA (3) PENYEBAB KEMISKINAN (menurut BKKBN)
1
2
FAKTOR INTERNAL
FAKTOR EKSTERNAL
1.Kesakitan 2.Kebodohan 3.Ketidaktahuan 4.Ketidakterampilan 5.Ketertinggalan Tehnologi 6. Ketidakpunyaan modal
1.Struktur sosial ekonomi 2. Nilai dan unsur budaya yang kurang 3. Kurangnya akses untuk memanfaat kan fasilitas pembangunan
SEMINAR TESIS – 5 JANUARI 2012
9
TINJAUAN PUSTAKA (4) PENYEBAB KEMISKINAN
Adat & Budaya suatu daerah
SEMINAR TESIS – 5 JANUARI 2012
BPS
Struktural (miskin karena mereka miskin)
10
TINJAUAN PUSTAKA (5) CONTOH PERHITUNGAN KEMISKINAN
Dimana: • IRM= indeks rumah tangga miskin • Si = skor variabel ke-i • Wi =penimbang setiap variabel
Menghasil kan interval 1-3
Text
semakin tinggi nilai indeks, semakin miskin kondisi rumahtangga yang bersangkutan
(SENSUS MISKIN JAWA TIMUR 2001 DGN 11 VAR) SEMINAR TESIS – 5 JANUARI 2012
11
TINJAUAN PUSTAKA (6)
PSE05 • 14 variabel • berdasar karakteristik rumahtangga • semakin tinggi nilai IRM, semakin miskin rumahtangga tersebut
CONTOH PERHITUNGAN KEMISKINAN
• memperbarui
PSE & PPLS
Wi=bobot variabel terpilih Xi=skor variabel IRM= indeks rumahtangga
SEMINAR TESIS – 5 JANUARI 2012
PPLS08 database PSE05 • memperbarui beberapa informasi kepala rumah tangga (KRT) • menambah data anggota rumah tangga (art)
12
TINJAUAN PUSTAKA (7) NEURAL NETWORK • Biasa disebut Jaringan Syaraf Tiruan (JTS) adalah suatu sistem •
•
pemrosesan informasi yang memiliki karakteristik jaringan syaraf biologi (Jek Siang, 2004).
mirip dengan
JTS mempunyai struktur yang sangat komplek dan mempunyai kemampuan yang luar biasa mirip dengan jaringan syaraf otak pada manusia.
Otak manusia terdiri dari banyak neuron yang akan menyampaikan sinyal. Dengan banyaknya neuron-neuron, membuat otak bisa mengenali pola, menyelesaikan perhitungan, melakukan kontrol terhadap gerak tubuh dengan cepat yang bahkan tidak bisa dilakukan oleh komputer.
SEMINAR TESIS – 5 JANUARI 2012
13
TINJAUAN PUSTAKA (8) Gambar 2.1 Struktur sederhana sebuah neuron pada otak manusia
Fausset mengemukakan bahwa bahwa proses informasi pada neural network memiliki kesamaan dengan jaringan neuron biologi SEMINAR TESIS – 5 JANUARI 2012
14
TINJAUAN PUSTAKA (9) Asumsi pada neural network:
1. Pemrosesan informasi terjadi karena banyaknya elemen-elemen sederhana yang disebut sebagai neuron. 2. Sinyal yang diterima/dikirimkan diantara neuronneuron terjadi melalui perantara/penghubung. 3. Setiap penghubung yang menghubungkan neuron satu dengan lainnya mempunyai bobot/weight yang berguna untuk memperkuat/memperlemah sinyal yang dikirim. 4. Untuk mendapatkan output, setiap neuron mempunyai fungsi aktivasi pada sinyal input yang diterima.
SEMINAR TESIS – 5 JANUARI 2012
15
TINJAUAN PUSTAKA (10)
Arsitektur jaringan Metode training/learning/ algoritma
3 karakteristik yang harus ada dalam NN
Fungsi aktivasi
SEMINAR TESIS – 5 JANUARI 2012
16
TINJAUAN PUSTAKA (11) Gambar 2.2 Model Neuron McCulloh-Pitt (a) Biological neuron (b) Mathematical model
SEMINAR TESIS – 5 JANUARI 2012
17
TINJAUAN PUSTAKA (12) (a)Adalah skema untuk jaringan neuron biologi (b)Adalah model matematis yang disusun oleh McCulloh-Pitt
Dimana: xi adalah neuron ke-i th wi adalah bobot/weight pada penghubung neuron ke-i th w = (w1, ..., wji)T dan x = (x1, ..., xji)T θ adalah treshold atau bias Ji adalah banyaknya input SEMINAR TESIS – 5 JANUARI 2012
18
TINJAUAN PUSTAKA (13) RADIAL BASIS FUNCTION (RBF) • Jaringan radial basis mempunyai satu hidden layer dengan fungsi aktivasi radial basis dan lapisan output dengan fungsi aktivasi purelin
• Jaringan syaraf radial basis biasanya membutuhkan jumlah neuron yang lebih banyak daripada jaringan feedforward (Kusumadewi,2004).
SEMINAR TESIS – 5 JANUARI 2012
19
TINJAUAN PUSTAKA (14) SIFAT-SIFAT RBF: • Pemrosesan dari input ke hiden layer bersifat non linier sedangkan dari hiden ke output bersifat linier
• Fungsi aktifasi pada hiden layer menggunakan gaussian dan pada output adalah purelin •Pada output unit sinyal dijumlahkan dengan metode Ordinary Least Square.
• Sifat jaringan satu arah (tidak bolak-balik seperti pada FFNN)
SEMINAR TESIS – 5 JANUARI 2012
20
TINJAUAN PUSTAKA (15)
Gambar 2.3 Arsitektur Dasar Jaringan Syaraf Radial Basis
SEMINAR TESIS – 5 JANUARI 2012
21
TINJAUAN PUSTAKA (16) K-mean cluster pada RBF • Salah satu cara untuk mendapatkan parameter yang optimal pada metode rbf adalah dengan menentukan kombinasi yang tepat antara jumlah variabel, dan node pada hidden layer
•Salah satu metode untuk mendapatkan jumlah node digunakan metode k-mean kluster. Keuntungan dari metode ini adalah kita bisa langsung mendapatkan nilai pusat yaitu mean dan radius yaitu standart deviasi dari setiap variabel pada setiap node.
SEMINAR TESIS – 5 JANUARI 2012
22
TINJAUAN PUSTAKA (17) REGRESI LOGISTIK ORDINAL • variabel respon lebih dari dua kategori dan memiliki tingkatan •
(Hosmer dan Lemeshow 1989), contoh: kecil-sedang-besar
rumus matematis:
P = (Y
j= | x) p= j ( x)
e 1
g j ( x)
∑e
g j ( x)
j =0 dimana: j=0,1,2,...l dengan l adalah jumlah kategori variabel respon βok = 0 k= 0,1,2,...,p,
SEMINAR TESIS – 5 JANUARI 2012
23
TINJAUAN PUSTAKA (18) PENGUJIAN PARAMETER SECARA SERENTAK
dilakukan untuk mengetahui apakah variabel prediktor berpengaruh terhadap pembentukan model secara bersama-sama. Hipotesis dari uji ini adalah:
H 0 : β1= β 2= ...= β k= 0
H1 : minimalaadaasatuanilaiaβ k ≠ 0
Statistik uji yang digunakan adalah uji Rasio Likelihood (G) L G 2 = −2 ln 1 L0
Hipotesis nol ditolak jika G > X2(db,). SEMINAR TESIS – 5 JANUARI 2012
24
TINJAUAN PUSTAKA (19) PENGUJIAN PARAMETER SECARA PARSIAL
dilakukan untuk mengetahui apakah variabel prediktor berpengaruh nyata terhadap variabel responnya. Hipotesis dari uji ini adalah:
H 0 : βk = 0 H1 : β k ≠ 0
Statistik uji yang digunakan adalah uji Wald (W) β k Wk = ( β ) SE k
2
Hipotesis nol ditolak jika SEMINAR TESIS – 5 JANUARI 2012
Wk > X 2 (α ,1)
25
TINJAUAN PUSTAKA (20) PROSEDUR KLASIFIKASI Penentuan kesalahan pengklasifikasian dapat diketahui melalui tabel klasifikasi sebagai berikut : Predicted membership
Actual membership
Total
SEMINAR TESIS – 5 JANUARI 2012
Total
n11
n12
n13
A
n21
n22
n23
B
n31
n32
n33
C
D
E
F
G
26
METODOLOGI (1) METODE PENGUMPULAN DATA 1. Program Pendataan Perlindungan Sosial Tahun 2008 (PPLS08) merupakan pemutakhiran/ updating data Rumahtangga Bantuan Langsung Tunai tahun 2005. Berbeda dengan data karakteristik kemiskinan secara makro, penentuan rumahtangga miskin tidak didasarkan pada pendekatan nilai konsumsi perkapita rumahtangga, tetapi lebih kepada karakteristik rumahtangga itu sendiri. 2. Pada PPLS08 ini memungkinkan adanya penghapusan, penggantian atau penambahan rumahtangga sasaran yang belum masuk pada PSE 2005
SEMINAR TESIS – 5 JANUARI 2012
27
METODOLOGI (2) METODE PENELITIAN 1. Inventarisasi dan persiapan data Dalam tahap ini penulis menginventarisir data baik itu data pokok maupun data pendukung yang akan berguna dalam penyusunan penelitian. 2. Pemilihan variabel Pemilihan variabel didasarkan pada ketersediaan data dan berdasarkan tinjauan pustaka dan studi literatur.
SEMINAR TESIS – 5 JANUARI 2012
28
METODOLOGI (3) DIAGRAM ALUR PENELITIAN Star
Data rumahtangga
Melakukan Klasifikasi dengan regresi logistik
Melakukan klasifikasi dengan RBFNN dengan algoritma K-Mean
Menghitung misklasifikasi
Menghitung misklasifikasi
Melakukan n-cross validasi
Memilih metode terbaik
End
SEMINAR TESIS – 5 JANUARI 2012
29
METODOLOGI (4) VARIABEL PENELITIAN
Variabel respon yang digunakan: Y = Klasifikasi rumahtangga miskin hasil PPLS 2008 yang terdiri dari: 1 = sangat miskin 2 = miskin 3 = hampir miskin Variabel prediksinya adalah: 1. Luas lantai 2. Jenis dinding rumah 3. Sumber air minum 4. Penerangan 5. Bahan bakar 6. Frekuensi makan dalam sehari 7. Kemampuan berobat ke puskesmas/polilinik 8. Lapangan pekerjaan kelapa rumahtangga 9. Pendidikan kepala rumahtangga 10. Kepemilikan aset/barang berharga 11. Persentase art yang masih sekolah 12. Dependency rasio
SEMINAR TESIS – 5 JANUARI 2012
30
METODOLOGI (4) TAHAPAN PENELITIAN Metode Regresi logistik:
1. Mempersiapkan data yang akan digunakan dalam penelitian ini. 2. Membentuk dummy variabel pada variabel prediktor 3. Meregresikan variabel respon dan prediksi yang telah di dummy-kan secara individu. 4. Melakukan pengujian parameter secara parsial untuk mengetahui variabel-variabel yang berpengaruh terhadap model secara individu. 5. Meregresikan variabel respon dan prediksi yang telah di dummy-kan secara serentak. 6. Melakukan pengujian parameter dan mencari variabel yang signifikan terhadap respon secara serentak. 7. Melakukan permodelan regresi logistik ordinal dengan menggunakan variabelvariabel yang signifikan. 8. Membentuk model logit yang terbentuk pada tahap 7. 9. Membentuk tabel ketepatan klasifikasi/pengelompokan. 10. Melihat ketepatan/akurasi pengelompokan
SEMINAR TESIS – 5 JANUARI 2012
31
METODOLOGI (5) TAHAPAN PENELITIAN RBFNN: 1. Menyiapkan data rumahtangga yang akan digunakan dalam metode ini. 2. Penentuan cluster dengan sendirinya akan menghasilkan center atau pusat dari kelompok data. 3. Penentuan bobot dilakukan untuk mendapatkan bobot pada setiap neuronnya. Pada tahap ini dibutuhkan data training dan testing. Dari 1000 data rumahtangga 800 kita jadikan data training dan 200 lainnya sebagai data testing. 4. Meneruskan sinyal input ke hidden layer dan menghitung nilai fungsi aktivasinya pada tiap hidden layer. 5. Menyusun matrik Gaussian dari hasil tahap ke empat. 6. Menghitung bobot baru (W) dengan mengalikan pseudoinverse dari matriks Gaussian, dengan vektor target dari data training. 7. Melakukan penghitungan output jaringan dengan metode Ordinary Least Square (OLS). 8. Melihat ketepatan/akurasi pengelompokan . SEMINAR TESIS – 5 JANUARI 2012
32
HASIL DAN PEMBAHASAN (1) DESKRIPSI DATA 1. JUMLAH RUTA MISKIN KOTA PASURUAN TAHUN 2008 2. PROPORSI SETIAP VARIABEL
SEMINAR TESIS – 5 JANUARI 2012
33
HASIL DAN PEMBAHASAN (2) PEMBENTUKAN MODEL LOGISTIK INDIVIDU Predictor X1 X2 X3 X4_1 X4_2 X5_1 X5_2 X6_1 X6_2 X7 X8_1 X8_2 X8_3 X8_4 X8_6 X8_7 X8_8 X8_9 X8_10 X9_1 X9_2 X9_3 X10 X11 SEMINAR TESIS – 5 JANUARIX12 2012
Coef -0,02 0,27 -0,31 0,14 -2,84 -0,28 1,42 -0,12 -0,20 0,29 1,14 -0,34 -0,88 1,49 0,67 0,96 1,15 0,62 0,88 0,19 -0,65 -2,28 -0,79 0,02 0,01
SE 0,00 0,23 0,13 0,38 0,41 0,14 1,24 0,52 0,52 0,17 0,29 1,39 1,25 0,35 0,25 0,39 0,23 0,21 0,25 0,14 0,25 0,47 0,17 0,00 0,00
Wald 21,27 1,33 5,37 0,14 49,19 4,27 1,30 0,05 0,15 2,76 15,14 0,06 0,50 18,23 7,11 5,91 24,51 8,74 12,16 1,79 6,51 23,74 22,27 29,95 14,42
P_value 0,00 0,249 0,020 0,707 0,000 0,039 0,254 0,818 0,696 0,096 0,000 0,805 0,480 0,000 0,008 0,015 0,000 0,003 0,000 0,180 0,011 0,000 0,000 0,000 0,000
34
HASIL DAN PEMBAHASAN (3) PEMBENTUKAN MODEL LOGISTIK SERENTAK Nilai statistik uji G yang diperoleh dari model ini adalah 511,393 dengan derajat bebas sebesar 25. Dengan tingkat signifikan sebesar 5 persen (0,05) dan derajat bebas 25, didapatkan nilai χ pada tabel adalah 37.65 sehingga diperoleh nilai G > χ 2
(0.05,25)
2
Berdasarkan nilai ini, maka keputusan kita adalah menolak Ho yang berarti minimal ada satu variabel prediktor yang berpengaruh terhadap variabel respon.
Untuk mengetahui variabel apa saja yang berpengaruh, perlu kita lakukan uji signifikansi parameter pada masing-masing variabel menggunakan statistik uji Wald (W). SEMINAR TESIS – 5 JANUARI 2012
35
HASIL DAN PEMBAHASAN (4) PEMBENTUKAN MODEL LOGISTIK SERENTAK Predictor Constan (1) Constan (2) X1 X2 X3 X4_1 X4_2 X5_1 X5_2 X6_1 X6_2 X7 X8_1 X8_2 X8_3 X8_4 X8_6 X8_7 X8_8 X8_9 X8_10 X9_1 X9_2 X9_3 X10 X11 X12 SEMINAR TESIS – 5 JANUARI 2012
Coef
SE
Wald
P_value
-2,150 0,299 0,014 0,396 -0,843 0,056 -3,345 0,356 1,166 0,299 0,416 0,310 1,149 -2,014 -1,434 1,786 1,007 1,282 1,659 1,016 0,629 -0,077 -1,568 -3,024 -0,553 0,024 0,009
0,766 0,763 0,005 0,293 0,176 0,411 0,449 0,179 1,439 0,628 0,627 0,214 0,344 1,934 1,415 0,432 0,304 0,463 0,291 0,258 0,299 0,172 0,313 0,554 0,212 0,004 0,003
7,883 0,154 7,390 1,833 23,026 0,019 55,551 3,941 0,657 0,226 0,440 2,103 11,146 1,084 1,027 17,132 10,994 7,673 32,455 15,558 4,421 0,201 25,133 29,847 6,804 31,504 10,097
0,005 0,695 0,007 0,176 0,000 0,891 0,000 0,047 0,418 0,634 0,507 0,147 0,001 0,298 0,311 0,000 0,001 0,006 0,000 0,000 0,036 0,654 0,000 0,000 0,009 0,000 0,001
36
HASIL DAN PEMBAHASAN (5) Dari pembentukan model secara individu dan serentak diketahui bahwa variabel yang berpengaruh terhadap ruta miskin adalah: 1. Variabel luas lantai (X1) 2. Variabel sumber air minum kemasan/ledeng/pompa/sumur atau mata air terlindung yang lain dibandingkan sumber air minum lainnya (X3_2) 3. Variabel listrik dengan meteran dibandingkan dengan sumber penerangan lainnya (X4_2) 4. Variabel bahan bakar minyak tanah dibandingkan dengan lainnya (X5_2) 5. Variabel kepala rumahtangga yang bekerja di sektorpertanian, perikanan, industri(kerajinan), konstruksi, angkutan, perdagangan dan jasa, serta lapangan usaha lainnya (X8-1, X8_4, X8_6, X8_7, X8_8, X8_9, X8_10) 6. Variabel pendidikan sederajat SMP dan sederajat SMA diabndingkan dengan pendidikan SD atau yang tidak sekolah( X9_2, X9-3) 7. Variabel yang tidak punya aset dibandingkan dengan yang punya aset( X10) 8. Variabel persentase anggota rumahtangga yang masih sekolah (X11) 9. Variabel angka ketergantungan (X12).
SEMINAR TESIS – 5 JANUARI 2012
37
HASIL DAN PEMBAHASAN (6) PEMBENTUKAN MODEL LOGISTIK SIGNIFIKAN Predictor Const(1) Const(2) X1 X3 X4_D1 X4_D2 X5_D1 X5_D2 X8-1 X8_2 X8_3 X8_4 X8_6 X8_7 X8_8 X8_9 X8_10 X9_D1 X9_D2 X9-D3 X10 X11 SEMINAR TESIS –X12 5 JANUARI 2012
Coef -1,67 0,77 0,01 -0,92 0,04 -3,37 0,36 0,81 1,11 -1,78 -1,55 1,73 0,98 1,27 1,64 1,00 0,58 -0,07 -1,52 -2,97 -0,51 0,02 0,01
SE 0,47 0,47 0,01 0,17 0,41 0,45 0,18 1,32 0,34 1,92 1,41 0,42 0,30 0,46 0,29 0,26 0,30 0,17 0,31 0,55 0,21 0,00 0,00
Wald 12,32 2,66 7,84 28,84 0,01 56,90 4,04 0,38 10,58 0,86 1,21 16,66 10,44 7,59 32,17 15,21 3,83 0,15 23,94 29,50 6,12 31,27 10,42
P_value 0,000 0,103 0,005 0,000 0,918 0,000 0,044 0,539 0,001 0,354 0,272 0,000 0,001 0,006 0,000 0,000 0,050 0,703 0,000 0,000 0,013 0,000 0,001
38
HASIL DAN PEMBAHASAN (7) KETEPATAN KLASIFIKASI 1.
DATA TRAINING
Ketepatan Kategori
Y
Total
Klasifikasi
1
2
3
1
192
72
7
271
70.85
2
89
130
54
273
47.63
3
10
52
194
256
75.78
291
254
255
800
64.50
Total
2. DATA TESTING Ketepatan
Yhat Kategori
Y
Total
Klasifikasi
1
2
3
1
0
0
61
61
0
2
0
0
63
63
0
3
0
0
76
76
100
0
0
200
200
38
Total
SEMINAR TESIS – 5 JANUARI 2012
39
HASIL DAN PEMBAHASAN (8) PEMBENTUKAN MODEL RADIAL BASIS FUNCTION
1. Dengan k-mean cluster ditetapkan jumlah kelas sebanyak 3 sehingga jumlah node pada lapisan hidden layer adalah 3 buah. 2. Berikut nilai mean dan standart deviasinya: nilai mean Prediktor X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
Kluster 1 28,823 1,030 1,189 2,171 1,299 2,323 2,000 8,311 1,756 1,884 13,610 39,902
SEMINAR TESIS – 5 JANUARI 2012
nilai standart deviasi
Kluster 2 26,564 1,034 1,420 2,070 1,289 2,430 1,000 7,960 1,620 1,954 16,805 39,460
Kluster 3 41,003 1,216 1,635 2,689 1,596 2,701 1,021 8,069 1,883 1,530 14,287 29,373
Prediktor X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
Kluster 1 13,366 0,172 0,393 0,527 0,472 0,575 0,100 2,873 0,852 0,321 19,160 30,599
Kluster 2 13,075 0,181 0,494 0,375 0,458 0,527 0,100 2,791 0,695 0,209 19,879 28,540
Kluster 3 19,007 0,412 0,482 0,477 0,498 0,459 0,143 2,507 0,874 0,500 18,415 25,941
40
HASIL DAN PEMBAHASAN (9) ARSITEKTUR MODEL RADIAL BASIS FUNCTION
SEMINAR TESIS – 5 JANUARI 2012
41
HASIL DAN PEMBAHASAN (10) MATRIK GAUSSIAN YANG TERBENTUK 2 1 x − 28,82 2 x − 1,03 2 x − 1,19 2 39,90 x − 3 1 2 12 = + H1 exp ... + + 2 13,37 0.17 0,39 30,60
1 x − 26,56 2 x − 1,03 2 x − 1, 42 2 x − 39, 46 2 = + 2 + 3 H 2 exp 1 ... + 12 2 13,07 0,18 0, 49 28,54 2 1 x − 41, 00 2 x − 1, 22 2 x − 1, 63 2 x − 29,37 3 1 2 12 = + + H 3 exp ... + 2 19, 01 0, 41 0, 48 25,94
SEMINAR TESIS – 5 JANUARI 2012
42
HASIL DAN PEMBAHASAN (11) NILAI TAKSIRAN PARAMETER Kategori 1 9.4663
Kategori 2 -2.9279
Kategori 3 -6.5383
-24.4415
-19.0533
43.4949
15.8247
0.6793
0.3024
0.3471
KETEPATAN KLASIFIKASI Kategori 1 2 3 Total
-16.5040 0.3505
Ketepatan Data Training
Ketepatan Data Testing
(%) 68,63 65,88 68,00 67,48
(%) 70.00 68.50 62.00 67,08
SEMINAR TESIS – 5 JANUARI 2012
43
HASIL DAN PEMBAHASAN (12) BERDASARKAN TABEL KETEPATAN KLASIFIKASI MAKA: 1.
2.
Berdasarkan uraian di atas diketahui bahwa dengan menggunakan metode regresi logistik, ketepatan klasifikasi data data testing adalah sebesar 38 persen sedangkan ketepatan klasifikasi data testing pada metode RBF adalah sebesar 67,08 persen. Sehingga bisa kita simpulkan bahwa metode RBF memberikan tingkat akurasi yang lebih baik daripada metode regresi logistik ordinal.
Untuk lebih memastikan hasil yang diperoleh dilakukan 10-fold cross validasi.
SEMINAR TESIS – 5 JANUARI 2012
44
HASIL DAN PEMBAHASAN (13) HASIL 10 FOLD-CROSS VALIDASI Regresi Logistik
RBF_Design
(%)
(%)
1
25,50
68,19
2
31,00
67,92
3
37,50
69,59
4
34,00
67,19
5
38,00
67,09
6
27,50
76,74
7
34,00
69,19
8
35,50
67,03
9
36,50
67,38
10
35,50
67,33
Rata-rata
33,50
68,77
Percobaan
SEMINAR TESIS – 5 JANUARI 2012
45
HASIL DAN PEMBAHASAN (14) 1. Dari tabel di atas terlihat bahwa dengan adanya sepuluh kali percobaan, pada setiap percobaan menujukkan bahwa tingkat akurasi metode radial basis function lebih baik daripada metode regresi logistik ordinal. 2. Hasil dari 10 fold-validasi menunjukkan rata-rata tingkat akurasi metode regresi logistik ordinal sebesar 33,50 persen dan metode radial basis function sebesar 68,77 persen. Berdasarkan simulasi perhitungan di atas bisa disimpulkan bahwa metode radial basis function dengan pendekatan k-mean cluster lebih baik daripada metode regresi logistik ordinal.
SEMINAR TESIS – 5 JANUARI 2012
46
HASIL DAN PEMBAHASAN (15) PEMBENTUKAN GUI PADA METODE RBF
SEMINAR TESIS – 5 JANUARI 2012
47
KESIMPULAN (1) KESIMPULAN 1. Dengan metode regresi logistik ordinal diketahui variabel yang berpengaruh terhadap respon yaitu variabel X1, X2, X3, X4_2, X5_1, X8_1, X8_4, X8_6, X8_7, X8_8, X8_9, X8_10, X9_2, X9_3, X10, X11, dan X12 sehingga diperoleh model logit sebagai berikut: 2. Permodelan menggunakan metode radial basis function dengan pendekatan k-mean cluster memberikan tingkat akurasi yang lebih baik dari pada metode regresi logistik ordinal dimana ketepatan klasifikasi pada data testing dengan metode RBF sebesar 67.08 dan ketepatan klasifikasi metode regresi logistik ordinal sebesar 38 persen. 3. Dengan 10 – fold cross validasi diperoleh hasil rata-rata tingkat akurasi metode regresi logistik ordinal sebesar 33,50 persen sedangkan tingkat akurasi metode radial basis function dengan pendekatan k-mean cluster adalah sebesar 68,77 persen. Berdasarkan perhitungan ini bisa diambil kesimpulan bahwa metode radial basis function dengan pendekatan kmean cluster merupakan metode yang lebih baik dibandingkan regresi logistik ordinal. SEMINAR TESIS – 5 JANUARI 2012
48
DAFTAR PUSTAKA (1) DAFTAR PUSTAKA
Agresti, Alan, (1990), Categorical Data Analysis, John Wiley and Sons, Inc, New York. Ai Nuraeni (2009), Feed-Forward Neural Network untuk Small Area Estimation Pada Kasus Kemiskinan, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Bappenas (2004), Laporan Akhir Studi Sistem Perlindungan Sosial Penduduk Miskin, Bappenas, Jakarta Badan Pusat Statistik (2000), Pengembangan Kegiatan Analisis, Indikator Kemiskinan, Dan IPM: Antara Pusat dan Daerah, BPS, Jakarta. Badan Pusat Statistik (2008), Pendataan Program Perlindungan Sosial 2008, Pedoman Pencacah, BPS, Jakarta. Badan Pusat Statistik (2009), Analisis Kemiskinan, Ketenagakerjaan Dan Distribusi Pendapatan, BPS, Jakarta. Jong Jek Siang (2009), Jaringan Syaraf Tiruan & Pemrogramannya Menggunakan Matlab, 2nd Edition, Penerbit Andi, Yogyakarta. Haralambos Sarimveis, Philip Doganis, Alex Alexandridis (2005), A classification technique based on radial basis function neural networks, Advances in Engineering Software 37 (2006) 218–221 Johnson, R. A. Dan Wichern, D. W. (1992), Applied Multivariate Statistical Analysis, Prentice Hall, New Jersey. Kuncoro, Mudrajat (2004). Lecture 9 Regresi Logistik dan Determinan. Bahan Ajar Fakultas Ekonomi dan Pasca Sarjana UGM Laurene Fausett, Fundamentals of Neural Networks Architectures, Algorithms,and Application. L. Bruzzone, D. Fern_andez Prieto (1999), An incremental-learning neural network for the classi®cation of remote-sensing images, Pattern Recognition Letters 20 (1999) 1241±1248 Muhammad Erwin Ashari Haryono (2005), Pengenalan Huruf Menggunakan Model Jaringan Saraf Tiruan Radial Basis Function Dengan Randomize Cluster Decision, Seminar Nasional Aplikasi Teknologi Informasi, Yogyakarta. SEMINAR TESIS – 5 JANUARI 2012
49
DAFTAR PUSTAKA (2) P. Dhanalakshmi, S. Palanivel, V. Ramalingam (2008), Classification of audio signals using SVM and RBFNN, journal homepage: www.elsevier.com/locate/eswa. PK Dash and SR Samantray (2004), An Accurate Fault Calssification Algorithm Using a Minimal Radial Basis Function Neural Network, Journal Published in Engineering Intelijent Systems, 2004, Vol 4, P205 - 2010 Siti Wahyuningrum (2009), Pendekatan MARS Untuk Ketepatan Klasifikasi Desa/Kelurahan Miskin di Kalimantan Timur Tahun 2005, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Sri Kusumadewi (2004), Membangun Jaringan Syaraf Tiruan Menggunakan Matlab & Exel Link, Penerbit Graha Ilmu, Yogyakarta. S. Suresh, N. Sundararajan, P. Saratchandran (2008), A sequential multi-category classifier using radial basis function networks, Journal Neurocomputing 71 (2008) 1345–1358 Vasthy Budhiarti (2010), Kalsifikasi Data Jaringan Saraf Fungsi Basis Radial, Studi Kasus: Proses Penjurusan Siswa SMS Negeri 3 Surabaya TA 2005/2006 sampai dengan TA 2008/2009, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Veerendra Singh, S. Mohan Rao (2005), Application of image processing and radial basis neural network techniques for ore sorting and ore classification, Journal Minerals Engineering 18 (2005) 1412– 1420
SEMINAR TESIS – 5 JANUARI 2012
50
LOGO