Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA KELAS LISTENING Novatiara Fury Pritasari 1), Hanna Arini Parhusip 2), Bambang Susanto 3) 1) Mahasiswa Program Studi Matematika FSM UKSW 2), 3) Dosen Program Studi Matematika FSM UKSW Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana Jl. Diponegoro 52-60 Salatiga 50711 1)
[email protected], 2)
[email protected], 3)
[email protected] Abstract Data pengukuran berulang (repeated measures) memiliki struktur data longitudinal. Dalam makalah ini, data longitudinal yang dianalisa adalah data hasil penyebaran kuesioner mahasiswa FBS UKSW pada 2 kelas Listening FBS UKSW yang berbeda selama 3 kali pertemuan (3 minggu). Adapun tujuan dari makalah ini adalah untuk mengetahui apakah ada perbedaan yang signifikan antara respon mahasiswa kelas Listening terhadap pertanyaan yang diteliti pada setiap kelas menggunakan one-wayrepeated measures dan dua kelas yang bebeda menggunakan two-way repeated measures. Analisis data menggunakan program SPSS 16.0 sebagai alat bantu. Berdasarkan pengujian one-way repeated measures, pada Kelas A ada perbedaan yang signifikan yaitu ada perbedaan respon minggu kedua dengan minggu ketiga. Sedangkan respon mahasiswa pada Kelas B tidak berbeda secara signifikan. Pada pengujian two-way repeated measuresada perbedaan respon Kelas A dan Kelas B, tetapi tidak ada perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi Kelas dan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Kata Kunci:One-way repeated measures, two-way repeated measures
PENDAHULUAN Pritasari dkk (2013) telah membahas perbedaan respon mahasiswa kelas Listening antar dua minggu yang berbeda dalam tiga minggu yang bertujuan untuk mengetahui perbedaan respon mahasiswa menggunakan paired comparisons. Pada pengujian tersebut disimpulkan bahwa pada kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa. Tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon. Sedangkan pada kelas B tidak ada perbedaan respon mahasiswa pada minggu ke-2 dengan minggu ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada perbedaan respon. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi 95%. Dalam makalah ini ANOVA digunakan untuk menganalisis data yang sama.ANOVA adalah suatu metode untuk menguji hipotesis kesamaan rata-rata dari tiga atau lebih populasi. Analisis terhadap data pengukuran berulang tersebut dilakukan untuk menyelidiki apakah ada perbedaan yang signifikan antara respon mahasiswa kelas Listening pada setiap kelas dan dua kelas yang berbedamenggunakan one-wayrepeated measures dan two-way repeated measures. Program SPSS 16.0 digunakan sebagai alat bantu untuk melakukan analisis data.
Makalah Pendamping: Matematika 3
233
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
METODE PENELITIAN Jenis Penelitian Penelitian ini menggunakan pendekatan kuantitatif. Waktu dan Tempat Penelitian Penyebaran kuesioner dilakukan pada kelas Listening Fakultas Bahasa dan Sastra (FBS) UKSW selama tiga kali pertemuan pada setiap hari Senin tanggal 11, 18, dan 25 Februari 2013 untuk kelas A. Sedangkan untuk kelas B setiap hari Kamis tanggal 14, 21, dan 28 Februari 2013. Target atau Subjek Penelitian Subjek dari penelitian ini adalah mahasiswa baru kelas Listening FBS UKSW pada dua kelas yang berbeda. Data dan Teknik Pengumpulan Data Data yang digunakan adalah data sekunder dari penelitian Rahandika(2013). Data tersebut diperoleh melalui penyebaran kuesioner yang berisi 13 pertanyaan yang sama di setiap minggu untuk 29 mahasiswa pada 2 kelas Listening FBS-UKSW selama tiga kali pertemuan. Isi kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening. Jenis data adalah data skala 1-5 (skala likert) sebagai skala untuk menyatakan berturut-turut sangat tidak setuju hingga sangat setuju. Teknik Analisis Data ANOVA adalah suatu modelyangcukup komprehensif untukmendeteksi perbedaan kelompok pada variabel terikat tunggal. Teknik yang lebih umum biasa dikenal sebagai multivariat analisis varians (MANOVA). MANOVA dapat dianggap sebagai ANOVA untuk situasi dimana ada beberapa variabel terikat. Pada Tabel 1 dijelaskan perbedaan dari ANOVA dan MANOVA. Informasi lebih lengkap dapat dilihat di Field(2009) dan Stevens (2009). Tabel 1. Perbedaan ANOVA dan MANOVA ANOVA
MANOVA
Hanya satu variabel terikat
Beberapa variabel terikat
Menguji perbedaan mean pada
Menguji perbedaan vektor mean
variabel terikat untuk beberapa
beberapa variabel terikat
variabel bebas Sedangkan perbedaan one-way repeated measures dan two-way repeated measures hanya pada variabel bebas. One-way repeated measures menggunakan satu variabel bebas dan two-way repeated measures menggunakan dua variabel bebas. a. Repeated Measures (Pengukuran Berulang) ANOVA Repeated measures adalah pengukuran berulang terhadap sekumpulan obyek atau partisipan yang sama. Pada prinsipnya Repeated Measures ANOVA sama dengan paired t-test untuk membandingkan rata-rata dua sampel yang saling berhubungan. Perbedaannya dengan ANOVA
234
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
adalah sampel uji ini adalah sampel pengukuran berulang, sementara ANOVA mensyaratkan sampel bebas. One-way repeated measures ANOVA biasanya digunakan untuk membandingkan nilai disain sebelum dan sesudah partisipan yang sama pada satu grup. Sedangkan two-way repeated measures ANOVA membandingkan pada dua grup. (Web 4) Dalam disain general linear model repeated measures, level dari within subject factor mewakili beberapa pengamatan dari skala waktu ke waktu dalam kondisi yang berbeda. Ada 3 jenis tes yang dilakukan jika within subject factormemiliki lebih dari dua level, yaitustandar univariat uji F, uji univariat alternatif, dantes multivariat. Tiga jenistes ini mengevaluasi hipotesis yang sama, rata-rata populasisama untuk semua level pada faktor (Web 1). Standarunivariatuji F ANOVAtidak dianjurkanketikawithin subject factormemiliki lebih daridua levelkarenapadaasumsitersebut, asumsi Sphericity umumnyadilanggardanuji F ANOVAmenghasilkan p-value yangakuratsejauhasumsiini dilanggar. Tes univariat alternatif memperhitungkan pelanggaran asumsi Sphericity. Tes ini menggunakan penghitungan statistik F yang sama dengan standar univariat tes. Namun p-value berpotensi berbeda. Dalam menentukan p-value, sebuah epsilon statistikdihitung berdasarkan data sampel untuk mengetahui derajat yang melanggar asumsi Sphericity. Pembilang dan penyebut derajat kebebasan uji standar dikalikan dengan epsilon untuk mendapatkan serangkaian derajat kebebasanyang sudah dikoreksi untuk membuat nilai F yang baru dan menentukan p-value. Uji
multivariat
tidak
memerlukan
asumsi
Sphericity.
Perbedaan
nilai
dihitung dengan membandingkan nilai-nilai dari berbagai levelwithin subject factor.Misalnya untuk
within
subject
factor
dengan
tiga
level,
nilai
perbedaan
mungkin
dihitung antara level pertama dengan kedua dan antara level kedua dengan ketiga. Uji multivariat kemudian akan mengevaluasi apakah rata-rata populasi untuk nilai perbedaan kedua pasangan secara simultan sama dengan nol. Tes ini tidak hanyamengevaluasi rata-rata terkait dengan dua pasangan nilai perbedaan, tetapi juga mengevaluasi apakah rata-rata dari nilai selisih antara level pertama dan ketiga faktor tersebut sama dengan nol sebagaikombinasi linier dari nilai perbedaan. Menurut Carey (1998), semua perhitungan statistik multivariat didasarkan pada akar-akar karakteristik dari matriks A yang dibentuk dari 𝐴 = 𝐻𝐸 −1
(1)
dengan H : matriks varians-kovarians perlakuan pada MANOVA E : matriks varians-kovarians error pada MANOVA. Dalam uji multivariat sendiri ada beberapa uji yang digunakan, yaitu:
Wilks’ Lamda
Makalah Pendamping: Matematika 3
235
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Statistik uji digunakan jika asumsi homogenitas dipenuhi. Nilai Wilks’ Lamda berkisar antara 0-1. Statistik uji ini yang sering dipakai (Web 2). Statistik uji Wilks’ Lamda dirumuskan sebagai: 𝛬=
𝐸 𝐻+𝐸
1 𝑠 𝑖=1 1+𝜆
=
(2)
𝑖
dengan 𝛬 : Wilks’ Lamda; 𝐸 : determinan dari matriks E;𝑠 : banyaknya akar-akar karakteristikdari matriks A;𝜆𝑖 : akar-akar karakteristik ke-i matriks A. Statistik Wilks’ Lamda di atas dapat ditransformasikan menjadi suatu statistik yang berdistribusi F. Khususnya Kasus 1: 𝑝 = 1, 𝑔 ≥ 2 1−𝛬 𝑛−𝑔 𝛬 𝑔−1
~ 𝐹𝑔−1,𝑛−𝑔 .
(3)
Kasus 2: 𝑝 ≥ 1, 𝑔 = 2 1−𝛬 𝑛−𝑝−1 𝛬 𝑝−1
~ 𝐹𝑝,𝑛−𝑝−1
(4)
dengan 𝑝 : banyaknya variabel; 𝑔 : banyaknya grup; 𝑛 : banyaknya partisipan. Informasi lebih lanjut dapat dilihat pada Patel dkk (2013).
Pillai’s Trace Statistik uji ini paling cocok digunakan jika asumsi homogenitas tidak dipenuhi (Web 2).
Statistik uji Pillai’s Trace 𝑉 dirumuskan sebagai: 𝑉 = 𝑡𝑟𝑎𝑐𝑒 𝐻 𝐻 + 𝐸
−1
=
𝜆𝑖 𝑠 𝑖=1 1+𝜆
𝑖
.
(5)
Beberapa ahli statistik menganggapnya paling kuat dari 4 statistik yang lain. Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑉 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004).
Hotelling’s Trace Statistik uji ini jarang digunakan oleh para ahli (Web 2). Berikut rumus dari Hotelling’s
Trace: 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 𝑡𝑟𝑎𝑐𝑒 𝐻𝐸 −1 =
𝑠 𝑖=1 𝜆𝑖 .
(6)
Statistik Hotelling’s Trace di atas dapat ditransformasikan menjadi suatu statistik yang berdistribusi F (Web 3). Khususnya 𝑣1 𝑣2
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 𝑝,𝑞 1
× 𝑛 𝑚𝑖𝑛
~𝐹𝑣1 ,𝑣2 ,
(7)
dimana 𝑣1 = 𝑝𝑞1 dan 𝑣2 = 𝑛 − 𝑝 − 1 𝑚𝑖𝑛 𝑝, 𝑞1 , dengan p : akar-akar karakteristik dari matriks A; n : banyaknya partisipan. Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004).
236
Roy’s Largest Root
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Roy’s Largest Root digunakan jika asumsi dipenuhi dan berkorelasi dengan kuat. Tetapi uji ini harus hati-hati dalam penggunaanya (Web 2). 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 𝑚𝑎𝑥 𝜆𝑖 .
(8)
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004). Keempat tes multivariat tersebut menggunakan uji statistik sebagai berikut: 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan) 𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (setidaknya ada perbedaan antar dua perlakuan). Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05 dan 𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . b. Sphericity Pada dasarnya, asumsi Sphericitymengacu padakesamaanvariansdariperbedaan diantaralevel pada
faktorrepeated
measures.Dengan
kata
lain,
kitamenghitungperbedaanantara
pasanganlevelfaktorrepeated
measuresdankemudian
menghitungvariansdarinilaiperbedaan.Sphericitymensyaratkan setiapnilaiperbedaansama.
setiap
Kita
mengasumsikanbahwa
bahwavariansuntuk hubunganantara
tiap
pasangkelompokadalahsama. Untuk menguji asumsi Sphericity dapat menggunakan tes Mauchly, uji Greenhouse Geisser dan tes Huynh Feldt. Hipotesis untuk Sphericity: 𝐻0 : 𝜎𝑦21 −𝑦2 = 𝜎𝑦21 −𝑦3 = 𝜎𝑦22 −𝑦3 (tidak ada perbedaan yang signifikan diantara varians perbedaan) 𝐻𝑎 : 𝜎𝑦21 −𝑦2 ≠ 𝜎𝑦21 −𝑦3 ≠ 𝜎𝑦22 −𝑦3 (ada perbedaan yang signifikan diantara varians perbedaan) dengan 𝑦1 − 𝑦2 : perbedaan level 1 dengan level 2 pada faktorrepeated measure 𝑦1 − 𝑦3 : perbedaan level 1 dengan level 3 pada faktorrepeated measure 𝑦2 − 𝑦3 : perbedaan level 2 dengan level 3 pada faktorrepeated measure. Kriteria pengujiannya tolak 𝐻0 jika hasil p-value dari Mauchly Tests< 0.05, yang artinya bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui (Field, 2012). Jika tes Mauchly dari Sphericity tidak signifikan, maka tes within-subjects effects dapat dilakukan. Sedangkan jika tes Mauchly dari Sphericity signifikan, tes multivariat yang digunakan (Ho, 2006). Jika data melanggar asumsi Sphericity, ada beberapa pembenaran yang dapat diterapkan untuk menghasilkan rasio Fyang valid. SPSS membuat tiga pembenaran berdasarkan perkiraan Sphericity yang dianjurkan oleh Greenhouse Geisser dan Huynh Feldt. Kedua perkiraan ini menimbulkan faktor koreksi yang diterapkan pada derajat kebebasan yang digunakan untuk menilai rasio Fyang telah diteliti. Koreksi Greenhouse Geisser biasanya dilambangkan dengan 𝜀 bervariasi antara
1 𝑘−1
dan 1,
dimana k adalah jumlah kondisi repeated measures. Semakin 𝜀 dekat ke 1, varians dari perbedaan semakin homogen.
Makalah Pendamping: Matematika 3
237
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Ketika estimasi Greenhouse Geisser lebih besardari 0,75 maka hipotesis nol ditolak. Ketika perkiraan Sphericity lebihbesar dari 0.75 maka koreksi Huynh Feldtharus digunakan, tetapi ketika perkiraan Sphericity kurang dari 0,75 atau Sphericity sama sekali tidak diketahui maka koreksi Greenhouse Geisser harus digunakansebagai gantinya(Field, 2009).
c. Pengukuran Pengaruh atau Dampak Ukuran pengaruh keseluruhan untuk pendekatan univariat adalah parsial eta kuadrat 𝜂 2 dan dapat dihitung menggunakan persamaan berikut: 2 Parsial𝜂𝑓𝑎𝑐𝑡𝑜𝑟 = 𝑆𝑆
𝑆𝑆 𝑓𝑎𝑐𝑡𝑜𝑟 𝑓𝑎𝑐𝑡𝑜𝑟
+𝑆𝑆𝑒𝑟𝑟𝑜𝑟
.
(9)
Ukuran pengaruh keseluruhan untuk uji multivariat terkait dengan Wilks’ Lamda 𝛬 adalah multivariat eta kuadrat dan dapat dihitung menggunakan persamaan berikut: Multivariat𝜂 2 = 1 − 𝛬.
(10)
Nilai parsial eta kuadrat dan multivariat eta kuadrat berkisar antara 0 sampai 1. Nilai 0 menunjukkan tidak ada hubungan antara faktor repeated measures dan variabel terikat, sedangkan nilai 1 menunjukkan adanya hubungan yang kuat. (Web 1) d. Pairwise Comparisons Desain
within-subjects
direkomendasikan
menggunakan
pendekatan
Bonferroni.
Pendekatan ini harus digunakan terlepas dari apakah peneliti merencanakan untuk menguji semua perbandingan berpasangan atau hanya membuat keputusan untuk memeriksa data (Maxwell dkk, 2004) Uji statistik disusun sebagai berikut: 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan) 𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (ada perbedaan antar perlakuan). Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05. Prosedur a. Variabel Penelitian 1. Variabel terikat (level) : banyaknya perlakuan, yaitu minggu pertama, minggu kedua dan minggu ketiga. 2. Variabel bebas (faktor repeated measures) : One-way repeated measures: rata-rata respon mahasiswa. Two-way repeated measures : kelas dan rata-rata respon mahasiswa. b. Langkah-langkah dalam Analisis Data 1. Menghitung rata-rata respon tiap mahasiswa pada tiap minggu. 2. Menganalisa hasil Sphericity. Jika signifikan (p-value< 0.05) dilanjutkan tes multivariat, sebaliknya jika tidak signifikan dilanjutkan tes within-subject effects.
238
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
3. Jika dilanjutkan tes multivariat, setelah itu menganalisa keempat uji pada tes multivariat. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut,kemudian menghitung nilai-nilai dari keempat uji menggunakan persamaan (1), (2) , (5), (6) dan (8). Statistik uji yang dianalisis adalah Wilks’ Lamda sehingga untuk menghitung penolakan Ho digunakan persamaan (3) dan (4). Tolak Ho saat 𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 dan sebaliknya. 4. Jika dilanjutkan tes within-subject effects, setelah itu menganalisa p-value dari Greenhouse Geisser dan Huynh-Feldt. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut, kemudian membuat perubahan derajat kebebasan untuk pembilang dan penyebut yang baru. 5. Menghitung pengaruh faktor dari repeated measures menggunakan persamaan (9) atau (10). 6. Menganalisa hasil p-value dari Pairwise Comparisons. Tolak 𝐻0 jika p-value < 0.05. HASIL PENELITIAN DAN PEMBAHASAN One-Way Repeated Measures Kasus 1 Akan diuji apakah ada perbedaan yang signifikan pada Kelas A minggu pertama, minggu kedua dan minggu ketiga. Hasil dari analisis mengindikasikan bahwa tes Mauchlydari Sphericity signifikan (p-value = 0 < 0.05). Artinya bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui. Oleh karena itu, teswithinsubject effects tidak dapat digunakan, tetapi yang dapat digunakan adalah tes multivariat. Dari Tabel 2a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu ketiga semakin meningkat, tetapi perbedaannya tidak terlalu jauh. Sedangkan standart deviasi dari minggu pertama sampai minggu ketiga semakin menurun. Tabel 2a. Rata-rata dan standar deviasi
Tabel 2b. Hasil dari tes multivariat untuk
Kelas A
Kelas A minggu pertama, kedua dan ketiga
Mean
Standart Deviasi
Nama Uji
p-value
Minggu pertama
4.019
0.396
Pillai’s Trace
0.008
Minggu kedua
4.098
0.296
Wilks’ Lamda
0.008
Minggu ketiga
4.223
0.232
Hotelling’s Trace
0.008
Roy’s Largest Root
0.008
Untuk mengetahui apakah rata-rata dari minggu pertama sampai minggu ketiga berbeda secara signifikan, dapat dilakukan tes multivariat dengan melihat Tabel 2b. Dari semua uji diperoleh kesimpulan bahwa semua menolak Ho karena semua uji menghasilkan p-value yang
Makalah Pendamping: Matematika 3
239
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
sama yaitu 0.008 < 0.05. Maka ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’ Lamda, Hotelling’s Trace dan Roy’s Largest Root, nilai-nilai dari keempat uji tersebut juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Dengan menggunakan persamaan (1) dapat diperoleh: 3.262 −1.876 0.605 0.077 0.5763 0.4691 ,𝐸= dan 𝐸 −1 = . −1.876 2.305 0.077 0.010 0.4691 0.8156 0.3848 0.3466 0.4290 Sehungga matriks 𝐴 = dan didapatkan akar-akar karakteristik . 0.0491 0.0443 0.0001 𝐻=
Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat dihitung menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh: 1
1
0.4290
𝛬 = 1+0.4290 . 1+0.0001 = 0.6997;
0.0001
𝑉 = 1+0.4290 + 1+0.0001 = 0.3003
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 0.4290 + 0.0001 = 0.4291;
𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.4290.
Dalam kasus ini yang dianalisis adalah 1 variabel dan 3 grup. Dari persamaan (3) diperoleh statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui) 𝐹𝑖𝑡𝑢𝑛𝑔 =
1−0.6997 29−3 0.6997 3−1
= 5.5794.
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹3−1,29−3 = 𝐹2,26 = 3.37. Jadi 𝐻0 ditolak karena𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Artinya bahwa ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan multivariat eta kuadrat sehingga diperoleh Multivariat𝜂 2 = 1 − 0.6997 = 0.3003. Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan yang diberikan setiap minggunya. Tabel 2d menunjukkan semua perbandingan berpasangan (dengan interval konfidensi Bonferroni) diantara 3 level. Dengan membandingkan respon setiap minggunya, kita dapat memasang-masangkan data rata-rata respon antar minggu pertama sampai minggu ketiga. Tabel 2d. Hasil analisa perbandingan berpasangan Kelas A
240
Respon mahasiswa
p-value
Analisa
Minggu ke-1 dan ke-2
1
𝐻0 diterima
Minggu ke-1 dan ke-3
0.092
𝐻0 diterima
Minggu ke-2 dan ke-3
0.042
𝐻0 ditolak
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Dapat dilihat dari Tabel 2d, dengan = 5% maka rata-rata respon mahasiswa minggu kedua dan minggu ketiga berbeda secara signifikan (p-value< 0.05). Rata-rata respon mahasiswa minggu pertama dengan minggu kedua dan rata-rata respon minggu pertama dengan minggu ketiga tidak berbeda secara signifikan (p-value> 0.05).
Kasus 2 Akan diuji apakah ada perbedaan yang signifikan pada Kelas B minggu pertama, minggu kedua dan minggu ketiga. Dari hasil analisis mengindikasikan bahwa tes Mauchlydari Sphericity
tidak
signifikan
(p-value=
0.299
>
0.05).
Hasiltes
within-subject
effectsmengindikasikan bahwa within-subjects variabel rata-rata respon mahasiswa tidak signifikan karena p-value = 0.736 >0.05. Artinya, tidak ada perbedaan yang signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga. Setelah hasil tes Mauchlydari Sphericity sudah diperoleh, kemudian dari tes withinsubject effects dibuat sebuah perubahan derajat kebebasan untuk pembilang dan penyebut. Hal ini dapat diperoleh dengan mengalikan kedua nilai ini menggunakan Huynh-Feldt karena perkiraan Sphericity lebih dari 0.75. Perubahan derajat kebebasan pembilangnya adalah 2 × 0.921 = 1.966. Rasio F = 0.308 harus dievaluasi dengan derajat kebebasan yang baru ini. Setelah dihitung dengan derajat kebebasan yang baru diperoleh F yang sama yaitu 0.308 dan pvalue = 0.733 > 0.05. Ternyata setelah dievaluasi dengan derajat kebebasan yang baru tetap memperoleh kesimpulan yang sama dengan sebelumnya, yaitu tidak ada
perbedaan yang
signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga. Dari Tabel 3a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu ketiga perbedaannya tidak terlalu jauh. Tabel 3a. Rata-rata dan standar deviasi
Tabel 3b. Hasil analisa perbandingan
Kelas B
berpasangan Kelas B
Mean
Standar deviasi
Respon mahasiswa
p-value
Analisa
Minggu pertama
3.939
0.300
Minggu ke-1 dan ke-2
1
𝐻0 diterima
Minggu kedua
3.989
0.184
Minggu ke-1 dan ke-3
1
𝐻0 diterima
Minggu ketiga
3.955
0.219
Minggu ke-2 dan ke-3
1
𝐻0 diterima
Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan parsial eta kuadrat sehingga diperoleh 2 Partial𝜂𝑓𝑎𝑐𝑡𝑜𝑟 =
0.038 0.038+3.500
= 0.011.
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan yang diberikan setiap minggunya.
Makalah Pendamping: Matematika 3
241
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Tabel 3b menunjukkan semua pairwise comparisons (dengan interval konfidensi Bonferroni) diantara 3 level. Dengan membandingkan setiap minggunya, kita dapat memasangmasangkan data rata-rata antar minggu pertama sampai minggu ketiga. Dapat dilihat dari Tabel 3b dengan = 5% maka rata-rata respon mahasiswa minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Two-Way Repeated Measures Akan diuji apakah ada perbedaan yang signifikan interaksi respon dari mahasiswa pada Kelas A dan Kelas B pada minggu pertama, minggu kedua dan minggu ketiga.Dari Tabel 4a, variabel Kelas menghasilkan hasil yang sangat signifikan untuk semua tes multivariat dengan pvalue = 0 < 0.05. Artinya ada perbedaan respon Kelas A dan Kelas B.Dari Tabel 4b dapat dilihat bahwa pada respon Kelas A lebih besar daripada rata-rata respon Kelas B. Tabel 4a. Hasil tes multivariat Kelas A dan B untuk variabel Kelas
Tabel 4b. Perbedaan rata-rata respon Kelas
Nama Uji
p-value
A dan B untuk variabel Kelas
Pillai’s Trace
0
Kelas
Mean
Wilks’ Lamda
0
A
4.113
Hotelling’s Trace
0
B
3.961
Roy’s Largest Root
0
Selanjutnya diuji variabel Rata-rata respon mahasiswa.Padates MauchlydariSphericity menghasilkan nilai 0.731, dan signifikan karena p-value = 0.015 < 0.05. Asumsi Sphericity dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4c menunjukkan bahwa variabel Rata-rata respon mahasiswa tidak signifikan. Hal ini dapat dilihat dari p-value = 0.170 > 0.05 yang artinya tidak ada perbedaan rata-rata respon mahasiswa dari minggu pertama sampai minggu ketiga. Tetapi dari Tabel 4ddapat dilihat bahwa rata-rata respon mahasiswa minggu pertama, minggu kedua dan minggu ketiga semakin meningkat. Tabel 4c. Hasil tes multivariat rata-rata respon mahasiswa
Respon mahasiswa
Mean
Minggu ke-1
3.979
Nama Uji
p-value
Minggu ke-2
4.044
Pillai’s Trace
0.170
Minggu ke-3
4.089
Wilks’ Lamda
0.170
Hotelling’s Trace
0.170
Roy’s Largest Root
0.170
Tabel 4d. Rata-rata respon mahasiswa
242
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Untuk interaksi Kelas dengan Rata-rata respon mahasiswa, tes Mauchlydari Sphericity menghasilkan nilai 0.454 dan signifikan karena p-value = 0.042 < 0.05. Asumsi Sphericity juga dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4e menunjukkan bahwa efek interaksi signifikan karena p-value = 0.023 < 0.05. Hal ini menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Tabel 4e. Hasil tes multivariat dari interaksi Kelas dengan Rata-rata respon mahasiswa Nama Uji
p-value
Pillai’s Trace
0.023
Wilks’ Lamda
0.023
Hotelling’s Trace
0.023
Roy’s Largest Root
0.023
Nilai-nilai dari keempat uji pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’ Lamda, Hotelling’s Trace dan Roy’s Largest Root untuk interaksi Kelas dengan Rata-rata respon mahasiswa juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Menggunakan persamaan (1) dapat diperoleh: 0.094 −0.293 2.898 −1.695 0.5433 0.3389 ,𝐸= dan 𝐸 −1 = . −0.293 0.907 −1.695 2.717 0.3389 0.5795 −0.0482 −0.1379 Sehingga matriks 𝐴 = dan didapatkan akar-akar karakteristik 0.1482 0.4263 −0.0003 . Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat 0.3784 dihitung menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh: 𝐻=
1
1
𝛬 = 1−0.0003 . 1+0.3784 = 0.7257;
−0.0003
0.3784
𝑉 = 1−0.0003 + 1+0.3784 = 0.2742
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = −0.0003 + 0.3784 = 0.3781;
𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.3784.
Dalam kasus ini yang dianalisis adalah 3 variabel dan 2 grup. Dari persamaan (4) diperoleh statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui) 𝐹𝑖𝑡𝑢𝑛𝑔 =
1−0.7253 29−3−1 0.7253 3−1
= 4.7342.
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹𝑝,𝑛−𝑝−1 = 𝐹3,25 = 2.99. Jadi 𝐻0 ditolak karena𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Hal ini menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Kemudian mengukur pengaruh interaksi Kelas dengan Rata-rata respon mahasiswa tersebut menggunakan multivariat eta kuadrat sehingga diperoleh Multivariat𝜂 2 = 1 − 0.7257 = 0.2743. Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara Kelas dengan Rata-rata respon mahasiswa terhadap perlakuan yang diberikan setiap minggunya.
Makalah Pendamping: Matematika 3
243
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Gambar 1. Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B
Gambar 1 menunjukkan bahwa rata-rata respon mahasiswa yang diberikan pada 3 minggu tergantung pada perbedaan kelas. Pada kelas A, rata-rata respon mahasiswa semakin meningkat tetapi pada kelas B rata-rata respon mahasiswa meningkat dan mengalami penurunan lagi pada minggu ketiga. Tabel 4f. Hasil analisa perbandingan berpasangan minggu pertama sampai minggu ketiga Respon mahasiswa
p-value
Analisa
Minggu ke-1 dan ke-2
1
𝐻0 diterima
Minggu ke-1 dan ke-3
0.248
𝐻0 diterima
Minggu ke-2 dan ke-3
0.868
𝐻0 diterima
Tabel 4f menunjukkan semua perbandingan berpasangan antara dua kelas dan rata-rata respon mahasiswa tiga minggu dengan menggunakan interval konfidensi Bonferroni 95%. Dapat dilihat dari Tabel 4f dengan = 5%, rata-rata respon mahasiswa di Kelas A dan Kelas B pada minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Artinya tidak ada perbedaan rata-rata respon mahasiswa di minggu pertama sampai ketiga.
SIMPULAN Pada makalah ini telah dibahas studi tentang respon mahasiswa dengan metode one-way dan two-wayrepeated measures untuk dua kelas Listening FBS-UKSW. Berdasarkan hasil yang diperoleh dapat disimpulkan bahwa: One-wayRepeated Measures
Pada kelas A Berdasarkan tes multivariat, ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Tetapi varians dari minggu pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons,
244
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
respon minggu kedua dengan respon minggu ketiga berbeda secara signifikan sedangkan respon minggu pertama dengan minggu kedua dan respon minggu pertama dengan minggu ketiga tidak berbeda secara signifikan.
Pada kelas B Berdasarkan tes within-subject effects, varians dari minggu pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons, rata-rata respon mahasiswa minggu pertama, kedua dan ketiga juga tidak berbeda secara signifikan.
Two-way Repeated Measures Berdasarkan uji yang dilakukan, dapat disimpulkan bahwa terdapat perbedaan respon Kelas A dengan Kelas Btetapi tidak ada perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi Kelas dengan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Pengujian Pairwise Comparisonsyang dilakukan untuk dua kelas yang berbeda mengindikasikan tidak ada perbedaan antara respon mahasiswa di minggu pertama sampai ketiga.
DAFTAR PUSTAKA Carey, G. (1998). Multivariate Analysis of Variance (MANOVA): I. Theory. Diakses tanggal 1 November
2013
pukul
12.40
WIB
dari
http://ibgwww.colorado.edu/~carey/p7291dir/handouts/manova1.pdf. Field, A. (2009). Discovering Statistics Using SPSS. (3thed.). India : Sage. Field, A. (2012). Discovering Statistics Repeated Measures ANOVA. Diakses tanggal 29 Oktober 2013 dari http://www.discoveringstatistics.com. Giri, N.C. (2004). Multivariate Statistical Analysis. (2nded). New York : Marcel Dekker. Ho, R. (2006). Handbook of Univariate and Multivariate Data Analysis and Interpretation with SPSS. New York : Chapman & Hall/CRC Taylor & Francis Group. Maxwell, S.E. & Delaney, H.D. (2004). Designing Experiments And Analyzing Data A Model Comparison Perspective. (2nded.). London: Lawrence Erlbaum Associates. Patel, S. & Bhavsar, C.D. (2013). Analysis of Pharmocokinetic Data by Wilk‟s Lamda (An Important Tool of Manova). International Journal of Pharmaceutical Science Invention, Vol. 2, 36-44. Pritasari, N.F., Parhusip, H.A. & Susanto, B. (2013). Analisis Respon Mahasiswa Kelas Listening Menggunakan Metode Paired Comparisons. Prosiding, Seminar Nasional Matematika VII yang diselenggarakan oleh Jurusan Matematika FMIPA dan Prodi Pendidikan Matematika Program Pascasarjana UNNES tanggal 26 Oktober 2013. Semarang: Universitas Negeri Semarang. Makalah Pendamping: Matematika 3
245
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Rahandika, A. (2013). The Students Perceptions toward Different Task Types in Public Listening Class. Skripsi. Program Studi Pendidikan Bahasa Inggris, Fakultas Bahasa dan Sastra, Universitas Kristen Satya Wacana. Salatiga. Stevens, J.P. (2009). Applied Multivariate Statistics For The Social Sciences. (5thed.). New York : Routledge Taylor & Francis Group. Web
1:
http://oak.ucc.nau.edu/rh232/courses/EPS625/Handouts/RM-
ANOVA/Understanding%20Repeated-Measures%20ANOVA.pdf. Diakses tanggal 30 Oktober 2013 pukul 09.53 WIB. Web 2: https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&ved =0CFQQFjAF&url=http%3A%2F%2Fwww.chsbs.cmich.edu%2Fk_han%2Fpsy613%2F manova1.doc&ei=4tZ5UvzpOqzwiQfHoCwAw&usg=AFQjCNFOCcK9hRRVQczMgt0tSqX6Al8z5Q&sig2=w5KyDbLxz-MaMqVVyntzA&bvm=bv.55980276,d.aGc. Diakses tanggal 6 November 2013 pukul 12.45 WIB. Web
3:
http://www.stat.ncsu.edu/people/bloomfield/courses/st784/twa-08-3.pdf.
Diakses
tanggal 7 November 2013 pukul 08.27 WIB. Web
4:
http://www.zu.ac.ae/main/files/contents/research/training/one-
wayrepeatedmeasureanova.pdf. Diakses tanggal 7 November 2013 pukul 09.12 WIB.
246
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
ANALISIS BIPLOT PADA PEMETAAN KARAKTERISTIK KEMISKINAN DI PROVINSI NUSA TENGGARA BARAT Desy Komalasari 1), Mustika Hadijati 2), Marwan 3) 1) Program Studi Matematika FMIPA UNRAM, email:
[email protected] 2) Program Studi Matematika FMIPA UNRAM, email:
[email protected] 3) Program Studi Matematika FMIPA UNRAM, email:
[email protected] 1), 2), 3). Jln. Majapahit No.62 Mataram- NTB. Abstrak Penelitian ini bertujuan memberikan inovasi baru mengenai pemetaan karakteristik kemiskinan pada kabupaten/kota di provinsi Nusa Tenggara Barat, menggunakan metode analisis Biplot. Analisis Biplot didasarkan pada singular value decomposition, matriks orthonormal, dan faktorisasi dari matriks data. Penelitian ini menghasilkan Square Root Biplot (SQRT) atau Biplot Simetri, yaitu grafik Biplot yang memetakan secara bersamaan kabupaten/kota dengan karakteristik kemiskinan di provinsi NTB. Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup baik mengenai informasi data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%. Grafik Biplot menampilkan wilayah yang memiliki kesamaan karakteristik kemiskinan ada pada kabupaten Bima dan kabupaten Sumbawa, dengan jarak Euclid terdekat sebesar 0.266. Sedangkan jarak terjauh ada pada kabupaten Lombok Tengah dan kota Mataram, sebesar 9.779. Keragaman karakteristik kemiskinan ditunjukkan dengan panjang vektor, vektor terpanjang pada penduduk miskin yang bekerja di sektor pertanian (𝑋7 ) dan vektor terpendek pada angka partisipasi sekolah penduduk miskin (𝑋3 ). Kata kunci: Analisis Biplot, Singular Value Decomposition, Karakteristik Kemiskinan.
PENDAHULUAN Kemiskinan merupakan masalah yang sering dihadapi di setiap daerah di Indonesia seperti halnya provinsi Nusa Tenggara Barat. Jumlah penduduk miskin di provinsi Nusa Tenggara Barat (NTB) pada Maret 2011 sebesar 19,73%, dan menurun pada Maret 2012 sebesar 18,63% (Berita Resmi Statistik, 2012). Angka penurunan sebsar 1,10% dipengaruhi oleh beberapa faktor karakteristik kemiskinan di antaranya faktor sosial ekonomi dan faktor pendidikan. Penurunan yang kurang signifikan menyebabkan perlunya pemetaan karakteristik kemiskinan, sehingga upaya pengentasan kemiskinan tepat sasaran. Karakteristik kemiskinan yang digunakan merupakan data kemiskinan makro. Data kemiskinan makro menunjukkan jumlah dan persentase penduduk miskin di setiap daerah berdasarkan estimasi. Data ini digunakan untuk perencanaan dan evaluasi program kemisikinan dengan target geografis. Oleh karena itu, perlunya dilakukan pemetaan karakteristik kemiskinan pada kabupaten/kota di Provinsi NTB menggunakan analisis Biplot. Analisis Biplot merupakan teknik statistik deskriptif dimensi ganda dengan menyajikannya secara visual dan simultan sejumlah objek pengamatan dan variabel dalam suatu grafik. Oleh karena itu, tujuan penelitian ini yaitu untuk mengetahui gambaran pemetaan karakteristik kemiskinan di Provinsi NTB menggunakan analisis Biplot. Sehingga manfaat dari pemetaan ini dapat digunakan sebagai bahan acuan Pemerintah Daerah Provinsi NTB untuk melakukan upaya pengentasan kemiskinan yang tepat sasaran pada karakteristik kemiskinan di wilayah tersebut. Makalah Pendamping: Matematika 3
247
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
METODE PENELITIAN Jenis Penelitian Penelitian ini menggunakan pendekatan kuantitatif dan aplikatif, yaitu mengaplikasikan data – data numerik ke dalam analisis Biplot. Analisis Biplot adalah salah satu upaya menggambarkan data - data yang ada pada tabel ringkasan kedalam grafik berdimensi dua. Grafik yang dihasilkan dari Biplot ini merupakan grafik yang berbentuk bidang datar. Dengan penyajian seperti ini, ciri-ciri variabel dan objek pengamatan serta posisi relatif antara objek pengamatan dengan variabel dapat dianalisis (Kohler dan Luniak, 2005).
Waktu dan Tempat Penelitian Penelitian dilaksanakan mulai bulan Juni 2013 sampai dengan bulan Oktober 2013. Tempat penelitian di Universitas Mataram dan Badan Pusat Statistik Provinsi NTB.
Data Penelitian Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) Provinsi Nusa Tenggara barat. Data yang digunakan yaitu data karakteristik kemiskinan tahun 2011, terdiri dari 10 kabupaten/kota yang merupakan Objek penelitian dan 10 karakteristik kemiskinan yang merupakan variabel penelitian. Objek penelitian meliputi Kab. Lombok Barat, Kab. Lombok Tengah, Kab. Lombok Timur, Kab. Sumbawa, Kab. Dompu, Kab. Bima, Kab. Sumbawa Barat, Kab. Lombok Utara, Kota Mataram, Kota Bima. Variabel penelitian merupakan karakteristik kemiskinan meliputi Jumlah Penduduk Miskin (𝑋1 ), Angka Melek Huruf Penduduk Miskin (𝑋2 ), Angka Partisipasi Sekolah Penduduk Miskin (𝑋3 ), Penduduk miskin yang tidak bekerja (𝑋4 ), Penduduk miskin yang bekerja di sektor Informal (𝑋5 ), Penduduk miskin yang bekerja di sektor formal (𝑋6 ), Penduduk miskin yang bekerja di sektor pertanian (𝑋7 ), Penduduk bekerja di bukan sektor pertanian (𝑋8 ), Pengeluaran perkapita untuk makanan (𝑋9 ), Luas lantai perkapita rumah tangga miskin (𝑋10 ). Prosedur Penelitian Prosedur penelitian ini meliputi observasi pendahuluan, perancangan penelitian, pengumpulan data, analisis data, interpretasi hasil, dan kesimpulan. Observasi pendahuluan dilakukan dengan survey data-data yang relevan, dengan tujuan untuk memberikan gambaran dan informasi mengenai karakteristik kemiskinan di setiap kabupaten/kota di provinsi NTB. Perancangan penelitian meliputi penetapan rumusan masalah, tujuan penelitian, penentuan alat dan bahan, pengumpulan data, serta penentuan teknik analisis data. Langkah selanjutnya yaitu pengumpulan data, data yang dikumpulkan disini adalah data sekunder yang berhubungan dengan karakteristik kemiskinan. Selanjutnya analisis data menggunakan Biplot, kemudian
248
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
interpretasi hasil Biplot yaitu memberikan gambaran atau penjelasan secara deskriptif mengenai kedekatan antar objek yang diamati, keragaman variabel, hubungan atau korelasi antar variabel, dan nilai variabel pada suatu objek. Berdasarkan hasil interpretasi akan ditarik kesimpulan mengenai analisis Biplot terhadap posisi kabupaten/kota terhadap karakteristik yang dimilikinya serta karakteristik kemiskinan mana saja yang paling dominan di suatu kabupaten/kota di provinsi NTB.
Teknik Analisis Data Analisis data menggunakan teknik analisis Biplot. Prosedur analisis biplot meliputi menentukan matriks data yang dikoreksi terhadap rata-rata (𝒀), menentukan matriks 𝒀𝑻 𝒀, menentukan nilai eigen dan vektor eigen, mencari Singular Value Decomposition (SVD) yaitu mendapatkan matriks U, L dan A, menentukan matriks koordinat dengan 𝛼yang digunakan berkisar pada 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim digunakan dalah 𝛼 = 1; 𝛼0.5; dan 𝛼0 (Nugroho, 2008). Menentukan matriks G(objek) dan H(variabel) terpilih berdasarkan 𝒀 ≅ 𝑮𝑯𝑻 , menggambar grafik menggunakan program, interpretasi hasil dan kesimpulan. Analisis Biplot bertujuan menggambarkan suatu matriks dengan menumpang tindihkan vektor-vektor baris dengan vektor-vektor kolom matriks. Analisis Biplot didasarkan pada penguraian nilai-nilai singular (Singular Value Decomposition) dari suatu matriks data yang telah dikoreksi oleh rataanya. Biplot dibentuk dari suatu matriks data, dimana setiap kolom mewakili variabel-variabel penelitian, dan setiap baris mewakili objek penelitian. Misalkan matriks Xadalah matriks yang terdiri dari variabel-variabel sebanyak p dan objek penelitian sebanyak n. Misalkan matriks Y merupakan hasil dari matriks X yang dikoreksi terhadap rataannya, maka akan diuraikan menjadi perkalian tiga buah matriks berikut: 𝒀(𝒏×𝒑) = 𝑼(𝒏×𝒓) 𝑳𝒓×𝒓 𝑨𝑻𝒓×𝒑
(1)
Matriks 𝑳 merupakan nilai singular 𝒀 dengan unsur-unsur diagonalnya akar kuadrat dari nilai eigen𝒀𝑻 𝒀, sedangkan matriks 𝑼diperoleh dari 𝑼 = 𝒀𝑨𝑳−𝟏 . Sehingga 𝑼𝑻 𝑼 = 𝑨𝑻 𝑨 = 𝑰, I adalah matriks identitas dan L adalah matriks diagonal berukuran (rxr) dengan unsur-unsur diagonalnya adalah akar dari nilai eigen–nilai eigen tak nol 𝒀𝑻 𝒀 yaitu 𝜆𝟏 ≥ 𝜆𝟐 … ≥ 𝜆𝒓 (Menurut Matjik dan Sumertajaya, 2011)). Menurut Joellife (1986) dalam Matjik dan Sumertajaya, 2011, dari matriks Y akan dibentuk matriks G dan H, dimana 𝑮 = 𝑼𝑳𝜶 dan𝑯𝑻 = 𝑳𝟏−𝜶 𝑨𝑻 dengan 𝛼 besarnya 0 ≤ 𝛼 ≤ 1, yang masing-masing berukuran 𝑛 × 𝑟 dan 𝑟 × 𝑝maka persamaan (1) menjadi: 𝒀 = 𝑼𝑳𝜶 𝑳𝟏−𝜶 𝑨𝑻 = 𝑮𝑯𝑻
(2)
Masing-masing merupakan matriks G baris ke-i , dimana𝑖 = 1,2, … , 𝑛serta matriks H kolom kej dimana 𝑗 = 1,2, … , 𝑝, dan r adalah rank matriks data Y. Jika matriks Ymempunyai rank dua,
Makalah Pendamping: Matematika 3
249
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
maka vektor baris 𝒈𝒊 dan vektor 𝒉𝒋 akan digambarkan dalam dimensi dua. Namun, jika Y mempunyai rank lebih dari dua maka persamaan di atas menjadi : 𝟏
𝒓 𝟐 𝑻 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋
𝒚𝒊𝒋 =
(3)
dengan 𝒖𝒊𝒌 merupakan elemen ke-(i,k) pada matriks U, 𝜶𝒌𝒋 𝑻 merupakan elemen ke-(k,j) pada 𝟏 𝟐
T
matriks A serta 𝝀𝒌 adalah elemen diagonal ke-k matriks Lyang merupakan akar kuadrat nilai eigen𝒀𝑻 𝒀 . Menurut Gabriel (1971) dalam Matjik dan Sumertajaya, 2011, data pengamatan awal matriks X yang terdiri dari n objek dan p variabel tereduksi menjadi beberapa himpunan data yang terdiri dari n baris dengan m kolom. Jika ada sebanyak m kolom yang ditentukan, maka persamaan (2) menjadi; 𝟏
𝒎𝒚𝒊𝒋
=
𝒎 𝟐 𝑻 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋 , 𝒎
<𝑟
(4)
Persamaan di atas dapat dibentuk sebagai berikut : 𝒎 𝒎𝒚𝒊𝒋
𝟏
= 𝒌=𝟏 𝒎
𝒖𝒊𝒌 𝝀𝜶𝒌 𝟐
𝟏
𝟐 𝝀𝟏−𝜶 𝜶𝒌𝒋 𝑻 𝒌
𝒈𝒊𝒌 𝒉𝑻𝒌𝒋
=
𝒌=𝟏 𝑻
= 𝒈∗𝒊 𝒉∗𝒋
(5)
𝑻
dengan 𝒈∗𝒊 dan𝒉∗𝒋 masing-masing merupakan elemen vektor 𝒈𝒊 dan 𝒉𝒋 . Jika 𝑚 = 2 pada persamaan (5) maka dikatakan sebagai Biplot, sehingga dapat dibentuk menjadi : 𝟐𝒚𝒊𝒋
𝑻
= 𝒈∗𝒊 𝒉∗𝒋
Dengan
𝟐𝒚𝒊𝒋
(6)
merupakan elemen matriks Yberdimensi dua, sedangkan 𝒈∗𝒊 mengandung elemen
dua kolom pertama vektor 𝒈𝒊 , dan 𝒉∗𝒊 mengandung dua kolom pertama vektor 𝒉𝒋 . Sehingga dari matriks Y pada dimensi dua diperoleh matriks dengan ukuran tereduksi yaitu matriks Gdan H sebagai berikut (Johnson danWichern, 2002) : 𝑔11 ⋮ 𝑮 = 𝑔𝑖1 ⋮ 𝑔𝑛1
11 𝑔12 ⋮ ⋮ 𝑔𝑖2 dan 𝑯 = 𝑖1 ⋮ ⋮ 𝑔𝑛2 𝑝1
12 ⋮ 𝑖2 ⋮ 𝑝2
Masing-masing pada matriks G dan H merupakan titik-titik koordinat dari n objek dan titiktitik koordinat dari p variabel. Rencer (2002), mengemukakan ukuran Biplot dengan pendekatan matriks Y berdimensi dua dalam bentuk : 𝑝2 =
250
(𝜆 1 + 𝜆 2 ) 𝑟 𝑘=1 𝜆 𝑘
(7)
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Dengan 𝜆1 adalah nilai eigen terbesar pertama, 𝜆2 adalah nilai eigen terbesar kedua dan 𝜆𝑘 , 𝑘 = 1,2, … , 𝑟 adalah nilai eigen ke-k. Apabila nilai 𝑝2 mendekati satu, maka Biplot memberikan penyajian yang semakin baik mengenai informasi data yang sebenarnya. Biplot mempunyai beberapa tipe. Perbedaan tipe ini berdasarkan pada nilai 𝛼yang digunakan. Nilai 𝛼yang digunakan dalam Biplot adalah 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim digunakan dalah 𝛼 = 1; 𝛼0.5; dan 𝛼0 (Nugroho, 2008). 1) Biplot dengan 𝛼1 disebut juga dengan Biplot komponen utama. Jika 𝛼 yang digunakan adalah 𝛼 = 1 maka Biplot yang dibentuk disebut Biplot RMP (Row Metric Preserving). Biplot RMP ini digunakan untuk menduga jarak Euclid secara optimal. Sehingga Biplot untuk 𝛼 = 1 diperoleh: 𝑮 = 𝑼𝑳𝟏 = 𝑼𝑳dan 𝑯 = 𝑨𝑳𝟏−𝟏 = 𝑨
(8)
Pada kondisi ini jarak Euclid antara 𝑔𝑖 dan 𝑔𝑗 sama dengan jarak antara 𝑦𝑖 dan 𝑦𝑗 pada pengamatan sesungguhnya. Selain itu koordinat 𝑗𝑇 merupakan koefisien variabel ke-j dalam dua komponen utama pertama. 2) Nilai 𝛼lain yang digunakan dalam pembuatan Biplot yaitu 𝛼 = 0.5. Untuk nilai 𝛼ini, Biplot yang dibentuk disebut Biplot Simetri atau Biplot SQRT (Square Root Biplot).. Biplot untuk 𝛼 = 0.5 diperoleh: 𝑮 = 𝑼𝑳𝟎,𝟓 dan 𝑯 = 𝑨𝑳𝟏−𝟎,𝟓 = 𝑨𝑳𝟎,𝟓
(9)
3) Jika 𝛼yang digunakan adalah 𝛼0, maka akan terbentuk tipe Biplot yang disebut Biplot CMP (Column Metric Preserving). Saat 𝛼 = 0 diperoleh matriks G dan H sebagai berikut diperoleh𝑮 = 𝑼𝑳𝟎 = 𝑼 dan 𝑯 = 𝑨𝑳𝟏−𝟎 = 𝑨𝑳 sehingga terbentuk
(10) 𝑻
𝒀𝑻 𝒀 = 𝑮𝑯𝑻 (𝑮𝑯𝑻 ) = 𝑯𝑮𝑻 (𝑮𝑯)𝑻 = 𝑯𝑮𝑻 𝑮𝑯𝑻 = 𝑯𝑼𝑻 𝑼𝑯𝑻 = 𝑯𝑯𝑻
(11)
Matriks U merupakan matriks orthonormal dan 𝒀𝑻 𝒀 = 𝑛 − 1 𝑺dengan n merupakan banyaknya objek serta Smerupakan matriks varian kovarian dari matriks Y, sehingga 𝑯𝑻 = 𝑛 − 1 𝑺 .Hasil kali elemen 𝑗 𝑘𝑇 akan sama dengan (𝑛 − 1) kali kovarian 𝑠𝑗𝑘 variabel ke-j dan 2 2 2 2 variabel ke-k. Elemen diagonal utama matriks 𝑯𝑯𝑻 , 11 + 21 , … , 𝑗21 + 𝑗22 , … , 𝑝1 + 𝑝2
merupakan variansi dari variabel. Sedangkan 𝑗21 + 𝑗22 , 𝑗 = 1,2, . . , 𝑝 merupakan panjang vektor variabel (dengan pusat jarak Euclid di titik O(0,0)). Sehingga dapat dikatakan bahwa panjang vektor variabel sebanding dengan variansi variabel (Matjik dan Sumertajaya, 2011).
Makalah Pendamping: Matematika 3
251
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
HASIL DAN PEMBAHASAN Deskripsi data penelitian Gambaran data penelitian di tampilkan pada tabel Deskriptif Statistik berikut. Tabel 1. Deskriptif Statistik N
Minimum Maximum
Mean
Std. Deviation Variance
Penduduk Miskin (X1)
10
11.69
39.27
19.9220
7.46983
55.798
AMH (X2)
10
72.57
91.63
84.3240
6.12581
37.526
APS (X3)
10
92.58
100.00
96.3380
2.54088
6.456
Tidak Bekerja (X4)
10
31.22
47.67
37.2530
5.46294
29.844
Bekerja Informal (X5)
10
36.38
68.34
54.7690
9.49724
90.197
Bekerja Formal (X6)
10
.45
15.95
7.9810
4.85856
23.606
Bekerja Sektor Pertanian (X7)
10
1.78
55.85
39.6360
16.41475
269.444
Bekerja Bukan Pertanian (X8)
10
12.40
50.54
23.1140
11.71297
137.194
Pengeluaran Makanan (X9)
10
59.69
73.21
67.2390
4.13745
17.118
Luas Lantai (X10)
10
41.12
79.19
59.3520
12.71368
161.638
Valid N (listwise)
10
Pada tabel 1 terlihat Gambaran karakteristik kemiskinan di provinsi NTB, rata-rata penduduk miskin di 10 kabupaten tersebut sebesar 19.92%, dengan rata-rata angka melek huruf 84.32%, rata-rata angka partisipasi sekolah yang tinggi oleh penduduk miskin sebesar 96.33% yang berarti semangat penduduk miskin untuk bersekolah sangat tinggi. Persentase penduduk miskin yang tidak bekerja 37.25%, rata-rata penduduk miskin yang bekerja di sektor informal 54.77%, sedangkan yang bekerja di sektor formal masih sangat kecil yaitu 7.98%. Penduduk miskin yang bekerja di sektor pertanian 39.64% lebih tinggi daripada penduduk miskin yang bekerja di bukan sektor pertanian sebesar 23.11%. Rata-rata pengeluaran perkapita untuk makanan rumah tangga miskin sebesar 67.24%. Pengeluaran perkapita adalah rata-rata pengeluaran makanan rumah tangga dibagi dengan jumlah anggota rumah tangga yang bersangkutan. Rata-rata luas lantai rumah tangga miskin di provinsi NTB sebesar 59.35%, dengan luas lantai setiap rumah tangga lebih kecil dari 8m2 ≤ 8𝑚2 .
Hasil Analisis Biplot Berdasarkan prosedur analisis Biplot diperoleh hasil berupa grafik Biplot seperti pada Gambar 1.
252
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
a. Hasil grafik Biplot untuk 𝛼 = 0.5 ditunjukkan pada gambar di bawah ini:
Gambar 1. Pemetaan Biplot data karakteristik kemiskinan di provinsi NTB Pada penelitian ini dihasilkan grafik biplot dengan 𝛼 = 0.5. Alasan terpilihnya biplot dengan 𝛼 = 0.5 yaitu karena hasil kali matriks koordinat Objek (G) dan matriks koordinat variabel (H) sama dengan elemen-elemen pada matriks data awal 𝒀 ≅ 𝑮𝑯𝑻.Sehingga biplot dalam penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Biplot Simetri merupakan tipe Biplot yang membuat kesamaan penskalaan atau pembobotan pada baris dan kolom secara bersamaan, sehingga digunakan untuk menggambarkan gabungan vektor objek yaitu kabupaten/kota serta variabel yang merupakan karakteristik kemiskinan secara bersamaan dalam satu plot (grafik).
b. Interpretasi Informasi Biplot Biplot adalah upaya membuat gambar di ruang berdimensi banyak menjadi gambar di ruang dimensi dua. Informasi data yang disajikan dalam Biplot ditentukan berdasarkan nilai 𝑝2 ,semakin mendekati nilai satu berarti Biplot yang diperoleh dari matriks pendekatan berdimensi dua akan memberikan penyajian data yang semakin baik mengenai informasiinformasi yang terkandung pada data yang sebenarnya. Penyajian informasi ini bergantung pada nilai eigen(𝜆). Pada penelitian ini diperoleh nilai 𝜆1 sebesar 5231.74, dan 𝜆2 sebesar 1078.05,
Makalah Pendamping: Matematika 3
253
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
sehingga diperoleh nilai 𝑝2 sebesar 84.59%. Nilai 𝑝2 mendekati satu, maka Biplot dalam penelitian ini memberikan penyajian yang cukup baik mengenai informasi dari data yang sebenarnya.
c. Kedekatan Antar Objek (Kabupaten/kota) Informasi ini dijadikan panduan untuk mengetahui kabupaten/kota yang memiliki kemiripan karakteristik kemiskinan dengan kabupaten/kota lainnya. Kabupaten/kota yang berada pada kuadran yang sama dapat dikatakan memiki kesamaan karakteristik kemiskinan yang cukup dekat, jika dibandingkan dengan kabupaten/kota yang berada pada kuadran yang berbeda. Pada gambar 1. terlihat kabupaten/kota yang berada pada kuadran yang sama yaitu kuadran keempat, diantaranya Kota Bima dan Kota Mataram. Dapat dikatakan bahwa kedua kota tersebut memiliki kesamaan karakteristik kemiskinan. Selain itu juga dapat ditentukan melalui jarak Euclidean, dari plot yang dihasilkan dapat ditentukan jarak Kota Bima dan Kota Mataram sebesar 4.037, yang berarti kota kabupaten tersebut memiliki kemiripan karakteristik kemiskinan. Interpretasi yang sama juga berlaku untuk kabupaten/kota lainnya.
d. Interpretasi Nilai Variabel Pada Suatu Objek Informasi ini digunakan untuk menentukan karakteristik kemiskinan di setiap wilayah (kabupaten/kota). Suatu wilayah yang terletak searah dengan vektor karakteristik kemiskinan menunjukkan tingginya nilai karakteristik kemiskinan untuk wilayah tersebut. Atau dapat interpretasikan bahwa karakteristik kemiskinan untuk wilayah tersebut mempunyai nilai di atas rata-rata seluruh kabupaten/kota. Sebaliknya, jika suatu wilayah terletak berlawanan arah dengan vektor karakteristik kemiskinan maka nilai karakteristik kemiskinannya rendah atau di bawah nilai rata-rata seluruh kabupaten/kota. Sedangkan jika wilayah yang hampir berada di tengah-tengah berarti wilayah tersebut memiliki nilai karakteristik kemiskinan yang dekat dengan rata-rata. Pada gambar 1, terlihat bahwa Kabupaten Lombok Barat searah dengan arah vektor variabel (𝑋10 ). Sesuai dengan data asli, dimana luas lantai perkapita rumah tangga miskin (𝑋10 ) di Kabupaten Lombok Barat sebesar 79.19% di atas rata-rata keseluruhan yakni 59.35%. Contoh lainnya pada Kabupaten Lombok Utara yang searah dengan vektor 𝑋1 , hal ini menyatakan jumlah penduduk miskin di kabupaten tersebut sebesar 39.27% berada di atas ratarata yakni sebesar 19.92%. Contoh lainnya pada Kabupaten Lombok Tengah yang searah dengan vektor 𝑋5 , hal ini menandakan bahwa penduduk miskin yang bekerja di sektor informal pada kabupaten Lombok Tengah sebesar 68.34% berada di atas rata-rata keseluruhan yaitu 54.77%. Sedangkan variabel 𝑋6 berlawanan arah dengan kabupaten Lombok Tengah yang berarti penduduk miskin yang bekerja di sektor formal pada kabupaten tersebut sebesar 0.45% berada di bawah rata-rata seluruh kabupaten sebesar 7.98%. Interpretasi yang sama pada kota
254
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Mataram yang searah dengan vektor variabel 𝑋8 dan berlawan arah dengan vektor variabel 𝑋7 . Hal ini menandakan penduduk miskin yang bekerja di bukan sektor pertanian (𝑋8 ) sebesar 50.54% berada di atas rata-rata yakni 23.11%. Sedangkan penduduk miskin yang bekerja di sektor pertanian (𝑋7 ) sebesar 1.78% berada di bawah rata-rata yakni 39.64%. Interpretasi yang sama juga berlaku untuk kabupaten/kota dan karakteristik kemiskinan lainnya.
e. Keragaman Variabel (Karakteristik Kemiskinan) Informasi ini digunakan untuk melihat keragaman karakteristik kemiskinan setiap kabupaten/kota. Dengan informasi ini, bisa diperkirakan pada karakteristik kemiskinan yang mana strategi harus ditingkatkan dalam rangka menurunkan angka kemiskinan, dan juga sebaliknya. Dalam Biplot nantinya komponen-komponen dengan keragaman yang kecil digambarkan sebagai vektor yang pendek sedangkan komponen-komponen dengan keragaman yang besar digambarkan sebagai vektor yang panjang. Pada gambar 1 terlihat bahwa vektor terpanjang pada variabel 𝑋7 yaitu penduduk miskin yang bekerja di sektor pertanian, dengan nilai keragaman sebesar 34.162. Sesuai data aslinya penduduk miskin yang bekerja disektor pertanian (𝑋7 ) untuk kota Mataram sebesar 1.78%, paling kecil di antara 9 kabupaten/kota lainnya. Sedangkan kabupaten Bima menempati urutan ke sepuluh, dengan jumlah penduduk miskin yang bekerja disektor pertanian paling besar yaitu 55.85%. Vektor terpendek ada pada variabel 𝑋3 (angka partisipasi sekolah penduduk miskin), yang berarti keragaman data pada variabel 𝑋3 sebesar 0.232. Ini berarti angka partisipasi sekolah penduduk miskin sangat tinggi. Kota Bima menempati urutan pertama, dengan angka partisipasi sekolah penduduk miskin mencapai 100%, sedangkan yang terendah pada kota Mataram sebesar 92.58%. Hal ini menandakan program pemertintah provinsi NTB untuk meningkatkan angka partisispasi sekolah penduduk miskin sudah berhasil, terlihat dari nilai rata-rata angka partisipasi sekolah di 10 kabupaten/kota mencapai 96.34% (Data Tabel 1). Interpretasi yang sama juga berlaku untuk panjang vektor variabel lainnya. Secara berturut-turut panjang vektor variabel yang menunjukkan keragaman data karakteristik kemiskinan meliputi variabel 𝑋7 (penduduk miskin yang bekerja disektor pertanian) sebesar 34.162, 𝑋10 (Luas lantai perkapita rumah tangga miskin) sebesar 30.230, 𝑋8 (Penduduk miskin bekerja di bukan sektor pertanian) sebesar 17.389, 𝑋5 (Penduduk miskin yang bekerja di sektor informal) sebesar 9.307, 𝑋1 (Penduduk Miskin) sebesar 4.020, 𝑋4 (Penduduk miskin yang tidak bekerja) sebesar 3.146, 𝑋2 (angka melek huruf penduduk miskin) sebesar 3.140, 𝑋9 (Pengeluaran perkapita untuk makanan) sebesar 1.878, 𝑋6 (Penduduk miskin yang bekerja di sektor formal) sebesar 1.661, dan 𝑋3 (angka partisipasi sekolah penduduk miskin) sebesar 0.232. f.
Korelasi Antar Variabel (Karakteristik Kemiskinan)
Makalah Pendamping: Matematika 3
255
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Korelasi atau hubungan saling mempengaruhi antar karakteristik kemiskinan dapat diinterpretasikan dari penyajian grafik Biplot. Pada grafik Biplot, karakteristik kemiskinan digambarkan sebagai garis berarah. Dua karakteristik yang memiliki korelasi positif akan digambarkan sebagai dua garis dengan arah yang sama sehingga membentuk sudut sempit atau sudut lancip. Sedangkan jika dua buah karakteristik digambarkan sebagai dua garis yang berlawanan maka dikatakan memiliki korelasi negatif, sehingga membentuk sudut lebar atau tumpul. Namun jika dua buah karakteristik digambarkan dalam bentuk garis dengan sudut sikusiku maka dikatakan karakteristik kemiskinan tersebut tidak saling berkorelasi atau berhubungan. Sudut yang dibentuk antara dua karakteristik kemiskinan merupakan nilai cosinus. Semakin kecil nilai cosinus yang dibuat antara dua karakteristik kemiskinan maka semakin tinggi korelasinya. Sehingga diperoleh hasil bahwa jumlah penduduk miskin (𝑋1 ) dan pengeluaran perkapita untuk makanan penduduk miskin (𝑋9 )saling mempengaruhi dan berkorelasi positif. Hal tersebut ditentukan dari sudut yang terbentuk sebesar 18.03° . Semakin banyak jumlah penduduk miskin dalam satu keluarga, maka semakin banyak pengeluaran perkapita untuk makanan yang harus dikeluarkan. Contoh lainya yaitu pada karakteristik penduduk miskin yang bekerja di sektor informal (𝑋5 ) berkorelasi negative dengan penduduk miskin yang bekerja di sektor formal (𝑋6 ), dengan sudut yang terbentuk sebesar 173.84. Semakin banyak jumlah penduduk miskin yang bekerja di sektor informal maka semakin sedikit penduduk miskin yang bekerja di sektor formal. Interpretasi yang sama juga berlaku untuk karakteristik kemiskinan lainnya.
SIMPULAN DAN SARAN Simpulan Berdasarkan analisis hasil dan pembahasan, maka dapat disimpulkan hal-hal berikut: Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup baik mengenai informasi dari data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%. Biplot yang terbentuk dalam pada penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Wilayah yang memiliki kesamaan karakteristik kemiskinan ada pada kabupaten Bima dan kabupaten Sumbawa, dengan jarak Euclid terdekat sebesar 0.266. Sedangkan jarak terjauh ada pada kabupaten Lombok Tengah dan kota Mataram, sebesar 9.779. Keragaman karakteristik kemiskinan ditunjukkan dengan panjang vektor, dengan vektor terpanjang pada penduduk miskin yang bekerja di sektor pertanian (𝑋7 ) dan vektor terpendek pada angka partisipasi sekolah penduduk miskin (𝑋3 ). Saran. Selain menggunakan analisis Biplot, pemetaan karakteristik kemiskinan juga dapat dilakukan 256
menggunakan
Multidimensional
Scalling
atau
dengan
kombinasi
Biplot
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
menggunakan analisis faktor dan Cluster. Serta saran bagi pemerintah provinsi NTB dari hasil pemetaan ini diharapkan program-program pemerintah dalam mengentaskan kemiskinan lebih tepat sasaran, karena dari plot terlihat beberapa daerah yang memiliki karaktersitik kemiskinan yang sama. Sehingga nantinya diperoleh distribusi kesejahteraan yang merata di setiap kabupaten/kota.
DAFTAR PUSTAKA
Berita Resmi Statistik, 2012. BPS Provinsi NTB. BRS No. 44/07/52/TH.VI , 2 Juli 2012 Johnson, R.A. dan D.W. Wichern, 2002, Applied Multivariate Statistical Analysis, Fifth Edition. Prentice Hall Inc, New Jersey. Kohler, U. dan Luniak, M. (2005). Data inspection using Biplots. The Stata Journal Vol 5, Number 2, pp. 208–223. Matjik, A.A., dan Sumertajaya, (2011) I. M., Sidik Peubah Ganda dengan Menggunakan SAS. IPB Press. Dermaga. Bogor. Nugroho, S., 2008. Statistika Multivariat Terapan. UNIB Press. Bengkulu Rencer, A. C., 2002. Methods of Multivariate Analysis. Brigham Young University.
Makalah Pendamping: Matematika 3
257
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
PROBABILITAS WAKTU DELAY MODEL EPIDEMI ROUTING Dyah Wardiyani1, Respatiwulan, Sutanto Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sebelas Maret Surakarta 1)
[email protected] Abstrak Model epidemi routing menjelaskan pengiriman paket data pada jaringan mobile melalui analogi pada model epidemi penyebaran penyakit. Analogi didasarkan pada kemiripan proses dan variabel. Pengiriman paket data dapat dilihat berdasarkan banyaknya node yang menerima paket data. Perubahan banyaknyanode yang menerima paket data terhadap waktu dapat dinyatakan dengan persamaan diferensial. Waktu delay merupakan waktu yang dibutuhkan untuk mengirim paket dari satu node ke node yang lain. Setiap pengiriman paket data memiliki waktu delay yang berbeda, sehingga waktu delay dapat dipandang sebagai variabel random yang memiliki fungsi distribusi probabilitas. Tujuan penelitian ini adalah mengonstruksi model epidemi routing dan menentukan probabilitas waktu delay. Selanjutnya, model epidemi routing dan probabilitas waktu delay diterapkan pada kasus pengiriman informasi pada area militer dan disimulasikan dengan mengambil laju pengiriman paket, 𝛽yang berbeda. Hasil simulasi menunjukkan semakin besar 𝛽maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan probabilitas kumulatif waktu delay menuju 1. Kata kunci: delay, epidemi routing, mobile, node, dan probabilitas.
1. Pendahuluan Model epidemi merupakan model matematika yang dapat menggambarkan pola penyebaran penyakit. Banyak ilmuwan yang meneliti dan memodelkan pola penyebaran penyakit, diantaranya Mc.Kendrick dan Kermack [5]. Pada tahun 1927 Mc.Kendrick dan Kermack berhasil memodelkan pola penyebaran penyakit dalam bentuk deterministik yang sesuai dengan kasus epidemi sebenarnya. Kesesuaian model epidemi dengan kasus epidemi sebenarnya, mengakibatkan banyak dilakukan pengembangan model epidemi. Menurut Isham [4], pengembangan model epidemi dapat dilakukan dengan menambah variabel atau menambah perlakuan. Pengembangan model epidemi juga dapat dilakukan dengan melakukan analogi antara proses penyebaran penyakit dengan proses lain yang memiliki kemiripan proses. Salah satu proses yang mirip dengan penyebaran penyakit adalah proses pengiriman paket data pada routing (Zhang [10]). Routing merupakan proses pemilihan jalur pengiriman paket data pada suatu jaringan mobile (Andrew [1]). Jaringan mobile dibentuk oleh beberapa node yang dapat berpindah tempat atau bersifat mobile. Menurut Liu [7] dan Zhang [10], pengiriman paket data pada routing dapat dinyatakan dengan algoritma store- carry-forward. Maksud dari algoritma storecarry-forward adalah node menerimapaket data, membawa paket data dan mengirimkannya ke node lain yang belummemiliki paket data sampai semua node memiliki paket data. Menurut 258
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Small [8]dan Sun[9], algoritma store-carry-forward mirip dengan proses penyebaran penyakitpada model susceptible infected (SI ). Pada model SI, individu menularkanpenyakit ke individu lain yang belum terinfeksi. Karena kemiripan proses penyebaranpenyakit dan pengiriman paket data pada routing, maka dapat dilakukananalogi. Model analogi penyebaran penyakit dan pengiriman paket data pada routing disebut dengan model epidemi routing (Zhang [10]). Model epidemi routing menggambarkan pola pengiriman paket data pada routing berdasarkan banyaknyanode yang menerima paket data tiap waktu. Menurut Zhang [10], padamodel epidemi routing diharapkan mampu mencapai minimum waktu penundaanpengiriman paket data (waktu delay). Waktu delay merupakan selang waktudari pertama kali paket data diterima oleh sebuah node sampai dikirimkan ke nodeyang lain. Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti. Olehkarena itu waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay.Sehingga pada penelitian ini akan dikonstruksi ulang model epidemi routing danprobabilitas waktu delay.
2. Model Epidemi Routing Model epidemi routing merupakan model yang dapat menggambarkan pola pengiriman paket data pada jaringan mobile berdasarkan banyaknya node yang menerima paket data. Menurut Zhang [10], model epidemi routing dapat mudah dikonstruksi dengan menganalogikan pengiriman paket data dan penyebaran penyakit, berdasarkan proses dan variabel yang berpengaruh. Menurut Small [8] dan Sun [9], model epidemi yang sesuai dengan proses pengiriman paket data pada routing adalah model susceptible infected (SI). Pada model SI, populasi individu dibagi ke dalam dua kelompok, yaitu kelompok individu rentan (𝑆) dan kelompok individu terinfeksi penyakit (𝐼). Individu 𝑆 dapat terinfeksi penyakit dengan laju penularan sebesar b, sehingga banyaknya individu 𝑆 akan berkurang sebesar 𝑏𝑆𝐼 ke individu 𝐼. Individu rentan yang terus berkurang mengakibatkan semua individu akan terinfeksi penyakit. Karena pengiriman paket data pada routing dapat dianalogikan dengan model SI, asumsi pada model epidemi routing mengacu pada model SI. Berikut adalah asumsi-asumsi konstruksi model epidemi routing. 1. Pengiriman paket data terjadi pada suatu jaringan mobile dengan banyaknya node konstan. 2. Node dalam jaringan mobile tersebut dibagi ke dalam kelompok node tanpa paket dan node yang memiliki paket. 3. Setiap node memiliki peluang yang sama untuk mendapat paket data. 4. Hanya satu paket data yang dikirimkan
Makalah Pendamping: Matematika 3
259
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Pada model epidemi routing, node-node dibagi dalam kelompok node tanpa paket data (𝑆) dan kelompok node yang memiliki paket data (𝐼). Node 𝑆dapat terkirimi paket data dengan laju pengiriman paket data sebesar 𝛽, sehingga node 𝑆akan berkurang ke node 𝐼sebesar 𝛽𝑆𝐼. Karena setiap node memiliki kemungkinan yang sama untuk menerimat paket data, banyaknya node kelompok 𝑆berpindah ke kelompok 𝐼sebesar 𝛽𝑆𝐼. Sehingga proses pengiriman dan penerimaan paket data antar node disajikan dalam Gambar 1.
Gambar 1. Proses pengiriman dan penerimaan paket data antar node Banyaknya node pada kelompok 𝑆dan 𝐼pada waktu 𝑡, masing-masing dinyatakan sebagai 𝑆(𝑡) dan 𝐼(𝑡). Jika banyaknya node dalam jaringan mobile dinyatakan dengan 𝑁maka 𝑆(𝑡) = 𝑁 − 𝐼(𝑡). Dengan demikian perubahan banyaknya node yang menerima paket data terhadap waktu dapat dinyatakan sebagai 𝑑𝐼(𝑡) = 𝛽𝐼 𝑡 𝑁 − 𝐼 𝑡 , 𝑑𝑡
(2.1)
dengan laju pengiriman paket data 𝛽 > 0. Model epidemi routing menggambarkan pola pengiriman paket data berdasarkan banyaknya node yang menerima paket data. Persamaan (2.1) menyatakan perubahan banyaknya node yang menerima paket data terhadap waktu. Sehingga persamaan (2.1) perlu diselesaikan untuk mendapatkan banyaknya node yang menerima paket data tiap waktu. Persamaan (2.1) harus dibentuk ke dalam persamaan diferensial dengan variabel terpisah (Campbell [2]), yaitu 𝑑𝐼(𝑡) 𝐼 𝑡
1−
𝐼 𝑡 𝑁
= 𝛽 𝑁𝑑𝑡
(2.2)
Jika diasumsikan 𝐼(0) = 1 yang berarti mula-mula terdapat sebuah node yang memiliki paket data, maka banyaknya node yang menerima paket data dapat dinyatakan sebagai 𝐼 𝑡 =
𝑁 , 1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
(2.3)
dengan laju pengiriman paket data 𝛽 > 0. Jika nilai 𝛽semakin besar maka nilai 𝑒 −𝛽𝑁𝑡 semakin mendekati 0. Hal ini mengakibatkan banyaknya node yang menerima paket data mendekati 𝑁. Sedangkan jika 𝛽bernilai 0 maka 𝑒 −𝛽𝑁𝑡 bernilai 1, berakibat hanya terdapat sebuah node yang menerima paket data yaitu node awal. Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka banyaknya node yang menerima paket data semakin cepat mendekati N.
3. Probabilitas Waktu Delay 260
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Ketika terjadi pengiriman paket data pada jaringan mobile dimungkinkan terdapat waktu penundaan pengiriman paket data atau waktu delay (Groenevelt [3]). Menurut Zhang [10] dan Zhou [11], waktu delay merupakan selang waktu dari pertama kali paket data diterima oleh sebuah node sampai dikirimkan ke node yang lain, 𝑡 < 𝑇𝑑 < 𝑡 + 𝛥𝑡dengan 𝛥𝑡 kecil. Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi secara pasti. Oleh karena itu, waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay. Menurut Zhang [10], fungsi distribusi kumulatif dari 𝑇𝑑 , 𝑃𝑁 (𝑡) = 𝑃𝑟(𝑇𝑑 < 𝑡). Fungsi distribusi kumulatif 𝑇𝑑 sulit diperoleh secara langsung. Menurut Small [8] dan Lin [6] perubahan fungsi distribusi kumulatif 𝑇𝑑 untuk 𝛥𝑡kecil dapat dinyatakan dengan 𝑑𝑃𝑁 𝑡 𝑃𝑁 𝑡 + ∆𝑡 − 𝑃𝑁 𝑡 = lim ∆𝑡→0 𝑑𝑡 ∆𝑡 𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 − 𝑃 𝑇𝑑 > 𝑡 = lim − . ∆𝑡→0 ∆𝑡
3.1
Pada persamaan (3.1), 𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 = 𝑃(𝑡𝑖𝑑𝑎𝑘 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 [𝑡, 𝑡 + ∆𝑡]|𝑇𝑑 > 𝑡)𝑃(𝑇𝑑 > 𝑡) = (1 − 𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 )𝑃 𝑇𝑑 > 𝑡 . (3.2) Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 ditentukan berdasarkan durasi delay dan rata-rata banyaknya node yang menerima paket data. Karena waktu delay terdapat pada 𝑡, 𝑡 + ∆𝑡 maka durasi delay sebesar ∆𝑡, sedangkan rata-rata banyaknya node yang menerima paket data sebesar 𝛽𝐼(𝑡). Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 dinyatakan sebagai 𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 = ∆𝑡𝛽𝐼 𝑡 .
(3.3)
Persamaan (3.3) disubtitusikan ke persamaan (3.2), sehingga didapatkan 𝑃𝑟 𝑇𝑑 > 𝑡 + ∆𝑡 = 1 − ∆𝑡𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 .
(3.4)
Selanjutnya, persamaan (3.4) disubstitusikan ke persamaan (3.1), diperoleh 𝑑𝑃𝑁 𝑡 [𝑃 𝑇𝑑 > 𝑡 1 − ∆𝑡𝛽𝐼 𝑡 = lim − ∆𝑡→0 𝑑𝑡 ∆𝑡
− 𝑃 𝑇𝑑 > 𝑡
= 𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 . Karena 𝑃 𝑇𝑑 > 𝑡 = 1 − 𝑃(𝑇𝑑 < 𝑡), maka 𝑑𝑃𝑁 𝑡 = 𝛽𝐼 𝑡 1 − 𝑃𝑁 𝑡 . 𝑑𝑡
(3.5)
Persamaan (3.5) diselesaikan untuk mendapatkan persamaan yang menyatakan probabilitas waktu delay. Persamaan (3.5) harus dibentuk ke dalam persamaan diferensial dengan variabel terpisah (Campbell [2]). Jika diasumsikan 𝑃(0) = 0, maka penyelesaian persamaan (3.5) yaitu Makalah Pendamping: Matematika 3
261
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
𝑃𝑁 𝑡 = 1 −
𝑒𝛽𝑁𝑡
𝑁 , + (𝑁 − 1)
(3.6)
dengan laju pengiriman paket data 𝛽 > 0. Jika nilai 𝛽semakin besar maka nilai 𝑒 𝛽𝑁𝑡 juga semakin besar tergantung pada 𝑁. Hal ini mengakibatkan probabilitas kumulatif waktu delay semakin mendekati 1. Sedangkan jika 𝛽bernilai 0 maka 𝑒 𝛽𝑁𝑡 bernilai 1, berakibat probabilitas kumulatif waktu delay bernilai 0. Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka probabilitas kumulatif waktu delay semakin cepat mendekati 1.
4. Penerapan Kasus Pada bagian ini diberikan kasus pengiriman paket data jaringan mobile di area militer. Pada area militer tertentu terdapat 100 node mobile yang dapat mengirimkan paket data dengan laju 0.222 jam/node (Groenevelt [3]). Semua node dalam jaringan mobile tersebut diharapkan dapat menerima paket data dengan terdapat sebuah sumber atau node awal yang memiliki paket data. Banyaknya node pada waktu t pada jaringan mobile di area militer tersebut dapat dinyatakan dengan 𝐼 𝑡 =
100 . 1 + 99𝑒 −22.2𝑡
(4.1)
Pada model epidemi routing juga diharapkan mampu mencapai minimum waktu penundaan pengiriman paket data (delay).Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti. Oleh karena itu waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay. Fungsi distribusi kumulatif waktu delay pada jaringan mobile dalam area militer tersebut adalah 𝑃𝑁 𝑡 = 1 −
100 . 𝑒 22.2𝑡 + 99
(4.2)
Persamaan (4.1) dan persamaan (4.2) yang menyatakan banyaknya node yang menerima paket data dan probabilitas kumulatif waktu delay dapat dilihat pada Gambar 2. Gambar 2 (𝑎) menunjukan bahwa pada waktu 0.87 jam semua node dalam jaringan mobile telah menerima paket data. Gambar 2 (𝑏) menunjukan bahwa probabilitas kumulatif waktu delay kurang dari 0,87 jam dalam jaringan mobile menuju 1. Hal ini menunjukan probabilitas waktu delay mendekati 0 atau dapat dikatakan sudah tidak terjadi waktu delay. Sehingga semua node dalam jaringan mobile pada area militer tersebut menerima paket dan probabilitas delay mencapai minimum setelah 0,87 jam. Banyaknya node yang menerima paket data dan probabilitas waktu delay pengiriman paket data dalam area militer tersebut hanya dipengaruhi oleh laju pengiriman paket data.
262
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Gambar 2. (a) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay Pengaruh laju pengiriman paket data 𝛽terhadap pola pengiriman paket data dan probabilitas waktu delay dalam jaringan mobile dapat diperjelas dengan simulasi. Simulasi pola pengiriman paket data dan probabilitas waktu delay untuk 𝛽 = 0.15, 𝛽 = 0.222, 档𝑎𝑛 𝛽 = 0.9 dapat dilihat pada Gambar 3.
Gambar 3. (𝑎) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay dengan 𝛽 = 0.15, 𝛽 = 0.222, 𝑑𝑎𝑛 𝛽 = 0.9 Gambar 3 (𝑎) menunjukan bahwa untuk 𝛽 = 0.15 semua node dalam jaringan mobile dapat menerima paket data dalam waktu 1.28 jam, untuk 𝛽 = 0.222 memerlukan waktu 0.87 jam, dan 𝛽 = 0.9 memerlukan waktu 0.22 jam. Sedangkan dari Gambar 3 (𝑏) terlihat bahwa untuk 𝛽 = 0.15 probabilitas waktu delay menuju 1 setelah 1.28 jam, untuk 𝛽 = 0.222 setelah 0.87 jam, dan 𝛽 = 0.9 setelah 0.22 jam. Sehingga dapat disimpulkan bahwa semakin besar laju pengiriman paket data (𝛽)maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan probabilitas waktu delay cepat menuju 1. Hasil simulasi ini memperjelas pengaruh laju pengiriman paket data (𝛽)terhadap banyaknya node yang menerima paket data dan probabilitas waktu delay yang telah dijelaskan sebelumnya.
Makalah Pendamping: Matematika 3
263
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
5. Kesimpulan Model epidemi routing pada jaringan mobile dinyatakan sebagai 𝐼 𝑡 =
𝑁 , 1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
dengan syarat terdapat satu node awal yang memiliki paket data, sedangkan probabilitas kumulatifwaktu delay pada model epidemi routing yaitu 𝑃𝑁 𝑡 = 1 −
𝑒𝛽𝑁𝑡
𝑁 , + (𝑁 − 1)
dengan probabilitas waktu delay mula-mula 0, laju pengiriman paket data 𝛽 > 0 dan banyaknya node dalam jaringan N. Simulasi menunjukan semakin besar laju pengiriman paket data (𝛽) maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan probabilitas waktu delay juga semakin cepat menuju 1.
DAFTAR PUSTAKA [1] Andrew S.T., Computer Networks, Pearson Education, Inc., Amsterdam, 2003. [2] Campbell,L. Stephen, An Introduction to Differential Equations and Their Application, second ed., Wadswordh, Inc, California, USA, 1990. [3] Groenevelt, R., P. Nain, and G. Koole, The Message Delay in Mobile Ad Hoc Network, Perform (2005), no. 62, 210-228. [4] Isham, V., Stochastic Models for Epidemics, Research Report 263, Department of Statistical Science, University College London, 2004. [5] Kermack,W.O. and A. G. McKendrick, A Contribution to The Mathematical Theory ofEpidemics, Proceedings of the Royal Society of London Series A 115(1927), 700-721. [6] Lin, Y., B. Li, B. Liang, Stochastic Analysis of Network Coding in Epidemic Routing, ACN MobiOpp (2007). [7] Liu, J., X. Jiang, H. Nishiyama, and N. Kato, General Model for Store-CarryForwardRouting Schemes with Multicast in Delay Tolerant Networks, IEEE (2011), 494500. [8] Small, T., and Z.J. Haas, The Shared Wireless Infostation Model-A New Ad Hoc NetworkingParadigm, MobiHoc, Maryland, USA (2003), 233-244. [9] Sun,L., Epidemic Content Distribution in Mobile Networks, Master of science thesis, KTH Royal Institute of Technology, Stockholm, Swedia, Februari 2013. [10] Zhang, E., G. Neglia, J. Kurose, and D. Towsley, Performance Modeling of EpidemicRouting, Tech. Report 44, UMass Computer Science, 2005. [11] Zhou, S., L. Ying, S. Tirthapura, Delay, Cost and Infrastructure Tradeoff of Epidemic Routingin Mobile Sensor Networks, Proceedings of 11 the 6th International Wireless Communications and Mobile Computing Conference.
264
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
PIECEWISE POLYNOMIAL SMOOTH SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI DESA TERTINGGAL DI PROVINSI KALIMANTAN TIMUR Ita Wulandari1), Santi Wulan Purnami2), Santi Puteri Rahayu3) 1,2,3) Program Magister Jurusan Statistika FMIPA ITS Kampus ITS Keputih, Sukolilo, Surabaya 60111, Jawa Timur,
[email protected],
[email protected],
[email protected] Abstrak Support Vector Machine (SVM) adalah metode yang sangat popular untuk klasifikasi data biner pada data mining. SVM dapat diaplikasikan secara luas seperti pengenalan pola, analisis regresi, dan estimasi probabilitas. SVM memanfaatkan optimasi dengan quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti mengembangkan suatu teknik dengan mengubah formulasi SVM menggunakan smoothing technique yang disebut Smooth-SVM (SSVM). Teknik ini mampu mengkonversi quadratic programming pada SVM menjadi linear programming. Penelitian selanjutnya berkembang dengan memodifikasi smooth function pada SSVM kedalam bentuk polynomial smooth function seperti: quadratic polynomial function, fourth polynomial function, piecewise polynomial function dan spline function. Dibandingkan dengan ketiga polynomial smooth function lainnya, piecewise polynomial function mempunyai performansi yang lebih baik. Piecewise polynomial function jika diterapkan pada model SSVM, maka akan diperoleh model Piecewise Polynomial Smooth Support Vector Machine (PPSSVM). Penelitian ini menggunakan dua model yaitu Smooth-SVM (SSVM) dan PPSSVM yang ditemukan oleh Wu dan Wang. Penelitian ini akan mengkaji performansi piecewise polynomial function dan konvergensi kedua model secara teoritis serta mencoba menerapkan model terbaik untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data PODES (Potensi Desa) 2011. Keywords:
desa tertinggal, klasifikasi, piecewise polynomialsmooth functionSVM, Smooth SVM.
PENDAHULUAN SVM adalah suatu teknologi pembelajaran statistik yang dapat menghasilkan performansi generalisasi terbaik. SVM diperkenalkan untuk pertama kalinya oleh Vapnik pada tahun 1995 dan sangat berhasil melakukan prediksi, baik dalam kasus klasifikasi maupun regresi. Metode ini berusaha untuk menemukan fungsi pemisah optimal yang bisa memisahkan dua set data dari dua kelas atau disebut juga hyperplane terbaik diantara fungsi yang tidak terbatas (Gunn, 1998). Lee dan Mangasarian, (2001) menyatakan bahwa SVM memanfaatkan optimasi dengan quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti mengembangkan smoothing technique untuk mengubah optimasi yang terbatas menjadi optimasi yang tanpa batas menggunakan formulasi dari SVM standar. Teknik tersebut adalah Smooth-SVM (SSVM) yang mampu mengkonversi quadratic programming pada SVM menjadi linear programming dengan menggunakan algoritma Newton-Armijo. Makalah Pendamping: Matematika 3
265
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Para peneliti kemudian mengembangkan smooth function ke dalam bentuk fungsi polynomial. Yuan dan Huang, (2005) menemukan quadratic polynomial function dan fourth polynomial function. Luo dkk, (2006) menemukan piecewise polynomial function. Yuan dkk, (2007) menemukan spline function. Purnami dkk, (2009a, 2009b) membandingkan keempat fungsi yang ditemukan oleh peneliti-peneliti tersebut pada permasalahan diagnosis kanker payudara. Hasil yang diperoleh adalah piecewise polynomial function mempunyai performansi terbaik. Penelitian selanjutnya dilakukan oleh Wu dan Wang (2013) yang menemukan piecewise polynomial function yang berbeda rumus fungsinya dengan yang ditemukan Luo, dkk (2006). Penelitian tersebut memberikan kesimpulan bahwa piecewise polynomial function memiliki efisiensi, ketepatan serta akurasi yang terbaik. Pada penelitian ini akan membandingkan model PPSSVM yang ditemukan Wu dan Wang dengan model SSVM. Kedua model akan dilihat performansi smooth function dan konvergensi kedua model secara teoritis untuk mendapatkan model terbaik. Model terbaik selanjutnya diterapkan untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data PODES Tahun 2011.
METODE PENELITIAN Data dan Prosedur Penelitian Data yang digunakan dalam penelitian ini adalah data sekunder. Variabel respon berasal dari Kemendagri pada profil desa dan kelurahan 2011: data dasar tipologi klasifikasi, kategori desa kelurahan (2012). Variabel prediktor berasal dari BPS yaitu data PODES Provinsi Kalimantan Timur Tahun 2011 yang terdiri dari 16 variabel. Penelitian dilakukan terhadap 1465 desa. Untuk melakukan analisis data dalam penelitian ini digunakan program aplikasi MATLAB. Langkah-langkah analisis data penelitian ini antara lain sebagai berikut: 1.
Melakukan analisis secara teoritis performansi smooth function dan konvergensi kedua modeluntuk mendapatkan model terbaik. Langkah-langkah untuk menyelesaikan tahap ini adalah sebagai berikut: a.
Performansi smooth function: membandingkan selisih antara smooth function dengan plus function.
b.
Konvergensi kedua model: dengan membuktikan bahwa problem optimasi model SSVM dan PPSSVM dapat mendekati problem optimasi model awal ketika k mendekati tak hingga.
2. Model terbaik kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data PODES 2011. Langkah-langkahnya adalah sebagai berikut:
266
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
a.
Volume 2
Menggunakan fungsi kernel Gaussian dalam implementasi pembentukan model terbaik.
b.
Membagi data training dan testing menggunakan 10-fold cross validation.
c.
Mencari kombinasi log 2 dan log 2 v terbaik sebagai parameter model terbaik dengan memilih akurasi yang paling tinggi.
d.
Membangun model terbaik dengan algorithma Newton-Armijo.
e.
Evaluasi performansi klasifikasi dilihat dari akurasinya.
Teknik Analisis Data 1.
Support Vector Machine (SVM) Support Vector Machine (SVM)pertama kali diusulkan oleh Vapnik untuk klasifikasi
dua kategori atau binomial. Pada bentuk yang paling sederhana, SVM memisahkan titik-titik dari kelas yang berbeda, misalkan kelas {+1} dan {-1} dengan hyperplane tunggal pada ruang berdimensi banyak yang pada akhirnya partisi-partisi tersebut diselesaikan secara nonlinier. Hyperplane yang optimum diperoleh melalui program nonlinier, tepatnya quadratic programming (Bertsimas dan Shioda, 2007). Diberikan permasalahan klasifikasi dari sebanyak n objek dalam ruang dimensi Rp sehingga susunan data berupa matrik A berukuran n x p dan keanggotaan tiap titik yaitu yi terhadap kelas {+1} atau {-1} didefinisikan pada diagonal matriks D berukuran n xn. Untuk permasalahan klasifikasi program dari algorithma SVM standar adalah sebagai berikut ( SVM ||.||2 2
):
min
( w , , y )R p1n
ve ' y 12 || w ||22
(1)
dengan kendala D(Aw e ) y e
y 0 dimana: v
: Parameter yang ditentukan sebagai pengontrol (trade off)
y
: Vektor variabel slack berukuran n x 1 yang mengukur kesalahan klasifikasi dan bernilai nonnegatif.
e
: Vektor kolom berukuran n dan bernilai 1.
w
: Vektor normal berukuran p x1 .
: Nilai bias yang menentukan lokasi relatifhyperplane terhadap kelas asli. Hyperplane margin yang mungkin dibentuk dalam memisahkan objek-objek dalam
masalah klasifikasi dua kelas secara linier adalah sebagai berikut:
x ' w 0,
(2)
Makalah Pendamping: Matematika 3
267
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Sehingga kedua bidang memisahkan dua kelas dengan soft margin yang ditentukan oleh variabel slack nonnegatif, adalah sebagai berikut:
x ' w y i 1 untuk x ' Ai dan Dii 1
(3)
x ' w y i 1 untuk x ' Ai dan Dii 1 Dimana vektor x adalah bagian dari matriks A berukuran p x 1. Dimana i= 1,2,…,n. Persamaan di atas merupakan subject to bagi fungsi SVM yang dapat ditulis dalam satu persamaan matriks sebagai berikut:
D(Aw e ) y e dan y 0
(4)
Penyelesaian persamaan (1) akan mudah diselesaikan dengan meminimumkan fungsi Lagrange terhadap w, , y serta meminimumkan terhadap Lagrange multiplier α dan β .
L ( w , , y , α, β)
1 || w ||22 ve ' y α '(D( Aw e ) e ) β ' y 2
(5)
Nonlinier SVM dengan bidang pemisah yang nonlinier diperoleh dengan mentransformasi formulasi SVM standar sebagai berikut:
w A ' Du
(6)
Sangat sulit untuk mengetahui fungsi transformasi yang tepat, untuk itu pada SVM digunakan „kernel trik’. Teknik ini dapat tercapai tanpa perlu mengetahui pemetaan nonliniernya. Pemetaan tersebut dilakukan melalui sebuah fungsi kernel, yaitu (Hsu dkk, 2008): a.
Kernel Linier K xi , x xTi x
b.
(7)
Polynomial Kernel
K xi , x xTi x r , 0 d
c.
(8)
Fungsi Kernel Gaussian
K xi , x exp | xi x |2 , 0 d.
(9)
Eksponensial Kernel
K xi , x tanh xTi x r
(10)
Fungsi kernel yang umum digunakan adalah kernel Gaussian. Dengan
, r dan d merupakan
parameter kernel dan i,j=1,2,…,n. Dengan menggantikan A’A dengan kernel nonlinier K(A,A’) menghasilkan nonlinear generalized SVM adalah sebagai berikut:
1 minp1n ve ' y u ' D ' K ( A, A ')Du ( w , , y )R 2
(11)
dengan kendala D( K (AA ')Du e ) y e
y0 268
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
2.
Volume 2
Smooth Support Vector Machine (SSVM) Sejak pertama kali muncul, metode SVM telah banyak dikembangkan dan
dimodifikasi demi meningkatkan performansi dan efisiensinya. Tahun 2001 Lee dan Mangasarian merekomendasikan formulasi baru dari SVM dengan kernel dan nonlinier untuk analisis klasifikasi menggunakan smoothing technique sehingga dinamakan smooth support vector machine (SSVM). Pendekatan smoothing Lee dan Mangasarian. (2001) menjadikan variabel slack y menjadi 2-norm yang diboboti
v . Dengan demikian problem optimasi pada SSVM adalah: 2
v 1 min y ' y w ' w 2 w , , y 2 2
(12)
dengan kendala D(Aw e ) y e
y 0, di mana untuk memperoleh solusi problem (12), kendala-kendalanya dapat ditulis sebagai berikut:
y (e D(Aw e ))
(13)
Subtitusi persamaan (13) terhadap persamaan (12) menghasilkan fungsi objektif tanpa kendala sebagai berikut
v 1 min || (e D( Aw e )) ||22 (w ' w 2 ) w , 2 2
(14)
Dimana () menggantikan komponen-komponen bernilai negatif dengan nilai nol. Fungsi objektif dalam persamaan (14) tidak memiliki turunan kedua, smoothing technique yang diusulkan Lee dan Mangasarian (2001) dilakukan dengan menggantikan fungsi plus dengan p(x,
) yaitu integral dari fungsi sigmoidneural network (1 exp( x))1 atau dapat dituliskan sebagai berikut
p( x, ) x
1
log(1 x ), 0
(15)
di mana adalah smoothing parameter. Menggantikan dengan p(x, ), maka diperoleh model SSVM sebagai berikut
min (w, ) minn1
( w , )Rn1
( w ,b )R
v 1 || p(e D( Aw e ), ||22 (w ' w 2 ) 2 2
(16)
Sedangkan problem optimasi untuk SSVM non linier diperoleh sebagai berikut:
v 1 minn1 (w, ) : minn1 || p(e D( K ( A, A ')Du e ), ) ||22 (u ' u 2 ) ( u , )R ( u , )R 2 2 Makalah Pendamping: Matematika 3
(17)
269
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Program optimasi linier maupun non linier dapat diselesaikan dengan algoritma NewtonArmijo. Langkah-langkah algoritma Newton-Armijo dimulai dengan inisiasi (w 0 , 0 ) R n1 , kemudian mengulangginya sampai gradient dari fungsi objektif (16) atau (17) sama dengan nol atau (wi , i ) 0 . Selainnya, menghitung (wi 1 , i 1 ) sebagai berikut : 1)
Newton Direction: menentukan direction d R i
n 1
dengan menyelesaikan n +1
persamaan linier dengan n +1 variabel sebagai berikut:
2 (wi , i )d i (wi , i )' 2)
(18)
Armijo Stepsize: memilih stepsize i R sedemikian hingga:
w
i 1
, i 1 wi , i i d i
(19)
1 1 2 4
dimana i maksimumkan 1, , ,... sehingga:
wi , i
w , d w , d i
i
i
i
i
i
i
i
(20)
1 2
dengan 0,
i i Saat w , 0 , iterasi pada algoritma Newton-Armijo berhenti, dan
diperoleh nilai w dan yang konvergen. Dengan demikian fungsi pemisah yang diperoleh untuk kasus klasifikasi linier adalah :
f ( x) sign(x ' w ),
(21)
Sedangkan fungsi pemisah untuk kasus klasifikasi nonlinier adalah sebagai berikut:
f ( x) sign(x ' w ) sign(u ' D ' K (A, A ') ),
(22)
Seperti yang dijelaskan sebelumnya, Lee dan Mangasarian (2001) menemukan SSVM dengan menggantikan fungsi plus dengan p(x, ) yaitu integral dari fungsi sigmoid neural network (1 exp( x))1 atau seperti pada persamaan (15), di mana adalah smooth function. Beberapa peneliti kemudian memodifikasi smooth function ke dalam bentuk polynomial smooth function, yaitu quadratic polynomial function, fourth polynomial functionl, spline polynomial function, dan piecewise polynomial function. Fungsi piecewise polynomial salah satunya diusulkan oleh Wu dan Wang adalah sebagai berikut (2013):
270
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
1 x , 0, 3k 3 3 2 1 1 , x 0, 2 k x 3k 3k f ( x, k ) 3 3 2 1 1 x k x ,0 x , 2 3k 3k 1 x , x, 3k 3.
(23)
Seleksi Parameter dan Evaluasi Ketepatan Klasifikasi Seleksi parameter yang digunakan dalam penelitian ini menggunakan uniform design
(UD) dalam dua tahap. Pada dasarnya tahap pertama digunakan untuk mencobakan kombinasikombinasi parameter v dan . Huang dkk, (2007) menggunakan nilai parameter logaritma berbasis 2 atau logaritma biner. Perlu diperhatikan bahwa nilai log 2 v dan log 2 digunakan paling banyak satu kali dalam metode UD tersarang dan tidak ada titik yang ditempatkan di sudut. Metode UD pada penelitian ini menggunakan 10-fold cross validation
dalam
pembagian data training-testing. Metode ini melakukan pengulangan sebanyak 10kali untuk membagi sebuah himpunan contoh (sampel) secara acak menjadi 10-subset yang saling bebas. Setiap ulangan disisakan satu subset untuk testing dan sisanya digunakan untuk training. Hasil dari percobaan dan pembuktian teoritis, menunjukkan bahwa 10-fold cross validation adalah pilihan terbaik untuk mendapatkan hasil validasi yang akurat (Kohavi, 1995). Ukuran ketepatan klasifikasi dapat dilihat dari akurasi klasifikasi. Akurasi menunjukkan performansi teknik klasifikasi secara keseluruhan, semakin tinggi akurasi klasifikasi berarti semakin baik performansi teknik klasifikasi.
Tabel.1 Confusion Matrix Untuk Hasil Klasifikasi Biner Kelas prediksi Kelas sebenarnya
Positif
Negatif
Positif
tp
fn
Negatif
fp
tn
Keterangan : tp
: true positive (sebenarnya positif dan diklasifikasikan positif)
tn
: true negative (sebenarnya negatif dan diklasifikasikan negatif)
fp
: false positive (sebenarnya negatif tetapi diklasifikasikan positif)
fn
: false negative (sebenarnya positif tetapi diklasifikasikan negatif)
Makalah Pendamping: Matematika 3
271
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Akurasi klasifikasi (%) =
tp tn (24) tp fp tn fn
HASIL PENELITIAN DAN PEMBAHASAN
Penelitian ini diawali dengan analisis secara teoritis yang terdiri dari dua tahap. Tahap pertama menganalisis performasi smooth function dari kedua model dilanjutkan dengan menganalisis konvergensi dari kedua model. Tahap berikutnya adalah menerapkan model terbaik untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur dengan data PODES 2011.
Performansi smooth function Lemma 1:
p( x, ) x
1
log(1 x ), 0 , dan x adalah plus function. Untuk x R dan x ,
maka akan diperoleh hasil sebagai berikut: (i)
p( x, k ) x ;
2 2 (ii) for p 0,| x | p, p( x, ) x (log 2 / ) (2 / )log 2.
Pembuktian (i)
Untuk 0 x , p( x, ) ( x ) x
1
log(1 x ) x
1
log 2
Untuk x 0 maka didapatkan: p( x, ) ( x ) p( x, ) p(0, )
Oleh karena itu p( x, ) ( x )
1
1
log 2
log 2 atau p( x, ) x
(ii) Untuk 0 x , maka p( x, )2 ( x )2 x
1
2
log 2 (1 x )
2x
log(1 x )
log 2 2 log 2 2
Untuk x 0 , maka p( x, )2 adalah fungsi monoton naik, sehingga didapatkan:
log 2 p( x, ) ( x ) p( x, ) p(0, ) 2
2
2
2
2
log 2 2 log 2 2
Oleh karena itu p( x, ) 2 ( x ) 2
Theorema 1. Piecewise function yang didefinisikan pada (23) mempunyai sifat:
272
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
(i)
Volume 2
f ( x, k ) C1 (), f ( x, k ) C 2 (), x ;
(ii) Untuk semua x R, f ( x, k ) x ; (iii) Untuk semua x R, then f ( x, k )2 x2 1
216k 2
Pembuktian. (i)
f(x,k) memenuhi persamaan pada titik x 31k , x 0, 1
𝑓 −3k , k = 0, lim− 𝑓 𝑥, 𝑘 = lim+ 𝑓 𝑥, 𝑘 , 𝑥→0
1
𝑓′ −3k , 𝑘 = 0, 1
𝑓′′ −3k , 𝑘 = 0,
𝑥→0
lim 𝑓′ 𝑥, 𝑘 = lim+ 𝑓′ 𝑥, 𝑘 ,
𝑥→0−
𝑥→0
lim− 𝑓′′ 𝑥, 𝑘 = lim+ 𝑓′′ 𝑥, 𝑘 ,
𝑥→0
𝑥→0
𝑓
1 1 , 𝑘 = 3𝑘 3𝑘 1 𝑓′ −3𝑘 , 𝑘 = 1 1 𝑓′′ −3𝑘 , 𝑘 = 0
Jika x 31k , x 0, disubtitusikan ke dalam persamaan f(x,k), maka hasil pada (i) akan diperoleh dengan mudah. (ii)
f ( x, k ) x ; Jika
1 3 1 x 0 , gunakan persamaan Q( x) f ( x, k ) ( x) k 2 ( x k )3 x 3k 2 3
Sehingga Q' ( x)
9 2 1 k ( x )2 2 3k
Q' ( 31k ) 0 Dan
Q" ( x) 9k 2 ( x
1 1 ) 9k 2 ( x ) 0 . Ini mengindikasikan bahwa 3k 3k
Q( x)
monoton turun pada 31k , 0 Jika 0 x Sehingga
1 3 1 , gunakan persamaan Q( x) f ( x, k ) ( x) x k 2 ( x)3 x 3k 2 3k
9 1 Q ' ( x) 1 k 2 ( x) 2 2 3k
Q' ( 31k ) 0 Dan Q" ( x) 9k 2 (
1 1 x) 9k 2 ( x) 0 . Ini mengindikasikan bahwa Q( x) 3k 3k
monoton turun pada 0, 31k . Sehingga Q( x) Q 31k f ( x, k ) ( x) (iii) Jika
x
1 1 atau x , maka nilai dari f(x,k) dan x+ adalah sama, sehingga 3k 3k
f ( x, k )2 x2 0 Pertidaksamaan pada (iii) terpenuhi.
Makalah Pendamping: Matematika 3
273
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Jika 31k x 0 , maka ketika x 0 , maka f ( x, k )2 x2 f ( x, k )2 . Sebab f ( x, k ) adalah
fungsi
positif, kontinu dan
fungsi
sehingga akan didapatkan f ( x, k ) 2 f (0, k )2
31k x 0
monoton naik untuk
1 1 2 324k 216k 2 2
3 3 2 1 1 2 2 2 s ( x ) f ( x , k ) x x k x untuk 0 x , misalkan x 2 3k 3k 6
9 1 1 k 4 x 3k 2 x x 4 3k 3k
3
Untuk mendapatkan hasil, maka a ditransformasi menjadi a=kx , a 0, 1
Setelah
3 s ( x) 2 k
mensubsitusi
a=kx
ke
dalam
persamaan
3
di
atas
a=
0.0605
maka,
6 3 3 1 1 a a a 3 3 4
1
Untuk a 0, , 3
titik
maksimum
s(a) f ( x, k )2 x2 0.0046 f ( x, k ) 2 x2
pada
1 . 216k 2
s(a)
adalah
Sehingga
diperoleh
dan
hasil
1 216k 2
Berdasarkan hasil pada Lemma 1 dan Theorema 1, maka diperolah perbandingan performansi dari smooth function adalah sebagai berikut: Theorema 2 (Lee dan Mangasarian, 2001). Jika 1k , dan k>0. Maka hasil dari performansi smooth function adalah: (i) Jika smooth function yang didefiniskan pada (15), maka berdasarkan pada Lemma 1 diperoleh:
2 1 1 2 2 log 2 p( x, k ) 2 x2 log 2 log 2 2log 2 2 0.69267 2 k k k k
(25)
(ii) Jika smooth function yang didefiniskan pada (23), berdasarkan pada Theorem 1 maka,
f ( x, k )2 x2
1 1 0.0046 2 2 216k k
(26)
Theorem 2 menunjukkan bahwa piecewise function f(x,k) mempunyai performasi terbaik untuk plus function x+. Ketika k mempunyai nilai yang pasti, maka akan sangat mudah mendapatkan perbedaan dari smooth function di atas. Konvergensi SSVM dan PPSSVM
274
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Pembuktian untuk konvergensi dari model SSVM dan PPSSVM akan diperoleh ketika k mendekati tak hingga. Hal tersebut diperoleh ketika problem optimasi mendekati model awal (15). Theorema 3 (Lee dan Mangasarian, 2001). Jika
A Rmxn , R mx1 , definisi dari fungsi riil
f ( x) : Rn R dan g ( x, k ) : Rn N R adalah sebagai berikut: f ( x)
1 2
g x, k
Ax
2 2
1 x 2
2 2
2 1 1 f Ax , k 2 x 2 2
2 2
Untuk model SSVM dengan α > 0, maka: (i)
f ( x) dan g ( x, k ) adalah fungsi kecebungan yang kuat.
(ii)
x* adalah solusi unik untuk min xRn f x dan xk* juga merupakan solusi uniq dari
min xRn g x, k (iii)
Untuk
0
x x * k
* 2
, diperoleh pertidaksamaan :
m log 2 log 2 Dimana max Ax* b 2y 1i m 2
2
x* dan xk* memenuhi lim xk* x*
(iv)
i
(27)
(28)
k
Untuk model PPSSVM, maka : (i)
f ( x) dan g ( x, k ) adalah fungsi kecebungan yang kuat.
(ii)
x* adalah solusi unik untuk min xRn f x dan xk* juga merupakan solusi uniq dari
min xRn g x, k (iii)
Untuk
k 1 x* dan xk* keduanya memenuhi
xk* x*
2
m 216k 2
(29)
x* dan xk* memenuhi lim xk* x*
(iv)
(30)
k
Pembuktian Model SSVM dan PPSSVM Pada point (i) dan (ii) baik model SSVM dan PPSSVM mempunyai pembuktian yang sama, yaitu: 2
(i) f ( x) dan g ( x, k ) adalah fungsi kecembungan yang kuat karena . 2 adalah fungsi kecembungan yang kuat. Jika Lv ( f ( x)) adalah level set dari f ( x) dan Lv ( g ( x, k )) adalah level set dari g ( x, k ) , maka berdasarkan pada hasil (ii) Theorem 1 diperoleh:
Lv (( f ( x, k ) Lv ( f ( x)) x | x
Makalah Pendamping: Matematika 3
2 2
2v
275
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Oleh karena itu, Lv ( g ( x, k )) dan
Lv ( f ( x)) adalah strict convex set. Dikarenakan hal
tersebut, keduanya merupakan solusi yang unik untuk min xRn f x dan min xRn g x, k . (ii) Jika x* adalah problem optimasi untuk min xRn f x dan xk* adalah problem optimasi untuk min xRn g x, k , disebabkan oleh problem optimasi dan sifat kecembungan dari
f ( x) dan g ( x, k ) , maka pertidaksamaan yang diperoleh adalah:
f xk* f x* f x* xk* x*
1 * xk x* 2
f x* , k f xk* , k f xk* , k x* xk*
2 2
1 xk* x* 2
1 * *2 1 * xk x xk x* 2 2 2
2 2
2 2
Untuk pembuktian point (iii) dan (iv) adalah sebagai berikut: Model SSVM (iii) p( x, ) 0 , maka:
xk* x* g x* , f x* f xk* , f ( xk* ) 2 2
g ( x* , ) f ( x* )
2 1 1 p( Ax* b), ( Ax* b) 2 2 2
Sehingga diperoleh x x * k
* 2 2
2 2
2 m log 2 2y log 2 2
(iv) Ketika k mendekati tak hingga , maka:
lim x x * k
k
* 2 2
2 m log 2 2y lim log 2 0 Sehingga lim xk* x* k 2 k
Model PPSSVM (v) Jika kedua persamaan diatas dijumlahkan dengan catatan
f ( x, k ) x maka akan
diperoleh:
xk* x* f xk* f x* f x* , k f xk* , k 2
2
g x , k f x* f xk* , k f xk* f x* , k f x*
*
1 f Ax* , k 2
2 2
1 2
Ax
*
2 2
Berdasarkan pada hasil (iii) pada Theorema 3
xk* x*
2 2
m , maka diperoleh 216k 2
kesimpulan bahwa persamaan (29) adalah benar. 276
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
(vi) Ketika k mendekati tak hingga pada (29), maka diperoleh
lim xk* x* k
2 2
m 0 Sehingga lim xk* x* 2 k k 216k
lim
Hasil dari (iv) pada Theorema 3 menjelaskan bahwa problem optimasi model PPSSVM mendekati model SVM standar ketika k mendekati positif tak hingga. Hasil analisis teoritis menunjukkan bahwa model PPSSVM lebih baik dibandingkan dengan model SSVM. Untuk menunjukan secara jelas perbedaan performansi smooth function dengan plus function, maka kita gunakan k=10 untuk semua fungsi tersebut dan hasilnya dapat dilihat pada gambar 1.
Gambar 1. Perbandingan performansi smooth function (k-=10)
Terlihat pada Gambar 1 bahwa piecewise polynomial function mempunyai performansi yang terbaik untuk plus function. Hal tersebut ditunjukkan pada kurva piecewise polynomial function yang lebih mendekati pada kurva plus function.
Aplikasi Model Terbaik PPSSVM yang ditemukan Wu dan Wang adalah model terbaik hasil analisis secara teoritis. Model ini kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur. Variabel prediktor yang digunakan dalam penelitian ini sebanyak 16 variabel dengan unit analisis adalah 1465 desa. Hasil Output MATLAB untuk model SSVM dan PPSSVM diperoleh: Tabel 2. Hasil Output model SSVM dan PPSSVM Keterangan
Nilai SSVM
Nilai PPSSVM
Terr
0.11655
0.106826
Verr
0.118089
0.116041
Best C
1.778279
23.71374
Best Gamma
8.42E-06
5.255e-06
Elapse
9.001258
5137.425
Makalah Pendamping: Matematika 3
277
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Point
< 21 x 2 double>
< 21 x 2 double>
Ratio
1
1
Sumber : Hasil Output MATLAB Ketepatan klasifikasi untuk desa tertinggal di Provinsi Kalimantan Timur dapat dilihat dari tingkat akurasinya. Berdasarkan Tabel 2, maka diperoleh akurasi model PPSSVM: Akurasi untuk data training
: 99.89%
Akurasi untuk data testing
: 99.88%
Jika dibandingkan dengan model SSVM maka model PPSSVM mempunyai tingkat akurasi yang lebih baik, walaupun dapat dikatakan relatif tidak jauh berbeda untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data PODES 2011.
SIMPULAN DAN SARAN Analisis secara teoritis menunjukkan bahwa performansi dan konvergensi piecewise polynomialfunction penemuan Wu lebih baik dibandingkan dengan smooth function dan model terbaik yang didapatkan adalah model PPSSVM. Penerapan model terbaik PPSSVM pada klasifikasi desa tertinggal di Provinsi Kalimantan Timur mendapatkan akurasi yang relative lebih tinggi dibandingkan dengan model SSVM. Penelitian ini menggunakan algorithma Newton Armijo dalam menentukan parameter dan model terbaik, sedangkan pembagian data testing dan training menggunakan 10 fold – cross validation. Peneliti menyarankan untuk menggunakan polynomial smoothing function yang lebih baik pada penelitian berikutnya. Selain itu dapat pula dicoba beberapa k fold – cross validation pada kasus yang sama ataupun berbeda.
DAFTAR PUSTAKA Andari, S. (2013), Smooth Support Vector Machine dan Multivariate Adaptive Regression Splines Untuk Mendiagnosis Kanker Payudara. Tesis ITS. Anguita, D., Ghelardoni, L., and Ghio, A., (2012). The „K‟ in K-fold Cross Validation. ESANN 2012 proceedings, European Symposium on Artificial Neural Network, Computational Intelligence and Machine Learning. Bruges (Belgium). Badan Pusat Statistik, (2005), Identifikasi dan Penentuan Desa Tertinggal 2002. BPS, Jakarta. Bertsimas, D. and Shioda, R. (2007), Clasification and regression via integer optimazion, Journal of Operation Research, Vol 55, No.2, hal 252-271. Breiman, L., Friedman, J., Olshen, R. and Stone, C. (1984). Classification and Regression Trees, Wadsworth International Group. Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan Kelurahan 2011: Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan Menurut Provinsi, Dirjen PMD Kemendagri, Jakarta.
278
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Fang, K.T., Winker, P., Lin, D.K.J., and Zhang, Y. (2000), Uniform Design: Theory and Application, American Statistical Association and American Society for Quality, Vol. 42, No 3, hal 237 – 248. Gajdos, C., tarter, P.I., Bleiweiss, I.J., Herman, G., de Csepel, J., Estabrook, A., and Rademaker, A.W. (2002), Mammography appearance of nonpalpable breast cancer reflects pathologi characteristics, Annals of Surgery, Vol 235, No. 2, hal 246 – 251.S Gunn, S. (1998), Support Vector Machines for Clasification and Regression, Technical Report, ISIS. Huang, C.M., Lee, Y.J., Lin D.K.J., and Huang, S.Y. (2007), Model selection for support vector machine via uniform design, Computational Statistics and Data Analysis, Vol. 52. hal. 335346. Hsu, C.W., Chang, C. C., and Lin, C. J. (2008). A practical guide to Support Vector Classification, Taipe: Information Engineering National Taiwan University. Kohavi, R. (1995), A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection, Appears in the International Joint Coference on Artificial Intelligence (IJCAI), 1995. Luo, L., Lin, C., Peng, H. and Zhou, Q. (2006), A Study on Piecewise Polynomial Smooth Approximation to the Plus Function,In proceedings of the ICARCV. Lee, Y.J., and Mangasarian, O.L. (2001), A Smooth Support Vector Machine, Jurnal of Computational Optimization and applications 20:5-22. Mangasarian, O.L., and Musicant, D.R. (1999), Succesive overrelaxation for support vector machines, IEEE Transactions on Neural Network, 10, hal. 1032 – 1037. Metz, C.E. (2006), Receiver Operating Characteristic Analysis: A Tool for the Quantative Evolution of Observer Performance and Imaging Systems, Journal of Amerian College of Radiology, Vol.3, hal. 413 – 422. Purnami, S.W., and Embong, A. (2008b), Smooth Support Vector Machine for breast cancer classification, The 4th IMT-GT 2008 Conference of Mathematics, Statistics and Its Application (ICMSA 2008), Banda Aceh, Indonesia. Purnami, S.W., Embong, A., Zain, J.M., and Rahayu, S.P. (2009), A Comparison of Smoothing Function In Smooth Support Vector Machine, will be presented in International Conference on Software Engineering & Computer Systems. Purnami, S.W., Embong, A., and Zain, J.M. (2009), Application of data mining technique using best polynomial smoot support vector machine in breast cancer diagnosis, International Conference in Robotic, Vision, Signal Symposisum and Power Application (Rovsip 2009) Langkawi Kedah, Malaysia. Vapnik, V. (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York
Makalah Pendamping: Matematika 3
279
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Wu, Q., andWenqing, W. (2013), Piecewise-Smooth Support Vector Machine for Clasification, Hindawi Publishing Corporation Matematical Problems in Engineerin, Volume 2013, Article ID 135149. Yuan, Y., and Huang, T. (2005),
A Polynomial Smooth Support Vector Machine for
Classification, Springer-Verlag, Berlin Heidelberg, LNAI 3584: 157-164. Yuan, Y., Yan J., and Xu, C. (2005), Polynomial Smooth Support Vector Machine (PSSVM), Chinese Journal of Computers, 28: 9-17. Yuan, Y., Fan, W., and Pu, D. (2007), Spline Function Smooth Support Vector Machine For Clasification, Journal of Industrial and Management Optimization 3(3): 529 – 542.
280
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
ANALISIS KETEPATAN KLASIFIKASI STATUS KETERTINGGALAN DESA DENGAN PENDEKATAN REDUCE SUPPORT VECTOR MACHINE (RSVM) DI PROVINSI JAWA TIMUR Herlina Prasetyowati Sambodo1), Santi Wulan Purnami2), Santi Puteri Rahayu3) 1, 2, 3 Program Pascasarjana Jurusan Statistik Fakultas MIPA ITS Jl. Keputih Sukolilo Surabaya, 60111 e-mail:
[email protected],
[email protected],
[email protected] Abstract Kemiskinan merupakan salah satu masalah serius yang dihadapi oleh bangsa ini. Pelaksanaan program pengentasan kemiskinan secara langsung diimplementasikan dengan perumusan beberapa program yang ditujukan untuk membantu kantong-kantong (wilayah) kemiskinan dengan sasaran wilayah merujuk kepada identifikasi desa tertinggal. Oleh karena itu identifikasi mengenai status ketertinggalan desa yang tepat sangat diperlukan terlebih jika itu berhubungan dengan masalah yang cukup krusial seperti perencanaan program pembangunan dan bantuan dana untuk pembangunan. Beberapa penelitian telah banyak dilakukan untuk melakukan klasifikasi terhadap status ketertinggalan desa. RSVM adalah metode klasifikasi untuk data yang berukuran besar dengan beberapa keunggulan seperti waktu pemrosesan yang lebih pendek dan penggunaan memori yang lebih kecil. Metode tersebut menggunakan fungsi kernel dan teknik K-fold Cross Validation (KCV) dalam seleksi model dan estimasi error. Penelitian ini akan mengkaji dan membandingkan penggunaan lebih dari satu fungsi kernel dan mengatur jumlah subset dalam teknik KCV sehingga mendapatkan estimasi yang tepat dalam pembentukan model terbaik pada klasifikasi status ketertinggalan desa di Provinsi Jawa Timur. Keywords: Desa Tertinggal, Klasifikasi, Fungsi Kernel, KCV, RSVM.
PENDAHULUAN Kemiskinan merupakan salah satu masalah yang dihadapi oleh bangsa ini. Pemerintah telah berupaya keras untuk terus menekan angka kemiskinan, dengan terus memperbaiki perencanaan pembangunan dengan tujuan untuk meningkatkan kesejahteraan masyarakat. Upaya tersebut dapat dilihat melalui lebih dari 50 program penanggulangan kemiskinan yang terdapat di 21 kementrian dan lembaga negara (Menko Kesra, 2009). Pelaksanaan program pengentasan kemiskinan secara langsung pada awalnya diimplementasikan oleh dengan perumusan beberapa program yang ditujukan untuk membantu kantong-kantong (wilayah) kemiskinan dengan sasaran penduduk miskin. Sasaran wilayah merujuk kepada identifikasi wilayah-wilayah (desa/kecamatan) miskin/tertinggal. Sejak tahun 2009, pemerintah melalui Tim Koordinasi Penanggulangan Kemiskinan (TKPK) yang selanjutnya menjadi Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), akan meningkatkan cakupan serta keterlibatan masyarakat melalui harmonisasi dan sinkronisasi program penanggulangan kemiskinan agar lebih efektif dan terukur tingkat keberhasilannya (Menko Kesra, 2009). Harmonisasi dan sinkronisasi program penanggulangan kemiskinan diimplementasikan melalui pengelompokan tiga klaster program, yaitu Program Bantuan dan Perlindungan Sosial, Program Pemberdayaan Masyarakat (PNPM) Mandiri, serta Program Pemberdayaan Usaha Makalah Pendamping: Matematika 3
281
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Mikro dan Kecil dengan Kredit Usaha Rakyat (KUR) sebagai salah satu instrumennya (TNP2K, 2012). PNPM Mandiri merupakan payung dan kerangka kebijakan bagi program-program penanggulangan kemiskinan berbasis pemberdayaan masyarakat yang merupakan instrumen untuk mengkoordinasikan seluruh program kemiskinan berbasis pemberdayaan masyarakat pada semua kementerian dan lembaga (Menko Kesra, 2009). Salah satu ciri program PNPM Mandiri adalah memberikan Bantuan Langsung Masyarakat (BLM) untuk kegiatan yang dilaksanakan secara swakelola oleh masyarakat. Ruang lingkup kegiatan PNPM Mandiri terbuka bagi semua kegiatan penanggulangan kemiskinan yang diusulkan dan disepakati masyarakat yang diantaranya meliputi penyediaan prasarana/sarana lingkungan dan infrastruktur pemukiman, sosial dan ekonomi melalui kegiatan padat karya (TNP2K, 2012). Desa sasaran program dan kegiatan telah ditetapkan oleh pemerintah melalui Keputusan Menteri Negara Pembangunan Daerah Tertinggal. Sehubungan dengan penentuan desa sasaran tersebut, Badan Pusat Statistik (BPS) sebagai penyedia data resmi statistik pemerintahan di Indonesia, memberikan data dasar sekaligus melakukan identifikasi dan pengelompokan desa tertinggal sebagai pendekatan untuk mengidentifikasi daerah kantong-kantong kemiskinan. Penetapan kriteria ketertinggalan selanjutnya dilakukan dengan menggunakan enam kriteria dasar sesuai kepmen PDT nomor 1 Tahun 2005, yaitu perekonomian masyarakat, sumber daya manusia, sarana dan prasarana (infrastruktur), kemampuan keuangan lokal (celah fiskal), aksesbilitas, dan karakteristik daerah (Edy, 2009). Provinsi Jawa Timur sebagai provinsi dengan jumlah penduduk terbesar kedua di Indonesia memiliki jumlah desa terbanyak sebesar 8.502 desa. Banyaknya desa tersebut menyebabkan penentuan status ketertinggalan desa menjadi sangat penting, khususnya apabila berkaitan dengan perencanaan anggaran dan pengambilan kebijakan. Provinsi Jawa Timur memiliki jumlah penduduk miskin nomor dua terbesar di Indonesia pada tahun 2011 yaitu sebesar 5,2 juta jiwa yang sebagian besar terdapat di pedesaan. 3,49 juta jiwa penduduk miskin di Provinsi Jawa Timur berada di pedesaan yang merupakan jumlah penduduk miskin terbesar di wilayah pedesaan di Indonesia (18,45 persen). Hal tersebut menunjukkan bahwa kantong kemiskinan di provinsi tersebut terdapat di wilayah sehingga klasifikasi status ketertinggalan desa yang tepat sangat diperlukan di sini. Beberapa penelitian yang telah dilakukan mengenai identifikasi desa tertinggal menggunakan metode seleksi variabel yang diduga menjadi faktor penentu status ketertinggalan desa. Salah satu metode yang digunakan antara lain Dewi Wahyuningsih (2009) yang menganalisis karakteristik desa tertinggal dengan Structural Equation Modelling (SEM), sedangkan Syarif (2008), melakukan pemodelan desa tertinggal di Jawa Barat Tahun 2005 dengan Pendekatan MARS. Penelitian lain mengenai ketertinggalan daerah adalah Evaluasi
282
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Ketertinggalan Daerah Dengan Analisis Diskriminan (Djuraidah, 2009) dan Penggunaan Geographically Weighted Regression-Kriging untuk Klasifikasi Desa Tertinggal (Dimulyo, S., 2009). Terdapat beberapa metode klasifikasi lain yang dapat digunakan untuk menentukan status ketertinggalan desa adalah diantaranya adalah Support Vector Machine (SVM). SVM merupakan metode machine learning yang banyak digunakan untuk klasifikasi karena tingkat akurasi klasifikasi maupun prediksi yang tinggi serta proses komputasi yang relatif singkat. SVM pertama kali diperkenalkan oleh Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang statistical learning theory. SVM berusaha menemukan hyperplane terbaik pada input space. Prinsip dasar SVM adalah linier classifier dan selanjutnya dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi (Vapnik and Cortez, 1995). Kelebihan SVM diantaranya mempunyai error generalisasi yang lebih kecil, dapat digunakan pada data sampel yang terbatas, memiliki landasan teori yang dapat dianalisa dengan jelas, dan dapat diimplementasikan dengan mudah (Anto, dkk., 2003). SVM sulit dipakai dalam problem berskala besar dalam hal ini dimaksudkan dengan jumlah sampel yang diolah. Dalam kasus ini disarankan digunakan Reduced SVM (RSVM). RSVM merupakan model yang dengan kernel matriks yang telah disederhanakan yang diturunkan dari General Support Machine (GSVM) dan Smooth Support Vector Machine (SSVM) (Lee and Mangasarian, 2001). RSVM disarankan digunakan untuk klasifikasi sampel dalam jumlah besar yaitu untuk mengatasi kesulitan komputasi sekaligus mengurangi kompleksitas model (Lee and Huang, 2005). Hal ini sesuai dengan kondisi Provinsi Jawa Timur yang mempunyai jumlah desa yang cukup besar (8.502 desa), sehingga proses klasifikasi yang tepat dengan efisiensi waktu pemrosesan dan tingkat kompleksitas model yang rendah sangat diperlukan. RSVM menggunakan fungsi kernel yang menunjukkan mapping dari input space menjadi feature space berdimensi tinggi. Terdapat beberapa fungsi kernel dasar yang sering digunakan seperti fungsi kernel linier, polynomial, gaussian, dan eksponensial (Hsu, Chang, and Lin, 2005). Penelitian ini menggunakan beberapa fungsi kernel untuk mendapatkan fungsi kernel yang menghasilkan tingkat akurasi terbaik dengan metode seleksi parameter Uniform Design (UD). K-fold Cross Validation (KCV) merupakan salah satu pendekatan yang sering dipakai para peneliti dalam seleksi parameter dan estimasi error pada metode klasifikasi (Anguita, Gelardoni, Ghio, Oneto, and Ridella, 2012). Nilai K dalam KCV yang sering digunakan dalam metode SVM adalah 5 dan 10. Penelitian sebelumnya menunjukkan bahwa 10-fold CV merupakan yang paling akurat untuk digunakan dalam SVM (Kohavi, 1995), namun ternyata nilai k sebesar 3 dan 4 juga memberikan tingkat akurasi yang tinggi (Anguita, et al, 2012). Oleh
Makalah Pendamping: Matematika 3
283
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
karena itu penelitian ini akan menggunakan teknik KCV dengan beberapa nilai k untuk mendapatkan model berdasarkan KCV yang mempunyai tingkat akurasi tertinggi. Berdasarkan paparan di atas, permasalahan yang akan diselesaikan melalui penelitian ini adalah bagaimana ketepatan metode klasifikasi RSVM menggunakan beberapa fungsi kernel berdasarkan KCV dengan nilai K yang memiliki tingkat akurasi tertinggi Berdasarkan permasalahan yang telah dirumuskan sebelumnya, tujuan yang ingin dicapai melalui penelitian ini adalah membandingkan tingkat ketepatan klasifikasi untuk status ketertinggalan desa di Provinsi Jawa Timur melalui pendekatan RSVM dengan beberapa fungsi kernel berdasarkan KCV yang memiliki tingkat akurasi tertinggi. Manfaat yang ingin diperoleh dari hasil penelitian ini adalah memperoleh klasifikasi yang tepat mengenai status ketertinggalan desa di Provinsi Jawa Timur untuk membantu perencanaan dan pengambilan keputusan agar lebih efektif dan tepat sasaran dengan menggunakan machine learning. Selain itu penelitian ini juga diharapkan dapat menambah wawasan keilmuan dalam menerapkan RSVM dengan menggunakan fungsi kernel dan teknik KCV sebagai salah satu alternatif metode untuk klasifikasi sampel dalam ukuran besar khususnya untuk status ketertinggalan desa.
METODE PENELITIAN Jenis, Waktu dan Tempat Penelitian Penelitian ini menggunakan pendekatan kuantitatif dengan metode machine learning yaitu menggunakan Reduce Support Vector Machine (RSVM). Target/Subjek Penelitian Penelitian dilakukan terhadap populasi desa di Provinsi Jawa Timur. Sebanyak 8.502 desa di Provinsi Jawa Timur akan diteliti dan dikaji mengenai status ketertinggalan yang dimiliki. Data Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data Potensi Desa (PODES) dan data Klasifikasi desa/kelurahan tahun 2011. Data merupakan data Populasi yang dikumpulkan melalui sensus. Data PODES dikumpulkan oleh Badan Pusat Statistik (BPS) yang pendataannya dilaksanakan pada tahun 2011, sedangkan data klasifikasi desa/kelurahan merupakan data yang dikeluarkan oleh Dirjen Pemberdayaan Masyarakat Desa (PMD) Kementrian Dalam Negeri (Kemendagri). Variabel Penelitian Variabel yang akan digunakan dalam penelitian ini dipilih berdasarkan referensi dari penelitian sebelumnya yaitu pada publikasi BPS mengenai identifikasi dan Penentuan Desa tertinggal 2002, indikator desa tertinggal menurut Kementrian Pembangunan Daerah Tertinggal
284
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
(PDT) Tahun 2007 dan Profil Desa dan Kelurahan (2012) menurut Kementrian Dalam Negeri c.q. Dirjen PMD. Profil desa dan kelurahan memuat tipologi dan klasifikasi desa dan kelurahan yang merupakan karakteristik desa dan kelurahan berdasarkan potensi sumber daya alam dan interaksi dengan kegiatan sosial ekonomi masyarakat (pola nafkah). Tipologi desa dan kelurahan mempertemukan konsep sumber daya alam, konsep pemberdayaan masyarakat, dan pola nafkah, dan aspek kewilayahan. Proksi terhadap profil desa dan kelurahan disusun berdasarkan data Potensi Desa dari Badan Pusat Statistik (BPS) antaralain PODES Tahun 2011.Penelitian dilakukan pada seluruh desa/kelurahan yang ada di Provinsi Jawa Timur yaitu sebanyak 8.502 desa/kelurahan. Variabel respon (Y) merupakan variabel yang berisi kelas yang terdiri atas dua kategori yaitu {+1} untuk desa/kelurahan tertinggal dan {-1} untuk desa/kelurahan tidak tertinggal. Pengukuran variabel respon didapat Profil Desa dan Kelurahan yang dikeluarkan dari Dirjen PMD, sedangkan variabel prediktor didapatkan dari hasil pendataan PODES Provinsi Jawa Timur Tahun 2011 yaitu sebanyak 17 variabel. Teknik Analisis Data Smooth Support Vector Machine (SSVM) SSVM adalah pengembangan baru dari SVM dengan fungsi kernel dan non linier untuk analisis klasifikasi menggunakan metode smoothing. SVM pertama kali diperkenalkan oleh Boser, Guyon dan Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep unggulan dalam statistical learning theory. Prinsip dasar SVM adalah linier classifier dan selanjutnya dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi (Vapnik, 1995). SSVM seperti halnya SVM digunakan untuk klasifikasi dua kategori atau binomial untuk memisahkan titik-titik yang berasal dari dua kelas yang berbeda misalnya kelas {+1} dan {-1}, dengan hyperplane tunggal pada ruang berdimensi banyak yang membentuk partisi yang kemudian diselesaikan secara non linier (Vapnik and Cortez, 1995). Margin adalah jarak antara hyperplane dengan pola terdekat masing-masing class. Pola yang paling dengan ini disebut support vector. Program algoritma dari SVM linier standar adalah
1 ve ' y w ' w 2 dengan kendala D(Aw e ) y e y0 min
( w ,b , y )R p1n
(1)
v
: merupakan parameter dalam SVM yang bernilai positif
y
: adalah vektor variabel slack berukuran n x 1 yang mengukur kesalahan klasifikasi dan bernilai nonnegative
e
: adalah vektor kolom berukuran n dan bernilai satu
Makalah Pendamping: Matematika 3
285
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
w
: adalah vektor normal berukuran p x 1
: nilai bias yang menentukan lokasi relatif hyperplane Pemisah kedua kelas yang berbeda tersebut adalah permukaan linier yang berada tepat
di tengah-tengah bidang pemisah yaitu
x'w
(2)
Terdapat dua bidang pemisah yang paralel dengan bidang pemisah di atas yang merupakan batas kedua kelas yaitu
x ' w 1
(3)
x ' w 1
dengan jarak tertentu yang disebut margin. Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya yaitu
1 . x w
merupakan vektor yang menyusun ruang riil berdimensi R dan menentukan lokasi p
relatif terhadap kelas asli. Pada persamaan tersebut y diminimasi dengan bobot v. Sehingga bidang yang memisahkan kedua kelas dengan soft margin adalah
x ' w y i 1, untuk x ' Ai dan Dii 1 x ' w y i 1, untuk x ' Ai dan Dii 1
(4)
dengan kendala D( Aw e ) y e y0 Dalam pendekatan smoothing, y diminimasi dengan bobot
v , sehingga problem dari 2
SVM yang dimodifikasi menjadi SSVM adalah
v 1 y'y (w'w 2 ) ( u , , y )R 2 2 dengan kendala D(Aw e ) y e y0 minn1m
(5)
dimana untuk memperoleh solusi dari problem tersebut variabel slack dapat ditulis menjadi
y (e D(Aw e ))
(6)
Substitusi y dilakukan sehingga didapatkan problem optimasi SSVM tanpa kendala dapat ditulis menjadi
min
( w, )Rn1
286
v 1 2 (e - D(Aw - e )) 2 (w'w 2 ) 2 2
(7)
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
dengan fungsi plus didefinisikan sebagai ( x )i maks{0,x i }
untuk i =1,2,...,p . Problem
di atas adalah problem cembung tanpa kendala yang mempunyai solusi unik tapi tidak mempunyai turunan kedua sehingga memerlukan metode Newton. Problem tersebut di smoothing dan metode Newton diterapkan, yang kemudian akan menghasilkan problem nonlinier yang akan dijelaskan kemudian. Untuk selanjutnya digunakan General Support Vector Machine (GSVM) untuk membangkitkan bidang pemisah nonlinier dengan menggunakan kernel arbitrary lengkap. Beberapa jenis fungsi kernel dasar yang biasa dipakai dalam SVM adalah (Gunn, 1998 dan Hsu et al., 2005) sebagai berikut : 1. Linear, dengan fungsi kernel K ( Ai , Aj ) AiT Aj 2. Polynomial, dengan fungsi K ( Ai , Aj ) ( AiT Aj r )d dimana 0 2
3. Gaussian atau RBF, dengan fungsi K ( Ai , Aj ) exp( Ai Aj ) 2
dimana 0 4. Sigmoid ,dengan fungsi K ( Ai , Aj ) tanh( AiT Aj r )
dimana 0 GSVM memecahkan problem matematis untuk kernel umum K ( A, A ') sehingga
min ve'y f (u)
( w, )R n1
dengan kendala D( K ( A, A')Du - e ) 2 y e 2
(8)
y0
f (u) adalah fungsi cembung pada R m yang meminimasi parameter u dan v merupakan bilangan positif yang memboboti error klasifikasi e'y dibandingkan minimasi dari u . Program solusi untuk u dan menghasilkan bidang pemisah nonlinier yaitu
K (x', A')Du Formulasi
linier
SSVM
(9) didapatkan
bila
K (A, A ') AA '
,
w = A'Du
dan
1 f (u) u'DAA'Du . Sehingga digunakan tujuan klasifikasi yang berbeda yang meminimasi 2 parameter u dan dalam persamaan nonlinier
v 1 y'y + (u'u 2 ) ( u , , y )R 2 2 dengan kendala D( K ( A, A')Du - e ) y e y0 min2 m1
(10)
yang dapat ditulis menjadi Makalah Pendamping: Matematika 3
287
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
y (e - D( K (A, A')Du - e )
(11)
Sehingga didapatkan SSVM dengan problem optimasi tanpa kendala sebagai berikut :
minm1
( u , )R
2 v 1 (e - D( K ( A, A')Du - e )) (u'u 2 ) 2 2 2
(12)
yang merupakan fungsi objektif mempunyai solusi unik tetapi tidak mempunyai turunan kedua, dan tidak smooth, oleh karena itu disarankan untuk menerapkan metode Newton dengan teknik smoothing dan menggantikan x atau fungsi plus dengan p( x, ) yaitu integral dari fungsi sigmoid neural network
p( x, ) x
1 1 x
1
sehingga dapat dituliskan menjadi
log(1 x ), 0
(13)
Fungsi p di atas (dengan sebagai parameter penghalus) digunakan untuk menggantikan fungsi plus sehingga didapatkan model SSVM yaitu
minp1
( w, )R
v 1 2 p(e - D(Aw - e ), ) 2 (w'w 2 ) 2 2
(14)
Persamaan di atas yang telah dimodifikasi dengan penambahan parameter penghalus dan dapat diperoleh turunan keduanya sehingga penyelesaian problem tersebut dapat dilakukan dengan menerapkan algoritma konvergen kuadrat Newton dengan tahapan Armijo atau disebut Algoritma Newton Armijo yang membuat algoritma tersebut konvergen secara global. Reduce Support Vector Machine (RSVM) SVM dengan kernel linier dan non linier menjadi algoritma yang cukup terkenal untuk klasifikasi. Melalui kernel mapping, bermacam model SVM berhasil dengan efektif dan fleksibel untuk model non linier. Namun terdapat beberapa keterbatasan yang dimiliki SVM di antaranya masalah banyaknya waktu dan penyimpanan yang diperlukan untuk memecahkan masalah pemrograman khususnya untuk data dengan ukuran besar. Kesulitan yang dihadapi dalam penggunaan kernel non linier pada data berukuran besar secara garis besar ada dua. Pertama adalah kesulitan komputasi dalam memecahkan problem optimasi tanpa kendala yang besar yang melibatkan fungsi kernel yang membutuhkan memori sangat besar bahkan sebelum dimulainya proses pencarian solusi. Kedua adalah kesulitan dalam penggunaan formula untuk bidang pemisah pada x yang merupakan titik baru yang tidak terlihat. Hal tersebut berarti data yang berukuran besar memerlukan memori besar dan waktu penghitungan yang lama. Untuk menangani kesulitan komputasi tersebut, sebagai alternatif, disarankan metode Reduced Support Vector Machine (RSVM) yang disarankan oleh Lee dan Mangasarian ( 2001). RSVM diturunkan dari Generalized Support Vector Machine (GSVM) dan Smooth Support Vector Machine (SSVM) (Lee and Huang, 2005; Purnami, Zain, Heriawan, 2012).
288
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
RSVMberangkat dari ide menggunakan bagian kecil (m) dari total dataset (m) yang dipilih secara random atau acak ( m selalu lebih kecil dibandingkan m ) yang disebut A . Untuk selanjutnya digunakan A ' untuk menggantikan A ' pada kedua probel optimasi tanpa kendala untuk mengatasi masalah ukuran matriks dan waktu pemrosesan. Formulasi RSVM Dengan menggunakan formulasi untuk data di mana A R
mxn
dengan kernel square
K ( A, A ') R mxm dan memodifikasi formulasi berikut untuk data reduced A Rmxn yang mxn korespondensi dengan matriks diagonal ( D) dan matriks kernel K ( A, A ') R akan
didapatkan algoritma RSVM yang dipecahkan dengan smoothing. Program kuadratik RSVM didapatkan dengan mengganti A ' dengan A ' sehingga menjadi
v 1 y'y (u'u 2 ) ( u , , y )R 2 2 dengan kendala D( K ( A, A')Du - e ) y e y0 minm1m
(15)
Data yang diperoleh akan diolah menggunakan metode RSVM dengan menggunakan software Matlab. Pendekatan machine learning dengan seleksi parameter dilakukan dalam penelitian ini untuk mendapatkan model terbaik menggunakan Uniform Design (UD) dan K-fold Cross Validation (KCV). Dalam penelitian ini dilakukan perbandingan penggunaan fungsi kernel Gaussian dan Linear dengan nilai K sebesar 3,4,5, dan 10 pada KCV untuk mendapatkan model terbaik. Langkah-langkah dan metodenya adalah sebagai berikut 1. Analisis Deskriptif 2. Memperoleh klasifikasi status ketertinggalan desa/kelurahan di Provinsi Jawa Timur dengan metode RSVM menggunakan fungsi kernel dan teknik KCV dengan nilai K yang memiliki tingkat akurasi tertinggi i.
Membangkitkan atau membentuk subset matriks dari elemen full matriks secara random untuk menggantikan / representasi dari full matriks
ii.
Menerapkan fungsi kernel RBF/Gaussian, dan Linear dalam model RSVM
iii.
Membuat partisi data dengan KCV dengan nilai k sebesar 3,4,5, dan 10 dalam mendapatkan parameter untuk membangun model RSVM
iv.
Menentukan kombinasi parameter yang paling tepat untuk model fungsi kernel Gaussian, dan Linear dengan teknik KCV berdasarkan tingkat akurasi tertinggi
v.
Membangun model RSVM menggunakan fungsi kernel Gaussian, dan Linear berdasarkan teknik KCV yang mempunyai tingkat akurasi tertinggi
3. Membandingkan tingkat akurasi ketepatan klasifikasi untuk status ketertinggalan desa/kelurahan di Provinsi Jawa Timur dengan pendekatan RSVM dengan fungsi kernel Makalah Pendamping: Matematika 3
289
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Gaussian, dan Linear berdasarkan teknik KCV dengan nilai K yang mempunyai tingkat akurasi tertinggi
HASIL PENELITIAN DAN PEMBAHASAN Data klasifikasi desa menunjukkan dari total 8.502 desa/kelurahan di Provinsi Jawa Timur pada tahun 2011, sebanyak 4.273 desa/kelurahan (50,26 persen) diklasifikasikan sebagai desa tertinggal dan sisanya sebanyak 4.229 desa/kelurahan (49,74 persen) termasuk desa tidak tertinggal. Hal tersebut menunjukkan bahwa separuh desa/kelurahan di Provinsi Jawa Timur masih tergolong desa tertinggal. RSVM diterapkan untuk mengklasifikasikan desa/kelurahan tersebut untuk mendapatkan klasifikasi status ketertinggalan desa. Desa/kelurahan diklasifikasikan ke dalam dua kelas, kelas +1 untuk desa tertinggal dan kelas -1 untuk desa tidak tertinggal dengan hyperplane tunggal pada ruang berdimensi banyak yang membentuk partisi yang kemudian diselesaikan secara non linier dengan memasukkan konsep kernel trick (Vapnik, 1995; Vapnik and Cortez, 1995). Jarak yang paling optimum antara hyperplane dengan pola terdekat masing-masing kelas disebut margin. Penelitian ini ingin membandingkan kernel Linear yang sesuai untuk data dalam jumlah besar, dan kernel Gaussian/RBF yang dianggap efisien (Hsu, et.al, 2008) untuk klasifikasi status ketertinggalan desa di Provinsi Jawa Timur dengan metode seleksi parameter UD dan teknik estimasi error menggunakan KCV. Nilai K yang digunakan dalam penelitian ini adalah 3,4,5, dan 10, dengan alasan seperti yang telah dijelaskan sebelumnya. Dalam hal ini, ingin didapatkan model terbaik untuk klasifikasi status ketertinggalan desa di Provinsi Jawa Timur dengan menggunakan metode RSVM berdasarkan tingkat akurasi tertinggi yang diukur melalui training error maupun akurasi model. Tabel 1. Perbandingan Training Error dan Akurasi RSVM Number of K of KCV 3
4
5
10
290
Measure
Kernel Function RBF/Gaussian
Linear
Training error
0,36
0,26
Akurasi
0,58
0,72
Training error
0,36
0,26
Akurasi
0,55
0,74
Training error
0,37
0,27
Akurasi
0,60
0,73
Training error
0,34
0,25
Akurasi
0,60
0,74
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Tabel di atas menunjukkan secara umum, kernel linear memberikan hasil yang lebih baik dibandingkan dengan kernel RBF, hal tersebut ditunjukkan dengan training error yang lebih kecil dan tingkat akurasi yang lebih besar. Apabila dilihat dari teknik KCV, 10-fold CV ternyata memang memberikan hasil yang paling baik dibandingkan ketiga nilai K yang lain baik dari sisi training error pada kedua fungsi kernel yaitu berturut-turut sebesar 0,34 persen dan 0,25 persen. Tingkat akurasi pada penggunaan 10-fold CV juga paling tinggi yaitu sebesar 0,60 persen dan 0,74 persen. Berdasarkan uraian di atas terlihat bahwa penggunaan fungsi kernel Linear dan 10-fold CV pada metode RSVM akan memberikan training error terendah dan tingkat akkurasi tertinggi pada klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.
SIMPULAN DAN SARAN RSVM adalah salah satu metode yang dapat digunakan untuk mengklasifikasikan data dalam jumlah besar. Hasil penelitian menunjukkan bahwa penggunaan kedua fungsi kernel menunjukkan fungsi kernel Linear menunjukkan hasil yang lebih baik dibandingkan fungsi kernel RBF. Selanjutnya seperti penelitian yang sudah dilakukan sebelumnya (Kohavi, 1995) 10-fold CV adalah teknik terbaik. Berdasarkan hasil tersebut dapat dikatakan bahwa fungsi kernel Linear dan teknik 10-fold CV merupakan metode terbaik dalam pengklasifikasian status ketertinggalan desa di Provinsi Jawa Timur.
DAFTAR PUSTAKA
Agresti, A., 1996, An Introduction to Categorical Data Analysis, John Willey and Son, Inc, United States of America Andari, S., 2012, Smooth Support Vector Machine dan Multivariate Adaptive Regression Splines Untuk Mendiagnosis Kanker Payudara, Tesis, Mahasiswa Jurusan Statistika Fakultas MIPA ITS, Surabaya. Anguita, D., Gelardoni, L., Ghio, A., Oneto, L., and Ridella, S., (2012), The K in K-fold Cross Validation, European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN 2012) Proceedings, Bruges (Belgium), 2527 April 2012 . Badan Pusat Statistik, 2005, Identifikasi dan Penentuan Desa Tertinggal 2002, Badan Pusat Statistik, Jakarta. Badan Pusat Statistik, 2011, Pedoman Pendataan PODES 2011, Badan Pusat Statistik, Jakarta. Badan Pusat Statistik, 2012, Profil Kemiskinan Indonesia September 2011, Berita Resmi Statistik No. 06/01/Th. XV, 2 Januari 2012, Badan Pusat Statistik, Jakarta BAPPENAS, 1993, Panduan Pelaksanaan Program IDT 1994-1999, Jakarta.
Makalah Pendamping: Matematika 3
291
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Chien, L.J., Chang, C.C. and Lee, Y.J., 2010, Variant methods of reduced set selection for reduced support vector machines, Journal of Information Science and Engineering, Vol. 26 (1). Cortes, C. And Vapnik, V., 1995, Support vector networks, Machine Learning, 20, 273-297. Dimulyo S.,
2009, Penggunaan
Geographically Weighted Regression-Kriging
untuk
Klasifikasi Desa Tertinggal, dalam Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2009, Yogyakarta. Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri,
(2012), Profil Desa dan
Kelurahan 2011 : Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan Menurut Provinsi,Dirjen PMD Kemendagri, Jakarta. Djuraidah, A., 2009, Analisis Status Ketertinggalan Daerah dengan Analisis Diskriminan, Seminar Nasional Matematika dan Pendidikan Matematika, UNY, Yogyakarta. Edy, L., 2009, Pencapaian Pembangunan Daerah Tertinggal Lima Tahun Terakhir, Jurnal Sekretariat Negara, No : 13, Agustus 2009. Gunn, S., 1998, Support Vector Machines for Clasification and Regression, Technical Report, ISIS. Hidayat, S., 2008, Permodelan Desa Tertinggal di Jawa Barat Tahun 2005 dengan Pendekatan Mars, Tesis Mahasiswa Jurusan Statistika Fakultas MIPA ITS, Surabaya Hsu, C.W., Chang, C. C., & Lin, C. J., 2008. A practical guide to Support Vector Classification, Taipe: Information Engineering National Taiwan University. Huang, C.M., Lee, Y.J., Lin, D.K.J. and Huang, S.Y., 2007, “Model selection for support vector machines via uniform design”, A Special issue on Machine Learning and Robust DataMining of Computational Statisticsand Data Analysis, Vol. 52, pp. 335-346. Kementrian Pembangunan Daerah Tertinggal, 2011, Indikator Primer Daerah Tertinggal Tahun 2011, KPDT : kpdt.bps.go.id/index.php?AnalisisData/ analisa1#, Jakarta (diakses 5 Juli 2013). Kohavi, R., 1995, A study of cross-validation and bootstrap for accuracy estimation and model selection. InInternational joint Conference on artificial intelligence, volume 14, pages 1137–1145, 1995. Lee, Y. J., 2001, Support vector machines in data mining, PhD thesis, University of WisconsinMadison, USA. Lee, Y.J., & Mangasarian, O.L.,
2001, A Smooth Support Vector Machine, Jurnal of
Computational Optimization and applications 20:5-22. Lee, Y.J., & Mangasarian, O.L., 2001 “RSVM: Reduced Support Vector Machines”, In Proceedings of the First SIAM International Conference on Data Mining. Lee, Y.J. and Huang, S.Y., 2007, “Reduced Support Vector Machines: A Statistical Theory”, IEEE Trans.Neural Network, Vol.18, no. 1.
292
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Lin, K.M and Lin, C.J., 2003, “A study on reduced supportvector machines”, IEEE Trans.Neural Network, Vol.14,no.6, pp.1449-1459. Menteri Negara Pembangunan Daerah Tertinggal Republik Indonesia, 2005, Strategi Nasional Pembangunan Daerah Tertinggal, Kementerian Negara Pembangunan Daerah Tertinggal Republik Indonesia, Jakarta Menteri Koordinator Kesejahteraan Masyarakat, 2009, Membangun Kesejahteraan dan Kemandirian
Bangsa,
Kemenkesra
http://www.setneg.go.id/index.php?option=com_content&task=view&id=2263&Itemid= 219 (diakses tanggal 24 Agustus 2013). Mubyarto, 1994, Keswadayaan Masyarakat Desa Tertinggal, Aditya Media, Yogyakarta. Narayan, D., Patel, R., Schafft, K., Rademacher, A., Schulte, S.K, 1999, Can Anyone Hear Us? Voice From 47 Countries. Poverty Group, PREM. World Banks. Nugroho, A.S., Witarto, A.A., Handoko, Dwi, Support Vector Machine : Teori dan Aplikasinya dalam Bioinformatika, http://ilmukomputer.com (diakses 4 Juli 2013). Purnami, S.W., Zain, J.M., Heriawan, T., (2011), An alternative algorithm for classification large categorical dataset: k-mode clustering reduced support vector machine. International Journal of Database Theory and Application Vol. 4, No. 1, March 2011. Putra, A.S., 2013, Daerah Tertinggal, Perdesaan Swadaya/Tertinggal dan Kecamatan Tertinggal, http://opentrade2222.blogspot.com/2013/05/daerah-tertinggal-perdesaan.html
(diakses
tanggal 24 Agustus 2013). Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Buku Saku PNPM Mandiri, TNP2K, Jakarta. Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Daftar Indikatif Lokasi dan Alokasi BLM Program PNPM Mandiri 2012, TNP2K, Jakarta. Vapnik, V., 1995, The Nature of Statistical Learning Theory, Springer-Verlag, New York. Wahyuningsih, D., 2009, Analisis Karakteristik Desa Tertinggal dengan Stuctural Equation Modelling, Tesis Jurusan Statistika Fakultas MIPA ITS, Surabaya.
Makalah Pendamping: Matematika 3
293
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
PERBANDINGAN UJI KENORMALAN PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS MENGGUNAKAN METODE SIMULASI MONTE CARLO Sugiyanto1, Etik Zukhronah2, dan Sri Sulistijowati H3 1
[email protected] 2
[email protected] 3
[email protected] Abstrak Uji kenormalan berdasarkan pada kategori fungsi distribusi empiris ada empat yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan. Hasil perbandingan dari uji-uji tersebut menggunakan simulasi Monte Carlo bahwa uji Anderson-Darling mempunyai kepekaan paling tinggi untuk menolak ketidaknormalan suatu data. Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji Anderson-Darling,Simulasi Monte Carlo.
1. LATAR BELAKANG MASALAH Asumsi kenormalan diperlukan dalam banyak porsedur statistika. Pemeriksaan asumsi kenormalan dapat menggunakan metode grafik maupun uji kenormalan. Metode grafik yang dapat digunakan antara lain quantile-quantile plot (q-q plot), histogram, box-plot, dan diagram batang dan daun. Namun demikian metode grafik tersebut masih belum cukup untuk memberikan bukti yang menyakinkan. Uji kenormalan pada kategori fungsi distribusi empiris menurut Arshad dkk. [4] ada empat macam yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan AndersonDarling. Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan. Pernyataan ini dikuatkan oleh Razali dan Wah [4] yang mengatakan bahwa antara uji kenormalan yang satu dengan yang lain menghasilkan kesimpulan yang berbeda. Beberapa uji menolak hipotesis nol (H0) sedangkan uji yang lain gagal menolak H0 dengan H0 adalah sampel acak berasal dari populasi berdistribusi normal. Conover [2] menyatakan bahwa beberapa uji statistik dapat dibandingkan berdasarkan kekuatan uji masing-masing. Kekuatan uji yaitu besarnya probabilitas menolak H0 ketika H0 salah. Untuk mengetahui kepekaan uji masing-masing untuk menolak H0ketika H0 salah, dilakukan metode simulasi Monte Carlo. Stephens [5] pada tahun 1974 melakukan penelitian mengenai perbandingan uji kenormalan pada kategori fungsi distribusi empiris menggunakan metode simulasi Monte Carlo sebanyak 1.000 kali pengulangan dengan ukuran sampel yaitu 10,20 dan 30. Hasil perbandingan uji-uji tersebut disajikan dalam bentuk tabel persentase menolak H0. Penelitian Stephens menyimpulkan bahwa uji Cramer-von Mises dan Anderson-Darling sama kuat dalam menguji 294
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
kenormalan data. Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil penelitian Stephens yaitu perbandingan menggunakan metode simulasi Monte Carlo dengan 10.000 kali pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji tersebut disajikan dalam bentuk grafik persentase menolak H0. 2. PEMBAHASAN 2.1 Prosedural. Prosedural merupakan langkah-langkah pengujian hipotesis untuk mengetahui sampel acak berasal dari populasi berdistribusi normal atau tidak. Berikut langkah-langkah pengujian hipotesis. (1) Hipotesis H0 : sampel acak berasal dari populasi berdistribusi normal H1 : sampel acak tidak berasal dari populasi berdistribusi normal (2) Tingkat signifikansi () (3) Daerah kritis H0 ditolak jika statistik uji > nilai kritis. Nilai kritis bergantung pada yang diambil. (4) Statistik uji Modifikasi statistik Kolmogorov-Smirnov dinyatakan 𝐷∗ = dengan 𝐷 + = max𝑖=1,2,…,𝑛
𝑖 𝑛
𝑛 − 0,01 +
0,85 𝑛
𝐷
− 𝑧𝑖 , 𝐷 − = max𝑖=1,2,…,𝑛 𝑧𝑖 −
(𝑖−1) 𝑛
, dan
𝐷 = max 𝐷 +, 𝐷 − Dimana 𝐷 adalah statistik Kolmogorov-Smirnov, 𝑛 adalah banyaknya sampel acak dan 𝑧𝑖 adalah distribusi probabilitas kumulatif normal standar untuk 𝑤𝑖 =
(𝑥 𝑖 −𝑥 ) 𝑠
dengan 𝑥𝑖
merupakan statistik terurut. Stephens [5] mendefinisikan modifikasi statistik Kuiper 𝑉 ∗ sebagai 𝑉∗ =
𝑛 + 0,05 +
0,82 𝑛
𝑉.
Notasi 𝑉 menunjukkan statistik Kuiper yang nilainya merupakan kombinasi dari statistik
Kolmogorov-Smirnov
yaitu
𝐷+
dan
𝐷−
sehingga
𝑉 = 𝐷 + + 𝐷 −. Modifikasi statistik Cramer-von Mises adalah ∗
𝑊2 = 1 + 1
dengan 𝑊 2 = 12𝑛 +
𝑛 𝑖=1
𝑧𝑖 −
2𝑖−1 2 . 2𝑛
0,5 𝑊2 𝑛
Notasi 𝑊 2 merupakan statistik Cramer-von
Mises. Modifikasi statistik Anderson-Darling ditentukan dengan Makalah Pendamping: Matematika 3
295
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
∗
𝐴2 = 1 + 1
dengan 𝐴2 = −𝑛 − 𝑛
𝑛 𝑖=1
0,75 2,25 2 + 2 𝐴 𝑛 𝑛
2𝑖 − 1 ln 𝑧𝑖 + ln(1 − 𝑧𝑛+1−𝑖 ) .
Notasi 𝐴2 adalah statistik Anderson-Darling. (5) Kesimpulan
2.2 Simulasi Monte Carlo untuk Keempat Uji. Langkah awal dari simulasi ini adalah membangkitkan bilangan acak dari distribusi eksponensial, chi-kuadrat, gamma, beta, dan uniform. Bilangan acak yang dibangkitkan tersebut dipandang sebagai sampel acak. 2.2.1
Sampel Berdistribusi Eksponensial. Pada simulasi pertama, sampel dibangkitkan dari
distribusi eksponensial dengan parameter 𝜃 = 7. Hasil simulasi disajikan dalam grafik persentase menolak H0 dengan bervariasi ukuran sampel yang tampak dalam Gambar 1. Gambar 1 menunjukkan semakin besar ukuran sampel, persentase menolak H0 untuk keempat uji tersebut juga semakin besar. 100
Persentase menolak H0
90
80
70
60
50 Kolmogorov-Smirnov Kuiper Cramer-von Mises Anderson-Darling
40
30 10
20
30
40
50
60
70
80
90
100
n
Gambar 1. Persentase menolak H0 dari sampel berdistribusi eksponensial dengan parameter 𝜃 = 7 untuk 𝑛 = 10,20, … ,100
Uji Anderson-Darling memiliki persentase menolak H0 yang lebih besar dari uji Kuiper dan Cramer-von Mises. Namun, perbedaan persentase menolak H0 untuk ketiga uji tersebut tidak signifikan sehingga dianggap memiliki kepekaan yang sama. Sedangkan uji KolmogorovSmirnov memiliki persentase menolak H0 yang paling kecil diantara ketiga uji tersebut. Tetapi mulai 𝑛 = 50, uji Kolmogorov-Smirnov sudah memiliki kepekaan yang sama dengan ketiga uji yang lain. Ini artinya keempat uji tersebut sama kuat dalam menguji kenormalan sehingga dapat memberikan kesimpulan yang sama.
296
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
2.2.2
Volume 2
Sampel Berdistribusi Chi-Kuadrat. Simulasi kedua ini, sampel yang dibangkitkan
berasal dari distribusi chi-kuadrat dengan derajat bebas 𝜐 = 3. Hasil simulasi disajikan dalam grafik persentase menolak H0 dengan 𝑛 = 10,20, … ,100 yang tampak dalam Gambar 2. Pada Gambar 2, menunjukkan bahwa hasil simulasi kedua ini hampir sama dengan hasil simulasi yang pertama. Ketika sampel dibangkitkan dari distribusi chi-kuadrat dengan ukuran sampel semakin besar, persentase menolak H0 untuk keempat uji tersebut juga semakin besar. 100 90
Persentase menolak H0
80 70 60 50 40 Kolmogorov-Smirnov Kuiper Cramer-von Mises Anderson-Darling
30 20 10
20
30
40
50
60
70
80
90
100
n
Gambar 2. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi chikuadrat dengan derajat bebas 𝜐 = 3
Persentase penolakan H0 untuk uji Anderson-Darling lebih besar dibandingkan dengan uji Cramer-von Mises tetapi selisihnya tidak signifikan sehingga kedua uji tersebut dikatakan memiliki kepekaan yang sama. Ini berarti uji Cramer-von Mises dan Anderson-Darling samasama kuat untuk menguji kenormalan. Sebaliknya, uji Kolmogorov-Smirnov memiliki persentase penolakan H0 yang paling kecil diantara keempat uji tersebut. Uji Kuiper, Cramer-von Mises, dan Anderson-Darling memiliki kepekaan yang sama pada saat ukuran sampel mendekati 60. Sedangkan, ketika ukuran sampel mendekati 80, uji Kolmogorov-Smirnov dapat dikatakan mempunyai kepekaan yang sama seperti ketiga uji yang lain. 2.2.3
Sampel Berdistribusi Gamma. Pada simulasi ketiga ini, sampel yang digunakan
dibangkitkan dari distribusi gamma dengan parameter 𝜃 = 3 dan 𝜅 = 5. Hasil simulasi ditunjukkan dengan grafik persentase penolakan H0 yang tampak dalam Gambar 3. Pada gambar tersebut tampak bahwa hasil simulasi ini memberikan gambaran yang berbeda dengan hasil simulasi yang sebelumnya. Namun, hasil simulasi ini juga menunjukkan bahwa jika ukuran sampelnya semakin besar maka persentase penolakan H0 untuk keempat uji tersebut juga semakin besar. Makalah Pendamping: Matematika 3
297
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
100 90
Persentase menolak H0
80 70 60 50 40 30
Kolmogorov-Smirnov Kuiper Cramer-von Mises Anderson-Darling
20 10 10
20
30
40
50
60
70
80
90
100
n
Gambar 3. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi gamma dengan parameter 𝜃 = 3 dan 𝜅 = 5
Uji Kolmogorov-Smirnov dan Kuiper memiliki persentase penolakan H0 hampir sama dan lebih kecil dari uji Cramer-von Mises dan Anderson-Darling. Hal ini menunjukkan uji Kolmogorov-Smirnov dan Kuiper memiliki kepekaan yang sama untuk menolak H0 ketika H0 salah. Sebaliknya, uji Cramer-von Mises dan Anderson-Darling mempunyai selisih persentase penolakan H0 yang tidak signifikan sehingga kedua uji tersebut dianggap memiliki kepekaan yang sama. Hal ini berarti apabila sampel berasal dari distribusi gamma, baik uji Cramer-von Mises maupun uji Anderson-Darling akan sama-sama kuat dalam menguji kenormalan sehingga keduanya dapat memberikan kesimpulan yang sama.
2.2.4
Sampel Berdistribusi Beta. Hasil simulasi keempat tampak pada Gambar 4, yang
mana sampel dibangkitkan dari distribusi beta dengan parameter a = 3 dan b = 1. Dari gambar tersebut, uji Anderson-Darling yang memiliki persentase menolak H0 paling besar daripada ketiga uji yang lain. Namun, ketika ukuran sampel sebesar 100, persentase menolak H0 untuk keempat uji tersebut hampir sama dan selisihnya tidak signifikan. Oleh karena itu, keempat uji tersebut dapat dianggap memiliki kepekaan yang sama untuk menolak H0 ketika H0 salah sehingga sama kuat dalam menguji kenormalan dan dapat menghasilkan kesimpulan yang sama pula.
298
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
100 90
Persentase menolak H0
80 70 60 50 40 30
Kolmogorov-Smirnov Kuiper Cramer-von Mises Anderson-Darling
20 10 10
20
30
40
50
60
70
80
90
100
n
Gambar 4. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi beta dengan parameter a = 3 dan b = 1
2.2.5
Sampel Berdistribusi Uniform. Hasil simulasi kelima disajikan dalam Gambar 5. Pada
simulasi kelima ini, sampel yang dibangkitkan berasal dari distribusi uniform dengan interval a =-3 dan b =3. Dari gambar tersebut, ketika ukuran sampel diambil kecil, dalam hal ini n = 10 tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling dapat memberikan kesimpulan yang sama. Hal ini karena keempat uji tersebut memiliki perbedaan persentase menolak H0 yang tidak signifikan. Tetapi, ketika ukuran sampel diambil besar, yaitu 100, terlihat bahwa uji Anderson-Darling memiliki persentase menolak H0 yang paling besar diantara keempat uji tersebut sedangkan uji Kolmogrov-Smirnov mempunyai persentase menolak H0 yang paling kecil. Selain itu, tampak bahwa uji Kuiper dan Cramer-von Mises memiliki selisih persentase menolak H0 yang tidak signifikan sehingga kepekaan kedua uji tersebut sama. Dengan demikian, Gambar 5 menunjukkan bahwa semakin besar sampel yang diambil, uji Anderson-Darling akan semakin kuat untuk menolak H0 ketika H0 salah. 100 90
Persentase menolak H0
80 70 60 50 40 30 Kolmogorov-Smirnov Kuiper Cramer-von Mises Anderson-Darling
20 10 0 10
20
30
40
50
60
70
80
90
100
n
Makalah Pendamping: Matematika 3
299
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Gambar 5. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi uniform dengan interval a =-3 dan b =3
3. KESIMPULAN Berdasarkan hasil simulasi Monte Carlo, diperoleh kesimpulan bahwa uji AndersonDarling memiliki kepekaan tertinggi untuk menguji ketidaknormalan suatu data. Sebaliknya, uji Kolmogorov-Smirnov merupakan uji yang paling lemah dalam menguji ketidaknormalan suatu data.
DAFTAR PUSTAKA [1] Arshad, M., M. T. Rsool and M. I. Ahmad, Anderson darling and modified anderson darling test for generalized pareto distribution, Pakistan Journal of Applied Sciences 3 (2003), no. 2, 85-88. [2] Conover, W. J., Practical nonparametric statistics, Third Edition, John Wiley and Sons, Inc, 1999. [3] Daniel, W. W., Statistika nonparametrik terapan, Gramedia, Jakarta, 1989. [4] Razali, N. M. and Y. B. Wah, Power comparisons of shapiro-wilk, kolmogorov-smrinov, liliefors, and anderson-darling tests, Journal of Statistical Modelling and Analytics 2 (2011), 21-33. [5] Stephens, M. A., Edf statistics for goodness of _t and some comparisons, Journal of the American Statistical Association 69 (1974), 730-737.
300
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
DETEKSI POLA PENYEBARAN DEMAM BERDARAH DENGUE DI KOTA SURAKARTA MENGGUNAKAN INDEKS MORAN Etik Zukhronah1, Sugiyanto2, Respatiwulan3 Jurusan Matematika FMIPA UNS 1
[email protected],2sugiyanto@yahoo. co.id,
[email protected] Abstrak Penyakit demam berdarah dengue disebabkan oleh virus dengue yang disebarkan oleh nyamuk Aedes Aegypti. Sebagian besar kelurahan di Kota Surakarta merupakan daerah endemis demam berdarah. Penelitian ini bertujuan untuk mendeteksi pola penyebaran penyakit demam berdarah secara spasial di Kota Surakarta menggunakan Indeks Moran. Data diambil dari Dinas Kesehatan Surakarta pada tahun 2012. Hasil penelitian menunjukkan bahwa terdapat autokorelasi spasial dalam penyebaran penyakit demam berdarah di Kota Surakarta dan kejadiannya berpola clustered. Kata kunci: demam berdarah dengue, indeks Moran
PENDAHULUAN Demam berdarah dengue atau dalam istilah kedokteran Dengue Hemorrhagik Fever (DHF) adalah suatu penyakit yang disebabkan oleh infeksi virus Dengue dan ditularkan melalui gigitan nyamuk Aedes Aegypti betina dan beberapa spesies Aedes lainnya. Populasi nyamuk ini akan meningkat pesat pada saat musim hujan. Namun nyamuk Aedes Aegypti juga dapat hidup dan
berkembang
biak
pada
bak-bak
penampungan
air
sepanjang
tahun
(http://www.blogdokter.net). Demam berdarah banyak ditemukan di daerah tropis dan subtropis. Asia menempati urutan
pertama
dalam
jumlah
penderita
demam
Dengue
setiap
tahun.
(http://www.blogdokter.net). Kasus demam berdarah di Indonesia tercatat masih tinggi bahkan paling tinggi dibanding Negara lain di ASEAN (http://health.detik.com). Sebagian besar kecamatan di Kota Surakarta, Jawa Tengah merupakan daerah endemis demam
berdarah
dengan
jumlah
penderita
hampir
meningkat
setiap
tahunnya.
(http://www.mediaindonesia.com). Dari 51 kelurahan yang ada, terdapat 40 kelurahan yang merupakan daerah endemis dengan jumlah penderita 826 orang dan 12 orang diantaranya meninggal pada tahun 2008 (Dinas Kesehatan Kota Surakarta, 2009). Terdapat 46 kelurahan yang merupakan daerah endemis pada tahun 2009 dengan jumlah penderita 684 orang dan 7 diantaranya meninggal ( Dinas Kesehatan Kota Surakarta, 2010). Sedangkan pada tahun 2010 terdapat 49 kelurahan yang merupakan daerah endemis dengan jumlah penderita 533 orang dan 9 diantaranya meninggal (Dinas Kesehatan Kota Surakarta, 2011) Melihat tingginya angka kasus DBD di Kota Surakarta, maka perlu dilakukan penelitian yang berhubungan dengan komponen ruang guna menentukan pola epidemi kasus demam Makalah Pendamping: Matematika 3
301
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
berdarah. Epidemi demam berdarah bervariasi dari satu tempat ke tempat lain, sehingga komponen ruang juga harus diperhatikan. Autokorelasi spasial merupakan teknik untuk mengukur tingkat hubungan dalam data yang dipengaruhi oleh keadaan geografis (data spasial) (Griffith, 2003). Data spasial (ruang) merupakan suatu data yang dipengaruhi oleh ruang ataupun posisi relatif suatu objek yang diamati (Anselin, 1992). Untuk mengukur hubungan spasial antar daerah dapat digunakan indeks global dan indeks local (Wen etal. 2010). Indeks Moran merupakan indeks global yang digunakan untuk mengukur adanya hubungan spasial dalam penyebaran penyakit. Hubungan spasial ini diperlukan untuk mengetahui apakah terdapat autokorelasi spasial dalam penyebaran penyakit demam berdarah yang terjadi di Kota Surakarta. Penelitian
yang berkaitan dengan penyebaran penyakit demam berdarah telah
dilakukan oleh Nakhapakorn dan Supet (2006), kemudian oleh Astutik et al. (2011). Nakhapakorn dan Supet (2006) meneliti tentang distribusi spasial kasus demam berdarah yang terjadi di Thailand. Dalam penelitiannya, ia menggunakan indeks Moran, Geary dan LISA untuk mengukur hubungan spasial antar daerah. Sedangkan Astutik et al. (2011) mendeteksi hubungan spasial temporal kasus demam berdarah yang terjadi di provinsi Jawa Timur menggunakan multivariat Moran dan multivariat LISA. Berdasarkan penelitian yang telah dilakukan oleh Nakhapakorn dan Supet (2006), dan Astutik et al.(2011), maka kasus kejadian DBD di Kota Surakarta dapat dianalisis secara spasial.
METODE PENELITIAN Data Penelitian Data yang digunakan dalam penelitian ini adalah data jumlah penderita DBD di Surakarta tahun 2012 yang meliputi 51 kelurahan yang berada di 5 kecamatan.Data tersebut diambil dari di Dinas Kesehatan Kota Surakarta. Data dianalisis menggunakan bantuan software OpenGeoda dengan melakukan input data ke file shp (shape file) daerah Surakarta.
Metode Analisis Data 1.
Langkah awal dalam analisis spasial temporal adalah menyusun matriks pembobotan 𝑊 yang elemen-elemennya 𝑤𝑖𝑗 merupakan spatial weight measure untuk daerah yang berbatasan. Jika daerah i berbatasan dengan daerah j maka dinotasikan 1 dan jika tidak berbatasan maka dinotasikan 0.
2.
Langkah selanjutnya adalah menghitung nilai indeks Moran dari data jumlah penderita tiap-tiap kelurahan. Indeks Moran dihitung dengan menggunakan rumus 𝐼=
𝑛 𝑛𝑖=1 𝑛𝑗=1 𝑤 𝑖𝑗 𝑥 𝑖 −𝑥 𝑥 𝑗 −𝑥 𝑊 𝑛𝑖=1 𝑥 𝑖 −𝑥 2
.................................... (1)
dengan 302
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
𝑊= 𝐼
𝑛 𝑖=1
Volume 2
𝑛 𝑗 =1 𝑤𝑖𝑗
menyatakan indeks Moran,
n menyatakan banyak lokasi kejadian, 𝑥𝑖 menyatakan jumlah penderita demam berdarah pada daerah i, 𝑥𝑗 menyatakan jumlah penderita demam berdarah pada daerah j, 𝑥
menyatakan rata rata dari jumlah penderita demam berdarah,
𝑤𝑖𝑗 menyatakan elemen pada bobot matriks antara daerah 𝑖 dan 𝑗, W menyatakan jumlah darisemua nilaiselpada bobot matriks Menurut Pfeiffer et al. (2008), nilai-nilai yang dihasilkan dalam perhitungan indeks Moran adalah dalam range berkisar antara -1
Setelah diperoleh indeks Moran, dilakukan uji signifikansi untuk mengetahui apakah terdapat autokorelasi spasial dalam penyebaran DBD. Uji signifikansi dapat dilakukan dengan menggunakan p-value yang ada pada output OpenGeoda dan membandingkannya dengan tingkat signifikansi α = 0,05.
4.
Pola penyebaran penyakit DBD di Kota Surakarta dapat ditunjukkan dengan membandingkan nilai indeks Moran terhadap nilai E I = −1/(n − 1) . Jika nilai indeks Moran lebih kecil dari E I maka autokorelasi spasial negatif dan jika lebih besar E I maka autokorelasi spasial positif. Bila autokorelasi spasial positif berarti kelurahan yang mempunyai jumlah penderita DBD yang tinggi terletak berdekatan dengan kelurahan yang mempunyai jumlah penderita DBD yang tinggi juga, dan kelurahan yang memiliki jumlah penderita DBD yang rendah berdekatan dengan kelurahan yang memiliki jumlah penderita DBD yang rendah.
HASIL DAN PEMBAHASAN Indeks Moran dihitung menggunakan persamaan 1. Misalkan x1 menyatakan jumlah penderita demam berdarah di kelurahan Nusukan untuk i=1, xj menyatakan jumlah penderita demam berdarah di kelurahan j dengan j berjalan dari 1, 2, ..., 51dalam hal ini j menyatakan kelurahan yang ada di Kota Surakarta. Dengan menggunakan cara yang sama untuk pemilihan i yang lain. Penghitungan indeks Moran menggunakan bantuan software OpenGeoda dan diperoleh nilai sebesar 0,123 dengan p value sebesar 0,041. Diperoleh nilai p value kurang dari α=5%, sehingga dapat disimpulkan bahwa terdapat hubungan spasial yang mempengaruhi penyebaran penyakit demam berdarah di Kota Surakarta.
Makalah Pendamping: Matematika 3
303
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Selanjutnya membandingkan nilai indeks Moran dengan nilai E[I] untuk mengetahui 1
pola penyebaran penyakit demam berdarah. Nilai 𝐸 𝐼 = − 𝑛−1 = −0,02 dengan n merupakan jumlah kelurahan yang ada di Kota Surakarta sebanyak 51 kelurahan. Jika nilai indeks Moran kurang dari -0,02, maka terdapat autokorelasi spasial negatif dan jika nilai indeks Moran lebih dari -0,02, maka terdapat autokorelasi spasial positif. Ternyata nilai indeks Moran yang diperoleh lebih besar dari -0,02, sehingga dapat disimpulkan bahwa terdapat autokorelasi spasial positif dengan pola penyebaran Clustered. Gambar 1 merupakan Moran scatterplot dan nilai indeks Moran hasil outputOpenGeoda 9.15.
Gambar 1a. Moran Scatterplot tahun2012
Gambar 1b. Indeks Moran tahun 2012 Pada Gambar 1a. terlihat garis ungu yang menggambarkan indeks Moran miring dari bawah sebelah kiri ke atas sebelah kanan yang menunjukkan autokorelasi spasial positif dan pada Gambar 1b. terlihat bahwa indeks Moran berada di sebelah kanan rata-rata. Hal ini
304
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
menunjukkan bahwa daerah yang mempunyai jumlah penderita demam berdarah tinggi berdekatan dengan daerah yang mempunyai jumlah penderita demam berdarah tinggi dan daerah yang mempunyai jumlah penderita demam berdarah rendah berdekatan dengan daerah yang mempunyai jumlah penderita demam berdarah rendah.
KESIMPULAN Berdasarkan hasil analisis menggunakan bantuan Software OpenGeoda diperoleh nilai indeks Moran yang signifikan, yang berarti bahwa pada tahun 2012 terdapat hubungan spasial yang mempengaruhi penyebaran penyakit demam berdarah dengan pola penyebaran bersifat clustered.
DAFTAR PUSTAKA Anselin, L. (1992). Spatial Data Analysis with GIS : An Introduction to Aplicationin the Social Sciences. National Center for Geographic Information and Analysis of California Santa Barbara, CA93106. ________. (1995). Local Indicator of Spatial Association. Geographical Analysis27: 93-115. Astutik, S , B. Rahayudi, A. Iskandar, R. Fitriani, and S. Murtini. (2011). Detection of Spatial –Temporal Autocorrelation using Multivariate Moran and LISA Method on Dengue Haemorrhagic Fever (DHF) Incidence, East Java, Indonesia. European Journal of Scientific Research Vol (49:2) page 279-285. Dinas Kesehatan Kota Surakarta. (2009).
Profil Kesehatan Kota Surakarta Tahun 2008.
Surakarta. ________. (2010). Profil Kesehatan Kota Surakarta Tahun 2009. Surakarta. ________. (2011). Profil Kesehatan Kota Surakarta Tahun 2010. Surakarta. Griffith, D. (2003). Spatial Autocorrelation Concept. Department of Geography. Syracuse University.
Nakhapakorn, K. and Supet J. (2006). Temporal and Spatial Autocorrelation Statistics of Dengue Fever. Dengue Buletin, Vol. 30, pp: 177-183. Pfeiffer, D. et al. (2008). Spatial Analysis in Epidemiologi. Oxford University Press. New York.
Makalah Pendamping: Matematika 3
305
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
PENERAPAN FUZZY MODEL TAHANI UNTUK PEMILIHAN KENDARAAN BERMOTOR RODA DUA BERDASARKAN KRITERIA LINGUISTIK Yosep Bungkus F. M.1), Lilik Linawati2), Tundjung Mahatma3) 1) Mahasiswa Program Studi Matematika FSM UKSW 2),3) DosenProgram Studi Matematika FSM UKSW Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana Jl. Diponegoro 52-60 Salatiga 50711 1)
[email protected], 2)
[email protected], 3)
[email protected] Abstrak Dalam makalah ini diterapkan pemodelan data fuzzy Model Tahani untuk membantu merekomendasikan pemilihan kendaraan bermotor roda dua dengan kriteria linguistik terhadap data kendaraan yang memiliki spesifikasi secara pasti. Dengan menggunakan model ini dihasilkan nilai fire strength yang menjadi dasar pembuatan rekomendasi. Tiga kemungkinan rekomendasi yang dihasilkan yakni: tidak terdapat hasil rekomendasi, terdapat satu hasil rekomendasi dan terdapat lebih dari satu rekomendasi kendaraan bermotor. Ketiga kemungkinan rekomendasi ini dihasilkan berdasar pada nilai fire strength yang diperoleh menurut kriteria linguistik tertentu. Kata kunci : Himpunan Fuzzy, Model Tahani, Kriteria Linguistik.
PENDAHULUAN Dalam kegiatan jual-beli suatu barang atau jasa, merepresentasi kebutuhan pelanggan merupakan salah satu faktor penting, dimana pembeli memiliki kriteria akan barang atau jasa yang diinginkannya. Dalam kehidupan sehari-hari kriteria yang dikemukakan pembeli sering kali bersifat ambigu dikarenakan setiap individu pembeli memiliki persepsi yang berbeda, sebagai contoh kriteria harga adalah mahal, murah. Kriteria seperti ini disebut sebagai kriteria linguistik. Pada kenyataannya kriteria suatu barang biasanya dinyatakan secara pasti atau deterministik, misalnya harga sebesar tiga belas juta rupiah. Dalam hal ini proses pengambilan keputusan akan sulit jika seseorang menyebutkan kriteria-kriteria dalam bentuk linguistik. Data dalam bentuk kualitatif atau linguistik dapat dikelola menggunakan konsep himpunan fuzzy. Kriteria-kriteria seperti harga, suhu, kecepatan dalam teori himpunan fuzzy direpresentasikan sebagai variabel fuzzy, yang mana masing-masing variabel fuzzy dinyatakan dalam beberapa himpunan fuzzy sesuai dengan domain yang ditentukan berdasarkan data crisp. Sebagai contoh variabel fuzzy harga dikaitkan pada himpunan fuzzy murah, sedang dan mahal dengan batas-batas domain tertentu. Bila terdapat beberapa kriteria linguistik dan dimiliki data spesifikasi barang dalam bentuk crisp, maka untuk menentukan barang yang sesuai kriteria linguistik yang ditentukan, dapat menggunakan metode pengambilan inferensi yang didasarkan pada pemodelan data fuzzy Model Tahani. Beberapa penerapan fuzzy Model Tahani yaitu dalam pengambilan keputusan
306
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
pembelian mobil (Eliyani, 2009) dan pengambilan keputusan pembelian handphone (Amalia, 2010). Dalam penelitian ini dikaji bagaimana menentukan rekomendasi pemilihan suatu barang berdasarkan kriteria linguistik terhadap sejumlah barang yang memiliki spesifikasi pasti, dalam hal ini adalah kendaraan bermotor roda dua. Seperti diketahui bahwa terdapat banyak sekali merk dan tipe kendaraan bermotor roda dua, yang mana masing-masing mempunyai spesifikasi berbeda. Dengan menggunakan fuzzy Model Tahani diharapkan dapat dihasilkan suatu keputusan atau rekomendasi jenis kendaraan yang sesuai dengan kriteria linguistik yang ditentukan.
METODE PENELITIAN Penelitian ini merupakan penerapan fuzzy Model Tahani untuk pemilihan kendaraan bermotor roda dua berdasarkan kriteria linguistik yang dinyatakan sebagai variabel fuzzy dan dikaitkan dengan himpunan fuzzy yang sesuai, didasarkan pada spesifikasi data berbagai kendaraan bermotor roda dua yang diperoleh dari internet yang diakses pada tanggal 10 September 2013. Landasan teori yang akan digunakan sebagai dasar pengkajian akan dipaparkan secara singkat yaitu tentang himpunan fuzzy dan fuzzy Model Tahani. Himpunan Fuzzy Himpunan crisp memiliki definisi secara tegas, artinya bahwa setiap elemen dalam himpunannya selalu dapat ditentukan secara tegas apakah ia merupakan anggota dari himpunan atau tidak. Pada kenyataanya tidak semua himpunan terdefinisi secara tegas, misalnya himpunan kendaraan murah. Pada himpunan kendaraan murah kita tidak dapat menyatakan secara tegas apakah kendaraan itu murah atau tidak, sebagai contoh didefinisikan kendaraan murah memiliki harga kurang dari atau sama dengan Rp 13.000.000,- maka kendaraan dengan harga Rp 13.150.000,- atau Rp. 15.000.000,- menurut definisi tersebut tidak termasuk kendaraan yang murah. Namun harga Rp.13.150.000,- dapat dipandang sebagai harga yang masih murah karena lebih dekat dengan nilai 13 juta dibanding 15 juta ke 13 juta, hal ini menimbulkan kekabur pada arti murah. Untuk mengatasi hal ini maka Zadeh mengaitkan elemen-elemen pada himpunan tersebut dengan suatu fungsi yang dapat menyatakan derajat kesesuaian elemen-elemen dalam semestanya. Pada contoh di atas misalkan kendaraan seharga Rp.13.150.000,- dikaitkan dengan suatu fungsi dan mempunyai nilai fungsi sebesar 0,2. Misalkan dimiliki himpunan A yang dikaitkan dengan himpunan fuzzy𝐴, maka secara matematis himpunan fuzzy 𝐴 dalam semesta X dapat dinyatakan sebagai himpunan pasangan terurut yang didefinisikan oleh : 𝐴= Makalah Pendamping: Matematika 3
𝑥, 𝜇𝐴 𝑥 |𝑥 ∈ 𝑋 307
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
Dengan 𝜇𝐴 adalah fungsi keanggotaan yang memetakan x anggota himpunan semesta X ke selang tertutup [0,1]. Nilai 𝜇𝐴 𝑥 adalah nilai fungsi keanggotaan dari x, yang disebut juga sebagai derajat keanggotaan (Susilo, 2003). Terdapat beberapa fungsi keanggotaan dalam himpunan fuzzy, di antaranya adalah: fungsi keanggotaan linear seperti direpresentasikan pada Gambar 1. dan fungsi keanggotaan segitiga seperti direpresentasikan pada Gambar 2. (Kusumadewi, 2004). Gambar 1.(a) merepresentasikan fungsi keanggotaan fuzzylinearnaik danGambar 1.(b) menyatakan fungsi linear turun.
(a)
(b)
Gambar 1. Representasi Fungsi Keanggotaan FuzzyLinear. Rumus fungsi keanggotaan linear naik dinyatakan seperti pada persamaan (1), sedangkan fungsi keanggotaan linear turun dinyatakan seperti pada persamaan (2). 𝜇 𝑥 =
𝑥−𝑎 𝑏−𝑎
0; 𝑥 ≤ 𝑎 ; 𝑎≤𝑥≤𝑏
(1)
1; 𝑥 ≥ 𝑏 1; 𝑥 ≤ 𝑎 𝜇 𝑥 =
𝑏−𝑥 𝑏−𝑎
; 𝑎≤𝑥≤𝑏
(2)
0; 𝑥 ≥ 𝑏
308
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Fungsi segitiga direpresentasikan seperti pada Gambar 2. dengan rumus fungsinya dinyatakan sebagai persamaan (3). Fungsi keanggotaan fuzzy ini merupakan gabungan dari fungsi keanggotaan linear naik danfungsi keanggotaan linear turun.
Gambar 2. Representasi Fungsi Keanggotaan Fuzzy Segitiga.
0; 𝑥 ≤ 𝑎 𝑎𝑡𝑎𝑢 𝑥 ≥ 𝑏 𝑥−𝑎 ; 𝑎≤𝑥≤𝑏 𝜇 𝑥 = 𝑏−𝑎 𝑐−𝑥 ; 𝑏≤𝑥≤𝑐
(3)
𝑐−𝑏
Operasi Himpunan Fuzzy Terdapat tiga operasi dasar untuk mengkombinasikan dan memodifikasi beberapa himpunan fuzzy yang dikemukakan oleh Zadeh. Operasi tersebut adalah komplemen pada suatu himpunan fuzzy serta gabungan dan irisan pada himpunan-himpunan fuzzy (Wang,1997). Operasi komplemen pada suatu himpunan fuzzy𝐴, hasilnya dinyatakan sebagai himpunan fuzzy 𝐴′ dengan fungsi keanggotaan seperti persamaan (4). 𝜇𝐴′ 𝑥 = 1 − 𝜇𝐴 𝑥
(4)
Operasi gabungan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∪ 𝐵dengan fungsi keanggotaan seperti persamaan (5). 𝜇𝐴∪𝐵 𝑥 = 𝑚𝑎𝑥 𝜇𝐴 𝑥 , 𝜇𝐵 𝑥
(5)
Operasi irisan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∩ 𝐵dengan fungsi keanggotaan seperti persamaan (6). 𝜇𝐴∩𝐵 𝑥 = 𝑚𝑖𝑛 𝜇𝐴 𝑥 , 𝜇𝐵 𝑥
(6)
Fuzzy Model Tahani Fuzzy Model Tahani dideskripsikan sebagai suatu model yang digunakan untuk memproses pencarian data, hanya saja model ini didasarkan pada operasi-operasi dalam teori himpunan fuzzy untuk mendapatkan informasi yang sesuai dengan kriteria pencarian datanya, sehingga fuzzy Model Tahani sangat tepat digunakan dalam proses pencarian data yang akurat (Bojadziev, 2007). Dalam pencarian data, fuzzy Model Tahani menggunakan nilai fire strength Makalah Pendamping: Matematika 3
309
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
sebagai dasar pengambilan keputusan. Nilai fire strength merupakan nilai derajat keanggotaan hasil dari operasi-operasi himpunan fuzzy, sehingganilai fire strength berada pada interval [0,1]. Sebagai contoh, seseorang ingin memilih kendaraan bermotor roda dua dengan kriteria : “harga murah dan kapasitas silinder besar, atau panjang-kendaraan pendek dan harga sedang”. Maka berdasarkan kriteria tersebut dibentuk himpunan fuzzy hasil operasi dari masing-masing himpunan fuzzy dengan fungsi keanggotaannya seperti dibawah ini : 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 =
𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻
∪
∩ 𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅
𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾
∩ 𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺
Dengan fungsi keanggotaan diatas untuk mendapatkan nilai fire strength untuk setiap kendaraan dapat dicari dengan rumus dibawah ini : 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 𝑥 = 𝑚𝑎𝑥 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 , 𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 𝑥
, 𝑚𝑖𝑛 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 𝑥 , 𝜇𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺 𝑥
Kendaraan roda dua yang mempunyai nilai fire strength lebih besar dari 0 merupakan kendaraan roda dua yang direkomendasikan karena memenuhi
kriteria linguistik yang
diinginkan.
Data Dalam penelitian ini dikaji data 17 kendaraan bermotor roda dua dari berbagai merk dan tipe yang dinyatakan sebagai kode A, B, C, dst. Variabel- variabel fuzzy yang digunakan sebagai kriteria adalah harga, kapasitas-silinder, panjang-kendaraan, volume-tangki-bbm dan jarakmesin-ke-tanah. Data tersaji pada Tabel 1. Tabel 1. Spesifikasi Kendaraan Bermotor Roda Dua * No.
Kode
Harga
Kapasitas
Panjang
Tangki Bahan
Jarak Mesin
(Jutaan Rupiah)
Silinder
(mm)
Bakar (lt)
ke Tanah
(cc)
(mm)
1
A
13.125
109
1919
3.7
135
2
B
13.150
108
1863
3.7
140
3
C
22.750
150
2008
12
148
4
D
17.300
124
1923
4.1
130
5
E
17.500
134
1960
4
140
6
F
19.850
149
2050
12
152
7
G
24.000
149
2000
12
167
8
H
12.550
113
1850
3.5
135
9
I
18.875
147
1945
4.2
140
10
J
15.250
124
1895
4.1
135
11
K
12.450
113
1910
4
145
12
L
13.715
124
1900
4
155
310
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
13
M
11.900
113
1930
4.3
140
14
N
14.650
125
1889
3.7
138
15
O
15.550
125
1918
5.5
128
16
P
17.150
150
2056
12.2
156
17
Q
15.000
113
1880
4.8
152
Keterangan :* Data diambil dari berbagai sumber di internet yang diakses pada 10 September 2013.
Langkah-Langkah Pengolahan Data Berikut disajikan langkah-langkah pengolahan data kendaraan bermotor roda dua berdasarkan fuzzy Model Tahani. 1. Penentuan variabel dan himpunan fuzzy serta fungsi keanggotaannya. Variabel fuzzy yang digunakan sebagai kriteria pemilihan, yaitu harga, kapasitas silinder, panjang, tangki bahan bakar dan jarak mesin ke tanah. Pada setiap variabel fuzzy ditentukan 3 himpunan fuzzy yang akan digunakan sebagai nilai kriteria linguistiknya. Pada setiap himpunan fuzzy ditentukan pula fungsi keanggotaannya. Tabel 2. menyajikan daftar variabel fuzzy, himpunan fuzzy dan fugsi keanggotaan masing-masing himpunan yang digunakan sebagai dasar pengolahan data. 2. Perhitungan nilai keanggotaan setiap himpunan. Menggunakan fungsi keanggotaan yang telah ditentukan pada Tabel 2, setiap nilai x yang merupakan data crisp pada masing-masing variabel fuzzy terkait dipetakan menjadi derajat keanggotaan (𝜇 𝑥 ). Misalkan motor J dengan variabel fuzzy harga dimana nilai x adalah Rp15.250.000,- maka derajat keanggotaan pada himpunan fuzzy murah dengan menggunakan fungsi keanggotaan pada persamaan (1) didapat hasil 0.21.
Tabel 2. Daftar Variabel Fuzzy, Himpunan Fuzzy dan Fungsi Keanggotaannya. Variabel
Harga
Kapasitas Silinder
Panjang Kendaraan
Makalah Pendamping: Matematika 3
Himpunan
Fungsi Keanggotaan
MURAH
Linear Naik
SEDANG
Segitiga
MAHAL
Linear Turun
KECIL
Linear Naik
SEDANG
Segitiga
BESAR
Linear Turun
PENDEK
Linear Naik
SEDANG
Segitiga
PANJANG
Linear Turun
311
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
SEDIKIT
Linear Naik
SEDANG
Segitiga
BANYAK
Linear Turun
PENDEK
Linear Naik
SEDANG
Segitiga
PANJANG
Linear Turun
Volume Tangki
Jarak Mesin ke Tanah
3. Penyusunan kriteria. Kriteria linguistik sering kali memuat kata penghubung “atau” dan “dan”. Kata “atau” dikaitkan dengan operasi gabungan pada himpunan fuzzy, “dan” dikaitkan dengan operasi irisan pada himpunan fuzzy. Data crisp pada setiap kriteria (x) dipetakan sesuai dengan fungsi keanggotaan pada variabel dan himpunan fuzzynya seperti pada Tabel 2, sehingga setiap data akan diperoleh derajat keanggotaannya. Kriteria pemilihan disusun berdasarkan kombinasi operasi-operasi antara himpunan-himpunan fuzzy dan variabelnya, sehingga banyaknya kriteria yang terbentuk bergantung pada banyaknya variabel fuzzy yang digunakan dan himpunan fuzzy masing-masing variabelnya. Pada penelitian ini terdapat sebanyak lima variabel fuzzy dan setiap variabel fuzzy mempunyai tiga himpunan fuzzy ditambah kemungkinan tidak memilih satupun himpunan fuzzy pada variabel tersebut, sehingga setiap variabel fuzzy memiliki 4 kemungkinan dipilih. Jadi, banyaknya kombinasi pilihan dari kelima variabel fuzzy tersebut adalah 45 = 512 kombinasi pilihan. 4. Penentuan nilai fire stregth. Pada tahap ini kriteria yang dinyatakan dalam variabel dan himpunan fuzzy akan diolah dengan menggunakan operasi himpunan fuzzy gabungan dan irisan. Dengan rumus seperti pada persamaan (5) dan (6) atau kombinasi dari keduanya. 5. Penentuan hasil rekomendasi. Nilai fire strength
yang diperoleh pada langkah sebelumnya akan menjadi dasar
pengambilan keputusan rekomendasi. Kendaraan dengan nilai fire strength lebih besar dari 0 (nol) merupakan kendaraan yang direkomendasikan. Apabila terdapat beberapa kendaraan dengan nilai fire strength lebih besar dari 0 (nol), maka kendaraan dengan fire strength terbesar merupakan hasil rekomendasi terbaik.
HASIL PENELITIAN DAN PEMBAHASAN Berdasarkan Tabel 1. dan Tabel 2. serta menerapkan persamaan (1), (2) dan (3) diperoleh derajat keanggotaan untuk setiap himpunan fuzzy yang tampak pada Tabel 3. Kriteria pemilihan kendaraan bermotor roda dua ini sangat bervariasi yaitu diantara 512 kombinasi kriteria. Pada penelitian diambil beberapa beberapa contoh kriteria sebagai penerapannya, yaitu sebagai berikut : 312
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
a. Kriteria-1 = Diinginkan kendaraan yang harganya mahal dan kapasitas-silindernya kecil. b. Kriteria-2 = Diinginkan kendaraan yang harganya murah dan volume-tangki-bbm banyak atau panjang-kendaraan sedang dan jarak-mesin-ke-tanah panjang.
Tabel 3. Derajat Keanggotaan Setiap Kendaraan menurut Variabel dan Himpunan Fuzzynya. Harga (Rp)
Kapasitas Silinder (cc)
Panjang Kendaraan (mm)
Volume Tangki Bahan Bakar (lt)
Jarak Mesin ke Tanah (mm)
Kode Murah
Sedang
Mahal
Kecil
Sedang
Besar
Pendek
Sedang
A
0.71
0.29
0.00
0.95
0.05
0.00
0.19
0.81
B
0.71
0.29
0.00
1.00
0.00
0.00
0.85
C
0.00
0.16
0.84
0.00
0.00
1.00
D
0.00
0.85
0.15
0.19
0.81
E
0.00
0.83
0.17
0.00
F
0.00
0.53
0.47
G
0.00
0.00
H
0.85
I
Panjang
Sedikit
Sedang
Banyak
Pendek
Sedang
Panjang
0.00
0.92
0.08
0.00
0.54
0.46
0.00
0.15
0.00
0.92
0.08
0.00
0.22
0.78
0.00
0.00
0.40
0.60
0.00
0.03
0.97
0.00
0.80
0.20
0.00
0.14
0.86
0.00
0.76
0.24
0.00
0.87
0.13
0.00
0.72
0.28
0.00
0.79
0.21
0.80
0.20
0.00
0.22
0.78
0.00
0.00
0.04
0.96
0.00
0.05
0.95
0.00
0.03
0.97
0.00
0.63
0.37
1.00
0.00
0.04
0.96
0.00
0.46
0.54
0.00
0.03
0.97
0.00
0.00
1.00
0.15
0.00
0.75
0.25
0.00
1.00
0.00
0.00
1.00
0.00
0.00
0.54
0.46
0.00
0.00
0.65
0.35
0.00
0.13
0.87
0.00
0.92
0.08
0.72
0.28
0.00
0.22
0.78
0.00
J
0.21
0.79
0.00
0.19
0.81
0.00
0.47
0.53
0.00
0.76
0.24
0.00
0.54
0.46
0.00
K
0.87
0.13
0.00
0.75
0.25
0.00
0.29
0.71
0.00
0.80
0.20
0.00
0.00
0.93
0.07
L
0.57
0.43
0.00
0.19
0.81
0.00
0.41
0.59
0.00
0.80
0.20
0.00
0.00
0.51
0.49
M
1.00
0.00
0.00
0.75
0.25
0.00
0.06
0.94
0.00
0.68
0.32
0.00
0.22
0.78
0.00
N
0.35
0.65
0.00
0.13
0.87
0.00
0.54
0.46
0.00
0.92
0.08
0.00
0.35
0.65
0.00
O
0.14
0.86
0.00
0.13
0.87
0.00
0.20
0.80
0.00
0.20
0.80
0.00
1.00
0.00
0.00
P
0.00
0.87
0.13
0.00
0.00
1.00
0.00
0.00
1.00
0.00
0.00
1.00
0.00
0.46
0.54
Q
0.27
0.73
0.00
0.75
0.25
0.00
0.65
0.35
0.00
0.48
0.52
0.00
0.00
0.63
0.37
Berdasarkan Kriteria-1 dan Kriteria-2 dibentuk fungsi keanggotaan dari kombinasi operasi himpunan fuzzy yang sesuai, yaitu :
a. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 1 𝑥 = 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝐴𝐻𝐴𝐿 𝑥 , 𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐾𝐸𝐶𝐼𝐿 𝑥 b. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 2 𝑥 = 𝑚𝑎𝑥 min 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 , 𝜇𝑇𝑎𝑛𝑔𝑘𝑖𝐵𝐴𝑁𝑌𝐴𝐾 𝑥
, min 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑆𝐸𝐷𝐴𝑁𝐺 𝑥 , 𝜇𝐽𝑎𝑟𝑎𝑘𝑃𝐴𝑁𝐽𝐴𝑁𝐺 𝑥
Nilai fire strength untuk Kriteria-1 disajikan pada Tabel 4, hanya terdapat satu nilai fire strength yang lebih besar dari 0 (nol), yaitu bernilai 0.15 yang merupakan kode kendaraan D. Jadi kendaraan yang direkomendasikan sesuai dengan Kriteria-1 adalah kendaran D.
Tabel 4. Nilai Fire strength untuk Kriteria-1. Derajat Keanggotaan Kode
HargaMAHAL SilinderKECIL
Nilai Fire Strength HargaMAHAL ∩ SilinderKECIL
D
0.15
0.19
0.15
A
0.00
0.95
0.00
B
0.00
1.00
0.00
C
0.84
0.00
0.00
E
0.17
0.00
0.00
F
0.47
0.00
0.00
G
1.00
0.00
0.00
Makalah Pendamping: Matematika 3
313
Volume 2
Prosiding SNMPM Universitas Sebelas Maret 2013
H
0.00
0.75
0.00
I
0.35
0.00
0.00
J
0.00
0.19
0.00
K
0.00
0.75
0.00
L
0.00
0.19
0.00
M
0.00
0.75
0.00
N
0.00
0.13
0.00
O
0.00
0.13
0.00
P
0.13
0.00
0.00
Q
0.00
0.75
0.00
Tabel 5. Nilai fire strength untuk Kriteria-2. Nilai Keanggotaan
Kode
Nilai Fire Strength
HargaMURAH
TangkiBANYAK
PanjangSEDANG
JarakPANJANG
(a1)
(a2)
(b1)
(b2)
a1
b1
∩
∩
a2
b2
(a1 ∩ a2) ∩ (b1 ∩ b2)
L
0.57
0.00
0.59
0.49
0.00
0.49
0.49
G
0.00
0.97
0.46
1.00
0.00
0.46
0.46
Q
0.27
0.00
0.35
0.37
0.00
0.35
0.35
C
0.00
0.97
0.40
0.20
0.00
0.20
0.20
K
0.87
0.00
0.71
0.07
0.00
0.07
0.07
F
0.00
0.97
0.05
0.37
0.00
0.05
0.05
A
0.71
0.00
0.81
0.00
0.00
0.00
0.00
B
0.71
0.00
0.15
0.00
0.00
0.00
0.00
D
0.00
0.00
0.86
0.00
0.00
0.00
0.00
E
0.00
0.00
0.79
0.00
0.00
0.00
0.00
H
0.85
0.00
0.00
0.00
0.00
0.00
0.00
I
0.00
0.00
0.92
0.00
0.00
0.00
0.00
J
0.21
0.00
0.53
0.00
0.00
0.00
0.00
M
1.00
0.00
0.94
0.00
0.00
0.00
0.00
N
0.35
0.00
0.46
0.00
0.00
0.00
0.00
O
0.14
0.00
0.80
0.00
0.00
0.00
0.00
P
0.00
1.00
0.00
0.54
0.00
0.00
0.00
Hasil nilai fire strength untuk Kriteria-2 dapat dilihat pada Tabel 5. Kombinasi kriteria harga murah dan volume-tangki-bbm banyak memberikan hasil semua nilai fire strength sama dengan 0 (nol), seperti terlihat pada kolom-6 Tabel 5. Hal ini berarti tidak ada kendaraan yang direkomendasikan untuk kriteria tersebut. Sedangkan untuk Kriteria-2, terdapat enam nilai fire strength yang lebih besar dari 0 (nol), yaitu bernilai : 0.05, 0.07, 0.20, 0.35, 0.46, 0.49 pada kode kendaraan : F, K, C, Q, G, L , ini berarti 6 kendaraan tersebut memenuhi Kriteria-2 . 314
Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013
Volume 2
Kendaraan dengan fire strength terbesar, yaitu 0.49 untuk kode kendaraan L merupakan kendaraan yang mendapat rekomendasi terbaik untuk Kriteria-2.
SIMPULAN DAN SARAN Dari pembahasan diatas dapat diambil simpulan bahwa penerapan fuzzy model Tahani untuk kendaraan bermotor roda dua terdapat tiga kemungkinan hasil rekomendasi, yaitu tidak ada hasil rekomendasi, terdapat satu hasil rekomendasi atau terdapat lebih dari satu rekomendasi kendaraan bermotor yang dipilih. Apabila terdapat lebih dari satu hasil rekomendasi, maka kendaraan bermotor roda dua yang mempunyai nilai fire strength tertinggi merupakan rekomendasi terbaik. Kemungkinan kriteria
pemilihan kendaraan bermotor roda dua dapat berkembang
sesuai dengan variabel dan himpunan fuzzy yang dirumuskan, serta banyaknya jenis dan tipe kendaraannya, maka perlu adanya pengembangan pada pengelolaan dan pengolahan datanya dengan memanfaatkan basisdata dan aplikasi yang berbasis pada basisdata, agar proses pengolahan datanya dapat lebih cepat dan efisien.
DAFTAR PUSTAKA Amalia, L. 2010. Model Fuzzy Tahani Untuk Pemodelan Sistem Pendukung Keputusan (SPK). Seminar Nasional Aplikasi Teknologi Informasi 2010, Yogyakarta. Eliyani. 2009. Decision Support System Untuk Pembelian Mobil Menggunakan Fuzzy Database Model Tahani. Seminar Nasional Aplikasi Teknologi Informasi 2009., Yogyakarta. Bojadziev, M & Bojadziev, G. 2007. Fuzzy Logic for Business, Finance, and Management 2nd Edition.,World Scientific. Singapore. Kusumadewi, S & Purnomo, H. 2004. Aplikasi Logika Fuzzy Untuk Pendukung Keputusan.,Graha Ilmu. Yogyakarta. Susilo, F. 2003. Penghantar Himpunan & Logika Kabur Serta Aplikasinya. Universitas Sanata Dharma. Yogyakarta. Wang, L-X. 1997. A Course in Fuzzy System and Control., Prentice Hall Internasional. Amerika. http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013. http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013. http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.
Makalah Pendamping: Matematika 3
315