METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST Wahidah Alwi Nur Azni Tahir Prodi Matematika, FST- UINAM
Mahasiswa Prodi Matematika, FST- UINAM
Info: Jurnal MSA Vol. 3 No. 2 Edisi: Januari – Juni 2014 Artikel No.: 3 Halaman: 14 - 24 ISSN: 2355-083X Prodi Matematika UINAM
ABSTRAK Pada artikel ini dijelaskan bagaimana menentukan factor-faktor yang mempengaruhi seseorang menderita penyakit kencing manis dengan menggunakan Algoritma QUEST. Data yang disajikan diambil dari Rumah Sakit Plamonia Makassar yang terdiri dari 250 sampel atau jumlah pengamatan dengan 12 variabel bebas dimana 5 variabel bebas kategorik dan 7 variabel bebas numerik. Berdasarkan hasil penelitian faktor yang mempengaruhi penderita penyakit kencing manis seseorang yaitu kadar gula darah, hipertensi, dan umur. Kata Kunci: Algoritma Quest, Kencing Manis
1. PENDAHULUAN LatarBelakang Kencing Manis adalah suatu keadaan dimana terjadi peningkatan kadar gula darah (glukosa) dalam darah yang berlebihan dan terjadi secara menahun. Hal ini terjadi karena tidak bisa memproduksi insulin dalam jumlah yang cukup atau tubuh tidak mampu menggunakan insulin secara efektif. Disebut penyakit Kencing Manis, karena dalam urin penderita penyakit tersebut dapat ditemukan zat gula yang mana seharusnya tidak ditemukan. Dalam Al-Qur’an Surah Al-Anbiya ayat 83 telah dijelaskan bahwa Terjemahnya: “Dan (ingatlah kisah) Ayyub, ketika ia menyeru Tuhannya: “(Ya Tuhanku), Sesungguhnya aku telah ditimpa penyakit dan Engkauadalah Tuhan yang Maha Penyayang diantara semua Penyayang”. Maksud dari ayat al-qur’an tersebut adalah, Allah swtmengingatkan Rasul-Nya dan umat Muslimin kepada kisah Nabi Ayub a.s. yang ditimpa suatu penyakit yang berat sehingga berdoa memohon pertolongan Tuhannya untuk melenyapkan penyakitnya itu, karena ia yakin bahwa Allah SWT. adalah yang amat penyayang. Walaupun berbeda-beda riwayat yang diperoleh tentang Nabi Ayub, baik mengenai pribadinya, masa 14
hidupnya dan macam penyakit yang dideritanya, namun ada hal-hal yang dapat dipastikan tentang dirinya, yaitu bahwa dialah seorang hamba Allah yang saleh, telah mendapat cobaan dari Allah, baik mengenai harta benda, keluarga, dan anakanaknya, maupun cobaan yang menimpa dirinya sendiri. Dan penyakit yang dideritanya adalah berat. Meskipun demikian semua cobaan itu dihadapinya dengan sabar dan tawakal serta memohon pertolongan dari Allah SWT. dan sedikitpun tidak mengurangi keimanan dan ibadahnya kepada Allah SWT. Allah memberikan penyakit kepada setiap umatnya dan tentu Allah juga memberikan obat bagi segala penyakit yg telah ditimpakannya kepada umatnya, sesuai dengan hadits berikut:
َْب َد َوا ُء ال َّدا ِء بَ َرأ َ صي ِ ُ فَإ ِ َذا أ،لِ ُك ِّل دَا ٍء َد َوا ٌء بِإ ِ ْذ ِن هللاِ َع َّز َو َج َّل Terjemahnya: “Setiap penyakit ada obatnya. Maka bila obat itu mengenai penyakit akan sembuh dengan izin Allah Azza wa Jalla.” (HR. Muslim no. 5705) Salah satu penyakit yang akan dibahas pada penelitian kali ini adalah Kencing Manis (Diabetes Mellitus) dengan menggunakan metode Klasifikasi berstruktur pohon yang diaplikasikan dalam algoritma quest.
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Masalah klasifikasi (pengelompokan) sering dijumpai pada kehidupan sehari-hari, baik dibidang pendidikan, sosial, industri, kesehatan maupun perbankan. Contoh masalah klasifikasi dalam bidang pendidikan adalah klasifikasi sekolah berdasarkan akreditasi sekolah. Dalam bidang kesehatan dilakukan pengklasifikasian penyakit berdasarkan tingkat keseriusan dan bahaya yang ditimbulkan. Dalam statistika, dikenal berbagai metode untuk mengklasifikasikan objek. Klasifikasi dapat dilakukan dengan menggunakan pendekatan parametric maupun pendekatan nonparametrik. Pendekatan parametric biasanya sangat tergantung dari asumsi-asumsi mengenai sebaran data sehingga bila asumsi tersebut tidak terpenuhi, maka hasil yang diperoleh menjadi tidak valid. Pendekatan nonparametric digunakan untuk mengatasi keterbatasan dari pendekatan parametrik. Pendekatan ini tidak bergantung pada asumsi tertentu sehingga memberikan kemudahan dalam menganalisa data tetapi tetap mempunyai tingkat akurasi yang tinggi. Untuk mendapatkan klasifikasi yang tepat, perlu diperhatikan metode klasifikasi yang tepat. Metode klasifikasi berstruktur pohon adalah salah satu metode klasifikasi nonparametrik yang sering digunakan. Metode ini pertama kali diperkenalkan oleh Breiman,et. al pada tahun 1984. Klasifikasi pada metode ini dilakukan dengan membangun sebuah pohon klasifikasi yang diperoleh melalui penyekatan berulang terhadap sebuah himpunan data (dalam hal ini diistilahkan sebagai simpul) menjadi dua atau lebih simpul baru. Metode klasifikasi berstruktur pohon dapat dibagi menjadi dua kelompok. Kelompok pertama menghasilkan pohon biner, yaitu sebuah pohon yang setiap simpul disekat menjadi dua simpul yang saling terpisah. CART (Classification and Regression Trees) merupakan algoritma yang diperkenalkan oleh Breiman, et.al (1984), sedangkan QUEST (Quick, Unbiased, Efficient Statistical Trees) merupakan algoritma yang diperkenalkan oleh Loh dan Shih (1997). CART dan QUEST merupakan contoh metode yang menghasilkan pohon seperti ini. Kelompok kedua adalah 15
kelompok yang menghasilkan pohon non-biner, yaitu sebuah pohon yang setiap simpul disekat menjadi dua atau lebih simpul yang terpisah. CHAID (Chi-squared Automatic Interaction Detector) merupakansalahsatualgoritma yang diperkenalkanolehKass (1980), sedangkan CRUISE (Classification Rule with Unbiased Interaction Selection and Estimation) merupakanalgoritma yang diperkenalkanoleh Kim danLoh (2001). CHAID dan CRUISE merupakancontohmetodeklasifikasi yang menghasilkanpohon non- biner. Pada penelitian ini, akan dibahas metode klasifikasi berstruktur pohon menngunakan algoritma QUEST yang masih relatif baru untuk diketahui bagaimana menerapkannya pada data pasien penderita penyakit kencing manis. Berdasarkan hal tersebut maka akan dikaji metode klasifikasi berstruktur pohon dan menuangkan dalam karya ilmiah dengan judul:“Metode Klasifikasi Berstruktur Pohon Dengan Algoritma Quest (Studi Kasus: FaktorFaktor Yang Mempengauhi Penderita Penyakit Kencing Manis)” RumusanMasalah Rumusan Masalah adalah faktor-faktor apa yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon ? TujuanPenelitian Tujuan penelitian ini adalah untuk mengetahui faktor-faktor yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon 2. TINJAUAN PUSTAKA Uji Levene Uji Levene digunakan untuk menguji kesamaan ragam peubah dari dua kelompok atau lebih. Untuk mendapatkan statistik uji ini, data ditransformasikan dulu menjadi simpangan mutlaknya terhadap nilai tengah data, yaitu 𝑦𝑘𝑖 = |𝑥𝑘𝑖 − 𝑥̅ 𝑘 |, Dengan:
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 i = 1, 2, ..., 𝑛𝑘 k = 1, 2, ..., K 𝑥̅𝑘 : nilai tengah contoh kelompok ke-k 𝑦𝑘𝑖 : hasil transformasi data pengamatan ke-i dari kelompok ke-k 𝑥𝑘𝑖 : pengamatan ke-i dari kelompok ke-k Lakukan statistik uji ANOVA pada data yang telah ditransformasi untuk mendapatkan nilai statistik uji Levene . Dalam pengambilan keputusan, 𝐻0 ditolak pada taraf nyata 𝛼 jika nilai statistik uji Lavene hasil perhitungan lebih besar daripada nilai 𝐹𝛼,𝐾−1,𝑁−𝐾.
pengukuran terhadap satu peubah bebas atau lebih. Metode ini menghasilkan sebuah pohon klasifikasi (classification tree) yang dibentuk melalui penyekatan data secara berulang (rekursif) terhadap suatu himpunana data, di mana pengelompokan dan nilai-nilai peubah bebas setiap amatan padadata contoh sudah diketahui. Setiap himpunan data dinyatakan sebagai simpul dalam pohon yang terbentuk Pohon klasifikasi berikut:
disajikan dalam gambar
Analisis Diskriminan Kuadratik Analisis diskriminan bertujuan untuk membentuk fungsi diskriminan yang mampu membedakan kelompok. Analisis ini dilakukan berdasarkan suatu perhitungan statistik terhadap objek-objek yang telah diketahui dengan jelas dan mantap pengelompokannya. Fungsi diskriminan dapat disebut dengan fungsi pembeda. Fungsi diskriminan yang dibangun dengan asumsi bahwa kelompokkelompok memiliki matriks ragam peragam yang sama dinamakan fungsi diskriminan linier, sedangkan fungsi yang dibangun tanpa asumsi tersebut dinamakan fungsi diskriminan kuadratik. Metode Klasifikasi Berstruktur Pohon Dalam statistika, terdapat berbagai metode yang dapat digunakan dalam menarik kesimpulan mengenai hubungan antara suatu peubah respon dengan beberapa peubah bebas. Jika peubah respon berupa data kuantitatif maka analisa mengenai hubungan peubah bebas dan respon biasanya dilakukan melalui analisis regresi biasa. Namun, bila peubah respon merupakan data kualitatif maka analisa mengenai hubungan peubah bebas dan respon salah satunya dapat dilakukan melalui teknik klasifikasi. Metode klasifikasi berstruktur pohon merupakan metode statistika yang digunakan untuk memperkirakan keanggotaan amatan atau objek dalam kelas- kelas peubah respon kategorik, yang keanggotaannya diduga berdasarkan
Gambar 2.1. Pohon Klasifikasi Dalam pohon klasifikasi sepeti pada gambar 1, himpunan data awal disebut simpul induk, dinotasikan sebagai 𝑡0 . Pada simpul 𝑡0 , dilakukan penyekatan sehingga terbentuk simpul 𝑡1 dan 𝑡2 . Penyekatan dilakukan secara berulang sampai diperoleh sebuah simpul yang tidak dapat disekat lagi, yang disebut simpul akhir. Simpul yang tidak termasuk pada simpul induk dan simpul akhir disebut simpul dalam. Dapat dilihat bahwa 𝑡1 dan 𝑡4 adalah simpul dalam sedangkan 𝑡2 , 𝑡3 , 𝑡5 𝑑𝑎𝑛 𝑡6 adalah simpul akhir. Pada simpul-simpul akhir ini dilakukan pendugaan respon. Penyekatan terhadap sebuah simpul dilakukan berdasarkan nilai suatu peubah bebas (titik penyekat). Peubah bebas yang digunakan untuk menyekat sebuah simpul dinamakan sebagai peubah penyekat. Peubah penyekat dapat berupa peubah kategorik maupun peubah kontinu. Pada gambar 1 terlihat bahwa simpul 𝑡0 disekat berdasarkan peubah 𝑥1 menjadi simpul 𝑡1 bila 𝑥1 ≤ 0,05 dan simpul 𝑡2 bila 𝑥1 > 0,05. Simpul dalam 𝑡1 disekat lagi berdasarkan peubah 𝑥2 menjadi simpul 𝑡3 bila 𝑥2 ∈ {1}dan 𝑡4 bila 16
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 𝑥2 ∈ {2,3}. Simpul dalam 𝑡4 disekat lagi berdasarkan peubah 𝑥3 menjadi simpul 𝑡5 bila 𝑥3 ≤ 6 dan 𝑡6 bila 𝑥3 > 6. Dalam menyekat suatu simpul, setiap peubah bebas memiliki kesempatan untuk terpilih sebagai peubah penyekat, meskipun peubah tersebut telah terpilih sebelumnya sebagai peubah penyekat simpul lain. Proses penyekatan terhadap simpul dilakukan secara berulang sampai ditemukan salah satu dari tiga hal berikut: 1. respon di semua simpul sudah homogen nilainya 2. tidak ada lagi peubah bebas yang bisa digunakan 3. jumlah objek di dalam simpul sudah terlalu sedikit untuk menghasilkan pemisahan yang memuaskan. Dalam pembentukan pohon klasifikasi, proses penyekatan terhadap suatu simpul dapat bersifat biner atau non biner. Pada penyekatan biner, setiap simpul hanya boleh disekat menjadi dua simpul baru, sedangkan pada penyekatan non biner setiap simpul dapat menghasilkan lebih dari dua simpul baru. Gambar 1 merupakan pohon klasifikasi dengan penyekatan biner. Pohon yang dibentuk dari proses penyekatan tersebut dapat berukuran sangat besar. Bila pohon berukuran besar, biasanya penduga respon cenderung lebih tepat, tapi sulit diinterpretasi. Bila pohon kecil, pohon mudah diinterpretasi namun penduga respon cenderung tidak tepat. Pohon terbaik yaitu pohon yang memiliki keseimbangan antara ukuran pohon dan ketepatan penduga respon. Untuk menghasilkan pohon terbaik dilakukan pemangkasan pohon yang sudah terbentuk. 3. PEMBAHASAN Penerapan metode quest ini akan diperlihatkan melalui kasus pengkajian faktor-faktor apa saja yag mempengaruhi seseorang menderita penyakit Kencing Manis.Penyakit kencing manis (Diabetes Mellitus) adalah salah satu keadaan dimana terdapat kadar gula darah yang berlebihan dalam peredaran darah. Ini terjadi karena badan kekurangan hormon yang disebut
17
insulin yang diperlukan untuk membakar gula menjadi tenaga dalam tubuh. Berikut ini disajikan data yang diperoleh untuk mengkaji faktor-faktor yang mempengaruhi seseorang penderita Kencing Manis.variabel terikat Y merupakan peubah kategorik dengan dua kategori yaitu penderita Kencing Manis dan 0 bila tidak menderita penyakit Kencing Manis. Data ini diperoleh dari Rumah Sakit Pelamonia Makassar yang terdiri dari 12 variabel bebas dengan 5 variabel bebas kategorik dan 7 variabel bebas numerikdan jumlah pengamatan sebanyak 250 sampel . Sebelum itu perlu disusun beberapa hipotesis dalam pemilihan variabel penyekat yakni seagai berikut: H 0 variabel tidak dapat variabel penyekat dan
dipilih
sebagai
H 1 variabel dapat dipilih sebagai variabel penyekat Selanjutnya akan diilustrasikan pembentukan pohon dengan menggunakan metode QUEST untuk data penyakit Kencing Manis. Simpul awal t 0 atau variabel terikat Y terdiri dari 250 pengamatan dari dua kategori pengamatan yaitu pasien yang berpenyakit kencing manis(81 pengamatan) dan pasien yang tidak berpenyakit Kencing Manis (169 pengamatan).Untuk pemilihan variabel penyekat dipilih dengan menggunakan uji ANOVA satu faktor untuk variabel bebas numerik dan uji 2 untuk variabel bebas kategorik. Berikut ini adalah tabel hasil uji statistik pemilihan variabel penyekat simpul t 0 : Tabel 4.1. Hasil uji statistik pemilihan variabel penyekat simpul t 0 Variabel bebas
Nilai statistik uji
Nilai p
X1
2 0,11
p 0,739
X2
F 6,924
p 0,009
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Variabel bebas
Nilai statistik uji
Nilai p
Berikut ini adalah hasil uji statistik pemilihan variabel penyekat simpul t1 :
X3
F 10,997
p 0,001
Tabel 4.2. Hasil uji statistik pemilihan variabel penyekat simpul t1
X4
F 1,451
p 0,230
X5
2 0,158
p 0,691
X6 X7
X8 X9 X 10
2 11,663 F 14,968 F 2,380 F 6,417
F 5,307
X 11
74 ,936
X 12
25,701
2
2
p 0,001
p 0,000
Nilai statistik uji
Nilai p
X1
2 3,518
p 0,061
X2
F 1,037
p 0,310
X3
F 2,267
p 0,134
X4
F 0,619
p 0,433
X5
2 0,025
p 0,874
X6
2 5,815
p 0,016
X7
F 0,238
p 0,626
X8
F 0,380
p 0,539
X9
F 7,148
p 0,008
X 10
F 13,560
p 0,000
X 12
2 4,052
p 0,044
p 0,124 p 0,012
p 0,022 p 0,000 p 0,000
Selanjutnya untuk daerah kritis yang digunakan H 0 ketika p / jumlah adalah menerima variabel dan menolak H 0 ketika p / jumlah variabel. Bila digunakan a 0,05 akan didapatkan a / M 1 0,05/12 0,0042 . Berdasarkan tabel 4.1 terihat bahwa yang memiliki nilai p terkecil adalah variabel X 7 , X 11 , X 12 dengan nilai p 0.000 . Nilai p terkecil dapat diperoleh pada variabel dengan nilai statistik uji ANOVA dengan F terbesar atau uji chi square dengan 2 terbesar. Karena variabel X 11 memiliki 2 terbesar maka dianggap X 11 memiliki nilai p yang terkecil . Selanjutnya
X 11 memilik terlihat bahwa nilai p 0.000 0.0042 sehingga dalam hal ini H 0 ditolak atau X 11 dapat variabel penyekat.
Variabel bebas
digunakan
sebagai
Selanjutnya untuk daerah kritis yang digunakan H 0 ketika p / jumlah adalah menerima variabel dan menolak H 0 ketika p / jumlah variabel. Bila digunakan a 0,05 didapat a / M 1 0,05/12 0,0042 . Berdasarkan Tabel 4.2 terlihat bahwa X 10 memilik nilai p 0.000 0.0042 sehingga H 0 ditolak atau X 10 dapat dalam hal ini digunakan sebagai variabel penyekat. Variabel X 10 adalah variabel numerik sehingga diperlukan analisis diskriminan kuadratik untuk memperoleh titik penyekat, dari data diperoleh: 18
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 x0 43,979 x1 33,733 s 02 110 ,290 s12 46 ,924
s1 6,850
s0 10 ,502
P(0 | t ) 0,896 P(1 | t ) 0,104
Titik penyekat adalah akar dari persamaan ax 2 bx c 0 Dimana a s02 s12 110 ,290 46 ,924 63,366 b 2( x s x s ) 2 0 1
2 1 0
2((43,979 46,924) (33,733110,290)) 2(2063,670596 - 3720.41257)
-3313.484
P(0 | t ) s12 c ( x1 s0 ) ( x0 s1 ) 2s s ln 2 P(1 | t ) s0 2
2
2 2 0 1
dimulai dari variabel bebas X 1 yang merupakan variabel kategorik sehingga dalam hal ini 2 terhadap dlakukan uji Untuk Y. memudahkan, dilakukan perhitungan dengan menggunakan SPSS. Berdasarkan Tabel 34(lihat lampiran halaman 91), diperoleh nilai statistik uji sebesar 2 0,915 dan p 0,339. Berikut ini hasil uji statistik pemilihan variabel penyekat simpul t 2 : Tabel 4.3. Hasil uji statistik pemilihan variabel penyekat simpul t 2 Nilai
p
Variabel bebas
Nilai statistik uji
X1
2 0,915
p 0,339
X2
F 6,142
p 0,015
F 46 0,,070 X3 924 0,896 2 2 33,733 10,502 43,979 6,850 2110,29046,924ln 0,104 110,290 F 1,742 X4 125502.958- 90755.268 10350.496(1.299)
p 0,792
48192.632
X5
2 1,571
p 0,210
X6
2 3,805
p 0,001
X7
F 13,237
p 0,000
X8
F 0,002
p 0,962
3313,484 (3313,484) 4(63,366)(48192,632) X9 2(63,366)
F 0,533
p 0,467
X 10
F 1,429
p 0,235
X 12
2 16 ,571
p 0,051
Dengan demikian diperoleh persamaan 2 63,366 x 3313 ,484 x 48192 ,632 0 Akar dari persamaan diatas adalah: d
p 0,190
b b 4ac 2a 2
2
3313,484 - 1235920 126,732 Karena akarnya imajiner sehingga tidak dapat dilanjutkan untuk membuat titik penyekat.Oleh karena itu simpul t1 tidak dapat disekat lagi sehingga pada simpul t1 penyekatan dihentikan. Selanjutnya dilakukan langkah yang sama untuk memilih variabel penyekat pada simpul t 2 19
Selanjutnya untuk daerah kritis yang digunakan adalah menerima H 0 ketika p / jumlah variabel dan menolak H 0 ketika p / jumlah variabel. Bila digunakan a 0,05 didapat a / M 1 0,05/12 0,0042 .
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Berdasarkan Tabel 4.3 terihat bahwa yang memiliki nilai p terkecil adalah variabel X 7 ,
X 12 dengan nilai p 0.000 . Nilai p terkecil dapat diperoleh pada variabel dengan nilai statistik uji ANOVA dengan F terbesar atau uji chi square dengan 2 terbesar . Karena variabel X 11 memiliki 2 terbesar maka dianggap X 12 memiliki nilai p yang terkecil . Selanjutnya X 12 memilik terlihat bahwa nilai p 0.000 0.0042 sehingga dalam hal ini H 0 ditolak atau X 12 dapat variabel penyekat.
digunakan
Tabel 4.62. Hasil uji statistik pemilihan variabel penyekat simpul t 3 Nilai statistik uji
X1
2 0,068
p 0,795
X2
F 4,166
p 0,045
X3
F 0,006
p 0,939
X4
F 0,213
p 0,646
X5
2 0,495
p 0,482
X6
2 2,357
p 0,111
X7
F 3,014
p 0,087
X8
F 0,144
p 0,706
X9
F 0,026
p 0,871
X 10
F 7,038
p 0,010
sebagai
Variabel X 12 adalah variabel kategorik dengan banyak kategori sama dengan dua sehinggga titik penyekat dapat diperoleh langsung. Dengan demikian simpul t 2 dibagi menjadi dua simpul yaitu simpul t 3 dan t 4 . Dimana simpul t 3 dengan
X 12 0 dan simpul t 4 dengan X 12 1 . Simpul t 3 terdiri dari 29 pengamatan dari dua kategori yaitu 20 orang yang tidak menderita Kencing Manis dan 9 orang yang menderita Kencing Manis. Simpul t 4 terdiri dari 77 pengamatan dari dua kategori yaitu 20 orang yang tidak menderita Kencing Manis dan 57 orang yang menderita Kencing Manis.
Nilai
p
Variabel bebas
Karena simpul t3 tidak memungkinkan lagi untuk melakukan penyekatan karena banyaknya pengamatan pada simpul dalam paling sedikit 50 dan simpul akhir paling sedikit 20 sehingga simpul t3 menjadi simpul akhir.
Selanjutnya untuk daerah kritis yang digunakan H 0 ketika p / jumlah adalah menerima variabel dan menolak H 0 ketika p / jumlah variabel. Bila digunakan a 0,05 didapat a / M 1 0,05/12 0,0042 .
Selanjutnya dilakukan langkah yang sama untuk memilih variabel penyekat pada simpul t 4 dimulai dari variabel bebas X 1 yang merupakan variabel kategorik sehingga dalamhal ini 2 terhadap dlakukan uji Untuk Y. memudahkan, dilakukan perhitungan dengan menggunakan SPSS.Berdasarkan Tabel 49(lihat lampiran halaman 97),diperoleh nilai statistik uji sebesar 2 0,068 dan p 0,795 .
Berdasarkan Tabel 4.61 dapat terlihat bahwa variabel bebas X 10 memiliki nilai p terkecil, yang Selanjutnya terlihat bahwa X 10 memilik nilai p 0.010 0.0042 sehingga dalam hal ini H 0 diterima atau X 10 tidak dapat digunakan sebagai variabel penyekat.
Berikut ini adalah Hasil uji statistik pemilihan variabel penyekat simpul t 3
Dari hasil tabulasi diatas, Karena H 0 diterima oleh karena itu perlu dilakukan uji Levene atau uji homogenitas pada setiap variabel numerik m untuk menguji bahwa data sudah homogen atau belum. Dengan menggunakan cara SPSS didapatkan nilai levene sebagai berikut: 20
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Berdasarkan Tabel 61(lihat lampiran halaman 102),Untuk variabel X 2 diperoleh nilai levene 8,182 dengan nilai p 0,005 . Selanjutnya berdasarkan tabel 62(lihat lampiran halaman 102),Untuk variabel X 3 diperoleh nilai levene 5,594 dengan nilai p 0,021. Selanjutnya berdasarkan tabel 63(lihat lampiran halaman 103),Untuk variabel X 4 diperoleh nilai levene 1,518 dengan nilai p 0,222. Berdasarkan Tabel 64(lihat lampiran halaman 103),Untuk variabel X 7 diperoleh nilai levene 1,398 dengan nilai p 0,241 . Selanjutnya Berdasarkan Tabel 65(lihat lampiran halaman 103),Untuk variabel X 8 diperoleh nilai levene 1,803 dengan nilai p 0,183 . Selanjutnya berdasarkan tabel 66(lihat lampiran halaman 104),Untuk variabel X 9 diperoleh nilai levene 4,105 dengan nilai p 0,046 . Selanjutnya Untuk tabel 67 (lihat lampiran halaman 104), untuk variabel X 10 diperoleh nilai levene 0,075 dengan nilai p 0,785 Dari berbagai uji beberapa variabel diatas diperoleh tabel sebagai berikut: Tabel 4.4. Hasil uji statistik Levene variabel numerik simpul t 4
Berdasarkan Tabel 4.4 diperoleh variabel X 2 memiliki uji levene terkecil yaitu 8,182 dengan nilai p 0,005 kemudian dibandingkan dengan / 7 0,0071 . Berdasarkan uji levene yang digunakan diperlihatkan nilai p 0,005 0.0071 . Sehingga dalam hal ini H0 ditolak atau X2 dapat digunakan sebagai variabel penyekat. Variabel X 2 adalah variabel numerik sehingga diperlukan analisis diskriminan kuadratik untuk memperoleh titik penyekat, dari data diperoleh: x0 52 ,900 x1 57 ,825 s 02 18,411 s12 109 ,183
s1 10 ,449
s 0 4,291
P(0 | t ) 0,260 P(1 | t ) 0,740
Titik penyekat adalah akar dari persamaan ax 2 bx c 0 Dimana a s02 s12 18,411 109 ,183 -90.772 b 2( x 0 s12 x1 s 02 )
2((52,9 109,183) (57,825 18,411)) 2(5775.7807- 1064.616075)
9422.330 Uji Levene
X2
8,182
p 0,005
X3
5,594
p 0,021
57,825 4, 291 52,900 10, 449
X4
1,518
p 0,222
0, 260 109,183 2 18, 411109,183 ln 0,740 18, 411
X7
1,398
p 0,241
X8
1,803
p 0,183
X9
4,105
p 0,046
X 10
0,075
p 0,785
21
Nilai
p
Variabel bebas
P(0 | t ) s12 c ( x1 s0 ) 2 ( x0 s1 ) 2 2s02 s12 ln 2 P(1 | t ) s0 2
2
61567.045- 305534.8841 2951.363
-241016.476
Dengan demikian diperoleh persamaan 2 - 90.772x 9422.330x 241016.476 0 Akar dari persamaan diatas adalah:
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Kelompok kedua merupakan seseorang yang memiliki kadar gula > 120 mg dan tidak terserang penyakit diabetes. Pada kelompok - 9422,330 (9422,330) 2 4(90,772)(241016,476 ini )juga cenderung tidak menderita penyakit Kencing Manis. 2(90.772) 3. Kelompok ketiga Kelompok ketiga merupakan seseorang 6 yang memiliki kadar gula >120 dan 9422 ,330 1.31831 10 terserang penyakit hipertensikemudian - 181.444 memiliki umur dibawah 58,35 tahun cenderung menderita penyakit Kencing 9422 ,330 1.31831 10 6 Manis. d1 45,677 - 181.444 4. Kelompok keempat Kelompok keempat merupakan seseorang yang memiliki kadar gula >120 dan 9422 ,330 1.31831 10 6 terserang penyakit hipertensi kemudian d2 58,354 memiliki umur diatas 58,35 tahun semuanya - 181.444 menderita penyakit Kencing Manis d
b b 2 4ac 2a
Dari dua akar persamaan ini, diambil akar yang paling mendekati x0 52 ,9 sehingga diperoleh
d 2 58,354 . Dapat disimpulkan bahwa X 2 memotong di titik d 2 58,354 . dengan demikian simpul t 4 disekat menjadi 2 simpul yaitu simpul t 5 dengan d 58,354 dan simpul t 6 dengan d 58,354 . Simpul t 5 terdiri dari 54 pengamatan dari dua kategori yaitu bukan penderita kencing manis sebanyak 20 pengamatan dan penderita kencing manis sebanyak 34 pengamatan. Simpul t 6 terdiri dari bukan penderita kencing manis sebanyak 0 pengamatan dan penderita kencing manis sebanyak 23 pengamatan.Selanjutnya tidak dilakukan penyekatan lagi pada simpul t 5 dan t 6 karena pengamatan sudah terlalu kecil untuk dilakukan penyekatan.
Berdasarkan kelompok diatas dapat digunakan untuk mengambil kesimpulan untuk menduga nilai dari variabel terikat Y atau penyakit Kencing Manis yaitu dimana faktor yang mempengaruhi seseorang menderita penyakit Kencing Manis yaitu faktor kadar gula, keadaan hipertensi, dan umur . Sehingga variabel-variabel seperti jenis kelamin, umur, tinggi badan, berat badan, kolestrol, HDL, LDL, tekanan darah dan rokok bisa dikatakan memiliki pengaruh terhadap penyakit kencing manis walaupun pengaruhnya tidak terlalu signifikan. Selanjutnya berdasarkan langkahlangkah sebelumnya diperoleh pohon klasifikasi sebagai berikut:
Selanjutnya untuk menduga variabel terikat Y yakni dengan mengelompokkan berdasarkan banyaknya simpul akhir. Dalam hal ini terdapat 4 kelompok yaitu: 1. Kelompok pertama Kelompok pertama menyatakan bahwa seseorang yang memiliki kadar gula darah <120 mg .seseorang yang termasuk pada kelompok ini seseorang rata-rata tidak menderita penyakit Kencing Manis. 2. Kelompok kedua 22
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 Endang, Lanywati.(2002). Diabetes Mellitus Penyakit Kencing Manis. Yogyakarta: Kanisius. Hipertensi pada diabetes~ Klik medicine.htm, diakses tanggal 05 november 2014 http://sunniy.wordpress.com/2013/10/27/setiappenyakit-ada-obatnya-dan-setiapmasalah-ada-caramengatasinya/comment-page-1/ Gambar 4.1. Pohon klasifikasi data penyakit Kencing Manis Keterangan:
Y Keadaan diabetes seseorang yang diamati
0 Tidak terserang penyakit Kencing Manis
1 terserang penyakit diabetes X 11 kadar gula darah pasien
0 untuk gula darah < 120 mg dan
1 untuk gula darah > 120 mg.
X 12 merupakan keadaan hipertensi seseorang
0 tidak terserang penyakit hipertensi
1 terserang penyakit hipertensi. X 2 merupakan umur pasien
4. KESIMPULAN Dari hasil penelitian ini dapat disimpulkan bahwa faktor-faktor yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon adalah factor kadar gula darah, keadaan hipertensi, dan umur. Faktor kadar gula merupakan faktor yang memberikan pengaruh yang besar disbanding faktor yang lainnya.
Kadir,Abdul. (2005). Algoritma Pemrograman. Yogyakarta:Penerbit Andi. Maizurrahm. Penyakit Kencing Manis. [online]. Tersedia http://us.geocities.com/maizurrahm. [16 Mei 2014]. Merokok Menyebabkan dan Memperparah Diabetes Melitus ~ ARZHI 94 BLOG KESEHATAN.htm, diakses tanggal 05 november 2014 National Cardiovascular Center Harapan Kita Kolesterol dan Diabetes (Kencing Manis).htm, diakses tanggal 05 november 2014 Pengertian regresi dan korelasi. widyago.wordpress.com/2011/04/03/pen gertian _regresi_dan_ korelasi/, diakses (29 Mei 2014). Shihab, Qurays. (2002). Tafsir Al Misbah. Jakarta: Lentera Hati.
5. DAFTAR PUSTAKA
Scalable linear regression tree algorithm. (2002). [online]. Tersedia http://www.cs.unc.edu/courses/comp290 -90-f03/secret_pres.pdf. [16 Mei 2014]. Suarga.(2006). Algoritma Pemrograman. Yogyakarta: Penerbit Andi.
Analisis regresi. http://id.m.wikipedia. org/wiki/Analisis_regresi, diakses (29 Mei 2014).
Tiro, M Arif. (2002). Analisis Korelasi Regresi Edisi 2. Makassar: Badan Penerbit Universitas Negeri Makassar.
Breiman L, Friedman, JH, Olshen, dll. (1984). Classification and regression trees. Newyork. Cox, David. (1984). Analysis of survival Data. Newyork: Chapman and hall.
Tim Redaksi Vitahealth.2004. Total kesehatan anda. (2010). Diabetes I. [online]. Tersedia http://www.totalkesehatananda.com/diab etesI.html. [19 Mei 2014]. Wei Yin Loh. (2002). Guide regression tree (version 4) user manual. [online]. Tersedia
David W, Nathan. (2002). Menaklukkan Diabetes Mellitus. Jakarta: Gramedia.
23
Jurnal MSA Vol. 3 No. 2 Ed. Juni-Desember 2015 http://www.stat.wisc.edu/~loh/treeprogs/ guide/guideman.pdf. [16 Mei 2014]. Wei Yin Loh. (2002). Regression Trees with unbiased variable selection and interaction detection. [online]. Tersedia http://www.stat.wisc.edu/~loh/treeprogs/ guide/guide02.pdf. [16 Mei 2014].
24