BAB I PENDAHULUAN
1.1
Latar Belakang Klasifikasi merupakan suatu metode statistika untuk mengelompokkan
sekumpulan objek yang disusun secara sistematis ke dalam suatu kelompokkelompok baru yang lebih kecil dan sesuai dengan kategori kelompoknya. Salah satu metode dalam teknik klasifikasi yaitu regresi logistik. Klasifikasi regresi logistik didasarkan pada pendekatan analisis regresi linear merupakan metode yang sangat populer dalam mengatasi masalah-masalah klasifikasi (Subianto, 2009). Pada regresi logistik nilai respons (𝑌) adalah
berjenis kualitatif dan
variabel-variabel prediktornya berjenis kualitatif dan kuantitatif yang dinyatakan dengan sebuah model atau persamaan regresi. Berdasarkan variabel responsnya regresi logistik dibagi menjadi dua yaitu regresi logistik biner atau dichotomous (digunakan jika dan hanya jika terdapat variabel respons yang terdiri dari dua kategori) dan regresi logistik multinomial, polychotomous atau polytomous (digunakan jika dan hanya jika terdapat variabel respons lebih dari dua kategori). Variabel respons pada regresi logistik dapat berupa variabel dengan kategori yang tidak terurut (skala nominal) atau biasa disebut dengan regresi logistik multinomial dan kategori terurut (skala ordinal) atau biasa disebut dengan regresi logistik ordinal. Ketepatan suatu klasifikasi regresi logistik ordinal dapat dihitung dengan menggunakan
alat
ukur
apparent
error 1
rate
(APER).
Nilai
APER
2
merepresentasikan proporsi sampel kesalahan klasifikasi (misclassifications) oleh fungsi klasifikasi. Prosedur klasifikasi yang baik harus menghasilkan kesalahan klasifikasi yang kecil (Johnson dan Wichern, 2007). Peningkatan suatu klasifikasi dapat dilakukan dengan pendekatan bootstrap aggregating (bagging). Metode bagging pertama kali diperkenalkan oleh Breiman (1994). Bagging bekerja dengan baik pada metode klasifikasi, yang mana metode klasifikasi memiliki ketidakstabilan kinerja. Ketidakstabilan kinerja yaitu perubahan kecil pada data set akan menghasilkan perubahan besar pada model yang diperoleh. Salah satu metode klasifikasi yang tidak stabil adalah regresi logistik ordinal. Metode bagging digunakan sebagai alat untuk membentuk klasifikasi yang lebih stabil. Penelitian sebelumnya yang berkaitan dengan peningkatan klasifikasi dengan metode bagging dilakukan oleh Insani dkk. (2010) yang mengaplikasikan metode bootstrap aggregating regresi logistik ordinal untuk memperoleh model dan peningkatan ketepatan klasifikasi regresi logistik ordinal pada kasus kanker serviks. Uji simultan dan parsial regresi logistik ordinal menghasilkan variabel yang signifikan berpengaruh terhadap tingkat stadium kanker serviks, dengan tingkat ketepatan klasifikasi yang dihasilkan sebesar 89,1%. Pendekatan bagging regresi logistik ordinal kemudian dilakukan untuk meningkatkan ketepatan klasifikasi yang telah diperoleh pada regresi logistik ordinal. Variabel respons dan variabel prediktor yang signifikan berpengaruh terhadap variabel respons dalam model regresi logistik berganda kemudian diperlakukan resampling bagging. Dari proses bagging dihasilkan peningkatan klasifikasi dari model data set, yaitu sebesar
3
89,1% menjadi 99,06% dengan kata lain, bagging dapat menurunkan kesalahan klasifikasi sebesar 9,96% dari model data set. Penelitian yang dilakukan oleh Akbar dkk. (2010) mengenai perbandingan klasifikasi status gizi balita dengan metode cluster dan WHO-NCHS berdasarkan survei kekurangan energi protein (KEP) di Kabupaten Nganjuk, untuk memperoleh model dan peningkatan klasifikasi dilakukan dengan pendekatan bagging regresi logistik ordinal. Kedua model dari metode cluster dan WHO-NCHS tersebut dibentuk dengan metode regresi logistik ordinal. Pada klasifikasi status gizi balita cluster, variabel-variabel prediktor dan variabel respons dalam model regresi logistik ordinal berganda dengan tingkat ketepatan klasifikasi sebesar 67,7% diperlakukan resampling bagging regresi logistik ordinal. Proses tersebut menghasilkan adanya peningkatan klasifikasi, yaitu 76,3% meningkat sebesar 8,6%. Sedangkan pada klasifikasi status gizi balita WHO-NCHS, diperoleh variabel prediktor dan variabel respons status gizi balita dalam model regresi logistik berganda dengan tingkat ketepatan klasifikasi sebesar 75,862% diperlakukan resampling bagging regresi logistik ordinal. Dari proses bagging dihasilkan peningkatan klasifikasi sebesar 0,738% menjadi 76,6%. Dengan demikian, dapat disimpulkan bahwa bagging dapat meningkatkan klasifikasi dari model data set. Menurut Dinas Kesehatan Provinsi Bali (2014) salah satu indikator kesehatan yang dinilai pencapaiannya dalam Millenium Development Goals (MDG’s) adalah status gizi balita. Kesehatan gizi yang baik merupakan satu unsur yang sangat penting. Kekurangan gizi pada balita akan menghambat tumbuh kembang anak dalam upaya pencapaian derajat kesehatan yang optimal untuk
4
meningkatkan mutu kehidupan bangsa dan daya saing bangsa. Status gizi balita dapat diukur berdasarkan umur, berat badan (BB), dan tinggi badan (TB). Variabel umur, BB dan TB ini disajikan dalam bentuk tiga indikator antropometri, yaitu: berat badan menurut umur (BB/U), tinggi badan menurut umur (TB/U), dan berat badan menurut tinggi badan (BB/TB).
Indikator tinggi badan menurut umur
(TB/U) digunakan untuk menggambarkan keadaan kurang gizi pendek (stunting). Prevalensi balita stunting di Provinsi Bali meningkat sebesar 1,6% yaitu dari 31% pada tahun 2007 menjadi 32,6% pada tahun 2013. Kabupaten Klungkung merupakan salah satu kabupaten di Provinsi Bali yang merupakan kabupaten paling kecil kedua dari sembilan Kabupaten dan Kodya di Bali. Namun, dari hasil Riskesdas tahun 2013, Kabupaten Klungkung memiliki prevalensi stunting sebesar 19,3% yang menjadikan Kabupaten Klungkung berada pada urutan kelima di Provinsi Bali (Kementerian Kesehatan, 2013). Suciari (2015) melakukan penelitian mengenai status gizi balita yang diukur berdasarkan indikator tinggi badan menurut umur (TB/U) untuk menggambarkan keadaan kurang gizi pendek (stunting). Penelitian ini bertujuan untuk mengetahui hubungan antara status gizi ibu saat hamil, panjang badan lahir, berat badan lahir dan umur awal pemberian MP-ASI dengan keadaan stunting anak balita umur 2459 bulan dengan analisis regresi logistik biner. Dari penelitian tersebut dihasilkan bahwa panjang badan lahir, berat badan lahir dan umur awal pemberian MP-ASI berhubungan dengan kejadian stunting pada balita umur 24-59 bulan dengan kategori respons kejadian stunting dan normal.
5
Berdasarkan uraian tersebut, maka penelitian ini dilakukan untuk mengaplikasikan metode bootstrap aggregating (bagging) regresi logistik ordinal untuk mengklasifikasi status gizi balita. Variabel respons dan prediktor menurut penelitian Suciari (2015) akan dibentuk model regresi logistik ordinal untuk mendapatkan faktor-faktor yang memengaruhi status gizi. Kemudian, dicari tingkat ketepatan klasifikasi dengan APER. Variabel respons dan variabel prediktor yang signifikan berpengaruh terhadap status gizi balita dikelompokkan dan diperlakukan resampling bagging regresi logistik ordinal untuk memperoleh tingkat ketepatan klasifikasi. Selanjutnya, ketepatan klasifikasi regresi logistik ordinal dan bagging regresi logistik ordinal dibandingkan untuk dilihat adanya peningkatan tingkat ketepatan klasifikasinya.
1.2
Rumusan Masalah Berdasarkan uraian latar belakang yang telah dikemukakan tersebut, maka
permasalahan yang akan dibahas dalam penelitian ini adalah sebagai berikut: 1. Bagaimana model regresi logistik ordinal dan model bagging regresi logistik ordinal, dan faktor-faktor apa saja yang berpengaruh signifikan terhadap status gizi balita yaitu normal, pendek, dan sangat pendek? 2. Bagaimana tingkat ketepatan klasifikasi yang dihasilkan oleh regresi logistik ordinal? 3. Bagaimana tingkat ketepatan klasifikasi yang dihasilkan oleh bagging regresi logistik ordinal?
6
1.3
Batasan Masalah Untuk memperjelas dan memfokuskan objek yang akan diteliti, batasan
penelitian dirumuskan sebagai berikut: 1. Objek penelitian ini ialah balita umur 24-59 bulan di UPT. Puskesmas Klungkung I pada tahun 2015. 2. Variabel-variabel yang digunakan pada penelitian ini ialah variabel respons (𝑌) dengan kategori status gizi berdasarkan indikator tinggi badan menurut umur (TB/U) yaitu normal, pendek, dan sangat pendek; dan variabel prediktor (𝑋) berdasarkan variabel status gizi menurut penelitian Suciari (2015). 3. Majority voting digunakan dalam penentuan prediksi kelas label (kategori) maksimum pada setiap replikasi B. 4. Replikasi bootstrap yang digunakan sebanyak 51, 61, 71, 81, 91, 101, 151, 201, 301, 401, dan 501.
1.4
Tujuan Penelitian 1. Membangun sebuah model guna melihat hubungan klasifikasi status gizi balita di Kabupaten Klungkung berdasarkan faktor-faktor yang memengaruhinya dengan menggunakan metode regresi logistik ordinal dan bagging regresi logistik ordinal. 2. Mengetahui tingkat ketepatan klasifikasi pada metode regresi logistik ordinal.
7
3. Mengetahui tingkat ketepatan klasifikasi pada metode bagging regresi logistik ordinal.
1.5
Manfaat Penelitian 1. Manfaat secara Teoretis Memahami, mengkaji, dan menerapkan metode regresi logistik ordinal dengan
pendekatan
bootstrap
aggregating
(bagging)
untuk
meminimalkan kesalahan klasifikasi status gizi balita dari model yang diperoleh. 2. Manfaat secara Praktis Penelitian ini diharapkan dapat memberikan sumbangan pengetahuan dan informasi
kepada penelitian selanjutnya terkait bootstrap
aggregating maupun regresi logistik ordinal.