IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI STATUS ANEMIA PADA IBU HAMIL MENGGUNAKAN METODE CHAID DAN RANDOM FOREST
AZYL YUNIA KOMALA SARI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi FaktorFaktor yang Mempengaruhi Status Anemia pada Ibu Hamil Menggunakan Metode CHAID dan Random Forest adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, September 2013 Azyl Yunia Komala Sari NIM G14090030
ABSTRAK AZYL YUNIA KOMALA SARI. Identifikasi Faktor-Faktor yang Mempengaruhi Status Anemia pada Ibu Hamil Menggunakan Metode CHAID dan Random Forest dibimbing oleh ANIK DJURAIDAH dan LA ODE ABDUL RAHMAN. Anemia pada ibu hamil merupakan salah satu masalah yang dihadapi oleh masyarakat. Tingginya angka anemia ibu hamil sejalan dengan kurangnya kesadaran terhadap pentingnya mengkonsumsi makanan yang bergizi terutama zat besi pada ibu hamil. Hal yang dapat dilakukan untuk menanggulangi masalah anemia pada ibu hamil adalah dengan mengklasifikasikan faktor-faktor yang berhubungan dengan status anemia pada ibu hamil. Metode CHAID (Chisquare Automatic Interaction Detection) merupakan salah satu metode yang membahas masalah klasifikasi yang diterapkan pada data yang bertipe kategorik untuk peubah responnya. Metode CHAID diterapkan pada delapan (8) peubah penjelas yang digunakan pada penelitian ini dengan pengulangan sebanyak tiga kali sehingga diperoleh perbedaan hasil pohon klasifikasinya. Perbedaan hasil klasifikasi dengan metode CHAID mengakibatkan ketidakstabilan peubah pencirinya, oleh karena itu dilanjutkan dengan metode random forest untuk melihat peubah penciri yang stabil. Metode random forest menghasilkan tiga peubah penjelas yang stabil secara berurutan adalah lingkar lengan atas (lila), frekuensi pemeriksaan kehamilan (anc), dan umur klinis ibu hamil. Peubah penciri hasil random forest diterapkan pada metode CHAID untuk melihat klasifikasinya. Metode CHAID dengan kriteria random forest menghasilkan kriteria ibu hamil yang cenderung anemia ketika ukuran lingkar lengan atas (lila) kurang dari 23.5 cm dan pemeriksaan kehamilan kurang atau sama dengan empat kali, sedangkan kriteria tidak anemia ketika ukuran lingkar lengan atas (lila) lebih besar atau sama dengan 23.5 cm dan melakukan pemeriksaan kehamilan (anc) lebih dari satu kali. Kata Kunci: anemia pada ibu hamil, CHAID, random forest
ABSTRACT AZYL YUNIA KOMALA SARI. Identification of factors that affect the maternal anemia status using CHAID method and Random Forest method. Advised by ANIK DJURAIDAH and LA ODE ABDUL RAHMAN. Maternal anemia is one of problem in society. The high rates of maternal anemia in line with lack of awareness to iron consumption. The solution for this problem is classifiying the factors associated with maternal anemia status. CHAID method (Chisquare Automatic Interaction Detection) is one of classification method which type categorical response variable. In this study, CHAID method applied to eight explanatory variable with repetition three times so that the resulting classification tree is different. Differences in classification result with the CHAID method lead to instability identifier variable therefore proceed with the
random forest method to see identifier variable that stable. Random forest produced three explanatory variables sequentially stable are upper arm circumference (lila), frequency of prenatal care (anc), and maternal age clinical. Identifier variable be produced random forest method applied to the CHAID method to see its classification. CHAID method with random forest criteria produce that maternal anemia criteria if maternal upper arm circumference (lila) less than 23.5 cm and frequency of prenatal care (anc) less than four times, where as maternal normal if maternal upper arm circumference (lila) more than 23.5 cm and frequency of prenatal care (anc) more than one. Key words: anemia, maternal, CHAID, random forest
IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI STATUS ANEMIA PADA IBU HAMIL MENGGUNAKAN METODE CHAID DAN RANDOM FOREST
AZYL YUNIA KOMALA SARI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Judul Skripsi: Identifikasi Faktor-Faktor yang Mempengaruhi Status Anemia pada Ibu Hamil Menggunakan Metode CHAID dan Random Fores t Nama : Azyl Yunia Komala Sari : 014090030 NIM
Disetujui oleh
Dr Ir Anik Djuraidah, MS
Pembimbing I
Tanggal Lulus:
Abdul Rahman SSi MSi Pembimbing II
2013
Judul Skripsi: Identifikasi Faktor-Faktor yang Mempengaruhi Status Anemia pada Ibu Hamil Menggunakan Metode CHAID dan Random Forest Nama : Azyl Yunia Komala Sari NIM : G14090030
Disetujui oleh
Dr Ir Anik Djuraidah, MS Pembimbing I
La Ode Abdul Rahman, SSi MSi Pembimbing II
Diketahui oleh
Dr Ir Hari Wijayanto, MS Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji syukur penulis ucapkan kehadirat Allah SWT yang telah melimpahkan rahmat dan hidayah-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah yang berjudul “Identifikasi Faktor-Faktor yang Mempengaruhi Status Anemia pada Ibu Hamil Menggunakan Metode CHAID dan Random Forest” ini disusun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika di Departemen Statistika, Institut Pertanian Bogor. Penulis menyampaikan ucapan terima kasih kepada : 1. Ibu Dr Ir Anik Djuraidah, MS dan Bapak La Ode Abdul Rahman, SSi MSi selaku dosen pembimbing yang telah memberikan bimbingan dan saran selama penulisan karya ilmiah ini. 2. Bapak Dr Anang Kurnia selaku dosen penguji yang telah memberikan saran dalam penulisan karya ilmiah ini. 3. Kedua orang tua tercinta dan kedua kakak tersayang yang telah memberikan semangat, nasihat, dukungan, dan kasih sayang kepada penulis. Seluruh dosen dan staf Departemen Statistika yang telah membantu penulis 4. selama kuliah sampai terselesaikannya karya ilmiah ini. 5. Semua pihak yang telah membantu penulis dalam penulisan karya ilmiah ini. Penulis menyadari bahwa penulisan karya ilmiah ini masih banyak kekurangan, oleh karena itu penulis mengharapkan kritik dan saran agar dapat lebih baik lagi dalam berkarya di masa depan. Penulis sangat berharap karya ilmiah ini dapat memberikan manfaat kepada pembaca.
Bogor, September 2013 Azyl Yunia Komala Sari
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
METODOLOGI
2
Sumber Data
2
Metode
3
HASIL DAN PEMBAHASAN
7
Eksplorasi Data
7
Klasifikasi Peubah dengan Analisis CHAID
9
Penentuan Peubah Penjelas yang Stabil dengan Random Forest
10
SIMPULAN
13
DAFTAR PUSTAKA
14
RIWAYAT HIDUP
19
DAFTAR TABEL 1 Hasil pohon klasifikasi CHAID pada tiga ulangan 2 Nilai peluang salah klasifikasi
10 11
DAFTAR GAMBAR 1 Proporsi status anemia ibu hamil di enam Puskesmas Kota Bogor 2 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah usia 3 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah umur klinis 4 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah anc 5 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah lila 6 Nilai MDG masing-masing peubah penjelas 7 Pohon klasifikasi CHAID dengan peubah penjelas hasil random forest
7 8 8 8 9 11 12
DAFTAR LAMPIRAN 1 2 3 4
Deskripsi Karakteristik Ibu Hamil Diagram hubungan setiap peubah penjelas terhadap status anemia Pohon klsifikasi CHAID dengan tiga kali ulangan Ketepatan klasifikasi hasil metode CHAID dengan peubah penjelas hasil metode random forest
15 16 17 18
1
PENDAHULUAN Latar Belakang Masalah gizi pada hakikatnya adalah masalah kesehatan masyarakat, namun penanggulangannya tidak dapat dilakukan dengan pendekatan medis dan pelayanan kesehatan saja, tetapi harus melibatkan berbagai sektor terkait. Masalah gizi di Indonesia dan negara berkembang pada umumya masih didominasi oleh masalah kurang energi protein, anemia besi, kekurangan yodium, kurang vitamin A, dan obesitas terutama di kota-kota besar (Supariasa 2012). Kematian ibu hamil di Indonesia 15% hingga 20% secara langsung atau tidak langsung berhubungan dengan anemia. Anemia merupakan masalah gizi mikro terbesar dan tersulit di seluruh agenda (Darlina dan Hardinsyah 2003). Sebagian besar anemia pada ibu hamil adalah anemia karena kekurangan zat besi. Setiap tahunnya sekitar 4 juta ibu hamil dan menyusui menderita gangguan anemia yang sebagian besar disebabkan oleh kekurangan zat besi (Bappenas 2007). Anemia pada ibu hamil akan menghambat dan mengganggu kesehatan ibu beserta janin yang tengah dikandung. Masalah yang timbul karena anemia adalah pendarahan sebelum dan pada saat melahirkan, kelahiran bayi prematur, keguguran, dan berat bayi lahir rendah. Selain itu, seorang ibu yang sedang menderita anemia juga rentan terkena penyakit jantung. Dengan demikian angka kematian ibu hamil akibat anemia semakin tinggi. Anemia secara umum merupakan kondisi kurangnya sel darah merah dalam tubuh seseorang. Anemia dapat terjadi karena kurangnya hemoglobin (Hb) yang berarti juga minimnya oksigen ke seluruh tubuh (Arisman 2004). Anemia dalam kehamilan adalah kondisi ibu dengan kadar hemoglobin (Hb) di bawah 11 g/dl pada trimester I, trimester II, dan trimester III (Soebroto 2009). Faktor-faktor yang mempengaruhi anemia pada ibu hamil adalah status kurang energi kronis (kek), konsumsi zat gizi, konsumsi teh dan tablet penambah darah, infeksi dan penyakit, serta karakteristik ibu hamil. Prevalensi anemia pada ibu hamil tahun 2005 di Kota Bogor berdasarkan penelitian Herlina dan Djamilus (2006) adalah sebesar 42%. Hal ini sejalan dengan kurangnya kesadaran ibu hamil untuk mengkonsumsi makanan yang bergizi terutama zat besi pada masa kehamilan. Tingginya angka kematian ibu hamil akibat anemia dan dampak buruk yang ditimbulkan oleh anemia maka diperlukan penelitian untuk mengklasifikasikan faktor-faktor yang berpengaruh terhadap status anemia pada ibu hamil. Salah satu metode yang dapat digunakan adalah pohon klasifikasi menggunakan metode CHAID (Chisquare Automatic Interaction Detection). Hasil klasifikasi CHAID akan memberikan informasi mengenai kecenderungan kejadian anemia pada ibu hamil sehingga pencegahan terhadap anemia pada ibu hamil dapat dilakukan tanpa harus memeriksakan kadar hemoglobin (Hb) pada lembaga kesehatan. Hal ini juga akan mengurangi biaya ibu hamil untuk memeriksakan kadar hemoglobin (Hb) pada tenaga medis. Penggunaan metode CHAID dalam klasifikasi terkadang mengakibatkan ketidakstabilan dari pembentukan pohon klasifikasi, sehingga diperlukan metode yang lebih baik untuk menyelesaikan masalah tersebut. Salah satu solusi yang bisa dilakukan adalah dengan menggunakan metode pohon gabungan (ensamble tree)
2 (Sartono dan Syafitri 2010). Metode pohon gabungan yang digunakan dalam penelitian ini adalah random forest. Metode random forest menggunakan tahapan bootstrap untuk pengambilan contoh pada setiap pembentukan pohon klasifikasinya. Tujuannya adalah untuk mendapatkan peubah penjelas yang stabil dari semua pohon klasifikasi yang terbentuk. Tujuan Penelitian Tujuan dari penelitian ini adalah : Menentukan peubah penjelas yang berhubungan dengan status anemia pada ibu hamil di wilayah kerja Puskesmas Kota Bogor. 2. Menentukan peubah penjelas yang stabil dengan metode random forest.
1.
METODOLOGI Sumber Data Data yang digunakan pada penelitian ini adalah data ibu hamil tahun 2012 di enam (6) Puskesmas wilayah Kota Bogor. Puskesmas yang diteliti adalah Puskesmas Mekarwangi, Puskesmas Cipaku, Puskesmas Tegal Gundil, Puskesmas Pulo Armin, Puskesmas Sindang Barang, dan Puskesmas Sempur. Data ini terdiri dari 494 ibu hamil dengan kelengkapan administrasi. Peubah yang digunakan pada penelitian ini terdiri dari satu peubah respon dan delapan (8) peubah penjelas ( Soebroto 2009), sebagai berikut: 1. Peubah respon Peubah respon yang digunakan dalam penelitian adalah kadar hemoglobin (Hb) ibu hamil. Kadar hemoglobin dibedakan menjadi dua kategori, yaitu: a. Anemia : Kadar hemoglobin <11 gr/dl b. Tidak anemia : Kadar hemoglobin >= 11 gr/dl 2. Peubah penjelas Berikut ini adalah peubah penjelas yang digunakan beserta kategorinya masing-masing yang diperoleh dari Depkes (2003), yaitu: a. Usia ibu hamil Usia ibu hamil dikategorikan menjadi tiga kategori, yaitu: i. Usia < 20 tahun ii. Usia antara 20 – 35 tahun iii. Usia > 35 tahun b. Umur klinis Umur klinis ibu hamil dibedakan menjadi tiga kategori yaitu: i. Trimester I (0-12 minggu) ii. Trimester II (13-28 minggu) iii. Trimester III ( > 28 minggu) c. Frekuensi pemeriksaan kehamilan (anc) Frekuensi pemeriksaan kehamilan dibedakan menjadi tiga kategori, yaitu: i. 1 kali ii. 2-4 kalli iii. > 4 kali
3 d. Tingkat pendidikan Tingkat pendidikan ibu hamil dilihat dari pendidikan terakhir yang ditempuh yang dibedakan menjadi empat kategori, yaitu: i. SD ii. SMP/ sederajat iii. SMA/ sederajat iv. Perguruan tinggi e. Status pekerjaan Status pekerjaan dilihat dari kegiatan yang menghasilkan uang sehingga dibedakan menjadi dua kategori yaitu: i. Tidak bekerja ii. Bekerja f. Ukuran lingkar lengan atas (lila) Menurut Indiyah (2000) lingkar lengan atas ibu hamil adalah ukuran untuk melihat status kurang energi kronis (kek) pada ibu hamil. Peubah lingkar lengan atas ini dibedakan menjadi dua kategori, yaitu: i. < 23.5 cm ii. >= 23.5 cm g. Frekuensi kehamilan (gravida) Kategori frekuensi kehamilan dilihat dari sebaran data ibu hamil di enam Puskesmas wilayah Kota Bogor, yaitu: i. 1-2 kali ii. > 2 kali h. Tekanan darah Tekanan darah dibedakan menjadi tiga kategori yaitu: i. Normotensi : < 120 mmHg ii. Perbatasan : 120-139 mmHg iii. Hipertensi : 140-149 mmHg
Metode Tahapan analisis yang dilakukan dalam penelitian ini adalah sebagai berikut: 1. Melakukan analisis statistika deskriptif untuk mengetahui karakteristik ibu hamil di Kota Bogor. 2. Melakukan analisis CHAID untuk mengetahui klasifikasi peubah penjelas yang berhubungan dengan status anemia pada ibu hamil. Analisis CHAID dilakukan dengan tiga kali ulangan dengan mengambil contoh sebanyak n setiap pengulangan dengan rumus sebagai berikut : -
n (
-
)
= 357 -
dengan N = jumlah total keseluruhan data, nilai N = 494 ; w = nilai proporsi ibu hamil yang anemia, nilai w = 0.281 ; = batasan tingkat kesalahan, nilai B = 0.025.
4 3.
Hasil pohon klasifikasi CHAID masing-masing ulangan dibandingkan dan dilihat perbedaannya. Menurut Kass (1980) ada 3 tahapan dalam metode CHAID yaitu: a. Penggabungan Melakukan pemeriksaan nilai khi-kuadrat setiap peubah penjelas terhadap peubah respon. i. Bentuk tabel kontingensi dua arah untuk masing–masing peubah penjelas dan peubah respon. ii. Hitung statistik khi-kuadrat untuk setiap pasangan kategori yang didapat dan dipilih untuk digabungkan menjadi satu. Pengujian kebebasannya dalam sebuah sub tabel kontingensi 2 × J yang dibentuk oleh sepasang kategori dengan peubah respon yang mempuyai J kategori. iii. Nilai khi-kuadrat setiap pasangan yang terbentuk dengan rumus sebagai berikut: c r nij ij ∑∑ i
ni n j
b.
j
ij
dengan ij n ; i ,…,r ; j ,…,c, dan nij = banyaknya pengamatan pada baris ke-i dan kolom ke-j ij = nilai harapan pengamatan pada baris ke-i dan kolom ke-j ni = total banyaknya pengamatan pada baris ke-i n j = total banyaknya pengamatan pada kolom ke-j n = total banyaknya data pengamatan Keputusan yang diambil pada uji khi-kuadrat ini adalah tolak H0 ketika nilai dari hitung > ; r- civ. Setiap nilai khi-kuadrat berpasangan, hitung nilai p-nya. Apabila ada pasangan yang tidak berhubungan secara nyata maka gabungkan sebuah pasangan kategori yang paling mirip yaitu pasangan yang mempunyai nilai khi-kuadrat berpasangan terkecil dan nilai p terbesar menjadi sebuah kategori tunggal. v. Periksa kembali nilai khi-kuadrat kategori baru setelah digabung dengan kategori lainnya dalam peubah penjelas. Jika masih ada pasangan yang belum berhubungan secara nyata maka ulangi lagi langkah sebelumnya sampai semua peubah penjelasnya berhubungan nyata. Pemisahan Memilih peubah yang digunakan sebagai pemisah simpul terbaik dengan membandingkan nilai p pada tahap penggabungan untuk setiap peubah penjelas. i. Pilih peubah penjelas yang mempunyai nilai p yang paling kecil yang akan digunakan sebagai pemisah simpul. ii. Jika nilai p kurang atau sama dengan tingkat spesifikasi alpha maka pemisah simpul menggunakan peubah ini. Jika tidak ada peubah penjelas dengan nilai p seperti syarat diatas, maka tidak dilakukan pemisahan.
5 Koreksi Bonferroni adalah suatu proses koreksi yang digunakan ketika beberapa uji statistik untuk kebebasan atau ketidakbebasan dilakukan secara bersamaan (Sharp et al. 2000 dalam Kunto dan Hasana 2002). Pengali Bonferroni untuk masing-masing peubah penjelas berbedabeda sesuai dengan tipe peubahnya, antara lain : i. Peubah Monotonik c ( ) r ii. Peubah Bebas r
∑ i
iii.
4.
i
r c i (r i)
Peubah Mengambang c c ( ) r( ) r r dengan : M = pengali Bonferroni c = kategori peubah respon r = kategori peubah penjelas c. Ulangi langkah penggabungan sub kelompok berikutnya. Penghentian. d. Tahap penghentian dilakukan dengan peraturan pemberhentian berikut ini: i. Tidak ada lagi peubah penjelas yang berhubungan dengan peubah respon. ii. Jika pohon sekarang mencapai batas nilai maksimum pohon dari spesifikasi. iii. Nilai pengamatan pada simpul anak mencapai nilai minimum. Melakukan analisis random forest untuk memperoleh peubah penjelas yang paling stabil. Metode random forest pada awalnya dikenalkan oleh Breimen (2001) dengan jurnalnya yang berjudul Machine Learning yang berupaya untuk memperbaiki metode bagging. Perbedaan metode random forest dan bagging terletak pada penambahan tahapan random sub setting sebelum pembentukan pohon (Sartono dan Syafitri 2010). Menurut Breiman dan Cutler (2003) pembentukan pohon pada metode random forest ini tidak menggunakan keseluruhan dari set data total, tetapi kira-kira menggunakan 2/3 dari set data contoh yang disebut dengan gugus data pemodelan dan 1/3 lainnya digunakan untuk menghitung nilai peluang salah klasifikasi dari pembentukan pohon dan perkiraan peubah yang penting. Langkah-langkah metode random forest adalah sebagai berikut : a. Tahapan bootstrap: tarik contoh acak sebesar 2/3 dari gugus data dengan pemulihan b. Pada pembentukan pohon dipilih peubah penjelas sebanyak m secara acak dengan m < banyaknya peubah penjelas (q) pada setiap proses pemisahan dan lakukan pemisahan terbaik. Pada dasarnya algoritma pembentukan pohon tunggal dengan metode random forest didasarkan pada metode CART (classification and regression tree), hanya saja tidak ada tahapan pemangkasan (pruning). CART merupakan
6 metodologi statistik nonparametrik yang dikembangkan untuk analisis klasifikasi (Breimen et al. 1993). CART akan menghasilkan pohon regresi apabila peubah responnya numerik dan menghasilkan pohon klasifikasi apabila peubah responnya kategorik. Pohon klasifikasi yang terbentuk secara berulang akan menghasilkan pohon keputusan biner. Algoritmanya adalah sebagai berikut : i. Pemilihan pemilah Pada tahap ini dicari pemilah yang mempunyai simpul yang paling heterogen. Salah satu teknik yang digunakan adalah menggunakan impuritas dengan indeks gini. Nilai impuritas menggunakan indeks gini pada simpul t, i(t) dapat ditulis sebagai berikut: i( )
- ∑j
j | ) ……
dengan j adalah peluang unit pengamatan dalam kelas ke-j dari simpul t, dan j=0, 1
(j| )
j j
j
∑j j j
j
……
dengan j adalah peluang awal kelas ke-j, j adalah banyaknya unit pengamatan dalam kelas ke-j, dan j adalah banyaknya unit pengamatan yang termasuk dalam kelas ke-j pada simpul t. Nilai kebaikan sekatan (goodness of split) adalah salah satu evaluasi pemilahan oleh pemilah s pada simpul t dengan rumus sebagai berikut: ( ,)
i( , ) i( )-
i( )-
i( ) …… 3
adalah besar proporsi amatan saat amatan dan dengan adalah besar proporsi amatan saat amatan . Pemilihan simpul pemilah yang terbaik adalah dengan mencari nilai maksimum dari pemilah simpul t yang terbentuk, yaitu : i( , ) ma ii.
c.
i , ……
Penentuan simpul terminal Simpul t dapat dijadikan simpul terminal apabila tidak terdapat penurunan keheterogenan yang berarti pada pemilahan, adanya batasan minimum n, dan adanya batasan jumlah level atau tingkat kedalaman pohon maksimal. iii. Penandaan label kelas. Label kelas dari simpul terminal ditentukan berdasarkan aturan jumlah terbanyak. Ulangi langkah a dan b sebanyak k kali. Nilai k merupakan banyaknya pohon tunggal yang dibentuk.
7 d. e.
Catat nilai peluang salah klasifikasi pada nilai m dan k yang dicobakan. Catat nilai mean decrease gini (MDG) pada nilai m dan nilai k yang dicobakan. Mean decrease gini (MDG) merupakan salah satu ukuran yang digunakan untuk melihat tingkat kepentingan dari peubah penjelas pada metode random forest. Cara perhitungannya adalah sebagai berikut (Sandri dan Zuccolotto 2006): h
5.
k
∑ d(h, ) (h, ) ……
dengan k adalah banyaknya pohon yang terbentuk, d(h, ) adalah besar penurunan indeks gini untuk peubah penjelas h pada simpul t yang diperoleh dari persamaan (3) dan (h, ) =1 ketika h memilah simpul t dan 0 selainnya. f. Urutkan nilai MDG yang diperoleh dan tentukan peubah penjelas yang paling stabil. Interpretasi hasil dari metode CHAID dan random forest
HASIL DAN PEMBAHASAN Eksplorasi Data Banyaknya ibu hamil yang melakukan pemeriksaan kehamilan di enam Puskesmas Kota Bogor yang diteliti adalah 494 ibu hamil. Jumlah ini merupakan data ibu hamil yang mempunyai kelengkapan administrasi. Berdasarkan data yang diperoleh diketahui bahwa ibu hamil yang menderita anemia adalah sebesar 139 orang (28.14%), sedangkan ibu hamil yang tidak menderita anemia adalah 355 orang (71.86%) seperti terlihat pada Gambar 1. Karakteristik ibu hamil di enam Puskesmas Kota Bogor untuk setiap peubah penjelas yang digunakan dapat dilihat pada Lampiran 1. Anemia 28%
Tidak anemia 72%
Gambar 1 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor Gambar 2 menunjukkan hubungan antara status anemia ibu hamil dengan peubah penjelas usia ibu hamil. Mayoritas ibu hamil di enam Puskesmas Kota Bogor yang berusia lebih dari 35 tahun menderita anemia. Hal ini terjadi karena usia lebih dari 35 tahun merupakan kehamilan resiko tinggi.
8
> 35 tahun 20-35 tahun < 20 tahun 0%
20%
40%
60%
80% 100%
Gambar 2 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah usia ( anemia tidak anemia) Anemia lebih banyak terjadi pada saat umur kehamilan trimester III seperti terlihat pada Gambar 3. Ibu hamil akan membutuhkan zat besi yang lebih banyak ketika berada pada kehamilan trimester III. Hal ini terjadi karena kehamilan trimester III merupakan tahap akhir dari fase kehamilan. trimester III trimester II trimester I 0%
20%
40%
60%
80% 100%
Gambar 3 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor anemia tidak anemia) untuk peubah umur klinis ( Jika dilihat dari frekuensi pemeriksaan kehamilan (anc) pada Gambar 4, anemia lebih dominan terjadi pada ibu hamil dengan frekuensi pemeriksaan 1 kali. Kondisi ini diduga karena kurangnya kesadaran ibu hamil di enam Puskesmas Kota Bogor untuk mengetahui dan lebih peduli terhadap kesehatan ibu dan janin yang tengah dikandung. Menurut Hardinsyah et al. (2008) kesehatan yang baik terutama dalam masa kehamilan harus ditunjang dengan pemeriksaan ibu selama kehamilan. > 4 kali 2-4 kali 1 kali 0%
20%
40%
60%
80%
100%
Gambar 4 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah anc ( anemia tidak anemia) Peubah lingkar lengan atas (lila) adalah salah satu cara pengukuran untuk mengetahui status kurang energi kronis (kek) pada ibu hamil. Ukuran lingkar lengan atas (lila) ibu hamil kurang dari 23.5 cm cenderung menderita kurang energi kronis (kek). Berdasarkan ukuran lingkar lengan atas (lila) ibu hamil di enam Puskesmas Kota Bogor pada Gambar 5, anemia lebih sering terjadi pada ibu hamil dengan ukuran lingkar lengan atas (lila) kurang dari 23.5 cm, sedangkan ibu hamil dengan ukuran lingkar lengan atas (lila) lebih atau sama dengan 23.5 cm
9 mayoritas tidak anemia. Persentase status anemia ibu hamil untuk peubah lainnya dapat dilihat pada Lampiran 2. >= 23.5 < 23.5 0%
20%
40%
60%
80%
100%
Gambar 5 Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor untuk peubah lila ( anemia tidak anemia) Klasifikasi Peubah dengan Analisis CHAID Pembentukan pohon klasifikasi menggunakan metode CHAID dilakukan dengan pengulangan sebanyak tiga kali untuk melihat kestabilan peubah penciri dari pohon klasifikasi CHAID. Pengambilan contoh dilakukan secara acak menggunakan penarikan contoh acak sederhana dengan n = 357 setiap ulangan. Nilai peluang salah jenis I ( ) penggabungan dan penyekatan ditentukan sebesar 0.05. Metode pemberhentian pohon yang digunakan yaitu saat masing-masing peubah tidak berhubungan. Minimum amatan pada simpul induk sebanyak 100 amatan dan minimum simpul anak sebanyak 10 amatan. Kedalaman pohon yang digunakan tidak dibatasi. Metode CHAID dilakukan pada delapan peubah penjelas yang terdiri dari usia, tingkat pendidikan, status pekerjaan, umur klinis, frekuensi kehamilan (gravida), frekuensi pemeriksaan kehamilan (anc), ukuran lingkar lengan atas (lila), dan tekanan darah. Pembentukan pohon dilakukan sebanyak tiga kali karena sudah terlihat perbedaan hasil dendogram yang terbentuk. Evaluasi perbedaan pohon klasifikasi yang terbentuk dapat dilihat berdasarkan peubah penciri yang terbentuk, jumlah simpul, kedalaman pohon, dan nilai peluang salah klasifikasi yang dihasilkan. Perbedaan masing-masing pohon klasifikasi yang terbentuk dapat dilihat pada Tabel 1. Peubah penciri yang terbentuk pada setiap ulangan berbeda-beda. Peubah lila mempunyai hubungan dengan status anemia pada ibu hamil di enam Puskesmas Kota Bogor untuk setiap ulangan. Peubah umur klinis pada ulangan kedua dan ketiga mempunyai hubungan dengan status anemia pada ibu hamil, sedangkan pada pohon klasifikasi ulangan pertama peubah umur klinis tidak mempunyai hubungan dengan status anemia pada ibu hamil. Peubah tekanan darah mempunyai hubungan dengan status anemia pada ibu hamil hanya pada pohon klasifikasi ulangan pertama. Peubah usia ibu hamil pada pohon klasifikasi ulangan kedua mempunyai hubungan dengan status anemia pada ibu hamil, sedangkan pada pohon klasifikasi ulangan pertama dan ketiga peubah tersebut tidak mempunyai hubungan dengan status anemia pada ibu hamil. Secara keseluruhan peubah lingkar lengan atas (lila) mempunyai hubungan dengan status anemia pada ibu hamil untuk setiap ulangan. Perbedaan peubah penciri yang terbentuk menunjukkan ketidakstabilan setiap pohon klasifikasi yang terbentuk. Banyaknya simpul yang terbentuk pada masing-masing pohon klasifikasi CHAID berbeda-beda. Banyaknya simpul pada pohon klasifikasi ulangan pertama
10 dan kedua yaitu tujuh simpul dan lima simpul akhir. Pohon klasifikasi ulangan ketiga memiliki jumlah simpul yang berbeda dengan pohon klasifikasi ulangan satu dan dua yaitu sebanyak lima simpul dan tiga simpul akhir. Perbedaan jumlah simpul pada setiap pembentukan pohon klasifikasi CHAID ini juga menunjukkan ketidakstabilan pembentukan pohon klasifikasi. Kedalaman pohon yang terbentuk pada setiap ulangan pembentukan pohon klasifikasi CHAID juga berbeda-beda. Kedalaman pohon klasifikasi ulangan pertama dan kedua adalah tiga, sedangkan kedalaman pohon klasifikasi ulangan ketiga adalah dua. Nilai peluang salah klasifikasi yang dihasilkan pada setiap ulangan pembentukan pohon klasifikasi berbeda-beda, secara berurutan nilainya adalah sebesar 0.170, 0.163, dan 0.173. Pohon klasifikasi untuk setiap ulangan dapat dilihat pada Lampiran 3. Tabel 1 Hasil pohon klasifikasi CHAID pada tiga ulangan Pembeda Peubah penjelas yang terbentuk Jumlah simpul yang terbentuk Jumlah simpul akhir Kedalaman pohon Peluang salah klasifikasi
Hasil dendogram pada ulangan ke1 2 3 Lila, anc, dan Lila, umur klinis, Lila dan umur tekanan darah dan usia klinis
7
7
5
4
4
3
3
3
2
0.170
0.163
0.173
Berdasarkan perbedaan yang diperoleh dari setiap ulangan pembentukan pohon klasifikasi CHAID yang dilakukan, dapat diketahui bahwa hasil metode CHAID memiliki ketidakstabilan pada setiap pembentukan pohonnya, sehingga diperlukan analisis lanjutan menggunakan random forest untuk melihat kestabilan dari pembentukan pohon klasifikasi dan peubah penjelas yang stabil. Penentuan Peubah Penjelas yang Stabil dengan Random Forest Random forest merupakan salah satu metode pohon gabungan yang relatif baru dikembangkan. Metode ini digunakan untuk melihat peubah penjelas yang paling stabil dari keseluruhan peubah penjelas yang digunakan. Pada penelitian ini dicobakan m = 3, m = 4, dan m = 6 dengan k = 50, 100, 250, dan 1000. Hal ini bertujuan untuk melihat peluang salah klasifikasi yang dihasilkan menggunakan metode random forest. Berdasarkan nilai peluang salah klasifikasi yang dihasilkan dengan beberapa kriteria seperti di atas, terlihat kestabilan pohon pada m = 3 dan m = 6. Breiman (2001) menyarankan untuk menggunakan m yang kecil sehingga dipilih kriteria m = 3 dan k = 50 seperti terlihat pada Tabel 2. Selanjutnya kriteria tersebut digunakan untuk melihat peubah penjelas yang paling stabil.
11 Tabel 2 Nilai peluang salah klasifikasi m 3
4
6
k 50 100 250 1000 50 100 250 1000 50 100 250 1000
Peluang salah klasifikasi 0.147 0.147 0.147 0.147
0.147 0.151 0.151 0.151 0.153 0.153 0.153 0.153
Salah satu ukuran yang dapat digunakan untuk melihat kestabilan peubah penjelas adalah dengan melihat nilai mean decrease gini (MDG) seperti terlihat pada Gambar 6 yang berisikan nilai MDG masing-masing peubah penjelas. Peubah penjelas yang mempunyai tingkat kepentingan peubah paling tinggi secara berurutan adalah lingkar lengan atas (lila), frekuensi pemeriksaan kehamilan (anc), dan umur klinis ibu hamil. lila anc umur kilnis pendidikan umur ibu gravida pekerjaan tekanan darah 0
0,1
0,2
0,3
Gambar 6 Nilai MDG masing-masing peubah penjelas Kekurangan dari metode random forest adalah sulit untuk menampilkan dendogram klasifikasinya. Salah satu upaya yang dapat dilakukan adalah dengan membentuk dendogram pohon klasifikasi menggunakan metode CHAID berdasarkan kriteria yang dihasilkan oleh metode random forest. Peubah penjelas yang stabil hasil analisis random forest terdiri dari lingkar lengan atas (lila), umur kehamilan, dan frekuensi pemeriksaan kehamilan (anc) akan dibentuk dendogram menggunakan analisis CHAID seperti terlihat pada Gambar 7, sehingga dapat dilihat klasifikasi pada setiap kategori peubah respon. Diagram pohon hasil analisis CHAID seperti terlihat pada pada Gambar 7 menggambarkan bahwa simpul utama berisikan informasi total ibu hamil yang melakukan konsultasi di enam Puskesmas Kota Bogor yang diteliti. Banyaknya ibu hamil adalah 494 ibu hamil, yang terdiri dari 355 ibu hamil (71.9%) dengan a u anemia “anemia” dan 39 ibu hamil 8 % dengan a u anemia “ idak anemia”
12
Gambar 7 Pohon klasifikasi CHAID dengan peubah penjelas hasil random forest Peubah pertama yang menjadi pemilah adalah lingkar lengan atas (lila) dengan dua kategori, terdiri dari ukuran lingkar lengan atas (lila) kurang dari 23.5 cm dan ukuran lingkar lengan atas (lila) lebih atau sama dengan 23.5 cm. Peubah lingkar lengan atas (lila) dapat dikatakan sebagai peubah penciri status anemia ibu hamil di enam Puskesmas Kota Bogor karena mampu untuk membedakan status anemia ibu hamil. Ukuran lingkar lengan atas (lila) kurang dari 23.5 cenderung terkena anemia, sedangkan ukuran lingkar lengan atas (lila) lebih atau sama dengan 23.5 cm cenderung tidak anemia. Peubah kedua adalah umur klinis yang terdiri dari dua kategori baru yaitu umur klinis trimester I, II digabung menjadi satu kategori dan umur klinis trimester III. Ibu hamil dengan umur klinis trimester I, trimester II, dan trimester III dan ukuran lila lebih besar atau sama dengan 23.5 cm cenderung tidak anemia.
13 Peubah penjelas terakhir adalah frekuensi pemeriksaan kehamilan (anc) dengan dua kategori baru yaitu frekuensi pemeriksaan kehamilan satu sampai empat kali dan frekuensi pemeriksaan kehamilan lebih dari empat kali. Ibu hamil yang pernah memeriksakan kehamilan dan ukuran lingkar lengan atas lebih atau sama dengan 23.5 cm cenderung tidak anemia. Ibu hamil dengan pemeriksaan kehamilan kurang dari empat kali dan ukuran lingkar lengan atas (lila) kecil dari 23.5 cm cenderung anemia, sedangkan ibu hamil dengan fekuensi pemeriksaan kehamilan (anc) lebih dari empat kali dan ukuran lingkar lengan atas (lila) kecil dari 23.5 cm belum bisa membedakan anemia atau tidak anemianya. Frekuensi pemeriksaan kehamilan (anc) merupakan upaya pelayanan kesehatan bagi ibu hamil dan janin oleh tenaga profesional yang meliputi pemeriksaan kehamilan sesuai dengan standar pelayanan. Bila kehamilan termasuk resiko tinggi maka perhatian dan jadwal kunjungan harus lebih ketat. Ketepatan klasifikasi hasil metode CHAID dengan kriteria hasil metode random forest dapat dilihat pada Lampiran 4. Berdasarkan tiga peubah yang diperoleh dari metode random forest dan metode CHAID maka diperoleh peubah penciri yang mampu membedakan status anemia ibu hamil di enam Puskesmas Kota Bogor yaitu peubah lingkar lengan atas (lila) dan frekuensi pemeriksaan kehamilan (anc). Ibu hamil dengan ukuran lingkar lengan atas (lila) kurang dari 23.5 cm dan frekuensi pemeriksaan kehamilan (anc) kurang dari empat kali lebih cenderung terkena anemia, sedangkan ibu hamil dengan ukuran lingkar lengan atas (lila) lebih atau sama dengan 23.5 cm dan pernah memeriksakan kehamilannya kepada tenaga medis cenderung tidak anemia.
SIMPULAN Peubah penjelas yang berhubungan dengan status anemia pada ibu hamil di enam Puskesmas wilayah Kota Bogor adalah ukuran lingkar lengan atas (lila), frekuensi pemeriksaan kehamilan (anc), umur klinis ibu hamil, usia, dan tekanan darah. Peubah penjelas yang stabil hasil metode random forest secara berurutan adalah lingkar lengan atas (lila), frekuensi pemeriksaan kehamilan (anc), dan umur klinis ibu hamil. Hasil dari metode CHAID dengan peubah penjelas hasil random forest menghasilkan kriteria mengenai status anemia pada ibu hamil. Kriteria pertama adalah Ibu hamil dengan ukuran lingkar lengan atas(lila) kurang dari 23.5 cm dan frekuensi pemeriksaan kehamilan (anc) kurang dari empat kali cenderung terkena anemia. Kriteria kedua adalah ibu hamil yang pernah memeriksakan kehamilan dan ukuran lingkar lengan atas (lila) lebih besar atau sama dengan 23.5 cm cenderung tidak anemia. Dengan demikian ibu hamil dengan karakteristik tersebut dapat waspada terhadap resiko anemia dan melakukan upaya pencegahan sebelum terkena anemia.
14
DAFTAR PUSTAKA Bappenas. 2007. Rencana Aksi Nasional Pangan dan Gizi 2006-2010: Jakarta (ID). Breiman L, JH Friedman, RA Olshen, CJ Stone. 1993. Classification and Regression Trees. New York (US): Champan and Hall. Breiman L. 2001. Random Forest. Machine Learning. 45: 5-32. Breiman L, Cutler A. 2003. Manual on Setting Up, Using, and Understanding Random Forest V4.0.[Internet]. [diunduh 2013 Mei 10]. Tersedia pada: http://oz.berkeley.edu/ users/breiman/Using_random_forests_v4.0.pdf. Darlina, Hardiansyah. 2003. Faktor Risiko Anemia Pada Ibu Hamil di Kota Bogor. Media Gizi dan Keluarga. 27(2): 34-41. [Depkes RI] Departemen Kesehatan RI. 2003. Pedoman Umum Gizi Seimbang. Jakarta: Depkes RI Eherler D, Lehmann T. 2001. Responder Profiling with CHAID and Dependency Analysis.[Internet]. [diunduh 2013 April 12]. Tersedia pada: www.informatik.unifreiburg.de/~ml/ecmlpkdd/WSProceedings/w10/lehman n.pdf. Gallagher, C. A. 2000. An Iterative Approach to Classification Analysis.[Internet]. [diunduh 2013 April 09]. Tersedia pada: www.casact.org/ library/ ratemaking/ 90dp237.pdf. Hastie TJ, Tibshirani RJ, Friedman JH. 2008. The Elements of Statistical Learning: Data-mining, Inference and Prediction.Second Edition. New York (US): Springer-Verlag. Herlina N, Djamilus F. 2006. Faktor-Faktor Resiko Kejadian Anemia pada Ibu Hamil di Wilayah Kerja Puskesmas Bogor. Bogor [ID]. Majalah Pengembangan dan Pemberdayaan Sumber Daya Manusia Kesehatan. 2(2):32-33 Indiyah W. 2000.Hubungan Kurang Energi Kronis dengan Anemia Gizi pada Ibu Hamil [tesis]. Semarang [ID]: Universitas Diponegoro Kunto YS, Hasana SN. 2006. Analisis CHAID Sebagai Alat Bantu Statistika untuk Segmentasi Pasar. Jurnal Manejemen : Universitas Kristen Petra. Sartono B, Syafitri UD. 2010. Ensamble Tree: an Alternative Toward Simple Classification and Regression Tree. Forum Statistika dan Komputasi. 15(1): 1-7. Soebroto Ikhsan. 2009. Cara Mudah Mengatasi Problem Anemia. Jakarta (ID): Gramedia Supariasa ID. 2012. Penilaian Status Gizi. Jakarta: Penerbit Buku Kedokteran EGC.
15 Lampiran 1 Deskripsi Karakteristik Ibu Hami > 35 tahun 11%
Usia
< 20 tahun 10%
Umur klinis trimes ter III 26%
trimes ter I 29%
20-35 tahun 79%
>2 kali 29%
trimes ter II 45%
Lila
Gravida
< 23.5 27% >= 23.5 73% 1-2 kali 71%
Perbata san 13%
Tekanan darah
Hiperte nsi 1%
Pendidikan
SMP/se derajat 29%
1 kali 43% 2-4 kali 43%
Normo tensi 86%
SMA/se derajat 21%
Anc
>4 kali 14%
Perguru an Tinggi 3%
SD 47%
Bekerja 10%
Pekerjaan
Tidak bekerja 90%
16 Lampiran 2 Diagram hubungan setiap peubah penjelas terhadap status anemia a. Persentase status anemia pada ibu hamil di enam Puskesmas Kota Bogor dengan peubah pekerjaan ( anemia tidak anemia) Bekerja Tidak bekerja 0%
b.
20%
40%
60%
80% 100%
Persentase status anemia pada ibu hamil di enam Puskesmas Kota Bogor dengan peubah tingkat pendidikan ( anemia tidak anemia) Perguruan Tinggi SMA/sederajat SMP/sederajat SD 0%
c.
50%
100%
Persentase status anemia pada ibu hamil di enam Puskesmas Kota Bogor dengan peubah tekanan darah ( anemia tidak anemia) Hipertensi Perbatasan Normotensi 0%
d.
20%
40%
60%
80%
100%
Persentase status anemia ibu hamil di enam Puskesmas Kota Bogor dengan peubah fekuensi kehamilan (gravida) ( anemia tidak anemia) > 2 kali 1-2 kali 0%
20%
40%
60%
80%
100%
17 Lampiran 3 Pohon klasifikasi CHAID pada tiga kali ulangan a.
Pohon klasifikasi ulangan I
b.
Pohon klasifikasi ulangan II
18 c.
Pohon klasifikasi ulangan III
Lampiran 4 Ketepatan klasifikasi hasil metode CHAID dengan kriteria hasil metode random forest Prediksi Tidak Anemia Anemia Tidak Anemia 337 28 Anemia 47 92 ketepatan keseluruhan Aktual
% Benar 92.3% 66.2% 85.1%
19
RIWAYAT HIDUP Azyl Yunia Komala Sari dilahirkan di Kubang, Kabupaten 50 Kota, Sumatera Barat pada tanggal 8 Juni 1991 dari pasangan Bapak Yedrial dan Ibu Zuriati. Penulis merupakan anak ketiga dari tiga bersaudara. Tahun 2003 penulis menyelesaikan pendidikan dasar di SD 46 Kubang, Kabupaten 50 Kota, Sumatera Barat, kemudian menyelesaikan pendidikan menengah pertama di SMP 1 Kecamatan Guguk, Kabupaten 50 Kota, Sumatera Barat pada tahun 2006. Pada tahun 2009 penulis menyelesaikan pendidikan menengah atas di SMA 1 Kecamatan Guguk, Kabupaten 50 Kota, Sumatera Barat. Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Penulis Mengikuti program mayor Statistika dan minor Matematika Aktuaria di Fakultas Matematika dan Ilmu Pengetahan Alam. Selama mengikuti perkuliahan, penulis aktif dalam Himpunan Keprofesian Gamma Sigma Beta (GSB) sebagai staff divisi Science pada tahun 2011, selain itu tahun 2012 penulis juga aktif di GSB pada divisi Kestari. Penulis aktif dalam kepanitian Statistika Ria 2012, Welcome Ceremony of Statistics ( WCS) 2011, Welcome Ceremony of Statistic (WCS) 2012, Pesta Sains 2011, Spirit FMIPA 2012, dan bedah buku 9 Summer 10 Autumns 2011. Pada bulan Februari sampai April 2013 penulis melaksanakan kegiatan praktik lapang di Balai Penelitian Tanaman Rempah dan Aromatik (BALITTRO).