PEMODELAN REGRESI LOGISTIK PADA KASUS BERAT BADAN LAHIR RENDAH (BBLR) DAN PENGARUH AGREGASI DATA TERHADAP HASIL PENDUGAAN
ANT. BENNY SETYAWAN
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Regresi Logistik pada Kasus Berat Badan Lahir Rendah (BBLR) dan Pengaruh Agregasi Data terhadap Hasil Pendugaan adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Oktober 2015 Ant. Benny Setyawan G 152130394
RINGKASAN ANT. BENNY SETYAWAN. Pemodelan Regresi Logistik pada Kasus Berat Badan Lahir Rendah (BBLR) dan Pengaruh Agregasi Data terhadap Hasil Pendugaan. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan INDAHWATI. Berat Badan Lahir Rendah (BBLR) didefinisikan sebagai kelahiran hidup dengan berat badan di bawah 2500 gram tanpa memperhatkan usia kehamilan. Kejadian BBLR berkaitan erat dengan kematian bayi, kesakitan bayi, pertumbuhan fisik dan mental yang terhambat serta penyakit menahun ketika dewasa. Berdasarkan hanya pada Survei Demografi dan Kesehatan Indonesia (SDKI) yang dilaksanakan setiap lima tahun sekali, sulit untuk memonitor apakah suatu kebijakan untuk menekan angka BBLR dapat dikatakan efektif. Oleh karena itu, pemodelan statistik, pada kasus ini, Regresi Logistik, diperlukan untuk menduga prevalensi BBLR. Permasalahan dalam pemodelan timbul pada dua sisi, sisi peubah respon dan peubah penjelas. Pada sisi peubah respon, data berat badan lahir memiliki dua dasar respon: data tercatat dan ingatan ibu. Sedangkan pada peubah penjelas, ketersediaan data individu tidak selalu terpenuhi, tetapi yang tersedia adalah data agregat. Permasalahan tersebut berpengaruh dalam akurasi dan presisi model yang dibangun. Pada tesis ini permasalahan pada sisi peubah respon diatasi dengan menyertakan peubah boneka dan memboboti amatan berdasarkan ragam tiap kelompok ke dalam model. Berdasarkan hasil dari model individu, tidak terdapat perbedaan nyata pada kedua kelompok akan tetapi pembobotan berdasarkan ragam meningkatkan kebaikan model. Pada sisi peubah bebas, untuk membandingkan setiap level aggregat, data diagregasikan pada level ibu, rumah tangga, cluster (blok sensus), dan kabupaten/kota. Peubah respon diagregasikan dari sebaran Bernoulli ke sebaran Binomial. Hasil pemodelan pada level individu, ibu dan rumah tangga cenderung mirip, sedangkan model blok sensus dan kabupaten/kota memiliki lebih sedikit jumlah penduga parameter yang nyata. AIC dan Luas area di bawah kurva Receiver Operating Characteristics (ROC) menurun drastis pada model level blok sensus dan kabupaten/kota, mengindikasikan penurunan kebaikan model. Agregasi data pada level yang lebih tinggi secara konsisten meningkatkan ragam pendugaan dan memperlebar pendugaan. Akan tetapi dibandingkan dengan selang pendugaan langsung pada prevalensi provinsi, selang pendugaan yang dihasilkan model cenderung lebih sempit. Kata kunci: agregasi data, BBLR, regresi logistik, regresi terboboti, ROC.
SUMMARY ANT. BENNY SETYAWAN. A Study of Low Birth Weight (LBW) Models using Logistic Regression and the Effect of Data Aggregation on Estimation Results. Supervised by KHAIRIL ANWAR NOTODIPUTRO and INDAHWATI. Low Birth-Weight (LBW) is defined as a birth weight of a live-born infant of less than 2500 grams regardless of gestational age. Case of LBW has been known to be associated with infant mortality, infant morbidity, inhibited growth and slow cognitive development, also chronic diseases in later life. Based only on Indonesia Demographic and Health Survey (IDHS), available every five year, it has been acknowledged to be hard to monitor if a policy is effective to suppress LBW case. Therefore, statistical modelling, in this case Logistic Regression, was needed to estimate LBW rates. The problems on modelling have arisen both for the response variable side and the explanatory variables side. On the response variable side the birth weight data was recorded in two ways: written record and mother’s recall. Moreover, in practice the individual level data is not always available. What we usually have is aggregated data of higher level. These problems theoretically have affected the accuracy and the precision of the model. In this thesis the problem on the response side was handled by inserting dummy variables for each group of measurements. Moreover the variance of each group was used to weight the model. Based on the result of individual level model, there was no significant difference between these groups. However, by using variances as weights in the model, it is shown that the goodness of fit of the model has improved. On the explanatory side, the effects of aggregation levels were compared. The aggregation levels were mother level, household level, cluster or census block level and district level. The response variable was aggregated accordingly, and hence the response variable has changed from Bernoulli to Binomial distribution. The result showed that the aggregation at individual, mother and household levels produced similar models, while aggregation at cluster and district levels resulted in models with fewer significant parameter estimates. The AIC and Area under Receiver Operating Characteristics (ROC) curves were drastically decreased at the cluster and district levels model, indicating that the goodness of fit has decreased. Data aggregation from lower levels to higher levels was found to consistently increase the variances, and widen the interval estimates. However, in comparison with the direct estimates of provincial rates, the interval estimates of the models have shown narrower intervals. Keywords: data aggregation, logistic regression, low birth weight, ROC, weighted regression.
© Hak Cipta Milik IPB, Tahun 2015 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB
PEMODELAN REGRESI LOGISTIK PADA KASUS BERAT BADAN LAHIR RENDAH (BBLR) DAN PENGARUH AGREGASI DATA TERHADAP HASIL PENDUGAAN
ANT. BENNY SETYAWAN
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika Terapan
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015
Penguji Luar Komisi pada Ujian Tesis:Dr. Ir. Budi Susetyo, MS
Judul Tesis : Pemodelan Regresi Logistik pada Kasus Berat Badan Lahir Rendah (BBLR) dan Pengaruh Agregasi Data terhadap Hasil Pendugaan Nama : Ant. Benny Setyawan NIM : G 152130394
Disetujui oleh Komisi Pembimbing
Prof Dr Ir Khairil Anwar Notodiputro, MS Ketua
Dr Ir Indahwati, MSi Anggota
Diketahui oleh
Ketua Program Studi Statistika Terapan
Dekan Sekolah Pascasarjana
Dr Ir Indahwati, MSi
Dr Ir Dahrul Syah, MScAgr
Tanggal Ujian: 4 November 2015
Tanggal Lulus:
PRAKATA Puji Syukur kepada Tuhan Yang Maha Kuasa atas berkat dan penyertaan-Nya yang tak kunjung henti sehingga penulis dapat menyelesaikan tesis yang berjudul “Pemodelan Regresi Logistik pada Kasus Berat Badan Lahir Rendah (BBLR) dan Pengaruh Agregasi Data terhadap Hasil Pendugaan” ini dengan baik. Penulis mengucapkan terima kasih yang sebesar-besarnya kepada Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, MS dan Ibu Dr. Ir. Indahwati, M.Si selaku pembimbing dan Bapak Dr. Ir. Budi Susetyo, MS selaku penguji atas arahan dan bimbingannya hingga tesis ini dapat terselesaikan dengan baik. Ucapan terima kasih juga penulis sampaikan kepada seluruh Dosen Departemen Statistika IPB atas seluruh ilmu yang diberikan dan seluruh karyawan Departemen Statistika atas segala bantuan, pelayanan dan kemudahan selama pendidikan yang ditempuh oleh penulis. Terima kasih pula disampaikan kepada seluruh pimpinan Badan Pusat Statistik (BPS) baik di Pusat maupun di Daerah Istimewa Yogyakarta atas pembiayaan dan kesempatan yang diberikan. Tesis ini penulis persembahkan bagi kedua mendiang orang tua Bapak Henricus Suyamto dan Ibu Maria Immaculata Marilah atas doa dan kasih sayang yang diberikan kepada penulis hingga akhir hayatnya. Bagi istri tercinta Cicilia Widyasari dan buah hatiku Tadeus Dhirajati Bratamandala semoga penyelesaian tesis ini dapat sedikit menebus kegundahan atas kebersamaan yang hilang. Terima kasih kepada kakak dan adik-adikku serta seluruh keluarga atas doa dan dukungannya selama studi yang ditempuh. Terima kasih juga kepada rekan-rekan S2 Statistika Terapan IPB BPS angkatan I atas persahabatan dan kegembiraannya serta seluruh teman-teman mahasiswa Sekolah Pascasarjana Statistika IPB. Penulis menyadari masih terdapat kekurangan baik dalam isi maupun penulisan tesis ini. Namun demikian besar harapan penulis agar tesis ini dapat menjadi karya ilmiah yang bermanfaat.
Bogor, Oktober 2015 Ant. Benny Setyawan
“The fear of the LORD is the beginning of knowledge” (Proverbs 1:7a)
Untuk Bapak dan Ibu Untuk Sari dan Dhira
DAFTAR ISI DAFTAR TABEL
vii
DAFTAR GAMBAR
vii
DAFTAR LAMPIRAN
vii
1 PENDAHULUAN Latar Belakang Perumusan Masalah Tujuan Penelitian Manfaat Penelitian
1 1 2 2 2
2 TINJAUAN PUSTAKA Berat Badan Lahir Rendah (BBLR) Survei Demografi dan Kesehatan Indonesia (SDKI) Generalized Linear Model (GLM) Regresi Terboboti (Weighted Regression) Perbandingan Model
3 3 4 5 7 7
3 METODE PENELITIAN Data Peubah Penelitian Metode Analisis Pembobotan Model Individu Agregasi Data
10 10 10 13 14 14
4 HASIL DAN PEMBAHASAN Eksplorasi Data Model Individu Pembobotan Persamaan Regresi Dugaan Odds Ratio dan Peluang Model Agregat Perbandingan Model dan Hasil Dugaan Pemilihan Model Perbandingan Hasil Pemodelan dan Publikasi BPS
15 15 16 16 17 18 20 20 21 23
5 SIMPULAN DAN SARAN Simpulan Saran
25 25 25
DAFTAR PUSTAKA
26
LAMPIRAN
29
RIWAYAT HIDUP
32
DAFTAR TABEL 2.1. Tabulasi silang dugaan dan kejadian BBLR 3.1. Peubah-peubah yang digunakan dalam penelitian 4.1. Kelompok dasar respon dan pembobotan yang diberikan 4.2. Nilai dugaan odds Ratio dan peluang BBLR 4.3. Perbandingan dugaan parameter model per level agregat 4.4. Perbandingan statistik kebaikan model 4.5. Perbandingan kepekaan dan kekhususan model pada c = 0.09439 4.6. Perbandingan dugaan prevalensi model terhadap nilai publikasi
8 11 17 19 20 21 23 24
DAFTAR GAMBAR 2.1. Ilustrasi kurva Receiver Operating Charasteristics (ROC) 3.1. Komposisi data SDKI 2012 yang menjadi cakupan penelitian 3.2. Bagan alur penelitian 4.1. Persebaran prevalensi BBLR menurut provinsi 4.2. Persebaran IPM menurut provinsi 4.3. Pola hubungan berat badan lahir bayi dengan urutan kelahiran, umur ibu saat melahirkan dan jarak dengan kelahiran sebelumnya 4.4. Perbandingan ROC pada tiap level agregasi
9 10 13 15 15 16 22
DAFTAR LAMPIRAN 1
Perbandingan dugaan prevalensi BBLR provinsi dan selang kepercayaannya pada tiap model terhadap dugaan langsung (α = 5%)
29
1 PENDAHULUAN Latar Belakang Berat Badan Lahir Rendah (BBLR) didefinisikan oleh WHO (2011) sebagai kejadian bayi lahir hidup dengan berat di bawah 2500 gram, tanpa memperhatikan usia kandungan (gestational age). Observasi epidemiologi menunjukkan bahwa bayi dengan berat lahir di bawah 2500 gram memiliki resiko 20 kali lebih besar untuk mengalami kematian (Kramer 1987). Selain itu, kejadian BBLR juga erat kaitannya dengan morbiditas bayi, pertumbuhan yang terhambat, perkembangan kognitif yang lambat, dan penyakit akut ketika dewasa (Barker 1995). Kramer (1987) mengidentifikasi faktor-faktor yang mempengaruhi kejadian BBLR yang secara umum terdiri dari beberapa kelompok: genetis, obstetris, asupan nutrisi, penyakit, paparan zat beracun, pemeliharaan kehamilan dan faktor sosial. Sebagian faktor-faktor yang mempengaruhi kejadian BBLR berasal dari pihak ibu. Oleh karena itu, menekan angka BBLR selain secara tidak langsung menekan angka kematian bayi juga merupakan cerminan dari peningkatan kesehatan ibu yang merupakan 2 dari 8 Millennium Development Goals (MDGs) (UN 2014). Karena dampaknya yang bersifat jangka panjang, penurunan prevalensi BBLR hingga 30 persen juga dicanangkan oleh WHO sebagai salah satu dari Six Global Nutrition Targets 2025 (WHO 2014). Kondisi ini menjadi krusial di Indonesia yang pada periode 2005-2040 berada pada demographic window (of opportunity) dimana proporsi penduduk usia dibawah 15 tahun berada di bawah 30%, sebagai akibat dari menurunnya angka kelahiran, dan berakibat lebih besarnya proporsi penduduk usia kerja. Pada periode ini, dengan rendahnya angka ketergantungan, potensi SDM yang maksimal secara umum akan mendorong negara berkembang menjadi negara maju (Bloom et al. 2003). Risiko jangka panjang BBLR terhadap pertumbuhan dan kesehatan individu berpengaruh pada kualitas SDM ketika dewasa. Kualitas SDM yang kurang, baik pada individu tersebut maupun ibunya, meskipun merupakan bagian dari proporsi angkatan kerja yang besar akan menjadi kurang produktif dalam memperoleh pertumbuhan ekonomi yang besar (bonus demografi/demographic dividend) (UN 2004). Angka prevalensi BBLR diperoleh dari Survei Demografi dan Kesehatan Indonesia (SDKI) yang dilakukan setiap 5 tahun oleh BPS bekerjasama dengan BKKBN dan Kemenkes. Berdasarkan SDKI 2012, angka nasional 7,3 persen dengan angka provinsi berkisar antara 4.7-15.7 persen, angka terendah di DKI Jakarta (4.7%) dan tertinggi di NTT (15.7%) (BPS et al. 2013). Sebagai perbandingan WHO (2011) mencatat pada tahun 2000, rata-rata negara maju 7 persen dan negara berkembang 16.9 persen, Asia Tenggara 11.6 persen dan Indonesia 9 persen. Meskipun angka nasional terbilang rendah untuk negara berkembang, tingginya kisaran angka provinsi menunjukkan bahwa permasalahan BBLR cukup serius pada beberapa provinsi. Dengan ketersediaan data secara lima-tahunan, sulit untuk memonitor apakah suatu kebijakan dapat dikatakan efektif. Oleh karena itu pemodelan untuk mengestimasi angka BBLR perlu dikembangkan. Permasalahan dalam SDKI 2012 adalah estimasi prevalensi BBLR berdasarkan data yang terdiri dari dua kelompok dasar respon: 3314 (18.4%) bayi berat lahirnya tercatat (record), 11810 (65.5%) bayi berat lahirnya berdasarkan ingatan (memory).
2 Kedua kelompok ini tentu secara logika memiliki akurasi dan presisi yang berbeda. Oleh karena itu pemodelan yang dilakukan secara statistik harus mengakomodasi perbedaan akurasi (rataan) dan presisi (ragam) tersebut ke dalam model. Permasalahan berikutnya adalah model dari data SDKI tersebut dibangun dari data pada level individu, sedangkan secara umum pada tahun-tahun yang tidak dilaksanakan SDKI data individu tersebut juga tidak tersedia. Data yang tersedia umumnya adalah data pada tataran agregat yang lebih tinggi, sehingga model tersebut tidak dapat diaplikasikan. Untuk itu pemodelan dengan tataran agregat antara peubah respon dan peubah bebas yang sama perlu juga dilakukan. Berdasarkan permasalahan tersebut perlu dikaji bagaimana pemodelan untuk prevalensi BBLR dapat dilakukan dalam keadaan terdapat dugaan perbedaan akurasi (rataan) dan presisi (ragam) dalam cara pengukuran, serta berdasarkan data yang ada sampai sejauh mana agregasi dapat dilakukan dengan tetap menghasilkan model dan nilai dugaan yang baik. Perumusan Masalah Berdasarkan latar belakang tersebut maka permasalahan yang dikaji dalam penelitian ini adalah: 1. Faktor-faktor apa saja yang mempengaruhi kejadian BBLR baik pada level individu maupun pada level agregat? 2. Apakah terdapat pengaruh perbedaan dasar respon (ingatan dan catatan) pada akurasi dan presisi dugaan BBLR? 3. Sampai sejauh mana agregasi data masih menghasilkan pemodelan kejadian BBLR yang baik? 4. Bagaimana perbandingan dugaan prevalensi BBLR dari model yang dihasilkan jika dibandingkan dengan nilai prevalensi BBLR yang dipublikasikan? Tujuan Penelitian 1.
2. 3.
Tujuan yang hendak dicapai dalam penelitian ini adalah sebagai berikut: Mengembangkan model yang dapat menerangkan kejadian BBLR dengan faktorfaktor yang mempengaruhi dengan mempertimbangkan perbedaan pengaruh dan ragam data berdasarkan dasar respon (ingatan dan catatan). Mengkaji dampak level agregasi dari data kejadian BBLR dan faktor-faktor yang mempengaruhinya terhadap pemodelan BBLR. Mengevaluasi seberapa besar perbedaan hasil dugaan tidak langsung BBLR (yaitu menggunakan model) pada beberapa level agregat dengan nilai yang dipublikasikan. Manfaat Penelitian
Dari hasil penelitian ini manfaat yang diharapkan adalah diperoleh model yang baik yang dapat digunakan untuk melakukan pendugaan terhadap prevalensi BBLR pada periode dimana tidak dilaksanakan SDKI sesuai data agregat yang tersedia.
3
2 TINJAUAN PUSTAKA Berat Badan Lahir Rendah (BBLR) Kasus Berat Badan Lahir Rendah (BBLR) ditentukan oleh hasil pengukuran berat badan bayi lahir hidup di bawah 2500 gram. Pengukuran ini dilakukan tanpa memperhatikan usia kandungan (gestational age) dan dilakukan pada jam-jam pertama setelah kelahiran (WHO 2011). Hal ini karena pada hari-hari pertama setelah kelahiran, bayi akan mengalami penurunan berat badan yang signifikan. Penentuan batas 2500 gram didasarkan pada kisaran persentil ke-10 dan persentil ke-90 pada usia kandungan 40 minggu yaitu antara 2500 – 4000 gram sebagai berat wajar untuk usia kandungan 40 minggu (appropriate for gestational age). Berat badan lahir dibawah 2500 gram disebut sebagai kategori kecil untuk usia kandungan tersebut (small for gestational age) dan disebut sebagai kasus Berat Badan Lahir Rendah (BBLR), sedangkan diatas 4000 gram disebut sebagai kategori besar untuk usia kandungan tersebut (large for gestational age) (Hutcheon et al. 2010). Kramer (1987) menyatakan bahwa berdasarkan hasil observasi epidemiologi, bayi dengan berat lahir di bawah 2500 gram memiliki resiko 20 kali lebih besar untuk mengalami kematian. Selain itu, kejadian BBLR juga erat kaitannya dengan morbiditas bayi, pertumbuhan yang terhambat, perkembangan kognitif yang lambat, dan penyakit akut ketika dewasa (Barker 1995). Kejadian BBLR memiliki dua penyebab: kelahiran prematur (usia kandungan di bawah 37 minggu) dan pertumbuhan janin yang terhambat (intra uterine growth restriction) selama kehamilan, serta kombinasi dari keduanya. Faktor-faktor yang mempengaruhi kejadian BBLR secara umum bersifat tidak langsung yang meningkatkan resiko (faktor resiko) kelahiran prematur dan pertumbuhan janin yang terhambat yang lebih lanjut oleh Kramer (1987) dikelompokkan menjadi: 1. Faktor dasar dan genetis: jenis kelamin bayi, kembar, ras, tinggi ibu, berat ibu sebelum hamil, tekanan darah selama kehamilan, berat dan tinggi ayah, serta faktor genetis lain. 2. Faktor demografis dan psikososial: umur ibu saat hamil, pendidikan, pekerjaan dan kesejahteraan, status perkawinan dan faktor psikologi ibu lainnya. 3. Faktor obstetrik: paritas, jarak kehamilan, aktivitas seksual, riwayat BBLR, riwayat prematur, riwayat aborsi/keguguran/lahir mati/kematian neonatal, masalah kesuburan, dan paparan diethylstilbestrol dalam rahim. 4. Faktor nutrisi: penambahan berat selama kehamilan, asupan kalori, aktivitas fisik, asupan protein, zat besi dan anemia, vit. B9 (asam folat), B6 dan B12, asupan seng, tembaga, kalsium, fosfor dan vit. D dan nutrisi lainnya. 5. Penyakit selama kehamilan: malaria, infeksi saluran kencing dan kelamin, diare, ISPA, TBC, anoreksia dan penyakit-penyakit lainnya. 6. Paparan zat beracun: rokok (pasif maupun aktif), alkohol, kafein, marijuana, narkotika dan paparan racun lainnya. 7. Pemeriksaan kehamilan: pemeriksaan kehamilan pertama, jumlah pemeriksaan selama kehamilan dan kualitas perawatan kehamilan. Beberapa penelitian tentang BBLR di Indonesia yang telah dilakukan untuk mengkaji hubungan antara berat badan lahir bayi dengan faktor-faktor risikonya antara lain oleh Kawengian (2004) dengan Korelasi Pearson, Sianturi (2005) dan Yongky
4 (2007) dengan Regresi Berganda dan Puspitasari (2011) dengan Regresi Logistik yang dilakukan pada satu atau beberapa fasilitas kesehatan. Nilai-nilai amatan yang digunakan dalam penelitian cenderung lebih akurat karena berasal dari record (catatan) fasilitas kesehatan tersebut. Akan tetapi kesimpulan yang diambil bersifat lokal dan hanya berlaku terhadap individu-individu yang memiliki akses terhadap fasilitas kesehatan tersebut. Penelitian dengan lingkup area yang lebih luas dengan menggunakan data survei rumah tangga antara lain oleh Arpansah (2010) dengan Regresi Berganda di Sumatera dari data Riskesdas 2007 dan Setyowati et al. (1996) dengan Regresi Logistik di Indonesia dengan data SDKI 1994. Kesimpulan dari penelitian tersebut sebaliknya dapat digeneralisasikan ke populasi secara umum, namun karena berasal dari data dengan amatan yang bersumber dari dua kelompok respon (ingatan atau catatan), terdapat potensi bias dari kesimpulan yang diambil karena perbedaan akurasi dan presisi dari dua kelompok respon tersebut diabaikan. Selain itu sebagian besar penelitian tersebut memandang kejadian BBLR sebagai bagian dari nilai amatan berat badan lahir bayi (kontinu), sedangkan faktor risiko yang menyebabkan dan dampak yang diakibatkan oleh kejadian BBLR tidak bergerak secara linier terhadap berat badan lahir bayi. Dengan demikian kejadian BBLR lebih tepat dipandang sebagai kasus khusus dan dipandang sebagai peubah acak biner, sehingga pendekatan regresi logistik seperti yang dilakukan Puspitasari (2011) dan Setyowati et al. (1996) akan lebih tepat. Survei Demografi dan Kesehatan Indonesia (SDKI) Survei Demografi dan Kesehatan Indonesia (SDKI) merupakan satu-satunya sumber data BBLR pada skala nasional. SDKI dilaksanakan setiap lima tahun sekali oleh Badan Pusat Statistik (BPS) bekerjasama dengan Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) dan Kementerian Kesehatan. ICF International memberikan bantuan teknis karena SDKI adalah bagian dari program MEASURE Demographic and Health Surveys (DHS) dari United States Agency for International Development (USAID) yang dilaksanakan secara internasional di 91 negara. SDKI 2012 merupakan SDKI ketujuh yang dilaksanakan oleh BPS. SDKI 2012 memiliki rancangan berlapis (stratified) dan bertahap (multistage). Pada rancangan acak berlapis populasi yang heterogen dibagi ke dalam subpopulasi yang lebih homogen sehingga diperoleh ragam pendugaan yang lebih kecil. Sedangkan rancangan acak bertingkat digunakan untuk mengatasi kondisi: (1) kerangka contoh pada tingkat terkecil tidak tersedia secara keseluruhan dan (2) kondisi geografis yang sangat luas menyebabkan penyebaran unit contoh menjadikan rancangan tidak ekonomis (Scheaffer et al. 2006). Penarikan contoh pada setiap tahap (stage) dilakukan secara systematic untuk menjamin cakupan wilayah. Provinsi dan kategori desa urban/rural berfungsi sebagai strata (65 strata) dengan alokasi contoh proporsional dengan jumlah penduduk berdasarkan hasil SP2010 pada setiap strata. Dari setiap strata pada tahap pertama diambil sejumlah ni Blok Sensus (BS) sebagai cluster dengan total keseluruhan sampel 1.840 BS. Pada tahap kedua diambil 25 contoh rumah tangga untuk setiap BS terpilih dan seluruh anggota rumah tangganya sesuai kuesioner yang digunakan. Estimasi yang dihasilkan hanya sampai pada level provinsi (BPS et al. 2013).
5 Untuk setiap rumah tangga terpilih terdapat 4 jenis kuesioner yang digunakan: 1. Kuesioner Rumah Tangga 2. Kuesioner Wanita umur 15-49 tahun 3. Kuesioner Pria Kawin umur 15-54 tahun 4. Kuesioner Pria Belum Pernah Kawin umur 15-24 tahun Data BBLR berasal dari kuesioner wanita umur 15-49 tahun, sedangkan peubahpeubah bebas individu yang digunakan berasal dari kuesioner rumah tangga dan kuesioner wanita umur 15-49 tahun. Generalized Linear Model (GLM) Kelahiran dengan BBLR dapat dinyatakan dalam peubah acak biner Yi, dimana kejadian BBLR dinyatakan dengan nilai Yi = 1 dan kejadian kelahiran bukan BBLR dengan nilai Yi = 0. Apabila peluang kejadian BBLR sebesar πi maka sebarannya akan mengikuti sebaran Bernoulli (πi), dimana nilai peluang πi untuk setiap bayi berbedabeda tergantung pada karakteristik bayi yang lahir tersebut. Pada kasus aggreggasi data, secara lebih umum peubah acak Yi menyatakan jumlah kejadian BBLR dari keseluruhan ni kejadian kelahiran pada agregat ke-i. Dengan asumsi bahwa setiap kejadian kelahiran bersifat saling bebas dan peluang dari setiap kejadian BBLR pada agregat ke-i adalah identik sebesar πi maka peubah acak Yi akan mengikuti sebaran Binomial (ni, πi). Oleh karena itu pemodelan kejadian BBLR dengan model linier klasik akan melanggar asumsi normalitas dan homoskedastisitas. Sebaran data bagi Yi ~ Binomial (ni, πi) berimplikasi juga kepada ragam yang tidak homogen yang merupakan fungsi dari nilai harapannya Var (Yi) = niπi (1 – πi). Untuk mengatasi permasalahan tersebut Nelder dan Wedderburn (1972) memperkenalkan Generalized Linear Model (GLM) untuk mengakomodasi peubah yang tidak menyebar Normal namun masih termasuk dalam sebaran eksponensial sehingga dapat dimodelkan dalam model linier (2.1). 𝑔(𝒚) = 𝑿𝜷 + 𝜺 (2.1) GLM terdiri dari tiga komponen utama (Azen dan Walker 2011): 1. Komponen Acak (random component) Y yang merupakan peubah respon acak yang memiliki sebaran yang termasuk dalam keluarga sebaran eksponensial. Keluarga sebaran eksponensial memiliki bentuk umum fungsi persamaan 2.2. 𝑦𝑖 𝜂𝑖 − 𝑎(𝜂𝑖 ) 𝑓 (𝑦𝑖 , 𝜂𝑖 , 𝜙𝑖 ) = 𝑒𝑥𝑝 { + 𝑐 (𝑦𝑖 , 𝜙𝑖 )} 𝑏(𝜙𝑖 ) (2.2) 2. Penduga Linier (linear predictor) Xβ dengan X adalah matriks peubah bebas dan β adalah vektor parameter model yang hendak diduga. 3. Fungsi Hubung (link function) g(.) yang menghubungkan komponen acak dan penduga linier. 𝜂𝑖 = 𝑔(𝜇𝑖 ) = 𝑔(𝐸(𝑦𝑖 )) (2.3) Sebaran Binomial dapat dinyatakan seperti dalam bentuk umum (2.2) sehingga sebaran Binomial merupakan salah satu anggota keluarga sebaran eksponensial (2.4). 𝜋𝑖 𝑛𝑖 𝑛𝑖 𝑓(𝑦𝑖 ) = (𝑦 ) 𝜋𝑖 𝑦𝑖 (1 − 𝜋𝑖 )𝑛𝑖−𝑦𝑖 = exp [𝑦𝑖 ln ( ) + 𝑛𝑖 ln(1 − 𝜋𝑖 ) + ln ( 𝑦 )] 𝑖 𝑖 1 − 𝜋𝑖 (2.4)
6 sehingga diperoleh fungsi hubung (2.5) yang disebut sebagai fungsi logit 𝜋𝑖 𝜂𝑖 = 𝑔(𝜇𝑖 ) = ln ( ) 1 − 𝜋𝑖 (2.5) dan pemodelan BBLR dengan GLM akan mengikuti model 2.6 yang disebut sebagai model regresi logistik. 𝜋𝑖 𝑔(𝑦𝑖 ) = ln ( ) = 𝛽0 + 𝛽1 𝑋𝑖1 + ⋯ + 𝛽𝑝 𝑋𝑖𝑝 + 𝜀𝑖 1 − 𝜋𝑖 𝑒 𝛽0 +𝛽1 𝑋𝑖1 +⋯+𝛽𝑝 𝑋𝑖𝑝 +𝜀𝑖 𝜋𝑖 = 1 + 𝑒 𝛽0 +𝛽1 𝑋𝑖1 +⋯+𝛽𝑝 𝑋𝑖𝑝 +𝜀𝑖 (2.6) 𝑻 𝛽 ⋯ 𝛽 (𝛽 ) Untuk dapat menduga parameter 𝜷 = 0 ̂𝑖 = 1 𝑝 nilai penduga 𝜋 𝑦𝑖 digunakan dalam pendugaan. Pada pemodelan terhadap data agregat dengan 𝑛𝑖
kondisi 0 < yi < ni nilai logit dari masing-masing amatan dapat dihitung sehingga pendugaan secara Ordinary Least Square (OLS) dapat dilakukan dengan 𝜋 ̂ transformasi𝑦𝑖∗ = ln (1−𝜋𝑖̂ ). Permasalahan pada pemodelan regresi logistik dengan 𝑖
data individu atau data agregat terjadi ketika nilai yi = 0 atau yi = ni. Pada kondisi demikian pendugaan dilakukan dengan pendekatan metode Maximum Likelihood Estimation (MLE). Fungsi likelihood diperoleh dari sebaran bersama seluruh data amatan sejumlah m dengan mensubstitusikan parameter model pada persamaan 2.6 ke parameter sebaran binomial (2.4). Pendugaan dengan metode MLE dilakukan dengan memaksimumkan nilai fungsi log-likelihood ln L(𝜷) terhadap parameter 𝜷 yang diduga. 𝑚 𝑚 𝑛𝑖 𝑇 ln 𝐿 (𝜷) = ln ∏ 𝑓 (𝑦𝑖 |𝜷) = ∑ [𝑦𝑖 (𝒙𝑇𝑖 𝜷) − 𝑛𝑖 ln (1 + 𝑒 𝒙𝑖 𝜷 ) + ln (𝑦 )] 𝑖 𝑖=1
𝑖=1
(2.7) 𝐔(𝜷)𝑝×1 =
𝒙𝑇 𝑖𝜷
𝜕 ln 𝐿 (𝜷) 𝑛𝑖 𝑒 ̅) = 𝟎 ; 𝑦̅𝑖 = 𝑛𝑖 𝜋𝑖 = = 𝐗 𝐓 (𝒚 − 𝒚 𝑇 𝜕𝜷 1 + 𝑒 𝒙𝑖 𝜷
(2.8) Dugaan bagi parameter 𝜷 diperoleh dari solusi persamaan 2.8 yang dapat diselesaikan melalui metode numerik dengan algoritma Newton-Raphson hingga diperoleh iterasi ke-r yang konvergen dari persamaan 2.9 (Dobson 2002). 𝐔(𝜷(𝑟−1) ) (𝑟) (𝑟−1) 𝜷 =𝜷 − 𝐔′(𝜷(𝑟−1) ) (2.9) 2 ( ) 𝜕 𝑙 𝜷 𝐔 ′ (𝜷)𝑝×𝑝 = = −𝐗 𝐓 𝐖𝐗 𝜕𝜷𝟐 (2.10) dimana W adalah matriks diagonal pembobot yang memiliki elemen-elemen 𝑤𝑖𝑖 = 𝜋𝑖 (1 − 𝜋𝑖 ). Vektor U(β) disebut sebagai vektor score yang memiliki karakteristik : 𝐸 (𝐔) = 𝟎 ; 𝑉𝑎𝑟(𝐔) = 𝐸 (𝐔 2 ) = −𝐸 (𝐔 ′ ) = 𝕴 (2.11) Matriks ℑ disebut sebagai matriks information yang dalam metode MLE pada umumnya digunakan sebagai pendekatan terhadap nilai U’. Sehingga penduga b bagi 𝜷 dapat diperoleh melalui r iterasi dari persamaan 2.12.
7 𝕴(𝑟−1) 𝒃(𝑟) = 𝕴(𝑟−1) 𝒃(𝑟−1) + 𝐔(𝒃(𝑟−1) ) (2.12) Pendekatan numerik ini disebut sebagai metode scoring dan proses penghitungannya serupa dengan metode Iterative Weighted Least Squares (IWLS). Regresi Terboboti (Weighted Regression) Informasi tentang sebaran data sangat penting dalam melakukan suatu pemodelan. Pengabaian terhadap sebuah informasi dapat berujung pada pemodelan yang tidak valid dan kesimpulan yang diambil dapat menjadi bias. Pada kondisi terdapat indikasi ketidakhomogenan ragam (heteroskedastisitas) ataupun antar amatan tidak saling bebas (autokorelasi) pada sebaran data, pemodelan yang dilakukan perlu disesuaikan. Pemodelan pada kondisi heteroskedastisitas maupun autokorelasi, meskipun tetap tak bias, berdampak pada pendugaan yang menjadi tidak efisien (ragam tidak minimum) dan hasil uji statistik menjadi tidak valid. Aitken (1935) memperkenalkan Generalized Least Squares (GLS) untuk regresi dengan sebaran yang memiliki ragam yang tidak homogen ataupun amatan yang tidak saling bebas. 𝒚 = 𝑿𝜷 + 𝜺 ; 𝜺~(𝟎, 𝑽) (2.13) dimana V adalah matriks simetrik non singular dan W = V-1 dan matriks H adalah matriks sedemikian hingga HTH = W dan HTVH = I maka menyertakan matriks H dalam model akan menghasilkan: 𝐇𝒚 = 𝐇𝐗𝜷 + 𝐇𝜺 ; E(𝐇𝒚) = 𝐇𝐗𝜷 ; Var(𝐇𝒚) =𝐇 T 𝐕𝐇 = 𝐈 (2.14) Sehingga penduga yang dihasilkan: ̂ GLS = (𝐗 T 𝐇 T 𝐇𝐗)−1 𝐗 T 𝐇 T 𝐇𝐲 = (𝐗 T 𝐖𝐗)−1 𝐗 T 𝐖𝒚 𝜷 (2.15) adalah penduga yang bersifat Best Linear Unbiased Estimator (BLUE) dengan W = V-1 disebut sebagai matriks pembobot dan model regresi yang digunakan disebut sebagai model regresi terboboti. Dalam kasus terdapat indikasi perbedaan ragam (heteroskedastisitas) dalam pemodelan dengan GLM prinsip yang sama dapat digunakan dengan menyertakan matriks diagonal H seperti pada persamaan 2.14 ke dalam persamaan 2.1. 𝑔(𝐇𝒚) = 𝐇𝐗𝜷 + 𝐇𝜺 (2.16) Sehingga penduga dari parameter 𝜷 diperoleh dari solusi persamaan 2.17, 𝑇 𝑛𝑖 𝑒 ℎ𝑖𝑖𝒙𝑖 𝜷 𝜕 ln 𝐿 (𝜷) ∗ ∗ T T ∗ ̅ ) = 𝟎 ; 𝑦̅𝑖 = 𝑛𝑖 𝜋𝑖 = 𝐔(𝜷)𝑝×1 = = 𝐗 𝐇 (𝐇𝒚 − 𝒚 𝑇 𝜕𝜷 1 + 𝑒 ℎ𝑖𝑖𝒙𝑖 𝜷 (2.17) Perbandingan Model Untuk mengevaluasi kebaikan model-model tersebut sehingga dapat dibandingkan satu sama lain digunakan Akaike’s Information Criterion (AIC) dan luas di bawah kurva Receiver Operating Characteristics (ROC). AIC adalah kriteria pemilihan model yang dikembangkan oleh Akaike (1973) berdasarkan pada nilai
8 maksimum log-likelihood (2.7) dari model dengan dikoreksi oleh jumlah parameter model yang diduga (p) menjadi formula 2.18. 𝐴𝐼𝐶 = −2 ln 𝐿 (𝜷) + 2𝑝 (2.18) Meskipun setiap model yang diperbandingkan dalam penelitian ini memiliki jumlah amatan yang sama akan tetapi jumlah kejadian kelahiran (n), kejadian BBLR (y) yang diamati dan jumlah parameter yang diduga (p) untuk setiap model tetap sama. Sehingga perbandingan AIC yang dihasilkan merupakan perbandingan kesesuaian (fit) karena perbedaan AIC yang dihasilkan hanya berdasarkan perbedaan nilai dugaan peluang kejadian (π). Nilai dugaan peluang kejadian (π) itu sendiri tergantung pada hasil agregasi peubah bebas (X) dan dugaan parameter model (β). Kurva ROC disusun dari plot antara kepekaan (Se) terhadap 1 – kekhususan (1 – Sp) pendugaan pada setiap nilai cut-off (c) yang ketiga-tiganya memiliki nilai berada pada interval 0 dan 1. Nilai cut-off (c) adalah batas nilai dugaan peluang yang ditentukan untuk mengklasifikasikan dugaan kejadian. Sehingga dugaan kejadian BBLR dapat dinyatakan sebagai fungsi dari nilai cut-off (c). 1(𝐵𝐵𝐿𝑅) ; 𝜋̂ ≥ 𝑐 𝑌̂ (𝑐 ) = { 0(𝑁𝑜𝑛 𝐵𝐵𝐿𝑅) ; 𝜋̂ < 𝑐 Sehingga penghitungan kepekaan (Se) dan kekhususan (Sp) pada kejadian BBLR dapat digambarkan pada Tabel 2.1 dan persamaan 2.19. Tabel 2.1. Tabulasi silang dugaan dan kejadian BBLR Kenyataan Jumlah Dugaan BBLR Non BBLR BBLR(c) True Positive(c) False Positive(c) Positive(c) Dugaan(c) Non BBLR(c) False Negative(c) True Negative(c) Negative(c) Jumlah Kelahiran Event Non Event Total 𝑇𝑁(𝑐) 𝑇𝑃(𝑐) ; 𝑆𝑝(𝑐 ) = 𝑇𝑁(𝑐 ) + 𝐹𝑃(𝑐) 𝑇𝑃(𝑐 ) + 𝐹𝑁(𝑐) 0 ≤ 𝑐 ≤ 1; 0 ≤ 𝑆𝑒(𝑐 ) ≤ 1; 0 ≤ 𝑆𝑝(𝑐) ≤ 1
𝑆𝑒(𝑐 ) =
(2.19) Kepekaan menunjukkan proporsi kejadian BBLR yang diduga dengan benar dan kekhususan menunjukkan proporsi kejadian Non BBLR yang diduga dengan benar. Karena penghitungan kepekaan dilakukan pada kelompok data event (BBLR) dan kekhususan pada kelompok data non event (Non BBLR) maka kedua ukuran tersebut tidak tergantung terhadap prevalensi data (prevalence-independent), sehingga ketika dugaan model sudah diperoleh, besarnya nilai kepekaan dan kekhususan hanya tergantung pada nilai c. Karena hanya berdasarkan nilai c, konsekuensi dari formula 2.19 semakin tinggi kepekaan, maka kekhususannya akan semakin rendah, demikian juga sebaliknya. Oleh karena itu kepekaan maupun kekhususan secara terpisah tidak dapat digunakan sebagai indikator kebaikan suatu model. Hubungan antara keduanya yang digambarkan dalam kurva ROC lebih tepat digunakan sebagai indikator kebaikan model dalam memprediksi suatu kejadian biner (Gonçalves et al. 2014). ROC sendiri menggunakan plot kepekaan (Se) terhadap 1 – kekhususan (1 – Sp) dengan alasan kemudahan sebagai perbandingan antara true positive dan false positive yang sejalan dengan nilai c. Model yang baik akan memiliki kepekaan yang lebih besar daripada
9 nilai 1 – kekhususannya, semakin besar kecenderungan perbedaannya semakin baik model tersebut sebagai penduga (classifier). Contoh ilustrasi dari kurva ROC dapat dilihat pada Gambar 2.1. Model penduga yang baik akan menghasilkan kurva ROC yang cekung ke bawah dan mendekati kondisi sempurna.
Gambar 2.1. Ilustrasi kurva Receiver Operating Charasteristics (ROC) Agar kebaikan model dapat diukur, kurva ROC dapat dipandang sebagai fungsi dari nilai cut-off point (c) terhadap nilai ROC dan luas area dibawah kurva (area under curve/AUC) sebagai ukuran kebaikan model (2.20). 𝑅𝑂𝐶 (𝑐 ) = 𝑆𝑒(𝑆𝑝−1 (1 − 𝑐)) 1
𝐴𝑈𝐶 = ∫ 𝑅𝑂𝐶(𝑐)𝑑𝑐
; 0 ≤ 𝐴𝑈𝐶 ≤ 1
0
(2.20) Meskipun secara perhitungan nilai AUC berada pada kisaran 0 < AUC < 1, akan tetapi secara umum AUC berada dalam kisaran 0.5 < AUC < 1. Nilai AUC di bawah 0.5 menunjukkan model penduga yang berlawanan (penduga BBLR justru lebih baik dalam menduga Non BBLR). Semakin besar nilai AUC maka semakin baik model penduga tersebut. Model penduga yang baik akan memiliki nilai AUC mendekati 1 (AUC dari kurva ROC yang sempurna).
10
3 METODE PENELITIAN Data Data yang digunakan dalam penelitian ini terdiri dari data primer dan data sekunder. Data primer berasal dari data mentah SDKI 2012 sedangkan data sekunder berupa data komponen-komponen Indeks Pembangunan Manusia (IPM) kabupaten/kota se-Indonesia tahun 2011. Amatan yang digunakan adalah bayi lahir hidup dalam periode 5 tahun yang lalu yang berat badannya ditimbang. Komposisi data primer yang digunakan adalah seperti pada Gambar 3.1.
Gambar 3.1. Komposisi data SDKI 2012 yang menjadi cakupan penelitian Peubah Penelitian Peubah-peubah penelitian yang digunakan terdiri dari peubah respon dan peubah-peubah penjelas. Peubah-peubah penjelas terdiri dari tiga kelompok: proxy individu, faktor risiko individu dan pengaruh area. Peubah proxy terdiri dari peubah dasar respon dan peubah perkiraan ukuran yang digunakan untuk mengevaluasi akurasi perkiraan ibu terhadap berat badan lahir bayi. Akurasi yang dimaksudkan disini berhubungan dengan konsep rataan. Akurasi antara kelopok data ingatan dan data catatan dapat dikatakan sama apabila pada kondisi bayi yang sama peluang kejadian BBLR antara kedua kelompok juga sama. Hal ini ditunjukkan oleh tidak adanya perbedaan pengaruh kelompok dasar respon terhadap pendugaan. Peubah perkiraan ukuran digunakan dengan harapan dapat mendukung kesimpulan yang diambil. Keakuratan pendugaan ditunjukkan oleh pengaruh perkiraan ukuran terhadap pendugaan memiliki tanda dan urutan yang sesuai (bayi dengan ukuran kecil memiliki kecenderungan BBLR yang tinggi dan bayi dengan ukuran lebih besar memiliki kecenderungan BBLR yang lebih rendah). Rincian peubah-peubah yang digunakan dalam penelitian ini disajikan pada Tabel 3.1.
11 Tabel 3.1. Peubah-peubah yang digunakan dalam penelitian No. Nama Peubah Definisi Operasional Skala Kategori/Satuan Peubah Respon 1. Kejadian BBLR Berat badan lahir bayi Kategorik BBLR (Y=1) (Y) dikategorikan menjadi Non BBLR (Y=0) BBLR (< 2.500 gram) dan Non BBLR (≥ 2.500 gram) Peubah Proxy 2. Dasar Respon Dasar informasi berat Kategorik Catatan (–) badan lahir dari ibu Ingatan (D1) 3.
Perkiraan Ukuran
Faktor Risiko 4. Kembar
Ukuran bayi ketika lahir Kategorik menurut perkiraan ibu
Sangat Kecil (D2) Kecil (D3) Sedang (–) Besar (D4) Sangat Besar (D5)
Bayi lahir kembar atau tidak kembar
Kategorik
Tidak Kembar (–) Kembar (D6)
Kategorik
Anak Pertama (D7) < 2 th dan ke 2-3 (D8) > 2 th dan ke 2-3 (–) < 2 th dan ke 4+ (D9) > 2 th dan ke 4+ (D10)
5.
Jarak dan Urutan Lahir
Kombinasi dari jarak dengan kelahiran sebelumnya dan urutan kelahiran
6.
Komplikasi Kehamilan
Terdapat komplikasi Kategorik selama proses kehamilan
7.
Riwayat Keguguran
Memiliki riwayat aborsi, keguguran maupun lahir mati
Kategorik
8.
Umur Ibu
Pengelompokan menurut umur kelahiran beresiko
Kategorik
< 20 tahun (D15) 20-34 tahun (–) 35-49 tahun (D16)
9.
Jenis Kelamin Bayi
Jenis kelamin bayi
Kategorik
Laki-laki (D17) Perempuan (–)
10. Pendidikan Ibu
Pendidikan yang ditamatkan oleh ibu
Kategorik
Dasar/Tak Sekolah (D18) Menengah/Tinggi (–)
11. Kesejahteraan Rumahtangga
Indeks dari kondisi Kategorik perumahan, tersedia dalam data SDKI
Miskin (D19) Menengah (D20) Kaya (–)
12. Kebiasaan Merokok
Aktif = Ibu perokok Kategorik aktif, Pasif = ada ART perokok aktif
Aktif (D21) Pasif (D22) Tidak ada perokok (–)
Prematur (D11) Komplikasi lainnya (D12) Tidak ada komplikasi (–) No Information** (D13) Ada riwayat (D14) Tidak ada riwayat (–)
12 Tabel 3.1. (lanjutan) No. Nama Peubah Definisi Operasional Skala 13. Suplemen Ibu mengkonsumsi Kategorik zat besi suplemen zat besi selama kehamilan
Kategori/Satuan Mengkonsumsi (D23) Tidak mengkonsumsi (–) No Information**
14. Pemeriksaan kehamilan
Pernah melakukan pemeriksaan kehamilan pada tenaga kesehatan
Kategorik
Medis (D24) Tradisional (D25) Tidak Periksa (–) No Information**
15. Sumber Air Minum
Sumber air minum yang digunakan rumah tangga. Kategori pekerjaan sehari-hari ibu
Kategorik
Terlindung (D26) Tidak terlindung (–)
Kategorik
Pekerjaan fisik (D27) Pekerj. non fisik (D28) Tidak bekerja (–)
Kategori Desa/Kota
Kategorik
18. AHH (X30)
Angka Harapan Hidup Kabupaten/ Kota tahun 2011
Numerik
Desa (D29) Kota (–) dalam tahun (th)
19. AMH (X31)
Angka Melek Huruf Kabupaten/ Kota tahun 2011
Numerik
16. Pekerjaan Ibu
Pengaruh Area 17. Desa/Kota
dalam persen (%)
20. Pengeluaran/ Kapita (X32)
Pengeluaran per Numerik dalam ribu rupiah Kapita Kabupaten/ (000 Rp) Kota tahun 2011 (Dj) peubah boneka untuk kategori bukan referensi (–) kategori referensi ** data kosong karena desain kuesioner, hanya ditanyakan pada anak terakhir Pengkategorian peubah-peubah bebas secara umum merujuk pada pengkategorian yang dilakukan Kramer (1987). Berdasarkan hasil eksplorasi data pengkategorian beberapa peubah yang terlalu banyak menghasilkan kategori-kategori yang tidak signifikan. Oleh karena itu beberapa peubah pengkategoriannya disederhanakan sehingga diperoleh kategori-kategori yang pengaruhnya lebih signifikan. Peubah-peubah yang disederhanakan pengkategoriannya antara lain: Pendidikan Ibu (5 kategori), Kesejahteraan Rumah Tangga (5 kategori), Sumber Air Minum (12 kategori), dan Pekerjaan Ibu (8 kategori). Pengaruh Area terdiri dari kategori Desa/Kota dan komponen IPM sebagai ukuran kesejahteraan suatu daerah. Angka Harapan Hidup merupakan indikator tingkat kesehatan, Angka Melek Huruf adalah indikator tingkat pendidikan dan Pengeluaran per Kapita sebagai indikator kemiskinan. Peubah-peubah tersebut diharapkan dapat menjelaskan pengaruh perbedaan area yang tidak dapat dijelaskan oleh pengaruh faktor-faktor risiko individu.
13 Metode Analisis Secara umum tahapan-tahapan analisis dalam penelitian ini dapat diringkas dalam bagan alur penelitian berikut seperti pada Gambar 3.2. Tahapan pra-pengolahan terdiri dari: pengkategorian, koreksi kode area dan konsistensi data, identifikasi sebaran data dan penanganan terhadap extreme value dan missing value. Seleksi peubah bebas dilakukan baik pada model individu terboboti maupun model agregat untuk menyederhanakan model yang dihasilkan. Peubah-peubah bebas yang dipilih adalah peubah-peubah bebas yang signifikan pada masing-masing model. Meskipun peubah bebas hanya signifikan pada salah satu model saja (level individu maupun agregat) peubah tersebut tetap disertakan dalam analisis. Metode seleksi yang digunakan adalah backward elimination. Dengan metode ini dapat dilihat apakah peubah-peubah yang dikeluarkan dari model memiliki kategori-kategori yang signifikan ataupun tidak. Peubah-peubah bebas yang tidak signifikan namun memiliki kategori yang signifikan tetap disertakan dalam analisis dalam tahapan overfitting. Data BBLR SDKI dan IPM
Eksplorasi Data dan Pra-Pengolahan
Pembobotan
Model Individu Terboboti
Agregasi Data
Model Ibu
Model Rmt
Model BS
Model Kab/Kota
Seleksi Peubah Bebas dan overfitting
Model Individu Akhir Terboboti
Model Akhir Ibu
Model Akhir Rmt
Model Akhir BS
Perbandingan Dugaan Parameter Model, Dugaan Prevalensi & Ragam Perbandingan Model AIC dan luas di bawah Kurva ROC Gambar 3.2. Bagan alur penelitian
Model Akhir Kab/Kota
14 Pembobotan Model Individu Pemodelan kejadian BBLR pada level individu menggunakan Model Regresi Logistik Terboboti. Pembobotan dilakukan untuk mengatasi indikasi perbedaan presisi (ragam) dari kejadian BBLR pada kelompok data berat badan lahir yang berdasarkan ingatan ibu dan berdasarkan data catatan. Pembobotan dilakukan dengan menghitung ragam dari masing-masing kelompok ke-j. Bobot yang diperoleh (hj) kemudian distandarisasi (hj*) sehingga total amatan tidak berubah. 𝑦𝑗 𝑝𝑗 (1 − 𝑝𝑗 ) Var(𝑝̂𝑗 ) = Var ( ) = 𝑛𝑗 𝑛𝑗 𝑛ℎ𝑗 ℎ𝑗 = 1⁄√Var(𝑝𝑗 ) ; ℎ𝑗∗ = 𝑘 ∑𝑗=1 𝑛𝑗 ℎ𝑗 (3.1) * Masing-masing bobot tersebut diterapkan pada setiap amatan ke-i (hi ) sesuai dengan kelompok datanya sehingga diperoleh model regresi logistik individu terboboti 1seperti pada persamaan (3.2): 𝜋𝑖∗ 𝑔(ℎ𝑖∗ 𝑦𝑖 ) = ln ( ) = ℎ𝑖∗ 𝛽0 + ℎ𝑖∗ 𝛽1 𝑋1𝑖 + ⋯ + ℎ𝑖∗ 𝛽32 𝑋32𝑖 + ℎ𝑖∗ 𝜀𝑖 1 − 𝜋𝑖∗ ∗ ∗ ∗ ∗ 𝑒 ℎ𝑖 𝛽0 +ℎ𝑖 𝛽1 𝑋1𝑖 +⋯+ℎ𝑖 𝛽32 𝑋32𝑖 +ℎ𝑖 𝜀𝑖 ∗ 𝜋𝑖 = ∗ ∗ ∗ ∗ 1 + 𝑒 ℎ𝑖 𝛽0 +ℎ𝑖 𝛽1 𝑋1𝑖 +⋯+ℎ𝑖 𝛽32 𝑋32𝑖 +ℎ𝑖 𝜀𝑖 (3.2) Agregasi Data Untuk dapat mengetahui sejauh mana pemodelan dari data agregasi menghasilkan model yang baik, pemodelan pada beberapa level agregasi perlu dilakukan. Agregasi data individu dilakukan pada level Ibu, Rumah Tangga, Blok Sensus, dan Kabupaten/Kota. Agregasi pada level Desa dan Kecamatan tidak dilakukan karena ukuran sampel SDKI yang kecil sehingga rancangan yang diperoleh, pada level desa dan kecamatan hampir semuanya hanya memperoleh 1 (satu) BS sampel. Agregasi dilakukan pada peubah respons maupun peubah penjelas pada level individu/level agregat terendah (misalnya: pendidikan ibu mulai diagregasi pada level rumah tangga, sumber air minum mulai diagregasi pada level BS, dst.). Pada level agregat pemodelan dilakukan dengan mengasumsikan bahwa peluang kejadian BBLR (πi) dalam suatu agregat identik. Sehingga dari ni kelahiran dalam suatu agregat jumlah kejadian BBLR yi akan mengikuti sebaran Binomial (ni, πi). 𝑦 Karena dalam pemodelan yang digunakan adalah nilai 𝜋̂𝑖 = 𝑛𝑖 maka agregat peubah𝑖 peubah penjelas juga dinyatakan dalam proporsi (𝑋̅𝑗 ) sehingga diperoleh model regresi logistik agregat (3.3). 𝑦𝑖
𝑔(𝑦𝑖 ) = ln (
𝑛𝑖
𝑦
1 − 𝑛𝑖
) = 𝛽0 + 𝛽1 𝑋̅𝑖1 + ⋯ + 𝛽𝑝 𝑋̅𝑖𝑝 + 𝜀𝑖
𝑖
(3.3) Model regresi logistik agregat ini tidak diboboti karena dalam proses agregasi amatan dari data ingatan dan data catatan sudah tercampur dalam satu aggregat.
15
4 HASIL DAN PEMBAHASAN Eksplorasi Data Dari hasil publikasi SDKI 2012 yang diterbitkan BPS, prevalensi BBLR nasional 7.3 persen dengan prevalensi BBLR provinsi berkisar antara 4.7-15.7 persen, angka terendah di DKI Jakarta (4.7%) dan tertinggi di NTT (15.7%). Provinsi-provinsi dengan prevalensi BBLR yang cukup tinggi (> 8.5%) adalah Banten, D.I. Yogyakarta, Kalimantan Barat, Sulawesi Barat, Sulawesi Tengah, Gorontalo, NTB, NTT dan Papua Barat (Gambar 4.1).
Gambar 4.1. Persebaran prevalensi BBLR menurut provinsi Persebaran ini cukup berbeda dengan persebaran data Indeks Pembangunan Manusia (IPM) yang mencerminkan kesejahteraan suatu daerah (Gambar 4.2). Beberapa daerah dengan nilai IPM tinggi namun memiliki prevalensi BBLR yang tinggi pula adalah Banten, D.I. Yogyakarta, Sulawesi Barat, Sulawesi Tengah, dan Gorontalo. Sedangkan Maluku Utara dan Papua memiliki prevalensi BBLR pada kategori sedang meskipun nilai IPM nya terbilang rendah. Karena IPM sendiri terdiri dari beberapa komponen (pendidikan, kesehatan dan kemiskinan) maka perlu dikaji komponen-komponen mana yang berpengaruh terhadap prevalensi BBLR.
Gambar 4.2. Persebaran IPM menurut provinsi Data BBLR berasal dari data peubah berat badan lahir bayi yang bersifat numerik. Pada tahap awal pada data berat badan lahir bayi, identifikasi sebaran menunjukkan bahwa sebaran data tidak normal. Hal ini disebabkan antara lain oleh
16 adanya outlier serta karakteristik data yang cenderung digit preference, karena sebagian besar data berdasarkan ingatan (78.1 %). Peubah penjelas yang bersifat numerik seperti: umur ibu, jarak kelahiran dan urutan kelahiran juga tidak menunjukkan pola hubungan terhadap berat badan bayi (Gambar 4.3).
Gambar 4.3. Pola hubungan berat badan lahir bayi dengan urutan kelahiran, umur ibu saat melahirkan dan jarak dengan kelahiran sebelumnya Oleh karena itu pendekatan regresi logistik dirasa lebih tepat mengingat sebagian besar peubah penjelas bersifat kategorik. Hal ini sesuai dengan kenyataan bahwa kejadian BBLR sebagai kejadian yang bersifat khusus dengan dampak-dampak yang khusus pula. Dari hasil eksplorasi peubah-peubah penjelas individu numerik tersebut lebih berpengaruh nyata ketika dikonversi menjadi peubah kategorik dengan pengkategorian merujuk pada Kramer (1987). Sedangkan dari sisi faktor-faktor risiko individu, komposisi data SDKI 2012 adalah: 1.44 persen bayi adalah bayi kembar, 2.12 persen bayi lahir prematur dan 9.34 mengalami komplikasi lainnya, 6.81 bayi lahir berjarak < 2 tahun, 38.05 persen adalah anak pertama dan 14.96 persen adalah anak dengan urutan kelahiran 4 (empat) ke atas, 2.43 persen bayi saat kehamilannya tidak diperiksakan pada tenaga medis dan 23.5 persen tidak mengkonsumsi suplemen zat besi saat hamil. Dari sisi ibu, 14.52 persen ibu punya riwayat keguguran/aborsi/lahir mati, 2.23 merupakan perokok aktif dan 68.12 persen di dalam rumah tangganya ada yg perokok aktif, 28.05 persen ibu berpendidikan SD ke bawah, 8.89 persen melahirkan pada usia < 20 tahun dan 15.21 melahirkan pada usia > 35 tahun, 20.98 persen ibu bekerja pada pekerjaan yg bersifat fisik dan 32.23 persen pada pekerjaan non fisik. Sedangkan pada tingkat rumah tangga, 22.53 persen rumah tangga merupakan rumah tangga yang terindikasi miskin dan 27.25 persen rumah tangga mengkonsumsi air dari sumber air tidak terlindung. Model Individu Pembobotan Pada tahapan pembobotan, perbedaan yang besar antara ukuran kelompok data catatan (3314 bayi) dan data ingatan (11810 bayi) menyebabkan dugaan ragam lebih mencerminkan ukuran sampel (nt) daripada keragaman data (πt (1–πt)). Oleh karena itu kelompok data ingatan dibagi ke dalam kelompok-kelompok yang lebih kecil sehingga ukurannya relatif seragam. Kelompok yang digunakan adalah jarak kelahiran dengan saat pendataan, dengan asumsi semakin jauh jarak kelahiran akurasi ingatan semakin menurun, sehingga diperoleh komposisi (Tabel 4.1).
17 Tabel 4.1. Kelompok dasar respon dan pembobotan yang diberikan Ragam Bobot Kelompok Ukuran BBLR (%) (×10-6) Terstandarisasi Catatan 3314 6.40 18.07 1.2040 1 tahun 2408 7.43 28.58 0.9574 2 tahun 2462 6.99 26.39 0.9961 3 tahun 2378 8.62 33.13 0.8892 4 tahun 2326 8.38 33.02 0.8906 5 tahun 2236 6.53 27.30 0.9796 Untuk menyederhanakan pemodelan peubah-peubah bebas diseleksi dengan metode backward elimination dengan dilakukan overfitting pada peubah-peubah bebas yang tidak signifikan tetapi memiliki kategori yang signifikan. Seleksi juga dilakukan pada tiap level agregasi untuk mengakomodasi adanya peubah yang tidak signifikan pada level individu tetapi signifikan pada level agregat maupun sebaliknya. Dari proses seleksi diperoleh peubah-peubah bebas yang disertakan dalam analisis adalah: Dasar Respon (D1), Perkiraan Ukuran (D2 – D5), Kembar (D6), Jarak dan Urutan Kelahiran (D7 – D10), Komplikasi Kehamilan (D11 – D13), Umur Ibu (D15 – D16), Pendidikan Ibu (D18), Kesejahteraan Rumah Tangga (D19 – D20), Sumber Air Minum (D26), Pekerjaan Ibu (D27 – D28), Angka Melek Huruf Kab/Kota 2011 (X31) dan Pengeluaran per Kapita Kab/Kota 2011 (X32). Persamaan Regresi Hasil pemodelan data individu menunjukkan model terboboti lebih baik (AIC = 4519.63) daripada model individu yang tidak terboboti (AIC = 4565.19) meskipun luas di bawah kurva ROC untuk kedua model sama (AUC = 0.9142). π̂i 2.45 + 0.06𝐷1 + (4.92𝑫𝟐 + 3.11𝑫𝟑 – 1.68𝑫𝟒 – 3.01𝑫𝟓 ) + 2.70 𝑫𝟔 )= +(0.27𝑫𝟕 +0.66𝑫𝟖 +0.55𝑫𝟗 –0.03𝐷10 )+(0.51𝑫𝟏𝟏 +0.31𝑫𝟏𝟐 +0.04𝐷13 ) 1-π̂i +(0.14𝐷15 +0.25𝑫𝟏𝟔 ) + 0.46𝑫𝟏𝟖 + (0.22𝑫𝟏𝟗 + 0.02𝐷20 ) + 0.20𝑫𝟐𝟔 +(0.02𝐷27 + 0.20𝑫𝟐𝟖 ) − 0.02𝑿𝟑𝟏 − 0.01𝑿𝟑𝟐 (4.1) Keterangan: kategori tebal adalah kategori yang signifikan pada α = 5% ln (
Dari model terboboti 4.1 terlihat bahwa, tidak ada pengaruh nyata perbedaan kelompok dasar respon data (D1) baik berdasarkan catatan dan ingatan ibu terhadap dugaan BBLR. Artinya peubah-peubah (kategori-kategori) lain dalam model mampu menjelaskan pengaruh perbedaan kelompok respon terhadap kejadian BBLR sehingga tidak ada perbedaan akurasi yang signifikan pada kedua kelompok. Hal ini terlihat pula dari koefisien-koefisien kategori perkiraan ukuran (D2 – D5) yang konsisten. Semakin kecil perkiraan ukuran yang diberikan oleh ibu semakin besar nilai koefisien (kecenderungan BBLR). Ini menunjukkan bahwa perkiraan ibu akan berat badan bayi secara statisik bisa diandalkan (akurat). Nilai AIC yang menunjukkan bahwa model terboboti lebih baik menunjukkan bahwa terdapat perbedaan ragam dari kelompok dasar respon data. Nilai bobot pada data catatan yang lebih tinggi menunjukkan bahwa data catatan memiliki presisi yang lebih tinggi (karena ragamnya lebih kecil) Dari model individu terboboti yang diperoleh, kategori-kategori individu yang secara nyata memiliki risiko BBLR yang lebih tinggi adalah: bayi kembar, bayi pertama, bayi dengan jarak kelahiran < 2 tahun, bayi prematur, bayi yang mengalami
18 komplikasi selama kehamilan, bayi dari ibu di atas 35 tahun, bayi dari ibu yang berpendidikan dasar/tidak sekolah, bayi dari rumah tangga miskin, bayi dari ibu yang pekerjaan sehari-harinya bersifat non fisik, dan bayi dari rumah tangga yang mengkonsumsi air dari sumber air tak terlindung. Sedangkan pengaruh area yang berpengaruh terhadap kejadian BBLR adalah Angka Melek Huruf yang mewakili tingkat pendidikan pada suatu daerah, dan Pengeluaran per Kapita yang mewakili tingkat kesejahteraan suatu daerah. Koefisien yang negatif menunjukkan bahwa daerah dengan AMH dan pengeluaran per kapita yang tinggi cenderung memiliki prevalensi BBLR yang rendah. Kategori daerah Desa/Kota dan Angka Harapan Hidup yang mewakili tingkat kesehatan tidak berpengaruh nyata terhadap kejadian BBLR. Hal ini mungkin dikarenakan kedua indikator tersebut sudah dapat dijelaskan oleh kategori-kategori individu. Dugaan Odds Ratio dan Peluang Interpretasi umum dari model regresi logistik adalah dengan menggunakan odds ratio (θk). Odds ratio menyatakan kecenderungan suatu kejadian (BBLR) pada suatu kategori terhadap kategori referensi yg dinyatakan dalam perbandingan odd (peluang sukses dibagi peluang gagal). Nilai odds ratio diduga dengan nilai eksponensial dari penduga parameter regresi (βk) pada peubah kategorik. Pada peubah kontinu nilai ini merupakan nilai perubahan odd secara multiplikatif setiap penambahan satu satuan (dapat juga berarti odds ratio terhadap nilai 0). Eksponensial dari intercept adalah nilai odd dari kategori referensi. 𝜋 ̂
𝜃̂𝑘 = 𝑒
̂𝑘 𝛽
( 𝑘 ) 𝑜𝑑𝑑𝑘 1−𝜋 ̂ = = 𝜋̂ 𝑘 𝑜𝑑𝑑𝑟𝑒𝑓 ( 𝑟𝑒𝑓 ) 1−𝜋 ̂
̂
; 𝜋̂𝑘 =
̂
𝑒 𝛽0 +𝛽𝑘 1 + 𝑒 𝛽̂0+𝛽̂𝑘
̂
; 𝜋̂𝑟𝑒𝑓 =
𝑒 𝛽0 1 + 𝑒 𝛽̂0
𝑟𝑒𝑓
(4.2) Selain itu karena regresi logistik memodelkan peluang suatu kejadian, peluang kejadian BBLR pada kategori tertentu (πk), dengan asumsi kategori lain ada pada kondisi referensi, dapat juga diduga dengan mengasumsikan peubah numerik pada suatu nilai tertentu. Formula penghitungan dugaan odds ratio dan peluang kejadian BBLR dapat dilihat pada persamaan 4.2. Dugaan nilai odds ratio dan peluang untuk masing-masing kategori diasjikan pada Tabel 4.2. Nilai odds ratio dapat diinterpretasikan sebagai kecenderungan suatu kejadian (BBLR) pada suatu kelompok dibandingkan kelompok lain (kategori referensi). Nilai odds ratio yang tinggi (θ >1) menunjukkan bahwa pada kategori tersebut kejadian BBLR memiliki kecenderungan terjadi yang lebih tinggi (dibandingkan pada kategori referensi) sedangkan nilai odds ratio yang rendah ( θ <1) menunjukkan kecenderungan kejadian BBLR pada kategori tersebut lebih rendah (dibandingkan kategori referensi). Faktor-faktor sosial yang tidak berpengaruh secara langsung pada kejadian BBLR menarik untuk diperhatikan nilai odds ratio-nya, antara lain: pendidikan ibu, kesejahteraan rumah tangga dan pekerjaan ibu. Ibu dengan pendidikan rendah (SD/tidak sekolah) memiliki kecenderungan BBLR yang tinggi ( θ = 1.58, θlower = 1.36, θupper = 1.84). Hal ini karena ibu dengan pendidikan rendah pada umumnya memiliki pengetahuan yang rendah pula tentang kesehatan kehamilan. Demikian juga kelahiran pada rumah tangga miskin memiliki kecenderungan BBLR ( θ = 1.24, θlower = 1.01, θupper = 1.53), karena keterbatasan ekonomi berdampak pada keterbatasan akses terhadap fasilitas dan layanan kesehatan kehamilan yang memadai. Pekerjaan ibu juga
19 menarik untuk diamati bahwa kecenderungan BBLR justru lebih banyak terjadi pada ibu yang bekerja pada pekerjaan yang bersifat non fisik ( θ = 1.23, θlower = 1.04, θupper = 1.44) dan bukan pada pekerjaan yang bersifat fisik ( θ = 0.98, θlower = 0.82, θupper = 1.16). Kebiasaan aktivitas fisik yang tinggi pada ibu (baik pada kategori ibu rumah tangga maupun ibu dengan pekerjaan fisik) berdampak pada kesehatan dan kebugaran ibu sehingga resiko BBLR cenderung lebih rendah dibandingkan ibu yang memiliki pekerjaan yang minim aktivitas fisik (kantoran). Tabel 4.2. Nilai dugaan odds ratio dan peluang BBLR Penduga Odds 10% 10% Peubah/Kategori ratio (θk) lower upper βk Intercept
2.45
11.63**
0.63
214.23
Peluang* (πk×100) 1.61
Dasar Respon Ingatan 0.06 1.06 0.91 1.24 1.71 Perkiraan Ukuran Sangat kecil 4.92 137.17 102.16 184.16 69.22 Kecil 3.11 22.43 19.37 25.96 26.89 Besar -1.68 0.19 0.13 0.27 0.30 Sangat besar -3.01 0.05 0.01 0.27 0.08 Kembar Kembar 2.70 14.82 10.47 20.98 19.55 Jarak dan Urutan Lahir Anak pertama 0.27 1.31 1.11 1.54 2.10 < 2 th dan ke 2 – 3 0.66 1.94 1.43 2.62 3.08 < 2 th dan ke 4 + 0.55 1.73 1.13 2.65 2.76 > 2 th dan ke 4+ -0.03 0.97 0.77 1.21 1.56 Komplikasi Kehamilan Prematur 0.51 1.67 1.13 2.45 2.66 Komplikasi lainnya 0.31 1.36 1.10 1.67 2.18 No Information 0.04 1.04 0.86 1.27 1.68 Umur Ibu < 20 th 0.14 1.15 0.92 1.44 1.86 35-49 th 0.25 1.28 1.05 1.57 2.06 Pendidikan Ibu SD/Tidak Sekolah 0.46 1.58 1.36 1.84 2.53 Kesejahteraan Rmt. Rmt. Miskin 0.22 1.24 1.01 1.53 2.00 Rmt. Menengah 0.02 1.02 0.86 1.20 1.64 Sumber Air Minum Air tak terlindung 0.18 1.20 1.03 1.40 1.93 Pekerjaan Ibu Pekerjaan fisik -0.02 0.98 0.82 1.16 1.58 Pekerjaan non fisik 0.20 1.23 1.04 1.44 1.97 ** -0.02 0.98 0.97 0.99 1.58 AMH 2011 -0.01 0.99** 0.99 1.00 1.60 Peng./kapita 2011 * Peluang dihitung pada rata-rata AMH 95% dan Pengeluaran/Kapita Rp. 600.000,** Pada peubah kontinu diinterpretasikan sebagai perubahan odd setiap kenaikan satu satuan, pada intercept nilai ini diinterpretasikan sebagai odd pada kondisi referensi.
20 Model Agregat Perbandingan Model dan Hasil Dugaan Perbandingan model pada level agregat menunjukkan bahwa pada level ibu dan rumah tangga model hanya sedikit mengalami perubahan pada kategori-kategori yang signifikan (Tabel 4.3). Hal ini disebabkan pada kedua level ini masih didominasi agregat dengan jumlah amatan 1 (sama dengan level individu). Sedangkan pada level agregasi blok sensus dan kabupaten/kota, jumlah kategori yang berpengaruh signifikan berkurang banyak. Tabel 4.3. Perbandingan dugaan parameter model per level agregat Rumah Blok Kategori Individu Ibu Tangga Sensus 2.45 2.24 2.06 1.01 Intercept Dasar Respon Ingatan 0.06 0.07 0.09 -0.05 Perkiraan Ukuran Sangat kecil 4.92** 5.13** 5.13** 6.74** ** ** ** Kecil 3.11 3.19 3.16 4.22** Besar -1.68** -1.19** -1.10** -0.32 ** ** Sangat besar -3.01 -2.33 -2.00** -0.21 Kembar Kembar 2.70** 2.38** 2.38** 2.97** Jarak dan Urutan Lahir Anak pertama 0.27** 0.26** 0.27** 0.34 ** ** ** < 2 th dan ke 2 – 3 0.66 0.96 1.00 0.53 < 2 th dan ke 4 + 0.55** 0.61** 0.53* 0.24 > 2 th dan ke 4+ -0.03 -0.05 -0.03 -0.03 Komplikasi Kehamilan Prematur 0.51** 0.43* 0.41* -0.27 ** ** ** Komplikasi lainnya 0.31 0.29 0.28 0.23 No Information 0.04 0.60** 0.52** 0.10 Umur Ibu < 20 th 0.14 0.18 0.19 0.33 ** ** ** 35-49 th 0.25 0.28 0.28 0.36 Pendidikan Ibu SD/Tidak Sekolah 0.46** 0.44** 0.45** 0.29** Kesejahteraan Rmt. Rmt. Miskin 0.22* 0.19 0.15 0.11 Rmt. Menengah 0.02 -0.01 -0.04 -0.11 Sumber Air Minum Air tak terlindung 0.18** 0.19** 0.22** -0.22* Pekerjaan Ibu Pekerjaan fisik -0.02 -0.04 -0.05 -0.23 Pekerjaan non fisik 0.20** 0.19** 0.17* -0.24 ** ** ** -0.02 -0.02 -0.02 -0.01** AMH 2011 -0.01** -0.01** -0.01** -0.00** Peng./kapita 2011 ** * signifikan pada α = 5% signifikan pada α = 10%
Kab/ Kota 0.32 -0.11 8.67** 4.15** 0.06 -0.51 3.68** 0.10 -0.56 1.69 -0.51 0.84 -0.38 0.74 1.58** 0.66 0.44* -0.19 -0.64** -0.23 -0.01 -0.06 -0.01** -0.00
21 Peubah-peubah bebas yang hanya terdiri dari dua kategori (kembar, pendidikan, sumber air minum) cenderung mengalami penurunan signifikansi yang lambat. Hal ini dikarenakan penurunan signifikansi hanya dipengaruhi oleh penurunan jumlah amatan. Sedangkan pada peubah-peubah bebas dengan kategori lebih dari dua, penurunan signifikansi terjadi lebih cepat karena selain berkurangnya jumlah amatan terdapat distorsi antar kategori ketika dilakukan proses aggregasi. Sebagai contoh pada peubah umur ibu, ketika diaggregasi proporsi kejadian BBLR pada ibu < 20 tahun dan ibu 3549 tahun tidak bisa teridentifikasi lagi. Hal ini menyebabkan pada level Blok Sensus dan Kab/Kota peubah-peubah tersebut cenderung tidak signifikan lagi. Faktor risiko yang berpengaruh (dengan α = 10%) pada level BS, hanya proporsi anak kembar, proporsi ibu yang berpendidikan rendah dan proporsi rumah tangga yang menggunakan sumber air tak terlindung serta nilai AMH dan pengeluaran per kapita. Sedangkan pada level kabupaten/kota proporsi rumah tangga yang menggunakan sumber air tak terlindung dan pengeluaran per kapita menjadi tidak signifikan, sedangkan proporsi rumah tangga dengan kesejahteraan sedang dan proporsi ibu yang melahirkan pada usia di bawah 20 tahun menjadi signifikan berpengaruh terhadap kejadian BBLR. Hal ini dikarenakan aggregasi dari peubah-peubah bebas individu tersebut merupakan indikator yang berbeda. Sebagai contoh, kategori rumah tangga miskin adalah indikator kemiskinan individu, sedangkan proporsi rumah tangga miskin merupakan indikator kemiskinan suatu daerah, yang keduanya merupakan ukuran yang berbeda. Hal ini pula yang dapat menyebabkan agregat peubah individu yang signifikan menjadi tidak signifikan dan juga sebaliknya. Pemilihan Model Model terbaik dapat dilihat dari nilai AIC nya yang paling rendah adalah model individu. Uji Hosmer-Lemeshow (Hosmer & Lemeshow 2000) pada model ini juga menunjukkan tidak ada perbedaan signifikan antara nilai dugaan dengan nilai yang teramati. Sedangkan model-model agregasi menunjukkan nilai Hosmer-Lemeshow Chi-Square yang signifikan yang menunjukkan bahwa model-model tersebut tidak terlalu baik secara statistik dalam menduga kejadian BBLR. Hal ini juga terlihat dari penurunan nilai R2 yang dihasilkan. Pengecekan asumsi overdispersi hanya relevan pada level BS dan Kab/Kota karena pada level individu, ibu dan rumahtangga datanya didominasi oleh amatan tunggal (Bernoulli). Nilai yang mendekati 1 menunjukkan bahwa tidak ada kondisi overdispersi pada model agregat level BS dan kabupaten/kota. Perbandingan statistik kebaikan model dapat dilihat pada Tabel 4.4. Tabel 4.4. Perbandingan statistik kebaikan model Model Statistik Individu Ibu Rmt. BS Kab/Kota N 15124 13224 12809 1801 459 AIC 4519.63 4791.26 4902.76 7199.45 7684.90 Deviance/df 0.30 0.32 0.33 0.82 1.01 Pearson/df 0.94 0.87 0.83 0.84 0.88 2 R 0.20 0.19 0.18 0.05 0.02 2 Max-rescaled R 0.50 0.47 0.45 0.12 0.05 2 Hosmer-Lemeshow χ 4.93 16.95 42.78 55.76 10.96 2 Pr > χ 0.77 0.03 0.00 0.00 0.20
22 Untuk membandingkan kebaikan model dari tiap-tiap agregasi ukuran yang digunakan adalah luas di bawah kurva (area under curve/AUC) dari ROC. ROC adalah kurva yang menggambarkan hubungan antara kepekaan (proporsi true positive) dan 1 – kekhususan (proporsi false negative) pada setiap nilai dugaan peluang yang dihasilkan dari data sebagai cut-off point. Model yang baik akan menghasilkan ROC dengan luas area dibawah kurva mendekati 1. Dari ROC yang dihasilkan (Gambar 4.4), model individu (AUC = 0.9142), model ibu (AUC = 0.9087) dan model rumahtangga (AUC = 0.9055) memiliki luas area di bawah kurva yang hampir sama dengan akurasi yang tinggi. Hal ini bersesuaian dengan model yang dihasilkan bahwa dugaan parameter model dengan nilai signifikansi yang serupa. Sedangkan pada agregasi level blok sensus (AUC = 0.7505) dan kabupaten/kota (AUC = 0.6525) luas area di bawah kurva yang dihasilkan menurun drastis yang menunjukkan bahwa pendugaan dengan model agregasi blok sensus dan kabupaten/kota sudah tidak akurat lagi.
J(c)
Gambar 4.4. Perbandingan ROC pada tiap level agregasi Untuk dapati membandingkan kepekaan dan spesifitas dari masing-masing model maka perlu dipilih nilai cut-off dimana model akan menghasilkan dugaan terbaik. Penentuan nilai cut-off (c) optimal yang paling umum digunakan adalah statistik J(c) yang diperkenalkan oleh Youden (1950) pada persamaan 4.3. 𝐽(𝑐) = max𝑐 {𝑆𝑒 (𝑐 ) + 𝑆𝑝(𝑐 ) − 1} ; 0 ≤ 𝐽(𝑐) ≤ 1 (4.3) Dengan menggunakan model individu sebagai patokan, hasil penghitungan diperoleh nilai J(c) = 0.7259 dan c = 0.09439. Pada nilai cut off yang sama maka nilai kepekaan dan kekhususan pada tiap-tiap model dapat dibandingkan pada Tabel 4.5.
23 Tabel 4.5. Perbandingan kepekaan dan kekhususan model pada c = 0.09439 Model Indikator Individu Ibu Rumah Tangga Blok Sensus Kab/Kota Kepekaan(c) 0.81 0.80 0.78 0.50 0.36 Kekhususan(c) 0.92 0.91 0.90 0.82 0.82 Hasil perbandingan menunjukkan bahwa kepekaan dan kekhususan cenderung mengalami penurunan seiring proses aggregasi. Proporsi kejadian BBLR yang kecil mengakibatkan penurunan kepekaan model yang lebih drastis dibandingkan penurunan kekhususan yang lebih lambat. Nilai kepekaan yang rendah pada level blok sensus dan kabupaten/kota menunjukkan bahwa model tidak lagi dapat menduga kejadian BBLR dengan baik. Perbandingan Hasil Pemodelan dan Publikasi BPS Pemanfaatan data SDKI yang dilakukan oleh BPS hannya sebatas pendugaan langsung terhadap prevalensi BBLR pada tingkat provinsi (BPS et al. 2013). Dugaan langsung dihitung sesuai desain sampling yang digunakan dan berdasarkan data BBLR saja, sedangkan dugaan tidak langsung dilakukan dengan memperhitungkan faktorfaktor yang mempengaruhi kejadian BBLR melalui pemodelan. Untuk memperbandingkan hasil dugaan tidak langsung dari setiap model dengan dugaan langsung yang dilakukan oleh BPS maka perlu disusun selang kepercayaan untuk masing-masing dugaan. Karena desain survei SDKI yang kompleks, selang pendugaan langsung didekati dengan ragam pendugaan dari rancangan penarikan contoh acak sederhana (simple random sampling/SRS), sedangkan selang pendugaan hasil pemodelan karena tidak dapat diturunkan sebarannya maka didekati dengan diturunkan dari selang pendugaan koefisien parameter (Hosmer & Lemeshow 2000). Secara umum pendugaan tidak langsung (dengan menggunakan model) lebih baik dibandingkan dengan pendugaan langsung. Hal ini dikarenakan dugaan tidak langsung memperhitungkan faktor-faktor lain yang berpengaruh sehingga ragam dari dugaan tidak langsung cenderung lebih kecil (Rao 2003). Secara visual meskipun bervariasi pada tiap provinsi terlihat kecenderungan selang pendugaan tidak langsung yang dihasilkan semakin melebar sejalan dengan agregasi data, tetapi lebarnya tetap cenderung lebih sempit dibandingkan selang pendugaan langsung (Lampiran 1). Pada kasus dimana selang kepercayaan dugaan tidak langsung lebih lebar dibandingkan dengan dugaan langsungnya, hal itu dapat menjadi indikasi adanya permasalahan pada data (sebaran data yang tidak sesuai, pencilan, dll.) maupun dalam pemodelan (link function yang tidak tepat, adanya peubah-peubah bebas yang tidak disertakan, dll.) yang perlu ditindak lanjuti. Perbandingan dugaan prevalensi provinsi untuk masing-masing model dapat dilihat pada Tabel 4.6. Secara umum dugaan prevalensi yang dihasilkan model konsisten dengan dugaan langsung (direct estimate) dari hasil survei. Hal ini ditunjukkan dengan selang pendugaan dari pemodelan yang berpotongan dengan selang pendugaan langsung dari survei (Lampiran 1). Dugaan prevalensi provinsi yang berbeda nyata hanya pada provinsi Sulawesi Tengah (underestimated pada dugaan model individu, ibu, rumah tangga dan blok sensus) dan Sulawesi Tenggara (overestimated pada dugaan model individu, ibu, dan rumah tangga).
24 Tabel 4.6. Perbandingan dugaan prevalensi model terhadap nilai publikasi Dugaan Prevalensi BBLR Provinsi Publikasi Individu Ibu Rmt. BS Kab/Kota Aceh 7.6 8.27 8.46 8.49 8.40 8.68 Sumut 5.0 6.39 6.27 6.28 5.98 5.88 Sumbar 4.9 5.69 5.55 5.48 5.58 5.11 Riau 4.8 6.12 6.02 6.13 5.99 5.33 Jambi 5.6 7.56 7.71 7.74 8.07 8.16 Sumsel 6.7 6.75 6.56 6.74 6.53 6.75 Bengkulu 5.4 6.61 6.57 6.64 6.39 6.40 Lampung 6.6 6.22 6.34 6.44 6.45 5.85 Babel 5.7 6.85 6.90 7.02 6.62 7.00 Kep. Riau 5.8 4.83 4.85 4.78 5.00 5.05 DKI Jakarta 4.7 5.10 5.26 5.33 5.11 5.34 Jabar 6.9 7.28 7.27 7.35 7.62 7.95 Jateng 7.0 6.98 7.09 7.08 6.63 7.27 DIY 9.4 6.68 6.79 6.81 7.09 6.41 Jatim 8.4 8.93 9.18 9.16 9.51 9.02 Banten 8.9 5.84 5.92 5.93 6.25 6.32 Bali 6.8 6.39 6.28 6.44 6.11 6.61 NTB 10.6 10.59 10.65 10.63 10.16 9.82 NTT 15.7 11.20 11.26 11.10 10.03 11.31 Kalbar 8.6 6.47 6.62 6.72 7.41 7.17 Kalteng 5.6 6.62 6.59 6.54 6.42 6.72 Kalsel 7.2 6.61 6.47 6.54 6.74 6.47 Kaltim 5.2 5.84 6.00 5.95 5.96 5.60 Sulut 7.7 9.07 9.28 9.17 9.75 10.07 Sulteng 14.4 9.42 8.83 8.26 8.14 8.25 Sulsel 8.4 9.77 9.80 9.54 9.31 9.47 Sultra 4.8 8.88 8.42 9.43 9.36 9.40 Gorontalo 12.5 10.37 10.05 9.87 10.71 10.30 Sulbar 10.2 8.14 8.49 8.43 8.67 8.70 Maluku 5.7 5.65 5.48 5.46 6.66 5.65 Maluku Utara 7.7 6.96 7.12 7.04 6.93 6.42 Papua Barat 9.1 9.40 9.57 9.33 9.06 9.15 Papua 7.2 7.33 7.41 7.45 7.50 7.28 Tebal = selang pendugan model tidak berpotongan dengan selang pendugaan langsung Hal ini menunjukkan bahwa model yang dihasilkan tidak dapat menjelaskan dengan baik fenomena BBLR pada kedua provinsi tersebut. Dari eksplorasi data juga terlihat bahwa nilai dugaan prevalensi BBLR hasil SDKI pada provinsi Sulawesi Tengah yang sangat tinggi (urutan kedua tertinggi) dan Sulawesi Tenggara yang sangat rendah (urutan kedua terendah) sedangkan level IPM kedua daerah pada level sedang. Oleh karena itu perlu diidentifikasi lebih lanjut faktor-faktor lain apakah yang berpengaruh terhadap kejadian BBLR pada kedua provinsi tersebut.
25
5 SIMPULAN DAN SARAN Simpulan Faktor-faktor risiko yang mempengaruhi kejadian BBLR adalah bayi kembar, anak pertama, kelahiran dengan jarak kurang dari 2 tahun, kelahiran prematur dan komplikasi kehamilan, umur ibu di atas 35 tahun, pendidikan ibu yang rendah, kesejahteraan rumah tangga yang rendah, pekerjaan ibu yang bersifat non fisik dan sumber air minum yang tidak terlindung, sedangkan peubah area yang berpengaruh adalah tingkat pendidikan (AMH) dan kesejahteraan (pengeluaran per kapita) suatu daerah. Perbedaan akurasi (rataan) pada kelompok data berdasarkan catatan dan ingatan ibu dapat dijelaskan oleh peubah-peubah bebas yang disertakan di dalam model, sedangkan perbedaan ragamnya cukup nyata, sehingga penyertaan informasi perbedaan ragam dalam model mampu meningkatkan kebaikan model. Dalam proses agregasi, pengaruh suatu kategori terhadap kejadian BBLR mengalami distorsi karena pengaruhnya tercampur dengan kategori-kategori lainnya dalam peubah yang sama. Distorsi pengaruh dan menurunnya jumlah amatan mengakibatkan kebaikan model pada level blok sensus dan kabupaten/kota menurun drastis. Berdasarkan model yang dihasilkan pemodelan kejadian BBLR yang baik dapat dilakukan hingga level rumah tangga saja. Selang kepercayaan dari dugaan prevalensi BBLR semakin melebar sejalan dengan proses agregasi akan tetapi cenderung lebih sempit jika dibandingkan selang pendugaan dari dugaan langsung. Namun dugaan yang dihasilkan oleh masing-masing model cukup konsisten (cenderung tidak berbeda) dengan hasil dugaan langsung. Hanya dugaan prevalensi BBLR Sulawesi Tengah (underestimated) dan Sulawesi Tenggara (overestimated) yang berbeda secara nyata. Saran Untuk mengkaji faktor-faktor risiko dan hubungannya terhadap kejadian BBLR, peubah-peubah proxy tidak perlu disertakan dalam model karena pengaruhnya dapat menyamarkan pengaruh dari faktor-faktor risiko yang diteliti. Faktor-faktor lain di luar dari yang sudah dimodelkan perlu diteliti lagi untuk meningkatkan akurasi model dan dapat menjelaskan kejadian BBLR pada daerah-daerah yang dugaannya berbeda nyata. Pada level agregat penambahan peubah-peubah bebas yang bersifat area dan pengaruh spasial perlu dilakukan untuk memperbaiki kebaikan model. Beberapa kategori menjadi signifikan pengaruhnya ketika diagregasi sehingga perlu dikaji lebih lanjut. Pendugaan pada level kabupaten/kota dengan Small Area Estimation maupun pendugaan pada periode-periode dimana SDKI tidak dilaksanakan dapat dikembangkan dari model yang dihasilkan tersebut.
26
DAFTAR PUSTAKA Aitken AC. 1935. On Least Squares and the Linear Combination of Observations. Proceedings of the Royal Society of Edinburgh, 55: 42-48. Arpansah. 2010. Analisis Faktor yang Berhubungan dengan Berat Bayi Lahir dan Pengaruhnya terhadap Status Gizi Anak Usia 6-11 Bulan di Sumatera [tesis]. Bogor (ID). IPB. Akaike H. 1973. Information Theory and an Extension of the Maximum Likelihood Principle. Proceedings of 2nd International Symposium on Information Theory. 267-281. Azen R, Walker CM. 2011. Categorical Data Analysis for the Behavioral and Social Sciences. New York (US). Routledge Bloom D, Canning D, Sevilla J. 2003. The Demographic Dividend: A New Perspective on the Economic Consequences of Population Change. Santa Monica, CA (US): RAND Corporation. Barker DJP. 1995. The Fetal and Infant Origins of Disease. European Journal of Clinical Investigation. 25: 457-463. [BPS] Badan Pusat Statistik, [BKKBN] Badan Kependudukan dan Keluarga Berencana Nasional, Kementerian Kesehatan, ICF International. 2013. Indonesia Demographic and Health Survey 2012. Jakarta (ID). BPS. Dobson AJ. 2002. An Introduction to Generalized Linear Models. Ed ke-2. New York (US). Chapman & Hall/CRC. Gonçalves L, Subtil A, Oliviera MR, Bermudez PdZ. 2014. ROC Curve Estimation: An Overview. REVSTAT –Statistical Journal 12(1): 1-20. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. Ed ke-2. New York (US). John Wiley & Sons, Inc. Hutcheon JA, Walker M, Platt RW. 2010. Assessing the Value of Customized Birth Weight Percentiles. American Journal of Epidemiology. 173(4): 459-467. Kawengian SES. 2004. Pola Pertambahan Berat Badan Ibu selama Kehamilan dan Kaitannya dengan Berat Badan Bayi Lahir di Kota Manado [tesis]. Bogor (ID). IPB. Kramer MS. 1987. Determinants of Low Birth Weight: Methodological Assessment and Meta-Analysis. Bulletin of World Health Organization. 65(5): 663–737. Nelder JA, Wedderburn RWM. 1972. Generalized Linear Models. Journal of the Royal Statistical Society, A, 135, 370-384. Puspitasari ZD. 2011. Identifikasi Faktor-Faktor yang Mempengaruhi Berat Bayi Lahir Rendah (BBLR) Menggunakan Pendekatan Regresi Logistik Biner: Studi Kasus Puskesmas Kecamatan Klakah - Lumajang, Jawa Timur [skripsi]. Bogor (ID). IPB. Rao JNK. 2003. Small Area Estimation. New Jersey (US): John Wiley and Sons, Inc. Scheaffer RL, Mendenhall W, Ott RL, Gerow KG. 2006. Elementary Survey Sampling. Ed. ke-6. Belmont, CA (US). Duxbury Press Setyowati T, Soesanto SS, Budiarso LR, Kristanti, Djaja S, Ma’roef S. 1996. Faktorfaktor yang Mempengaruhi Bayi Lahir dengan Berat Badan Rendah (Analisa data SDKI 1994). Bulletin Penelitian Kesehatan. 24(2&3): 38-54
27 Sianturi AHD 2005. Kajian Status Gizi Ibu Hamil dan Faktor-faktor yang Mempengaruhinya serta Hubungannya dengan Berat Badan Bayi Lahir di Kecamatan Warungkondang, Cianjur, Jawa Barat [tesis]. Bogor (ID). IPB. [UN] United Nations. 2004. World Population to 2300. New York (US). United Nations. _________________. 2014. The Millennium Development Goals Report 2014. New York (US). United Nations. [UNICEF] United Nations Children’s Fund, [WHO] World Health Organization. 2004. Low Birth Weight: Country, Regional and Global Estimates. New York (US). UNICEF. [WHO] World Health Organization. 2011. International Statistical Classification of Diseases and Health Related Problems. Ed ke-10. Geneva (CH). WHO. ___________________________. 2014. Global Nutrition Targets 2025: Low Birth Weight Policy Brief. Geneva (CH). WHO. Yongky. 2007. Analisis Pertambahan Berat Badan Ibu Hamil Berdasarkan Status Sosial Ekonomi dan Status Gizi serta Hubungannya dengan Berat Bayi Baru Lahir [disertasi]. Bogor (ID). IPB. Youden WJ. 1950. Index for rating diagnostic test. Cancer 3:32-35.
28
29 Lampiran 1. Perbandingan dugaan prevalensi BBLR provinsi dan selang kepercayaannya pada tiap model terhadap dugaan langsung (α = 5%)
30 Lampiran 1. (lanjutan)
31 Lampiran 1. (lanjutan)
32
RIWAYAT HIDUP Penulis dilahirkan di Klaten, Jawa Tengah pada tanggal 11 April 1982 sebagai putra kedua dari lima bersaudara dari pasangan Henricus Suyamto dan Maria Immaculatta Marilah. Pada tahun 2014 penulis menikah dengan Cicilia Widyasari dan saat ini sudah dikaruniai seorang putra Tadeus Dhirajati Bratamandala. Penulis menyelesaikan pendidikan menengah di SMU Negeri 1 Klaten pada tahun 2000 dan melanjutkan pendidikan di Perguruan Tinggi Kedinasan Sekolah Tinggi Ilmu Statistik (STIS) Jakarta dan menyelesaikan pendidikan pada jurusan Statistika dengan peminatan Statistika Ekonomi pada tahun 2004. Setelah menyelesaikan pendidikan penulis ditugaskan di Badan Pusat Statistik (BPS) Kabupaten Maluku Tenggara, Provinsi Maluku pada tahun 2004-2011. Pada tahun 2011 penulis mengajukan mutasi ke BPS Kabupaten Sleman dan masih berstatus sebagai staf aktif di BPS Kabupaten Sleman, Provinsi D. I. Yogyakarta hingga saat ini. Penulis memperoleh kesempatan melanjutkan studi S2 pada program studi Statistika Terapan di Sekolah Pascasarjana IPB pada tahun 2013 melalui program beasiswa dari APBN Badan Pusat Statistik.