ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI BERAT BADAN BAYI SAAT LAHIR DI KOTA SURAKARTA MENGGUNAKAN METODE POHON REGRESI
perpustakaan.uns.ac.id
digilib.uns.ac.id
oleh NINA HARYATI M0107040
SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar commit to user Sarjana Sains Matematika
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2012
i
SKRIPSI
ANALISIS T'AKTOR-FAKTOR YANG MEMPENGARUI{I BERAT BADAI\I BAYI SAAT LAHIR DI KOTA ST]RAKARTA MENGGUNAKAI\I METODE POHON REGRESI yang disiapkan dan disusun oleh
NINA HARYATI perpustakaan.uns.ac.id
M0107040
digilib.uns.ac.id
dibimbing oleh Pembimbing I, fi
(/Jt^h Winita Sulandari" M.Si
NIP. 19780814 200501 2 aaz
NIP.
telah dipertahankan di depan Dewan Penguji pada hari Kamis tanggal
26}uli2012
dan dinyatakan telah memenuhi syarat
Anggota Tim Penguji
Tanda T
1. Dra. Yuliana Susanti, M.Si }.IIP. 1961r2L9 198703 2 001 2. Drs. Siswanto. M.Si
70813 199203 1002 commit to user
Surakart4 I 7 Septemb er 2Al2
dan Ilmu Pengetahuan Alam an Matematika
Irwan Susanto. S.Si.. DEA NrP. 19610223 198601 1001
NIP. 19710511 t995n
I aal
ABSTRAK Nina Haryati, 2012. ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI BERAT BADAN BAYI SAAT LAHIR DI KOTA SURAKARTA MENGGUNAKAN METODE POHON REGRESI. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret. Di Surakarta, kita masih sering menjumpai bayi lahir dengan Berat Badan perpustakaan.uns.ac.id digilib.uns.ac.idberat badan bayi saat Lahir Rendah (BBLR). Beberapa faktor yang mempengaruhi lahir adalah usia ibu hamil, jarak kehamilan, jumlah anak yang dilahirkan, kenaikan berat badan ibu, penyakit saat kehamilan, kadar hemoglobin, frekuensi pemeriksaan kehamilan, status pekerjaan ibu dan pendidikan ibu. Dalam penelitian ini, kami membahas tentang pola hubungan antara variabel prediktor dan variabel respon menggunakan metode pohon regresi. Metode ini dipilih karena berat badan bayi saat lahir sebagai variabel respon bertipe kontinu sedangkan faktor-faktor yang berpengaruh terhadap berat badan bayi saat lahir sebagai variabel prediktor bertipe kategorik maupun kontinu. Data secara random dibagi menjadi 2 bagian yaitu data pelatihan dan data uji dengan proporsi data pelatihan sebesar 90% dan data uji sebesar 10%. Proses ini diulang sebanyak 10 kali sehingga diperoleh 10 kelompok data percobaan. Masing-masing kelompok data digunakan untuk membentuk pohon regresi. Langkah pertama adalah penumbuhan pohon menggunakan data pelatihan. Langkah kedua adalah proses pemberhentian pembentukan pohon. Langkah ketiga adalah proses pemangkasan pohon. Langkah keempat adalah proses pemilihan pohon regresi optimal menggunakan data uji. Langkah terakhir adalah pemilihan pohon regresi optimal dari 10 kelompok data percobaan. Berdasarkan pohon regresi optimal, terbentuk pola hubungan antara tiga variabel prediktor terhadap berat badan bayi saat lahir. Adapun tiga variabel yang membentuk pola hubungan adalah variabel usia ibu hamil, kenaikan berat badan ibu, dan status pekerjaan ibu. Kata kunci: pohon regresi, BBLR, kontinu, kategorik commit to user
iii
ABSTRACT Nina Haryati, 2012. ANALYSIS OF FACTORS AFFECTING BIRTH WEIGHT BABIES IN THE CITY OF SURAKARTA USING REGRESSION TREE METHOD. Faculty of Mathematics and Natural Sciences, Sebelas Maret University. In Surakarta, we still often see babies born with Low Birth Weight (LBW). digilib.uns.ac.id Several factorsperpustakaan.uns.ac.id that affect the newborn weight are maternal age, pregnancy spacing, number of children born, maternal weight gain, illness during pregnancy, hemoglobin level, frequency of prenatal care, maternal employment status and maternal education. In this research, we discussed about patterns of relationships between predictor and response variables using regression tree method. This method was chosen because the newborn weight as response variable is continuous and the factors that affect newborn weight as predictor variables are categorical or continuous. Data were randomly divided into two parts, namely training data and test data with the proportion of 90% training data and test data by 10%. This process was repeated 10 times to get 10 data sets. Each data sets is used to perform regression tree. The first step is tree growing process using training data. The second step is stopping the tree building process. The third step is pruning the tree. The fourth step is selection of optimal regression tree using the test data. The final step is the selection of optimal regression tree of 10 data sets. Based on optimal regression tree we can find the relationship pattern between three predictor variables and newborn weight. The three variables are maternal age, maternal weight gain, and employment status mother. Key words: regression tree, LBW, continuous, categorical
commit to user
iv
MOTO
perpustakaan.uns.ac.id
digilib.uns.ac.id
“Dan segala sesuatu telah Kami terangkan dengan jelas” (Q.S. Al-Israa’: 12) “Dan katakanlah: Ya Tuhanku, tambahkanlah kepadaku ilmu pengetahuan” (Q.S. Thaahaa: 114)
commit to user
v
PERSEMBAHAN
Karya ini kupersembahkan kepada: perpustakaan.uns.ac.id
digilib.uns.ac.id
“Bapak, Ibu, Kakak dan Adik yang telah memberikan amanah, harapan dan kepercayaan untuk mewujudkan cita-citaku. Senyum dan kebahagiaan kalian adalah semangat hidupku”
commit to user
vi
KATA PENGANTAR
Segala puji bagi Allah atas limpahan rahmat, hidayah serta nikmat kesehatan jasmani dan rohani sehingga penulis dapat menyelesaikan skripsi ini. Keberhasilan penulisan skripsi ini tidak lepas dari bimbingan, kerjasama, serta bantuan dari berbagai pihak sehingga dalam kesempatan ini penulis mengucapkan perpustakaan.uns.ac.id
digilib.uns.ac.id
terima kasih kepada 1. Ibu Winita Sulandari, M.Si sebagai dosen Pembimbing I yang telah memberikan bimbingan, nasehat, kritik dan saran kepada penulis selama menyelesaikan skripsi ini. 2. Bapak Drs. Muslich, M.Si sebagai dosen Pembimbing II yang telah memberikan bimbingan, perbaikan dan saran dalam penulisan skripsi ini. 3. Ibu-ibu kader posyandu dan ibu-ibu yang memiliki balita yang telah membantu penulis dalam mengumpulkan data. 4. Teman-teman di Jurusan Matematika FMIPA UNS angkatan 2007, temanteman di Wisma Linaya dan Novita Anggraeni yang telah membantu dan memberi semangat kepada penulis selama menyelesaikan skripsi ini. 5. Mbak Putri dan Sony Arjanggi di ITS yang telah membantu penulis dalam mencari referensi. Semoga skripsi ini bermanfaat bagi pihak yang berkepentingan.
Surakarta, Juli 2012 commit to user
Penulis
vii
DAFTAR ISI
HALAMAN JUDUL ......................................................................................
i
HALAMAN PENGESAHAN ..........................................................................
ii
ABSTRAK ......................................................................................................
iii
ABSTRACT .......................................................................................................
iv
MOTO .............................................................................................................. perpustakaan.uns.ac.id digilib.uns.ac.id
v
PERSEMBAHAN ............................................................................................
vi
KATA PENGANTAR .....................................................................................
vii
DAFTAR ISI ....................................................................................................
viii
DAFTAR TABEL ............................................................................................
x
DAFTAR GAMBAR .......................................................................................
xi
DAFTAR NOTASI ..........................................................................................
xii
BAB I
BAB II
PENDAHULUAN ......................................................................
1
1.1 Latar Belakang Masalah ........................................................
1
1.2 Rumusan Masalah .................................................................
2
1.3 Tujuan Penelitian ..................................................................
2
1.4 Manfaat Penulisan .................................................................
3
LANDASAN TEORI ..................................................................
4
2.1 Tinjauan Pustaka ...................................................................
4
2.1.1 Variabel yang berpengaruh terhadap Berat Badan Bayi Saat Lahir ...........................................................
5
user 2.1.2 Classification commit AndtoRegression Trees (CART) ............
8
2.1.3 Struktur CART ............................................................
9
2.1.4 Pemilahan Rekursif Biner ...........................................
10
2.1.5 Metode Pohon Regresi................................................
11
2.1.6 Langkah Kerja Pembentukan Pohon Regresi .............
13
a. Aturan Pemilahan dalam Pohon Regresi ...............
13
b. Aturan Penumbuhan Pohon dan Kriteria Pemilah Terbaik .....................................................
viii
14
BAB III
BAB IV
c. Pemberhentian Pemilahan Pohon ..........................
15
d. Pemangkasan Pohon Regresi .................................
15
e. Penentuan Ukuran Pohon Regresi Optimal ...........
18
f. Penduga Kesalahan Standar...................................
18
2.2 Kerangka Pemikiran ..............................................................
23
METODE PENELITIAN ............................................................
24
3.1 Sumber Data .......................................................................... perpustakaan.uns.ac.id digilib.uns.ac.id
24
3.2 Analisis Data .........................................................................
25
HASIL DAN PEMBAHASAN ...................................................
27
4.1 Statistik Deskriptif ................................................................
27
4.2 Analisis Pohon Regresi .........................................................
31
4.2.1 Pembentukan Pohon Regresi Maksimal.......................
31
4.2.2 Pemangkasan Pohon Regresi Maksimal ......................
37
4.2.3 Pohon Regresi Optimal ................................................
40
4.2.4 Pemilihan Pohon Regresi dari Kelompok Data Percobaan .....................................................................
48
PENUTUP ...................................................................................
49
5.1 Kesimpulan ...........................................................................
49
5.2 Saran ......................................................................................
50
DAFTAR PUSTAKA ......................................................................................
51
LAMPIRAN .....................................................................................................
53
BAB V
commit to user
ix
DAFTAR TABEL
Tabel 3.1
Variabel Prediktor dari Berat Badan Bayi Saat Lahir .................
Tabel 4.1
Statistik Deskriptif Berat Badan Bayi Saat Lahir, Umur Ibu Hamil dan Kenaikan Berat Badan Ibu…. ...................................
Tabel 4.2
21
24
Selisih Jumlah Kuadrat Deviasi dari Semua Kemungkinan Pemilahan .................................................................................... perpustakaan.uns.ac.id digilib.uns.ac.id
30
Tabel 4.3
Data Berat Badan Bayi pada Simpul Terminal ...........................
34
Tabel 4.4
Selisih Jumlah Kuadrat Deviasi pada Proses Pemangkasan Pertama .......................................................................................
36
Tabel 4.5
Data Uji ......................................................................................
37
Tabel 4.6
Nilai Kesalahan Relatif Penduga Sampel Uji .............................
38
Tabel 4.7
Perhitungan
...........................................................................
39
Tabel 4.8
Perhitungan
...........................................................................
40
Tabel 4.9
Pohon Regresi dari Kelompok Data Percobaan ..........................
43
commit to user
x
DAFTAR GAMBAR
Gambar 2.1
Bentuk CART .......................................................................
9
Gambar 2.2
Proses Partisi .......................................................................
11
Gambar 2.3
Pohon Regresi T...................................................................
16
Gambar 2.4
Cabang
16
Gambar 2.5
Pohon Regresi perpustakaan.uns.ac.id
......................................................... digilib.uns.ac.id
16
Gambar 4.1.(a)
Diagram Batang Pendidikan Ibu ..........................................
25
Gambar 4.1.(b)
Diagram Batang Jumlah Anak yang Dilahirkan ..................
25
Gambar 4.2.(a)
Diagram Lingkaran Jarak Kehamilan ..................................
26
Gambar 4.2.(b)
Diagram Lingkaran Penyakit Saat Kehamilan ....................
26
Gambar 4.3.(a)
Diagram Lingkaran Ibu Menderita Anemia.........................
27
Gambar 4.3.(b)
Diagram Lingkaran Frekuensi Pemeriksaan Kehamilan .....
27
Gambar 4.3.(c)
Diagram Status Pekerjaan Ibu..............................................
27
Gambar 4.4
Pemilah Pertama ..................................................................
32
Gambar 4.5
Model Pohon Regresi Maksimal .........................................
33
Gambar 4.6
Pohon Regresi Optimal ........................................................
41
...........................................................................
commit to user
xi
DAFTAR NOTASI : variabel prediktor : variabel respon : ruang pengukuran variabel prediktor : ruang pengukuran variabel respon : simpul perpustakaan.uns.ac.id
digilib.uns.ac.id
: jumlah data : penduga respon : data pelatihan
: jumlah data uji : harapan kuadrat kesalahan : harapan kuadrat kesalahan relatif : variansi dari
dan harapan kuadrat kesalahan menggunakan
nilai : kesalahan penduga sampel uji : kesalahan relatif penduga sampel uji : pohon (biner) : cabang dari
dengan simpul akar
: pohon maksimal : jumlah kuadrat deviasi dan penduga pengganti pada simpul : jumlah kuadrat pohon regresi dan penduga pengganti dari : pemilah
commit to user
: kumpulan pemilah biner : selisih jumlah kuadrat deviasi : pendugaan respon dari pengamatan ke
pada pohon ke-
: kesalahan penduga sampel uji dari penduga respon : kesalahan relatif penduga sampel uji dari penduga respon : penduga kesalahan standar dari
xii
11
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah Gambaran tentang status gizi bayi baru lahir dapat dilihat dari angka berat badan saat lahir. Berdasarkan laporan Dinas Kesehatan Kota Surakarta (2010) pada tahun 2009, Angka Kematian Bayi (AKB) di kota Surakarta perpustakaan.uns.ac.id digilib.uns.ac.id sebesar 5,67 per seribu kelahiran hidup. Angka tersebut mengalami peningkatan jika dibandingkan dengan AKB tahun 2008 sebesar 3,63 per seribu kelahiran hidup. Seperti dikutip dalam http://bataviase.co.id salah satu penyebabnya adalah bayi dengan Berat Badan Lahir Rendah (BBLR). Menurut Dinas Kesehatan Kota Surakarta (2010) terjadi peningkatan angka BBLR pada tahun 2008 sebesar 1,30% menjadi 1,60% pada tahun 2009. Menurut Jaya (2009) dan Siza (2008) terdapat beberapa faktor yang mempengaruhi berat badan bayi saat lahir yaitu faktor internal yang terdiri dari usia ibu hamil, jarak kehamilan, paritas (jumlah anak yang dilahirkan), status gizi ibu hamil (kenaikan berat badan ibu sejak hamil sampai melahirkan), penyakit saat kehamilan, kadar hemoglobin (ibu menderita anemia atau tidak), frekuensi pemeriksaan kehamilan, serta faktor eksternal yang terdiri dari status pekerjaan ibu dan pendidikan ibu. Yuliana (2007) melakukan penelitian tentang pengaruh antara Lingkar Lengan Atas (LLA) dan kadar hemoglobin terhadap berat bayi saat lahir menggunakan regresi linear sederhana. Hasil penelitian menunjukkan bahwa ada pengaruh positif antara kadar hemoglobin terhadap berat bayi saat lahir. commit to user Pengetahuan antara berat badan bayi saat lahir dengan faktor-faktor yang
mempengaruhinya menjadi hal penting untuk menanggulangi masalah BBLR. Hubungan tersebut bukan hanya berasal dari satu faktor saja, tetapi dapat berasal dari faktor lain yang mempengaruhinya. Apabila pola hubungan itu dapat diketahui, langkah-langkah yang diambil dapat lebih terarah. Metode Classification and Regression Trees (CART) dapat digunakan untuk mengetahui pola hubungan tersebut. Metode CART merupakan pendekatan untuk regresi nonparametrik yang dikembangkan oleh Breiman et al. (1993). Metode CART mempunyai beberapa
1
2
kelebihan dibandingkan dengan metode regresi biasa yaitu variabel-variabel dalam CART tidak bergantung pada asumsi-asumsi seperti pada regresi biasa sehingga CART termasuk dalam metode statistik nonparametrik, variabel-variabel prediktor dalam CART dapat bertipe kategorik (nominal dan ordinal) maupun bertipe kontinu, interpretasi dari pohon yang dihasilkan oleh CART sangat mudah dipahami karena hasilnya berupa diagram pohon (Lewis and Roger, 2000). Metode CART terdiri dari 2 analisis yaitu pohon klasifikasi dan pohon regresi. Menurut perpustakaan.uns.ac.id digilib.uns.ac.id Komalasari (2007) dan Soni (2010) CART menghasilkan pohon klasifikasi jika variabel respon yang dimiliki bertipe kategorik sedangkan jika variabel respon yang dimiliki bertipe kontinu maka CART akan menghasilkan pohon regresi. Damayanti (2011) melakukan penelitian tentang aplikasi algoritma CART yaitu metode pohon klasifikasi pada Asuransi Bumiputera untuk mengklasifikasikan data nasabah. Berdasarkan uraian tersebut, karena berat badan bayi saat lahir sebagai variabel respon yang bertipe kontinu sedangkan faktor-faktor yang mempengaruhi berat badan bayi saat lahir sebagai variabel prediktor mempunyai tipe variabel yang berbeda-beda sehingga peneliti akan membentuk pohon regresi dari berat badan bayi saat lahir dengan menggunakan metode pohon regresi untuk mengetahui pola hubungan antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat lahir di kota Surakarta.
1.2 Perumusan Masalah Berdasarkan uraian dalam latar belakang masalah, dapat dirumuskan permasalahan bagaimana pola hubungan antara variabel-variabel yang berpengaruh to user terhadap berat badan bayi saat lahir commit di kota Surakarta menggunakan metode pohon
regresi.
1.3 Tujuan Penelitian Berdasarkan perumusan masalah maka tujuan dari penelitian ini adalah untuk mengetahui pola hubungan antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat lahir di kota Surakarta.
3
1.4 Manfaat Penelitian Manfaat yang dapat diperoleh dari penelitian ini adalah memberikan informasi kepada pemerintah khususnya pemerintah kota Surakarta dalam mengurangi terjadinya BBLR sebagai salah satu penyebab kematian bayi.
perpustakaan.uns.ac.id
digilib.uns.ac.id
commit to user
444
BAB II LANDASAN TEORI
2.1 Tinjauan Pustaka Metode CART dikembangkan oleh Breiman et al. sekitar tahun 1980. Seiring perkembangan ilmu pengetahuan, metode CART diterapkan dalam berbagai bidang penelitian. Pada tahun 2007 Komalasari melakukan digilib.uns.ac.id penelitian di bidang pertanian perpustakaan.uns.ac.id untuk eksploratori penciri tingkat pendapatan usaha tani di Jawa Timur pada tahun 2004 menggunakan metode pohon regresi dengan bantuan software SPSS Answer Tree Versi 2.a. Banerjee et al. (2008) melakukan penelitian di bidang biologi menggunakan analisis CART untuk memperoleh variabel penting dari parameter yang berpengaruh terhadap fleksibilitas rata-rata protein keluarga kinase CaMK. Pada tahun 2011, Damayanti melakukan penelitian tentang aplikasi algoritma CART yaitu metode pohon klasifikasi pada Asuransi Jiwa Bersama Bumiputera untuk mengklasifikasikan data nasabah. Pada penelitian ini akan diterapkan metode pohon regresi dalam bidang kesehatan untuk mengetahui pola hubungan faktor-faktor yang berpengaruh terhadap berat badan bayi saat lahir di kota Surakarta. Penelitian sebelumnya tahun 2007 dalam bidang kesehatan Yuliana meneliti tentang pengaruh antara LLA dan kadar hemoglobin terhadap berat bayi lahir menggunakan regresi linear sederhana. Hasil penelitian menunjukkan bahwa ada pengaruh antara kadar Hb terhadap berat bayi lahir. Berat badan bayi saat lahir bukan hanya dipengaruhi oleh satu faktor saja tetapi dapat dipengaruhi oleh banyak faktor. Penggunaan analisis commit to user regresi linear sederhana dalam menganalisis faktor-faktor yang berpengaruh terhadap
berat badan bayi saat lahir akan bergantung pada banyak asumsi, sehingga untuk memenuhi semua asumsi menjadi sangat sulit. Oleh karena itu, dilakukan penelitian untuk menganalisis faktor-faktor yang mempengaruhi berat badan bayi saat lahir di kota Surakarta dengan menerapkan metode pohon regresi.
4
5
2.1.1
Variabel yang berpengaruh terhadap Berat Badan Bayi Saat Lahir
Berat badan bayi saat lahir merupakan hasil interaksi dari berbagai faktor melalui suatu proses yang berlangsung selama berada dalam kandungan. Menurut Pudjiadi (Yuliana, 2007) pada umumnya bayi dilahirkan setelah dikandung kurang lebih 40 minggu dalam rahim ibu. Secara umum berat badan bayi lahir yang normal adalah antara 3000 sampai 4000 gram, dan bila di bawah atau kurang dari 2500 gram dikatakan BBLR. perpustakaan.uns.ac.id Menurut Jaya (2009) dan Siza (2008) terdapat faktor-faktor yang digilib.uns.ac.id mempengaruhi berat badan bayi saat lahir, yaitu 1. Faktor internal: a. Usia ibu hamil Usia ibu erat kaitannya dengan berat bayi lahir. Kehamilan dibawah umur 20 tahun merupakan kehamilan beresiko tinggi 2-4 kali lebih tinggi dibandingkan dengan kehamilan pada wanita yang cukup umur. Meskipun kehamilan di bawah umur sangat beresiko tetapi kehamilan di atas usia 35 tahun juga tidak dianjurkan karena dalam proses persalinan, kehamilan di usia lebih akan menghadapi kesulitan akibat lemahnya kontraksi rahim serta sering timbul kelainan pada tulang panggul tengah. Faktor usia memegang peranan penting terhadap derajat kesehatan dan kesejahteraan ibu hamil serta bayi, maka perencanaan kehamilan yang baik dilakukan pada usia antara 20-30 tahun. b. Jarak kehamilan Menurut anjuran yang dikeluarkan oleh Badan Koordinasi Keluarga Berencana Nasional (BKKBN), jarak kehamilan yang ideal adalah 2 tahun commit to user atau lebih, karena jarak kelahiran yang pendek akan menyebabkan seorang
ibu belum cukup untuk memulihkan kondisi tubuhnya setelah melahirkan sebelumnya. c. Paritas Paritas secara luas mencakup jumlah kehamilan, jumlah kelahiran, dan jumlah keguguran sedangkan dalam arti sebenarnya yaitu jumlah atau banyaknya anak yang dilahirkan. Paritas dikatakan tinggi apabila seorang ibu melahirkan anak empat atau lebih. Seorang wanita yang sudah mempunyai tiga anak dan
6
terjadi kehamilan lagi keadaan kesehatannya mulai menurun dan sering mengalami kurang darah, terjadi pendarahan lewat jalan lahir, dan letak bayi yang sungsang ataupun melintang. d. Status gizi ibu hamil Menurut Almaiser (Yuliana, 2007) status gizi ibu hamil berarti keadaan tubuh sebagai akibat konsumsi makanan dan penggunaan zat-zat gizi sewaktu hamil. Status gizi ibu pada waktu pembuahandigilib.uns.ac.id dan selama hamil sangat perpustakaan.uns.ac.id mempengaruhi pertumbuhan janin dalam kandungan ibu hamil, apabila gizi ibu buruk sebelum dan selama kehamilan maka akan menyebabkan BBLR. Status gizi ibu hamil dapat diketahui melalui kenaikan berat badan ibu sejak awal kehamilan sampai melahirkan. Bertambahnya umur kehamilan biasanya disertai dengan pertambahan berat badan yang sesuai. Pertambahan berat badan ibu yang tidak normal dapat menyebabkan terjadinya keguguran, prematur, BBLR, gangguan pada rahim dan perdarahan setelah melahirkan. e. Penyakit saat kehamilan Penyakit pada saat kehamilan yang dapat mempengaruhi berat bayi lahir diantaranya adalah Diabetes Mellitus, cacar air, dan penyakit infeksi TORCH (Toxsoplasma, Rubella, Cytomegalovirus dan Herpes). Pada ibu hamil yang menderita Diabetes Mellitus biasanya akan melahirkan bayi dengan ukuran yang lebih besar dan lebih berat daripada bayi normal. Seorang ibu hamil yang menderita penyakit cacar air berarti ibu tersebut telah terserang virus Varicella Zooster. Jika tidak ditangani secara cepat dan tepat, penyakit ini user mendatangkan masalah. Jika commit ibu tohamil terjangkit cacar air akan menambah
risiko pada janin yaitu kematian janin atau sindroma Varicella Kongenital berupa kelainan bentuk dan saraf yang parah sehingga bayi mengalami retardasi mental, bayi lahir prematur. Ibu dengan cacar air dapat mengalami komplikasi berupa radang otak atau radang paru bahkan dapat menyebabkan kematian. Penyakit TORCH adalah suatu istilah jenis penyakit infeksi yaitu Toxsoplasma, Rubella, Cytomegalovirus dan Herpes. Keempat jenis penyakit ini sama bahayanya bagi ibu hamil yaitu dapat mengganggu janin yang
7
dikandungnya, seperti terkena katarak mata, tuli, gangguan pertumbuhan organ tubuh, serta mengakibatkan berat bayi tidak normal. f. Kadar hemoglobin Hemoglobin adalah parameter yang digunakan secara luas untuk menetapkan anemia. Anemia kehamilan disebabkan karena berkurangnya cadangan besi untuk kebutuhan janin. Kadar hemoglobin sangat berpengaruh terhadap berat bayi yang perpustakaan.uns.ac.id dilahirkan. Ibu hamil yang terserang anemia karena hemoglobin digilib.uns.ac.id yang rendah dapat membahayakan ibu hamil dan juga mengganggu pertumbuhan dan perkembangan serta dapat membahayakan jiwa janin. g. Frekuensi pemeriksaan kehamilan Pemeriksaan kehamilan harus dilakukan secara berkala. Pemeriksaan kehamilan bertujuan untuk mengetahui dan mengidentifikasi masalah yang timbul selama kehamilan, sehingga kesehatan selama kehamilan dapat dipelihara dan yang terpenting ibu dan bayi dalam kandungan akan baik dan sehat sampai saat persalinan. Masalah gizi dan kesehatan pada ibu hamil dapat ditanggulangi dengan pemeriksaan kehamilan yang rutin setiap satu bulan sekali sehingga gangguan/kelainan pada ibu hamil dan bayi yang dikandung dapat segera ditangani oleh tenaga kesehatan. 2. Faktor eksternal: a. Status pekerjaan ibu Pekerjaan fisik banyak dihubungkan dengan peranan seorang ibu yang mempunyai pekerjaan tambahan diluar pekerjaan rumah tangga dalam upaya commit to user meningkatkan pendapatan keluarga. Beratnya pekerjaan ibu selama kehamilan
dapat menimbulkan terjadinya prematuritas karena ibu tidak dapat beristirahat dan hal tersebut dapat mempengaruhi janin yang sedang dikandung. Ibu yang bekerja cenderung memiliki sedikit waktu istirahat sehingga berisiko terjadinya komplikasi kehamilan, seperti terlepasnya plasenta yang secara langsung berhubungan dengan BBLR (Sistiarani, 2008).
8
b. Pendidikan ibu Pendidikan mempengaruhi kehamilan khususnya terhadap kejadian bayi dengan berat badan lahir rendah. Hal ini dikaitkan dengan pengetahuan ibu dalam memelihara kondisi kehamilan serta upaya mendapatkan pelayanan dan pemeriksaan kesehatan selama kehamilan (Sistiarani, 2008). Seorang ibu hamil dengan tingkat pendidikan yang lebih tinggi akan lebih mudah meyerap informasi perpustakaan.uns.ac.id dan menerapkannya dalam sikap dan perilaku sehari-hari, digilib.uns.ac.id khususnya dalam hal kesehatan dan gizi. Pengetahuan antara berat badan bayi saat lahir dengan faktor-faktor yang mempengaruhinya menjadi hal penting untuk menanggulangi masalah BBLR. Metode CART yaitu metode pohon regresi dapat digunakan untuk mengetahui pola hubungan tersebut.
2.1.2
Classification and Regression Trees (CART)
CART adalah salah satu metode dari salah satu teknik eksplorasi data yaitu teknik pohon keputusan. Menurut Breiman et al. (1993) CART merupakan metode statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk variabel respon kategorik maupun kontinu. Metode CART terdiri dari dua analisis yaitu pohon klasifikasi dan pohon regresi. Menurut Komalasari (2007) dan Soni (2010), CART menghasilkan pohon klasifikasi jika variabel respon yang dimiliki bertipe kategorik sedangkan jika variabel respon yang dimiliki bertipe kontinu maka CART akan menghasilkan pohon regresi. commit to user Menurut Lewis (2000) beberapa keunggulan CART dibandingkan dengan
metode statistik yang lain (khususnya parametrik) adalah 1. variabel-variabel dalam CART tidak bergantung pada asumsi-asumsi seperti pada regresi biasa, sehingga CART termasuk dalam metode statistik nonparametrik, 2. variabel-variabel prediktor dalam CART dapat bertipe kategorik (nominal dan ordinal) maupun bertipe kontinu, 3. interpretasi dari pohon yang dihasilkan oleh CART sangat mudah dipahami karena hasilnya berupa diagram pohon.
9
2.1.3
Struktur CART
Metode CART termasuk dalam anggota analisis klasifikasi yang disebut pohon keputusan karena proses analisis dari CART digambarkan dalam bentuk atau struktur yang menyerupai sebuah pohon, lebih tepatnya pohon klasifikasi yang berbentuk biner. Adapun bentuk CART digambarkan pada Gambar 2.1 berikut t1
X1 ≤ a
X1 > a
perpustakaan.uns.ac.id
digilib.uns.ac.id
Pemilah 1
t2
X2 ≤ a
t3
X2 > a
Pemilah 2
Pemilah 3
t4
t5
p.4
p.5
t8
t6
t7
A6
p.6
t10
t11
t12
A4
A5
A7
t9
t13 3
p.7
A1
t1
p.8
t14
t15
t16
t17
A2
A3
A8
A9
= simpul akar
= simpul nonterminal
= cabang
= simpul terminal
Gambar 2.1. Bentuk CART
Keterangan Gambar 2.1: to user 1. Simpul akar digambarkan dengancommit lingkaran. Merupakan simpul internal paling
awal (paling atas) dan tempat inisialisasi data pelatihan yang dimiliki. 2. Cabang digambarkan dengan 2 garis lurus yang merupakan cabang dari simpul akar. Cabang merupakan tempat kriteria pemilahan dari masing-masing simpul internal. Sebagai contoh: kriteria pemilahan pertama pada cabang kiri adalah dan cabang kanan adalah
.
3. Simpul internal (simpul dalam) digambarkan dengan lingkaran. Merupakan himpunan bagian dari simpul internal di atasnya yang memenuhi kriteria
10
pemilahan tertentu. Sebagai contoh: objek-objek yang berada dalam simpul internal
merupakan himpunan bagian dari objek-objek yang berada dalam
simpul internal
yang memenuhi kriteria pemilahan
.
4. Simpul akhir atau simpul terminal, digambarkan dengan persegi. Merupakan simpul tempat diprediksikannya sebuah objek pada kelas tertentu. Sebagai contoh, jika ada beberapa objek yang masuk dalam simpul akhir objek tersebut perpustakaan.uns.ac.id akan dimasukkan ke dalam kelas 5. Simpul
dan
.
digilib.uns.ac.id
merupakan simpul anak dari simpul
merupakan simpul anak dari simpul akar
induk untuk simpul
dan
dan
sedangkan simpul
. Begitu juga sebaliknya simpul akar
merupakan simpul induk untuk simpul simpul induk untuk simpul
, maka objek-
dan simpul
, sedangkan simpul
, simpul
merupakan
merupakan simpul
, dan seterusnya.
2.1.4 Pemilahan Rekursif Biner Teknik atau proses kerja dari CART dalam membuat sebuah pohon klasifikasi dikenal dengan istilah pemilahan rekursif biner (Binary Recursive Patitioning). Proses disebut biner karena setiap simpul induk akan selalu mengalami pemilahan ke dalam tepat dua simpul anak. Sedangkan rekursif berarti bahwa proses pemilahan tersebut akan diulang kembali pada setiap simpul anak hasil pemilahan terdahulu, sehingga simpul anak tersebut sekarang menjadi simpul induk. Proses pemilahan akan terus dilakukan sampai tidak ada kesempatan lagi untuk melakukan pemilahan berikutnya. Dan istilah pemilahan berarti bahwa data pelatihan yang dimiliki dipecah commit to user
ke dalam bagian-bagian atau partisi-partisi yang lebih kecil. Kriteria pemecahan didasarkan pada nilai-nilai dari variabel prediktor yang dimiliki. Misal dimiliki variabel prediktor
yang bertipe kontinu dan variabel-variabel
. Proses pemilahan rekursif biner dapat diilustrasikan sebagai
proses pembagian dari ruang berdimensi
dari variabel-variabel prediktor
ke
dalam partisi-partisi yang berbentuk persegi panjang dan tidak saling bertumpang tindih yaitu dengan membagi ruang berdimensi
dari variabel-variabel prediktor ke
dalam beberapa partisi dimana masing-masing partisi berisi objek-objek yang
11
homogen. Maksud homogen adalah objek-objek tersebut merupakan anggota satu kelas yang sama walaupun pada kenyataannya secara teori tidak mudah diperoleh. Proses pemilahan akan berlanjut sampai didapat pohon yang paling besar atau maksimal (proses pemilahan tidak bisa dilakukan lagi). t1
t1
t2
t3
x≤a
x>a
perpustakaan.uns.ac.id
x≤a
x>a
digilib.uns.ac.id
t2
t2
t3
t3 x>b
x ≤b
a
t5
t4
t4 b
t2
t5 a Gambar 2.2. Proses Partisi Untuk memperjelas proses partisi, akan diberikan contoh pemilahan yaitu pada
Gambar 2.2 terlihat proses partisi simpul dan
dipilah dengan kriteria pemilahan
. Pemilahan yang dihasilkan adalah simpul
sedangkan simpul
akibat dari kriteria
terbentuk akibat kriteria pemilahan
partisi berlanjut pada simpul
. Kemudian proses
, dengan kriteria pemilahan
terbentuk karena memenuhi kriteria
commit to user
dan simpul
dan
. Simpul
terbentuk karena kriteria
.
2.1.5
Metode Pohon Regresi
Dalam regresi, suatu objek terdiri dari data yang berada dalam ruang pengukuran dalam ruang pengukuran sedangkan variabel
. Variabel
dan
dimana
merupakan nilai
adalah angka bernilai riil yang berada biasa disebut sebagai variabel respon
disebut sebagai variabel prediktor. Aturan prediksi atau
12
pendugaan respon adalah fungsi riil. Jadi,
yang ditentukan pada
adalah fungsi dari
dan menghasilkan nilai
yang bernilai riil
Metode pohon regresi dalam CART merupakan istilah umum dalam yang berasal dari data pelatihan . Pembentukan
pembentukan penduga respon
penduga respon memiliki dua tujuan, yaitu (1) untuk memprediksi variabel respon secara tepat dan teliti yang berhubungan dengan data yang akan datang (2) untuk perpustakaan.uns.ac.id mengetahui hubungan struktural antara variabel respondigilib.uns.ac.id dan variabel prediktor.
Jika terdapat data pelatihan
yang terdiri dari
dan terdapat sebanyak
digunakan untuk membentuk penduga respon uji
maka ketepatan
objek data
dapat diukur dengan rata-rata kuadrat
kesalahan (mean squared error), yaitu
dengan
sebagai penduga respon dari
.
Definisi 2.1. (Breiman et al., 1993) Rata-rata kuadrat kesalahan respon
artinya
dari penduga
didefinisikan sebagai
adalah harapan kuadrat kesalahan menggunakan
sebagai penduga
respon . Definisi 2.2. (Breiman et.al., 1993) Rata-rata kuadrat kesalahan relatif sebagai penduga respon
pada
adalah commit to user
dimana
adalah penduga respon untuk adalah variansi dari
jika nilai
serta
tidak diketahui dan
merupakan rata-rata kuadrat
kesalahan menggunakan nilai . Jika rata-rata dan variansi dari data uji masing-masing adalah dan
maka penduga pengganti dimana
untuk
adalah
adalah penduga pengganti rata-rata kuadrat kesalahan
13
relatif,
adalah penduga pengganti untuk
, dan
adalah rata-rata
kuadrat kesalahan dari data uji. Rumus kesalahan relatif penduga sampel uji untuk adalah
dengan rumus kesalahan penduga sampel uji untuk
perpustakaan.uns.ac.id
adalah
digilib.uns.ac.id
(Breiman et. al., 1993).
2.1.6
Langkah Kerja Pembentukan Pohon Regresi
Menurut Lewis (2000) pada dasarnya dalam membuat sebuah pohon regresi, CART bekerja dalam empat langkah utama. Langkah pertama adalah pembentukan pohon regresi melalui proses pemilahan simpul yaitu proses pemilahan simpul induk menjadi dua buah simpul anak melalui aturan pemilahan tertentu dan dilakukan secara berulang-ulang. Langkah kedua adalah proses pemberhentian pembentukan pohon regresi. Pada tahap ini pohon maksimal (Tmax) telah terbentuk. Langkah ketiga adalah proses pemangkasan pohon
menjadi pohon yang lebih kecil
.
Selanjutnya langkah terakhir adalah proses pemilihan pohon regresi optimal. Berikut ini dijelaskan langkah kerja pembentukan pohon regresi.
a.
Aturan Pemilahan dalam Pohon Regresi
Tahapan pemilahan seperti dijelaskan oleh Komalasari (2007) sebagai berikut: commit to user 1. Semua kemungkinan pemilahan ditentukan dari setiap variabel prediktor. Tiap pemilahan tergantung pada nilai yang berasal dari satu variabel prediktor. Misal terdapat variabel prediktor sebanyak adalah jenis variabel prediktor, adalah variabel
dan
dimana
secara berurutan. Jika
maka akan terdapat
pemilahan.
. Untuk variabel kontinu
dengan
pemilahan yang diperbolehkan adalah nilai tengah antara dua nilai amatan mempunyai sebanyak
nilai yang berbeda
14
2. Pada variabel kategorik pemilahan yang terjadi berasal dari semua kemungkinan pemilahan berdasarkan terbentuknya dua anak gugus yang saling lepas (disjoint). Jika
adalah variabel kategorik nominal dengan pemilahan, sedangkan jika
akan terdapat
kategori, maka akan ada
adalah variabel kategorik ordinal maka
pemilahan.
perpustakaan.uns.ac.id digilib.uns.ac.id b. Aturan Penumbuhan Pohon dan Kriteria Pemilah Terbaik
Proses pemilahan dilakukan pada tiap simpul dengan cara sebagai berikut. 1. semua kemungkinan pemilahan dicari pada setiap variabel prediktor (Timofeev, 2004), 2. pemilah terbaik dipilih dari masing-masing pemilahan terbaik yang ada. Pemilah terbaik dihitung berdasarkan selisih jumlah kuadrat deviasi dari masing-masing simpul dengan simpul pemilahnya. Selisih terbesar akan dijadikan sebagai pemilah terbaik. Jumlah kuadrat deviasi digunakan sebagai kriteria kehomogenan pada tiap-tiap simpul . Jumlah kuadrat deviasi di dalam simpul adalah dengan
dimana dalam suatu simpul , nilai
individu variabel respon dalam simpul , nilai prediktor yang berada dalam simpul , nilai data
dalam simpul , dan
adalah nilai
adalah nilai individu variabel adalah nilai rata-rata untuk semua
adalah jumlah data yang berada dalam simpul
(Breiman et al., 1993). commit to user terbaik Definisi 2.3. (Breiman et al., 1993) Pemilah
pada
dari simpul adalah pemilah
yang memaksimumkan jumlah kuadrat pohon regresi
Setiap pemilah
dari menjadi
Pemilihan pemilah terbaik
dan
.
maka
menjadi sebuah pemilah menyebabkan
15
yaitu selisih jumlah kuadrat deviasi terbesar yang dijadikan pemilah terbaik dimana adalah kumpulan pemilah biner,
dan
masing-masing adalah simpul anak kiri
dan simpul anak kanan.
c.
Pemberhentian Pemilahan Pohon
Proses pembentukan pohon regresi berhenti apabila sudah tidak dimungkinkan perpustakaan.uns.ac.id digilib.uns.ac.id lagi dilakukan proses pemilahan. Awalnya dibentuk pohon yang besar
kemudian dilakukan proses pemilahan untuk meminimumkan
. Pemilahan
berhenti apabila tidak terdapat lagi penurunan keheterogenan atau semua nilai
yang
ada pada sebuah simpul adalah sama (homogen), ukuran simpul induk minimum 10 (Steinberg and Colla, 1998) yaitu ukuran minimum dimana simpul tidak akan dipilah, hanya terdapat satu pengamatan pada tiap simpul anak atau adanya batasan minimum serta adanya batasan jumlah level atau tingkat kedalaman pohon maksimal (Breiman et al., 1993). Pemilahan yang akan menghasilkan simpul anak yang lebih kecil tidak dipertimbangkan. Penambahan simpul induk yang diperbolehkan dan ukuran simpul anak digunakan untuk mengatur atau membatasi pertumbuhan pohon (Steinberg and Colla, 1998). Simpul-simpul yang tidak mengalami pemilahan lagi akan menjadi simpul terminal atau simpul akhir. Pohon regresi yang terbentuk sebagai hasil dari proses ini dinamakan pohon maksimal
.
d. Pemangkasan Pohon Regresi Pohon yang dibentuk dengan aturan pemilahan dan aturan pembentukan commit to user
berukuran sangat besar. Hal ini karena aturan pemberhentian yang digunakan hanya berdasarkan banyaknya data pada simpul akhir atau besarnya peningkatan kehomogenan. Oleh karena itu, pemangkasan pohon dilakukan untuk mendapatkan pohon akhir yang lebih sederhana. Pemangkasan pohon dilakukan dengan memangkas
menjadi beberapa pohon regresi
yang ukurannya lebih kecil
(sub pohon). Sebuah simpul ancestor dari simpul
disebut descendan (anak) dari simpul
dan simpul
disebut
jika kedua simpul ini bisa dihubungkan oleh jalur-jalur yang
16
bergerak dari atas ke bawah (simpul
berada di atas simpul
). Pada Gambar 2.3
pohon regresi
adalah descendan dari
tetapi tidak dengan
dan
dan
. Begitu pula dengan
ancestor dari
dan
adalah ancestor dari
(Breiman et al., 1993). t1 perpustakaan.uns.ac.id
digilib.uns.ac.id
t2
t3
t4
t8
t5
t6
t10
t9
t7
t11
0
Gambar 2.3. Pohon Regresi t2
t4
t8
t5
t9
t11
t10 0
Gambar 2.4. Cabang commit to user
t1
t2
t3
t6
t7
Gambar 2.5. Pohon Regresi
tetapi
bukan
17
Definisi 2.4. (Breiman et al., 1993) Suatu cabang
dari
dengan simpul akar
terdiri dari simpul itu sendiri dengan semua descendant dari dalam . Sebagai contoh pada Gambar 2.4 cabang dari
yaitu
dan
terdiri dari simpul
dan descendant
.
Definisi 2.5. (Breiman et al., 1993) Pemangkasan sebuah cabang perpustakaan.uns.ac.id akan menghasilkan semua descendant dari
kecualidigilib.uns.ac.id simpul akarnya ( itu sendiri).
Sebagai contoh pada Gambar 2.5 pohon regresi dari simpul
. Jika pemangkasan terjadi pada simpul
yaitu
dan
dari pohon
adalah hasil pemangkasan maka descendant dari
dipangkas kecuali simpul akarnya yaitu simpul
itu
sendiri. Definisi 2.6. (Breiman et al., 1993) Jika pemangkasan suatu cabang, maka dengan
. Sebagai catatan
diperoleh dari
sebagai hasil dari
disebut pruned subtree dari dan
memiliki simpul akar yang sama.
Sebagai contoh gambar pohon regresi
menunjukkan pruned subtree.
Proses pemangkasan pohon dimulai dengan mengambil simpul anak kanan dan
dan dinotasikan
yang merupakan
yang merupakan simpul anak kiri dari
yang
dihasilkan dari simpul induk . Jika diperoleh dua simpul anak dan simpul induk pada persamaan (2.3) berjumlah 0 atau
maka simpul anak
dipangkas. Hasilnya seperti pada persamaan (2.4) yaitu pohon kriteria
dan
tersebut
yang memenuhi
. Inti dari pemangkasan adalah pemotongan hubungan
terlemah (weakest-link cutting) pada pohon regresi (Breiman et al., 1993). Jika pada commit to user
pohon regresi tidak terpenuhi yang memenuhi
maka pemangkasan dimulai dari pohon . Proses pemangkasan diulang sampai tidak
ada lagi pemangkasan yang mungkin dan diperoleh urutan sebagai berikut dimana
dengan
.
18
e.
Penentuan Ukuran Pohon Regresi Optimal
Pohon regresi yang terbentuk dapat berukuran besar dan kompleks dalam menggambarkan struktur data. Sehingga perlu dilakukan suatu pemangkasan pohon untuk mendapatkan pohon akhir yang lebih sederhana. Pemangkasan dilakukan dengan memangkas bagian pohon yang kurang penting sehingga didapat pohon optimal. Pemangkasan yang digunakan adalah dengan membagi data menjadi data pelatihan dan data uji. Proporsi pembagian pohondigilib.uns.ac.id data pelatihan dan data uji perpustakaan.uns.ac.id ditentukan sendiri oleh peneliti karena tidak ada aturan dalam membagi data. Proses pemangkasan pohon yang terjadi adalah dengan membangun pohon menggunakan data pelatihan kemudian menggunakan pohon yang terbentuk untuk sampel data uji. Menurut Breiman et al. (1993) cara yang digunakan untuk menduga tingkat kesalahan prediksi dari suatu model pohon regresi adalah dengan menggunakan nilai kesalahan penduga sampel uji, data pengamatan dibagi dua secara acak menjadi data pelatihan
dan data uji
. Data pelatihan
digunakan untuk membentuk urutan
dari pemangkasan pohon. Rumus kesalahan penduga sampel uji adalah
dimana
adalah jumlah data uji,
berada dalam data uji, data uji, dan
adalah nilai individu variabel prediktor yang
adalah nilai individu variabel respon yang berada dalam
adalah dugaan respon dari pengamatan ke f.
pada pohon ke .
Penduga Kesalahan Standar
commit to user Penduga kesalahan standar adalah ukuran dari ketidakpastian di sekitar tingkat
kesalahan sebenarnya (sampel uji) dari pohon regresi saat berhadapan dengan data baru. Jadi, nilai penduga kesalahan standar memberikan gambaran ketidakpastian dari penduga tingkat kesalahan. Berdasarkan Definisi (2.2) (Breiman et al., 1993) yaitu penduga respon untuk variansi dari
jika nilai
tidak diketahui dan
sebagai dasar yaitu
yang merupakan rata-rata kuadrat kesalahan menggunakan nilai
19
yang tetap sebagai penduga respon
. Jika ditentukan
dan
atau
maka kesalahan relatif penduga sampel uji pada pohon keseperti pada persamaan (2.1) dapat dituliskan menggunakan persamaan (2.2) menjadi
perpustakaan.uns.ac.id
digilib.uns.ac.id
persamaan (2.5) merupakan penduga rata-rata kuadrat kesalahan dari
Pada penduga kesalahan standar, nilai kesalahan standar dari , dianggap
dengan
dan dan
dari
dapat diganti dengan
dalam menentukan
. Untuk menentukan kesalahan standar dari
adalah tetap dan persamaan (2.6) dapat ditulis dalam bentuk
adalah penduga yang tetap untuk adalah penduga yang tetap untuk
sama seperti variansi dari
yaitu commit to user
dan . Variansi
20
perpustakaan.uns.ac.id
dimana
digilib.uns.ac.id
,
dan
Misal data pelatihan sebanyak
untuk
.
dipilih secara independen dari suatu distribusi
probabilitas tertentu dan anggap bahwa data pelatihan digunakan untuk membentuk penduga respon
. Data uji sebanyak
dipilih secara independen dari distribusi . Setiap pasangan
yang sama dinotasikan dengan
memiliki distribusi yang sama, sehingga variansi dari setiap pasangan sama dengan variansi dari pasangan pertama.
menggunakan estimasi momen sampel
commit to user
sehingga
21
diketahui bahwa
perpustakaan.uns.ac.id
dengan demikian
digilib.uns.ac.id
dapat diestimasi dengan
Diketahui bahwa
menggunakan estimasi momen sampel commit to user
sehingga
22
diperoleh perpustakaan.uns.ac.id
dengan demikian
digilib.uns.ac.id
dapat diestimasi dengan
Diketahui bahwa
commit to user
diperoleh
23
dengan demikian
dapat diestimasi dengan
Rumus kesalahan standar dari
diperoleh menggunakan persamaan (2.7),
(2.8) dan (2.9) sebagai berikut
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2. Kerangka Pemikiran Berdasarkan tinjauan pustaka, dapat dibuat kerangka pemikiran yaitu metode CART merupakan salah satu metode eksplorasi nonparametrik yang digunakan untuk melihat hubungan antara variabel respon dengan variabel-variabel prediktor dengan tipe variabel yang berbeda-beda. Metode CART terdiri dari dua analisis yaitu pohon commit to user
klasifikasi dan pohon regresi. Jika variabel respon yang dimiliki bertipe kategorik maka CART menghasilkan pohon klasifikasi. Jika variabel respon yang dimiliki bertipe kontinu maka CART menghasilkan pohon regresi. Berat badan bayi merupakan variabel respon yang bertipe kontinu dan faktor-faktor yang mempengaruhi berat badan bayi merupakan variabel prediktor yang memiliki tipe variabel berbeda-beda sehingga penelitian tentang pola hubungan antara berat badan bayi yang lahir di Kota Surakarta dengan faktor-faktor yang mempengaruhinya dapat dianalisis dengan metode pohon regresi.
BAB III METODE PENELITIAN
Metode penelitian yang digunakan pada penelitian ini adalah studi kasus, yaitu membentuk pohon regresi dari berat badan bayi saat lahir di kota Surakarta dengan faktor-faktor yang mempengaruhinya menggunakan metode pohon regresi. perpustakaan.uns.ac.id
digilib.uns.ac.id
3.1
Sumber Data
Data yang digunakan dalam penelitian ini berupa data primer yang diperoleh dengan menyebarkan kuesioner kepada ibu-ibu yang memiliki balita di kota Surakarta. Sampel yang digunakan sebanyak 100 responden dari 5 kecamatan yang berada di kota Surakarta, yaitu Kecamatan Banjarsari, Kecamatan Jebres, Kecamatan Pasar Kliwon, Kecamatan Serengan dan Kecamatan Laweyan. Langkah-langkah yang dilakukan dalam mengumpulkan data meliputi: 1. Pengambilan sampel a. Pemilihan variabel-variabel yang akan diteliti.
Variabel yang digunakan meliputi variabel respon (Y) berskala kontinu yaitu berat badan bayi saat lahir (kilogram) di Kota Surakarta dan variabel prediktor (X) seperti pada Tabel 1. b. Pemilihan teknik sampling, ukuran sampling dan unit-unit sampling. Teknik yang digunakan adalah sampling kluster dengan semua kecamatan di kota Surakarta sebagai klusternya. Setiap kecamatan dipilih dua kelurahan commit to user secara random sederhana. Masing-masing kelurahan diambil 10 sampel.
Jumlah sampelnya adalah 100. Unit sampel adalah ibu-ibu yang memiliki balita. c. Perancangan kuesioner. Kuesioner yang digunakan dalam penelitian ini dapat dilihat pada Lampiran 1. d. Pengumpulan data primer di kota Surakarta dengan menyebar kuesioner sebanyak 100 kepada ibu-ibu yang memiliki balita.
24
25
Tabel 1. Variabel Prediktor dari Berat Badan Bayi Saat Lahir Variabel
Deskripsi
Skala
Keterangan
X1 X2
Usia ibu hamil Jarak kehamilan
Kontinu Kategorik
Jumlah anak yang dilahirkan
(tahun) 1 jika kurang dari 2 tahun 2 jika 2 tahun atau lebih -
Diskritdigilib.uns.ac.id
X4
Kenaikan berat badan
Kontinu
(kg)
X5
Penyakit saat kehamilan
Kategorik
X6
Ibu menderita anemia
Kategorik
X7
Frekuensi pemeriksaan kehamilan
Kategorik
X8
Status pekerjaan ibu
Kategorik
X9
Pendidikan ibu
Kategorik
1 jika ya 2 jika tidak 1 jika ya 2 jika tidak 1 jika kurang dari 1 bulan sekali 2 jika 1 bulan sekali 3 jika lebih dari 1 bulan sekali 1 jika bekerja 2 jika tidak bekerja 1 jika lainnya (tamat SD, tamat TK, tidak sekolah) 2 jika tamat SMP 3 jika tamat SMA 4 jika tamat Perguruan Tinggi
X3
perpustakaan.uns.ac.id
3.2
Analisis Data
commit to user
Langkah-langkah dalam menyelesaikan analisis data sebagai berikut: 1. Pembentukan statistik deskriptif dari masing-masing variabel. 2. Pembagaian data menjadi 2 bagian yaitu data pelatihan dan data uji. Proporsi pembagian data pelatihan dan data uji ditentukan sendiri oleh peneliti karena tidak ada aturan dalam membagi data. Peneliti menggunakan data dengan proporsi data pelatihan 90% dipilih secara random sebagai metode pemangkasan karena ukuran sampel yang besar, sehingga diperoleh pembagian data pelatihan
26
sebanyak 90 data dan data uji sebanyak 10 data. Pemilihan data secara random dilakukan sebanyak 10 kali sehingga diperoleh 10 kelompok data percobaan (dataset). 3. Pembentukan pohon regresi dengan algoritma CART pada 10 kelompok data percobaan menggunakan Software Salford Predictive Miner CART versi 4.0. dengan tahapan sebagai berikut: a. Pembentukan pohon regresi dengan aturan pemilahan secara biner perpustakaan.uns.ac.id digilib.uns.ac.id menggunakan data pelatihan dimana selisih jumlah kuadrat deviasi terbesar digunakan untuk memilah sebuah simpul. b. Proses pemberhentian pembuatan atau pembentukan pohon regresi. Proses pemilahan berhenti jika tidak terdapat lagi penurunan keheterogenan yang berarti atau semua nilai
yang ada pada sebuah simpul adalah sama
(homogen), ukuran simpul induk minimum 10 yaitu ukuran minimum dimana simpul tidak akan dipilah (Steinberg, 1998), atau hanya terdapat satu pengamatan pada tiap simpul anak (Breiman, 1993). c. Pemangkasan pohon regresi. Pemangkasan dilakukan jika dua simpul anak dan simpul induk pada persamaan (2.3) berjumlah 0. Jika
tidak
dipenuhi maka pemangkasan dimulai dari pohon yang memenuhi
dan berhenti sampai tidak dimungkinkan lagi proses pemangkasan. d. Pemilihan pohon regresi optimal dengan menggunakan data uji yaitu dipilih sub pohon yang mempunyai nilai kesalahan penduga sampel uji terkecil. commit to user
4. Pemilihan pohon regresi optimal dari pohon regresi yang dibentuk oleh 10 kelompok data percobaan.
BAB IV HASIL DAN PEMBAHASAN
Pada bagian ini dibahas tentang deskripsi variabel penelitian dan pembentukan pohon regresi dari berat badan bayi saat lahir di kota Surakarta.
4.1
perpustakaan.uns.ac.id
Statistik Deskriptif digilib.uns.ac.id
Statistik deskriptif digunakan untuk melihat homogen atau tidaknya data yang digunakan sebagai pemilah dalam pembentukan pohon regresi. Data yang digunakan dalam pembentukan pohon regresi adalah data berat badan bayi saat lahir di kota Surakarta dan faktor-faktor yang mempengaruhinya. Jumlah data yang digunakan sebanyak 100 data yang diperoleh dengan menyebarkan kuesioner. Data terdiri dari 9 variabel prediktor
dan 1 variabel respon
yang terdapat dalam Lampiran 2.
Informasi mengenai gambaran secara umum terhadap berat badan bayi saat lahir, umur ibu hamil dan kenaikan berat badan ibu dapat dilihat melalui statistik deskriptif berikut.
Tabel 4.1. Statistik Deskriptif Berat Badan Bayi Saat Lahir, Umur Ibu Hamil, dan Kenaikan Berat Badan Ibu Variabel
Mean
St.Dev
Min
Max
Berat Badan Bayi saat Lahir
3,021
0,445
2,20
4,30
(dalam kilogram) commit to user
Usia Ibu Hamil (dalam tahun)
30,190
4,694
23
43
Kenaikan Berat Badan Ibu
11,190
4,141
4
25
(dalam kilogram)
Pada Tabel 4.1. dapat diketahui rata-rata berat badan bayi saat lahir adalah 3,021 kilogram, standar deviasi sebesar 0,445 dengan berat badan bayi paling rendah adalah 2,20 kilogram dan berat badan bayi paling tinggi adalah 4,30 kilogram. Ratarata usia ibu saat hamil adalah 30,190 tahun dengan standar deviasi sebesar 4,694 dan 27
28
usia ibu saat hamil paling rendah adalah 23 tahun serta paling tinggi adalah 43 tahun. Rata-rata kenaikan berat badan ibu adalah 11,190 kilogram dengan standar deviasi sebesar 4,141 dan kenaikan berat badan ibu paling rendah adalah 4 kilogram serta paling tinggi adalah 25 kilogram. Variabel pendidikan ibu dibedakan menjadi 4 kategori yaitu tamat SMP, tamat SMA, tamat Perguruan Tinggi dan pendidikan ibu yang tidak termasuk ke dalam 3 kategori perpustakaan.uns.ac.id sebelumnya, masuk ke dalam kategori lainnya. Variabel jumlah digilib.uns.ac.id anak dibedakan menjadi 4 kategori yaitu jumlah anak 2, 3, 4 dan 5. Deskripsi pendidikan ibu dan jumlah anak disajikan dengan diagram batang sebagai berikut.
Pendidikan Ibu
Jumlah Anak yang Dilahirkan
lainnya
13.00
jml anak 2
tamat SMP
18.00
jml anak 3
tamat SMA tamat P.T.
56.00 13.00 0.00
20.00
40.00
60.00
67 23
jml anak 4
8
jml anak 5
2 0
20
(a)
40
60
80
(b)
Gambar 4.1. (a) Diagram Batang Pendidikan Ibu (b) Diagram Batang Jumlah Anak yang Dilahirkan
Pada Gambar 4.1.(a) terlihat bahwa tingkat pendidikan ibu paling banyak user adalah tamat SMA, yaitu ada sebanyakcommit 56to orang. Pendidikan ibu paling sedikit adalah
tamat Perguruan Tinggi dan lainnya, yaitu masing-masing sebesar 13 orang. Pada Gambar 4.1.(b) terlihat bahwa sebanyak 67 orang mempunyai anak yang dilahirkan berjumlah 2 anak, sebanyak 23 orang mempunyai anak yang dilahirkan berjumlah 3 anak, sebanyak 8 orang mempunyai anak yang dilahirkan berjumlah 4 anak, dan sebanyak 2 orang mempunyai anak yang dilahirkan berjumlah 5 anak. Variabel jarak kehamilan dibedakan menjadi 2 kategori yaitu jarak hamil kurang dari 2 tahun dan 2 tahun atau lebih. Variabel penyakit ibu saat kehamilan
29
dibedakan menjadi 2 kategori yaitu pernah menderita dan tidak pernah menderita. Deskripsi variabel jarak kehamilan dan penyakit ibu saat hamil disajikan dengan diagram lingkaran seperti pada Gambar 4.2. Pada Gambar 4.2.(a) terlihat bahwa ada sebanyak 73 orang yang memiliki jarak kehamilan 2 tahun atau lebih dengan persentase sebesar 73% dan sebanyak 27 orang memiliki jarak kehamilan kurang dari 2 tahun dengan persentase sebesar 27%. Hal ini berarti sebagian perpustakaan.uns.ac.id besar ibu memiliki jarak kehamilan yang baik sesuai anjuran digilib.uns.ac.id BKKBN. Pada Gambar 4.2.(b) terlihat bahwa sebanyak 94 orang tidak memiliki penyakit saat kehamilan dengan persentase sebesar 94% dan sebanyak 6 orang memiliki penyakit saat kehamilan dengan persentase sebesar 6%. Hal ini berarti sebagian besar ibu tidak memiliki penyakit saat hamil.
Penyakit saat Kehamilan
Jarak Kehamilan
ya 6% 2thn atau lebih 73%
< 2 thn 27%
tidak 94%
(a)
(b)
Gambar 4.2. (a) Diagram Lingkaran Jarak Kehamilan (b) Diagram Lingkaran Penyakit Saat Kehamilan commit to user
Variabel ibu menderita anemia dibedakan menjadi 2 kategori yaitu pernah anemia dan tidak pernah anemia. Variabel frekuensi pemeriksaan kehamilan dibedakan menjadi 3 kategori yaitu kurang dari satu bulan sekali, satu bulan sekali, dan lebih dari satu bulan sekali. Variabel status pekerjaan ibu dibedakan menjadi 2 kategori yaitu bekerja dan tidak bekerja. Deskripsi variabel ibu menderita anemia, frekuensi pemeriksaan kehamilan dan status pekerjaan ibu disajikan dengan diagram lingkaran seperti pada Gambar 4.3.
30
Ibu Menderita Anemia
Frekuensi Pemeriksaan Kehamilan
ya 32%
> 1 bln 15%
tidak 68%
< 1 bln 19%
1 bln 66% perpustakaan.uns.ac.id
digilib.uns.ac.id
(a)
(b)
Status Pekerjaan Ibu
bekerja 38%
tdk bekerja 62%
(c) Gambar 4.3. (a) Diagram Lingkaran Ibu Menderita Anemia (b) Diagram Lingkaran Frekuensi Pemeriksaan Kehamilan (c) Diagram Lingkaran Status Pekerjaan Ibu
Pada Gambar 4.3.(a) terlihat bahwa ada sebanyak 68 orang tidak menderita anemia saat hamil dengan persentase sebesar 68% dan sebanyak 32 orang menderita anemia saat hamil dengan persentase sebesar 32%. Hal ini berarti sebagian besar ibu commit to user memiliki kadar hemoglobin yang cukup selama hamil. Pada Gambar 4.3.(b) terlihat
bahwa sebanyak 66 orang memeriksakan kehamilannya setiap satu bulan sekali dengan persentase sebesar 66%, sebanyak 19 orang memeriksakan kehamilannya kurang dari satu bulan sekali dengan persentase sebesar 19% dan sebanyak 15 orang memeriksakan kehamilannya lebih dari satu bulan sekali dengan persentase sebesar 15%. Hal ini berarti sebagian besar ibu memeriksakan kehamilan secara rutin setiap satu bulan sekali. Pada Gambar 4.3.(c) terlihat bahwa sebanyak 62 orang tidak bekerja saat hamil dengan persentase sebesar 62% dan sebanyak 38 orang bekerja
31
saat hamil dengan persentase sebesar 38%. Hal ini berarti sebagian besar ibu tidak bekerja saat hamil. Berdasarkan deskripsi statistik terlihat bahwa semua data tidak homogen (heterogen). Dengan demikian, data tersebut dapat digunakan untuk analisis selanjutnya yaitu pembentukan pohon regresi.
4.2
perpustakaan.uns.ac.id
Analisis Pohon Regresi digilib.uns.ac.id
Langkah pertama dari analisis pohon regresi adalah pembentukan pohon regresi. Langkah selanjutnya adalah pemangkasan pohon regresi, pemilihan pohon regresi optimal, dan pemilihan pohon regresi dari kelompok data percobaan. Data penelitian dibagi menjadi 2 yaitu data pelatihan dan data uji. Pembagian sampel data dilakukan secara acak sebanyak 10 kali sehingga diperoleh 10 kelompok data percobaan (dataset) dengan pembagian data pelatihan sebesar 90% yaitu sebanyak 90 data dan data uji sebesar 10% yaitu sebanyak 10 data. Data pelatihan digunakan untuk proses pembentukan pohon regresi, sedangkan data uji digunakan untuk melakukan validasi model. Selanjutnya dibentuk pohon regresi dari berat badan bayi saat lahir di kota Surakarta yang melibatkan 9 variabel prediktor, yaitu usia ibu hamil, jarak kehamilan, jumlah anak yang dilahirkan, kenaikan berat badan, penyakit saat kehamilan, ibu menderita anemia, frekuensi pemeriksaan kehamilan, status pekerjaan ibu, dan pendidikan ibu. Berikut ini dijelaskan proses pembentukan pohon regresi dari salah satu kelompok data percobaan. Pembentukan pohon regresi dari 9 kelompok data percobaan lainnya dilakukan dengan cara yang sama. commit to user
4.2.1 Pembentukan Pohon Regresi Maksimal Pembentukan pohon regresi maksimal dilakukan menurut aturan pemilahan yaitu dimulai dari pemilahan data berat badan bayi saat lahir dari 90 data pelatihan oleh variabel pemilah terbaik dari masing-masing variabel prediktor. Banyaknya kemungkinan pemilahan diperoleh dengan cara sebagai berikut
32
1. jika pada variabel prediktor kontinu terdapat sebanyak berbeda, maka terdapat sebanyak
nilai pengamatan yang
pemilahan yang mungkin dilakukan.
Dalam hal ini, variabel yang bertipe kontinu adalah memiliki 19 – 1 = 18 kemungkinan pemilahan
a. variabel usia ibu hamil
) memiliki 16 – 1 = 15 kemungkinan
b. variabel kenaikan berat badan ibu ( pemilahan
perpustakaan.uns.ac.id digilib.uns.ac.idkategori, maka terdapat 2. jika pada variabel prediktor kategorik ordinal terdapat
sebanyak
pemilahan yang mungkin dilakukan. Dalam hal ini, variabel yang
bertipe kategorik ordinal adalah a. variabel jarak hamil (
) memiliki 2 – 1 = 1 kemungkinan pemilahan ) memiliki 4 – 1 = 3 kemungkinan pemilahan
b. variabel jumlah anak (
c. variabel frekuensi pemeriksaan kehamilan (
) memiliki 3 – 1 = 2
kemungkinan pemilahan d. variabel pendidikan ibu (
) memiliki 4 – 1 = 3 kemungkinan pemilahan
3. jika pada variabel prediktor kategorik nominal terdapat sebanyak
kategori, maka terdapat
pemilahan yang mungkin dilakukan. Dalam hal ini, variabel
yang bertipe kategorik nominal adalah a. variabel penyakit saat kehamilan (
) memiliki
kemungkinan
) memiliki
kemungkinan
) memiliki
kemungkinan
pemilahan b. variabel ibu menderita anemia ( pemilahan c. variabel status pekerjaan ibu (
commit to user
pemilahan. Pembentukan
pohon
regresi
maksimal
dimulai
dengan
mencoba
45
kemungkinan pemilahan pada data berat badan bayi saat lahir dari 90 data yang terkumpul dalam suatu himpunan yang disebut simpul akar dan diberi nama simpul 1. Masing-masing kemungkinan pemilahan menghasilkan 2 kelompok data yang dinamakan simpul anak kiri dan simpul anak kanan, kedua simpul anak diberi nama simpul 2 dan simpul 3. Pemilah terbaik dihitung berdasarkan selisih jumlah kuadrat deviasi dari masing-masing simpul dengan simpul pemilahnya. Selisih terbesar akan
33
dijadikan pemilah terbaik. Selisih jumlah kuadrat deviasi dapat dilihat pada perhitungan berikut Pemilah terbaik pertama, variabel kenaikan berat badan ibu
perpustakaan.uns.ac.id
kilogram
digilib.uns.ac.id
Perhitungan selisih jumlah kuadrat deviasi
dari kemungkinan
pemilahan lainnya dilakukan dengan cara yang sama dan diperoleh hasil seperti pada to user Tabel 4.2. Pemilah terbaik diperoleh commit dengan kriteria kenaikan berat badan ibu
kilogram. Variabel kenaikan berat badan ibu terpilih karena memiliki selisih jumlah kuadrat deviasi terbesar daripada variabel yang lainnya.
34
Tabel 4.2. Selisih Jumlah Kuadrat Deviasi dari Semua Kemungkinan Pemilahan Pemilah
Simpul anak kiri
Simpul anak kanan
1
usia ibu hamil ≤ 23,5 thn
usia ibu hamil > 23,5 thn
0,038
2
usia ibu hamil ≤ 24,5 thn
usia ibu hamil > 24,5 thn
0,014
3
usia ibu hamil ≤ 25,5 thn
usia ibu hamil > 25,5 thn
0,078
4
usia ibu hamil ≤ 26,5 thn
usia ibu hamil > 26,5 thn
0,098
5
usia ibu perpustakaan.uns.ac.id hamil ≤ 27,5 thn
digilib.uns.ac.id usia ibu hamil > 27,5 thn
0,173
6
usia ibu hamil ≤ 28,5 thn
usia ibu hamil > 28,5 thn
0,875
7
usia ibu hamil ≤ 29,5 thn
usia ibu hamil > 29,5 thn
0,56
8
usia ibu hamil ≤ 30,5 thn
usia ibu hamil > 30,5 thn
0,624
9
usia ibu hamil ≤ 31,5 thn
usia ibu hamil > 31,5 thn
0,377
10
usia ibu hamil ≤ 32,5 thn
usia ibu hamil > 32,5 thn
0,188
11
usia ibu hamil ≤ 33,5 thn
usia ibu hamil > 33,5 thn
0,014
12
usia ibu hamil ≤ 34,5 thn
usia ibu hamil > 34,5 thn
0,078
13
usia ibu hamil ≤ 35,5 thn
usia ibu hamil > 35,5 thn
0,03
14
usia ibu hamil ≤ 36,5 thn
usia ibu hamil > 36,5 thn
0,000
15
usia ibu hamil ≤ 37,5 thn
usia ibu hamil > 37,5 thn
0,087
16
usia ibu hamil ≤ 38,5 thn
usia ibu hamil > 38,5 thn
0,008
17
usia ibu hamil ≤ 39,5 thn
usia ibu hamil > 39,5 thn
0,001
18
usia ibu hamil ≤ 41,5 thn
usia ibu hamil > 41,5 thn
0,009
19
jarak hamil < 2 thn
jarak hamil 2 thn atau lbh
0,374
20
jumlah anak = 2
jumlah anak = {3, 4, 5}
0,024
21
jumlah anak = {2, 3}
jumlah anak = {4, 5}
0,043
22
jumlah anak = {2, 3, 4}
jumlah anak = 5
0,001
23
kenaikan bb ≤ 4,5 kg
kenaikan bb > 4,5 kg
0,009
24
kenaikan bb ≤ 5,5 kg
kenaikan bb > 5,5 kg
0,016
25
kenaikan bb ≤ 6,5 kg
kenaikan bb > 6,5 kg
0,028
26
kenaikan bb ≤ 7,5 kg
kenaikan bb > 7,5 kg
1,284
27
kenaikan bb ≤ 8,5 kg
kenaikan bb > 8,5 kg
1,084
commit to user
35
28
kenaikan bb ≤ 9,5 kg
kenaikan bb > 9,5 kg
0,642
29
kenaikan bb ≤ 10,5 kg
kenaikan bb > 10,5 kg
0,81
30
kenaikan bb ≤ 11,5 kg
kenaikan bb > 11,5 kg
0,841
31
kenaikan bb ≤ 12,5 kg
kenaikan bb > 12,5 kg
0,738
32
kenaikan bb ≤ 13,5 kg
kenaikan bb > 13,5 kg
0,366
33
kenaikan bb ≤ 14,5 kg
kenaikan bb > 14,5 kg
0,225
34
kenaikanperpustakaan.uns.ac.id bb ≤ 15,5 kg
digilib.uns.ac.id kenaikan bb > 15,5 kg
0,652
35
kenaikan bb ≤ 18 kg
kenaikan bb > 18 kg
0,552
36
kenaikan bb ≤ 22 kg
kenaikan bb > 22 kg
0,822
37
kenaikan bb ≤ 24,5 kg
kenaikan bb > 24,5 kg
0,076
38
penyakit saat hamil = ya
penyakit saat hamil = tidak
0,040
39
ibu anemia = ya
ibu anemia = tidak
0,416
40
frekuensi periksa = (1)
frekuensi periksa = (2, 3)
0,016
41
frekuensi periksa = (1, 2)
frekuensi periksa = (3)
0,760
status pekerjaan ibu = tidak 42
status pekerjaan ibu = bekerja
bekerja
0,313
pendidikan ibu = (SMP, 43
pendidikan ibu = (lainnya)
SMA, P.T)
0,150
44
pendidikan ibu = (lainnya, SMP)
pendidikan ibu = (SMA, P.T)
0,464
45
pendidikan ibu = (lainnya, SMP, SMA) pendidikan ibu = (P.T)
0,028
Setelah terbentuk dan diperoleh pemilah terbaik, maka simpul pertama yang berisi
data dipilah menjadi
commit to user
buah simpul akhir. Simpul akhir
kriteria variabel kenaikan berat badan ibu
kilogram. Simpul akhir
akibat kriteria variabel kenaikan berat badan ibu dapat dilihat pada Gambar 4.4. Sebanyak
data berat badan bayi dipilah data dengan kenaikan berat
kilogram masuk ke dalam simpul akhir
kenaikan berat badan ibu
terbentuk
kilogram. Pemilahan pertama
berdasarkan kriteria kenaikan berat badan ibu, yaitu badan ibu
terbentuk akibat
dan
data dengan
kilogram masuk ke dalam simpul akhir 2.
36
Node 1 X4 <= 7.500 STD = 0.451 Avg = 3.007 N = 90 Terminal Node 1 STD = 0.361 Avg = 2.750 N = 16
Terminal Node 2 STD = 0.450 Avg = 3.062 N = 74
perpustakaan.uns.ac.id
digilib.uns.ac.id
Gambar 4.4. Pemilah Pertama Proses pemilahan terus dilakukan pada simpul berikutnya dan berhenti apabila tidak terdapat lagi penurunan keheterogenan atau semua nilai y yang ada pada sebuah simpul adalah sama (homogen), ukuran simpul induk minimum 10 yaitu ukuran minimum dimana simpul tidak akan dipilah (Steinberg and Colla, 1998), atau hanya terdapat satu pengamatan pada tiap simpul anak. Pemilahan yang akan menghasilkan simpul anak yang lebih kecil tidak dipertimbangkan. Pohon regresi yang terbentuk sebagai hasil dari proses ini dinamakan pohon regresi maksimal (Tmax) secara umum ditunjukkan pada Gambar 4.5.
commit to user
Gambar 4.5. Model Pohon Regresi Maksimal
Simpul yang berwarna hijau pada Gambar 4.5 merupakan simpul dalam sedangkan simpul yang berwarna merah merupakan simpul akhir. Pohon regresi
37
maksimal tersebut memiliki 15 simpul dalam dan 16 simpul akhir, dengan kedalaman pohon regresi sebesar 8 tingkatan. Kedalaman pohon menunjukan jumlah level atau tingkatan dari pohon regresi yang dihitung dari simpul utama sampai pada simpul akhir yang terbawah. Pohon regresi maksimal secara detail dapat dilihat pada Lampiran 3. Pada pohon regresi yang terbentuk, CART menghitung ringkasan statistik di setiap simpul-simpul akhir yaitu nilai rata-rata dandigilib.uns.ac.id standar deviasi dari variabel perpustakaan.uns.ac.id respon. Nilai rata-rata dari simpul akhir merupakan nilai prediksi
dari variabel
respon pada kasus simpul terakhir tersebut. Data berat badan bayi dari setiap simpul akhir pada pohon regresi maksimal dapat dilihat pada Tabel 4.3. Nilai yang terdapat pada baris terakhir masing-masing kolom merupakan nilai rata-rata dari setiap simpul akhir. Contoh perhitungan nilai rata-rata dan standar deviasi pada simpul akhir 1 dalam Tabel 4.3 adalah sebagai berikut. Simpul akhir 1: Rata-rata Variansi
Standar deviasi commit to user
4.2.2 Pemangkasan Pohon Regresi Maksimal Pemangkasan pohon regresi maksimal menghasilkan 11 sub pohon. Proses pemangkasan pohon dapat dilihat pada Lampiran 4. Pemangkasan pohon dimulai dengan mengambil
yang merupakan simpul anak kiri dan
yang merupakan
simpul anak kanan dari pohon maksimal. Jika diperoleh dua simpul anak dan simpul induk pada persamaan (2.3) berjumlah 0 atau
maka simpul anak
dan
38
tersebut dipangkas. Jika pada pohon regresi tidak terpenuhi
maka
pemangkasan dimulai dari pohon yang memenuhi
term. 1 2,60 2,50 2,50 2,40 2,50 2,20
2,45 term. 9 3,75
3,75
.
Tabel 4.3. Data Berat Badan Bayi pada Simpul Akhir term. term. term. term. term. term. 2 3 4 5 6 7 2,20 3,00 2,25 2,50 2,90 3,50 3,00 2,20 2,80 2,80 perpustakaan.uns.ac.id digilib.uns.ac.id 2,70 3,00 3,20 2,90 2,60 3,00 2,80 2,50 3,00 2,60 2,90 2,35 3,10 2,90 3,25 2,30 3,10 2,70 3,10 3,50 2,20 3,011 2,664 2,908 2,625 3,50 term. 10 3,30 2,30 2,27 2,75 2,40 3,00 3,00 2,80 2,70 2,724
term. 8 2,80 3,10 3,10 3,50 2,95 2,80 3,30 3,80 3,169
term. 11 3,25 3,50 3,30
term. 12 3,30 3,20 3,00 3,60 3,30 2,90
term. 13 2,90 2,70 2,75 3,00
term. 14 3,40 3,20 3,00 2,90 3,50 3,00 3,50 2,60
term. 15 4,30 3,50 3,30 3,10 3,50 3,50 3,00
term. 16 2,90 4,25 4,10 3,60 3,60 3,60 2,95 2,65
3,35
3,217
2,838
3,138
3,457
3,456
commit todalam user Simpul maksimal memiliki 15 simpul dengan perhitungan selisih jumlah
kuadrat deviasi sebagai berikut. Simpul 9 (memiliki simpul anak yaitu simpul terminal 5 dan simpul terminal 6 seperti pada Tabel 4.3)
39
perpustakaan.uns.ac.id
digilib.uns.ac.id
commit to user
Perhitungan selisih jumlah kuadrat deviasi
pada 14 simpul dalam
lainnya dilakukan dengan cara yang sama dan diperoleh hasil seperti pada Tabel 4.4. Pada Tabel 4.4 terlihat bahwa semua simpul dalam pohon regresi maksimal tidak memenuhi
sehingga pemangkasan dimulai dari pohon yang memiliki
40
. Pemangkasan pertama terjadi pada simpul 9 karena simpul 9 memiliki nilai selisih jumlah kuadrat deviasi terkecil. Simpul anak dari simpul 9 yaitu simpul akhir 5 dan simpul akhir 6 dipangkas sehingga simpul 9 menjadi simpul akhir. Pemangkasan pertama menghasilkan 14 simpul dalam dan 15 simpul akhir. Pada proses pemangkasan kedua, simpul 13 mengalami pemangkasan karena memiliki selisih jumlah kuadrat deviasi terkecil diantara 13 simpul dalam lainnya. digilib.uns.ac.id Simpul anak dari perpustakaan.uns.ac.id simpul 13 yaitu simpul 14, simpul 15, simpul akhir 12, 13, 14, dan
15 dipangkas sehingga simpul 13 menjadi simpul akhir. Pemangkasan kedua menghasilkan 11 simpul dalam dan 12 simpul akhir. Proses pemangkasan berlanjut sampai tidak ada lagi pemangkasan yang mungkin yaitu hanya terdapat 1 simpul dalam dan 2 simpul anak.
Tabel 4.4. Selisih Jumlah Kuadrat Deviasi pada Proses Pemangkasan Pertama No.
Simpul Dalam
No.
Simpul Dalam
1
Simpul 3
0,592
9
Simpul 6
0,603
2
Simpul 9
0,241
10
Simpul 5
0,567
3
Simpul 12
1,897
11
Simpul 13
0,295
4
Simpul 14
0,345
12
Simpul 11
0,816
5
Simpul 15
0,381
13
Simpul 10
0,857
6
Simpul 2
0,864
14
Simpul 4
1,079
7
Simpul 8
0,496
15
Simpul 1
1,284
8
Simpul 7
0,833 commit to user
4.2.3 Pohon Regresi Optimal Setelah dilakukan pemangkasan pohon, langkah selanjutnya adalah pemilihan pohon regresi optimal. Dari 11 sub pohon yang terbentuk akan dipilih 1 pohon regresi dengan nilai kesalahan penduga pengganti terkecil. Data uji yang digunakan dapat dilihat pada Tabel 4.5. Rumus kesalahan penduga sampel uji yaitu
41
dan rumus kesalahan relatif penduga sampel uji
digunakan untuk pemilihan pohon regresi optimal. Nilai kesalahan relatif penduga sampel uji dari masing-masing sub pohon terlihat pada Tabel 4.6. Nilai rata-rata dari perpustakaan.uns.ac.id setiap simpul akhir merupakan nilai prediksi
simpul terakhir tersebut. Nilai
dari variabel respon pada kasus
digilib.uns.ac.id
dapat dilihat pada Gambar 4.6.
Tabel 4.5. Data Uji No.
Y
X1
X2
X3
X4
X5
X6
X7
X8
X9
1 2 3 4 5 6 7 8 9 10
3,50 2,60 3,20 2,65 3,60 3,10 3,10 3,00 3,10 3,60
35 26 35 25 35 25 40 29 31 24
2 1 2 2 2 1 2 2 2 1
3 2 2 2 3 2 2 2 3 2
12 15 10 14 10 8 15 12 12 10
2 2 2 2 2 2 2 2 2 2
2 2 2 2 1 2 2 1 2 2
1 3 1 2 1 2 2 1 2 2
2 2 2 2 2 1 1 1 2 2
3 2 3 2 3 3 3 2 3 3
Perhitungan kesalahan relatif pada pohon optimal menggunakan penduga sampel uji sebagai berikut. Kesalahan penduga sampel uji:
commit to user
42
Rata-rata kesalahan data uji:
perpustakaan.uns.ac.id
digilib.uns.ac.id
Kesalahan relatif penduga sampel uji :
commit to user
Nilai ± pada Tabel 4.6 merupakan nilai penduga kesalahan standar yaitu ukuran dari ketidakpastian di sekitar tingkat kesalahan sebenarnya (sampel uji) dari pohon tersebut saat berhadapan dengan data baru. Nilai penduga kesalahan standar memberikan gambaran ketidakpastian dari penduga tingkat kesalahan. Penduga kesalahan standar diperoleh menggunakan persamaan (2.10) yaitu
43
Tabel 4.6. Nilai Kesalahan Relatif Penduga Sampel Uji Sub
Jumlah Simpul
Kesalahan Relatif
Pohon
Akhir
Penduga Sampel Uji
16 15 12 11 8 7 5 4 3 2 1
0,945 ± 0,251 1,011 ± 0,275 0,955 ± 0,242 0,924 ± 0,230 digilib.uns.ac.id 0,895 ± 0,223 0,895 ± 0,223 0,778 ± 0,189 1,043 ± 0,054 1,043 ± 0,054 1,061 ± 0,161 1,171 ± 0,275
1 2 3 4 perpustakaan.uns.ac.id 5 6 7** 8 9 10 11 **Optimal
Perhitungan penduga kesalahan standar sebagai berikut.
Berdasarkan data pada Tabel 4.7 diperoleh nilai
Berdasarkan data pada Tabel 4.3 diperoleh nilai commit to user
sebagai berikut
dan
sebagai berikut
44
Tabel 4.7. Perhitungan
3,1
2,912
0,035
0,001
3,1
2,912
0,035
0,001
3
2,912
0,008
0,000
2,6
3,095
0,245
0,060
3,095
digilib.uns.ac.id 0,198
0,039
3,1
3,095
0,000
0,000
3,6
3,095
0,255
0,065
3,5
3,456
0,002
0,000
3,2
3,456
0,066
0,004
3,6
3,456
0,021
0,000
jumlah
0,865
0,172
2,65
perpustakaan.uns.ac.id
Berdasarkan data pada Tabel 4.8 diperoleh nilai
commit to user
sebagai berikut
45
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.8. Perhitungan
3,1
0,002
0,000
0,002
0,000
0,021
0,000
0,297
0,088
0,245
0,060
0,002
0,000
0,207
0,043
0,126
0,016
0,003
0,000
0,207 jumlah = 1,112
0,043 jumlah = 0,025
3,1 3 2,6 2,65 3,1 3,6 3,5 3,2 3,6
commit to user
Jadi, nilai penduga kesalahan standar atau ukuran dari ketidakpastian di sekitar tingkat kesalahan sebenarnya (sampel uji) dari pohon tersebut saat berhadapan dengan data baru sebesar
. Pada Tabel 4.6 dapat ditunjukkan bahwa pohon
regresi optimal yang terpilih adalah pohon regresi penduga sampel uji terkecil sebesar
yang memiliki kesalahan relatif yang berarti nilai kesalahan
prediksi besarnya berat badan bayi saat lahir dari pohon regresi optimal terhadap data yang dihitung berdasarkan penduga sampel uji berkisar antara
sampai
.
46
Pohon regresi optimal dapat dilihat pada Gambar 4.6. Pohon yang terpilih memiliki 4 simpul dalam dan 5 simpul akhir, dengan 4 tingkat kedalaman pohon regresi. Pada pohon regresi optimal ditunjukkan bahwa dari 9 variabel yang mempengaruhi berat badan bayi saat lahir, hanya 3 variabel yang membentuk pola hubungan yaitu variabel usia ibu hamil status pekerjaan ibu
, kenaikan berat badan ibu
dan
.
perpustakaan.uns.ac.id
digilib.uns.ac.id
Node 1 X4 <= 7.500 STD = 0.451 Avg = 3.007 N = 90 Node 2 X1 <= 28.500 STD = 0.361 Avg = 2.750 N = 16 Terminal Node 1 STD = 0.126 Avg = 2.450 N=6
Terminal Node 2 STD = 0.335 Avg = 2.930 N = 10
Node 3 X8 = (1) STD = 0.450 Avg = 3.062 N = 74 Terminal Node 3 STD = 0.407 Avg = 2.912 N = 29
Node 4 X1 <= 32.500 STD = 0.449 Avg = 3.159 N = 45 Terminal Node 4 STD = 0.399 Avg = 3.095 N = 37
Terminal Node 5 STD = 0.539 Avg = 3.456 N=8
Gambar 4.6. Pohon Regresi Optimal Pada Gambar 4.6 dapat diketahui bahwa variabel yang menjadi pemilah utama commit to user adalah variabel
yaitu kenaikan berat badan ibu. Variabel ini memilah 90 data
berat badan bayi menjadi 2 kelompok yaitu sebanyak 16 data dengan kenaikan berat badan ibu
kilogram masuk ke dalam simpul 2, sedangkan 74 data lainnya
dengan kenaikan berat badan ibu
kilogram masuk ke dalam simpul 3. Rata-rata
berat badan bayi saat lahir adalah 3,007 kilogram dengan standar deviasi sebesar 0,451.
47
Pada simpul 2, sebanyak 16 data berat badan bayi dipilah lagi berdasarkan variabel usia ibu hamil bayi dengan usia ibu hamil
menjadi 2 kelompok yaitu sebanyak 6 data berat badan tahun masuk ke dalam simpul kiri yaitu simpul
akhir 1 (sudah homogen) dan 10 data lainnya dengan usia ibu hamil
tahun,
masuk ke dalam simpul kanan yaitu simpul akhir 2 (sudah homogen). Rata-rata berat badan bayi saat lahir adalah 2,750 kilogram dengan standar deviasi sebesar 0,361. Pada simpulperpustakaan.uns.ac.id 3, variabel status pekerjaan ibu
memberi nilai penurunan
digilib.uns.ac.id
keheterogenan yang tinggi sebagai pemilah. Sebanyak 74 data berat badan bayi dipilah menjadi 2 kelompok yaitu sebanyak 29 data berat badan bayi dengan status pekerjaan ibu adalah bekerja masuk ke dalam simpul kiri yaitu simpul akhir 3 (sudah homogen) dan 45 data lainnya dengan status pekerjaan ibu tidak bekerja, masuk ke dalam simpul kanan yaitu simpul 4. Rata-rata berat badan bayi saat lahir adalah 3,062 kilogram dengan standar deviasi sebesar 0,450. Pada simpul 4, variabel usia ibu hamil
memberi nilai penurunan
keheterogenan yang tinggi sebagai pemilah. Sebanyak 45 data berat badan bayi dipilah menjadi 2 kelompok yaitu sebanyak 37 data berat badan bayi dengan usia ibu hamil
tahun masuk ke dalam simpul kiri yaitu simpul akhir 4 (sudah
homogen) dan 8 data lainnya dengan usia ibu hamil
tahun, masuk ke dalam
simpul kanan yaitu simpul akhir 5 (sudah homogen). Rata-rata berat badan bayi saat lahir adalah 3,159 kilogram dengan standar deviasi sebesar 0,449. Pada setiap simpul akhir diketahui bahwa sebanyak 6 data berat badan bayi masuk ke dalam simpul akhir 1 dengan rata-rata berat badan bayi saat lahir adalah commit to user
2,450 dan standar deviasi sebesar 0,126. Sebanyak 10 data berat badan bayi masuk ke dalam simpul akhir 2 dengan rata-rata berat badan bayi saat lahir adalah 2,930 dan standar deviasi sebesar 0,335. Sebanyak 29 data berat badan bayi masuk ke dalam simpul akhir 3 dengan rata-rata berat badan bayi saat lahir adalah 2,912 dan standar deviasi sebesar 0,407. Sebanyak 37 data berat badan bayi masuk ke dalam simpul akhir 4 dengan rata-rata berat badan bayi saat lahir adalah 3,095 dan standar deviasi sebesar 0,399. Sebanyak 8 data berat badan bayi masuk ke dalam simpul akhir 5
48
dengan rata-rata berat badan bayi saat lahir adalah 3,456 dan standar deviasi sebesar 0,539. 4.2.4 Pemilihan Pohon Regresi dari Kelompok Data Percobaan Berdasarkan percobaan yang dilakukan pada 10 kelompok data yang dipilih secara random ternyata tidak semua kelompok data menghasilkan pohon regresi. Dari 10 kelompok data percobaan, terbentuk 5 pohondigilib.uns.ac.id regresi yang memiliki nilai perpustakaan.uns.ac.id kesalahan relatif penduga sampel uji. Perhitungan nilai kesalahan relatif penduga sampel uji dilakukan dengan cara sama seperti perhitungan pada Tabel 4.6 dan dengan menggunakan software diperoleh hasil seperti terlihat pada Tabel 4.9. Tabel 4.9. Pohon Regresi dari Kelompok Data Percobaan Kelompok Data 1 2 3 4 5
Jumlah Simpul Akhir Pohon Maksimal
Pohon Optimal
17 16 15 21 18
10 5 7 5 7
Kesalahan Relatif Penduga Sampel Uji 1,045 0,778 1,944 1,499 1,030
0,258 0,189 0,783 0,878 0,179
Pada Tabel 4.9 terlihat bahwa kelompok data ke-2 memiliki nilai kesalahan relatif penduga sampel uji terkecil yaitu 0,778
0,189. Dengan demikian, kelompok
data ke-2 terpilih sebagai pohon regresi yang digunakan untuk membentuk pola commit to user hubungan antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat
lahir di kota Surakarta. Pohon regresi optimal yang terpilih dapat dilihat pada Gambar 4.6.
BAB V PENUTUP
5.1 Kesimpulan Berdasarkan hasil dari pembahasan, dapat disimpulkan bahwa pola hubungan antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat lahir di kota Surakarta sebagai perpustakaan.uns.ac.id berikut:
digilib.uns.ac.id
1. jika kenaikan berat badan ibu
kilogram dan usia ibu hamil
tahun maka rata-rata berat badan bayi saat lahir sebesar 2,450 kilogram, 2. jika kenaikan berat badan ibu
kilogram dan usia ibu hamil
tahun maka rata-rata berat badan bayi saat lahir sebesar 2,930 kilogram, 3. jika kenaikan berat badan ibu
kilogram dan status pekerjaan ibu
adalah bekerja maka rata-rata berat badan bayi saat lahir sebesar 2,912 kilogram, 4. jika kenaikan berat badan ibu
kilogram, status pekerjaan ibu
tidak bekerja dan usia ibu hamil
maka rata-rata berat badan bayi
saat lahir sebesar 3,095 kilogram, 5. jika kenaikan berat badan ibu
kilogram, status pekerjaan ibu maka rata-rata berat badan bayi
tidak bekerja dan usia ibu hamil saat lahir sebesar 3,456 kilogram. Variabel lainnya yaitu jarak kehamilan penyakit saat kehamilan kehamilan
, jumlah anak yang dilahirkan
, ibu menderita anemia
, dan pendidikan ibu
tidak masuk ke dalam pola hubungan.
,
, frekuensi pemeriksaan
tidak berpengaruh secara dominan sehingga commit to user
49
50
5.2 Saran Pada penelitian ini penulis menerapkan metode pohon regresi untuk menganalisis faktor-faktor yang mempengaruhi berat badan bayi saat lahir. Penelitian dilakukan hanya di lingkungan Kota Surakarta. Disarankan kepada pembaca yang tertarik dapat mengembangkan metode ini pada ruang sampel yang lebih besar dan dapat menambah variabel lain seperti kenaikan berat badan ibu per trimester serta usia kehamilan saat melahirkan. perpustakaan.uns.ac.id
digilib.uns.ac.id
Disarankan kepada ibu-ibu yang sedang hamil di Kota Surakarta untuk memperhatikan faktor-faktor dominan yang berpengaruh terhadap berat badan bayi saat lahir untuk mencegah terjadinya BBLR.
commit to user