BAB II TINJAUAN PUSTAKA
2.1
Penelitian Sebelumnya Penelitian tentang MARS telah banyak dilakukan. Salah satunya yaitu
penelitian yang berjudul Penerapan Metode Multivariate Adaptive Regression Splines (MARS) untuk Mengidentifikasi Komponen Yang Berpengaruh Terhadap Peringkat Akreditasi Sekolah pada SMA/MA di Provinsi Sumatra Barat oleh Febriyanti (2013). Pada penelitian tersebut, peringkat akreditasi yang didapatkan oleh sekolah dapat dikelompokan menjadi dua kelompok dengan kelompok 1 adalah sekolah yang terakreditasi A atau B, dan kelompok 2 adalah sekolah yang terakreditasi C atau tidak terakreditasi. Hasil pendugaan pengelompokan sekolah dengan metode MARS menghasilkan beberapa variabel yang berpengaruh secara signifikan, antara lain : komponen standar sarana dan prasarana (X5), komponen standar kompetensi lulusan (X3), komponen standar penilaian (X8), komponen standar isi (X1), komponen standar pembiyaan (X7), komponen standar proses(X2), dan komponen standar pengelolaan (X6). Selain itu, ada juga penelitian yang berjudul Pemodelan Kemiskinan di Provinsi Jawa Timur dengan Pendekatan Multivariate Adaptive oleh Pintowati (2012). Pada penelitian tersebut variabel respon yang digunakan adalah 3 indikator kemiskinan meliputi persentase penduduk miskin, indeks kedalaman kemiskinan, dan indeks keparahan kemiskinan. Sedangkan variabel prediktor yang digunakan ada 10 6
7
variabel dari segi ekonomi, kesehatan, pendidikan dan lingkungan. Hasilnya diperoleh tiga model yaitu untuk variabel respon persentase penduduk miskin model MARS terbaiknya adalah model dengan BF=20, MI=2 dan MO=2, untuk variabel respon indeks kedalaman kemiskinan model MARS terbaiknya adalah model MARS dengan BF=20, MI= 2 dan MO=0, dan untuk variabel respon indeks keparahan kemiskinan model MARS terbaiknya adalah
model dengan BF=20, MI=1 dan
MO=3. Penelitian-penelitian tersebut menjadi acuan bagi penulis dalam penelitian ini. Pada penelitian tersebut, MARS digunakan untuk permasalahan yang berdimensi tinggi dan untuk data yang tidak diketahui bentuk kurva regresinya. Berdasarkan penelitian yang telah dilakukan mengenai MARS, akan dijadikan teori untuk mendukung penelitian yang akan dilakukan. 2.2
Landasan Teori
2.2.1 Multivariate Adaptive Regression Splines (MARS) Multivariate Adaptive Regression Splines (MARS) merupakan pendekatan untuk regresi multivariat nonparametrik yang menghasilkan pemodelan regresi yang fleksibel. Metode ini diperkenalkan oleh Jerome H. Friedman pada tahun 1990. Model MARS difokuskan untuk mengatasi permasalahan berdimensi tinggi, memiliki variable prediktor 3
8
Misal Y adalah peubah respon tunggal yang dipengaruhi oleh peubah predictor X sebanyak p, dimana X ( X 1 , X 2 ,..., X P ) , maka Y dapat dinyatakan dalam model regresi sebagai berikut : Y f ( X 1 , X 2 ,..., X P )
(2.1)
Dengan domain D merupakan subset dari ruang berdimensi p. Sisaan diasumsikan memiliki rataan nol dan ragam . Dari persamaan (2.1), misalkan terdapat sampel 2
sebanyak N untuk Y dan X ( X 1 , X 2 ,..., X P ) dinyatakan sebagai yi , x1i , x2i ,..., x pi i 1 . N
Ambil R j Sj1 yang merupakan subset yang saling lepas dari domain D, sehingga S
D j 1 R j .RPR menduga fungsi f (x) yang tidak diketahui dengan S
^
f ( x) C j ( x) B j ( x)
(2.2)
j 1
Dengan B j ( x) I x R j , I adalah fungsi indikator yang bernilai 1 jika benar dan bernilai 0 jika salah. dan Cj (x) adalah koefisien subregion. Setiap fungsi indikator merupakan perkalian dari fungsi univariat yang menggambarkan setiap subregion R j . Secara umum, RPR mempunyai dua tahap yaitu tahap forward dan backward. Dimulai dari subregion pertama R1=D, tahap forward memilah domain D secara iteratif menjadi himpunan bagian (subregion) yang saling lepas
R
M
j
j 2
, untuk
M S. Dengan M ditentukan sebarang. Selanjutnya, tahap backward berlawanan dengan tahap forward yaitu menghilangkan atau memangkas subregion dari model dengan dua kriteria yaitu evaluasi dugaan model dan jumlah subregion dalam model.
9
Tahap forward dan backward ini menghasilkan sekumpulan subregion yang tidak ^
saling tumpang tindih, sehingga f ( x) mendekati f (x) untuk setiap subregion daerah asal. RPR merupakan metode yang mampu mengatasi kesulitan dalam menentukan knot karena knot ditentukan oleh data. Namun RPR masih memiliki kekurangan dalam pemodelan regresi. Kekurangan RPR yaitu belum cukup mampu menduga
f (x) linier atau aditif dan model RPR menghasilkan subregion yang tidak kontinu pada knot (Friedman, 1991). b. Modifikasi Recursive Partition Regression (RPR) Untuk mengatasi kekurangan dari RPR, Jerome H. Friedman melakukan modifikasi. Untuk menduga fungsi linier atau aditif, Friedman melakukan inovasi dengan cara tidak menghapus induk atau parent region selama pemilahan subregion dilakukan. Sehingga pada iterasi selanjutnya parent dan pilahan subregion dapat dipilah lebih lanjut, hal ini akan menghasilkan subregion yang saling tumpang tindih. Selain itu, modifikasi ini juga menghasilkan model linier dengan pemilahan berulang pada peubah prediktor yang berbeda serta menghasilkan model yang fleksibel (Friedman, 1991). Modifikasi tersebut belum dapat mengatasi diskontinuitas pada titik knot yang disebabkan oleh adanya perkalian fungsi univariat. Oleh karena itu Friedman mengganti perkalian fungsi univariat dengan regresi linier spline ordo satu. Pada regresi splines ini sisi kiri (-) dan sisi kanan (+) truncated spline sebagai berikut :
10
sj
B j ( x) ( S ij ( xk (i , j ) xk*(i , j ) ))
(2.3)
i 1
Dengan S j jumlah pilihan subregion ke-j dari domain D, xk*(i , j ) merupakan knot dari peubah prediktor xk (i , j ) dan S ij nilainya 1 atau -1 jika knot ada di kanan atau di kiri subregion. Beberapa hal yang perlu diperhatikan dalam membuat model MARS adalah (Friedman, 1991) : a. Knot merupakan nilai variabel prediktor ketika slope suatu garis regresi mengalami perubahan yang dapat didefinisikan sebagai akhir dari sebuah garis regresi (region) dan awal dari sebuah garis regresi (region) yang lain. Pada setiap titik knot, diharapkan adanya kontinuitas dari fungsi basis antar satu region dengan region lainnya. Minimum jarak antara knot atau minimum observasi (MO) antara knot adalah 0,1,2, dan 3 observasi. b. Fungsi Basis (BF) yaitu suatu fungsi parametrik yang didefinisikan pada tiap region yang digunakan untuk menjelaskan hubungan antara variable respon dan variable prediktornya. Fungsi basis ini berupa selang antar knot yang berurutan. Pada umumnya fungsi basis yang dipilih berbentuk polynomial dengan turunan yang kontinu pada setiap titik knot. Maksimum fungsi basis yang diizinkan adalah 2-4 kali jumlah variable prediktornya. c. Interaction (interaksi ) merupakan hasil perkalian silang antar variable yang saling berkorelasi. Jumlah maksimum interaksi (MI) yang diperbolehkan adalah
11
1,2, dan 3. Jika MI > 3 akan dihasilkan model yang semakin kompleks dan model akan sulit untuk diinterpretasi. Knot pada metode MARS ditentukan secara otomatis oleh data dan menghasilkan model yang kontinu pada knot.
Penentuan knot pada MARS
menggunakan algoritma forward dan backward (lampiran 3). Algoritma forward digunakan untuk mendapatkan jumlah fungsi basis maksimum. dengan kriteria pemilihan fungsi basis adalah dengan meminimumkan Mean Squared Error (MSE). MSE dapat dihitung dengan rumus sebagai berikut : 1 n MSE yi f M ( xi ) n i 1
2
dengan :
xi
: variabel prediktor
yi
: variabel respon
n
: banyaknya pengamatan
f M ( xi ) : dugaan fungsi f (x) dengan metode Recursive Partition Regression
Pada tahap backward dipilih satu fungsi basis dan mengeluarkan basis tersebut jika kontribusinya terhadap model kecil. Hal ini dilakukan untuk memenuhi konsep parsimoni (model yang sederhana). Proses backward akan terus dilanjutkan hingga tidak ada lagi fungsi basis yang dapat dikeluarkan atau dengan kata lain fungsi basis yang tersisa pada model adalah fungsi basis yang berpengaruh signifikan terhadap model. Ukuran kontribusi pada tahap backward dilakukan berdasarkan
12
kriteria validasi silang atau GCV (Generalized Cross Validation). Caranya adalah dengan meminimumkan nilai GCV. Pada MARS, kriteria pemilihan model terbaik adalah jika nilai GCV pada model tersebut mempunyai nilai yang paling rendah (minimum) diantara model-model lain (Friedman, 1991). Fungsi GCV minimum didefinisikan sebagai berikut :
GCV ( M )
MSE ~ 1 C ( M ) n
2
1 n y i f M ( xi ) n i 1
~ 1 C ( M ) n
2
2
(2.4)
Dengan MSE : Mean Squared Error/Kuadrat tengah eror
xi :variabel prediktor yi : variabel respon
C (M ) : Trace [B(BTB)-1BT]+1 B : matrik berukuran M n M : jumlah fungsi basis
n : banyaknya pengamatan ~
C ( M ) : C(M)+dM d : nilai ketika setiap fungsi basis mencapai optimasi 2 d 4 Algoritma MARS tahap forward dan backward menghasilkan model MARS sebagai berikut :
13
M
km
m1
k 1
f ( x) a0 am S km ( X v ( k ,m) t km )
(2.5)
Dengan :
a0 : fungsi basis induk atau konstanta regresi dari fungsi basis am : koefisien dari fungsi basis ke-m, m=1,2,…,M M : maksimum fungsi basis (nonconstant basis function) km : derajat interaksi Skm : tanda pada titik knot. Bernilai +1 jika knot berada disebelah kanan subregion dan bernilai -1 jika knot berada disebelah kiri subregion Xv(k,m) : variabel prediktor tkm : nilai knot dari variabel prediktor Xv(k,m) 2.2.2 Pengujian Signifikansi Model MARS Uji signifikansi dilakukan untuk mengetahui signifikansi parameter dan mengevaluasi kecocokan model. Uji signifikansi yang dilakukan meliputi pengujian fungsi basis secara keseluruhan atau uji simultan dan pengujian masing-masing fungsi basis atau uji parsial. a. Pengujian Koefisien Regresi Simultan Uji signifikansi yang dilakukan secara bersamaan untuk semua fungsi basis yang terdapat pada model MARS. 1. Hipotesis : H0
: αm = 0 (model tidak signifikan)
H1 : minimal terdapat satu αm ≠ 0 (model signifikan)
14
dengan m=1,2,3,…,M 2. Taraf signifikansi : α 3. Statistik uji : 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑛 𝑖=1 𝑛 𝑖=1
𝑦𝑖 −𝑦 2 /𝑀
𝑦 𝑖 −𝑦𝑖 2 /𝑁−𝑀−1
4. Daerah kritis : Tolak H0 jika nilai Fhitung > Fα(M;N-M-1 ) atau P-value < α dimana M= banyaknya fungsi basis dan N= banyaknya data b. Pengujian Koefisien Regresi Parsial Uji signifikansi secara individual untuk masing-masing fungsi basis yang terdapat dalam model MARS. 1. Hipotesis : H0 : αm = 0 (koefisien αm tidak berpengaruh terhadap model) H1 : αm ≠ 0 untuk setiap m (koefisien αm berpengaruh signifikan terhadap model) dengan m=1,2,3,…,M 2. Taraf signifikansi : α 𝑎𝑚
3. Statistik uji : 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑆𝑒
𝑎𝑚
𝑆𝑒 𝑎𝑚 =
𝑣𝑎𝑟 𝑎𝑚
4. Daerah kritis : Tolak H0 jika nilai thitung > t(α/2;N-M ) atau P-value < α dimana M= banyaknya fungsi basis dan N= banyaknya data 2.2.3 Derajat Kesehatan A.
Definisi-definisi Menurut WHO dalam Nona (2013), sehat adalah keadaan sejahtera secara
fisik, mental dan sosial yang merupakan satu kesatuan, bukan hanya terbebas dari penyakit maupun cacat. Menurut Undang-Undang Kesehatan No. 36 Tahun 2009, sehat adalah keadaan sejahtera dari badan, jiwa, dan sosial, sehingga memungkinkan
15
setiap orang dapat hidup produktif secara sosial dan ekonomi. Menurut KBBI, sehat adalah keadaan seluruh badan serta bagian-bagiannya terbebas dari sakit Derajat kesehatan adalah sesuatu yang ingin dicapai dalam bidang kesehatan. Merupakan gambaran profil kesehatan individu atau kelompok individu (masyarakat) di suatu daerah. Atau menyatakan tingkat/taraf kesehatan atau status kesehatan. Dengan adanya derajat kesehatan akan tergambarkan masalah kesehatan yang sedang dihadapi (Kementerian Kesehatan RI, 2014). B.
Indikator Derajat Kesehatan Dalam menilai derajat kesehatan, beberapa indikator yang dapat digunakan
yaitu : indikator-indikator mortalitas, indikator-indikator morbiditas, dan indikatorindikator status gizi (Kementerian Kesehatan RI, 2014) 1. Mortalitas adalah angka kematian yang diakibatkan oleh keadaan tertentu, dapat disebabkan oleh penyakit ataupun sebab lainnya yang terjadi pada kurun waktu tertentu dan tempat tertentu (Kementerian Kesehatan RI, 2014). Indikatorindikatornya yaitu : a.
Angka Kematian Ibu (AKI) adalah jumlah perempuan yang meninggal pada saat hamil, melahirkan, dan selama 42 hari setelah melahirkan (masa nifas) yang disebabkan oleh gangguan kehamilan atau penanganannya selama kehamilan dan bukan karena sebab-sebab lain, tanpa memandang lama kehamilan dan tempat persalinan per 100.000 kelahiran hidup.
16
b.
Angka Kematian Bayi (AKB) adalah jumlah bayi yang meninggal sebelum mencapai usia satu tahun yang dinyatakan dalam 1.000 kelahiran hidup pada tahun yang sama.
c.
Angka Kematian Balita (AKABA) adalah jumlah anak yang meninggal sebelum mencapai usia 5 tahun yang dinyatakan dalam per 1.000 kelahiran hidup. Angka Kematian Balita mempresentasikan peluang terjadinya kematian pada fase antara kelahiran dan sebelum umur 5 tahun.
d.
Angka Harapan Hidup (AHH) adalah rata-rata tahun hidup yang masih akan dijalani oleh seseorang yang telah berhasil mencapai umur x, pada suatu tahun tertentu dalam situasi mortalitas yang berlaku di lingkungan masyarakatnya
2. Morbiditas adalah angka kesakitan, baik disebabkan oleh kecelakaan maupun prevalen dari suatu penyakit (Kementerian Kesehatan RI, 2014). Morbiditas dapat digunakan sebagai gambaran kejadian penyakit dalam suatu populasi pada kurun waktu tertentu. Morbiditas dapat diukur dengan indikator-indikator : angka kesakitan Tuberkulosis Paru (TB. Paru), angka kesakitan Demam Berdarah Dengue (DBD), dan kesakitan terkena penyakit lainnya. 3. Status Gizi adalah hasil keseimbangan antara zat-zat gizi yang masuk (asupan gizi) dalam tubuh manusia dan jumlah yang dibutuhkan dalam penggunaannya untuk berbagai fungsi biologis termasuk pertumbuhan fisik, perkembangan, aktivitas dan pemeliharaan kesehatan (Kementerian Kesehatan RI, 2014). Status
17
gizi diukur berdasarkan berat badan (BB), tinggi badan (TB), dan umur. Indikatornya dapat berupa cukup gizi, gizi buruk dan gizi kurang. C.
Faktor-Faktor yang Mempengaruhi Derajat Kesehatan Menurut Hendrik L. Blum dalam (Nona, 2013), derajat kesehatan dipengaruhi
oleh empat faktor yaitu : faktor perilaku, faktor lingkungan, faktor pelayanan kesehatan, dan faktor genetik. Sedangkan menurut Kementerian Kesehatan RI (2014), derajat kesehatan dipengaruhi oleh banyak faktor. Faktor-faktor tersebut berasal dari sektor kesehatan seperti pelayanan kesehatan serta ketersediaan sarana dan prasarana kesehatan. Selain itu juga dipengaruhi oleh faktor yang berasal dari luar kesehatan seperti faktor ekonomi, pendidikan, lingkungan sosial, keturunan dan perilaku. 1. Perilaku Perilaku yang dimaksud adalah perilaku hidup bersih dan sehat (PHBS). PHBS adalah semua perilaku yang dilakukan atas kesadaran sehingga setiap anggota keluarga dapat menolong dirinya sendiri dibidang kesehatan dan berperan aktif dalam kegiatan-kegiatan kesehatan masyarakat. PHBS di rumah tangga adalah upaya untuk memberdayakan anggota rumah tangga agar tahu, mau dan mampu mempraktikkan perilaku hidup bersih dan sehat serta berperan aktif dalam gerakan kesehatan di masyarakat. Indikator perilaku sehat adalah (Kementerian Kesehatan RI, 2014) : a. Persentase rumah tangga yang berperilaku hidup bersih dan sehat (PHBS) b. Persentase bayi yang diberi ASI eksklusif c. Persentase posyandu yang aktif d. Kunjungan ibu hamil (K4)
18
e. Persentase peserta KB aktif f. Persentase kunjungan neonatus 3 kali 2. Lingkungan Menurut Kementerian Kesehatan RI (2014), lingkungan merupakan salah satu variabel yang mendapatkan perhatian khusus dalam menilai kesehatan masyarakat. Indikator-indikator sebagai berikut : a. Persentase rumah sehat b. Persentase keluarga yang memiliki jamban sehat c. Persentase keluarga dengan sumber air minum terlindung 3.
Pelayanan kesehatan dapat dilihat dengan indikator-indikator sebagai berikut
(Kementerian Kesehatan RI, 2014) : a. Persentase pelayanan ibu nifas b. Persentase persalinan yang ditolong oleh tenaga kesehatan c. Persentase ibu hamil mendapat tablet Fe3 d. Persentase pelayanan balita 4.
Genetik Genetik atau keturunan berpengaruh terhadap derajat kesehatan, karena ada
beberapa penyakit yang diturunkan lewat gen seperti albino, leukemia, diabetes, hemofilia. Kondisi ini terjadi ketika individu lahir dari dua individu sehat pembawa kelainan satu atau lebih gen, dan dapat juga terjadi ketika kelainan satu atau lebih gen merupakan gen yang dominan. Faktor ini sulit untuk diatasi karena merupakan bawaan seseorang sejak lahir (Kementerian Kesehatan RI, 2014).
19
5.
Ekonomi Menurut Dinas Kesehatan Provinsi Bali (2014), tingkat ekonomi masyarakat
berpengaruh terhadap derajat kesehatan masyarakat. Indikatornya yaitu : a. Jumlah penduduk yang bekerja di sektor pertanian b. Jumlah masyarakat miskin 6.
Pendidikan Menurut Dinas Kesehatan Provinsi Bali (2014), tingkat pendidikan
masyarakat berpengaruh terhadap derajat kesehatan masyarakat. Indikatornya yaitu : a. Jumlah murid SD dan SMP b. Jumlah penduduk menurut tingkat pendidikan tertinggi yang ditamatkan (sarjana)