TINJAUAN PUSTAKA Pohon Klasifikasi Konsep Dasar Metode Pohon Klasifikasi Metode klasifikasi dengan struktur pohon untuk peubah respons tunggal diperkenalkan oleh Breiman et al. (1984). Klasifikasi berstruktur pohon untuk peubah respons tunggal disusun berdasarkan pemilahan secara iteratif terhadap peubah penjelasnya.
Pemilahan pertama dilakukan terhadap seluruh amatan
sehingga diperoleh dua gugus amatan. Pemilahan bcrikutnya dilakukan terhadap kedua gugus amatan tersebut sehingga diperoleh masing-masing dua gugus amatan berikutnya. Setiap pemilahan selalu melibatkan semua peubah penjelas dan selalu menghasilkan satu peubah pemilah yang mencerminkan karakteristik kedua gugus amatan yang terbentuk. Adapun pembentukan pohon klasifikasi terdii dari tahapan-tahapan sebagai berikut :
1 . Penentuan peubah-peubah dan nilai-niiai pemilah. 2. Penentuan simpul terminal 3. Penentuan ukuran pohon k l a s i f h i yang optimum. Gambar 1 menampillcan sebuah struktur pohon sederhana yang mempunyai 3 lapisan simpul, yaitu :
1) Lapisan pertama terdiri dari simpul akar (root node). 2) Lapisan kedua terdiri 1 simpul dalam (internal node) dan 1 simpul terminal. 3) Lapisan ketiga terdii dari 2 simpul terminal (terminal node).
Terminal
Gambar 1. Shvktur Pohon Sederhana
Simpul Terminal
Setiap simpul dalam akan terpilah kembali menjadi dua anak simpul di bawabya, sedangkan simpul terminal adalah simpul akhir yang tidak dapat terpilah kembali dengan adanya aturan jumlah amatan minimum pada setiap simpul. Dengan demikian, simpul terminal ditentukan berdasarkan jumlah amatan minimum yang dikandungnya. Peubah Respons Biner Ganda Peubah respons yang digunakan dalam metode klasifikasi berstruktur pohon pada penelitian ini adalah peubah-peubah yang bersifat kategorik dengan dua kategori. Peubah respons tersebut banyak dijumpai dalam penelitian yang bersifat klinis clan observasional. Selanjutnya peubah respons tersebut dinamakan peubah respons biner ganda. Kriteria Pernilahan Simpul Berikut akan dipaparkan proses pembentukan pohon klasifikasi dan kriteriahkwan yang digunakannya. Misal terdapat sejumlah p peubah penjelas X
dan q peubah respons b i e r Y untuk n individu yang diamati. Untuk individu ke-i, ukurannya adalah :
..., xlp)' dengan i = l,2, ..., n dan XI = (X,I,XQ, Pohon klasifikasi dibentuk melalui pemilahan pa& simpul akar menjadi dua anak YI
= (Y,I,YQ,
...,ylq)'
simpul, yaitu anak simpul kiri dan anak simpul kanan. Kedua anak simpul yang terbentuk dapat berupa simpul dalam atau simpul terminal. Jika berupa simpul dalam, maka simpul tersebut akan dipilah lagi menjadi anak simpul kanan dan
anak simpul kiri berikutnya. Misalkan x, &ah suatu peubah penjelas X.
nilai-nilai amatan terurut dari
Aturan pemilahan yang digunakan adalah sebagai
berikut :
1. Tiap pemilahan tergantung pada nilai yang berasal dari satu peubah penjelas. 2. Untuk peubah penjelas yang bersifat kontinu, pemilahan hanya berasal dari pertanyaan "Apakah x, 5 c ?'untuk c
E
%I, dengan kata lain nilai
pemilah c harus berada di dalam rentang nilai-nilai yang diamati dalam X. Jadi, jika terdapat sebanyak-banyaknya k nilai amatan berbeda pada peubah penjelas X, maka akan terdapat sebanyak-banyaknya k-1
pemilahan (split) yang berbeda yang dibentuk oleh gugus pertanyaan ("Apakah xj 5 ci ?" ), defigan i = 1,2,3,
..., a-1 dan c, &ah
nilai tengah
(midlepoint) antara dua nilai amatan b e m t a n dari peubah X. 3. Untuk peubah penjelas kategorik, pemilahan yang terjadi berasal dari semua kemungkinan pemilahan berdasarkan terbentuknya dua anak gugus amatan yang saling lepas (disjoint). Jika peubah X merupakan peubah kategorik nominal bertaraf L, maka akan ada 2"'- 1 pemilahan, sedangkan jika X berupa peubah kategorik ordinal, maka akan ada L
- 1 pemilahan
yang mungkin. Simpul akar mengandung seluruh contoh yang diamati dan simpul-simpul lainnya berhubungan dengan sub-grup dari contoh yang diamati. Dua sub-grup yang ada di kiri dan kanan anak simpul tidak saling berkaitan dan gabungannya membentuk sub-grup untuk simpul induk. Dengan adanya sejumlah peubah penjelas clan sejumlah nilai pemilah, simpul akar dapat terbagi menjadi 2 simpul dengan banyak cara. Karenanya diperlukan kriteria untuk memilii sebuah pemilahan. Kriteria yang diiaksud yaitu pemilahan pada tiap simpul secara rekursif dengan cara sebagai berikut : 1. Cari semua kemungkinan pemilahan pada tiap peubah penjelas. 2. Pilih "pernilahan terbaik" dari masing-masing peubah penjelas dan pilih "pemilahan terbaik" dari "kumpulan pemilahan terbaik" tersebut. "Pemilahan terbaik" adalah pemilahan yang memaksimumkan ukuran homogenitas di dalam masing-masing anak simpul relatif terhadap simpul induknya dan yang memaksimumkan ukuran pernilahan antara dua anak simpul tersebut. Ukuran Homogenitas Simpul
Misalkan terdapat peubah penjelas Xj dan peubah respons YI, Sebuah pemilahan dipilih jika sebaran nilai-nilai amatan pada Yk ddam anak sinipul bersifat homogen. Berikut adalah deskripsi untuk menentukan ukuran homogenitas simpul yang dijelaskan oleh Zhang (1998). Berikut ini adalah
tabel yang dapat dibuat sebagai hasil dari pertanyaan yk'o
apakah xj
<
c?":
yk= 1
Tidak Simpul Kiri ( t~ )
"
Ya
xj S c
n~
Simpul Kanan ( t~ ) xj z c
nz. nI
n.2
Penentuan ukuran homogenitas dimulai dari simpul kiri ( tl hams mengandung rill yang lebih besar dari
1112
).
Simpul kiui ( t~ )
atau sebaliknya. Ukuran yang
sering digunakan untuk homogenitas simpul ditentukan melalui fungsi entropi sebagai berikut :
Sebuah pernilahan dipilih dengan memaksimalkan homogenitas simpul yang terboboti :
Hal yang perlu diperhatikan adalah bahwa h g s i entropi (1) memiliki sebuah interpretasi pararnetrik. Misalkan Ykpada simpul t~mengikuti sebaran binomial dengan frekuensi 8 sebagai berikut : ~ ( ~ k =t Ll )l = 6 Lalu fungsi log-likelihood dati nl, arnatan pada simpul kiri t~ adalah :
n,, log(@+ n12 log(1-e) Nilai maksimum dari fungsi log-likelihood tersebut proporsional terhadap fungsi entropi (1). Lalu fungsi entropi (1) digeneralisasi untuk kasus dengan respons biner ganda. Sebuah pendekatan parametrik dilakukan untuk menstabilkan fungsi entropi yang digeneralisasi. Misalkan y mempunyai sebaran peluang bersama sebagai berikut :
fi ;Y, Q) = exp (Y'y + Q'w
-A(Y,Q))
dengan Y dan Q = parameter-parameter fungsi.
A(Y,R)
= fimgsi yang menormalisasi dan bergantung pada
w
= vekto~acak yang memuat ( ~ 1 ~.2 .,yq-1yq, , . . ., y1y2
.
Y dan Q.
. . . yq)'
Sebaran yang berasal dari keluarga sebaran eksponensial adalah dasar dari model parametrik yang digunakan untuk respons b i e r ganda. Kemudian asumsikan bahwa sebaran bersama y tergantung kepada kombinasi linier dan jumlah ordo kedua dari komponen tersebut saja. Lebih tepatnya, asumsikan bahwa sebaran bersama y adalah : j(y ;Y , 6 )= exp (Y'y
+ Ow - A(Y,B))
(3)
dengan w = C i < j y i y j Maka fimgsi entropi yang digeneralisasi untuk homogenitas simpul kiri t~ didef~sikansebagai nilai maksimum bentuk log-likelihood dari sebaran y : ( subyek i
dengan Y dan
E t,}
i dapat dilihat sebagai nilai taksiran likelihood maksimum dari
Y dan B. Ukuran homogenitas simpul t~ dapat ditentukan dengan cara yang sama
dengan cara di atas. Setelah menentukan ukuran homogenitas, (2) digunakan kcmbali uituk memilih pemilahan yang diinginkan.
Amatan dengan Data yang Hiang Pennasalahan timbul pada saat beberapa peubah penjelas memiliki nilai-nilai amatan yang hilang (missing values). Untuk mengatasi masalah tersebut, digunakan metode yang disebut missing-together strategy (Clark dan Pregibon
1992; Zhang et al. 1996) dan peubah pengganti (surrogate) (Breiman et al. 1984). Ukuran Pohon Klasifikasi yang Optimum Pohon klasifikasi yang dibentuk dengan aturan splitting dan aturan growing berukuran sangat besar. Hal ini karena aturan penghentian (stopping rule) yang digunakan hanya berdasarkan banyaknya amatan pada simpul akhir atau besarnya peningkatan pada ukuran homogenitas simpul. Semakin banyak pemilahan yang dilakukan maka semakin kecil tingkat kesalahan prediksi. Namun, pohon klasifikasi yang besar bisa menimbulkan overfiting. Cara mengatasi masalah
tersebut adalah dengan menentukan pohon klasifikasi dengan ukuran yang optimum dengan tahapa sebagzi beriklit : 1. Penentuan pohon awal yang besar.
2. Pemangkasan pohon (pruning)secara iteratif menjadi sekuen pohon yang makin kecil.
3. Pemilihan pohon terbaik dari sekuen yang terbentuk dengan menggunakan contoh uji (test sample) atau contoh validasi silang (cross validation
sample). Pemangkasan pada langkah kedua di atas dilakukan dengan menggunakan ukuran
cost-complexity minimum (Breiman et al. 1993). Ukuran cost-complexitytersebut menunjukkan banyaknya simpul terminal dari sebuah pohon klasifikasi. Untuk melaksanakan langkah tersebut, cost-complexity dari sebuah pohon klasifikasi ditentukan oleh :
dengan : R,( T )
=
ukuran cost-complexity sebuah pohon klasifikasi
420) = complexity parameter yang menentukan jumlah simpul
terminal
IT1
=
jumlah simpul terminal
Sedangkan nilai R(T) didefinisikan sebagai :
f
dengan :
@ dan 8^ Setelah R&)
=
fungsi yang telah dijelaskan pada (3)
= parameter f yang ditaksir dari learning sample
ditentukan, langkah berikutnya adalah menentukan sebuah sekuen
dari sub-pohon optimal yang tersarang yang disimbolkan dengan :
To
2
TI
2
... 2 T ,
dengan To adalah pohon inisial dan T,,, adalah pohon yang mengandung simpul
akar saja. Kemudian, validasi silang digunakan untuk menentukan sub-pohon T*
yang memiliki ukuran cost-complexity yang minimum, yaitu : R N ( T * )='& R N ( T j )
(61
I=O
dengan :
RN(P)
=
cost-complexity sub-pohon yang minimum
RN(T,.) = cost-complexity sub-pohon ke-j
Breiman et. a1 (1984) juga menyatakan bahwa posisi dari nilai R"( minimum tidak stabil. Karenanya, Breiman
et. a1 (1984)
q) yang
menggunakan
aturan 1-standard error (SE) untuk mengatasi hal tersebut. Sehingga, sub-pohon terkecil I; * diperoleh dengan ketentuan : R N ( T , * )S R N ( T * )+ S E ( R N ( T * ) )
dengan SE ( R " (T *)) adalah simpangan baku dari R" (T*) . Kestabilan Pohon Klasifikasi Kestabilan pohon yang terbentuk merniliki arti yang sangat penting (Breirnan,
et. a1 1984). Pohon klasitikasi yang stabil memberkin informasi yang konsisten tentang hasil pengelompokan amatan, meskipun jumlah amatannya direduksi. Untuk menyelidiki kestabilan dari sebuah pohon, dilakukan tahapau sebagai berikut : 1. Membagi seluruh amatan menjadi dua kelompok amatan dengan jumlah yang sama. Kelompok amatan pertama disebut building set dan kelompok kedua disebut validnting set. 2. Sebuah pohon klasifikasi dibentuk dengan menggunakan amatan pada
building set dan hasilnya dibandiigkan dengan pohon yang terbentuk dari seluruh amatan. Sterilisasi pada Wanita Definisi dan Cara Sterilisasi Siswosudmo (2001) menyebutkan bahwa dalam ilmu kedokteran khususnya Giekologi, sterilisasi pada wanita didefinisikan sebagai setiap tindakan pada kedua tuba vulopii yang mengakibatkan tidak tetjadinya pertemuan antara sel telur wanitd dengan sperma. Cara sterilisasi yang sering digunakan hingga kini
adalah cara minilaparotomi dan cara laparoskopi (Fidruzal, 1993). Adapun teknik penyumbatan tub8 dapat dilakukan dengan beberape cara seperti ymg c!ijelaskan oleh Fidruzal(1993) dan Siswosudarmo (2001). Efek Samping Sterilisasi Fidruzal(1993) membedakan efek samping sterilisasi menjadi : 1. Efek samping dini, yaitu efek samping yang timbul kurang dari tiga minggu setelah menjalani sterilisasi. Efek samping yang terjadi berupa perdarahan, infeksi, traumalcedera organ dan kematian akibat tindakan sterilisasi.
2. Efek samping lanjut, yaitu efek samping yang timbul tiga minggu atau lebih setelah menjalani sterilisasi. Adapun faktor-faktor yang dilihat sebagai efek samping lanjut dari sterilisasi adalah : a. Siklus haid, yaitu jarak antara hari pertama haid dengan hari pertama haid pada siklus bulan berikutnya yang dihitung dalam hari.
b. Haid teratur, yaitu haid yang datang setiap bulan dengan siklus antara 21 s.d. 35 hari. c. Lama haid, yaitu jarak antara hari peasma keluarnya darah haid sampai dengan berhentinya darah haid yang dihitung dalam hari. d. Gangguan haid, yaitu keluhan fisik yang timbul selama haid. e. Perubahan kehidupan seksual adalah perubahan daiam fiekuensi hubungan intim atau perubahan frekuensi orgasme pada setiap melahkan hubungan intim setelah menjalani sterilisasi. Faktor-faktor Resiko Terjadinyn Efek Samping Sterilisasi Fidruzal (1993) dalam penelitiannya mendeskripsikan bahwa menurut survei prevalensi cli Indonesia pada tahun 1987, dari 41,2 % wanita usia subur yang tidak ingin hamil !agi, hanya sebagian kecil yang memilih kontrasepsi sterilisasi. Hingga tahun 1991, baru 5,2 % dari jumlah pasangan usia subur yang memilih sterilisasi sebagai kontrasepsi. Sebagian b a a dari wanita tersebut menolak melakukan sterilisasi dengan berbagai alasan seperti perasaan takut, takut hamil lagi, haid jadi tidak teratur clan anggapan bahwa sterilisasi menyebabkan wanita menjadi "diigin" dalam kehidupan seksual.
Berdasarkan ha1 tersebut, perlu dilakukan usaha untuk menyediakan infcxrnasi tentang efek sunping sterilisasi, yGtu dengan mengelompokkan wanita peserta KB sterilisasi berdasarkan faktor-faktor yang dapat mempenganrhi tejadinya efek samping sterilisasi, sehingga wanita usia subur mengetahui secara pasti tentang faktor-faktor apa saja yang dapat menimbulkan efek samping sterilisasi. Fidruzal (1993) menyebutkan bahwa faktor-faktor yang dapat menyebabkan atau mempengaruhi terjadinya efek samping sterilisasi berdasarkan hasil beberapa penelitian di dalam dan luar negeri adalah sebagai berikut : 1. Saat dan cara sterilisasi serta tipe penyumbatan tuba dapat menyebabkan
kemsakan cabang-cabang pembuluh arteri uterina yang menuju ovarium, sehingga mempengaruhi tejadinya perubahan pola haid, lama haid dan juga jumlah darah haid. 2. Tejadinya kompliiasi s a t sterilisasi dapat menimbulkan efek samping secara psikologis seperti perasaan menyesal dan memburuknya kehidupan seks. 3. Jenis KB dan lama KB sebelum melakukan sterilisasi juga dapat mempengaruhi terjadimya pembahan pola haid. Sebagian besar alat
kontrasepsi sangat mempengaruhi produksi honnon progesteron yang berperan &dam siklus haid dan jurnlah darah haid. Sehingga perubahan jenis KB yang digunakan juga akan mempengatuhi pola haid sewrang. 4. Usia pada saat sterilisasi juga sering mendapatkan perhatian dari beberapa peneliti. Dari hasil beberapa penelitian menunjukkan usia di atas 40 tahun dapat menjadi penyebab tejadinya efek samping sterilisasi. 5. Jumlah anak sebelum sterilisasi akan berdampak secara psikologis
terhadap sterilisasi. Seseorang dengan jumlah anak yang banyak akan mengalami perasaan khawatir seandainya sterilisasi yang dilakukan temyata tidak berhasil, sehingga hal tersebut mempengaruhi kehidupan
rumah tangganya.