1
Klasifikasi Kegiatan Partisipasi Ekonomi Perempuan Di Jawa Timur Dengan Pendekatan CART (Classification And Regression Trees) Sharfina Widyandini dan Vita Ratnasari Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail:
[email protected] Abstrak— Sebagai sumber daya manusia yang merupakan salah satu faktor produksi penting, peran serta perempuan dalam ekonomi juga dibutuhkan. Penelitian ini bertujuan untuk mendeskripsikan karakteristik perempuan di kabupaten dan kotamadya Propinsi Jawa Timur dalam kegiatan partisipasi ekonomi serta mengklasifikasikan kegiatan partisipasi ekonomi perempuan tersebut. Analisis data menggunakan tabulasi silang dan klasifikasi pohon pada metode CART dengan perempuan umur 15-64 tahun sebagai unit penelitiannya. Kegiatan partisipasi ekonomi perempuan dibedakan menjadi kategori bekerja dan tidak bekerja, dimana tidak bekerja meliputi pengangguran, mengurus rumah tangga, sekolah dan lainnya. Hasil uji independensi pada tabulasi silang menghasilkan tolak H0 yang artinya signifikan atau terdapat hubungan, untuk seluruh variabel prediktor kecuali variabel klasifikasi desa dan kota pada data kotamadya. Klasifikasi pohon di kabupaten memiliki 18 simpul terminal dan 8 kedalaman serta ketepatan klasifikasi sebesar 64,6%. Klasifikasi pohon di kotamadya memiliki 6 simpul terminal dan 5 kedalaman serta ketepatan klasifikasi sebesar 60,1%. Variabel umur menjadi pemilah terbanyak dengan skor tertinggi baik di kabupaten maupun kotamadya. Kata Kunci—CART, ekonomi perempuan, klasifikasi pohon, variabel.
I. PENDAHULUAN
P
ERAN perempuan sebagai sumber daya manusia, sangat diperlukan untuk mempercepat pembangunan di era globalisasi ini. Namun, hasil kajian yang telah dilakukan oleh Badan Penelitian dan Pengembangan Hak Asasi Manusia [1] menunjukkan bahwa partisipasi perempuan dalam kegiatan perekonomian dapat dikatakan masih kurang optimal, terdapat sejumlah kendala pula yang membatasi aktivitas perempuan untuk berkarir. Sementara itu, data BPS Jatim [2] menyebutkan bahwa jumlah penduduk di Jawa Timur relatif tinggi, dengan persentase penduduk perempuan lebih tinggi daripada laki-laki dari tahun 2008 hingga 2012. Tetapi hal ini berbanding terbalik dengan nilai TPAK perempuan (55,01), yang masih terpaut cukup jauh dari laki-laki (84,70). Penelitian ini dilakukan untuk mengetahui pengelompokkan kegiatan partisipasi ekonomi perempuan sesuai dengan variabel yang mempengaruhinya. Pengklasifikasian akan dilakukan dengan metode CART. Metode CART merupakan metode regresi nonparametrik yang bertujuan untuk mengklasifikasikan suatu kelompok observasi atau sebuah observasi ke dalam suatu sub kelompok dari suatu kelas-kelas yang diketahui. CART lebih mudah untuk
diinterpretasikan karena hasil analisis berupa topologi pohon atau berupa grafis [3], lebih akurat dan lebih cepat penghitungannya, selain itu CART juga merupakan metode yang bisa diterapkan untuk himpunan data dalam jumlah besar, variabel yang sangat banyak dan dengan skala variabel campuran melalui prosedur pemilahan biner. II. TINJAUAN PUSTAKA A. Cross Tabulation Analisis yang dilakukan untuk mengetahui ada atau tidaknya ketergantungan atau hubungan antara dua variabel. Adapun bentuk tabel kontingensinya digambarkan dalam Tabel 1 sebagai berikut. Tabel 1 Cross Tabulation rxc
1 2
1 n11 n21
Lajur 2 n12 n22
c n1c n2c
r
nr1
nr2
nrc
Baris
Hipotesis H0 : tidak ada hubungan antara dua variabel H1 : ada hubungan antara dua variabel Statistik uji yang digunakan adalah =∑
(1)
Dimana Tolak H0 jika nilai
>
atau Pvalue < α
B. Classification and Regression Trees (CART) Dalam metode CART, jika variabel responnya berbentuk kontinu maka CART yang dihasilkan adalah regresi pohon, namun jika variabel responnya berbentuk kategorik maka yang dihasilkan adalah klasifikasi pohon. Berikut merupakan langkah-langkah analisis klasifikasi pohon. 1. Pembentukan Pohon Klasifikasi Maksimal Pembentukan pohon klasifikasi membutuhkan learning sample, learning sample tersebut bersifat heterogen sehingga dilakukan pemilahan untuk mengurangi keheterogenan pada simpul utama dan memaksimumkan ukuran keheterogenan pada simpul anak. Metode pemilahan yang dapat digunakan adalah Gini, Twoing, Entropy [4] dan Informasi [5]. Namun, yang sangat mudah dan sesuai diterapkan dalam berbagai kasus yaitu Indeks Gini [4] sebagai berikut.
2 i(t)=∑ (2) keterangan : p(i,t) | p(t) adalah proporsi kelas i simpul t p(j,t) | p(t) adalah proporsi kelas j simpul t Kemudian penentuan simpul terminal, langkahnya adalah mencari kemungkinan pemilah pada variabel independen, sesuai dengan aturan, (i) Tiap pemilahan hanya bergantung pada nilai dari satu variabel independen., (ii) Jika variabel independen (xj) kontinu, pemilahan yang diijinkan adalah xj ≤ ci dan xj > ci, dimana i = 1,2,...n-1 sementara ci adalah nilai tengah dari dua amatan sampel yang berbeda variabel xj. Apabila suatu sampel berukuran n dan terdapat N nilai amatan sampel yang berbeda pada variabel xj, maka terdapat n-1 kemungkinan pemilahan, (iii) Jika variabel independen (xj) kategori, maka pemilahan berasal dari semua kemungkinan pemilahan menurut terbentuknya 2 simpul yang saling lepas. Jika variabel xj adalah kategori nominal bertaraf L maka akan diperoleh pemilahan sebanyak 2L-1-1. Tetapi, jika variabel xj kategori ordinal maka akan diperoleh pemilahan sebanyak L-1. Kedua, mencari pemilah terbaik dari setiap variabel independen. Pemilah yang terpilih akan membentuk suatu himpunan kelas yang disebut simpul satu, selanjutnya tiap pemilahan akan dilakukan pada tiap simpul sampai diperoleh simpul akhir dan menghasilkan 2 kelas yaitu simpul anak. Lalu yang terakhir adalah penandaan label kelas. Tahapan ini dilakukan berdasarkan aturan jumlah terbanyak, yaitu
5. Ketepatan Klasifikasi (1) Ukuran ketepatan klasifikasi dapat diketahui dengan berbagai cara, diantaranya dengan nilai sensitivity, specificity, error rate dan total accuracy rate. Sensitivity adalah ukuran ketepatan dari suatu kejadian yang diinginkan. Specificity merupakan suatu ukuran yang menyatakan kejadian yang tidak diinginkan. Error rate merupakan proporsi observasi yang diprediksi secara tidak benar oleh fungsi klasifikasi. Total accuracy rate adalah proporsi observasi yang diprediksi secara benar oleh fungsi klasifikasi. C. Kegiatan Partisipasi Ekonomi Perempuan Bentuk kegiatan partisipasi ekonomi perempuan pada penelitian ini dibedakan menjadi bekerja dan tidak bekerja, berdasarkan usia kerja, bekerja didefinisikan sebagai kegiatan ekonomi yang dilakukan seseorang dengan maksud memperoleh atau membantu memperoleh pendapatan atau keuntungan selama paling sedikit 1 (satu) jam secara tidak terputus selama seminggu yang lalu. Kegiatan bekerja ini mencakup, baik yang sedang bekerja maupun yang punya pekerjaan tetapi dalam seminggu yang lalu sementara tidak bekerja, misalnya karena cuti, sakit dan sejenisnya. Sementara itu tidak bekerja meliputi pengangguran, sekolah, mengurus rumah tangga dan lainnya. Adapun Definisi ketenagakerjaan menurut BPS [6] dirangkum dalam Gambar 1 Penduduk
(3) Dimana p(j|t) = proporsi kelas j pada simpul t Nj(t) = jumlah pengamatan kelas j pada simpul t N(t) = jumlah pengamatan pada simpul t Proses pembentukan pohon klasifikasi berhenti saat terdapat hanya satu pengamatan dalam tiap-tiap simpul anak atau adanya batasan minimum n. 2. Penghentian Pembentukan Pohon Klasifikasi Penghentian berhenti pada saat hanya ada satu pengamatan (n=1) dalam tiap simpul anak, semua pengamatan dalam tiap simpul anak mempunyai variabel independen yang identik sehingga tidak mungkin terjadi pemilahan, serta adanya batasan jumlah level atau tingkat kedalaman pohon maksimal [3]. 3. Pemangkasan Pohon Klasifikasi Pohon dipangkas menjadi sekuen pohon yang semakin kecil dan tersarang. Berdasarkan cost complexity prunning, resubtitution suatu pohon T pada kompleksitas α adalah ̃ (4) Keterangan R(T) = resubtitution estimate pohon T α= complexity parameter bagi penambahan satu simpul akhir pada pohon T | ̃ |= banyaknya simpul terminal pada pohon T 4. Penentuan Pohon Klasifikasi Optimal Pohon klasifikasi optimal menghasilkan pohon yang berukuran sederhana tetapi memberikan nilai kesalahan prediksi yang cukup kecil. Dua jenis penduga pengganti, yaitu penduga sampel uji (test sample estimate) dan penduga validasi silang lipat V (cross validation V-fold estimate).
Usia Kerja
Bukan Usia Kerja
Angkatan Kerja
Bekerja
Sedang Bekerja
Bukan Angkatan Kerja
Pengangguran Mencari Pekerjaan
Mempersiapkan Usaha
Sementara Tidak Bekerja
Sekolah Mengurus Rumah Tangga
Lainnya
Merasa Tidak Mungkin Mendapatkan Pekerjaan
Sudah Punya Pekerjaan Tapi Bekum Mulai Bekerja
Gambar 1 Konsep Penduduk, Usia Kerja, Angkatan Kerja, Bekerja dan Pengangguran
3 III. METODOLOGI PENELITIAN A. Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder SUSENAS tahun 2011, dengan unit penelitian individu, perempuan umur 15-64 tahun di Propinsi Jawa Timur, terdiri atas 28.472 jiwa di kabupaten dan 6.784 jiwa di kotamadya. B. Variabel Penelitian Variabel yang digunakan dalam penelitian ini terdiri dari variabel respon (Y) dan variabel prediktor (X). Berikut ini merupakan uraiannya. Tabel 2 Variabel Penelitian
Variabel
X1
Deskripsi Kegiatan partisipasi ekonomi perempuan Klasifikasi desa/kelurahan
X2
Umur
X3
Status perkawinan
X4
Hubungan dengan kepala rumah tangga
X5
Ijazah tertinggi yang dimiliki
Y
Y: X1: X2:
X3: X4: X5:
Keterangan 1 : bekerja 2 : tidak bekerja 1 : perkotaan 2 : pedesaan 1 : 15-19 tahun 2 : 20-54 tahun 3 : 55-64 tahun 1 : belum kawin 2 : kawin 3 : lainnya 1 : kepala rumah tangga 2 : istri 3 : anak 4 : lainnya 1 : tidak punya ijazah 2 : SD-SMA/sederajat 3 : D1/D2/D3 4 : D4/S1 5 : S2/S3
kegiatan partisipasi ekonomi perempuan usia kerja kurang dari 65 tahun. klasifikasi pedesaan atau perkotaan, perempuan umur 15-64 tahun dengan kategori 1-3 dikelompokkan menurut Sleumer [7] yaitu, kurang produktif penuh, golongan produktif, tidak produktif penuh. status perkawinan meliputi belum kawin, kawin, dan lainnya (cerai mati/cerai hidup). hubungan dengan kepala rumah tangga, kategori 4 terdiri atas menantu, cucu, orangtua/mertua, famili lain, pembantu rumah tangga dan lainnya. jenjang pendidikan terakhir dan mempunyai ijazah pada jenjang tersebut.
Langkah Analisis Langkah analisis yang digunakan dalam penelitian ini sebagai berikut 1. Mengidentifikasi karakteristik variabel respon dengan prediktor menggunakan crosstab, kemudian ditampilkan dalam bentuk bar chart maupun line chart. 2. Mencari ketepatan klasifikasi tertinggi dari setiap kombinasi data learning dan data testing di kabupaten dan kotamadya. 3. Pembentukan pohon klasifikasi dengan tahapan pemilihan pemilah terbaik, serta penentuan simpul terminal. 4. Penghentian pembentukan pohon klasifikasi.
5. Pemangkasan pohon klasifikasi dengan menggunakan kriteria kompleksitas kesalahan (cost complexity) yang minimum dan nilai kesalahan relatif penggantian (resubstitution relative error) yang minimum. 6. Pemilihan pohon klasifikasi optimal. III. ANALISIS DAN PEMBAHASAN A. Karakteristik Variabel Respon Terhadap Variabel Prediktor Identifikasi karakteristik antara variabel respon yakni kegiatan partisipasi ekonomi perempuan dengan masingmasing variabel prediktor, berturut-turut diantaranya klasifikasi desa dan kota, umur, status perkawinan, hubungan dengan kepala rumah tangga serta ijazah tertinggi.
Gambar 2 Persentase Kegiatan Partisipasi Ekonomi Perempuan Berdasarkan Klasifikasi Desa dan Kota (a) di kabupaten, (b) di kotamadya
Gambar 3 Persentase Kegiatan Partisipasi Ekonomi Perempuan Berdasarkan Kelompok Umur (a) di kabupaten, (b) di kotamadya
Gambar 4 Persentase Kegiatan Partisipasi Ekonomi Perempuan Berdasarkan Status Perkawinan (a) di kabupaten, (b) di kotamadya
C.
Gambar 5 Persentase Kegiatan Partisipasi Ekonomi Perempuan Berdasarkan Hubungan Dengan Kepala Rumah Tangga (a) di kabupaten, (b) di kotamadya
Gambar 6 Persentase Kegiatan Partisipasi Ekonomi Perempuan Berdasarkan Ijazah Tertinggi (a) di kabupaten, (b) di kotamadya
4 Pada Gambar 2 diketahui bahwa persentase bekerja lebih besar pada tiap desa maupun kota, kecuali pada desa di kotamadya, persentase tidak bekerja lebih tinggi dibandingkan dengan persentase bekerja. Pada Gambar 3, hanya pada kelompok umur 55-64 tahun di kabupaten, lebih banyak yang bekerja, hal ini berbanding berbanding terbalik dengan keadaan kelompok umur 55-64 tahun di kotamadya. Kemudian pada Gambar 4, perbandingan kegiatan partisipasi ekonominya hampir sama, bahwa perempuan dengan status kawin dan lainnya (cerai hidup/cerai mati) cenderung memiliki persentase bekerja yang lebih tinggi. Selanjutnya untuk Gambar 5 juga diketahui memiliki selisih persentase kegiatan partisipasi ekonomi yang sama, dengan status kepala rumah tangga dan istri cenderung lebih banyak yang bekerja. Terakhir, pada Gambar 6 didapatkan informasi bahwa kegiatan partisipasi ekonomi kategori bekerja didominasi oleh perempuan dengan ijazah D4/S1 dan S2/S3. Kemudian analisis hubungan variabel respon dan prediktor dilakukan pengujian dengan hipotesis berikut. H0: Tidak ada hubungan antara variabel respon dengan prediktor. H1: Ada hubungan antara variabel respon dengan prediktor. Dengan α sebesar 0,05 maka diperoleh keputusan seperti pada Tabel 3. Terdapat hubungan antara semua variabel prediktor dengan variabel respon, kecuali pada Gambar 2b
Klasifikasi desa/kota memiliki 22-1 -1= 1 pemilahan Umur memiliki 23-1 -1= 3 pemilahan Status perkawinan memiliki 2 3-1 -1= 3 pemilahan Hubungan dengan kepala rumah tangga memiliki 24-1 -1= 7 pemilahan e. Ijazah tertinggi memiliki 5 -1= 4 pemilahan 1. Klasifikasi Pohon di Kabupaten Propinsi Jawa Timur Pohon klasifikasi maksimal merupakan pohon dengan jumlah simpul terminal terbanyak. Pada Tabel 5 diketahui skor variabel terpenting dalam klasifikasi pohon maksimal. a. b. c. d.
Tabel 5 Skor Variabel Prediktor Pada Pohon Maksimal di Kabupaten Variabel Umur
Skor 100,00
Status perkawinan
73,97
Hubungan dengan kepala rumah tangga
38,48
Ijazah tertinggi
36,48
Klasifikasi desa/kota
7,89
Tabel 5 menunjukkan bahwa umur memiliki skor tertinggi sehingga variabel umur menjadi pemilah utama sekaligus menjadi simpul induk pada pohon klasifikasi. Selanjutnya, pemangkasan pohon klasifikasi dilakukan dengan menggunakan resubtitution relative cost, untuk mencegah terbentuknya pohon klasifikasi yang sangat besar dan kompleks.
Tabel 3 Nilai Pvalue Hasil crosstab Variabel Respon Dengan Prediktor Kabupaten Kotamadya Gambar Gambar P P No. No. Keputusan Keputusan value value Gagal tolak 2a 0,000 Tolak H0 2b 0,431 H0 3a
0,000
Tolak H0
3b
0,000
Tolak H0
4a
0,000
Tolak H0
4b
0,043
Tolak H0
5a
0,000
Tolak H0
5b
0,000
Tolak H0
6a
0,000
Tolak H0
6b
0,000
Tolak H0
Gambar 11 Plot Relative Cost dengan Jumlah Node di Kabupaten
Nilai resubtitution relative cost di kabupaten pada pohon maksimal sebesar 0,729 dan pohon optimal sebesar 0,731. Sehingga terbentuk pohon klasifikasi optimal melalui pemangkasan yang telah dilakukan. Terdapat 18 simpul terminal dengan 8 kedalaman.
B. Classification And Regression Trees (CART) Berikut persentase ketepatan klasifikasi pada berbagai kombinasi yang telah dilakukan oleh peneliti. Tabel 4 Perbandingan Ketepatan Klasifikasi Antar Kombinasi Data KABUPATEN KOTAMADYA Ketepatan Ketepatan Kombinasi Klasifikasi (%) Klasifikasi (%) Proporsi (%) Learn Test Learn Test 95 : 5 64,4 64,3 95 : 5 60 59,5 60,1 59,5 *90 : 10 64,4 64,6 90 : 10 85 : 15 64,5 64,4 *85 : 15 60 60,1 80 : 20 64,5 64,1 80 : 20 60,3 59 75 : 25 64,4 64,5 75 : 25 61,3 59 (*) Keterangan : kombinasi data yang digunakan untuk analisis Kombinasi Proporsi (%)
Dari Tabel 4 diketahui bahwa yang digunakan untuk analisis data kabupaten adalah kombinasi 90% learning dan 10% testing. Untuk data kotamadya yang digunakan adalah kombinasi 85% learning dan 15% testing. Ketepatan klasifikasi ini dapat menggambarkan kebaikan pohon klasifikasi yang terbentuk. Perhitungan kemungkinan pemilah dari masing-masing variabel prediktor.
Gambar 12 Pohon Klasifikasi Optimal di Kabupaten
Skor variabel prediktor dari pohon optimal yang terbentuk adalah sebagai berikut. Tabel 6 Skor Variabel Prediktor Pada Pohon Optimal di Kabupaten Variabel Umur
Skor 100,00
Status perkawinan
72,88
Ijazah tertinggi
36,83
Hubungan dengan kepala rumah tangga
35,54
Klasifikasi desa/kota
5,03
Berdasarkan tabel tersebut, umur masih menjadi pemilah utama sebagai pemilik skor tertinggi, diikuti dengan status perkawinan. Karakteristik simpul terminal yang terbentuk dengan jumlah N terbanyak pada kategori 1, terletak pada simpul
5 terminal ke-11. Sebanyak 6292 perempuan di kabupaten propinsi Jawa Timur di pedesaan, berstatus kawin, sebagai kepala rumah tangga dan istri, serta memiliki ijazah tertinggi SD-SMA/sederajat dalam kategori umur 20-54 tahun dan 5564, memutuskan untuk bekerja atau berpartisipasi dalam kegiatan ekonomi. Sementara pada kategori 2, terletak pada simpul terminal ke-12. Sebanyak 4208 perempuan di kabupaten propinsi Jawa Timur di perkotaan dengan status kawin, sebagai kepala rumah tangga dan istri, ijazah tertinggi SD-SMA/sederajat dan dalam kategori umur 20-54 dan 55-64 tahun, memutuskan untuk tidak bekerja. 2. Klasifikasi Pohon di Kotamadya Propinsi Jawa Timur Skor variabel terpenting dalam klasifikasi pohon maksimal ditampilkan dalam Tabel 7. Tabel 7 Skor Variabel Prediktor Pada Pohon Maksimal di Kotamadya Variabel Umur
Skor 100,00
Ijazah tertinggi
37,76
Status perkawinan
34,90
Hubungan dengan kepala rumah tangga
19,82
Klasifikasi desa/kota
3,50
Skor untuk variabel umur, tertinggi jauh dari skor variabel berikutnya, berturut-turut yaitu ijazah tertinggi, status perkawinan, hubungan dengan kepala rumah tangga dan terakhir, klasifikasi desa/kota.
Karakteristik simpul terminal yang terbentuk pada pohon klasifikasi optimal di kotamadya dengan jumlah N terbanyak, untuk kategori 1 terletak pada simpul kedua, sebanyak 840 perempuan umur 20-54 tahun dengan status belum kawin dan lainnya, ijazah tertinggi SD-SMA/sederajat, D1/D2/D3 dan tidak punya ijazah, memutuskan untuk berpartisipasi dalam kegiatan ekonomi dengan bekerja. Sedangkan pada kategori 2 terdapat pada simpul terminal ke-5, sebanyak 2873 perempuan dengan ijazah SD-SMA/sederajat, berstatus kawin serta berumur 20-54 dan 55-64 tahun, memutuskan untuk tidak bekerja. Langkah terakhir adalah melihat ketepatan klasifikasi dari pohon optimal yang terbentuk. Tabel 9 Ketepatan Klasifikasi Data Testing Pohon Optimal di Kabupaten Kelas Prediksi Kelas Ketepatan Tidak Aktual Klasifikasi Bekerja Bekerja Bekerja 1159 429 73,0% Tidak 580 679 53,9% Bekerja Total Ketepatan Klasifikasi
Tabel 10 Ketepatan Klasifikasi Data Testing Pohon Optimal di Kotamadya Kelas Prediksi Kelas Ketepatan Tidak Aktual Klasifikasi Bekerja Bekerja Bekerja 244 308 44,2% Tidak 103 374 78,4% Bekerja Total Ketepatan Klasifikasi
Gambar 13 Plot Relative Cost dengan Jumlah Node di Kotamadya
Gambar 13 memperlihatkan Nilai resubtitution relative cost di kabupaten pada pohon maksimal sebesar 0,767 dan pohon optimal sebesar 0,788. Kemudian terbentuk pohon optimal dengan 6 simpul terminal dengan 5 kedalaman.
Gambar 14 Pohon Klasifikasi Optimal di Kotamadya
Berikut ini adalah skor variabel prediktor yang terbentuk pada pohon optimal. Tabel 8 Skor Variabel Prediktor Pada Pohon Optimal di Kotamadya Variabel Umur
Skor 100,00
Ijazah Tertinggi
33,52
Status perkawinan
30,35
Hubungan dengan kepala rumah tangga
6,53
Klasifikasi desa/kota
0,00
Berdasarkan nilai skor variabel tersebut variabel klasifikasi desa/kota tidak memiliki skor atau dengan kata lain, tidak berkontribusi terhadap pemilahan pohon klasifikasi optimal di kotamadya ini.
64,6%
60,1%
Berdasarkan Tabel 9 dan Tabel 10, didapatkan ketepatan klasifikasi total pada data testing di Kabupaten sebesar 64,6% dan di kotamadya sebesar 60,1%, artinya model klasifikasi pohon optimal yang terbentuk sudah cukup baik dalam menggambarkan model klasifikasi pohon maksimal. IV. KESIMPULAN Berdasarkan hasil identifikasi karakteristik diperoleh perbedaan antara perempuan di kabupaten dan kotamadya pada variabel klasifikasi desa dan kota, kelompok umur, juga hubungan dengan kepala rumah tangga. Hasil uji independensi menunjukkan bahwa variabel klasifikasi desa dan kota di kotamadya tidak terdapat hubungan dengan variabel respon. Pada analisis kabupaten menggunakan kombinasi data learning dan testing 90%;10%, menghasilkan pohon optimal dengan 18 simpul terminal dan 8 kedalaman dengan umur sebagai skor tertinggi. Jumlah N terbanyak untuk kategori 1, sebanyak 6292 perempuan di kabupaten propinsi Jawa Timur di pedesaan, berstatus kawin, sebagai kepala rumah tangga dan istri, ijazah tertinggi yang dimiliki adalah SDSMA/sederajat serta dalam kategori umur 20-54 dan 55-64, memutuskan untuk bekerja. Untuk kategori 2, sebanyak 4208 perempuan di kabupaten propinsi Jawa Timur di perkotaan dengan status kawin, sebagai kepala rumah tangga dan istri, ijazah tertinggi SD-SMA/sederajat dan dalam kategori umur 20-54 dan 55-64, memutuskan untuk tidak bekerja. Total ketepatan klasifikasi data testing sebesar 64,6%. Sedangkan pada analisis kotamadya menggunakan kombinasi data learning dan testing 85%;15%. Menghasilkan
6 pohon optimal dengan 6 simpul terminal dan 5 kedalaman dengan variabel umur memiliki skor tertinggi. Jumlah N terbanyak untuk kategori 1 yaitu 840 perempuan umur 20-54 tahun dengan status belum kawin dan lainnya, ijazah tertinggi SD-SMA/sederajat, D1/D2/D3 dan tidak punya ijazah, memutuskan untuk berpartisipasi dalam kegiatan ekonomi dengan bekerja. Untuk kategori 2, sebanyak 2873 perempuan dengan ijazah SD-SMA/sederajat, berstatus kawin serta berumur 20-54 dan 55-64 tahun, tidak bekerja. Total ketapatan klasifikasi data testing sebesar 60,1%. DAFTAR PUSTAKA [1] Badan Penelitian dan Pengembangan Hak Asasi Manusia. 2013. www.balitbangham.go.id diakses 27 September 2013. [2] BPS Jatim. 2012. Keadaan Angkatan kerja di Provinsi Jawa Timur. Surabaya : Badan Pusat Statistik Provinsi Jawa Timur. [3] Lewis, M. D. dan Roger, J. 2000. An Introduction to Classification and Regression Tree (CART) Analysis. Presented at the 2000 Annual Meeting of the Society for Academic Emergency Medicine in San Fransisco,California.http://citeseerx.ist.psu.edu/viewdoc/downlo ad?doi=10.1.1.95.4103&rep=rep1&type=pdf. [4] Breiman, L., Friedman, J., Olshen, R. and Stone, C. 1984. ”Classification and Regression Trees” Chapman Hall, New York – London. [5] Zhang, H. and Singer, B. 1999. Recursive Partitioning in the HealthSciences.Springer-Verlag,NewYork.http://c2s2.yale.edu/ resources/lectures/LectureNotesOnRP. pdfS. Makridakis, S.C Wheelwright and V.E McGee. 1999. Metode dan Aplikasi Peramalan (Edisi Kedua). Jakarta: Binurapa Aksara. [6] BPS. 2011. Buku Konsep dan Definisi. www.bps.go.id diakses 1 Oktober 2013 [7] Sleumer D. W. 1996. Ilmu Dasar Kependudukan. Jakarta: Balai Pustaka.