ANALISIS KELOMPOK DAN ANALISIS DISKRIMINAN UNTUK MENGGOLONGKAN TINGKAT PENGANGGURAN DI PROVINSI JAWATIMUR BERDASARKAN PENDIDIKAN TERAKHIR YANG DITEMPUH Pratiwi, Y; Rahardjo, S dan Susiswo Jurusan Matematika Fakultas MIPA Universitas Negeri Malang ABSTRAK: Pengangguran adalah salah satu isu penting yang perlu menjadi perhatian dalam pembangunan ekonomi daerah. Dalam pembangunan dan kegiatan berproduksi, peranan tenaga manusia banyak ditentukan oleh jumlah dan kualitas tenaga kerja yang tersedia di berbagai bidang kegiatan. Berbagai bidang dalam pembangunan sumber daya manusia mencakup bidang kesehatan, perbaikan gizi, pendidikan dan latihan serta penyediaan lapangan kerja, sehingga kualitas manusia dapat ditingkatkan.. Oleh karena itu, indikator pengangguran dalam penelitian ini berdasarkan pendidikan terakhir yang ditamatkan dan angka buta huruf. Langkah pertama yang dilakukan adalah menggolongkan kabupaten dan kota yang ada di jawa timur menggunakan analisis kelompok metode KMean. Langkah kedua menggunakan analisis diskriminan untuk menentukan persamaan diskriminan dan mengetahui keakuratan fungsi diskriminan yang terbentuk. Berdasarkan analisis kelompok didapatkan kelompok 1 beranggotakan 24 dan kelompok 2 beranggotakan 14. berdasarkan analisis diskriminan diperoleh fungsi diskriminan sebagai berikut.
Kata kunci: analisis pengangguran, K-Mean.
kelompok,
analisis
diskriminan,
ABSTRACT: Unemployments is an important issue that need a special attention in a regional economic development. In the development and production activity, most of the human labor are determined by the total and the quality of the labor itself in any fields of activity. There are some fields in the human source development which cover health, nutritional improvement, education and training, and providing jobs. By those fields, the quality of human source can be improved. Therefore, the unemployment indicators in this research are built upon the final attained education and illiteracy rate. The first step that should be done is classifying the counties and cities in East Java by using the cluster analysis of K-Mean. The second step is using the discriminant analysis to determine the discriminant equation and detecting the accuracy of discriminant function that has been made. Based on the cluster analysis, there is one group consists of 24 counties/cities dan the group two consists of
1
14 counties/cities. The discriminant analysis we get the discriminant function as follows,
Keywords: cluster analysis, discriminant analysis, unemployment, K-Mean.
Di tahun 2013 Kamar Dagang dan Industri Indonesia (Kadin) menilai angka pengangguran di Indonesia sudah cukup tinggi akibat kesenjangan antara pertumbuhan angkatan kerja dan lapangan pekerjaan. Pertumbuhan tenaga kerja yang kurang diimbangi dengan pertumbuhan lapangan kerja akan menyebabkan tingkat kesempatan kerja cenderung menurun. International Labour Organization (ILO) mendefinisikan beberapa faktor yang berpengaruh terhadap TPT diantaranya yaitu kependudukan, pendidikan, upah tenaga kerja, PDRB, banyaknya pekerja di sektor formal dan informal, infrastruktur, serta sarana dan prasarana yang tersedia di suatu wilayah. Indikator TPT ini berguna sebagai acuan pemerintah untuk dibukanya lapangan kerja baru (BPS 2007). Selama ini hampir semua orang berpendapat, pendidikan diharapkan mampu mengubah manusia, dari tidak bisa menjadi bisa, dari tidak mampu menjadi mampu, dari tidak berbudaya menjadi berbudaya. Ekspektasi terhadap dunia pendidikan di atas tentu bertolak belakang dengan realita pengangguran yang ada di negara kita. Artinya, terdapat jutaan intelektual dan kaum terdidik yang menjadi pengangguran terbuka. Berdasarkan permasalahan di atas supaya diketahui pengangguran di kota/kab di jawa timur berada pada tingkat pengangguran rendah atau tinggi maka perlu adanya pengelompokan, sehingga penyuluhan tentang pentingnya pendidikan demi masa depan yang diharapkan sesuai dengan tingkat pengelompokkan Kab/Kota. Analisis kelompok adalah termasuk yang sesuai untuk melakukan pengelompokan dalam kelompok-kelompok berdasarkan pendidikan terakhir yang ditamatkan. Untuk lebih mempermudah membedakan antar kelompok maka pengangguran dikelompokkan menjadi 2 yaitu tingkat pengangguran tinggi dan tingkat pengangguran rendah maka dalam permasalahan ini digunakan analisis kelompok metode k-mean. Analisis Kelompok dengan metode K-Mean adalah statistik yang berguna untuk mengelompokkan sejumlah objek dalam jumlah kelompok yang sudah ditentukan di mana karakteristik objek hanya dikelompokkan berdasarkan variabel tertentu, tetapi karakteristik latar belakang objek belum diketahui pasti (Sofyan Yamin dan Heri Kurniawan, 2011:196). Analisis diskriminan merupakan teknik yang akurat untuk memprediksi seseorang termasuk ke dalam kategori apa, dengan catatan data-data yang dilibatkan terjamin akurasinya (Bilson Simamora, 2005:143). METODE PENELITIAN Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data yang telah dikumpulkan terlebih dahulu oleh pihak-pihak lain selain peneliti. Dalam penelitian ini data sekunder diperoleh dari BPS Jawa Timur.
2
Teknik analisis yang digunakan dalam penelitian ini yaitu analisis kelompok metode k-mean dan analisis diskriminan. Adapun hubungan antar variabel penelitian adalah sebagai berikut. Variabel Bebas (X) atau variabel prediktor yang diamati adalah sebagai berikut. 1. X1 = Jumlah penduduk yang tidak atau belum pernah sekolah. 2. X2 = Jumlah penduduk yang tidak tamat Sekolah Dasar (SD). 3. X3 = Jumlah penduduk yang tamat Sekolah Dasar (SD). 4. X4 = Jumlah penduduk yang tamat Sekolah Menengah Pertama(SMP). 5. X5 = Jumlah penduduk yang tamat Sekolah Menengah Atas(SMA). 6. X6 = Jumlah penduduk yang tamat Perguruan Tinggi (PT). 7. X7 = Jumlah penduduk yang Buta Huruf. Populasi dalam penelitian ini adalah masyarakat pengangguran di kota/kab di Jawa Timur tahun 2010 yang tercantum dalam hasil Survey Sosial Ekomomi Nasional. Data pengangguran ini didapat dari BPS Provinsi Jawa Timur. Sampel dalam penelitian ini adalah masyarakat yang menganggur di kota Malang tahun 2010. Teknik dalam pengumpulan data yang menunjang dalam penelitian ini dilakukan sebagai berikut. 1. Peneliti mengambil data BPS Provinsi Jawa Timur melalui web www.bps.go.id. 2. Data yang digunakan pada penelitian ini adalah data sekunder. Data tersebut diperoleh dari pihak yang berwenang di BPS Jawa Timur. Analisis data dalam penelitian ini menggunakan metode analisis kelompok dan analisis diskriminan yang dilakukan dengan bantuan program minitab dan SPSS. Adapun langkah-langkahnya adalah sebagai berikut. Data tidak Uji asumsi ya
Proses Pengelusteran dengan metode k-means Menentukan profil setiap kelompok tidak Uji asumsi ya
Analisis diskriminan Validasi
3
Langkah pertama yang dilakukan pada analisis kelompok adalah uji kenormalan multivariat. Langkah kedua adalah uji multikolinieritas. Multikolinieritas adalah suatu keadaan dimana terdapat dua variabel atau lebih, saling berkorelasi. Dan langkah ketiga adalah Dalam analisis kelompok, pengelompokan data atau permasalahan dibutuhkan suatu ukuran yang dapat menerangkan kedekatan antara data. Dimana ukuran jarak yang biasa digunakan adalah ukuran jarak Euclidean. Setelah itu mulai melakukan analisis kelompok. Analisis kelompok atau biasa dikenal sebagai cluster analysis adalah salah satu teknik statistik yang bertujuan untuk mengelompokkan objek ke dalam suatu kelompok sedemikian sehingga objek yang berada dalam satu kelompok akan memiliki kesamaan yang tinggi dibandingkan dengan objek yang berada di kelompok lain (Sharma, 1996:185). Langkah pengelompokkan dalam analisis kelompok terdiri dari 3 langkah yaitu Mengukur kesamaan jarak, membentuk kelompok secara K-Means, menentukan jumlah kelompok. Dengan melakukan uji normal multivariat, uji homogen, dan uji multikolinieritas, kita dapat melakukan analisis diskriminan. Heteroskedastisitas akan mengakibatkan penaksiran koefisien-koefisien regresi menjadi tidak efisien. Hasil penaksiran akan menjadi kurang dari semestinya. Asumsi homoekedastisitas berarti sama(homo) dan sebaran memiliki varian yang sama (Imam Ghozali,2009:35). Jika nilai Thitung < Tα/2(n-k-1) atau Thitung > Tα/2(n-k-1) dan nilai signifikan >0.05 maka mengindikasi bahwa sisaaan tersebut tidak mengalami heteroskedastisitas (nilai tersebut homogen). Analisis diskriminn merupakan salah satu metode analisis multivariat yang digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi linier fungsi diskriminan. Menurut Dillon (1984) dalam analisis diskriminan dengan p variabel yang diukur terdapat asumsi-asumsi yang harus dipenuhi untuk mendapatkan kombinasi linier fungsi diskriminan yang optimal dengan kesalahan klasifikasi terkecil adalah sebagai berikut: a. Data berdistribusi normal multivariate b. Matriks varian kovarians antar kelompok homogen. Setelah Fungsi diskriminan terbentuk, langkah selanjutnya adalah menilai validitas analisis diskriminan. Hasil klasifikasi dapat didasarkan pada analisis sampel ataupun validitas sampel dapat dilakukan dengan cara sebagai berikut. a. Menghitung diskriminan score Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. b. Menghitung cutting score Cutting score (m) dapat dihitung dengan rumus sebagai berikut :
Keterangan : : Cutting score : jumlah anggota grup A : jumlah anggota grup B : centroid grup A
4
: centroid grup B c. Hit Ratio Setelah semua observasi diprediksi keanggotaannya, kita dapat menghitung hit ratio. Hit Ratio merupakan nilai yang dapat menjawab: “Berapa persen objek yang dapat diklasifikasi secara tepat dari jumlah total objek?” Hit Ratio adalah persentase kasus atau responden yang kelompoknya dapat diprediksi secara tepat. Rumus hit ratio yang digunakan adalah: Dimana: n = jumlah kasus yang dapat diklasifikasi secara tepat N = jumlah sampel Kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan klasifikasi ditambah seperempatnya (Hair et. al., op. cit., hlm. 269-270). Kalau kesempatan klasifikasi adalah 50%, batas minimal hit ratio adalah 0,50 + (0,25) (0,50) = 0,625 atau 62,5%. Kalau kita memiliki 4 grup, kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas minimal hit ratio adalah 31,25%. d. Akurasi statistik Klasifikasi yang dilakukan dengan fungsi diskriminan dapat diuji keakuratannya dengan menggunakan Press’s Q Statistik. Ukuran sederhana ini membandingkan jumlah kasus yang diklasifikasikan secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai kritis (critical value). Press’s Q Statistik dapat ditulis dengan rumus : [ ] N n K
: ukuran sampel : jumlah kasus yang diklasifikasi secara tepat : jumlah grup
HASIL ANALISIS DAN PEMBAHASAN Uji Kenormalan Multivariat Pengujian kenormalan ini dengan melihat gambar hasil QQ plot yang terdapat di dalam software Macro Minitab 16. Hasil dari gambar plot menunjukkan titik mendekati garis lurus dan hasil dari macro minitab diperoleh t = 0,736842, hal ini membuktikan bahwa sampel dapat diasumsikan berasal dari populasi normal multivariat. Uji Multikolinieritas Tabel nilai koefisien korelasi sederhana (simple correlation) antar sesama variabel bebas tidak ada yang melebihi maka data tersebut menunjukkan tidak terjadinya gejala multikolinieritas. Jarak Euclidean Langkah pertama yang digunakan dalam analisis cluster adalah menghitung jarak Euclidean.
5
Analisis Kelompok (Cluster Analysis) Setelah menghitung jarak Euclidean. Proses selanjutya adalah melakukan analisis kelompok dengan menggunakan metode K-Mean. Diperoleh jumlah anggota pada kelompok 1 dalah 24 dan jumlah anggota pada kelompok 2 adalah 14. Analisis Diskriminan Analisis diskriminan bertujuan untuk menghitung fungsi diskriminan yang dapat digunakan sebagai pembeda kelompok. 1. Uji Normal Multivariat Uji normal multivariat pada analisis diskriminan sama yaitu dengan melihat gambar hasil QQ plot pada software Macro Minitab 16. bahwa plot menunjukkan titik mendekati garis lurus dan hasil dari macro minitab t = 0,74752, hal ini membuktikan bahwa sampel dapat diasumsikan berasal dari populasi normal multivariat. 2. Uji Homogenitas Tahap selanjutnya adalah pengujian kehomogenan suatu data dengan melihat nilai t hitung lebih besar dari t tabel. Daerah kritisnya adalah Thitung < Tα/2(n-k-1) = atau Thitung < Tα/2(n-k-1) = . karena nilai Thitung dari seluruh variabel penjelasan tidak terletak pada daerah kritis, maka H0 diterima dan nilai signifikan dari seluruh variabel penjelas > maka model ini homogen. 3. Uji Multikolinieritas Untuk menguji multikolinieritas pada analisis diskriminan pada dasarnya sama dengan analisis kelompok yaitu dapat dilihat dengan menghitung koefisien korelasi sederhana (simple correlation) antara sesama variabel bebas. Diperoleh nilai koefisien korelasi sederhana (simple correlation) antar sesama variabel bebas tidak ada yang melebihi maka data tersebut menunjukkan tidak terjadinya gejala multikolinieritas. 4. Proses Diskriminan Dengan metode fisher diperoleh model diskriminan yang terbentuk, yaitu:
5. Validasi a. Cutting score determination Diperoleh nilai pembatasnya adalah 0,014. Jika di bawah 0,014 masuk grup 1 (tingkat pengangguran tinggi) dan jika di atas 0,014 masuk grup 2 (tingkat pengangguran rendah). b. Hit ratio Karena hit ratio > batas minimal hit ratio, yaitu 100% > 62,5 %. Sehingga dapat disimpulkan bahwa model diskiminan yang terbentuk mempunyai tingkat validasi yang tinggi, yaitu 100%, sehingga dapat disimpulkan bahwa fungsi diskriminan mampu memprediksi keanggotaan semua Kab/Kota. c. Akurasi statistik [ ] Dengan α=0,05 dan df=1, nilai X2 tabel adalah 3,841. Karena Nilai sehingga dapat disimpulkan bahwa fungsi diskriminan akurat. 6
PENUTUP Kesimpulan Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, maka kesimpulan yang dapat diambil adalah sebagai berikut. 1. Berdasarkan analisis kelompok, pengelompokkan 38 kabupaten dan kota di provinsi Jawa Timur menggunakan metode K-mean dapat dibentuk 2 kelompok, dengan kelompok 1 (tingkat pengangguran tinggi) beranggotakan 24 kab/kota yaitu Pacitan, Ponorogo, Trenggalek, Blitar, Kediri, Malang, Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo, Pasuruan, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban, Lamongan, Bangkalan, Sampang, Pamekasan, Sumenep. Sedangkan kelompok 2 beranggotakan 14 kab/kota yaitu Tulungagung, Sidoarjo, Mojokerto, Jombang, Gresik, Kota Kediri, Kota Blitar, Kota Malang, Kota Probolinggo, Kota Pasuruan, Kota Mojokerto, Kota Madiun, Kota Surabaya, Kota Batu. 2. Berdasarkan analisis diskriminan diperoleh fungsi diskriminan sebagai berikut.
Sehingga dapat disimpulkan jika penambahan angka pada variabel dan , maka angka pengangguran di kabupaten dan kota di jawa timur akan menurun. Tetapi, jika penambahan angka pada variabel , dan , maka angka pengangguran di kabupaten dan kota di jawa timur akan meningkat. Dan juga fungsi diskriminan yang diperoleh dari data pengelompokan memiliki tingkat validasi 100% dengan kata lain Kab/kota pada kelompok tingkat pengangguran rendah dan tingkat pengangguran tinggi yang dihasilkan dari analisis kelompok memiliki tingkat akurasi tinggi. Saran Berdasarkan uraian diatas, maka saran yang diajukan dirumuskan sebagai berikut. Bagi pemerintah di Jawa Timur diharapkan setelah adanya penelitian ini bisa lebih memperhatikan pendidikan masyarakatnya. Bagi peneliti lain untuk kasus pengangguran diharapkan menambahkan variabel-varibel yang lebih bervariasi. Analisis kelompok dan analisis diskriminan dapat digunakan pada kasus lain seperti: kesehatan, pendidikan, pemilihan operator, dll. DAFTAR PUSTAKA Anwar, Desy. 2003. Kamus Lengkap Bahasa Indonesia. Surabaya: Amelia Ghozali, Imam. 2009. Aplikasi Analisis Multivariate Dengan Program SPSS, Cetakan IV, Badan Penerbit Universitas Diponegoro, Semarang. Manurung, Mandala dan Prathama Rahardja, 2004. Uang, Perbankan, dan Ekonomi Moneter. Jakarta: Penerbit Salemba. Sadono, Sukirno. 2008. Makroekonomi Teori Pengantar. Jakarta: Rajawali Grafindo. Sharma, Subhas. 1996. Applied Multivariate Techniques. New York: John Wiley and Sons, Inc.
7
Soemartini. 2008. Principal Component Analysis (PCA) Sebagai Salah Satu Metode Untuk Mengatasi Masalah Multikolinearitas. Jatinangor : Universitas Padjajaran. Sofyan Yamin & Heri Kurniawan. (2011). Generasi Baru Mengolah Data Penelitian dengan Partial Least Square Path Modeling : Aplikasi dengan Software XLSTAT, SmartPLS, dan Visual PLS. Jakarta : Salemba Infotek Subri, Mulyadi. 2003. Ekonomi Sumberdaya Manusia: Jakarta: Raja Graindo Persada. Suryanto. 1988. Metode Statistika Multivariat. Jakarta: Departemen Pendidikan dan kebudayaan.
8