Seminar Nasional Matematika 2008 Jurusan Matematika FMIPA UNPAD, Sumedang, 13 Desember 2008
Hierarchical Clustering Untuk Otomatisasi Pengelompokan Objek Pada Peta Dua Dimensi Hasil Analisis Multidimensional Scaling Satu Arah (Studi Kasus: Presepsi Mahasiswa terhadap Pelayanan Institusi) Irlandia Ginanjar
[email protected] Staf Pengajar Jurusan Statistika FMIPA, Unpad Bandung. ABSTRAK Tujuan dari penelitian ini adalah untuk mengelompokan objek-objek pada peta dua dimensi yang merupakan hasil Analisis Multidimensional Scaling satu arah, yang mana metode pengelompokan objek-objek tersebut tidak secara visual tetapi dengan menggunakan Hierarchical Clustering, sehingga memungkinkan pengelompokan objek-objek tersebut secara otomatis. Masalah dalam penelitian ini adalah tidak teridentifikasinya karakteristik dimensi dari peta yang merupakan hasil analisis Multidimensional Scaling sehingga pengelompokan yang dilakukan secara visual yang akan mengakibatkan kesimpulan bersifat subjektif, sehingga diperlukan suatu metode untuk mengatasi hal tersebut. Kesimpulan dari penelitian ini adalah berdasarkan titik koordinat yang didapatkan dari Analisis Multidimensional Scaling satu arah kita mendapatkan jarak dimensi setiap objeknya, jarak dimensi setiap objek tersebut di analisis dengan menggunakan Hierarchical Clustering, dengan jumlah kelompok ditentukan oleh nilai Rescaled Distance Cluster Combine dan kelompok yang terbentuk ditentukan berdasarkan hasil dendogram. Hasil studi kasus dari penelitian ini ialah terbentuknya tiga kelopok karakteristik pelayanan PBM dengan karakteristik masing-masing kelompok adalah: Kelompok 1, kelompok karakteristik pelayanan yang menjadi prioritas pertama untuk diperbaiki. Kelompok 2, kelompok karakteristik pelayanan yang menjadi prioritas kedua untuk diperbaiki. Kelompok 3, kelompok karakteristik pelayanan yang tidak harus diperbaiki. Kata Kunci: Multidimensional Scaling, Hierarchical Clustering ABSTRACT The research objective is for grouping objects from two dimension map, where the map is output from one way Multidimensional Scaling Analysis, where the method for grouping using Hierarchical Clustering, that possible to make an automatic objects grouping. The problem in this research is, we can not identify dimension characteristic because of that the grouping used visual method. Visual method could be make subjective grouping, so we need non subjective grouping method. Conclusion from this research is with coordinate where we can get from one way Multidimensional Scaling Analysis we can get the dimension distance for every object and that dimension distance would be analyzed by Hierarchical Clustering Analysis, and we can found the number of group form Rescaled Distance Cluster Combine and the members of group can identified form dendogram. From study cases analysis we got three groups of institution service characteristics with the characteristic are, group 1st is for the 1st priority service characteristics that must be repaired, group 2nd is for the 2nd priority service characteristics that must be repaired, group 3rd is for service characteristics that not must be repaired. Key Word: Multidimensional Scaling, Hierarchical Clustering
1. PENDAHULUAN Pemetaan adalah gambaran objek-objek yang dapat disajikan pada dua atau lebih dimensi. Tiap objek mempunyai posisi tertentu dalam suatu peta, hal itu memberikan suatu gambaran ruang mengenai hubungan antar objek-objek yang diamati. Cara pembuatan peta ini dapat dilakukan dengan beberapa metode statistik, diantaranya adalah Multidimensional Scaling, Analisis Korespondensi dan Biplot Analysis.
1
Berdasarkan hubungan antar objek-objek dari Peta kita bisa mengelompokan objek-objek tersebut Sesuai dengan keseragaman karakteristiknya. Pemetaan hasil Biplot Analysis bisa dikelompokan berdasarkan kuadran yang terbentuk karena setiap dimensi bisa diidentifikasi karakteristiknya, Pemetaan hasil Analisis Korespondensi dan analisis Multidimensional Scaling dua arah bisa dikelompokan berdasarkan karakteristik objek yang ikut dipetakan meskipun dimensi yang terbentuk tidak bisa diidentifikasi karakteristiknya, namun untuk analisis Multidimensional Scaling satu arah sulit untuk menentukan kelompoknya karena tidak ada karakteristik objek yang ikut dipetakan dan dimensi yang terbentuk tidak bisa diidentifikasi karakteristiknya. Selama ini pengelompokan dari peta hasil analisis Multidimensional Scaling satu arah dilakukan secara visual, hal itu mengakibatkan pengelompokan yang terbentuk bersifat subjektif sehingga akibatnya bisa menyesatkan. Masalah tersebut yang mendasari peneliti untuk melakukan penelitian ini dengan tujuan dari penelitian ini adalah: 1) Membuat peta dua dimensi dari Analisis multidimensional scaling satu arah. 2) Menentukan variabel yang akan menjadi bahan pengelompokan. 3) Menggunakan Analisis Hierarchical Clustering terhadap variabel bahan pengelompokan untuk mendapatkan kelompok secara otomatis. 4) Memadukan hasil Analisis Hierarchical Clustering dengan peta dua dimensi. Penelitian ini bermanfaat untuk: 1) Mengetahui teknik untuk mengelompokan objek dari peta presepsi yang tidak subjektif. 2) Mengetahui teknik untuk mengidentifikasi karakteristik kelompok objek yang terbentuk. 3) Hasil dari analisis ini juga memungkinkan untuk dipakai dalam penelitian lain, misalkan mencari metode Analisis pengelompokan non-subjektif lainnya untuk mendapatkan pengelompokan yang lebih baik. 2. METODE PENELITIAN 2.1. Pendekatan Masalah Penelitian Masalah dalam penelitian ini adalah, pengelompokan dari peta hasil Analisis Multidimensional Scaling satu arah dilakukan secara visual. Sehingga ada empat hal penting yang perlu diperhatikan dalam penelitian ini, pertama Analisis Multidimensional Scaling, kedua Analisis Hierarchical Clustering, ketiga penentuan data untuk clustering, dan keempat adalah memadukan hasil Analisis Hierarchical Clustering dengan hasil Analisis Multidimensional Scaling satu arah. 2.2. Analisis Multidimensional Scaling Penelitian ini memerlukan peta dua dimensi yang dihasilkan oleh Analisis Multidimensional Scaling, berdasarkan karakteristik data yang menjadi inputnya Analisis Multidimensional Scaling terbagi kedalam dua bagian, Pertama adalah Analisis Multidimensional Scaling satu arah yaitu analisis yang inputnya berbentuk row data, peta yang dihasilkan dari analisis ini objeknya adalah variabel kolom, Kedua adalah Analisis Multidimensional Scaling dua arah yaitu analisis yang inputnya berbentuk tabel kontingensi, peta yang dihasilkan dari analisis ini objeknya adalah variabel baris dan kolom. Dalam penelitian ini peta dua dimensi yang akan ditentukan pengelompokan objeknya adalah peta yang objek-objeknya variabel kolom, sehingga metode analisis yang digunakan adalah metode Analisis Multidimensional Scaling satu arah.
2
2.3. Analisis Hierarchical Clustering. Proses pengelompokan objek yang dipakai adalah proses penglompokan yang subjektifitasnya rendah sehingga terpilih metode pengelompokan dengan menggunakan Analisis Hierarchical Clustering. Analisis ini terpilih karena penentuan jumlah kelompok dan penentuan anggota kelompoknya sifatnya tidak subjektif, penentuan jumlah kelompoknya ditentukan oleh nilai selisih agglomerative pada dendogram diproyeksikan dengan Rescaled Distance Cluster Combine, dan anggota kelompoknya relatif berdasarkan jarak. Ukuran jarak yang digunakan adalah jarak Euclidean karena ukuran jarak tersebut sangat tepat untuk mempresentasikan jarak antara dua titik. Metode yang digunakan adalah metode Single Linkage (Nearest Neighbor), metode ini dipakai karena jarak antar cluster didefinisikan berdasarkan jarak minimum sehingga memungkinkan selisih agglomerative tertinggi tidak terjadi pada pengengelompokan akhir, dengan kata lain jika menggunakan Complete Linkage (Farthest Neighbor) dan Average Linkage jumlah kelompok yang paling mungkin terjadi adalah dua kelompok. Metode Centroid, Median atau Ward tidak memungkinkan untuk digunakan karena untuk tiga metode itu ukuran jaraknya tidak bisa menggunakan jarak Euclidean (harus squared Euclidean) 2.4. Penentuan Data untuk Clustering Pengelompokan dengan Analisis Hierarchical Clustering memerlukan data yang berbentuk jarak, karena pengelompokan yang akan dilakukan adalah pengelompokan dari peta, maka data jarak yang akan dipakai untuk pengelopokan tersebut adalah data titik koordinat dimensi dari objek peta tersebut. Data titik koordinat tersebut di dapatkan dari Analisis Multidimensional Scalling. 2.5. Memadukan Hasil Analisis Hasil dari Analisis Hierarchical Clustering berupa dendogram, berdasarkan dendogram tersebut bisa diidentifikasi berapa kelompok yang terbentuk dan apa saja anggota (objek) kelompoknya, kelompokan objek-objek yang ada di peta dua dimensi berdasarkan hasil Analisis Hierarchical Clustering tersebut .
3
3. PEMBAHASAN HASIL STUDI KASUS Dari hasil Analisis Multidimensional Scalling didapatkan koordinat dimensi (Tabel 1) sebagai berikut: No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Tabel 1. Titik koordinat untuk setiap dimensi Dimensi 1 Dimensi 2 No Objek Dimensi 1 1,7258 0,1179 18 PA04 -1,4361 0,34 0,1453 19 PA05 1,4848 -1,5082 -0,5444 20 PA06 1,622 0,3953 -0,5267 21 PA07 -1,3125 -1,5225 -0,6193 22 PA08 -1,2233 0,4477 -0,3275 23 PP01 0,1702 -1,4113 -0,6435 24 PP02 -1,6259 1,8174 -0,1387 25 PP03 -1,5316 1,6546 -0,0814 26 KD01 0,2952 0,5589 0,5417 27 KD02 -1,8829 1,5622 -0,0295 28 KD03 -1,5349 1,7495 0,0282 29 KD04 0,5121 0,3753 -0,2466 30 KD05 1,6204 1,5444 -0,2802 31 MI01 -1,8544 0,3031 0,1397 32 MI02 -1,4868 0,0062 -0,1687 33 MI03 1,4513 -1,3061 -0,7656
Objek FF01 FF02 FF03 FF04 FF05 FF06 FP01 FP02 FP03 KR01 KR02 KR03 KR04 KR05 PA01 PA02 PA03
Dimensi 2 0,077 -0,184 0,1562 0,9269 0,769 -0,183 0,8732 0,4761 -0,1096 -0,7021 0,8173 0,7565 0,035 -0,8686 0,6089 -0,0496
Peta presepsi yang dihasilkan dari Analisis Multidimensional Scalling dapat dilihat pada Gambar 1. 1.0
PA07
PP02 KD03
PA08
KD04
MI02 KR01 PP03
Dimensi 2
0.5
PA06
FF02 PA04 0.0
KD01
PA02
FF01
KD05
PA01
KR03 FP02
MI03 KR02
KR04
FP03
PP01
PA05 KR05
FF06 FF03
-0.5 FF05
FP01
FF04
KD02 PA03 MI01 -1.0 -2
-1
0
1
2
Dimensi 1
Gambar 1. Peta presepsi karakteristik pelayanan institusi berdasarkan presepsi mahasiswa
Hasil Analisis Hierarchical Clustering dengan data input untuk analisis ini adalah titik koordinat untuk setiap dimensi, didapatkan nilai agglomerative untuk setiap Cluster stage (tingkat cluster), berdasarkan itu dihitung selisih agglomerative tingkat bersangkutan dengan tingkat sebelumnya (ai–1 – ai) yang hasil perhitungannya dicantumkan dalam Tabel 2 dibawah ini:
4
Cluster stage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Tabel 2. Selisih Nilai Agglomerative untuk Setiap Tingkat cluster Agglomeration Perbandingan Cluster Agglomeration Perbandingan Coefficients antar stage stage Coefficients antar stage Selisih 0,037323 17 0,161169 16 vs. 17 0,076253 1 vs. 2 0,0389303555 18 0,164622 17 vs. 18 0,086876 2 vs. 3 0,0106234226 19 0,168922 18 vs. 19 0,092778 3 vs. 4 0,0059018311 20 0,172589 19 vs. 20 0,105978 4 vs. 5 0,0132000357 21 0,181353 20 vs. 21 0,106798 5 vs. 6 0,0008198287 22 0,205977 21 vs. 22 0,108566 6 vs. 7 0,0017679839 23 0,213879 22 vs. 23 0,110641 7 vs. 8 0,0020745734 24 0,219839 23 vs. 24 0,112707 8 vs. 9 0,0020662436 25 0,247939 24 vs. 25 0,113166 9 vs. 10 0,0004594617 26 0,249425 25 vs. 26 0,113803 10 vs. 11 0,0006365625 27 0,369789 26 vs. 27 0,121211 11 vs. 12 0,0074077487 28 0,410367 27 vs. 28 0,138512 12 vs. 13 0,0173015688 29 0,452825 28 vs. 29 0,140153 13 vs. 14 0,0016409298 30 0,625569 29 vs. 30 0,144957 14 vs. 15 0,0048040379 31 1,041365 30 vs. 31 0,158698 15 vs. 16 0,0137407605 32 1,441673 31 vs. 32
Selisih 0,0024711531 0,0034532539 0,0042993148 0,0036679046 0,0087639003 0,0246233134 0,0079021699 0,0059603464 0,0281001334 0,0014857916 0,1203639900 0,0405778530 0,0424576749 0,1727441801 0,4157963102 0,4003078045
Terlihat bahwa selisih terbesar ada pada tingkat cluster 31, hal ini mengindikasikan bahwa jumlah kelompok yang paling baik adalah tiga kelompok. Dari hasil Analisis Hierarchical Clustering juga didapatkan dendogarm dapat dilihat pada gambar 2
5
Rescaled Distance Cluster Combine C A S E Label Num PA01 FF02 KR04 FF06 PP01 KD01 PA02 FF04 KR01 KD04 PA05 KR05 FF01 KR03 PA06 KR02 KD05 FP03 MI03 FP02 FF05 FF03 FP01 PA03 MI01 KD02 PA08 PA07 KD03 PP02 PP03 MI02
20 21 18 19 15 17 14 16 22 23 25 26 31 32 30 27 28 29 24 33 3 4 5 6 1 2 12 13 10 11 8 9
PA04
7
0 5 10 15 20 25 +---------+---------+---------+---------+---------+ òûòòòòòø ò÷ ó Garis Pemotong òòòûòø ùòòòòòòòø Pembetuk 3 Kelompok òòò÷ ó ó ó òòòûòôòú ó òòò÷ ó ó ùòòòòòòòòòòòòòòòòòòòø òòòòò÷ ó ó ó òòòòòòò÷ ó ó òòòòòòòûòòòòòòò÷ ó òòòòòòò÷ ó òòòø ùòòòòòòòòòòòòòø òòòú ó ó òûòôòø ó ó ò÷ ó ó ó ó òòòú ó ó ó òûòú ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó ò÷ ó ó ó òòòú ó ó òòò÷ ó ó òòòòò÷ ó òûòø ó ò÷ ùòø ó òòò÷ ùòòòòòø ó òòòòò÷ ùòòòòòòòòòø ó òòòòòûòòòòò÷ ó ó òòòòò÷ ó ó òòòòòûòø ùòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ òòòòò÷ ùòòòòòø ó òòòûòòòú ó ó òòò÷ ó ùòòòòòòò÷ òòòûòòò÷ ó òòò÷ ó òòòòòòòòòòòòò÷ Gambar 2. Dendogram hasil Analisis Hierarchical Clustering
Berdasarkan dendogram diatas terlihat anggota-anggota (objek) dari setiap kelompok yang terbentuk. Berdasarkan informasi yang didapatkan dari dendogram diatas, didapatkan kejelasan pembentukan kelompok objek-objek untuk peta dua dimensi yang hasilnya bisa dilihat pada Gambar 3.
6
1.0
PA07
PP02 KD03
PA08
KD04
MI02 KR01 PP03
0.5
Dimensi 2
Kelompok 2
Kelompok 3 PA06
FF02 PA04 0.0
KD01
PA02
KR03 FP02
MI03 KR02
KR04
Kelompok 1
FF01
KD05
PA01
FP03
PP01
PA05 KR05
FF06 FF03
-0.5 FF05
FP01
FF04
KD02 PA03 MI01 -1.0 -2
-1
0
1
2
Dimensi 1
Gambar 3. Peta presepsi karakteristik pelayanan institusi yang membentuk tiga kelompok
Seperti yang telah kita ketahui bahwa objek yang berada di kiri bawah adalah objek yang penilainya kecil dan bergerak ke kanan atas penilaian objeknya membesar. Sehingga berdasarkan studi kasus kelompok 1 bisa kita identifikasikan sebagai objek yang penilaiannya kecil, kelompok 2 bisa kita identifikasikan sebagai objek yang penilaiannya sedang dan kelompok 3 bisa kita identifikasikan sebagai objek yang penilaiannya besar, dengan kata lain kelompok 1 adalah kelompok karakteristik pelayanan yang menjadi prioritas pertama untuk diperbaiki, kelompok 2 adalah kelompok karakteristik pelayanan yang menjadi prioritas kedua untuk diperbaiki dan kelompok 3 adalah kelompok karakteristik pelayanan yang tidak harus diperbaiki. 4.
KESIMPULAN DAN SARAN
4.1. Kesimpulan Subjektifitas dalam mengelompokan objek pada peta presepsi bisa ditanggulangi dengan menggunakan Analisis Hierarchical Clustering karena penentuan jumlah kelompoknya ditentukan oleh nilai selisih agglomerative pada dendogram diproyeksikan dengan Rescaled Distance Cluster Combine, dan penentuan anggota kelompoknya relatif berdasarkan jarak yang bisa dilihat pada dendogram. Ukuran jarak yang digunakan adalah jarak Euclidean dan metode yang digunakan adalah metode Single Linkage (Nearest Neighbor). Data jarak yang akan dipakai untuk Analisis Hierarchical Clustering adalah data titik koordinat dimensi setiap objek dari peta. Hasil Analisis Hierarchical Clustering menjadi dasar pembentukan kelompok objek-objek untuk peta dua dimensi. 4.2. Saran Penelitian ini bermaksud untuk menghindari subjektifitas pengelompokan objek dari peta dua dimensi, namun ada beberapa saran yang harus diperhatikan dalam pengunaan metode ini, yaitu: 1) Jika berdasarkan hasil Analisis Hierarchical Clustering dengan metode Single Linkage terbentuk cluster yang merupakan outlier, akan mengakibatkan adanya satu objek yang tidak terkelompok. Bila hal itu terjadi akan lebih baik jika metode yang digunakan adalah Complete Linkage atau Average Linkage. 7
2) Jika selisih agglomerative terbesar ada di tahap awal atau akhir akan mengakibatkan kelompok yang terbentuk tidak efisien. Bila hal ini terjadi akan lebih baik di pilih selisih agglomerative terbesar kedua, bila kelompok yang terbentuk masih tidak efisien juga, pilih selisih agglomerative terbesar ketiga, dan seterusnya. DAFTAR PUSTAKA Carmone, Jr, Frank.J.; Green, Paul.E.; Smith, Scott.M., 1989 Multidimensional Scaling Concepts and Applications, Allyn and Bacon, Boston. Dillon, W.R.; Matthew G., 1984. Multivariate Analysis: Methods and Application, John Willey and Sons Inc, New York. Goldberg, Jack.L., 1991. Matrix Theory With Apllications, McGraw-Hill Inc, New York. Hair, Jr, J.F.; Black, W.C.; Babin, B.J.; Anderson, R.E.; Tatham, R.L., 2006. Multivariate Data Analysis, 6th Ed, Pearson Education Inc, Singapore. Johnson, R.A.; Wichern, D.W., 1992. Applied Multivariate Statistical Analysis, Prentice-Hall Inc, New Jersey. Latin, J.; Carrol , J.; Douglas.; Green.; Paul.E., 2003. Analyzing Multivariat Data, Duxbury Applied Series, Canada. Morrison, D.F., 2005. Multivariate Statistical Methods, 4th Ed, Thomson Learning Inc, Singapore. Maholtra, N.K., 1999. Marketing Research An Applied Orientation, 3th Ed, Prentice-Hall Inc, New Jersey. Sudman, S.; Blair, E., 1998. Marketing Research A Problem Solving Approach, McGrawHill Companies Inc. Singapore. Rencher, Alvin C., 2002. Methods of Multivariate Analysis, 2nd Ed, John Wiley & Sons, Inc. United States of America. Webb, A.R., 2002. Statistical Pattern Recognition, 2nd Ed, John Wiley & Sons Ltd, The Atrium, Southern Gate, Chichester, West Sussex PO19 8SQ, England.
8