Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 1 Juli 2016, Samarinda, Indonesia ISSN : 2528 - 0988
PERBANDINGAN KINERJA METODE COMPLETE LINKAGE DAN AVERAGE LINKAGE DALAM MENENTUKAN HASIL ANALISIS CLUSTER (Studi Kasus: Produksi Palawija Provinsi Kalimantan Timur 2014/2015) 1
2,*
2
Silvia Ningsih , Sri Wahyuningsih , Yuki Novia Nasution Laboratorium Statistika Terapan, Fakultas MIPA, Universitas Mulawarman 2 Program Studi Statistika FMIPA, Universitas Mulawarman *Corresponding Author:
[email protected]
1
Abstrak Salah satu faktor penyebab rendahnya pertumbuhan ekonomi Kalimantan Timur karena melambatnya sektor pertanian yang terdiri dari padi dan tanaman palawija. Penelitian ini bertujuan untuk membentuk cluster dengan data produksi palawija di Provinsi Kalimantan Timur pada tahun 2014/2015 dengan metode complete linkage dan average linkage, serta menjelaskan perbandingan hasil yang diperoleh jika ditinjau dari simpangan baku dalam dan antar kelompok. Hasil akhir menunjukkan bahwa pada metode complete linkage dipilih empat cluster yaitu cluster pertama terdiri dari empat Kabupaten/Kota penghasil palawija sangat sedikit, cluster ke-dua terdiri dari dua Kabupaten/Kota penghasil palawija cukup banyak, cluster ke-tiga terdiri dari satu Kabupaten/Kota penghasil palawija terbanyak, cluster ke-empat terdiri dari dua Kabupaten/Kota penghasil palawija cukup sedikit. Untuk metode average linkage dipilih empat cluster yaitu cluster pertama terdiri dari lima Kabupaten/Kota penghasil palawija cukup sedikit, cluster ke-dua terdiri dari dua Kabupaten/Kota penghasil palawija cukup banyak, cluster ke-tiga terdiri dari satu Kabupaten/Kota penghasil palawija terbanyak, cluster ke-empat terdiri dari satu Kabupaten/Kota penghasil palawija sangat sedikit. Pada perbandingan nilai rasio simpangan baku, nilai terkecil sebesar 0,056 dimiliki oleh metode average linkage, yang berarti metode average linkage lebih baik dibandingkan dengan metode complete linkage pada kasus pengelompokkan Kabupaten/Kota berdasarkan produksi palawija. Kata Kunci: Analisis cluster, average linkage, complete linkage, simpangan baku dalam dan antar kelompok. Pendahuluan
dilakukan oleh Fatah pada tahun 2008 [2], dan analisis cluster Kabupaten/Kota berdasarkan pertumbuhan ekonomi yang dilakukan oleh Machfudhoh pada tahun 2013 [3]. Di tengah perlambatan ekonomi global, ekonomi Kalimantan Timur pada tahun 2015 triwulan IV turun sebesar -0,9%, lebih rendah dibandingkan tahun sebelumnya yang tumbuh 2,2%. Pencapaian ini jauh lebih rendah dari pertumbuhan ekonomi secara nasional pada triwulan IV tahun 2015 sebesar 5,0%. Hal ini dikarenakan turunnya permintaan batu bara dunia, rendahnya harga komoditas internasional, dan melambatnya kinerja sektor pertanian di Kalimantan Timur [4]. Salah satu faktor penyebab rendahnya pertumbuhan ekonomi di Kalimantan Timur adalah dengan melambatnya sektor pertanian yang terdiri dari padi dan tanaman palawija. Pengelompokkan daerah dapat dilakukan sehingga setiap daerah dapat memaksimalkan hasil panen dari sektor pertanian khususnya tanaman palawija.
Analisis cluster merupakan suatu teknik analisis dengan tujuan untuk memilih obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antara kelompok satu dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam kelompok atau variasi obyek dalam kelompok yang terbentuk sekecil mungkin. Dalam analisis cluster hierarki dengan metode complete linkage menggunakan aturan jarak maksimum antar kelompok. Untuk metode average linkage proses pengelompokkan dimulai dengan menemukan dua obyek yang mempunyai jarak terdekat. Selanjutnya obyek tersebut menjadi satu kelompok. Kemudian untuk langkah selanjutnya menggunakan aturan rata-rata jarak dua kelompok. Beberapa penelitian yang pernah dilakukan adalah analisis cluster perusahaan di Kutai Barat berdasarkan tingkat pencemaran udara yang dilakukan oleh Goreti pada tahun 2015 [1]. Analisis cluster pasien penyakit jantung yang rawat inap di Rumah Sakit Islam Samarinda, penelitian ini 46
Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 1 Juli 2016, Samarinda, Indonesia ISSN : 2528 - 0988 Teori
cluster i dan k dan juga cluster-cluster j dan k [7]. b. Metode Average Linkage Average linkage merupakan variasi dari algoritma single linkage dan complete linkage yaitu menghitung jarak antara dua cluster yang disebut sebagai jarak rata-rata dimana jarak tersebut dihitung pada masing-masing cluster dengan meminimumkan ratarata jarak antara pasangan cluster yang digabungkan.
Dalam penelitian ini analisis dilakukan dengan langkah-langkah sebagai berikut: 1. Statistika Deskriptif Analisis ini dimaksudkan untuk mendeskripsikan terhadap obyek yang diteliti, agar karakteristik data lebih mudah dipahami. 2. Asumsi dalam Analisis Cluster Asumsi dalam analisis cluster yaitu terjadinya korelasi antar obyek yang kuat atau sempurna. Karena data yang digunakan dalam penelitian berskala rasio maka teknik korelasi yang digunakan adalah korelasi Pearson, dengan rumus sebagai berikut :
(4) dengan dab menurut Johnson dan Wichern (1996) merupakan jarak antara obyek a dalam cluster (ij) dan obyek b dalam cluster k. sedangkan, n(ij) dan nk berturut-turut merupakan jumlah obyek dalam cluster (ij) dan k [7]. 5. Menentukan Banyaknya Cluster dan Interpretasi Hasil Cluster. Dalam menentukan banyaknya cluster tidak ada aturan yang baku yang mendasarinya, akan tetapi dapat dilakukan dengan mempertimbangkan berdasarkan aspek kegunaan, teoritis, jarak dimana cluster digabung dan uji validitas untuk non-hierarki. Interpretasi hasil cluster digunakan untuk memberi nama spesifik yang dapat menggambarkan isi cluster. 6. Melakukan Validasi Cluster : variabel xj bukan variabel pembeda
(1) dimana adalah koefisien korelasi obyek dengan obyek , adalah rata-rata dari obyek x, adalah rata-rata dari obyek y, adalah data ke-j dari obyek x, adalah data ke-j dari obyek y, dan p adalah jumlah variabel penelitian. Antar obyek dikatakan memiliki hubungan yang cukup kuat jika nilai korelasi berkisar antara 0,60 hingga 0,99 [5]. 3. Ukuran Jarak Kemiripan Ukuran jarak kemiripan yang digunakan adalah ukuran jarak city-block (Manhattan distance), karena dalam banyak kasus ukuran jarak ini mendapatkan hasil yang mirip dengan jarak Euclidean sederhana. Dengan rumus sebagai berikut : (2)
dalam pengklasifikasian. : variabel xj adalah variabel pembeda dalam pengklasifikasian. Statistik uji yaitu dengan menghitung nilai F, sebagai berikut:
Dimana dij merupakan jarak antara obyek ke-i dengan obyek ke-j [6]. 4. Memilih Prosedur Analisis Cluster a. Metode Complete Linkage Metode pautan lengkap didasarkan pada jarak maksimum Pada awal perhitungan, terlebih dahulu mencari nilai minimum dalam matriks dij dan menggabungkan obyek-obyek yang bersesuaian, misalnya i dan j, untuk mendapatkan cluster (ij). Pada langkah (3) dari algoritma yang dijelaskan sebelumnya, jarak antara (ij) dan cluster k lainnya, dihitung dengan cara : (3)
(8) H0 ditolak jika
>
[8].
7. Pemilihan Metode Terbaik Sebuah metode pengelompokkan dikatakan baik jika mempunyai nilai simpangan baku dalam kelompok (Sw) yang minimum dan nilai simpangan baku antar kelompok (Sb) yang maksimum. Dengan rumus sebagai berikut : (9) dimana
disini dik dan djk merupakan jarak paling jauh antara anggota cluster47
Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 1 Juli 2016, Samarinda, Indonesia ISSN : 2528 - 0988 dilakukan perhitungan jarak tiap cluster terhadap cluster baru dengan menggunakan Persamaan (3). Proses pengklasifikasian dilakukan berulang-ulang hingga didapat matriks jarak empat cluster sebagai berikut :
(10) (11) dimana adalah jumlah dari adalah jumlah dari [9].
Tabel 3. Matriks Jarak Empat Cluster
dan
x(1,6,7,9) x(2,8) x3 x(4,5)
Hasil dan Pembahasan Statistika Deskriptif Tabel 1. Statistika Deskriptif. Jenis palawija Jagung Ubi kayu
N
Min
Maks
Ratarata
Std. Deviasi
9 9
13 414
3.990 23.260
840,67 6.428,67
1.240,16 7.470,60
Kacang tanah
9
11
680
168,33
229,134
Pengujian Asumsi Analisis Cluster 2 3 4
Tabel 2. Matriks Jarak Kemiripan. x1 0 8.738 22.541
x2 8.738 0 15.025
… … … …
x8 10.972 2.922 12.133
x9 1.809 9.295 24.320
x9
1.809
9.295
…
12.187
0
x(4,5) 8.675 11.026 21.957 0
Kabupaten/ Kota Paser Penajam Paser Utara Samarinda Bontang Kutai Barat Balikpapan Kutai Kartanegara Kutai Timur Berau
Rata-rata
Produksi Palawija
754,333 423,667 519,333 151,333 3.249,667 4.213,667
Sangat sedikit Cukup bayak
8.258 1.700 3.043
Terbanyak Cukup sedikit
b. Metode Average Linkage Proses pengklasifikasian dimulai dengan mencari jarak terdekat antara dua obyek berdasarkan matriks jarak kemiripan yang telah terbentuk.jarak antara x6 dan x7 merupakan jarak yang paling dekat diantara yang lainnya yaitu sebesar 287, sehingga kedua obyek tersebut menjadi satu cluster dan tersisa delapan cluster. Selanjutnya dilakukan perhitungan jarak tiap cluster terhadap cluster baru dengan menggunakan Persamaan (4). Proses pengklasifikasian dilakukan berulang-ulang hingga didapat matriks jarak empat cluster sebagai berikut :
Menentukan Ukuran Jarak Kemiripan
x1 x2 x3
x3 24.320 15.025 0 21.957
Tabel 4. Anggota Cluster pada Metode Complete Linkage.
1
Nilai korelasi antara x1 dan x2 adalah sebesar 0,805 yang berarti bahwa x1 dan x2 memiliki kemiripan atau hubungan yang sangat kuat. Untuk nilai korelasi x1 dan x3 adalah sebesar 0,799 yang berarti bahwa x1 dan x3 memiliki hubungan yang kuat. Demikian seterusnya untuk penafsiran obyek-obyek lainnya.
x(2,8) 12.187 0 15.025 11.026
Untuk memperjelas proses pengklasifikasian, berikut ciri spesifik dari masing-masing cluster :
Cluster
Terlihat bahwa tanaman ubi kayu adalah tanaman palawija yang paling banyak dihasilkan yaitu sebesar 23.260 ton dan terdapat di Kabupaten Kutai Kartanegara.
x(1,6,7,9) 0 12.187 24.320 8.675
Dengan menggunakan perhitungan yang sama, diperoleh juga jarak antara x1 dan x3 dan seterusnya. Semakin kecil nilai jarak antara dua obyek, maka semakin mirip kedua obyek tersebut.
Tabel 5. Matriks Jarak Empat Cluster. x(1,4,6,7,9) x(2,8) x3 x5
Analisis Cluster a. Metode Complete Linkage Proses pengklasifikasian dimulai dengan mencari jarak terdekat antara dua obyek berdasarkan matriks jarak kemiripan yang telah terbentuk.jarak antara x6 dan x7 merupakan jarak yang paling dekat diantara yang lainnya yaitu sebesar 287, sehingga kedua obyek tersebut menjadi satu cluster dan tersisa delapan cluster. Selanjutnya
x(1,4,6,7,9) 0 9.542,6 22.702,4 6.999,8
x(2,8) 9.542,6 0 13.579 9.909
x3 22.702,4 13.579 0 21.957
x5 6.999,8 9.909 21.957 0
Untuk memperjelas proses pengklasifikasian, berikut ciri spesifik dari masing-masing cluster : Tabel 6. Anggota Cluster pada Metode Average Linkage. Cluster
48
Kabupaten/ Kota
Rata-rata
Produksi Palawija
Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 1 Juli 2016, Samarinda, Indonesia ISSN : 2528 - 0988
1
2 3 4
Paser
754,333
Kutai Timur Penajam Paser Utara Samarinda Bontang Kutai Barat Balikpapan Kutai Kartanegara
1.700 423,667 519,333 151,333 3.249,667 4.213,667
Berau
3.043
8.258
Tabel 9. Nilai Simpangan Baku Dalam dan Antar Kelompok pada Metode Complete Linkage dan Average Linkage. Complete Linkage
Cukup sedikit Cukup banyak Terbanyak Sangat sedkit
Signifikansi
Keputusan
Jagung Ubi Kayu Kacang Tanah
2,326
0,192
Gagal tolak
170,454
0,000
Tolak
43,020
0,001
Tolak
Signifikansi
Keputusan
Jagung Ubi Kayu Kacang Tanah
19,393
0,003
Tolak
71,076
0,000
Tolak
20,093
0,003
Tolak
180,354
2.133,789
2
720,915
12.978,56
782,499
12.985,168
3
38,266
2.572,959
25,033
2.537,905
Rasio Simpangan Baku 0,083 0,056
nilai rasio simpangan baku (R) sebesar 0,056 menunjukkan bahwa metode average linkage memiliki nilai rasio simpangan baku yang lebih kecil dari metode complete linkage. Oleh karena itu, kinerja yang paling baik dari kedua metode yang diteliti adalah metode average linkage. Kesimpulan 1. Terbentuk empat cluster baik dengan menggunakan metode complete linkage ataupun metode average linkage dengan rincian sebagai berikut : a. Untuk metode complete linkage diperoleh hasil cluster pertama terdiri dari empat Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah sangat sedikit. Cluster ke-dua terdiri dari dua Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah cukup banyak. Cluster ke-tiga terdiri dari satu Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah terbanyak. Cluster ke-empat terdiri dari dua Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah cukup sedikit. b. Untuk metode average linkage diperoleh hasil cluster pertama terdiri dari lima Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah cukup sedikit. Cluster ke-dua terdiri dari dua Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah cukup banyak. Cluster ke-tiga terdiri dari satu Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu, dan kacang tanah terbanyak.
Tabel 8. Uji F pada Metode Average Linkage. F
2.000,306
Metode Complete Linkage Metode Average Linkage
Setelah dilakukan validasi pada metode complete linkage dapat diketahui bahwa variabel ubi kayu dan variabel kacang tanah merupakan variabel pembeda dalam pengklasifikasian, sedangkan untuk variabel jagung bukan merupakan variabel pembeda dalam pengklasifikasian
Palawija
697,579
Metode
Tabel 7. Uji F pada Metode Complete Linkage. F
1
Tabel 10. Nilai Rasio Simpangan Baku Kedua Metode.
Validasi Cluster
Palawija
Average Linkage
Setelah dilakukan validasi pada metode average linkage dapat diketahui bahwa variabel jagung, variabel ubi kayu dan variabel kacang tanah merupakan variabel pembeda dalam pengklasifikasian.
Pemilihan Metode Terbaik
49
Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 1 Juli 2016, Samarinda, Indonesia ISSN : 2528 - 0988 Cluster ke-empat terdiri dari satu Kabupaten/Kota yang menghasilkan tanaman jagung, ubi kayu dan kacang tanah sangat sedikit. 2. Jika ditinjau dari nilai rasio simpangan baku Sw terhadap Sb menunjukkan bahwa nilai rasio simpangan baku (R) pada metode average linkage yaitu 0,056 lebih kecil daripada nilai rasio simpangan baku (R) pada complete linkage yaitu 0,083. Dengan demikian metode average linkage merupakan metode paling baik dari kedua metode yang diteliti pada kasus ini.
[8] Walpole, R. E. (1992). Pengantar Statistika Edisi ke-3. Jakarta : PT. Gramedia Pustaka Utama. [9] Nuritha, I., S. Bukhori., dan W. E. Y. Retnani. (2013). Identifikasi Pengaruh Lokasi Usaha Terhadap Tingkat Keberhasilan Usaha Minimarket Waralaba di Kabupaten Jember dengan Sistem Informasi Geografis. Jurnal Sainstek UNEJ Vol. 1, No. 1, 2013. Hal 825-835.
Ucapan Terima Kasih Penulis mengucapkan terima kasih kepada pihak Badan Pusat Statistik Prov. Kaltim atas kesempatan yang diberikan untuk pengambilan data penelitian. Selanjutnya, penulis berterima kasih pada Laboratorium Statistika Statistika Terapan FMIPA UNMUL atas fasilitas yang diberikan untuk melakukan penelitian ilmiah. Daftar Pustaka [1] Goreti, M. (2015). Perbandingan hasil Analisis Cluster dengan Menggunakan Metode Single Linkage dan metode CMeans. Skripsi tidak diterbitkan. Samarinda: FMIPA Universitas Mulawarman. [2] Fatah, A. (2008). Perbandingan Hasil Cluster antara Single Linkage, Complete Linkage dan Average Linkage. Skripsi tidak diterbitkan. Samarinda: FMIPA Universitas Mulawarman. [3] Machfudhoh, S., dan N. Wahyuningsih. (2013). Analisis Cluster Kabupaten/Kota Berdasarkan Pertumbuhan Ekonomi Jawa Timur. Jurnal Sains dan Seni Pomits ITS Vol. 2, No. 1, 2013.Hal 2337-3520. [4] Bank Indonesia. (2015). Kajian Ekonomi dan Keuangan Regional Provinsi Kalimantan Timur Triwulan IV Tahun 2015. Samarinda: BI. [5] Triton. (2006). SPSS 13.0 Terapan: Riset Statistik Parametrik. Yogyakarta: Andi Offset. [6] Simamora, B. (2005). Analisis Multivariat Pemasaran Edisi Pertama. Jakarta: PT. Gramedia Pustaka Utama. [7] Johnson, R. A., dan D. W. Wichern. (1996). Applied Multivariate Statistical th Analysis 3 . New Delhi: Prentice-Hall. 50