`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antara anggota dalam kelompoknya atau dapat dikatakan variasi obyek/individu dalam satu kelompok yang terbentuk sekecil mungkin (Anderberg,1973). Analisis cluster merupakan alat analisis data di berbagai situasi berbeda. Sebagai contoh peneliti yang mengumpulkan data dengan cara kuesioner mungkin menghadapi banyak observasi yang tidak bermakna sebelum diklasifikasikan secara teratur dalam kelompok-kelompok. Tujuan primer Analisis Cluster adalah mengetahui struktur data dengan menempatkan kesamaan objek observasi ke dalam satu grup atau dengan mengelompokkan sekumpulan objek (case atau variabel ) ke dalam beberapa kelompok (cluster) yang memiliki karakteristik tertentu dan dapat dibedakan satu sama lain untuk analisis dan interpretasi lebih lanjut. Secara garis besar, terdapat dua metode pembentukan cluster, yaitu: Metode Hirarki Metode hirarki adalah teknik pengelompokan yang membentuk konstruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon, sehingga proses pengelompokan dilakukan secara bertingkat atau bertahap. Metode hirarki dibedakan menjadi dua: a. Metode Aglomeratif (Agglomerative Methods) Pada metode aglomerasi, mula-mula setiap objek membentuk cluster masingmasing. Dua objek dengan jarak terdekat bergabung menjadi satu cluster. Objek lain akan bergabung dengan cluster yang ada atau objek lain membentuk cluster baru dengan tetap memperhitungkan jarak kedekatan antar objek. Proses berlangsung terus sampai akhirnya terbentuk satu cluster yang terdiri atas semua objek. Beberapa prinsip kemiripan (similarity) antar objek dalam bentuk jarak (distance) yang digunakan adalah: 1. Single Linkage (Nearest Neighbor Method) Prinsip yang digunakan adalah aturan jarak minimum dalam pembentukan cluster. 2. Complete Linkage (Further Neighbor Method) Merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip yang digunakan adalah aturan jarak terjauh objek. 3. Average Linkage Between Group Method (UPGMA = Unweighted Pair-Group Method Using Arithmetic Average) Jarak antara dua cluster yang digunakan dalam metode ini merupakan jarak rata-rata antara semua pasangan objek yang mungkin dari dua buah cluster. 4. Average Linkage Within-Group Method Merupakan variasi UPGMA. Perbedaannya terletak pada cara pembentukan cluster sehingga rata-rata jarak antar cluster adalah yang terkecil. Metode ini memperhitungkan jarak rata-rata semua pasangan objek yang terdapat dalam dua cluster. 5. Ward’s Error Sum of Squares Method Ward merupakan pembentukan cluster yang didasari oleh hilangnya informasi akibat penggabungan objek antar cluster.
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
6.
7.
Centroid Method Metode ini mendefinisikan jarak antara dua buah cluster sebagai jarak antara rataan tiap cluster (centroid) terhadap variabel. Median Method Metode ini mirip dengan centroid method, dimana perbedaannya terletak pada perhitungan centroidnya yang tidak menggunakan bobot. Artinya bahwa perhitungan rataan tiap cluster tidak memperhitungkan ukuran suatu cluster.
b. Metode Divisif (Divisive Methods) Metode divisif diawali dengan membagi n objek menjadi dua cluster. Tiap cluster tersebut dibagi dalam dua kelompok lagi dan seterusnya sehingga akan terdapat n buah kluster yang berisikan hanya satu objek atau n buah cluster yang diinginkan. Metode Partisi Metode partisi (nonhirarki) dimulai dengan memilih sejumlah nilai cluster yang sesuai dengan jumlah yang diinginkan kemudian objek digabungkan ke dalam clustercluster tersebut. Prosedur analisis cluster k-means digunakan untuk mengelompokkan sejumlah kasus yang besar (>200 kasus) dengan lebih efisien. Metode ini didasarkan pada nearest centroid sorting yaitu pengelompokan berdasarkan jarak terkecil antara kasus dan pusat cluster. Keunggulan Analisis Cluster : 1. Dapat mengelompokan data observasi dalam jumlah besar dan variabel yang relatif banyak. Data yang direduksi dengan kelompok akan mudah dianalisis. 2. Dapat dipakai dalam skala data ordinal, interval dan rasio Kelemahan Analisis Cluster 1. Pengelompokan bersifat subyektifitas peneliti karena hanya melihat dari gambar dendrogram 2. Untuk data yang terlalu heterogen antara objek penelitian yang satu dengan yang lain akan sulit bagi peneliti untuk menentukan jumlah kelompok yang dibentuk. 3. Metode-metode dipakai memberikan perbedaan yang signifikan, sehingga dalam perhitungan biasanya masing-masing metode dibandingkan. 4. Semakin besar observasi, biasanya tingkat kesalahan pengelompokan akan semakin besar (hasil penelitian) Kegunaan Analisis Cluster dalam Perencanaan Perencanaan merupakan suatu ilmu yang luas cakupannya, baik itu cakupan materi maupun wilayah yang dikajinya. Perencanaan juga bertujuan untuk membuat objek yang direncanakannnya menjadi lebih terarah dengan baik pembangunan dan pengembangannya. Dalam merencanakan suatu wilayah, diperlukan data – data yang mendetail guna mendukung proses perencanaan wilayah tersebut, namun, tidak mungkin bagi seorang perencana mampu menganalisis satu per satu secara mendetail wilayah tersebut. Padahal dalam suatu wilayah tersebut misalnya, terdapat 18 kecamatan yang memerlukan perencanaan dengan pendekatan yang berbeda-beda.
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Oleh karena itu perlu dilakukan suatu pengelompokan dalam objek atau wilayah amatan tersebut berdasarkan kemiripan karakteristiknya yang disebut analisis cluster. Hal ini agar memudahkan seorang perencana menganalisis dengan memberikan suatu pendekatan perencanaan yang sama terhadap objek atau wilayah amatan yang memiliki kemiripan. Cara ini tentu mengefisienkan dan mengefektifkan waktu, dana, serta proses perencanaan tersebut. Analisis Diskriminan Analisis diskriminan pertama kali dikembangkan oleh Fisher tahun 1936. Prinsip analisis diskriminan hampir sama dengan analisis regresi, yang Mempunyai Dependen Variabel (Y) dan Independen Variabel (X) yang mempengaruhi Dependen Variabel. Analogi yang dipakai untuk analisis regresi dan diskriminan adalah Depeden Variabel (Y) pada multiple regresi adalah suatu nilai kuantitatif, sedangkan pada discriminant analysis, dependen variabel adalah suatu nilai kualitatif. Pada analisis regresi, variabel dependen (Y) menjadi satu fokus yang berubah (prediktif) dan variabel independen (X) relatif tetap, sedangkan pada analisis diskriminan, variabel dependen relatif tetap (kelompok) dan variabel independen berubah-ubah serta terdistribusi normal. Analisis Regresi menurunkan perkiraan-perkiraan parameter yang telah mempunyai kelengkapan statistik, sedang analisis diskriminan merupakan strategi yang teliti dalam menemukan mean dari pengelompokkan. Tujuan analisis diskriminan adalah Untuk mencari model yang sesuai untuk dapat menentukan objek-objek pengamatan menjadi kelompok-kelompok yang lengkap. Untuk menentukan kontribusi masing-masing variabel yang terlibat dalam pengklasifikasian. Sebagai dasar penentuan apakah suatu variabel tertentu perlu dilibatkan dalam analisa pengklasifikasian selanjutnya atau tidak. Analisis Diskriminan merupakan teknik statistik yang cocok untuk menguji hipotesis dari sekelompok variabel bebas. Uji untuk signifikansi statistik untuk fungsi diskriminan secara umum diukur dari jarak diantara dua kurva. Jika overlap (wilayah tumpang tindih) dalam distribusi luasnya kecil, maka fungsi diskriminan dengan baik memisahkan kelompok, namun jika overlap besar, fungsi kurang baik sebagai pemisah antara kelompok. Tahapan analisis diskriminan dimulai dengan beberapa tujuan penelitian, diantaranya adalah: Mengidentifikasi perbedaan signifikansi statistik yang ada diantara profil skor rata-rata dalam seperangkat variabel dari dua atau lebih kelompok. Menentukan variabel bebas yang memiliki nilai rata-rata paling besar Menentukan prosedur pengklasifikasian objek (individu, pabrik, produk, dst) dalam kelompok berdasarkan skor dalam variabel bebas Menetapkan jumlah dan komposisi diskriminasi diantara kelompok yang dibentuk dari seperangkat variabel bebas.
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Kelebihan Analisis Diskriminan 1. Memberikan perhitungan yang lebih efisien (Sharma, 1996), 2. Fungsi diskriminan berfungsi sebagai aturan yang dapat membedakan objek pengamatan sekaligus mengelompokkannya ke dalam salah satu kelompok secara optimal (Johnson dan Wichern, 2002). 3. Analisis Diskriminan cocok untuk permasalahan penelitian dengan variabel terikat berjenis kategori (nominal atau nonmetrik). Kelemahan Analisis Diskriminan 1. Asumsi harus terpenuhi, dimana data harus memenuhi distribusi normal multivariat dan menghasilkan matriks kovarians yang sama setiap populasi (Johnson dan Wichern, 2002). Kegunaan Analisis Diskriminan dalam Perencanaan Dalam sebuah perencanaan suatu wilayah seringkali penelitian – penelitian yang dilakukan dikelompokkan dalam kategori – kategori tertentu. Pengkategorian tersebut sangat membantu dalam proses perencanan karena dapat memudahkan dalam proses pengarahan perencanaan suatu wilayah yang sesuai dengan kategorinya agar dapat mencapai tujuan dari sebuah proses perencanaan, yaitu membuat objek yang direncanakan menjadi lebih baik lagi. Dalam proses pengkategorian, diperlukan analisis terhadap variabel yang membuat data – data yang dikategorikan termasuk dalam kategori tersebut. Untuk itulah diperlukan analisis diskriman yang berfungsi mencari variabel pembeda dalam suatu pengkategorian data. Analisis Komponen Utama Dalam statistika, analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor. PCA dapat dianggap sebagai teknik transformasi data. Stu Daultrey (1976) menjelaskan PCA sebagai prosedur transformasi yang sebaiknya digunakan atau dapat juga sebagai prosedur awal untuk mengidentifikasi variabel-variabel untuk monitoring
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
dan analisis selanjutnya. Total varian (jumlah varian) dari tiap variabel dapat dihitung jika (1) variabel tersebut dapat diukur secara kuantitatif, (2) tiap variabel mempunyai varian yang berarti ‘nilai ukuran penyebaran dalam seluruh rata-rata data, dan (3) diantara variabel mempunyai hubungan (korelasi), contoh: nilai kovarian diantara dua variabel. PCA dapat dihitung berdasarkan varian-kovarian atau korelasi matrik. Prosedur perhitungan sebagian besar sama, kecuali penggunaan matrik sebagai input componentloading. Component-loading yang didapat dari korelasi matrik lebih mudah diinterpretasikan dibandingkan yang didapat dari matrik varian-kovarian karena nilai maksimal varian dari tiap variabel akan disebarkan dalam beberapa faktor. Analisis Komponen Utama biasanya digunakan untuk : 1. Identifikasi peubah baru yang mendasari data peubah ganda 2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas peubah yang banyak dan saling berkolerasi dengan mempertahankan sebanyak mungkin keragaman data tersebut. 3. Menghilangkan peubah-peubah asal yang mempunyai sumbangan informasi kecil. Kelebihan Analisis Komponen Utama 1. Mampu menjelaskan pengaruh interaksi tanpa menerangkan pengaruh utamanya . 2. Dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. 3. Analisis komponen utama juga sering digunakan untuk menghindari masalah multikolinearitas antar peubah bebas dalam model regresi berganda. Kelemahan Analisis Komponen Utama 1. Kurang memadai untuk menganalisis struktur data yang kompleks dan hanya efektif menjelaskan pengaruh interaksi tanpa menerangkan pengaruh utamanya (Mattjik, 1998). Kegunaan Analisis Diskriminan dalam Perencanaan Dalam lingkup perencanaan wilayah, metode ini sangat berguna dalam mengidentifikasi potensi ekonomi dalam suatu kawasan dan juga penyebaran dalam kawasan tersebut. Karena kemampuan tersebut, perencana wilayah sering menggunakan metode ini untuk menganalisis wilayah dalam berbagai tingkatan administratif, mulai dari tingkatan nasional hingga kabupaten (Eckey, 1989:4). Analisis faktor merupakan salah satu metode reduksi data yang bertujuan menyederhanakan sekumpulan besar data yang saling berkorelasi menjadi kelompokkelompok variabel yang lebih kecil (faktor) agar dapat dianalisis dengan mudah. Teori ini pertama kali digunakan untuk mengatasi permasalahan psikologi oleh Charles Spearman dalam The American Journal of Psychology tahun 1904 tentang pengukuran intelektual. Dalam perkembangannya, metode ini telah banyak digunakan oleh berbagai disiplin ilmu, seperti ilmu politik, ilmu sosial, teknik industri, pertanian, perencanaan wilayah dan kota, dsb (Dillon, 1984:23).
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Kesimpulan Didalam perencanaan tidak terlepas dari analisis data untuk mendapatkan informasi mengenai masa lalu dan untuk memprediksi masa depan. Analisisnyang digunakan antara lain Analisis Komponen Utama (Principal Component Analysis, PCA), Metode Analisis Gerombol (Cluster Analysis, CA) dan Metode Analisis Fungsi Diskriminan (Discriminant Function Analysis, DFA) yang mempunyai fungsi dan tujuan tersendiri. Tujuan utama penggunaan analisis komponen utama adalah untuk mengurangi jumlah variabel yang akan digunakan pada proses selanjutnya, sedangkan analisis cluster digunakan untuk mengelompokkan objek-objek pengukuran berdasarkan kesamaan atau ketidaksamaan karakteristik diantara objek-objek yang diukur (Lebart et al., 1995 yang diacu Lawson et al., 2001). Sedangkan analisis diskriminan selain digunakan untuk mengetahui apakah hasil pengelompokkan yang diperoleh dari analisis gerombol memiliki perbedaan yang nyata juga digunakan untuk mengetahui variabel apa saja yang terdapat pada fungsi diskriminan yang berperan sebagai pembeda yang nyata dalam pengelompokan tersebut (Cacoullos & Styan, 1973 yang diacu Lawson et al., 2001).
Metode Analisis Perencanaan
`
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Daftar Pustaka Anonim.2014.”Analisis Komponen Utama” diunduh pada 20 April 2014 pada statistikakomputasi.com Buchori, Imam, et.all. 2007. “Bahan Ajar Metode Analisis Perencanaan”. Semarang: Perencanaan Wilayah dan Kota Universitas Diponegoro. Budyanra. 2010. ” Ketepatan Pengklasifikasiaan Fungsi Diskriminan”. Bandung: Universitas Padjajaran.
Metode Analisis Perencanaan