BAB III METODOLOGI PENELITIAN
3.1 Jenis dan Sumber Data Data yang digunakan pada penelitian ini berupa data sekunder yang bersumber dari publikasi-publikasi BPS, yaitu Data Produk Domestik Regional Bruto (PDRB) Provinsi Jawa Timur Tahun 2005-2010, Data PDRB Kabupaten/Kota se-Jawa Timur Tahun 2010, Jawa Timur Dalam Angka 2011, Statistik Potensi Desa Provinsi Jawa Timur Tahun 2008, Data Makro Ekonomi dan Sosial Provinsi Jawa Timur Tahun 2005-2010 dan Hasil Survei Sosial Ekonomi Nasional Provinsi Jawa Timur Tahun 2010.
3.2 Metode Analisis Metode analisis yang digunakan dalam penelitian ini adalah analisis data dengan banyak peubah (Multivariate), yaitu Analisis Komponen Utama yang dirangkai dengan Analisis Faktor. Tujuan kedua analisis ini adalah untuk mereduksi banyaknya dimensi peubah yang saling berkorelasi menjadi suatu set kombinasi linier baru yang tidak saling berkorelasi akan tetapi masih mempertahankan sebagian besar keragaman data asli (original variable). Selanjutnya, sesuai dengan salah satu tujuan penelitian, kabupaten/kota yang ada
di
Provinsi
Jawa
Timur
diklasifikasikan
berdasarkan
kinerja
pembangunannya. Untuk itu, digunakan Analisis Cluster. Keseluruhan proses analisis dilakukan dengan bantuan program SPSS 19.
30
3.2.1 Analisis Komponen Utama Analisis Komponen Utama (AKU) digunakan untuk mengetahui apakah penelitian ini layak untuk analisis lebih lanjut dalam hal ini Analisis Faktor, di lihat dari nilai Kaiser Meyer Olkin (KMO) dan uji Bartlett. Analisis Komponen Utama (AKU) atau Principal Component Analysis (PCA) adalah suatu teknik menyusutkan (reduksi) data dimana tujuan utamanya untuk mengurangi banyaknya dimensi peubah yang saling berkorelasi menjadi peubah-peubah baru {disebut Komponen Utama (KU)} yang tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman dalam himpunan data tersebut. Artinya dengan dimensi yang lebih kecil diharapkan lebih mudah melakukan penafsiran atau interpretasi tanpa kehilangan banyak informasi tentang data.
Banyaknya KU (peubah baru) yang terbentuk diharapkan seminimal
mungkin, akan tetapi mampu menerangkan keragaman total yang maksimal. Secara aljabar linier, komponen utama merupakan kombinasi-kombinasi linier dan p peubah acak X1, X2, X3, X4,…., Xp. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan X1, X2, X3, .…., Xp sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariasi yang lebih sederhana. Sebagai catatan, dalam Analisis Komponen Utama, asumsi populasi mengikuti distribusi Normal Multivariate tidak diperlukan. Komponen utama yang dibentuk merupakan kombinasi linear dari peubahpeubah asli, dimana koefisiennya adalah vektor ciri (eigen vector). Vektor ciri dihasilkan dari akar ciri (eigen value) matriks kovarian atau matriks korelasi.
31
Penggunaan matriks kovarian atau matriks korelasi tergantung dari kesamaan satuan peubah-peubah yang dianalisis. Apabila satuannya sama digunakan matriks kovarian, sedang bila tidak sama digunakan matriks korelasi. Bila komponen utama diturunkan dari populasi normal multivariate dengan random vektor X X 1 , X 2 ,..., X P dan vektor mean μ 1 , 2 ,..., p
'
'
dan
matriks
Σ
kovarians
dengan
akar
ciri
(eigen
value)
yaitu
1 2 ... p 0 didapat kombinasi linier komponen utama adalah: Y1 e1' X e11 X 1 e21 X 2 ... e p1 X p Y2 e '2 X e12 X 1 e22 X 2 ... e p 2 X p ….
Yp e 'p X e1 p X 1 e2 p X 2 ... e pp X p
(1)
Maka: Varian Yi e'i e i
(2)
Kovarian Yi , Yk e'i e k
(3)
i , k = 1, 2, …, p Syarat untuk membentuk komponen utama yang merupakan kombinasi linear dari peubah X agar mempunyai varian maksimum adalah dengan memilih vektor ciri (eigen vector) yaitu e e1 , e 2 ,..., e p sedemikian hingga varian '
Yi e'i e k
maksimum dan e'i e i 1
Komponen
utama
pertama
adalah
kombinasi
memaksimumkan var e'1 X dengan syarat e'1 e1 1
linear
e'1 X yang
32
Komponen
utama
kedua
adalah
kombinasi
linier
e'2 X
yang
memaksimumkan var (e'2 X) dengan syarat e' 2 e 2 1 Komponen utama ke-i adalah kombinasi linier e'i X yang memaksimumkan var (e'i X) dengan syarat e' i e i 1 dan kov e'i X, e'k X 0 untuk k < i. Antar komponen utama tersebut tidak berkorelasi dan mempunyai variasi yang sama dengan akar ciri dari Σ. Akar ciri dari matriks ragam peragam Σ merupakan varian dari komponen utama Y, sehingga matriks ragam peragam dari Y adalah:
1 0 Σ. . 0
0
2 . . .
. . . . . p . . . . . .
0 0 .
Total keragaman peubah asal akan sama dengan total keragaman yang diterangkan oleh komponen utama yaitu: p
p
j 1
j 1
varX i tr Σ 1 2 ... p varYi
(4)
Penyusutan dimensi dari peubah asal dilakukan dengan mengambil sejumlah kecil komponen yang mampu menerangkan bagian terbesar keragaman data. Apabila komponen utama yang diambil sebanyak q komponen, di mana q < p, maka proporsi dari keragaman total yang bisa diterangkan oleh komponen utama ke-i adalah:
1 2 ... q p
100%
q
j j 1
p
100%, j 1,2,3,..., q
atau
(5)
33
Penurunan komponen utama dari matriks korelasi dilakukan apabila data sudah terlebih dahulu ditransformasikan kedalam bentuk baku Z. Transformasi ini dilakukan terhadap data yang satuan pengamatannya tidak sama. Bila peubah yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau satuan ukurannya tidak sama, maka peubah tersebut perlu dibakukan (standardized). Peubah baku (Z) didapat dari transformasi terhadap peubah asal dalam matriks berikut:
Z V 1/2
X μ 1
(6)
V1/2 adalah matriks simpangan baku dengan unsur diagonal utama adalah ii
1/ 2
sedangkan unsur lainnya adalah nol. Nilai harapan E (Z) = 0 dan keragamannya
adalah Cov(Z) V 1/2
V 1
1/2 1
ρ
(7)
Dengan demikian komponen utama dari Z dapat ditentukan dari vektor ciri yang didapat melalui matriks korelasi peubah asal ρ. Untuk mencari akar ciri dan menentukan vektor pembobotnya sama seperti pada matriks Σ. Sementara teras matriks korelasi ρ akan sama dengan jumlah p peubah yang dipakai. Penetapan banyaknya KU untuk dapat ditafsirkan dengan baik dapat dilihat dari: 1. Proporsi keragaman kumulatif dari KU Menurut Morrison (1990), banyaknya KU yang dipilih sudah cukup memadai apabila KU tersebut mempunyai persentase keragaman kumulatif tidak kurang dari 75% dari total keragaman data. Sedangkan Johnson dan Wichern (2002) mengisyaratkan bahwa KU dengan kondisi persentase keragaman
34
kumulatif sebesar 80-90%, dapat menggambarkan data asalnya. Keragaman total KU: p
Var (Yi) = 1+2+…+p
i 1
p
= i i 1
(8)
2. Nilai dari akar ciri Pemilihan komponen utama yang digunakan, didasarkan pada nilai akar cirinya. Menurut Kaiser (dalam Ekaria, 2004), pemilihan KU berdasarkan pendekatan akar ciri yang nilainya 1. AKU seringkali disajikan dalam tahap pertengahan dalam penelitian yang lebih besar. KU bisa merupakan masukan pada Analisis Faktor atau Analisis Cluster. KU terpilih selanjutnya digunakan sebagai pembentuk peubah dalam Analisis Faktor. Langkah selanjutnya adalah melakukan pengujian terhadap matriks korelasi dari data yang menjadi objek pengamatan. Matriks korelasi digunakan untuk melihat keeratan hubungan antara peubah yang satu dengan peubah yang lain. Ada dua macam pengujian yang dapat dilakukan terhadap matriks korelasi, yaitu: o Uji Bartlett Pengujian ini dilakukan untuk melihat apakah matrik korelasinya bukan merupakan suatu matrik identitas, jika matrik korelasinya merupakan matrik identitas, maka tidak ada korelasi antarpeubah yang digunakan. Uji ini dipakai bila sebagian besar dari koefisien korelasi kurang dari 0,5. Langkah-langkahnya adalah:
35
1. Hipotesis Ho : Matriks korelasi merupakan matriks identitas H1 : Matriks korelasi bukan merupakan matriks identitas 2. Statistik uji
2 N 1
2 p 5 ln R
6
N = Jumlah observasi
(9)
p = Jumlah peubah
R = Determinan dari matriks korelasi 3. Keputusan Uji Bartlett akan menolak H0 jika nilai
2 obs 2 , p p 1 / 2
(10)
o Uji Kaiser Meyer Olkin (KMO) Uji KMO digunakan untuk mengetahui apakah metode penarikan sampel yang digunakan memenuhi syarat atau tidak. Disamping itu, uji KMO dalam Analisis Faktor berguna untuk mengetahui apakah data yang digunakan dapat dianalisis lebih lanjut atau tidak dengan Analisis Faktor. Rumusan uji KMO adalah
KMO
r r i
i j
2
ij
i i j 2 ij
a 2 ij i
; i = 1,2,…,p ; j = 1,2,…,p
(11)
i j
di mana: rij = Koefisisen korelasi sederhana antara peubah i dan j aij = Koefisien korelasi parsial antara peubah i dan j Adapun penilaian uji KMO dari matrik antarpeubah adalah sebagai berikut: 0,90
36
0,80
; data tidak layak untuk uji lebih lanjut dengan analisis fak-
tor. 3.2.2 Analisis Faktor Analisis faktor adalah suatu analisis data untuk mengetahui faktor-faktor yang dominan dalam menjelaskan suatu masalah. Menurut Johnson dan Wichern (2002) yang dimaksud dengan analisis faktor adalah: 1. Pengembangan dari AKU yang lebih terperinci dan teliti. 2. Mengecek konsistensi data terhadap struktur peubah. Sedangkan kegunaan dari Analisis Faktor (Supranto, 2004) adalah: 1. Untuk mengidentifikasi dimensi yang mendasari (underlying dimensions) atau faktor, yang menjelaskan korelasi antara suatu set variabel. 2. Untuk mengidentifikasi suatu set variabel baru yang tidak berkorelasi (independent) yang lebih sedikit untuk menggantikan suatu set variabel asli yang saling berkorelasi. 3. Untuk mengidentifikasi suatu set variabel yang penting dari suatu set variabel yang banyak. Analisis Faktor pada dasarnya bertujuan untuk mendapatkan sejumlah kecil faktor/komponen utama yang memiliki sifat berikut (Ekaria, 2004): 1. Mampu menerangkan semaksimum mungkin keragaman data.
37
2. Terdapatnya kebebasan antarfaktor. 3. Tiap faktor dapat diinterpretasikan sejelas-jelasnya. Perbedaan antara Analisis Faktor dan Analisis Komponen Utama adalah: 1. Pada Analisis Komponen Utama, tujuannya adalah untuk memilih sejumlah peubah baru (yang disebut sebagai komponen utama) yang menjelaskan total variasi dalam set data sebesar – besarnya, 2. Pada Analisis Faktor, tujuan utamanya adalah memilih faktor-faktor yang dapat menjelaskan keterkaitan (Interrelationship) antar peubah asli. Dengan perkataan lain, Analisis Faktor bertujuan untuk menjelaskan arti peubahpeubah dalam set data. Pada Analisis Faktor diperlukan nilai estimasi dari faktor-faktor bersama yang disebut dengan skor faktor. Berdasarkan skor faktor pada setiap observasi, kita dapat menyatakan untuk masing – masing observasi tinggi rendahnya nilai skor faktornya. Skor faktor tertentu menunjukkan penting tidaknya peranan faktor-faktor tersebut bagi observasi itu. Skor faktor benilai negatif, nol dan positif, dimana jika nilainya semakin besar maka semakin besarlah peranan faktor tersebut terhadap suatu permasalahan pada observasi yang kita teliti. Secara umum, model Analisis Faktor adalah sebagai berikut : X1 - 1 = 11F1 + 12F2 + 13F3 +…………..+ 1mFm + 1 X2 - 2 = 21F1 + 22F2 + 23F3 +…………..+ 2mFm + X3 - 3 = 31F1 + 32F2 + 33F3 +…………..+ 3mFm +
38
Xp - p = p1F1 + p2F2 + p3F3 +…………..+ pmFm + p
(12)
Atau dalam notasi matriks, dituliskan Xpx1 - px1 = LpxmFmx1 + px1
(13)
di mana : Fj
= Faktor Umum ;
j = 1,2,……m; m
i
= Faktor Spesifik ;
i = 1,2,….p
i
= rata–rata peubah ke i
ij
= loading untuk peubah ke –i pada faktor ke –j
L
= Matriks faktor loading
dengan asumsi: 1. E(F) =0 2. Var (F) = E (FF') = Imxm 3. E () = 0 4. Var () = E(') = Cov (F') = E (F') =0, sehingga F dan independent Adapun struktur kovarian untuk model adalah: 1. Cov (X) = LL' + ψ
(14)
Var (Xi) = li21 li22 ... lij2 i
CovX 1 , Y j li21l 2j1 li22 l 2j 2 ... lim2 l 2jm 2. Cov (X,F) = L Cov (X1,Fj) = lij
(15)
39
Model (X-μ) = LF + ε adalah linier dalam faktor bersama. Bagian dari Var (Xi) yang dapat diterangkan oleh faktor bersama disebut communality ke-i. Sedangkan bagian dari Var (Xi) karena faktor spesifik disebut varian spesifik ke-i.
ii li21 li22 ... lim2 i hi2 i
(16)
di mana: hi2 = communality ψi = varian spesifik ke-i Dalam praktek, matriks ragam peragam di taksir dengan matriks ragam peragam sampel S dan matrik korelasi ρ peubah ditaksir dengan matriks korelasi R. Dalam hal ini, paket progarm SPSS/PC+ langsung menggunakan matriks korelasi R sebagai matriks ragam peragam dalam menghitung akar ciri dan vektor ciri maupun analisis faktornya. Faktor-faktor yang diperoleh melalui metode komponen utama pada umumnya masih sulit diinterpretasikan secara langsung. Untuk itu dilakukan manipulasi dengan cara merotasi loading L dengan menggunakan metode Rotasi Tegak Lurus Varimax (Varimax Orthogonal Rotation) sesuai dengan saran beberapa ahli, karena rotasi tegak lurus varimax lebih mendekati kenyataan dibanding yang lain. Rotasi varimax adalah rotasi yang memaksimalkan faktor pembobot, dan mengakibatkan korelasi variabel-variabel dengan suatu faktor mendekati satu, serta korelasi dengan faktor lainnya mendekati nol, sehingga mudah diinterpretasikan. Dari rotasi tersebut menghasilkan matriks loading baru L*, yaitu: L*(pxq) = L(pxq) . T(qxq)
(17)
40
di mana T adalah matriks transformasi yang dipilih sehingga, T'T = TT' = I
(18)
Matriks transformasi T ditentukan sedemikian serupa hingga total keragaman kuadrat loading L, yaitu:
1 q p ij V p j 1 i 1 hi
4 p ij h i 1 i
2
2 / p
(19)
menjadi maksimum, di mana: q
V (keragaman dari kuadrat loading untuk faktor ke-j) i 1
hi2 2i1 2i 2 ... 2iq (komunalitas, yaitu jumlah varians dari suatu variable ke-i yang dapat dijelaskan oleh sejumlah m common factors). Dari perumusan diatas, rotasi merupakan suatu upaya untuk menghasilkan faktor penimbang baru yang lebih mudah diinterpretasikan yaitu dengan mengalikan faktor penimbang awal dengan matriks transformasi yang bersifat orthogonal, sehingga matriks korelasinya tidak akan berubah. Dari merotasi matriks loading tadi menyebabkan setiap variabel asal mempunyai korelasi yang tinggi dan faktor tertentu saja, sedangkan dengan faktor lain mempunyai korelasi relatif rendah sehingga pada akhirnya setiap faktor akan lebih mudah diinterpretasikan. 3.2.3 Analisis Cluster Analisis Cluster bertujuan untuk memisahkan obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam
41
kelompok atau variasi obyek dalam satu kelompok yang terbentuk sekecil mungkin. Analisis ini digunakan untuk mengelompokan n individu (unit observasi) dengan p peubah ke dalam k kelompok. Bila yang akan dikelompokan berupa obyek maka pendekatan ukuran kemiripan biasanya ditunjukkan oleh ukuran jarak. Salah satu ukuran kemiripan yang digunakan adalah jarak euclidean. Jarak euclidean antar dua obyek Xi = [X1, X2, ..., XP] dan Yj = [Y1, Y2, ..., YP] yang berdimensi p adalah:
D X ,Y =
X 1 Y1 2 X 2 Y2 2 ... X P YP 2 X Y' X Y
(20)
Sehingga akan diperoleh matrik jarak sebagai berikut:
D
0 d 21
d12 0
. d n1
. d n2
... d1n ... d 2 n 0 ...
. 0
Semakin kecil nilai D, maka semakin besar kemiripan antara kedua pengamatan tersebut. Sebaliknya bila D besar, semakin besar ketidakmiripan dari pengamatan tersebut. Asumsi yang harus dipenuhi dalam penerapan Analisis Cluster adalah: 1. Sampel yang diambil harus dapat mewakili populasi yang ada. Dalam penelitian ini, digunakan data populasi, sehingga asumsi ini tidak perlu diuji lagi. 2. Multikolinieritas Multikolinieritas adalah kemungkinan adanya korelasi antar peubah bebas.
42
Sebaiknya tidak ada atau seandainya ada, besar multikolinieraitas tersebut tidaklah tinggi yaitu kurang dari 0,8 (Gujarati, 2004). Bila data yang digunakan dalam Analisis Cluster adalah data skor komponen dari hasil AKU, maka tidak akan ditemukan lagi adanya Multikolinieritas. Tahap selanjutnya dalam Analisis Cluster adalah menentukan metode pengelompokan/klasifikasi. Terdapat dua metode yaitu: 1. Metode Kelompok Hierarki (Hierarchical Clustering Methods) Metode ini digunakan bila banyaknya kelompok yang diinginkan belum diketahui.
Metode
ini
paling
banyak
digunakan
karena
pembentukan
kelompoknya bersifat alamiah. Pengelompokannya disajikan secara visual berbentuk dendogram yaitu suatu bagan yang menyajikan banyaknya kelompok terbesar hingga terkecil. Cara menentukan banyaknya kelompok yang tepat didasarkan pada jumlah anggota kelompok yang relatif merata. Proses pengelompokan diawali dengan memandang setiap obyek (n) sebagai sebuah kelompok, sehingga jumlah kelompok sebanyak jumlah obyeknya. Dua obyek/kelompok yang paling mirip (dalam hal ini dilihat dari jarak) adalah obyek yang pertama kali digabungkan menjadi satu kelompok, sehingga jumlah kelompok menjadi n-1. jarak kelompok baru dengan kelompok sebelumnya di hitung kembali. Prosedur ini diulang sampai akhirnya kemiripan berkurang, sehingga semua kelompok tergabung dalam suatu kelompok tunggal. Pada pengelompokan Hirarki terdapat tiga jenis metode, yaitu:
43
(1) Metode Pautan Tunggal (Single Linkage) Metode ini di lakukan dengan meminimumkan jarak antara kelompok yang di gabungkan. Jarak antar kelompok di bentuk dari individu-individu dalam dua kelompok yang mempunyai jarak terkecil atau kemiripan terbesar. Proses dimulai dengan menentukan jarak terkecil dalam D = {dih} dan gabungkan obyekobyek, misal U dan V, untuk memperoleh kelompok I atau {UV}, maka jarak antara {UV} dan kelompok W yang lain adalah: D(UV)W = min {dUW , dVW}
(21)
di mana: dUW adalah jarak terdekat dari kelompok U dan W dVW adalah jarak terdekat dari kelompok V dan W (2) Metode Pautan Lengkap (Complete Linkage) Dalam metode ini, jarak antar kelompok dibentuk dari individu-individu dalam dua kelompok yang mempunyai jarak yang paling jauh. Jadi pautan lengkap memastikan bahwa semua individu dalam suatu kelompok berada dalam jarak maksimum pada masing-masing kelompok yang lain. Pengelompokan dimulai dengan mencari jarak pada D = {dih} dan penggabungan antara U dan V untuk mendapatkan kelompok I (UV). Selanjutnya jarak antara (UV) dan setiap kelompok W dihitung dengan: D(UV)W = max {dUW , dVW} di mana: dUW adalah jarak kelompok yang paling jauh U dan W dVW adalah jarak kelompok yang paling jauh V dan W
(22)
44
(3) Metode Rataan Grup (Group Average) Metode ini dilakukan dengan meminimumkan rata-rata jarak antara semua pasangan individu dari kelompok yang digabungkan. Proses pengelompokan dimulai dengan mencari jarak D = {dih} untuk mendapatkan obyek yang terdekat. Kelompok ini dihubungkan untuk membentuk kelompok I atau (UV). Selanjutnya jarak antara (UV) dengan kelompok W lainnya ditentukan dengan: d UV W
nU nV dWU dWV nU nV nU nV
(23)
(4) Metode Sentroid (Centroid) Ukuran ketidakmiripannya adalah:
d UV W
nU nV nU nV dWU dWV d nU nV nU nV nU nV 2 UV
(24)
(5) Median Pada metode ini jarak antara dua gerombol yang terbentuk adalah:
d UV W
1 1 1 dWU dWV dUV 2 2 4
(25)
(6) Ragam Minimum (Minimum Variance) Ukuran ketidakmiripan yang digunakan ialah: d UV W
nU
nV dWU nV nW dWV nW dUV nU nV nW
di mana:
nU = banyaknya obyek dalam gerombol U nV = banyaknya obyek dalam gerombol V
nW = banyaknya obyek dalam gerombol W
(27)
45
2. Metode Non Hierarki Metode ini digunakan bila banyaknya kelompok yang akan dibentuk telah diketahui lebih dahulu. Sifat pengelompokannya tidak alamiah karena telah di kondisikan untuk jumlah kelompok tertentu. Proses pengelompokan dimulai dengan menentukan nilai k yang merupakan pusat kelompok, dengan cara random dari data. Metode non hierarki yang sering digunakan adalah metode K_Means, yaitu metode yang bertujuan mengelompokan data sedemikian hingga jarak tiaptiap data ke pusat kelompok dalam satu kelompok minimum. Analisis Cluster yang digunakan dalam penelitian ini adalah metode tidak berhierarki (K-means Clustering). Banyaknya gerombol (cluster) yang ingin dibentuk terlebih dahulu ditentukan. Didalam metode ini diasumsikan bahwa analisis terdiri dari n individu dan p pengukuran. X (i,j) adalah nilai dari individu ke-i dalam variabel ke-j; i = 1,2,…,n dan j = 1,2,…,p. Misal P (n,K) adalah pengelompokan yang merupakan hasil dari masing-masing individu yang dialokasikan ke dalam sebuah gerombol (cluster) 1,2,…,K. Rata-rata variabel ke-j dalam gerombol (cluster) ke-l akan dinotasikan dengan X (l,j), dan jumlah individu-individu yang termasuk dalam gerombol (cluster) ke-l dinyatakan dengan n(l). Dalam notasi ini kita dapat menampilkan jarak antara individu ke-i dan gerombol ke-l sebagai berikut: p
D(i, l ) ( X (i, j ) X (l , j ) )1 2 j 1
2
(28)
46
dengan komponen kesalahan tiap-tiap kelompok dapat didefinisikan sebagai berikut: n
2
EP(n, K ) Di, l (i)
(29)
i 1
di mana l(i) adalah gerombol (cluster) yang terdiri individu ke-i, dan D[i,l(i)] adalah jarak Euclidean antara individu i dan rata-rata klaster yang terdiri dari individu. Prosedur untuk
pengelompokan adalah mengikuti langkah-langkah:
mencari pengelompokan dengan komponen kesalahan E yang kecil dengan menempatkan individu-individu dari satu kelompok ke kelompok lainnya sampai tidak terjadi perpindahan hasil individu dalam pereduksian E. Dalam melakukan Analisis Cluster, sebaiknya pola nilai matriks korelasi data asal diamati terlebih dahulu. Selanjutnya dihitung persentase korelasi sedang (0,31-0,75) dan besar (0,76-1,00). Jika persentase korelasi sedang dan besar berkisar antara 10 hingga 80 persen, maka data skor faktor dapat memberikan hasil yang lebih baik daripada data asal untuk proses penggerombolan (Handayani dalam Naibaho, 2003). Kemudian dari hasil Analisis Cluster tersebut, dapat diketahui rata-rata maupun standar deviasi masing-masing indikator pada tiap kelompok. Dalam penelitian ini, indikator-indikator dari masing-masing kelompok dikategorikan menjadi lima tingkatan yaitu sangat rendah, rendah, sedang, tinggi ataupun sangat tinggi untuk mendapatkan informasi yang lebih cermat. Penentuan tingkatan kategori tersebut mengacu pada penelitian Abdullah (2008) dengan batasan pengkategorian sebagaimana terlihat pada Tabel 3.1. Untuk mempermudah penilaian, masing-masing kategori dikonversikan dalam bentuk angka.
47
Tabel 3.1 Kategori, Nilai Konversi dan Nilai Selang Skor Faktor Kategori
Nilai Konversi
Nilai Selang
(1)
(2)
(3)
Sangat Tinggi 5 Tinggi 4 Sedang 3 Rendah 2 Sangat Rendah 1 Sumber: Abdullah, 2008, diolah. di mana: j = 1,2,3…n, n = banyaknya kelompok j = rata-rata total peubah j Sj = standar deviasi peubah j SF = skor faktor
( j + 1,5Sj) < SF ( j + 0,5Sj) < SF ≤ ( j + 1,5Sj) ( j - 0,5Sj) < SF ≤ ( j + 0,5Sj) ( j - 1,5Sj) < SF ≤ ( j - 0,5Sj) SF ≤ ( j - 1,5Sj)