Bab II Teori Dasar
BAB II TEORI DASAR
II.1.
Analisis Kelompok
Istilah analisis kelompok pertama kali diperkenalkan oleh Tryon (1939). Ia memperkenalkan beberapa metode untuk mengelompokkan obyek yang memiliki kesamaan karakteristik (statsoft, 2004). Kesamaan karakteristik ini dinyatakan dengan ukuran keseragaman ataupun ukuran beda antara dua kelompok, dimana semakin kecil ukuran keseragaman akan menunjukkan semakin beda karakteristik kelompok tersebut. Analisis kelompok adalah suatu proses mempartisi himpunan obyek menjadi beberapa kelompok. Obyek-obyek (guru) yang berada dalam satu kelompok memiliki sifat yang mirip (Zaiane, O.R.,1999). Kemiripan pada tulisan ini disebut ukuran keseragaman atau ukuran beda, bergantung pada penelitian dan metode yang digunakan. Analisis kelompok merupakan salah satu cara memahami data, dua atau lebih guru yang mirip akan memberikan informasi maksimal, jika guru tersebut dalam satu kelompok (Statsoft, 2004). Tujuan utama analisis ini adalah melakukan pengelompokkan berdasarkan kategori tertentu sehingga guru-guru tersebut memiliki variasi dalam kelompok lebih kecil dibandingkan dengan variasi antar kelompok. Jadi diharapkan guru-guru dalam satu kelompok bersifat homogen. Dalam tulisan ini obyek yang dikelompokkan adalah guru. Sedangkan variabel yang mewakilinya adalah vektor nilai uji kompetensi bidangnya, berukuran tiga. Tiga variabel inilah yang menjadi dasar perhitungan matematik. Dua guru berbeda jika nilai kompetensi guru tersebut semakin berbeda. Karena akan semakin kecil tingkat keseragaman guru tersebut.
6
Bab II Teori Dasar
Analisis kelompok yang umum digunakan adalah bentuk hierarchical dan partitional clustering (Agus. Z.A.,-). Tehnik hierarchical memberikan bentuk urutan partisi berupa nested dan noniterative (Agus. Z.A.-) yang hasil akhirnya berupa pohon (tree) yang disebut dendogram. Algoritma dari tehnik hierarchical ini dapat dibagi menjadi dua kategori, yaitu agglomeratif dan divisive (Steinbach, Karypis, dan Kumar, 2000). Algoritma agglomeratif dimulai dari kelompok-kelompok beranggota tunggal. Kemudian
digabungkan
sehingga
akhirnya
diperoleh
satu
kelompok
yang
beranggotakan seluruh obyek pengamatan (guru). Sedangkan algoritma divisive dimulai dengan satu kelompok beranggotakan seluruh guru. Kemudian dipisah sehingga akhirnya menjadi kelompok-kelompok beranggota tunggal. Dari kedua tehnik hierarchical ini, yang umum digunakan adalah algoritma agglomeratif dan salah satu metodenya adalah metode Ward. Metode Ward ini adalah metode yang paling sering digunakan (H. C. Romesburg, 1984). Adapun tehnik partitional, berusaha mempartisi obyek secara iterasi.
Gambar 2 - 1 Dendogram Sedangkan pada tehnik partitional, yang umum digunakan adalah algoritma k-rataan. Algoritma ini berdasarkan pada kriteria galat kuadrat sebagai ukuran beda di dalam mengelompokkan, selain itu algoritma ini menuntut peneliti untuk memiliki pengetahuan tentang obyek penelitiannya.
7
Bab II Teori Dasar
II.2.
Algoritma Agglomeratif
Ukuran keseragaman ataupun ukuran beda antara dua obyek adalah dasar dalam analisis kelompok.
Selain
itu
pemilihan
algoritma
juga dapat mempengaruhi hasil
pengelompokkan. Pada tulisan ini digunakan Agglomeratif Ward. Dalam metode ini nilai galat kuadrat digunakan dalam menentukan beda antara dua guru. Dapat dikatakan metode ini mencari nilai minimum dari jumlah galat kuadrat (sum squares of error) saat akan menggabungkan dua guru ke dalam kelompok yang sama (statsoft, 2004). Dengan menggunakan metode ini diharapkan diperoleh kelompok-kelompok guru yang memiliki jumlah galat kuadrat didalam kelompok paling kecil. Sama dengan algoritma hierarchical lainnya, metode ini mensyaratkan datanya memiliki satuan ukuran yang sama (Lebart, Morineau, dan Warwick, 1984). Kelebihan metode Ward adalah penggabungan kelompok didasarkan pada kenaikkan jumlah galat kuadrat yang paling kecil (Macfarlane, P.A., 1996). Metode ini memiliki kecendrungan untuk membagi data ke dalam kelompok yang memiliki ukuran yang sama (www.let.rug,2006). Tetapi Metode ini tidak terlalu baik dalam mempartisi, begitu juga untuk data yang memiliki skala yang berbeda (Macfarlane, P.A., 1996). Metode Ward berguna sebagai analisis awal dalam memahami data (www.let.rug,2006). Definisi (Macfarlane, P.A., 1996) Misalkan x ik adalah vektor nilai variabel dari obyek ke i pada kelompok ke k dimana i = 1,2,..., nk dan rata-rata xk . Maka jumlah galat kuadrat (sum squares of error) untuk kelompok ke k adalah: nk
Ek = ∑ xik − xk . i =1
8
Bab II Teori Dasar
Definisi (Macfarlane, P.A., 1996): Misalkan Ek adalah jumlah galat kuadrat seperti yang telah didefenisikan diatas dan misalkan g adalah banyaknya kelompok. Maka jumlah galat kuadrat didalam kelompok (within group sum squares of error) adalah: g
E = ∑ Ek k =1
Di dalam studi kasus pada penelitian ini, xik adalah vektor nilai guru yang mengikuti uji kompetensi dengan tiga kompetensi sebagai variabelnya dan i menyatakan indeks dari guru tersebut. Algoritma Agglomeratif Ward (Macfarlane, P.A., 1996): i)
Dimulai dengan memandang setiap guru sebagai satu kelompok yang beranggotakan satu anggota. Pada tahap ini jumlah galat kuadrat di dalam kelompok (within cluster sum squares of error) adalah nol.
ii)
Menghitung semua kemungkinan jumlah norm antara dua guru atau kelompok (jumlah galat kuadrat).
iii)
Menggabungkan dua kelompok berdasarkan jumlah galat kuadrat yang paling kecil.
iv)
Menghitung jumlah galat kuadrat dalam kelompok.
v)
Kembali ke langkah dua jika belum terbentuk kelompok yang beranggotakan seluruh guru.
vi)
Jika seluruh guru telah berada di dalam satu kelompok, maka gambarkan setiap langkah yang menggabungkan dua kelompok dalam suatu dendogram.
Ambil contoh lima orang siswa. Siswa A memiliki tinggi badan 155cm, siswa B 157cm, siswa C 167cm, siswa D 167cm, dan siswa E 159cm. Lima siswa ini dikelompokkan berdasarkan tinggi badan.
9
Bab II Teori Dasar
Pada langkah awal dihitung semua kemungkinan perbedaan tinggi kelima siswa melalui jumlah galat kuadrat antara dua siswa. 2
E (AB) = ∑ xi − x i =1
E (AB) = (155 − 156) 2 + (157 − 156) 2 = 2 E (AC) = (155 − 161) 2 + (167 − 161)2 = 72 E (AD) = (155 − 160) 2 + (165 − 160)2 = 50 E (AE) = (155 − 157) 2 + (159 − 157) 2 = 8 E (BC) = (157 − 162) 2 + (167 − 162) 2 = 50 E (BD) = (157 − 161)2 + (165 − 161) 2 = 32 E (BE) = (157 − 158) 2 + (159 − 158) 2 = 2 E (CD) = (167 − 166) 2 + (165 − 166) 2 = 2 E (CE) = (167 − 163) 2 + (159 − 163) 2 = 18 E (DE) = (165 − 162) 2 + (159 − 162) 2 = 18
Atau dapat ditulis: A A
0
B
2
B
C
D
E
0
C 72 50
0
D 50 32
2
E
18 18 0
8
2
0
Dari jumlah galat kuadrat ini diperoleh kenaikan yang paling kecil adalah dua. Menggabungkan dua siswa yang memiliki jumlah galat kuadrat dua. Pada langkah ini terbentuk dua kelompok siswa, dengan jumlah galat kuadrat enam. Kelompok pertama A, B, dan E, sedangkan kelompok kedua C dan D. 3
E1 = ∑ xi − x i =1
E1 = (155 − 157)2 + (157 − 157) 2 + (159 − 157) 2 = 4 2
E2 = ∑ xi − x i =1
E2 = (167 − 166) 2 + (165 − 166) 2 = 2 E = E1 + E2 = 4 + 2 = 6
10
Bab II Teori Dasar
Karena pada tahapan ini seluruh siswa belum berada dalam satu kelompok, maka langkah selanjutnya adalah menggabungkan dua kelompok yang telah terbentuk. Jumlah galat kuadrat dalam kelompoknya adalah: 5
E = ∑ xi − x i =1
E = (155 − 160, 6) 2 + (157 − 160, 6) 2 + (167 − 160, 6) 2 + (165 − 160, 6) 2 + (159 − 160, 6)2 E = 107, 2 Pada tahapan ini seluruh siswa telah berada dalam satu kelompok, tahapan pengelompokkan dapat ditulis dalam sebuah dendogram.
Gambar 2 - 2 Dendogram siswa berdasarkan tinggi badan.
II.3.
Tipelogi Kelompok
Misalkan xihk adalah nilai obyek ke i variabel ke h pada kelompok ke k dimana
i = 1,2,..., nk , maka rata-rata kelompok ke k pada variabel ke h adalah: nk
xhk = ∑ i =1
xihk . nk
Tipelogi kelompok pada tulisan ini dinyatakan dengan rata-rata kelompok pada setiap kompetensinya sebagai variabel, yaitu pengelolaan pembelajaran ( h = 1), wawasan pendidikan ( h = 2), dan kajian akademik ( h = 3).
11
Bab II Teori Dasar
II.4.
Validitas Kelompok (cluster validity)
Setelah kelompok-kelompok terbentuk, timbul pertanyaan apakah kelompok-kelompok yang terbentuk tersebut valid atau tidak. Ada dua tipe untuk mengukur validitas kelompok, yaitu ukuran eksternal dan ukuran internal (Steinbach, Karypis, dan Kumar, 2000).
a.
Ukuran Eksternal
Ukuran ini berdasarkan pada informasi kelas data yang diketahui peneliti. Digunakan untuk mengukur sejauh mana kecocokan kelompok yang telah terbentuk dengan informasi kelas data. Informasi yang digunakan untuk menentukan kelas data adalah tingkatan diklat yang diikuti guru yaitu tingkat dasar/D (nilai < 40), tingkat lanjutan/C (40 ≤ nilai < 60), tingkat menengah/B (60 ≤ nilai < 80), dan tingkat tinggi (nilai ≥ 80). Sedangkan pada kasus nilai total berbobot uji kompetensi guru digunakan status sekolah tempat guru mengajar (negeri atau swasta) sebagai informasi kelas data. Salah satu ukuran kualitas eksternal adalah entropy (Steinbach, Karypis, dan Kumar, 2000). Langkah pertama dalam perhitungan entropy adalah menghitung kelas distribusi untuk masing-masing kelompok. Kemudian hitung pik , peluang bahwa kelompok ke k memuat anggota kelas ke i , dengan pik = nik nk dimana nik adalah banyak anggota kelas i yang berada dikelompok ke k dan nk adalah banyaknya anggota kelompok ke k .
Nilai entropy untuk setiap kelompok adalah:
Ek = −∑ pik log( pik ) . i
Jumlah total entropynya adalah: nk ∗ Ek , n k =1 g
E=∑
dimana g menunjukkan banyaknya kelompok, dan n adalah banyaknya obyek pengamatan.
12
Bab II Teori Dasar
Selain entropy, F-hitung juga merupakan salah satu ukuran eksternal yang dapat digunakan (Steinbach, Karypis, dan Kumar, 2000). Ukuran ini mengkombinasikan ide
precision dan recall dalam menentukan nilai F. Untuk setiap kelompok ke k dan kelas ke i , maka: Recall(i, k ) = nik / ni , Precision(i, k ) = nik / nk .
F-hitung untuk kelompok ke k dan kelas ke i adalah F (i, k ) = (2* Recall(i, k ) * Precision(i, k )) /(Precision(i, k ) + Recall(i, k )).
Dan jumlah total F-hitung adalah
F =∑ i
ni max { F (i, k )} , n
dimana nilai maksimum diperoleh dari semua kelompok pada semua tingkatan.
b.
Ukuran Internal
Ukuran ini digunakan untuk mengukur struktur kelompok yang terbentuk tanpa pertimbangan informasi dari luar (Steinbach, Karypis, dan Kumar, 2000). Cluster
cohesion dan cluster separation adalah dua ukuran internal yang dapat digunakan dalam menentukan validitas kelompok (Steinbach, Karypis, dan Kumar, 2004).
Cluster cohesion mengukur seberapa dekat obyek-obyek yang berada dalam satu kelompok. Dalam kasus pada tulisan ini adalah seberapa dekat nilai hasil uji kompetensi guru yang berada dikelompok yang sama. Ukuran ini diukur dengan menggunakan jumlah galat kuadrat didalam kelompok,
WSS = ∑ ∑ (x − xk ) 2 , k x∈Ck
dimana x adalah vektor nilai guru dan xk adalah vektor rata-rata nilai guru kelompok ke k (rata-rata hasil uji kompetensi guru untuk setiap kompetensi pada kelompok ke k ).
13
Bab II Teori Dasar
Cluster separation digunakan untuk mengukur seberapa berbeda kelompok-kelompok yang terbentuk. Dengan kata lain seberapa berbeda kelompok guru yang satu dengan kelompok guru lainnya. Ukuran ini diukur berdasarkan jumlah kuadrat kesalahan antar kelompok (between cluster sum squares of error), BSS = ∑ Ck ( x − xk ) , 2
k
dimana Ck adalah ukuran kelompok ke k , dan x adalah rata-rata obyek pengamatan (rata-rata hasil uji kompetensi guru untuk setiap kompetensinya).
14