PENGKLASIFIKASIAN KARAKTERISTIK MAHASISWA BARU DALAM MEMILIH PROGRAM STUDI MENGGUNAKAN ANALISIS CLUSTER Maxsi Ary Program Studi Manajemen Informatika Akademik Manajemen Informatika dan Komputer BSI Bandung (AMIK ‘BSI Bandung’) Jl.Sekolah Internasional No.1-6 Antapani, Bandung
[email protected]
ABSTRACT Object Clustering is one of the object mining process which aims to partition an existing object into one or more cluster objects based on their characteristics. Private Universities is one of the alternatives for the community colleges to meet increased demand for educational needs. The number of private colleges, especially in Bandung and generally in Indonesia is quite a lot. The number of colleges and universities means used to attract prospective students to be an interesting thing to study. As a reason for the intense competition in the search for new students, no doubt there are some ways that actually do not need to be done. Issues raised, namely classify new students of characteristics in selecting a course using cluster analysis. Data obtained from the questionnaire prospective new students in February 2014 Data processing using SPSS. The results using analysis SPSS aiming easier to describe the characteristics of each group of new students in choosing courses. Key Words: Clustering, characteristics of students, courses, cluster analysis
ABSTRAK Pengelompokan Objek (object clustering) adalah salah satu proses dari objek mining yang bertujuan untuk mempartisi objek yang ada kedalam satu atau lebih cluster objek berdasarkan karakteristiknya. Perguruan tinggi swasta merupakan salah satu perguruan tinggi alternatif bagi masyarakat untuk menghadapi peningkatan permintaan terhadap kebutuhan pendidikan. Jumlah perguruan tinggi swasta khususnya di Bandung dan umumnya di Indonesia berjumlah cukup banyak. Jumlah perguruan tinggi dan cara yang digunakan perguruan tinggi untuk menarik minat calon mahasiswa menjadi hal yang menarik untuk dikaji. Sebagai alasan ketatnya persaingan dalam mencari calon mahasiswa baru, tidak dipungkiri terdapat beberapa cara yang dilakukan yang sebetulnya tidak perlu dilakukan. Persoalan yang dikemukakan yaitu mengklasifikasikan karakteristik mahasiawa baru dalam memilih program studi menggunakan analisis cluster. Data diperoleh dari hasil kuisioner calon mahasiswa baru pada bulan februari 2014. Pengolahan data menggunakan SPSS. Hasil analisis menggunakan SPSS tersebut bertujuan memudahkan untuk mendeskripsikan karakteristik masing-masing kelompok mahasiswa baru dalam memilih program studi. Kata kunci: Clustering, Karakteristik Mahasiswa, Program Studi, Analisis Cluster.
1
1
PENDAHULUAN Terdapat beberapa teknik dalam statistik untuk menganalisis data. Salah satu caranya yaitu dengan menguji hipotesis nol (H0). Tujuan dari menganalisi data ini adalah mendapatkan informasi yang berada dalam data tersebut. Informasi yang diperoleh ini digunakan untuk menyelesaikan suatu masalah. Permasalahan yang akan diselesaikan biasanya dinyatakan dalam hipotesis nol. Cara analisis data seperti ini disebut metode statistik hipotesis nol. Untuk menganalisis data, diperlukan pula identifikasi pengukuran atau aturan pengukuran yang disebut skala pengukuran. Pengukuran menurut (Ghozali, 2011) merupakan suatu proses hal mana suatu angka atau simbol diletakkan atau properti suatu stimuli sesuai dengan aturan atau prosedur yang telah ditetapkan. Misalkan orang dapat digambarkan dari beberapa karakteristik seperti usia, pendidikan, agama, jenis kelamin, pendapatan. Skala pengukuran yang sesuai dapat digunakan untuk menunjukkan karakteristir ini. Menurut (Steven, 1946) dalam buku (Ghozali, 2011) skala pengukuran dapat dikelompokkan menjadi empat yaitu, skala nominal, skala ordinal, skala interval, dan skala rasio. Perguruan tinggi swasta merupakan salah satu perguruan tinggi alternatif bagi masyarakat untuk menghadapi peningkatan permintaan terhadap kebutuhan pendidikan. Jumlah perguruan tinggi swasta khususnya di Bandung dan umumnya di Indonesia berjumlah cukup banyak. Hal ini menyebabkan persaingan dalam hal menarik minat sebagai mahasiswa semakin ketat terutama dalam memberikan pelayanan kepada mahasiswa. Untuk menghadapi persaingan ini tidak sedikit keunggulan-keunggulan perguruan tinggi swasta dikemukakan. Seperti keunggulan gelar kesarjanaan, kurikulum yang diberikan, sampai fasilitas yang dapat digunakan oleh mahasiswa (Sukandi, 2010). Berikut data jumlah perguruan tinggi swasta yang didapat dari lingkungan Kopertis Wilayah IV Jawa Barat dan banten pada bulan Februari 2014. Tabel 1. 1 Jumlah Perguruan Tinggi Lingkup Kopertis IV Per Februari 2014
Bentuk PTS Jumlah PTS Universitas 20 Institut 5 Sekolah Tinggi 54 Akademi 29 Politeknik 13 Jumlah 121 Sumber: http://direktori.kopertis4.or.id/ Jumlah perguruan tinggi dan cara yang digunakan perguruan tinggi untuk menarik minat calon mahasiswa menjadi hal yang menarik untuk dikaji. Sebagai alasan ketatnya persaingan dalam mencari calon mahasiswa baru, tidak dipungkiri terdapat beberapa cara yang dilakukan yang sebetulnya tidak perlu dilakukan. Hasil dari cara tersebut tidak berdampak pada jumlah mahasiswa. Klasifikasi perilaku calon mahasiswa baru dalam memilih kampus dalam hal ini program studi/jurusan menjadi salah satu hal yang menarik untuk diteliti. Berbeda wilayah dan kebiasaan (life style), akan memberi dampak yang besar dalam hal memenangkan persaingan memperoleh jumlah mahasiswa. Klasifikasi gaya hidup calon mahasiswa baru dapat dipergunakan untuk mengukur profil psikografik mahasiswa baru itu sendiri. Analisis cluster bertujuan untuk mengelompokkan/mengklasifikasikan objek-objek berdasarkan karakteristik diantara objek-objek tersebut, sehingga dapat diketahui ciri khas dari tiap kelompok. Banyak objek yang diklasifikasikan dengan analisis cluster, diantaranya adalah produk (barang dan jasa), benda, manusia (responden konsumen) (Sitepu, Irmeilyana, & Gultom, 2011) dalam buku (Supranto, Teknik Sampling Untuk Survei dan Eksperimen, Edisi Baru, 2000). Dalam penulisan ini, persoalan yang dikemukakan yaitu mengklasifikasi perilaku calon mahasiswa baru dalam memilih program studi/jurusan. Di dalam penelitian ini menggunakan sampel n = 31 dan variabel pertanyaan 7 buah, jadi banyaknya elemen
2
sampel cukup memadai (sampel yang dianjurkan adalah 4 x 7 = 28 atau 5 x 7 = 35 orang responden). Data diperoleh dari hasil kuisioner calon mahasiswa baru yang datang ke kampus (Universitas BSI Bandung). Tujuan calon mahasiswa baru ini datang ke kampus bisa sekedar bertanya tentang program studi yang ada di kampus atau bahkan juga membeli formulir pendaftaran. Periode pembagian kuisioner dilakukan pada bulan Februari 2014, dengan mengambil responden sebanyak 31 calon mahasiswa baru dari berbagai sekolah menengah atas/kejuruan. Pengolahan data hasil kuisioner menggunakan SPSS (Statistical Package for Social Science). Hasil analisis menggunakan SPSS tersebut dapat digunakan untuk mengklasifikasikan karakteristik perilaku mahasiswa baru dalam memilih program studi/jurusan. 2
LANDASAN TEORI
2.1 Skala Pengukuran Menurut (Steven, 1946) dalam buku (Ghozali, 2011) skala pengukuran dapat dikelompokkan menjadi empat yaitu, skala nominal, skala ordinal, skala interval, dan skala rasio. a. Skala Nominal Skala nominal merupakan skala pengukuran yang menyatakan kategori, misalkan variabel jenis kelamin, di mana responden dapat dikelompokkan ke dalam dua kategori laki-laki dan perempuan. Kedua kelompok ini diberi kode angka 1 dan 2. Kedua angka ini berfungsi untuk label kategori saja tanpa memiliki arti apa-apa. Oleh sebab itu tidaklah tepat menghitung nilai rata-rata dan standar deviasi dari variabel jenis kelamin. Jadi uji statistic yang sesuai dengan skala nominal adalah uji statistic yang mendasarkan perhitungan seperti modus dan distribusi frekuensi. b. Skala Ordinal Skala ordinal tidak hanya mengkategorikan variabel kedalam kelompok, tetapi juga melakukan peringkat terhadap kategori. Misalkan responden menyatakan peringkat terhadap merk kendaraan roda dua, angka 1 untuk merk yang paling disukai, angka 2 untuk peringkat kedua, dan seterusnya. Jadi kategori antar merk tidak menggambarkan perbedaan yang sama dari ukuran atribut. Uji statistic yang sesuai dengan skala ordinal adalah modus, median, distribusi frekuensi dan statistic non-parametrik seperti rank order correlation. Variabel yang diukur dengan skala nominal dan ordinal umumnya disebut variabel non-varametrik atau variabel non-metrik. c. Skala Interval Misalkan responden menentukan peringkat terhadap merk, kemudian diminta memberikan nilai (rate) terhadap preferensi merk sesuai dengan skala penilaian sebagai berikut: Nilai Skala Preferensi 1 Preferensi Sangat Tinggi 1 Preferensi Tinggi 1 Preferensi Moderat 1 Preferensi Rendah 1 Preferensi Sangat Rendah Jika kita berasumsi bahwa urutan kategori menggambarkan tingkat preferensi yang sama, maka kita dapat mengatakan bahwa perbedaan preferensi responden untuk dua merk motor yang mendapat peringkat 1 dan 2 adalah sama dengan perbedaan preferensi untuk dua merk lainnya yang memiliki rating 4 dan 5. Namun demikian, kita tidak dapat menyatakan bahwa preferensi responden terhadap merk yang mendapat rating 5 nilainya lima kali preferensi untuk merk yang mendapat rating 1. Uji statistic yang sesuai untuk jenis pengukuran skala ini adalah semua uji statistic, kecuali yang mendasarkan pada rasio seperti koefisien variasi. d. Skala Rasio Skala rasio adalah skala interval dan memiliki nilai dasar (based value) yang tidak dapat dirubah. Misalkan usia memiliki nilai dasar 0 tahun. Skala rasio dapat
3
ditransformasikan dengan cara mengalikan dengan konstanta, tetapi transformasi tidak dapat dilakukan jika dengan cara menambah konstanta. Variabel yang diukur dengan skala interval dan rasio disebut variabel metrik. 2.2 Metode Analisis Data Misalkan kita anggap memiliki data yang berisi n observasi dengan p variabel. p variabel ini dapat dibagi menjadi dua kelompok atau subset. Uji statistik untuk menganalisis set data seperti ini disebut motode dependen (dependence method). Metode dependen menguji ada tidaknya hubungan dua set variabel. jika peneliti atas dasar teori yang ada menyatakan bahwa satu variabel dari subset adalah variabel bebas (independence variable) dan variabel lainnya dari subset adalah variabel terikat (dependence variable) maka tujuan dari metode dependen adalah menentukan apakah variabel bebas mempengaruhi variabel terikat secara individual dan atau bersamaan. Sebaliknya jika set data yang ada tidak mungkin untuk mengelompokkan kedalam variabel bebas dan variabel terikat, maka tujuan dari jenis set data seperti ini adalah mengidentifikasi bagaimana dan mengapa variabel tersebut saling berkaitan satu sama lainnya. Metode statistic yang sesuai untuk menganalisis data set seperti ini disebut metode interdependen (interdependence method). 2.2.1 Metode Dependen Metode dependen dapat dikelompokkan lagi menjadi: 1. Jumlah variavel bebas – satu atau lebih dari satu variabel bebas 2. Jumlah variabel terikat – satu atau lebih dari satu variabel terikat 3. Jenis skala pengukuran variabel bebas – metrik dan non-metrik 4. Jenis skala pengukuran variabel terikat – metric dan non-metrik Satu Variabel terikat (metrik) dan satu variabel bebas (non-metrik) Metode statistika untuk satu variabel terikat dan satu variabel bebas sering disebut metode univariat (univariate method). Apabila variabel bebas merupakan ukuran non-metrik dengan kategori lebih dari dua dan variabel terikat dengan pengukuran metric, misalkan apakah ada perbedaan gaji dilihat dari tempat tinggal yang dibagi menjadi empat kategori. Alat uji untuk kasus ini adalah Analysis of Variance (ANOVA). Dua atau lebih Variabel terikat (metrik) dan dua atau lebih variabel bebas (nonmetrik) Metode statistika untuk menguji lebih dari satu variabel terikat dan lebih dari satu variabel bebas adalah Multivariate Analysis of Variance (MANOVA). Contoh kasus yang dapat diberikan diantaranya: a) seperti apakah rata-rata gaji kepala keluarga dan total income anggota keluarga berbeda secara nyata untuk tiap region, b) seperti apakah rata-rata gaji kepala keluarga dan total income anggota keluarga berbeda secara nyata untuk tiap region dan ras, c) seperti apakah rata-rata gaji kepala keluarga berbeda nyata untuk tiap region dan ras. Satu variabel terikat (metrik) dan satu atau lebih variabel bebas (metrik) Metode statistic untuk menguji hubungan antara satu variabel terikat dan satu atau lebih variabel bebas adalah regresi. Regresi sederhana (simple regression) untuk menguji pengaruh satu variabel bebas terhadap satu variabel terikat, sedangkan untuk lebih dari satu variabel bebas disebut regresi berganda (multiple regression). Satu variabel terikat (metrik) dan lebih dari satu variabel bebas (metrik) Misalkan variabel terikat adalah intensitas membeli produk yang diukur dengan skala nominal. Responden diminta untuk menjawab apakah akan membeli produk (1) atau tidak akan membeli produk (0). Variabel bebasnya adalah usia, pendapatan, dan pendidikan, semuanya diukur dengan ukuran interval atau rasio, maka kita sekarang mempunyai set data dimana variabel terikatnya adalah kategori / nominal dan variabel bebasnya adalah metric / kontinyu. Persoalan uji statistic pada model seperti ini adalah menentukan apakah kedua grup yaitu pembeli dan bukan pembeli produk secara signifikan berbeda dikaitkan dengan variabel bebas. Metode statistic untuk menjawab
4
persoalan ini dilakukan dengan analisis diskriminan (discriminant analysis). Asumsi yang mendasari adalah data harus berdistribusi normal dan jumlah sample untuk kategori variabel terikat yaitu pembeli dan bukan pembeli harus sebanding 50% pembeli dan 50% bukan pembeli. Apabila variabel bebasnya kombinasi antara metric dan nominal (non-metrik), maka asumsi normalitas multivariate tidak akan dapat dipenuhi. Penyimpangan dari asumsi normalitas multivariate mempengaruhi signifikanis uji statistic dan tingkat ketepatan klasifikasi. Jika hal ini terjadi, maka digunakan uji statistik logistic regression. Logistik regression tidak mensyaratkan jumlah sample untuk kategori variabel terikat. 2.2.2 Metode Interdependen Dalam bahasan metode analisis data, ada kemungkinan tidak akan mengelompokkan set data yang ada ke dalam variabel terikat maupun variabel bebas. Pada situasi seperti ini tujuan utama dari analisis data adalah memahami atau mengidentifikasi mengapa dan bagaimana variabel-variabel tersebut saling berkorelasi. Variabel Metrik Variabel metrik diukur dengan skala interval dan skala rasio. Jika jumlah variabel dua buah dalam variabel metrik, maka alat uji yang digunakan adalah korelasi sederhana. Apabila lebih dari dua variabel alat uji yang digunakan adalah principle components dan analisis faktor. Principle Components adalah teknik yang cocok digunakan untuk mencoba mereduksi jumlah besar variabel menjadi indek komposit yang sedikit. Analisis faktor adalah teknik untuk mengidentifikasi kelompok atau cluster suatu variabel dimana korelasi variabel dalam setiap cluster lebih tinggi daripada korelasi variabel cluster lainnya. 2.3 Analisis Multivariat Analisis multivariat merupakan analisis yang meneliti masalah yang bersifat multidimensional dan menggunakan tiga atau lebih variabel. Analisis multivariate dibagi menjadi dua kategori utama, yaitu: 1. Dependence Method Analisis ketergantungan digunakan apabila tujuan dari analisis adalah menjelaskan dua atau lebih variabel bebas. Metode ini terdiri dari: • Analisis Regresi Berganda • Analisis Diskriminan Berganda • Analisis Multivariat Varians • Analisis Korelasi Kanonikal 2. Interdependence Method Metode yang digunakan untuk menjelaskan seperangkat variabel atau pengelompokkan berdasarkan variabel-variabel tertentu. Metode ini dikelompokkan menjadi: • Analisis Factor • Analisis Cluster • Skala Multidimensional 2.4 Analisis Cluster Analisis cluster menurut (Sitepu, Irmeilyana, & Gultom, 2011) dalam buku (Supranto, Teknik Sampling Untuk Survei dan Eksperimen, Edisi Baru, 2000) adalah analisis untuk mengelompokkan elemen yang mirip sebagai objek penelitian untuk menjadi kelompok (cluster) yang berbeda dan mutually exlusive. Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen, sehingga tujuannya tidak menghubungkan ataupun membedakan dengan sampel/variabel lain. Analasis cluster berguna untuk meringkas data dengan jalan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu diantara objek-objek yang akan diteliti. Analisis cluster terbagi menjadi dua metode, yaitu: 1. Metode Hirarki 2. Metode non-Hirarki
5
Analisis cluster adalah suatu alat untuk mengelompokkan sejumlah n objek berdasarkan p variabel yang secara relative mempunyai kesamaan karakteristik diantara objek-objekteretntu, sehingga keragaman dalam suatu kelompok tersebut lebih kecil dibandingkan dengan keragaman antar kelompok. Objeknya dapat berupa barang, jasa, hewan, manusia (responden, konsumen, dan lain-lain). Objek tersebut akan diklasifikasikan dalam satu atau lebih cluster, sehingga objek-objek yang berada dalam satu cluster akan mempunyai kemiripan karakter. Jika terdapat n objek dan p variabel, maka observasi xij dengan i = 1, 2, , n dan j = 1, 2, , p dan dapat digambarkan sebagai tabel 2.1 berikut: Gambar 2. 1 Tabel Data Observasi Var 1 Objek 1 Objek 2 . . Objek . . Objek
i
n
Var 2
x11 x21
x12 x22
. .
. .
xi1
xi 2
. .
. .
xn1
xn 2
. . . . . . .
Var
i x1 j
x2 j . .
xij
xij
. . . . . . .
Var
p x1 p
x2 p . .
xip
. .
. .
xnj
xnp
Ciri-ciri cluster yang baik adalah mempunyai: 1. Homogen yang tinggi antar anggota dalam satu cluster (within-cluster). 2. Heterogen yang tinggi antar cluster yang satu dengan cluster yang lain (betweencluster). 2.5 Analisis Cluster Metode Hirarki Pada metode hirarki dimulai dengan mengelompokkan dua atau lebih objek yang mempunyai kesamaan yang paling dekat. Kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua. Demikian seterusnya sampai cluster akan membentuk hirarki yang jelas antar objek dari yang paling mirip sampai yang paling tidak mirip. Dendogram biasanya digunakan untuk membantu memperjelas proses hirarki tersebut. Dalam metode hirarki terdapat dua tipe dasar yaitu agglomerative (pemusatan) dan divisive (penyebaran). Metode Agglomerative, setiap objek dianggap sebagai sebuah cluster tersendiri. Dalam tahap selanjutnya, dua cluster yang mempunyai kemiripan digabungkan menjadi sebuah cluster baru demikian seterusnya. Sebaliknya, dalam metode divisive beranjak dari sebuah cluster besar yang tersendiri dari semua objek. Selanjutnya, objek yang paling tinggi nilai ketidakmiripan dipisahkan demikian seterusnya. 2.6 Analisis Cluster Metode non-Hirarki Pada metode non-hirarki digunakan jarak Euclidian, untuk menetapkan nilai kedekatan antara objek. Bakal cluster pertama adalah observasi pertama dalam set data. Bakal kedua adalah observasi lengkap berikutnya yang dipisahkan dari bakal pertama oleh jarak minimum khusus. Apabila ditentukan terlebih dulu jumlah cluster yang diinginkan (missal dua cluster, tiga cluster, dan seterusnya), setelah itu proses cluster dilakukan tanpa mengikuti proses hirarki, cara tersebut dikenal dengan metode K-Means Cluster. 2.7 Tujuan Analisis Cluster Setelah mengelompokkan n buah objek pengamatan kedalam m kelompok berdasarkan p variabel dapat diketahui bahwa tujuan dari clustering objek adalah untuk
6
memperoleh kelompok objek yang memiliki nilai relatif sama. Sehingga nantinya dalam interpretasi, objek-objek yang berada pada satu cluster memiliki peluang yang cukup tinggi akan muncul bersamaan pada satu individu. 3
METODE PENELITIAN
Pada bagian ini akan membahas aspek metodologi penelitian yang diterapkan dalam penelitian. Penulis akan memberikan gambaran rinci tentang metodologi penelitian. Ini mencakup jenis penelitian dan metode pengumpulan data. 3.1 Jenis Penelitian Persoalan yang dikemukakan yaitu mengklasifikasi karakteristik mahasiswa baru dalam menentukan program studi. Analisis Cluster bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik diantara objek-objek itu, sehingga dapat diketahui ciri khas dari tiap kelompok. 3.2 Metode Pengumpulan Data Untuk mendukung penelitian dilakukan pengumpulan data sebagai berikut: 1. Sumber Data a. Data Primer Hasil kuisioner calon mahasiswa baru yang sekedar bertanya atau mendaftar ke kampus Universitas BSI Bandung. b. Data Sekunder Data Sekunder merupakan data yang diperoleh secara tidak langsung, misalnya dari dokumentasi, literatur buku, jurnal, dan informasi lainnya yang ada hubungannya dengan masalah yang diteliti. 2. Sampel Penelitian Sampel dari penelitian ini adalah calon mahasiswa baru yang sekedar bertanya atau mendaftar ke kampus Universitas BSI Bandung. Pemberian kuisioner dilakukan pada tanggal 6-15 Februari 2014. Jumlah responden berdasarkan kuisioner yang penulis buat berjumlah 31 responden. 4
HASIL PENGUKURAN DAN PEMBAHASAN
Pada proses pengukuran ini dilakukan menggunakan analisis cluster dan analisis data menggunakan SPSS Inc 17.0. Berikut dilampirkan 7 pernyataan mengenai karakteristik mahasiswa baru dalam menentukan program studi. Data mengenai pernyataan perilaku diperoleh pada suatu skala 7 butir (1=sangat tidak setuju dan 7=sangat setuju): X1
:
X2
:
X3
:
X4
:
X5 X6 X7
: : :
Saya lebih senang datang langsung ke kampus untuk memperoleh informasi jurusan/program studi daripada melalui media/perantara lain. Saya selalu mengecek biaya pendaftaran dan biaya lainnya, walaupun anggaran untuk kuliah relatif ada/kecil. Iklan di Koran lebih jelas/ menarik daripada brosur. Saya orang yang senang jika teman-teman satu jurusan/program studi banyak. Saya berencana selain kuliah, bekerja/magang di instansi/kantor. Saya berencana selain kuliah, melakukan bisnis kecil-kecilan/berwirausaha. Saya memilih kampus ini karena terkenal di Bandung dan biaya terjangkau.
Data yang diperoleh dari sampel calon mahasiswa baru yang diuji sebanyak 31 orang sebagai responden. Waktu pelaksanaan pada bulan Februari 2014, bertepatan dengan jadwal penerimaan mahasiswa baru gelombang I (s.d. 1 April 2014). Langkah-langkah pengujian statistik adalah sebagai berikut: a. Melakukan Standardisasi untuk mengantisipasi variabilitas satuan. b. Melakukan analisis cluster dengan Hirarki c. Melakukan analisis cluster dengan non-Hirarki
7
4.1 Standardisasi Variabilitas Satuan Langkah pertama untuk diperhatikan untuk mengklasifikasikan menggunakan analisis cluster adalah standardisasi. Proses ini diperlukan apabila terdapat variabilitas satuan. Berikut adalah tabel (Tabel 1) hasil standardisasi untuk menyimpan sebagai nilai Z Score atau nilai variabel yang telah distandardisasi. Tabel 1 Statistika Deskriptif Analisis Cluster Descriptive Statistics N
Minimum
Maximum
Mean
Std. Deviation
x1
31
1
7
5.29
2.116
x2
31
1
7
4.97
1.581
x3
31
1
7
2.94
1.711
x4
31
1
7
5.29
1.936
x5
31
2
7
5.52
1.749
x6
31
2
7
5.39
1.764
x7
31
2
7
5.26
1.612
Valid N (listwise)
31
4.2 Analisis Cluster Metode Hirarki Berikut adalah hasil pengolahan data dengan SPSS. Tabel 2 Proximities Jarak Euclidean a
Case Processing Summary Cases Valid N
Missing Percent
31
96.9%
N
Total
Percent 1
N
Percent
3.1%
32
100.0%
a. Squared Euclidean Distance used
Tabel 2 menunjukkan bahwa semua data berjumlah 31 objek telah diproses dengan data hilang berjumlah 1 objek. Tabel 3 Cluster Membership Cluster Membership Case
4 Clusters
3 Clusters
2 Clusters
1:IQBAL SHOLAHUDIN
1
1
1
2:AGUS
2
2
2
3:RIMA DEWI A
1
1
1
8
4:HAMZAH AL ARIF
1
1
1
5:SANJAYA TAKDIRULLOH
1
1
1
6:AZI AKHBAR
1
1
1
7:CHANDRA ANDY H
1
1
1
8:INDRAWATI
1
1
1
9:TRIO
1
1
1
10:DEVI
1
1
1
11:CATUR MARTIAN F
2
2
2
12:SYARIF
1
1
1
13:MUTIA
2
2
2
14:ALI AKBAR
1
1
1
15:CARIPAN
1
1
1
16:FANI
2
2
2
17:YUDI
2
2
2
18:IRWAN
1
1
1
19:AYU
1
1
1
20:RINI ROMDIANI
1
1
1
21:GILANG RAMADHAN
1
1
1
22:AJILHAM
1
1
1
23:ICHA
1
1
1
24:RIRIS R
1
1
1
25:ANI SOLIHAT
3
3
1
26:ADE M
1
1
1
27:RIZKI TRI PRASETIO
4
1
1
28:SAHIDILLAH NURDIN
1
1
1
29:TONI ARIFIN
1
1
1
30:SOPA MARTINA
1
1
1
31:DWI
1
1
1
Proses Aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak objek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan semua objek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk. Perincian jumlah cluster dengan anggotanya yang terbentuk dapat dilihat pada tabel 3. Hasil pengolahan data pada tabel 3 terlihat bahwa objek terbagi menjadi 2 cluster, 3 cluster, dan 4 cluster. Apabila menggunakan 2 cluster, maka akan menjadi anggota cluster pertama terlihat pada kolom cluster 2 dengan simbol 1. Sedangkan cluster kedua terlihat pada kolom cluster 2 dengan simbol 2.
9
4.3 Analisis Cluster Metode non-Hirarki Berikut hasil pengolahan data dengan SPSS. Tabel 4 Iteration History a
Iteration History
Change in Cluster Centers Iteration
1
2
1
1.926
1.327
2
.000
.000
a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is .000. The current iteration is 2. The minimum distance between initial centers is 7.114.
Pada tabel 4 diketahui bahwa proses iterasi dilakukan sebanyak 2 kali. Proses tersebut dilakukan untuk mendapatkan cluster yang baik. Jarak minimum antar pusat cluster yang terjadi dari hasil iterasi adalah 7.114. Tabel 5 Final Cluster Final Cluster Centers Cluster 1
2
Zscore(x1)
.27861
-1.16087
Zscore(x2)
.24814
-1.03391
Zscore(x3)
-.19602
.81677
Zscore(x4)
.32533
-1.35553
Zscore(x5)
.29957
-1.24822
Zscore(x6)
.32477
-1.35320
Zscore(x7)
.36105
-1.50438
Hasil akhir dari proses clustering diperoleh pada tabel 5. Hasil output tabel 5 dapat dilihat bahwa data masih terkait dengan proses standardisasi yang mengacu pada Z-Score dengan ketentuan sebagai berikut: • Nilai Negatif (-) artinya data berada di bawah rata-rata total • Nilai Positif (+) artinya data berada di atas rata-rata total Dari tabel 5 Final Centers diperoleh hasil sebagai berikut: Cluster 1 Dalam cluster 1 berisi variabel 3 memiliki nilai rendah, sedangkan variabel lainnya tinggi. Cluster 2 Dalam cluster 2 berisi variabel 3 memiliki nilai tinggi, sedangkan variabel lainnya rendah.
10
Tahapan selanjutnya adalah melihat perbedaan variabel pada cluster yang terbentuk. Dapat dilihat pada tabel ANOVA (lihat lampiran) nilai F dan nilai probabilitas (sig) masingmasing variabel. Variabel 7 (Zscore (x7)) memilifi nilai F = 37.009 dan sig 0.000. Menurut ketentuan besarnya nilai F semakin besar dan (sig < 0.05), maka semakin besar perbedaan variabel pada cluster yang terbentuk. Hasil tabel ANOVA menunjukkan variabel 7 adalah variabel yang paling menunjukkan adanya perbedaan diantara cluster lainnya. Jumlah anggota masing-masing cluster yang terbentuk adalah sebagai berikut (tabel 6). Tabel 6 Number Each Cluster Number of Cases in each Cluster Cluster
1
25.000
2
6.000
Valid Missing
31.000 1.000
Jumlah cluster 1 memiliki anggota 25 responden, dan cluster 2 memiliki 6 responden. Sedangkan responden yang dianggap hilang berjumlah 1 responden.
5
KESIMPULAN Dari hasil pengolahan data menggunakan SPSS Hasil analisis cluster diperoleh kesimpulan sebagai berikut: • Metode Hirarki dapat dikelompokkan menjadi dua, tiga, atau empat klasifikasi. Penulis mengambil dua cluster melihat nilai yang dihasilkan. Jumlah anggota cluster 1 berjumlah 26 responden, dan cluster 2 berjumlah 5 responden • Metode non-Hirarki dikelompokkan menjadi dua kelompok, yaitu Cluster 1 berisi variabel 3 memiliki nilai rendah, sedangkan variabel lainnya tinggi. Cluster 2 variabel 3 memiliki nilai tinggi, sedangkan variabel lainnya rendah. Jumlah anggota cluster 1 25 responden, dan cluster 2 berjumlah 6 responden 6
SARAN Variabel yang digunakan pada penelitian ini menggunakan 7 variabel dan dirasa perlu untuk ditambahkan kembali dengan variabel lainnya yang mendukung dalam pengelolaan kampus. Harapannya dapat memetakan hasil klasifikasi mahasiswa baru dalam menentukan program studi. Dari sisi jumlah responden penelitian ini menggunakan 31 responden mahasiswa baru, untuk penelitian selanjutnya dapat ditambah jumlah respondennya. Penelitian ini merupakan kelanjutan dari penelitian sebelumnya mengenai identifikasi perilaku mahasiswa baru dalam menentukan program studi menggunakan analisis factor. Untuk mengambil kesimpulan secara utuh mengenai identifikasi variabel dan klasifikasi objek, maka perlu diperhatikan lebih seksama mengenai hal tersebut. (Ary, 2014) 7
DAFTAR PUSTAKA
Ary, Maxsi. (2014). Identifikasi Perilaku Calon Mahasiswa Baru dalam Memilih Program Studi Menggunakan Analisis Faktor. Paradigma Jurnal Komputer dan Informatika Akademi Bina Sarana Informatika, 35-45. Damanhuri, D. S. (n.d.). Dunia Esai. Retrieved September 12, 2012, from Kumpulan esai berbahasa Indonesia:
11
http://www.duniaesai.com/index.php?option=com_content&view=article&id=108:s dm-indonesia-dalam-persaingan-global&catid=37:ekonomi&Itemid=93 Ghozali, I. (2011). Aplikasi Analisis Multivariate dengan Program IBM SPSS 19. Semarang: Badan Penerbit Universitas Diponegoro. Gujarati, D. (2003). Basic Econometrics. New York: Mc-Grawhill. Hadianto, B., & Wijaya, M. V. (Desember 2010). Prediksi Kebijakan Utang, Profitabilitas, likuiditas, Ukuran, dan Status Perusahaan Terhadap Kemungkinan Penentuan Peringkat Obligasi: Studi Empirik pada Perusahaan yang Menerbitkan Obligasi di Bursa Efek Indonesia. Jurnal Manajemen Teori dan Terapan, Tahun 3, No.3. Sitepu, R., Irmeilyana, & Gultom, B. (2011). Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan. Jurnal Penelitian Sains, 11-17. Steven, S. (1946). On The Theory of Scales of Measurement. Science, 103. Sukandi, P. (2010). Hubungan Antara Fasilitas Kampus Terhadap Kepuasan Mahasiswa dalam Menghadapi Daya Saing Jasa Pendidikan (Studi Kasus: Mahasiswa Fakultas Bisnis dan Manajemen Universitas Widyatama). The 4th PPM National Confrence on Management Research. Jakarta. Supranto, J. (2000). Teknik Sampling Untuk Survei dan Eksperimen, Edisi Baru. Jakarta: PT. Rineka Cipta. Supranto, J. (2010). Analisis Multivariat : Arti & Interpretasi. Jakarta: Rineka Cipta. Tabachnick, B. (1996). Using Multivariate Statistics. New York: Harper Collin.
12