EVALUASI KETEPATAN KLASIFIKASI KELULUSAN TES KETERAMPILAN SNMPTN BIDANG OLAHRAGA MENGGUNAKAN ANALISIS DISKRIMINAN KERNEL 1
1
Yosiana Fitria. W, 2 Bambang Widjanarko Otok Mahasiswa Program Sarjana, Jurusan Statistika FMIPA-ITS 2 Dosen Pembimbing Jurusan Statistika FMIPA-ITS
ABSTRAK Seleksi Nasional Mahasiswa Perguruan Tinggi Negeri (SNMPTN) merupakan satu-satunya pola seleksi yang dilaksanakan secara bersama oleh seluruh perguruan tinggi negeri dalam satu sistem yang terpadu dengan menggunakan soal yang sama atau setara dan diselenggarakan secara serentak. Terdapat dua jenis ujian dalam SNMPTN yaitu tes tertulis dan tes keterampilan. Tes keterampilan untuk ilmu olahraga memiliki prosentase bobot penilaian sebesar 50% karena pada kenyataannya sebagian besar mata kuliah yang terdapat di program studi ilmu keolahragaan merupakan praktek di lapangan. Metode pengklasifikasian diharapkan dapat membantu dalam menentukan kelulusan tes keterampilan bidang olahraga berdasarkan hasil tes yang telah dilaksanakan calon mahasiswa baru. Metode yang sering digunakan adalah diskriminan linier, namun karena metode ini terikat beberapa asumsi yang ketat maka digunakan metode diskriminan kernel. Oleh karena itu, tujuan dari makalah ini adalah menerapkan dan membandingkan kedua metode klasifikasi tersebut. Berdasarkan analisa yang telah dilakukan, dapat diketahui bahwa metode diskriminan kernel lebih baik daripada metode diskriminan linier pada kasus klasifikasi kelulusan calon mahasiswa baru dalam tes keterampilan SNMPTN bidang olahraga. Kata Kunci: Tes keterampilan, SNMPTN, diskriminan linier, diskriminan kernel.
1. Pendahuluan Seleksi Nasional Mahasiswa Perguruan Tinggi Negeri (SNMPTN) merupakan satu-satunya pola seleksi yang dilaksanakan secara bersama oleh seluruh perguruan tinggi negeri dalam satu sistem yang terpadu dengan menggunakan soal yang sama atau setara dan diselenggarakan secara serentak. SNMPTN bertujuan memperluas akses masyarakat di seluruh Indonesia untuk dapat masuk ke perguruan tinggi negeri. Terdapat dua jenis ujian dalam SNMPTN yaitu ujian tertulis dan ujian keterampilan. Ujian tertulis wajib dilakukan oleh seluruh peserta ujian SNMPTN untuk seluruh program studi yang dipilih, sedangkan ujian keterampilan hanya wajib dilakukan oleh peserta ujian yang memilih program studi keolahragaan dan/atau program studi kesenian. Peserta ujian yang mengikuti ujian keterampilan juga wajib mengikuti ujian tertulis sebelumnya. Tes keterampilan SNMPTN bidang olahraga memiliki prosentase bobot 50% dalam penilaian penerimaan calon mahasiswa baru (wikipedia). Tes keterampilan memiliki bobot yang sama dengan tes tertulis karena pada kenyataannya sebagian besar mata kuliah yang terdapat di program studi ilmu keolahragaan merupakan praktek di lapangan yang
1
meliputi berbagai macam cabang olahraga, sehingga dibutuhkan mahasiswa yang terampil dalam hal olahraga serta berbadan bugar dan sehat. Tes keterampilan terdiri dari dua jenis tes yaitu tes wawancara dan tes fisik. Tes wawancara sendiri digunakan untuk mengetahui riwayat kesehatan calon mahasiswa termasuk jenis kecacatan yang dimiliki calon mahasiswa. Sedangkan tes fisik digunakan untuk mengetahui kemampuan fisik yang nantinya sangat berperan dalam menjalani proses perkuliahan di program studi keolahragaan, khususnya dalam hal ini adalah jurusan Pendidikan Kesehatan dan Rekreasi (Penkesrek) UNESA. Dengan adanya tes keterampilan untuk calon mahasiswa ini maka diharapkan mahasiswa yang terpilih merupakan mahasiswa yang tepat sasaran karena prestasi mahasiswa selama menjalani masa perkuliahan akan berdampak pada kualitas lulusan jurusan Penkesrek UNESA. Metode pengklasifikasian diharapkan dapat membantu dalam menentukan kelulusan tes keterampilan bidang olahraga berdasarkan hasil tes yang telah dilaksanakan calon mahasiswa baru. Penelitian sebelumnya yang mengkaji masalah SNMPTN atau Seleksi Penerimaan Mahasiswa Baru (SPMB) telah dilakukan oleh Mayasari (2011) yang melakukan pemodelan regresi hasil tes
berdasarkan variabel pembeda yang nantinya digunakan untuk menghitung variabel baru yang dapat menggambarkan perbedaan antar grup dan untuk mengelompokkan pengamatan ke salah satu grup yang ada. Tahapan-tahapan analisis diskriminan adalah melakukan uji asumsi multivariat normal dan kehomogenan matriks varian kovarian, mengevaluasi signifikansi variabel pembeda, mengestimasi fungsi diskriminan, mengevaluasi signifikansi fungsi diskriminan, memilih metode pengelompokan, dan mengevaluasi fungsi diskriminan. Proses pembentukan fungsi diskriminan adalah sebagai berikut. Misalkan
kesehatan dan tes fisik bidang olahraga dengan pendekatan Multivariate Adaptive Regression Spline (MARS). Kemudian Asari (2010) mengkaji tentang perbaikan prosedur penerimaan mahasiswa baru di Universitas Sebelas Maret dengan metode Business Process Improvement (BPI). Pada umumnya metode yang sering digunakan untuk masalah klasifikasi pada penelitianpenelitian sebelumnya adalah metode Diskriminan Linier yang dikembangkan oleh R. A. Fisher (1936). Metode diskriminan linier merupakan salah satu teknik multivariate yang berfokus pada pemisahan obyek (pengamatan) dimana memerlukan asumsi variabel prediktor harus berdistribusi normal multivariat dan matrik varians-kovarians harus sama. Tetapi pada penerapannya, metode diskriminan linier sering melibatkan variabel-variabel yang tidak mengikuti pola distribusi normal, sehingga diperoleh hasil klasifikasi diskriminan linier yang tidak optimal (Dillon dan Goldstein, 1984). Untuk mengatasi hal tersebut maka dapat didekati dengan metode nonparametrik. Salah satu metode nonparametrik yang sering digunakan dalam hal klasifikasi adalah analisis diskriminan kernel yang menggunakan pendekatan fungsi kernel sehingga memungkinkan analisis diskriminan bekerja secara efisien dalam dimensi yang lebih tinggi (Mika et al., 1999). Beberapa penelitian sebelumnya dengan menggunakan analisis diskriminan kernel antara lain dilakukan oleh Rachmawati (2002) yang meneliti klasifikasi ketrampilan permainan tenis lapangan dengan pendekatan metode diskriminan, kernel, dan artificial neural network Berdasarkan uraian di atas, maka dilakukan penelitian mengenai evaluasi ketepatan klasifikasi calon mahasiswa baru bidang olahraga berdasarkan hasil tes keterampilan SNMPTN dengan analisis diskriminan linier dan diskriminan kernel. Kemudian dipilih metode diskriminan yang paling sesuai dan mempunyai ketepatan klasifikasi paling besar. 2. Tinjauan Pustaka 2.1 Analisis Diskriminan Linier
λˆ1 , λˆ2 ,..., λˆs > 0 merupakan non zero eigen
values dengan s ≤ min (g-1, p) dari W-1B dan eˆ 1 , eˆ 2 ,...eˆ s merupakan eigenvector sehingga
eˆ T S pooled eˆ = 1 . Koefisien vektor
aˆ
untuk
memaksimumkan rasio dihitung dengan rumus : g T ˆ (x i − x )(x i − x )T aˆ a ∑ T aˆ Baˆ i =1 = T n g i aˆ Waˆ T aˆ T ∑ ∑ (x ij − x i )(x ij − x i ) aˆ i =1 j=1
(1) Dengan aˆ 1 = eˆ 1 . Kombinasi linear aˆ 1 x disebut fungsi diskriminan pertama dan aˆ 2 = eˆ 2 merupakan fungsi diskriminan kedua, aˆ 2 x, dan seterusnya hingga aˆ k = eˆ k yang menghasilkan fungsi diskriminan ke-k, aˆ k x (k ≤ s) (Johnson dan Wichern, 2007). 2.2 Analisis Diskriminan Kernel Dalam klasifikasi dimana data tidak bisa dipisahkan secara linier, salah satu pendekatan yang dapat dipakai adalah dengan menggunakan metode kernel. Dalam hal ini, data dari input space dipetakan ke ruang baru yang disebut dengan kernel space. Dalam metoda kernel, suatu data x di input space dipetakan ke kernel space F dengan dimensi yang lebih tinggi. Pemakaian fungsi kernel memungkinkan analisis diskriminan linier bekerja secara efisien dalam suatu kernel space berdimensi tinggi yang linier. Dengan pendekatan kernel ini, Fisher Discriminant Analysis bisa dikembangkan menjadi kernel discriminant analysis (KFD) (Mika et al., 1999). Dalam pendugaan fungsi kepadatan peluang metode kernel menggunakan Kernel Uniform, Normal, Epanechnikov, Biweight, Atau Triweight. Namun fungsi kernel yang sering digunakan adalah kernel normal (Seber, 1984). Notasi berikut
Menurut Hair et al., (2006), Analisis Diskriminan merupakan salah satu metode dalam Analisis Multivariate yang bertujuan menghubungkan satu variabel respon yang bersifat kategori dengan satu atau lebih variabel prediktor yang bersifat kuantitatif dengan cara membentuk fungsi diskriminan. Tujuan analisis diskriminan antara lain untuk melakukan identifikasi variabelvariabel yang paling membedakan antar grup, untuk membangun persamaaan atau fungsi
2
•
digunakan untuk menjelaskan metode pengklasifikasian: x vektor berdimensi p berisi variabel kuantitatif dari suatu pengamatan g sebuah subskrip untuk membedakan grup ng jumlah pengamatan dalam grup pg probabilitas prior dari grup g f g (x) pendugaan fungsi kepadatan peluang berasal dari grup g berdasarkan x Jarak kuadrat antara dua pengamatan antara dua vektor x dan y dalam grup g diberikan sebagai berikut :
d g2 (x, y ) = (x − y ) Vg−1 (x − y ) T
Epanechnikov Kernel 1 c1 (g )1 − 2 z T Vg−1 z jika z T Vg−1 z ≤ h 2 K g (z ) = h 0 lainnya 1 p dimana c1 (t ) = 1 + υ h (t ) 2 • Biweight Kernel 2 1 T −1 c 2 ( g )1 − z V z jika z T Vg−1 z ≤ h 2 g 2 K g (z ) = h 0 lainnya
•
dimana V g mempunyai salah satu bentuk di bawah ini : Vg = Sg matrik kovarian dalam grup g V g = S pooled matrik kovarian gabungan Pengklasifikasian dari sebuah vektor pengamatan x didasarkan pada estimasi kepadatan dari grup. Metode kernel menggunakan bandwith h dan fungsi kernel K g untuk mengestimasi kepadatan kelompok g pada setiap vektor pengamatan x. Apabila z merupakan vektor pdimensi pada kernel space, maka volume dari pdimensi yang memenuhi zTz=1 adalah (Ansys, 2004)
υ0 =
π
3 1 T −1 T −1 2 c3 (g )1 − z V z jika z Vg z ≤ h g 2 K g (z ) = h 0 lainnya
p dimana c3 (g ) = 1 + c 2 (g ) 6 Pengklasifikasian dari pengamatan vektor x berdasarkan fungsi kepadatan peluang suatu grup T sebagai tertentu dimana X i = X i1 , X i2 , , X ip
(
(3)
(
}
1 2
υ h ( g ) = h Vg υ 0 p
(4)
c0 (g ) = (2π ) h p Vg
)
diklasifikasikan ke π 1 , demikian pula sebaliknya. Dimana p 1 dan p 2 merupakan probabilitas prior dari grup 1 dan grup 2 yang diperoleh dari :
1 1 exp − 2 z T Vg−1 z dimana c0 (g ) 2h p 2
)
Jika p (π 1 | x ) > p (π 2 | x ) maka pengamatan x
Normal Kernel (mean nol, varian h2V t )
K g (z ) =
∑ (
probabilitas posterior terbesar (Johnson dan Wichern, 2007). p1 f1 (x ) (6) p(π 1 | x ) = p1 f1 (x ) + p 2 f 2 (x ) p 2 f 2 (x ) p(π 2 | x ) = 1 − p(π 1 | x ) = p1 f1 (x ) + p 2 f 2 (x )
Metode kernel menggunakan salah satu fungsi kepadatan kernel berikut pada grup g • Uniform Kernel 1 jika z T Vg-1 z ≤ h 2 K g (z ) = υ h (g ) 0 lainnya •
n
1 g (5) K g x − X gi n g i =1 Berdasarkan pendugaan fungsi kepadatan peluang ini, maka probabilitas posterior dari grup x dapat dihitung. Penghitungan probabilitas posterior p π g | x menggunakan aturan Bayes berdasarkan f g (x ) =
dimana Γ merupakan fungsi gamma jadi, volume p-dimensi dari grup g yang memenuhi z | z T Vg−1 z = r 2 adalah
{
)
berikut (Jones and Wand, 1995).
p 2
p Γ + 1 2
p dimana c 2 (g ) = 1 + c1 (g ) 4 Triweight Kernel
(2)
p1 = n1
1 2
n1 + n2
dan p 2 =
n2
n1 + n2
Pada diskriminan kernel, hal yang perlu diperhatikan adalah bagaimana menentukan nilai bandwith h terbaik. Nilai h yang kecil mengakibatkan estimasi kepadatan yang dihasilkan tidak mulus, dan nilai h yang besar membuat estimasi kepadatan semakin mulus. Salah satu cara
3
n max : jumlah sampel terbesar pada salah satu kelompok N : jumlah sampel secara keseluruhan Tahap pengujian selanjutnya yaitu menguji tingkat kestabilan pengelompokan dengan mengujikan pada validation sample, dimana hal ini bertujuan untuk mengkaji apakah pengalokasian dari tiap sampel dalam kelompok relatif stabil atau tidak sebagai akibat adanya perubahan perbedaan jumlah sampel yang diteliti. Dengan menghitung nilai Press’s Q yang diformulasikan sebagai berikut (Hair et al., 2006):
untuk menentukan bandwith h yang tepat adalah dengan cara meminimalkan Approximate Mean Integrated Square Error (AMISE) dari estimasi kepadatan (Rosenblatt, 1956).
( (x )) dy +
2 1 g h ∫ g 2 K ( g )dg ∫ f x 4 g 1 2 K ( g ) dg ∫ nh g
AMISE =
2
''
AMISE merupakan pengembangan dari Mean Integrated Square Error (MISE)
{(
)
}
(
)
2 MISE = ∫ E fˆh ( x ) − f ( x ) dx + ∫ Var fˆh (x ) dx x
x
2 { N − (n × k )} press ' s Q = N (k − 1)
yang merupakan integral dari kuadrat bias dan integral varians. Nilai optimal h yang dihasilkan tergantung pada fungsi kepadatan dan kernel. Pemilihan bandwith h dilakukan dengan mengoptimalkan kriteria dengan mengasumsikan bahwa grup g berdistribusi normal dengan matrik varian kovarian V g . Sehingga nilai bandwith h optimal yang dihasilkan pada grup g yaitu (Ansys, 2004):
(10)
Keterangan : N : Total sampel n : jumlah pengamatan yang tepat diklasifikasikan k : jumlah dari grup (kelompok)
3. Metode penelitian Sumber data yang digunakan dalam penelitian (7) ini adalah data sekunder yang diambil dari Tesis Mayasari (2011) Universitas Airlangga. Data berasal dari prodi S1-Penjaskesrek FIK UNESA dimana konstanta optimal A(K g ) tergantung pada dan merupakan data calon mahasiswa baru tahun kernel K g . Konstanta A(K g ) dapat diperoleh dari: 2010 yang mengikuti SNMPTN. Jumlah 2 p +1 ( p + 2 )Γ( p 2 ) keseluruhan calon mahasiswa baru prodi S1A Kg = p Penjaskesrek yang mengikuti tes keterampilan SNMPTN tahun 2010 sebanyak 593 orang, namun Dengan Kernel Uniform dikarenakan adanya data yang tidak lengkap maka 4 A Kg = data yang digunakan dalam analisis hanya 2 p +1 berjumlah 471 data. Dengan Kernel Normal Variabel yang digunakan dalam penelitian ini adalah : 2 p +1 p 2 ( p + 2 )( p + 4 )Γ( p 2 ) A Kg = 1. Variabel respon (Y) adalah kelulusan calon 2 p +1 mahasiswa baru berdasarkan tes keterampilan Dengan Kernel Epanechnikov SNMPTN 2010 jurusan Penjaskesrek UNESA yang dikategorikan menjadi : 2.1.3 Uji Kestabilan dan Keakuratan Pengelompokan 1 : Lulus Untuk menentukan apakah pengelompokan 2 : Tidak Lulus yang dihasilkan mempunyai tingkat akurasi yang 2. Variabel prediktor (X) adalah jenis tes tinggi, maka digunakan Change Model (C pro ) yang keterampilan SNMPTN 2010 jurusan diformulasikan sebagai berikut (Hair et al., 2006) :
A(K g ) n g
1 p+4
( ) ( )
( )
Penjaskesrek UNESA. Pada penelitian ini terdapat dua jenis tes keterampilan yang tidak digunakan sebagai variabel prediktor yaitu tes wawancara riwayat kecatatan karena hasil tes memiliki skala nominal, serta tes pull up karena kriteria tes dibedakan antara calon mahasiswa putra dan putri. Variabel prediktor terdiri dari :
Proportional Change Criterion C pro = p2 + q2
(8)
Maximum Change Criterion C max = (n max / N) x 100%
(9)
Keterangan : p : proporsi jumlah sampel di kelompok 1 q : proporsi jumlah sampel di kelompok 2
4
(18)
a. Tinggi badan (X 1 ) b. Berat Badan (X 2 ) c. Tes Lari 50/60 meter (X 3 ) d. Tes Sit Up (X 4 ) e. Tes Vertical Jump (X 5 ) f. Tes Lari 1000/1200 meter (X 6 ) Langkah-langkah untuk melakukan analisis data dalam penelitian ini yaitu : 1. Analisis deskriptif data calon mahasiswa baru berdasarkan tes keterampilan SNMPTN 2010. 2. Membagi data menjadi data training dan data testing 3. Melakukan analisis diskriminan linier pada data training dengan langkah sebagai berikut : a. Melakukan pengujian asumsi normal multivariat dan matrik varian kovarian sama b. Melakukan uji perbedaan vektor rata-rata kelompok c. Menyusun fungsi diskriminan linier d. Menentukan ketepatan klasifikasi data training 4. Melakukan analisis diskriminan linier pada data testing dengan langkah sebagai berikut : a. Menghitung skor diskriminan data testing berdasarkan fungsi diskriminan yang telah terbentuk b. Menentukan nilai cutting score c. Melakukan pengelompokan data testing berdasarkan cutting score d. Menentukan ketepatan klasifikasi data testing 5. Melakukan analisis diskriminan kernel pada data training dan data testing masing-masing untuk analisis diskriminan kernel dengan asumsi matrik varian kovarian sama dan asumsi matrik varian kovarian tidak sama dengan langkah sebagai berikut. a. Menentukan fungsi kepadatan kernel b. Memasukkan nilai smoothing parameter atau bandwith h c. Pengklasifikasian dengan nilai bandwith berbeda-beda d. Menentukan ketepatan klasifikasi dan memilih bandwith optimal 6. Membandingkan ketepatan klasifikasi kedua metode untuk menentukan metode yang paling sesuai berdasarkan hit ratio, kriteria C pro dan C max , serta nilai Press’s Q.
4.1 Statistika Deskriptif Analisis deskriptif diperlukan untuk mengetahui karakteristik awal calon mahasiswa baru yang mengikuti tes SNMPTN. Data calon mahasiswa baru berjumlah 593 data, namun 122 data diantaranya merupakan data yang tidak lengkap (missing) sehingga jumlah data akhir yang dianalisis sebanyak 471 calon mahasiswa karena data missing tidak diikutsertakan dalam analisis. Tabel 1. Nilai mean dan standar deviasi data calon mahasiswa baru Lulus
Tidak lulus St Mean Dev
Variabel
Mean
St Dev
Tinggi Badan (cm)
162,85
7,24
166,04
6,36
Berat Badan (kg) Lari 50/60 m (detik)
55,61
9,29
58,86
54,24
8,35
1,12
9,66
1,27
Sit Up (kali/menit)
40,65
7,76
34,36
10,02
Vertical Jump (cm) Lari 1000/1200 m (detik)
61,88
11,66
53,19
13,16
288,58
44,22
366,97
47,73
Tabel 1 menunjukkan bahwa variabel tinggi badan, berat badan, lari 50/60 meter, dan lari 1000/1200 m pada kelompok tidak lulus mempunyai nilai rata-rata yang lebih tinggi daripada kelompok lulus, sedangkan variabel sit up dan vertical jump pada kelompok tidak lulus memiliki rata-rata yang lebih kecil. Ini berarti calon mahasiswa baru cenderung dinyatakan lulus tes apabila dapat menempuh lari 50/60 m atau lari 100/1200 m dengan waktu yang lebih singkat, mampu melakukan sit up dengan hasil yang lebih banyak dalam 1 menit, serta mampu melakukan vertical jump lebih tinggi dibandingkan mahasiswa yang tidak lulus tes keterampilan. 4.2 Metode Diskriminan Linier Sebelum dilakukan analisis, terlebih dahulu dilakukan pengujian asumsi. Berdasarkan pengujian asumsi yang dilakukan diketahui bahwa data berdistribusi normal multivariat, namun tidak memenuhi asumsi matrik varian kovarian sama. Setelah dilakukan pengujian asumsi, maka tahap selanjutnya adalah melakukan pengujian perbedaan vektor rata-rata antar kelompok menggunakan uji Wilks Lambda. Berdasarkan pengujian Wilk Lambda dihasilkan nilai p-value sebesar 0,000 sehingga dengan tingkat kepercayaan α = 5% dapat disimpulkan tolak H 0 karena p-value < α yang berarti rata-rata pengelompokan kategori “Lulus” dan “Tidak Lulus” memang nyata berbeda (signifikan). Oleh karena itu, fungsi diskriminan
4. Hasil dan Pembahasan Pada penelitian ini digunakan 377 pengamatan sebagai data training dan 94 pengamatan sebagai data testing.
5
mahasiswa yang sebenarnya lulus tes keterampilan namun menurut fungsi diskriminan linier diprediksi tidak lulus tes. Serta terdapat 45 calon mahasiswa yang sebenarnya tidak lolos tes namun menurut fungsi diskriminan linier diprediksi lulus tes keterampilan. Hasil ketepatan klasifikasi data testing berdasarkan model diskriminan linier yang telah terbentuk ditunjukkan pada Tabel 4.
perlu dibentuk untuk mengetahui hubungan antar kelompok serta untuk mengelompokkan suatu pengamatan baru ke dalam salah satu obyek. Dalam membentuk fungsi diskriminan digunakan metode simultan dengan memasukkan seluruh variabel prediktor yang ada. Berdasarkan pengujian parsial signifikansi variabel prediktor dengan menggunakan taraf signifikansi 5% diperoleh bahwa dari 6 (enam) variabel prediktor yang digunakan, hanya terdapat satu variabel yang tidak signifikan karena p-value < α yaitu variabel berat badan. Sehingga variabel-variabel yang dianggap berperan dalam membedakan suatu calon mahasiswa dinyatakan lulus atau tidak lulus dalam tes keterampilan SNMPTN 2010 berdasarkan fungsi diskriminan linier adalah variabel tinggi badan, tes lari 50/60 m, tes sit up, tes vertical jump, dan tes lari 1000 m. Bentuk persamaan dari fungsi diskriminan linier dengan memasukkan seluruh variabel prediktor adalah sebagai berikut.
Tabel 3 Hasil klasifikasi data testing berdasarkan model diskriminan linier pada data tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA Kelompok awal
Apabila nilai skor diskriminan semakin besar akan mengakibatkan klasifikasi masuk kelompok tidak lulus sedangkan apabila nilai skor diskriminan semakin kecil maka akan diklasifikasikan lulus. Jadi penambahan tinggi badan, berat badan, waktu tempuh tes lari 50/60 meter, dan waktu tempuh tes lari 1000/1200 meter serta pengurangan banyaknya hasil tes sit up dan vertical jump sebanyak nilai koefisien masingmasing variabelnya mengakibatkan skor diskriminan semakin bertambah sehingga akan cenderung diklasifikasikan tidak lulus, dan begitu pula sebaliknya. Selanjutnya hasil ketepatan klasifikasi menggunakan analisis diskriminan linier pada data tes keterampilan SNMPTN 2010 jurusan Penjasrek UNESA adalah sebesar 87,8% dengan rincian jumlah kesalahan klasifikasi ditunjukkan pada Tabel 2.
Jumlah
Lulus
31
1
32
Tidak lulus
45
300
345
Jumlah
76
301
377
Lulus
8
0
8
Tidak lulus
33
53
86
Jumlah
41
53
94
2 { N − (n × k )} press ' s Q = N (k − 1) 2 { 94 − (61 × 2 )} press ' s Q = 94(2 − 1)
Tabel 2 Hasil klasifikasi fungsi diskriminan linier data training tes keterampilan Kelompok menurut fungsi diskriminan Lulus Tidak lulus
Jumlah
Dari 94 data testing yang dianalisis, tidak terdapat calon mahasiswa lulus yang salah diklasifikasikan tidak lulus tes. Namun terdapat 33 calon mahasiswa yang sebenarnya tidak lulus tes namun menurut fungsi diskriminan linier diprediksi lulus tes. Kesalahan klasifikasi keseluruhan dari data testing dapat dihitung menggunakan nilai APER dengan perhitungan sebagai berikut (Johnson dan Wichern, 2007). 0 + 33 APER = = 0,36 atau terdapat kesalahan 8 + 86 klasifikasi pada data testing sebesar 0,36 sehingga ketepatan klasifikasi data testing berdasarkan fingsi diskriminan linier sebesar 1-0,36=0,64 atau sebesar 64%. Nilai ketepatan klasifikasi data testing yang rendah dimungkinkan karena model diskriminan yang terbentuk berdasarkan data training tidak memenuhi asumsi matrik varian kovarian sama. Selanjutnya dilakukan pengujian tingkat kestabilan dari fungsi yang dihasilkan dengan cara menghitung nilai Press’s Q sebagai berikut (Hair et al., 2006) :
Z = -30,499 + 0,142 X 1 + 0,00026 X 2 + 0,296 X 3 + -0,026 X 4 - 0,009 X 5 + 0,016 X 6
Kelompok awal
Kelompok menurut fungsi diskriminan Lulus Tidak lulus
= 8,34
Nilai Press’s Q sebesar 8,34 tersebut lebih 2 besar dari nilai chi-square χ (1;0,5 ) yang nilainya 3,841 sehingga pengklasifikasian dengan diskriminan linier tersebut mempunyai kestabilan dalam membedakan dan memprediksi kelulusan tes
Tabel 2 menunjukkan bahwa dari 377 data training yang dianalisis, terdapat 1 calon
6
keterampilan calon mahasiswa baru serta mampu memprediksi untuk sampel yang berbeda atau dapat dikatakan konsisten.
a.
Metode Diskriminan Kernel dengan Bandwith Sama di Tiap Kelompok Hasil ketepatan pengklasifikasian dengan metode diskriminan kernel untuk nilai bandwith yang sama tiap kelompoknya pada data hasil tes keterampilan SNMPTN 2010 jurusan Penjasrek UNESA disajikan pada Gambar 1.
4.3 Metode Diskriminan Kernel Metode kernel merupakan salah satu metode nonparametrik yang tidak memerlukan asumsiasumsi tertentu sehingga dapat digunakan untuk berbagai bentuk distribusi data (Seber, 1984). Hal tersebut sesuai dengan kasus data hasil tes keterampilan SNMPTN 2010 jurusan Penjasrek UNESA dimana data tidak memenuhi asumsi matrik varian kovarian sama yang merupakan persyaratan diskriminan linier. Pada analisis diskriminan kernel ini digunakan fungsi kernel normal. Sedangkan dalam pemilihan bandwith, akan dipilih berdasarkan penghitungan bandwith optimal dimana konstanta optimal A(K t ) tergantung pada Kernel (K t ). Dengan menggunakan kernel normal ditentukan nilai A(K t ) dengan perhitungan sebagai berikut (Ansys, 2004):
A(K t ) = =
95,5
Hit Ratio (%)
94,69
0,1
0,7
0,8
0,9
Hit Ratio (%)
4 2p +1
94,69 94,69 93,63
94
91,50 91,50
92
90
89,38
88
87,25
86 0,0
4 = 0,3077 2.6 + 1
0,1
0,2
0,3
0,4 0,5 Bandwith
0,6
0,7
0,8
0,9
(b) Gambar 1 Hasil ketepatan klasifikasi model diskriminan kernel asumsi bandwith sama untuk beberapa nilai bandwith pada (a) data training (b) data testing
Gambar 1 menunjukkan bahwa prosentase ketepatan klasifikasi tertinggi adalah analisis diskriminan kernel yang menggunakan nilai bandwith sebesar 0,4 dengan hasil ketepatan klasifikasi data training sebesar 95,23% dan hasil ketepatan klasifikasi data testing sebesar 96,82%. Baik untuk data training maupun data testing, analisis diskriminan kernel memberikan tingkat ketepatan klasifikasi yang cukup tinggi. Setelah diketahui bahwa hasil klasifikasi terbaik menggunakan bandwith sebesar 0,4, maka berikut ini ditunjukkan rincian hasil klasifikasi data training menggunakan bandwith 0,4 pada Tabel 4. Tabel 4 Hasil klasifikasi metode diskriminan kernel data training tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA (bandwith tiap kelompok sama)
ig
Kelompok awal
32
∑ K (x − X ) ∑
0,6
96,82 94,69
i =1
1 345
0,4 0,5 Bandwith
96
∑ K (x − X ) . 1
0,3
(a)
ng
i =1 345
0,2
98
Dimana p merupakan dimensi data yaitu 6 dan n t merupakan banyaknya data training yaitu sebanyak 377. Selain penentuan bandwith optimal menggunakan persamaan di atas, dilakukan pula analisis diskriminan kernel dengan menggunakan nilai bandwith antara 0,1 hingga 0,9. Dari beberapa nilai bandwith tersebut, akan dipilih bandwith yang memberikan nilai akurasi ketepatan klasifikasi paling tinggi. Fungsi kepadatan kernel yang digunakan dalam klasifikasi diskriminan kernel adalah sebagai berikut.
f 2 (x ) =
93,40
92,69
= 0,491
1 f1 (x ) = 32
94,34 94,34
94,0
0,0
1 (6+ 4 ) h = 0,3077 377
g
94,58
94,43
93,5
1 A(K t ) ( p + 4 ) h = nt
1 ng
94,43
94,5
93,0
Sehingga didapatkan:
f g (x ) =
95,23
95,0
i1
K 2 (x − X i 2 )
i =1
7
Kelompok menurut fungsi diskriminan Lulus Tidak lulus
Jumlah
Lulus
20
12
32
Tidak lulus
6
339
345
Jumlah
26
351
377
Tabel 4 menunjukkan bahwa dari 377 data training yang dianalisis menggunakan diskriminan kernel dengan bandwith tiap kelompok sama, terdapat 12 calon mahasiswa yang sebenarnya lulus tes keterampilan namun diprediksi tidak lulus tes. Serta terdapat 6 calon mahasiswa yang sebenarnya tidak lolos tes diprediksi lulus tes keterampilan. Selanjutnya diidentifikasi hasil klasifikasi data testing dengan bandwith 0,4 untuk bandwith tiap kelompok sama dengan rincian ketepatan klasifikasi ditunjukkan pada Tabel 5.
95,00
94,96 94,96
Hit Ratio (%)
94,58
Kelompok awal
5
3
8
Tidak lulus
0
86
86
Jumlah
5
89
94
=
{94 − (91 × 2)}2 94(2 − 1)
93,63
93,63
0,1
0,2
0,3
0,4 0,5 Bandwith
0,6
0,7
0,8
0,9
(a) 96
95,76
95
95,76 95,76
95,76
94
Hit Ratio (%)
93 92 91 90
89,38
89 88
87,25
87,25 87,25 87,25
87,25
87 0,0
0,1
0,2
0,3
0,4 0,5 Bandwith
0,6
0,7
0,8
0,9
(b) Gambar 2 Hasil ketepatan klasifikasi model diskriminan kernel asumsi bandwith berbeda untuk beberapa nilai bandwith pada (a) data training (b) data testing
Gambar 2 menunjukkan bahwa prosentase ketepatan klasifikasi tertinggi adalah analisis diskriminan kernel yang menggunakan nilai bandwith sebesar 0,3 dan 0,4. Kedua nilai bandwith tersebut menghasilkan prosentase ketepatan klasifikasi yang sama persis untuk data training maupun data testing dengan hasil ketepatan klasifikasi data training sebesar 94,96% dan hasil ketepatan klasifikasi data testing sebesar 95,76%. Dalam pemilihan bandwith optimal diupayakan bandwith yang mempunyai nilai lebih kecil apabila nilainya akurasinya sama, sehingga untuk analisis diskriminan kernel dengan bandwith tiap kelompok berbeda pada kasus ini digunakan bandwith optimal sebesar 0,3. Setelah diketahui bahwa hasil klasifikasi terbaik menggunakan bandwith sebesar 0,3, maka berikut ini ditunjukkan rincian hasil klasifikasi data training pada Tabel 6.
= 82,38
Nilai Press’s Q sebesar 82,38 tersebut lebih besar dari nilai chi-square χ 12 yang nilainya 3,841 sehingga pengklasifikasian dengan diskriminan kernel untuk bandwith tiap kelompok sama tersebut mempunyai kestabilan dalam membedakan dan memprediksi kelulusan tes keterampilan calon mahasiswa baru serta mampu memprediksi untuk sampel yang berbeda atau dapat dikatakan konsisten. b.
94,10 93,90
0,0
Tabel 5 menunjukkan bahwa dari 94 data testing yang dianalisis menggunakan diskriminan kernel dengan bandwith tiap kelompok sama, terdapat 3 calon mahasiswa yang sebenarnya lulus tes keterampilan namun diprediksi tidak lulus tes. Namun tidak terdapat calon mahasiswa tidak lulus tes yang salah diprediksi lulus tes keterampilan. Selanjutnya dilakukan pengujian tingkat kestabilan dengan menghitung nilai Press’s Q sebagai berikut : press 's Q
94,25 94,00
93,75
Jumlah
Lulus
94,58
94,50
93,50
Tabel 5 Hasil klasifikasi metode diskriminan kernel data testing tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA (Bandwith tiap kelompok sama) Kelompok menurut fungsi diskriminan Lulus Tidak lulus
94,81
94,81
94,75
Tabel 6. Hasil klasifikasi metode diskriminan kernel data training tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA (bandwith berbeda)
Metode Diskriminan Kernel dengan Bandwith Tiap Kelompok Berbeda
Kelompok awal
Hasil ketepatan pengklasifikasian dengan metode diskriminan kernel untuk bandwith tiap kelompok berbeda pada data hasil tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA disajikan pada Gambar 2.
8
Kelompok menurut fungsi diskriminan Lulus Tidak lulus
Jumlah
Lulus
18
14
32
Tidak lulus
5
340
345
Jumlah
23
354
377
(C pro ) yang diformulasikan sebagai berikut (Hair et al,, 2006):
Tabel 6 menunjukkan bahwa dari 377 data training yang dianalisis menggunakan diskriminan kernel dengan bandwith tiap kelompok berbeda, terdapat 14 calon mahasiswa yang sebenarnya lulus tes keterampilan namun diprediksi tidak lulus tes. Serta terdapat 5 calon mahasiswa yang sebenarnya tidak lulus tes namun diprediksi lulus tes keterampilan. Selanjutnya diidentifikasi pula hasil klasifikasi data testing dengan bandwith 0,3 untuk bandwith tiap kelompok berbeda dengan rincian ketepatan klasifikasi ditunjukkan pada Tabel 7.
Kelompok Lulus : p = 8/94 = 0,085 Kelompok Tidak Lulus : q = 86/94 = 0,915 Proportional Chance Criterion (C pro ) data testing C pro = p2 + q2 C pro = (0,085)2 + (0,915)2 = 0,845 Maximum Chance Criterion (C max ) data testing C max = (86/94)x 100% = 91,49% Dari hasil uji di atas, dihasilkan nilai perubahan proporsional (C pro ) sebesar 84,5% dan perubahan maksimum (C max ) sebesar 91,49%. Ini berarti bahwa apabila prosentase ketepatan klasifikasi data telah berada di atas batas tingkat akurasi yaitu minimal sebesar C max 91,49% maka pengklasifikasian yang dihasilkan dapat digunakan untuk memprediksi kelulusan calon mahasiswa baru dalam tes keterampilan secara akurat. Namun bila prosentase ketepatan klasifikasi lebih besar dari C pro 84,5% dan kurang dari C max maka pengklasifikasian yang dihasilkan masih bisa digunakan meskipun ketepatannya kurang akurat. Perbandingan antara diskriminan linier dan diskriminan kernel, serta kriteria evaluasi dari setiap model disajikan pada Tabel 10.
Tabel 7. Hasil klasifikasi metode diskriminan kernel data testing tes keterampilan SNMPTN 2010 jurusan Penjaskesrek UNESA (bandwith berbeda) Kelompok awal
Kelompok menurut fungsi diskriminan Lulus Tidak lulus
Jumlah
Lulus
4
4
8
Tidak lulus
0
86
86
Jumlah
5
89
94
Tabel 7 menunjukkan bahwa dari 94 data testing yang dianalisis menggunakan diskriminan kernel dengan bandwith tiap kelompok berbeda, terdapat 4 calon mahasiswa yang sebenarnya lulus tes keterampilan namun diprediksi tidak lulus tes. Namun tidak terdapat calon mahasiswa tidak lulus tes yang salah diprediksi lulus tes keterampilan. Selanjutnya dilakukan pengujian tingkat kestabilan dengan menghitung nilai Press’s Q sebagai berikut : press ' s Q
=
{94 − (90 × 2)} 94(2 − 1)
2
Tabel 8
Data
Diskriminan Linier
Training
87,80%
Diskriminan Kernel Varian Varian sama beda 95,23% 94,96%
Testing
64,00%
96,82%
95,76%
C pro
84,50%
84,50%
84,50%
C max
91,49%
91,49%
91,49%
Press’s Q
8,34
82,38
78,68
= 78,68
Nilai Press’s Q sebesar 76,68 tersebut lebih besar dari nilai chi-square χ 12 yang nilainya 3,841 sehingga pengklasifikasian dengan diskriminan kernel tersebut mempunyai kestabilan dalam membedakan dan memprediksi kelulusan tes keterampilan calon mahasiswa baru serta mampu memprediksi untuk sampel yang berbeda atau dapat dikatakan konsisten. Berdasarkan analisis yang telah dilakukan menggunakan metode diskriminan linier dan metode diskriminan kernel, ingin diketahui metode diskriminan yang menghasilkan prosentase ketepatan klasifikasi paling tinggi. Sebelumnya untuk mengetahui apakah pengelompokan data testing yang dihasilkan kedua metode mempunyai tingkat akurasi yang tinggi, maka perlu dibandingkan dengan change model
Nilai kriteria evaluasi ketepatan klasifikasi dengan metode diskriminan linier dan diskriminan kernel
Tabel 8 menunjukkan bahwa metode diskriminan kernel menghasilkan prosentase ketepatan klasifikasi yang lebih tinggi dibandingkan metode diskriminan linier baik untuk data training maupun data testing, dimana metode diskriminan kernel dengan bandwith tiap kelompok sama mempunyai ketepatan klasifikasi yang lebih tinggi dibandingkan metode diskriminan kernel dengan bandwith tiap kelompok berbeda. Meskipun begitu, selisih hasil klasifikasi metode diskriminan kernel dengan bandwith sama dan bandwith berbeda cukup kecil.
9
Selain itu, prosentase ketepatan klasifikasi (hit ratio) data testing untuk metode diskriminan kernel baik dengan asumsi matrik varian kovarian sama ataupun berbeda, keduanya lebih besar dari C pro dan C max sehingga dapat dikatakan pengklasifikasian metode diskriminan kernel sangat akurat (Tabel 8). Untuk nilai press’s Q, diskriminan kernel lebih besar daripada diskriminan linier. Kriteria-kriteria ini mengindikasikan bahwa diskriminan kernel dapat digunakan untuk memprediksi kelulusan tes keterampilan SNMPTN calon mahasiswa baru dengan ketepatan yang cukup besar. Sedangkan untuk prosentase ketepatan klasifikasi data testing yang dihasilkan metode diskriminan linier, nilainya kurang dari C pro sehingga dapat disimpulkan bahwa diskriminan linier memiliki tingkat akurasi yang sangat rendah dalam memprediksi kelulusan tes keterampilan SNMPTN calon mahasiswa baru. Sehingga dapat dikatakan bahwa metode diskriminan kernel memiliki kinerja lebih bagus dalam mengklasifikasikan data hasil tes keterampilan SNMPTN tahun 2010 untuk calon mahasiswa baru jurusan Penjaskesrek UNESA yang tidak memenuhi asumsi matrik varians kovarian sama.
6. Daftar Pustaka Ansys, Inc., 2004. Ansys Theory Reference : Ansys Release 9.0, First Ed. SAS IP, Inc, Philadelphia. Asari, D. D. 2011. Analisis dan Perbaikan Prosedur Seleksi Penerimaan Mahasiswa Baru di Universitas Sebelas Maret dengan Metode Business Process Improvement (BPI). Surakarta : Program Sarjana, Universitas Sebelas Maret. Ashadi, K., 2009. Mari Belajar Tentang Tes Kesegaran Jasmani Indonesia,
diakses 4 November 2011. Cahya, B., 2008. Laporan individu,
diakses 4 November 2011. Dillon, W. and Goldstein, M. 1984. Multivariate Analysis Methods and Aplication. New York: John Wiley & Sons, Inc. Fisher, R.A. 1936. The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics. 7, 179-188. Hair J. F., R. E. Anderson, R. L. Tatham, W. C. Black. 2006. Multivariate Data Analysis. Sixth Edition, Pearson Education Prentice Hall, Inc. Johnson, N. and Wichern, D. 2007. Applied Multivariate Statistical Analysis, 6th Edition. New Jersey: Prentice Hall, Englewood Cliffs. Jones, M. C. and Wand, M. P. 1995. Kernel Smoothing. Chapman and Hall. Mayasari, A. Y. 2011. Pemodelan Tes Kesehatan dan Tes Fisik Bidang Olahraga dengan Pendekatan Multivariate Adaptive regression Spline. Surabaya: Program Magister, Universitas Airlangga. Mika. S, G. R¨atsch, J. Weston, B. Sch¨olkopf, and K.-R. M¨uller. 1999 . Fisher discriminant analysis with kernels. In Y.-H. Hu, J. Larsen, E. Wilson, and S. Douglas, editors, Neural Networks forSignal Processing IX, pages 41–48. IEEE. Rahayu, Y. A. 2002. Analisis Diskriminan Multivariate dengan Metode Linear dan kernel (Studi Kasus pada Identifikasi Warna Obyek Menggunakan Kamera). Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember.
5. Kesimpulan Dari hasil analisis terhadap data training diketahui bahwa prosentase ketepatan klasifikasi untuk metode diskriminan linier sebesar 87,59% dan untuk metode diskriminan kernel sebesar 95,23%. Sedangkan hasil analisis terhadap data menunjukkan bahwa prosentase ketepatan klasifikasi untuk metode diskriminan linier sebesar 64,89% dan untuk metode diskriminan kernel sebesar 96,82%. Sedangkan untuk uji kestabilan model menunjukkan bahwa nilai Press’s Q metode diskriminan linier sebesar 8,34 dan pada metode diskriminan kernel nilainya lebih besar yaitu 82,38. Sehingga dapat disimpulkan bahwa pada kasus klasifikasi kelulusan tes keterampilan SNMPTN calon mahasiswa baru bidang olahraga, metode diskriminan kernel merupakan metode yang lebih sesuai digunakan daripada metode diskriminan linier. Hal ini juga dibuktikan dengan uji keakuratan model melalui kriteria C pro dan C max yang menunjukkan bahwa nilai pengklasifikasian diskriminan kernel lebih akurat dibandingkan metode diskriminan linier.
10
Rakhmawati, R. P. 2002. Studi Klasifikasi Ketrampilan Permainan Tenis Lapangan dengan Pendekatan Metode Diskriminan, Kernel, dan Artificial Neural Network. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Rencher, A. C. 2002. Methods of Multivariate Analysis, Second edition. New York: John Wiley & Sons, Inc. Rosenblatt, M. 1956. Remarks on Some Nonparametric Estimates of a Density Function. Annals of Mathematical Statistics. 27, 832 -837. Seber, G.A.F., 1984. Smoothing Observation. New York: John Wiley & Sons, Inc. Uswatul, F. 2004. Studi Pengelompokan Perguruan Tinggi Negeri dan Sekolah Menengah Atas berdasarkan Nilai SPMB Tahun 2003. Surabaya: Program Pasca Sarjana, Institut Teknologi Sepuluh Nopember. Wikipedia, 2011. Seleksi Nasional Masuk Perguruan Tinggi Negeri, diakses 4 November 2011. WHO, 2008. Definisi/Pengertian Sehat Menurut WHO, diakses 4 November 2011.
11