VALUE Jurnal Evaluasi & Asesmen Pendidikan
Volume II/No.01/Juni/2013
Diterbitkan oleh:
Pusat Penilaian Pendidikan Badan Penelitian dan Pengembangan Kementerian Pendidikan dan Kebudayaan
i
VALUE
©
Jurnal Evaluasi & Asesmen Pendidikan
Terbit 2 edisi per tahun (Juni dan Desember)
ISSN: 2303-0070
Hak Cipta dilindungi undang-undang. Dilarang memperbanyak sebagian atau keseluruhan dalam berbagai bentuk medium baik cetakan, elektronik, atau pun mekanik tanpa izin tertulis dari penerbit.
ii
VALUE,
akronim dari eVALUasi dan asEsmen, merupakan Jurnal di bidang Ilmiah Evaluasi
dan Asesmen/Penilaian Pendidikan yang dikelola oleh Pusat Penilaian Pendidikan (PUSPENDIK), Badan Penelitian dan Pengembangan, Kementerian Pendidikan dan Kebudayaan, untuk menerbitkan hasil karya penelitian (original research), karya pengembangan, tinjauan kembali (review), dan ulasan topik khusus dalam bidang Evaluasi dan Asesmen Pendidikan. Kesempatan menulis terbuka untuk umum meliputi para peneliti dan perekayasa lembaga riset, pengajar perguruan tinggi maupun pekarya-tesis sarjana semua strata. Karya tulis harus ditulis sesuai pedoman penulisan yang tercantum dalam setiap edisi.
Dewan Pengurus Penangung Jawab
: Hari Setiadi, Ph.D.
Dewan Redaksi
: Dr. Mahdiansyah, MA, Drs. Giri Sarana Hamiseno, Dra. Arniati, M.Psi, Drs. Safari, MA, APU, Drs. Witjaksono, MA, Drs. Rogers Pakpahan, M.Si, Dra. A. Hendriastuti, MA, Dra. Rahmah Zulaiha, MA.
Mitra Bestari
: Dr. Burhanuddin Tola, Jahja Umar, Ph.D, Bastari, Ph.D.
Pemimpin Redaksi
: Bagus Hary Prakoso, SE, MA
Tata Usaha
: Susi Mahyudin, M.Pd, Sidik Pranyoto, S.Kom
Sekretaris Redaksi
: Drs. Didi Pujohadi, Wuri Rohayati, S.S.
Alamat Redaksi Pusat Penilaian Pendidikan (PUSPENDIK), Badan Penelitian dan Pengembangan, Kementerian Pendidikan dan Kebudayaan (KEMDIKBUD), Jl. Gunung Sahari Raya no. 4, Jakarta Pusat, 10710 Tel. 62.21.3847537, 3847637, Fax. 3849451, E-mail:
[email protected] iii
Pedoman Penulisan Artikel 1.
Redaksi menerima naskah berupa hasil penelitian, opini, wawasan, pandangan, kajian pustaka, berita, dan resensi buku dari peneliti, praktisi dan pemerhati di bidang evaluasi dan asesmen pendidikan.
2.
Naskah dalam bentuk hard copy di kirim ke redaksi dan naskah soft copy dikirim melalui e-mail:
[email protected] dan disertai dengan biodata lengkap penulis.
3.
Ketentuan penulisan secara umum. a. Naskah ditulis dalam bentuk esai dan belum pernah diterbitkan di media lain. b. Naskah diketik dengan memperhatikan aturan penggunaan tanda baca dan ejaan, yang dimuat dalam pedoman ejaan bahasa Indonesia yang disempurnakan (EYD). c. Naskah diketik dengan format MS-Word, Font Calibri ukuran 11, spasi 1 jumlah halaman minimum 7 dan maksimum 20, ukuran kertas A4.
4.
Artikel hasil penelitian memuat judul, nama penulis, abstrak, kata kunci, dan isi. Isi artikel mempunyai struktur dan sistematika serta persentase jumlah halaman sebagai berikut : a. Penulis harus mencantumkan nama, instansi, dan email di bawah judul artikel. b. Artikel dalam bahasa Indonesia dan bahasa Inggris harus menuliskan abstrak dalam bahasa Indonesia dan bahasa Inggris. c. Pendahuluan meliputi latar belakang, perumusan masalah, dan tujuan penelitian (10%). d. Kajian Literatur mencakup kajian teori dan hasil penelitian terdahulu yang relevan (15%). e. Metode Penelitian yang berisi rancangan/model, sampel dan data, tempat dan waktu, teknik pengumpulan data, dan teknik analisis data (10%). f. Hasil dan Bahasan (50%). g. Simpulan dan Saran (15%) h. Daftar Pustaka. (Sistematika/struktur ini hanya sebagai pedoman umum, penulis dapat mengembangkannya sendiri asalkan sepadan dengan pedoman ini). iv
Artikel pemikiran dan atau reviu teori memuat judul, nama penulis, abstrak, kata kunci, dan isi. Isi artikel mempunyai struktur dan sistematika serta persentasinya dari jumlah halaman sebagai berikut : a. Pendahuluan meliputi latar belakang, perumusan masalah dan tujuan penulisan (10%). b. Kajian Literatur mencakup kajian teori dan hasil penelitian terdahulu yang relevan (75%). c. Simpulan dan Saran (20%) d. Daftar Pustaka (Sistematika/struktur ini hanya sebagai pedoman umum, mengembangkannya sendiri asalkan sepadan dengan pedoman ini).
penulis
dapat
Artikel resensi buku selain menginformasikan bagian-bagian penting dan buku yang diresensi juga menunjukkan bahasan secara mendalam kelebihan dan kelemahan buku tersebut serta membandingkan teori/konsep yang ada dalam buku tersebut dengan teori/konsep dari sumber- sumber lain. 5.
Daftar Pustaka disajikan mengikuti tata cara seperti contoh berikut dan diurutkan secara alfabetis dan kronologis. Aiken, Lewis R. (1994). Psychological Testing and Assessment, (Eighth Edition). Boston: Allyn and Bacon. Harding, J and Meldon-Smith, L. (2000). How to make observations & assessments (second edition). London: Hodder & Stoughton.
v
DAFTAR ISI VALUE, Jurnal Evaluasi & Asesmen Pendidikan Volume II/No.01/Juni/2013 Halaman
Dewan Pengurus dan Alamat Redaksi ............................................................................. Pedoman Penulisan Artikel .............................................................................................. Daftar Isi ..........................................................................................................................
iii iv vi
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta ................. Rahmawati
1
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009 ........................................ Deni Hadiana
14
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011 ............................................................................................................. Rumondang Purwati
36
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT) ............................................................................................................... Handaru Catu Bagus
60
Implementasi New Public Management Pada Lembaga Pengembangan Tes ................. Bagus Hary Prakoso Pembelajaran Kooperatif NHT upaya Meningkatkan Hasil Belajar IPA Siswa kelas VIII-I SMPN 228 Jakarta ........................................................................................... Tri Suyani Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011 ........................................................................................................................ Safari
75
90
109
vi
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta Rahmawati E-mail:
[email protected]
ABSTRACT Items of National examination for primary schools consist of 25 percent national linking items and the remaining 75 percent provincial items. Those provincial items were not derived from calibrated item bank resulted on extremely difficult items after putting on the same scale with national linking items. A simulation study then conducted to investigate impact of outliers of difficulty item parameters on accuracy of ability estimation. Three conditions were manipulated: ability distribution, numbers of outliers item, distribution of outliers. The results show that outliers item affected the accuracy of ability estimation specially in skew ability distribution and assymmetrical distribution of those outlier items. The simulation overviewed that in operational test when items were constructed too easy or too difficult relative to national linking items, then the ability estimate might not be accurate. It is suggested to prepare provincial item bank so that the items for national examination will have been calibrated before operational used. Keywords: outliers, item difficulty, national examination items, provincial item bank
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
1
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
ABSTRAK Soal-soal UN SD terdiri atas 75 persen soal-soal yang disusun di daerah. Soal-soal tersebut tidak berasal dari bank soal yang terkalibrasi. Pemetaan item parameter butir soal berdasar data operational test menunjukkan adanya soal-soal dengan tingkat kesukaran ekstrim. Studi simulasi dilakukan untuk mengetahui pengaruh soal dengan tingkat kesukaran ekstrim terhadap estimasi kemampuan peserta ujian. Tiga kondisi dimanipulasi: distribusi kemampuan peserta, jumlah soal dengan tingkat kesukaran ekstrim, serta sebaran soal-soal ekstrim. Hasil simulasi menunjukkan estimasi kemampuan peserta berpotensi bias jika diukur menggunakan soal-soal dengan tingkat kesukaran ekstrim terutama pada kondisi kemampuan peserta berdistribusi skew serta soal-soal yang tingkat kesukarannya ekstrim tersebar secara asimetris. Hasil simulasi memberi gambaran bahwa soal-soal yang disusun jauh lebih mudah ataupun lebih sukar relatif terhadap soal anchor nasional mempengaruhi akurasi hasil estimasi kemampuan peserta. Disarankan agar dibuat bank soal daerah yang terkalibrasi untuk memasok kebutuhan tes di tingkat daerah.
Kata Kunci: pencilan, tingkat kesukaran, soal UN SD, dan bank soal daerah
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
2
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
LATAR BELAKANG Latar Belakang Desain tes UN SD/MI memiliki kekhasan dibandingkan dengan UN di jenjang yang lain. Meskipun berdasarkan pada kisikisi dan indikator soal yang sama, 75% soal tes UN SD/MI adalah soal yang disusun di tingkat provinsi (BSNP, 2008). Soal-soal provinsi ini akan berbeda antara satu provinsi dengan provinsi lainnya. Sehingga dapat disimpulkan bahwa setiap provinsi menggunakan paket tes yang berbeda. Soalsoal provinsi disusun oleh tim penulis soal tingkat provinsi yang merupakan guru dari kabupaten/kota. Sebelum menyusun soal, tim penulis diwajibkan mengikuti pelatihan penulisan soal dari Pusat Penilaian Pendidikan (Puspendik). Sebagai pengontrol kualitas, soal-soal yang telah ditulis akan direview dari segi konten oleh tim pakar yang berasal dari perguruan tinggi dan direview dari segi konstruksi oleh tim Puspendik. Sampai saat penelitian ini disusun, tidak ada mekanisme ujicoba paket tes (field test) sebelum main test. Akibat tidak adanya
proses ujicoba paket tes, maka tidak diketahui karakter statistik butir soal yang disusun di tingkat provinsi. Karakter statistik yang dimaksud adalah tingkat kesukaran serta daya beda soal. Hal ini berpotensi menimbulkan pencilan soal-soal setiap provinsi setelah tingkat kesulitannya dikalibrasi terhadap tingkat kesulitan soalsoal anchor nasional, karena tendensi penulis di daerah untuk membuat soal yang mudah. Liu dan Zumbo (2007) menemukan bahwa soal-soal pencilan yang tersebar secara asimetris berdampak negatif terhadap reliabillitas skor tes. Jika soal-soal yang disusun di provinsi secara konsisten jauh lebih mudah atau jauh lebih sukar, maka berdasar hasil penelitian Liu dan Zumbo akan berpengaruh secara linear dengan standard error of measurement: semakin banyak soal pencilan, semakin besar kesalahan pengukuran. Jika pencilan tersebar secara simetris; sebagian lebih mudah dan sebagian lebih sukar; maka ketidaksimetrisan mengeliminir efek pencilan terhadap kesalahan estimasi. Oleh karena itu perlu dipetakan hasil kalibrasi soal–soal yang
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
3
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
disusun di provinsi: seberapa banyak yang tingkat kesukarannya ekstrim dan bagaimanakah sebaran soal-soal yang bersifat ekstrim tersebut. Hasil pemetaan ini tidak mampu menggambarkan akurasi hasil pengukuran, namun dapat menjadi overview kemampuan penulisan soal masing-masing provinsi. Oleh karena itu studi simulasi yang meneliti pengaruh soal pencilan terhadap akurasi estimasi kemampuan peserta perlu dilakukan untuk mengetahui seberapa bias hasil pengukuran jika digunakan alat ukur yang bersifat pencilan tingkat kesukarannya.
Rumusan Masalah Berdasarkan latar belakang di atas, terdapat permasalahan sebagai berikut: a) Soal-soal UN SD/MI yang disusun di provinsi tidak melalui proses kalibrasi sebelum pelaksanaan tes. Oleh karena itu perlu dikaji karakter psikometris dari butirbutir soal provinsi relatif terhadap butir soal nasional. b) Studi data empiris tidak mampu memberikan gambaran mengenai akurasi hasil estimasi. Oleh karena itu studi
simulasi perlu dilakukan untuk mengetahui sejauh mana pencilan tingkat kesukaran soal berpengaruh terhadap akurasi estimasi kemampuan peserta ujian.
Tujuan a) Mengetahui karakter psikometris butir soal UN SD/MI yang di susun di provinsi setelah dikalibrasi dengan butir soal nasional b) Mengetahui pengaruh pencilan tingkat kesukaran soal terhadap akurasi estimasi kemampuan peserta ujian berdasar hasil simulasi
Manfaat Penelitian 1) Penelitian ini diharapkan mampu memberi masukan kepada tim penulis soal di daerah untuk penulisan soal yang lebih baik dari perspektif psikometris 2) Penelitian ini diharapkan dapat memberikan rekomendasi kepada penanggung jawab pelaksanaan UN SD/MI mengenai mekanisme penyusunan tes yang lebih baik di masa mendatang.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
4
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
KAJIAN LITERATUR Akurasi estimasi kemampuan seorang yang menempuh tes sangat tergantung kepada kualitas tes sebagai alat ukur itu sendiri. Hambleton dan Rogers (1993) meneliti dampak dari buruknya kualitas psikometris butir soal pada konstruksi tes. Xing dan Hambleton (2004) menemukan bahwa buruknya kualitas butir soal menurunkan tingkat akurasi keputusan (decision accuracy) dan konsistensi keputusan (decision consistency) sebesar 4%. Artinya jika dikaitkan dengan konteks ujian nasional SMP dengan 400.000 peserta, maka terdapat sekitar 16.000 siswa SMP yang salah dalam kategorisasi kelulusan. Tidak hanya butir soal yang harus berkualitas baik, bahkan cara pengolahan data respon juga memengaruhi akurasi estimasi kemampuan peserta. Wasis (2009) meneliti kualitas penskoran butir-butir soal di ujian seleksi masuk perguruan tinggi. Hasil penelitian menunjukkan bahwa model penskoran secara partial credit (soal politomus) lebih baik dibandingkan dengan
model yang digunakan saat ini berupa penskoran dikomotus. Lebih khusus lagi model penskoran partial credit yang menggunakan pembobotan berdasarkan kompleksitas penyelesaian soal, menunjukkan estimasi yang paling baik dibandingkan model penskoran politomus lainnya. Sejumlah literature memberi kriteria soal yang baik. Berdasarkan teori tes klasik beberapa kriteria sebagai berikut: proportion correct antara 0,20 sampai 0,80; korelasi butir dengan skor total positif dan nilainya lebih atau sama dengan 0,30; jika soal berupa pilihan ganda setiap pilihan jawaban dipilih oleh minimal 20% responden; dan soal tidak dikosongkan oleh lebih dari 5% responden (Emslie dan Emslie, 2005). Berdasarkan teori respon butir terdapat beberapa kriteria soal yang baik sebagai berikut: data response bersifat unidimensi dan local independence; data response cocok/fit terhadap model teoritis; paramater tingkat kesukaran berada pada rentang -3 sampai +3, parameter daya beda soal bernilai positif dengan nilai lebih besar
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
5
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
atau sama dengan 0,40; untuk soal jenis pilihan ganda parameter guessing antara 0 sampai 1/banyaknya jumlah pilihan jawaban; fungsi maksimum informasi tes minimal 7.
peneliti. Namun karena data bangkitan tersebut bersifat probabilistic, maka perlu dilakukan replikasi data untuk setiap kondisi penelitian.
Namun kendala terbesar dalam studi yang membuktikan akurasi adalah tidak diketahuinya nilai true (nilai sebenarnya dari kemampuan seseorang). Sehingga dalam pembuktian studi akurasi perlu dilakukan pengandaian; jika nilai true kemampuan seseorang diketahui. Studi dengan pengandaian ini yang dikenal sebagai studi simulasi.
Masalah yang sering dihadapi dalam pembangkitan data adalah seberapa mirip data yang dibangkitkan dengan harapan kita. Dalam konteks IRT, apakah data yang dibangkitkan memenuhi asumsi unidimensi, apakah hasil estimasinya dekat dengan nilai yang ditetapkan sebelumnya, serta bagaimanakah stabilitas data bangkitan lintas replikasi. Han (2007) menjawab permasalahan bangkitan data ini dengan membuat aplikasi WinGen. WinGen memiliki kelebihan dimana interface aplikasi berbasis Windows yang lebih user friendly. Selain itu WinGen dapat membangkitkan data dari berbagai model IRT, berbagai jenis distribusi baik distrbusi butir soal maupun peserta, serta memiliki feature yang sangat mendukung Monte Carlo study seperti bangkitan file syntax yang compatible dengan software IRT.
Salah satu cara yang dapat dijadikan solusi untuk melakukan studi akurasi berdasarkan IRT adalah dengan teknik Monte Carlo study (Harwell, Stone, Chi Hsu, Kirisci, 1996). Monte carlo study tepat dilakukan ketika kita ingin mengetahui akurasi hasil estimasi terhadap nilai true. Sudah umum terjadi bahwa kita tidak mengetahui atau memiliki informasi mengenai nilai true. Oleh karena itu Monte Carlo study menawarkan solusi untuk melakukan penelitian yang membangkitkan data dengan nilai true tertentu sesuai kondisi yang menajdi interest
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
6
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
METODE PENELITIAN 1. Data Data yang digunakan dalam studi ini terdiri atas data empirik dan juga data simulasi. Data empirik adalah data UN SD/MI tahun 2010 dengan melakukan random sampling terhadap data simulasi. Setiap provinsi digunakan data dari paket tes utama dengan jumlah sampel minimal 10.000 setiap provinsi. Pada provinsi tertentu yang jumlah peserta UN SD/MI tidak jauh lebih besar dari 10.000 peserta, digunakan data populasi peserta paket utama provinsi tersebut. Simulasi pengaruh soal pencilan dilakukan menggunakan model IRT 2 parameter logistik dengan bentuk soal dikotomus. Pada simulasi dibangkitkan data response 3000 peserta tes terhadap 40 butir soal. Nilai parameter a butir soal terdistribusi uniform dengan rentang 0.2-1.9. nilai ini merupakan nilai parameter a yang umum dijumpai pada data empirik UN SD/MI. Beberapa variabel yang dimanipulasi dalam studi simulasi ini adalah:
a) Distribusi kemampuan peserta: Normal dan Skew negatif b) Jumlah soal pencilan tingkat kesukaran: 0%, 10%, 20%, dan 30% c) Sebaran soal pencilan: simetris dan asimetris Secara total terdapat 14 kondisi. Di setiap kondisi dilakukan replikasi 25 kali. Terdapat tiga kriteria yang digunakan untuk menentukan kondisi yang memberikan hasil estimasi kemampuan paling akurat: a) Root mean square error adalah akar pangkat dua dari nilai rerata beda hasil estimasi dan nilai true yang telah dikuadratkan. Dirumuskan dengan:
Semakin kecil nilai RMSE, maka hasil estimasi akurat. b) Bias, rerata selisih antara hasil estimasi dengan nilai true memiliki interpretasi makna yang sama dengan RMSE.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
7
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
c) Korelasi antara hasil estimasi dengan nilai true. Korelasi tinggi menunjukkan bahwa hasil estimasi semakin akurat. Studi simulasi menggunakan perangkat lunak WinGEN (Han, 2007). 2. Teknik Analisis Analasis data empirik menggunakan model IRT 2 parameter logistik dengan software Parscale. Butir soal anchor diestimasi dahulu tingkat kesukarannya untuk semua provinsi secara concurrent. Sedangkan butir soal non anchor dikalibrasi dengan metode fixed item parameter calibration untuk masing-masing provinsi dan butir soal anchor parameternya dianggap fixed.
HASIL PENELITIAN DAN PEMBAHASAN 1) Hasil data empirik Analisis data empirik memetakan soalsoal non anchor yang nilai tingkat kesukarannya lebih besar dari 3 atau kurang dari -3 setelah dikalibrasi terhadap butir soal anchor nasional. Item parameter butir soal anchor nasional diperoleh dengan cara concurrent calibration database nasional. Sedangkan item parameter butir soal non anchor diperoleh dengan cara fixed item parameter calibration database setiap provinsi. Hasil pemetaan jumlah soal non anchor pencilan disajikan pada tabel 1.
Sedangkan analisis data simulasi menggunakan software BILOG MG dengan model dua parameter logistik.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
8
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
Tabel 1. Pemetaan jumlah butir soal non anchor bersifat pencilan Prov 01 Prov 02 Prov 03 Prov 04 Prov 05 Prov 06 Prov 07 Prov 08 Prov 09 Prov 10 Prov 11 Prov 12 Prov 13 Prov 14 Prov 15 Prov 16 Prov 17 Prov 18 Prov 19 Prov 20 Prov 21 Prov 22 Prov 23 Prov 24 Prov 25
Pencilan 2 1 0 5 1 3 0 2 1 11 0 3 5 0 1 1 0 3 0 1 1 1 0 1 1
Positif 0 1 0 0 1 0 0 0 0 10 0 1 0 0 0 0 0 3 0 1 1 1 0 0 0
Negatif 2 0 0 5 0 3 0 2 1 1 0 2 5 0 1 1 0 0 0 0 0 0 0 1 1
Prov 26 Prov 27 Prov 28 Prov 29 Prov 30 Prov 31 Prov 32 Prov 33
Pencilan 0 0 0 3 0 2 1 0
Positif 0 0 0 0 0 0 1 0
Negatif 0 0 0 3 0 2 0 0
Terlihat dari tabel 1, sebelas dari 33 provinsi butir soal non anchor tidak terdeteksi memiliki pencilan tingkat kesukaran. Namun ada satu provinsi yang jumlah butir soal non anchor dengan pencilan berjumlah 11 soal, 10 diantaranya cenderung di sisi ekstrim sukar. Dua provinsi terdeteksi jumlah soal non anchor ekstrim 5 soal dengan karakter ekstrim mudah. Artinya sebagian besar dari 22 provinsi yang terdeteksi soal non anchornya bersifat pencilan, penyebaran soal non anchor pencilan tersebut tidak simetris.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
9
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
Hasil studi simulasi Tabel 2. Rerata Korelasi, RMSE, MAD, dan BIAS setiap kondisi DIST_CODE normal
outlier_code 10% outlier 20% outlier 30% outlier
negative skew
10% outlier 20% outlier 30% outlier
symmetric_code asymmetric symmetric asymmetric symmetric asymmetric symmetric asymmetric symmetric asymmetric symmetric asymmetric symmetric
Corr.
RMSE
MAD
BIAS
0.931 0.931 0.928 0.927 0.927 0.927 0.931 0.931 0.925 0.928 0.923 0.927
0.362 0.361 0.370 0.371 0.372 0.372 1.581 1.581 1.583 1.582 1.584 1.583
0.287 0.287 0.293 0.294 0.295 0.296 1.519 1.519 1.517 1.518 1.516 1.518
-0.022 -0.023 -0.021 -0.022 -0.021 -0.022 -1.519 -1.519 -1.517 -1.518 -1.516 -1.518
Terlihat dari tabel 2 bahwa bias estimasi kemampuan terjadi terutama pada kondisi distribusi kemampuan peserta negatively skewed, penyebaran soal pencilan yang asimetris dan persentase jumlah pencilan yang besar.
Gambar 1. Plot Mean Korelasi antara Kondisi Bentuk Distribusi dan Jumlah Pencilan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
10
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
Gambar 2. Plot Mean Bias antara Sebaran dan Jumlah Pencilan
Gambar 3. Plot Mean RMSE antara Bentuk Distribusi dan Jumlah Pencilan
Gambar 1, 2, dan 3 mengilustrasikan hasil pada tabel 1. Semakin besar persentase jumlah soal non anchor yang bersifat pencilan, maka bias semakin besar pula. Faktor utama bias menjadi besar terutama adalah bentuk distribusi yang tidak normal atau dalam hal ini negatively skewed. Namun pada gambar 4 yang menyajikan plot khusus kondisi distribusi normal saja, ternyata penyebaran soal non anchor yang tidak simetris disertai jumlah soal non anchor bermasalah yang besar potensi menimbulkan bias yang semakin besar pula.
Gambar 4. Plot Mean RMSE antara Sebaran dan Jumlah Pencilan Pada Distribusi Normal
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
11
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
SIMPULAN 1. Hasil studi data empirik menunjukkan bahwa terdapat butir soal non anchor yang tingkat kesukarannya bersifat pencilan pada 22 dari 33 provinsi. Satu provinsi sangat ekstrim dengan jumlah soal non anchor terdeteksi 11 soal. Dan sebagian besar provinsi penyebaran butir soal non anchor bermasalah tidak simetris. 2. Hasil studi simulasi menunjukkan bahwa soal dengan pencilan tingkat kesukaran akan menimbulkan bias dalam mengestimasi kemampuan peserta ujian, terutama jika kemampuan peserta ujian terdistribusi secara negatively skewed. Semakin banyak jumlah soal yang tingkat kesukarannya bersifat pencilan maka akurasi semakin rendah. Kesalahan estimasi kemampuan ini semakin besar teruatama jika soal-soal yang tingkat kesukarannya ekstrim berada di satu arah (asimetris): yaitu semua soal lebih mudah ataupun semua soal lebih sukar, dibandingkan jika sebaran soal-soal
tersebut simetris dan pangaruhnya saling menghilangkan.
DAFTAR PUSTAKA BSNP,
Kemdiknas Operasional 2008/2009.
(2008). Standar
Prosedur UASBN
Emsley, J.R. dan Emsley, G.R. (2005). Improving Classroom Multiple -Choice Tests: A Worked Example Using Statistical Criteria. Paper Department Psychology, Ryerson University Toronto. Diunduh dari http://www.ryerson.ca/content/dam/c cs/resources/trs/guide_to_results/Wor ked_Example_for_TRS.pdf Han, K. (2007). WINGEN: Windows software that generates IRT parameter and item responses. Applied Psychological Measurement, 31, 457–459. Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory. Newbury Park, CA: Sage. Harwell, M., Stone, C.A., Hsu, T.C., & Kirisci, L. (1996). Monte Carlo studies in item response theory. Applied Psychological Measurement, volume 20.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
12
Menilik Kualitas Penulisan Soal UN SD di Daerah: Studi Simulasi Pengaruh Pencilan Item Parameter Tingkat Kesukaran terhadap Estimasi Kemampuan Peserta
Holland, P.W., & Dorans,N.J.(2006) Linking and Equating. Pada R.Brennan, Educational Measurement, 4th edition (hal 187-220). Wesport, CT: Praeger Publisher.
Liu,Y. & Zumbo, B.(2007) The Impact of Outliers on Cronbach's Coefficient Alpha Estimate of Reliability. Educational and Psychological Measurement. Volume 67 Number 4.
Kang & Petersen (2009). Linking Item Parameters to a base scale. ACT Research Report Series. ACT Incorporation, 2009
Wasis (2009) Model Penskoran Partial Credit Pada Penskoran Item Multiple False Bidang Fisika. Disertasi Universitas Negeri Yogyakarta. Universitas Negeri Yogyakarta, 2009.
Kemdiknas (2008). Peraturan Menteri no 82 tahun 2008 tentang UASBN SD/MI/ SDLB
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
13
KARAKTERISTIK SOAL UN KIMIA SMA TAHUN PELAJARAN 2008/2009 Deni Hadiana Peneliti Muda pada Pusat Penilaian Pendidikan Email: ...... ABSTRACT This study aimed to analyze characteristics of National Examination, Chemistry Subject Matter in High School, Academic Year 2008/2009. Analysis of the characteristics of items was done qualitatively by dissecting the three documents namely the Minister of National Education Annex No. 22 of 2006 on the Content Standards for Elementary and Secondary Education Unit-Competence Standard and Basic Competence high school Chemistry, Table of spesification of Chemistry test, test and proportion correct results Chemistry. Proportion correct data in this study is a secondary data obtained from the reports of the UN school year 2008/2009, published by the Center for Educational Assessment, Research and Development, Ministry of Education and Culture. The three documents are analyzed to find the relationship between the standard and basic competencies with table of spesification and Chemistry items. The result showed that the dissemination of information matters UN Chemistry is consistent or compatible with the pattern of the spread of basic competence in terms of topics and cognitive domains. Topics that are on the topic of chemistry consist of analytical chemistry, physical chemistry, inorganic chemistry, organic chemistry, theoretical chemistry, and biochemistry. Cognitive domains of chemistry include cognitive levels of understanding, application, and analysis. The material grade 12 is the most tested than material grade XI and X. Keywords: UN, chemistry tests, basic competency.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
14
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
ABSTRAK Penelitian ini bertujuan untuk menganalisis Karakteristik Soal Ujian Nasional (UN) Kimia SMA Tahun Pelajaran 2008/2009. Analisis karakteristik butir soal dilakukan secara kualitatif dengan membedah tiga dokumen yakni Lampiran Peraturan Menteri Pendidikan Nasional Nomor 22 Tahun 2006 tentang Standar Isi untuk Satuan Pendidikan Dasar dan Menengah Standar Kompetensi dan Kompetensi Dasar Kimia SMA, kisi-kisi UN Kimia, Naskah dan Daya Serap hasil UN Kimia. Data daya serap pada penelitian ini merupakan data sekunder yang diperoleh dari laporan hasil UN SMA tahun 2008/2009 yang diterbitkan oleh Pusat Penilaian Pendidikan, Badan Penelitian dan Pengembangan, Kementerian Pendidikan dan Kebudayaan. Ketiga dokumen tersebut dianalisis sampai ditemukan hubungan antara standar kompetensi dan kompetensi dasar dengan kisi-kisi UN dan naskah UN Kimia. Dari hasil penelitian diperoleh informasi bahwa penyebaran soal-soal UN Kimia sudah konsisten atau sesuai dengan pola penyebaran kompetensi dasar dari segi topik dan tingkatan kognitif. Topik yang terdapat pada soal kimia teridiri dari topik kimia analitik, kimia fisika, kimia anorganik, kimia organik, kimia teori, dan biokimia. Tingkatan kognitif soal kimia mencakup tingkatan kognitif pemahaman, aplikasi, dan analisis. Materi kelas XII merupkan materi yang paling banyak diujikan pada soal UN kimia diikuti oleh materi kelas XI dan X. Kata kunci: UN, Soal UN kimia, dan Kompetensi Dasar.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
15
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
PENDAHULUAN Ujian Nasional adalah penilaian terhadap hasil belajar peserta didik untuk mengakhiri masa studinya pada satuan pendidikan dasar dan menengah, yang dilaksanakan secara nasional baik menyangkut penyelenggara, waktu pelaksanaan, materi soal, maupun kriteria kelulusannya. Sebelum tahun 2008 mata pelajaran yang di UN kan untuk tingkat SMA/MA adalah Bahasa Indonesia, Bahasa Ingris dan Matematika, sejak tahun 2008, mata pelajaran yang diujikan ditambah dengan mata pelajaran yang menjadi ciri khas masing-masing program studi bagi SMA/MA. Pada Program IPA ditambah dengan mata pelajaran biologi, fisika, dan kimia, pada Program IPS ditambah matematika, geografi, dan sosiologi, dan pada Program Bahasa ditambah matematika, sastra Indonesia, dan antropologi. Hasil UN dapat menggambarkan pencapaian kompetensi peserta didik dalam menguasai materi pembelajaran baik pada tingkat satuan pendidikan, kabupaten/kota,
provinsi, dan nasional. Deskripsi kemampuan peserta didik dalam UN sangat penting untuk menentukan berbagai kebijakan peningkatan mutu pembelajaran. Adanya penambahan mata pelajaran yang diujikan dalam UN khususnya mata pelajaran kimia, mata penulis menganggap perlu melakukan studi analisis karateristik soal Kimia UN yang meliputi: standar kompetensi, kompetensi dasar, kisi-kisi dan soal yang diujikan secara nasional tahun pelajaran 2008/2009 dimana untuk pertama kalinya mata pelajaran tersebut diujikan. Berdasarkan uraian di atas, pokok permasalahannya adalah: 1) Apakah soal yang diujikan dalam UN SMA tahun pelajaran 2008/2009 pada mata pelajaran kimia sudah sesuai dengan standar kompetensi dan kompetensi dasar yang ada terdapat pada standar UN. 2) Bagaimana penyebaran soal UN SMA tahun pelajaran 2008/2009 pada mata pelajaran kimia dari aspek topik, tingkatan kognitif, dan jenjang kelas? Penelitian ini bertujuan untuk: 1) menganalisis soal UN SMA tahun pelajaran 2008/2009 pada mata pelajaran kimia
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
16
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
berdasarkan standar kompetensi dan kompetensi dasar Kimia; 2) mengidentifikasi penyebaran soal UN SMA tahun pelajaran 2008/2009 pada mata pelajaran kimia dari aspek kompetensi dasar, level kognitif, dan jenjang kelas.
KAJIAN LITERATUR Menurut Furqon (2004), suatu kegiatan biasanya ditujukan untuk memenuhi fungsi dan mencapai tujuan tertentu. Fungsi utama yang diemban dapat berbeda antara kegiatan ujian yang satu dari kegiatan ujian lainnya, bergantung kepada tujuan ujian itu. Secara umum, fungsi-fungsi kegiatan ujian dalam dunia pendidikan dapat dikategorikan sebagai berikut. a. Akuntabilitas publik (public accountability), yaitu bahwa ujian dalam pendidikan diharapkan mampu menyediakan dan memberikan informasi kepada masyarakat mengenai kemajuan dan prestasi yang dicapai sehubungan dengan manfaat dari setiap rupiah yang dibelanjakan dalam kegiatan pendidikan.
b. Pengendalian mutu (quality control) pendidikan. Sebagai pengendali mutu pendidikan, ujian diharapkan dapat menjadi instrumen untuk mengendalikan dan menjamin bahwa setiap keluaran (lulusan) pendidikan telah memenuhi kualifikasi, kompetensi, atau standar tertentu yang ditetapkan. c. Motivator (pressure to achieve), yaitu bahwa evaluasi diharapkan menjadi instrumen untuk mendorong dan “memaksa” pengelola dan penyelenggara serta pelaksana (guru dan peserta didik) pendidikan untuk berusaha lebih keras dan sungguh-sungguh dalam mencapai hasil yang diharapkan. d. Seleksi dan penempatan, yaitu bahwa hasil evaluasi pendidikan dapat dijadikan salah satu bahan pertimbangan untuk menerima atau menolak seorang pelamar, khususnya jika tempat yang tersedia lebih sedikit dari jumlah yang melamar. Selain itu, hasil evaluasi juga dapat dijadikan bahan pertimbangan dalam menentukan ke mana seorang dianjurkan untuk
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
17
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
melanjutkan pendidikannya atau terjun ke dunia kerja. e. Diagnostik, yaitu bahwa evaluasi dapat memberikan umpan balik (feedback) kepada sistem tentang kekuatan dan kelemahannya, sehingga dapat ditentukan kegiatan tindak lanjut yang diperlukan. Fungsi ini sering juga dikaitkan dengan fungsi peningkatan mutu (quality improvement) karena balikan yang tepat dapat mendorong kegiatan dan program pendidikan untuk senantiasa melakukan peningkatan mutu layanan pendidikan dan keluaran yang dihasilkannya. Kegiatan evaluasi seperti ini dapat diselenggarakan dalam satuan kelas, satuan sekolah, satuan daerah, sampai satuan nasional. Sementara Ki Supriyoko (2004) menyampaikan bahwa UN sebagai salah satu bentuk dari evaluasi sumatif yang diselenggarakan oleh Pemerintah untuk mengetahui pencapaian standar nasional pendidikan perlu memerhatikan beberapa prinsip penilaian yaitu harus dilaksanakan secara objektif, adil dan berlaku sama bagi
semua peserta (equity), serta memberikan insentif belajar bagi peserta didik yang dikenai ujian (teaching-learning incentive). Di samping itu, UN harus benar-benar mampu mengukur prestasi belajar peserta didik (student achievement effectiveness), artinya peserta didik yang prestasi belajarnya baik mendapat nilai yang baik dan peserta didik yang prestasi belajarnya buruk mendapat nilai yang buruk. UN sebagai salah satu kegiatan pengukuran memerlukan soal yang bermutu baik, karena baik-buruknya soal akan menentukan mutu data yang dihasilkan. Mutu data ini akan menentukan mutu rumusan hasil penilaian, dan selanjutnya akan menentukan mutu berbagai keputusan dan kebijakan kependidikan yang ditetapkan berdasarkan hasil penilaian itu. Sesuai dengan Peraturan Menteri Pendidikan Nasional No. 77 Tahun 2008 tentang UN SMA Tahun Pelajaran 2008/2009 pada Pasal 6, dinyatakan bahwa mata pelajaran yang diujikan pada UN SMA Program IPA meliputi bahasa Indonesia, bahasa Inggris, matematika, fisika, kimia, dan biologi. Soal-soal UN disusun dan dirakit
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
18
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
berdasarkan kisi-kisi soal UN tahun pelajaran 2008/2009. Kisi-kisi soal UN disusun berdasarkan standar kompetensi lulusan (SKL) yang merupakan irisan (interseksi) dari pokok bahasan/sub pokok bahasan Kurikulum 1994, Standar Kompetensi dan Kompetensi Dasar (SKKD) pada Kurikulum 2004 dan Standar Isi. Soal-soal UN dikembangkan dan dikelola oleh Pusat Penilaian Pendidikan (Puspendik) Balitbang Depdiknas di bawah koordinasi Badan Standar Nasional Pendidikan (BSNP). Butir-butir soal UN merupakan soal yang terstandar yang diambil dari Bank Soal nasional sesuai dengan kisi-kisi UN tahun pelajaran 2008/2009. Butir-butir soal tersebut dirakit manjadi paket-paket tes dengan memerhatikan kesetaraan tingkat
kesukaran soal, antar paket. Dari paket tes tersebut, kemudian soal-soal dirakit kembali menjadi Paket A dan Paket B. Dengan demikian, soal-soal yang diujikan dalam UN telah benar-benar dipersiapkan dengan matang dan tentunya soal-soal tersebut bermutu baik. Pada UN SMA Program IPA, jumlah soal yang diujikan pada mata pelajaran bahasa Indonesia dan bahasa Inggris adalah 50 butir, sedangkan untuk mata pelajaran matematika, fisika, kimia, dan biologi masing-masing 40 butir. Masingmasing paket tes tersebut harus diselesaikan dalam waktu 120 menit. Kisi-kisi UN tahun pelajaran 2008/2009 untuk mata pelajaran Kimia dapat dilihat pada tabel 1 berikut.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
19
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Tabel 1. Kisi-kisi UN Tahun Pelajajaran 2008/2009 untuk Mata Pelajaran Kimia SKL 1. Menganalisis
Kemampuan yang Diuji 1.
Mendeskripsikan notasi unsur dan kaitannya dengan konfigurasi elektron serta jenis ikatan kimia yang dapat dihasilkannya
2.
Memprediksi letak unsur dalam tabel periodic
3.
Memprediksi jenis ikatan kimia/jenis interaksi molekuler
2. Menerapkan hukum-hukum dasar kimia untuk memecahkan masalah dalam perhitungan kimia.
4.
Menyelesaikan perhitungan kimia yang berkaitan dengan hukum dasar kimia
5.
Menganalisis persamaan reaksi kimia
3. Menjelaskan sifat-sifat larutan, metode pengukuran dan terapannya
6.
Menganalisis data daya hantar listrik beberapa larutan
7.
Mendeskripsikan konsep pH larutan
8.
Menghitung konsentrasi asam/basa pada proses titrasi asam basa
9.
Menganalisis sifat larutan penyangga
struktur atom, sistem periodik unsure dan ikatan kimia untuk menentukan sifat-sifat unsure dan senyawa.
10. Menghitung pH larutan garam yang terhidrolisis 11. Menyimpulkan terbentuknya endapan/larutan dari data Ksp 12. Menyimpulkan sifat koligatif larutan berdasarkan data 13. Menganalisis diagram PT yang berkaitan dengan sifat koligatif larutan 14. Menyimpulkan penerapan sifat koloid di dalam kehidupan sehari-hari 15. Menyimpulkan penerapan konsep minyak bumi yang berkaitan dengan efisiensi BBM
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
20
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SKL 4. Memahami senyawa organik, gugus fungsi dan reaksinya, benzena dan turunannya, makromolekul serta lemak.
Kemampuan yang Diuji 16. Mendeskripsikan senyawa turunan alkana 17. Mengidentifikasi senyawa benzena dan turunannya 18. Menganalisa data yang berhubungan dengan polimer 19. Mendeskripsikan makromolekul
5. Menentukan perubahan energi dalam reaksi kimia, cara pengukuran dan perhitungan nya.
20. Menyimpulkan peristiwa eksoterm/endoterm pada peristiwa termokimia
6. Memahami kinetika reaksi, kesetimbangan kimia, dan faktorfaktor yang memengaruhi nya, serta penerapannya dalam kehidupan sehari-hari dan industri.
22. Menghitung laju reaksi berdasarkan data eksperimen
21. Menentukan kalor reaksi
23. Mendeskripsikan faktor-faktor yang mempengaruhi laju reaksi 24. Menganalisis pergeseran kesetimbangan 25. Menghitung harga Kc/Kp
7. Memahami reaksi oksidasi-reduksi dan sel elektrokimia serta penerapannya dalam teknologi dan kehidupan sehari-hari.
26. Mendeskripsikan persamaan reaksi redoks
8. Memahami karakteristik unsur-unsur penting, terdapatnya di alam, pembuatan dan kegunaanya.
30. Mendeskripsikan mineral suatu unsur
27. Mendeskripsikan diagram sel volta 28. Menerapkan hukum Faraday 29. Mendeskripsikan fenomena korosi 31. Mendeskripsikan sifat unsur golongan tertentu 32. Mendeskripsikan cara memperoleh unsur dan kegunaannya (Sumber: Lampiran Permendiknas No. 77 Tahun 2008)
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
21
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Pada tabel 1, tampak terdapat 8 SKL yang dikembangkan menjadi 32 kemampuan yang diuji berdasarkan kisi-kisi tersebut disusunlah 40 soal. Soal-soal UN Kimia dikembangkan berdasarkan interseksi kurikulum 1994, kurikulum 2004, dan standar isi. Dengan demikian soal UN harus mampu mewakili kurikulum yang dijadikan acuan dalam pembelajaran. Selain itu, soal-soal UN yang cenderung mengukur aspek kognitif harus mampu mencerminkan seluruh domain kognitif. Menurut Badrun dkk (2009) tingkatan domain kognitif untuk kelompok mata pelajaran matematika dan ilmu pengetahuan alam termasuk kimia dibagi menjadi lima tingkatan (level) yaitu: memorize, perform procedure, communicate understanding, conjecture/generalize/prove, dan solve-non routine problems/make connection. Memorize merupakan level kognitif tingkat pertama yang mencakup level mengingat, diantaranya menyebutkan faktafakta, menyebutkan definisi-definsi, dan menyebutkan rumus-rumus. Pada tingkatan yang kedua, perform procedure sudah
meliputi kemampuan perhitungan, pengurutan angka, menampilkan grafik dari data yang ada. Pada tingkatan ketiga, communicate understanding peserta didik dituntut untuk menggunakan ide-ide dalam pemecahan masalah. Pada tingkatan keekpat, conjecture/generalize/prove peserta didik dituntut untuk dapat menentukan kebenaran dari suatu pola dan menganalisis data. Pada tingkatan kelima, solve-non routine problems/ make connection, peserta didik dituntut untuk bisa mengaplikasikan dan mengadaptasi permasalahan dan pemecahannya. Nilai hasil UN merupakan konversi skor mentah hasil UN ke dalam skala nilai 0–10. Nilai UN menunjukkan seberapa besar nilai perolehan peserta didik untuk tiap mata pelajaran yang diujikan. Nilai UN juga mencerminkan daya serap peserta didik pada setiap mata pelajaran yang diujikan. Daya serap dapat didefinisikan sebagai seberapa besar/banyak persentase peserta didik yang dapat menjawab pertanyaan dalam tes, satu pertanyaan dicerminkan dalam satu indikator. Daya serap ini merupakan hasil
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
22
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
perhitungan dari jawaban siswa dari setiap kemampuan yang diujikan di setiap jenjang pendidikan. Daya serap dalam tulisan ini berarti kemampuan peserta dalam menjawab setiap butir soal yang dinyatakan dalam persentase.
Badan Penelitian dan Pengembangan, Kementerian Pendidikan dan Kebudayaan. Ketiga dokumen tersebut dianalisis sampai ditemukan hubungan antara standar kompetensi dan kompetensi dasar dengan kisi-kisi UN dan naskah UN Kimia.
METODE PENELITIAN
HASIL DAN PEMBAHASAN
Penelitian ini menggunakan tiga dokumen meliputi Lampiran Peraturan Menteri Pendidikan Nasional Nomor Nomor 22 Tahun 2006 tentang Standar Isi untuk Satuan Pendidikan Dasar dan Menengah yaitu Standar Kompetisi Lulusan (SKL) mata pelajaran Kimia SMA, kisi-kisi UN Kimia, naskah dan Daya Serap hasil UN Kimia. Data daya serap pada penelitian ini merupakan data sekunder yang diperoleh dari laporan hasil UN SMA tahun 2008/2009 yang diterbitkan oleh Pusat Penilaian Pendidikan,
SKL, Kemampuan yang diuji, dan Indikator Berdasarkan hasil analisis SKL (standar kompetensi dan kompetensi dasar), kemampuan yang diuji dan soal UN Kimia dapat drumuskan indikator-indikator untuk setiap soalnya. Tabel 2 menggambarkan SKL, kemampuan yang diuji dan indikator soal yang diujikan dalan UN. Indikator soal mecerminkan kemampuan yang diukur dalam setiap butir soal berdasarkan soal yang diujikan, satu indikator soal menggambarkan satu butir soal.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
23
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Tabel 2. SKL, Kemampuan yang Diuji, dan Indikator SKL Menganalisis struktur atom, sistem periodik unsure dan ikatan kimia untuk menentukan sifat-sifat unsure dan senyawa.
Menerapkan hukumhukum dasar kimia untuk memecahkan masalah dalam perhitungan kimia.
Menjelaskan sifat-sifat larutan, metode pengukuran dan terapannya
Kemampuan yang Diuji
Indikator Soal
Mendeskripsikan notasi unsur 1) Menentukan konfigurasi dan kaitannya dengan elektron unsur konfigurasi elektron serta 2) Menentukan gambar jenis ikatan kimia yang dapat konfigurasi elektron unsur dihasilkannya 3) Menentukan rumus senyawa dan jenis ikatan Memprediksi jenis ikatan 4) Memprediksi jenis ikatan kimia/jenis interaksi berdasarkan sifat fisik molekuler Memprediksi letak unsur 5) Memprediksi letak unsur dalam sistem periodik berdasarkan dalam tabel periodic notasi unsur Menganalisis persamaan 6) Menentukan nama senyawa reaksi kimia berdasarkan persamaan reaksi Menyelesaikan perhitungan 7) Menentukan perbandingan vol kimia yang berkaitan dengan zat-zat berdasarkan persamaan hukum dasar kimia reaksi 8) Menghitung massa/volume zat hasil reaksi Menganalisis data daya 9) Menentukan sifat elektrolit/ hantar listrik beberapa nonelektrolit berdasarkan data larutan Mendeskripsikan konsep pH 10) Memperkirakan harga pH larutan berdasarkan data indikator Menghitung konsentrasi 11) Menghitung konsentrasi asam/basa pada proses titrasi variabel dalam titrasi asam basa
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
No Soal 1 2 3 4
5
6 7
8 9
10 11
24
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SKL
Memahami senyawa organik, gugus fungsi dan reaksinya, benzena dan turunannya, makromolekul serta lemak.
Kemampuan yang Diuji
Indikator Soal
Menganalisis sifat larutan 12) Memilih larutan penyangga penyangga berdasarkan data sifat larutan Menghitung pH larutan garam 13) Menghitung pH garam yang yang terhidrolisis terhidrolisis berdasarkan data Menyimpulkan terbentuknya 14) Memprediksi campuran yang menghasilkan endapan atau endapan/larutan dari data Ksp larutan berdasarkan data reaksi dan Ksp Menyimpulkan sifat koligatif 15) Manganalisis tekanan osmotik larutan berdasarkan data larutan berdasarkan data Menganalisis diagram PT yang 16) Menganalisis variabel sifat berkaitan dengan sifat koligatif larutan berdasarkan koligatif larutan diagram PT Menyimpulkan penerapan 17) Memilih contoh penerapan sifat koloid di dalam sifat koloid kehidupan sehari-hari Menyimpulkan penerapan 18) Menentukan bilangan oktan konsep minyak bumi yang suatu bahan bakar berkaitan dengan efisiensi BBM Mendeskripsikan senyawa 19) Menentukan rumus struktur/ gugus fungsi senyawa alkana/ turunan alkana turunan alkana 20) Menentukan jenis reaksi pada senyawa alkana/turunan alkana 21) Memilih nama/rumus struktur yang berisomer dengan salah satu senyawa
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
No Soal 12 13 14
15 16
17
18
19
20
21
25
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SKL
Kemampuan yang Diuji
Indikator Soal
Mengidentifikasi senyawa benzena dan turunannya
22) Memilih kegunaan benzene/ turunan benzene berdasarkan nama/rumus struktur Menganalisa data yang 23) Menganalisis hubungan data tentang polimer, monomer, berhubungan dengan polimer dan jenisnya Mendeskripsikan makromolekul
Menentukan perubahan energi dalam reaksi kimia, cara pengukuran dan perhitungannya.
Memahami kinetika reaksi, kesetimbangan kimia, dan faktorfaktor yang memengaruhinya, serta penerapannya dalam kehidupan sehari-hari dan industri.
24) Menentukan sifat-sifat polimer berdasarkan data 25) Menganalisis kandungan zat berdasarkan uji makromolekul Menyimpulkan peristiwa 26) Menganalisis data yang terkait eksoterm/endoterm pada dengan reaksi eksoterm/ peristiwa termokimia endoterm Menentukan kalor reaksi 27) Menghitung variabel kalor reaksi berdasarkan ilustrasi proses 28) Menghitung kalor reaksi berdasarkan persamaan reaksi dan energi ikat Menghitung laju reaksi 29) Menghitung laju reaksi berdasarkan data dan berdasarkan data eksperimen persamaan reaksi Mendeskripsikan faktor-faktor 30) Menganalisis gambar yang yang mempengaruhi laju berhubungan dengan faktor reaksi penentu laju reaksi Menganalisis pergeseran 31) Menganalisis gambar yang berhubungan degan kesetimbangan pergeseran kesetimbangan sesaat
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
No Soal 22
23
24 25 26
27
28
29
30
31
26
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SKL
Kemampuan yang Diuji Menghitung harga Kc/Kp
Memahami reaksi oksidasi-reduksi dan sel elektrokimia serta penerapannya dalam teknologi dan kehidupan sehari-hari.
Memahami karakteristik unsurunsur penting, terdapatnya di alam, pembuatan dan kegunaanya.
Mendeskripsikan persamaan reaksi redoks Mendeskripsikan diagram sel volta Menerapkan hukum Faraday Mendeskripsikan fenomena korosi Mendeskripsikan mineral suatu unsur
Mendeskripsikan sifat unsur golongan tertentu Mendeskripsikan cara memperoleh unsur dan kegunaannya
Tabel di atas memperlihatkan bahwa materi yang tergambar dalam soal UN Kimia telah mencerminkan ruang lingkup mata pelajaran kimia yang tertuang dalam standar kompetensi dan kompetensi dasar (SKKD)
Indikator Soal 32) Menghitung harga Kc/Kp dari reaksi 33) Menyetarakan persamaan reaksi redoks 34) Menentukan diagram sel berdasarkan gambar sel volta 35) Menerapkan hukum faraday berdasarkan data 36) Memilih metode pencegahan korosi 37) Menentukan pasangan data berhubungan dengan unsur dan mineral
No Soal 32 33 34 35 36 37
38) Menentukan sifat-safat unsur golongan tertentu 39) Menentukan nama proses pembuatan unsur
38
40) Menentukan kegunaan unsur/senyawa tertentu
40
39
yang bersumber Lampiran Peraturan Menteri Pendidikan Nasional Nomor 22 Tahun 2006 tentang Standar Isi. Hubungan antara SKL UN dan Standar Kompetensi dalam Standar Isi Kimia SMA dapat dilihat pada Tabel 3.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
27
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Tabel 3. SKL dan Standar Kompetensi Kimia SKL UN
Standar Kompetensi
Kelas/ Semester
Menganalisis struktur atom, sistem periodik unsure dan ikatan kimia untuk menentukan sifat-sifat unsure dan senyawa.
Memahami struktur atom, sifat-sifat periodik unsur, dan ikatan kimia
X/1
Memahami struktur atom untuk meramalkan sifat-sifat periodik unsur, struktur molekul, dan sifat sifat senyawa
XI/1
Menerapkan hukum-hukum dasar kimia untuk memecahkan masalah dalam perhitungan kimia.
Memahami hukum-hukum dasar kimia dan penerapannya dalam perhitungan kimia (stoikiometri)
X/1
Menjelaskan sifat-sifat larutan, metode pengukuran dan terapannya
Memahami sifat-sifat larutan non-elektrolit dan elektrolit, serta reaksi oksidasi-redukasi
X/2
Memahami sifat-sifat larutan asam-basa, metode pengukuran, dan terapannya
XI/2
Menjelaskan sistem dan sifat koloid serta penerapannya dalam kehidupan sehari-hari
XI/2
Menjelaskan sifat- sifat koligatif larutan nonelektrolit dan elektrolit
XII/1
Memahami senyawa organik, gugus fungsi dan reaksinya, benzena dan turunannya, makromolekul serta lemak.
Memahami sifat-sifat senyawa organik atas dasar gugus fungsi dan senyawa makromolekul
X/2
Memahami senyawa organik dan reaksinya, benzena dan turunannya, dan makromolekul
XII/2
Menentukan perubahan energi dalam reaksi kimia,cara pengukuran dan perhitungannya.
Memahami perubahan energi dalam reaksi kimia dan cara pengukurannya
XI/1
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
28
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SKL UN
Standar Kompetensi
Kelas/ Semester
Memahami kinetika reaksi, kesetimbangan kimia, dan faktorfaktor yang memengaruhi nya, serta penerapannya dalam kehidupan sehari-hari dan industri.
Memahami kinetika reaksi, kesetimbangan kimia, dan faktor-faktor yang mempengaruhinya, serta penerapannya dalam kehidupan sehari-hari dan industri
XI/1
Memahami reaksi oksidasi-reduksi dan sel elektrokimia serta penerapannya dalam teknologi dan kehidupan sehari-hari.
Menerapkan konsep reaksi oksidasi-reduksi dan elektrokimia dalam teknologi dan kehidupan sehari-hari
XII/1
Memahami karakteristik unsurunsur penting, terdapatnya di alam, pembuatan dan kegunaanya.
Memahami karakteristik unsur-unsur penting, kegunaan dan bahayanya, serta terdapatnya di alam
XII/1
Topik Kompetensi Dasar Kimia Dalam lampiran standar isi, dari 13 standar kompetensi dikembangkang menjadi 41 kompetensi dasar yang tersebar dari kelas X semester 1 sampai dengan kelas XII semester 2. Menurut Badrun dkk (2009), 41 kompetensi dasar dikelompokkan menjadi 14 kompetensi dasar kimia analitik; 2 kompetensi dasar biokimia; 3 kompetensi dasar kimia anorganik/unsur; 4 kompetensi dasar kimia organik; 4 kompetensi dasar kimia fisik; 13 kompetensi dasar kimia teori; dan 1 kompetensi dasar kimia nuklir.
Hasil analisis kompetensi dasar kimia berdasarkan stsndar isi dapat digambarkan dalam grafik berikut ini (gambar 1)
Gambar 1. Persentase Topik Kompetensi Dasar Kimia SMA
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
29
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Kompentensi dasar yang berkaitan dengan topik kimia analitik paling banyak yakni 34,15%, diikuti kimia teori 31,71%, kimia organik 9,76% dan kimia fisika 9,76%, kimia anorganik 7,32%, biokimia 4,88%, dan kimia nuklir 2,44%.
disusun berdasarkan interseksi kurikulum 1994, kurikulum 2004, dan standar isi. Dengan demikian soal UN hanya berisi topiktopik yang diajarkan pada ketiga kurikulum, dimana pada kurikulum 2004, kimia nuklir tidak diajarkan.
Adapun distribusi ke tujuh topik Kimia tersebut dalam naskah UN dapat dilihat pada gambar 2 berikut ini.
Dari keenam topik yang diujikan, topik kimia teori menjadi topik yang terbesar yakni 25,00% diikuti topik kimia analitik dan kimia fisika, kimia organik, kimia anorganik, dan biokimia. Urutan persentase topik pada soal UN hampir sama dengan urutan persentase pada kompetensi dasar mata pelajaran kimia dalam standar isi. Dengan demikian dari segi topik, soal-soal UN kimia tahun 2009 telah mencerminkan dan sesuai dengan tuntutan SKKD dalam kurikulum tingkat satuan pendidikan.
Gambar 2. Topik Kimia pada Soal UN 2009 Pada gambar di atas menunjukkan bahwa soal kimia pada UN tahun 2009 hanya terdapat enam topik sedangkan pada komptensi dasar terdapat tujuh topik. Topik yang tidak terdapat dalam soal UN kimia yaitu topik kimia nuklir, topik ini tidak diujikan karena soal UN kimia tahun 2009
Distribusi Soal Berdasarkan Kognitif dan Jenjang Kelas
Tingkatan
Menurut Badrun dkk (2009), dari ketujuh topik dalam kompetensi dasar hanya mencakup empat tingkatan kognitif yaitu pengetahuan, pemahaman, aplikasi, dan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
30
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
analisis. Sedangkan tingkatan kognitif sintesis dan penilaian tidak tercakup dalam kompetensi dasar kimia. Badrun dkk (2009) mengklasifikasikan tingkat kognitif tersebut
berdasarkan kata-kata kunci yang ditungkan dalam kompetensi dasar. Berikut tabel pemetaan topik kompetensi dasar kimia berdasarkan tingkatan kognitif.
Tabel 4. Tingkatan Kognitif dalam Kompetensi Dasar Kimia Tingkatan Kognitif
Kompetensi Dasar Kimia Analitik
Kimia Teori
Kimia Anorganik
Kimia Organik
Kimia Fisika
Kimia Nuklir
Biokimia
Pengetahuan
√
-
-
√
-
-
-
Pemahaman
√
√
√
√
√
√
√
Aplikasi
√
√
√
√
√
-
-
Analisis
√
√
√
-
√
-
-
Sintesis
-
-
-
-
-
-
-
Penilaian
-
-
-
-
-
Tingkatan kognitif pengetahuan terdapat pada topik kimia analitik dan kimia anorganik, tingkatan kognitif pemahaman terdapat pada semua topik kimia, tingkatan kognitif aplikasi terdapat pada topik kimia analitik, kimia teori, kimia anorganik, kimia organik, dan kimia fisika. Tingkatan kognitif analisis terdapat pada topik kimia analitik, kimia teori, kimia anorganik, dan kimia fisika. Sedangkan tingkatan kognitif sintesis dan
Sumber: Badrun dkk (2009)
penilaian tidak terdapat pada topik kimia SMA. Setali tiga uang dengan tingkatan kognitif pada kompetensi dasar, naskah kimia UN 2009 juga tidak mengujikan soal yang menguji tingkatan kognitif sintesis dan penilaian, soal-soal kimia hanya mengujikan tingkatan kognitif pemahaman, analisis, dan aplikasi seperti disajikan pada gambar 3 berikut ini.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
31
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
Gambar 3. Distribusi Soal Berdasarkan Tingkatan Kognitif Berbeda dengan kompetensi dasar yang memuat empat tingkatan kognitif yakni tingkatan kognitif pengetahuan, pemahaman, aplikasi, dan analisis, soal-soal UN kimia hanya teridiri dari tiga tingkatan kognitif yakni pemahaman, aplikasi, dan analisis. Ketiga tingkatan kognitif ini tersebar kedalam enam topik kimia. Satu butir soal biokimia mengukur tingkatan kognitif analisis, empat soal kimia anorganik mengukur pemahaman, dari tujuh soal kimia organik, dua butir soal merupakan soal aplikasi dan lima butir soal mengukur aspek pemahaman. Model soal
pemahaman pada topik kimia fisika dan kimia teori masing-masing sebanyak enam soal dan pada kimia analitik sebanyak tiga butir soal. Soal aplikasi masing-masing berjumlah satu butir untuk topik kimia analitik dan kimia teori, sedangkan untuk kimia fisika sebanyak dua butir soal. Soal yang mengukur tingkatan kognitif analisis berjumlah satu butir untuk kimia fisika, lima butir untuk kimia analitik, dan tiga butir untuk kimia teori. Sebaran tingkatan kognitif ini telah mencerminkan sebaran tingkat kognitif dalam kurikulum karena sifat UN sebagai tes prestasi artinya
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
32
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
menguji apa yang diajarkan dan dituntut kurikulum. Distribusi kompetensi dasar berdasarkan jenjang kelas dapat dilihat pada Gambar 4. Dari 41 kompetensi dasar mata pelajaran kimia SMA yang terdapat pada standar isi, persentase kompetensi dasar kimia tertinggi di kelas XI yakni 44% diikuti kelas XII yakni 32%, dan kelas X 24%. Gambar 5. Distribusi Soal Berdasarkan Jenjang Kelas Hal ini karena pemilihan soal UN Kimia didasarkan pada kisi-kisi UN 2009 yang telah mempertimbangkan urgensi, kontinuitas, relevansi, dan kontekstual materi yang tercermin pada SKL dan kemampuan yang diuji. Gambar 4. Distribusi Kompetensi Dasar Berdasarkan Jenjang Kelas Untuk soal UN kimia, 43% soal kimia disusun berdasarkan kompetensi dasar kelas XII, 40% kelas XI, dan sisanya 17% berdasarkan kompetensi dasar kelas X. Distribusi ini agak berbeda dengan distribusi kompetensi dasar.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
33
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
SIMPULAN DAN SARAN Simpulan Berdasarkan informasi yang diperoleh dari diskusi dan pembahasan, ada beberapa kesimpulan sebagai berikut. Materi yang tergambar dalam soal UN Kimia telah mencerminkan atau mewakili ruang lingkup mata pelajaran kimia yang tertuang dalam standar kompetensi dan kompetensi dasar yang bersumber Lampiran Peraturan Menteri Pendidikan Nasional Nomor 22 Tahun 2006 tentang Standar Isi untuk Satuan Pendidikan Dasar dan Menengah. Soal UN kimia tahun 2009 hanya terdapat enam topik yakni kimia analitik, kimia teori, kimia fisika, kimia organik, kimia anorganik, dan biokimia. Sedangkan pada komptensi dasar terdapat tujuh topik, topik yang tidak terdapat dalam soal UN kimia yaitu topik kimia nuklir, topik ini tidak muncul karena soal UN kimia tahun 2009 disusun berdasarkan interseksi kurikulum 1994, kurikulum 2004, dan kurikulum tingkat satuan pendidikan. Dengan demikian soal UN hanya
berisi topik-topik yang diajarkan pada ketiga kurikulum, dimana pada kurikulum 2004, kimia nuklir tidak diajarkan. Urutan persentase penyebaran topik pada soal UN hampir sama dengan urutan persentase penyebaran topik pada kompetensi dasar mata pelajaran kimia dalam standar isi. Dari aspek tingkatan kognitif, soal-soal UN kimia hanya teridiri dari tiga tingkatan kognitif yakni pemahaman, aplikasi, dan analisis. Ketiga tingkatan kognitif ini tersebar kedalam enam topik kimia. Sebaran tingkatan kognitif ini telah mencerminkan sebaran tingkat kognitif dalam kurikulum karena sifat UN sebagai tes prestasi artinya menguji apa yang diajarkan dan dituntut kurikulum. Dari segi jenjang kelas, materi kelas XII merupakan materi yang paling banyak diujikan dalam soal kimia diikuti kelas XI dan kelas X. Saran Standar kompetensi dan kompetensi dasar dalam standar isi perlu disempurnakan dengan memperkaya kompetensi dasar yang menuntut kemampuan tingkat kognitif sintesis dan evaluasi, dengan demikian soal
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
34
Karakteristik Soal UN Kimia SMA Tahun Pelajaran 2008/2009
UN Kimia juga dapat mengukur tingkat kognitif sintesis dan evaluasi.
PUSTAKA ACUAN Depdiknas, (2008). Peraturan Menteri Pendidikan Nasional No. 77 Tahun 2008 tentang UN SMA Tahun Pelajaran 2008/2009. Jakarta. Depdiknas, (2006): Peraturan Menteri Pendidikan Nasional No. 22 Tahun 2006 tentang Standar Isi untuk Satuan Pendidikan Dasar dan Menengah. Jakarta.
Furqon. (2004). Peranan evaluasi dalam meningkatkan mutu pendidikan. Makalah disampaikan dalam diskusi panel tanggal 31 Mei 2004 di UPI, Bandung. Pusat
Penilaian Pendidikan, Balitbang, Depdiknas, (2009): Hasil Ujian Nasional Tahun Pelajaran 2008/2009. Jakarta.
Supriyoko, Ki, (2004): Studi Aspirasi Masyarakat tentang Penyelenggaraan Ujian Nasional. Jogjakarta, LSPI. Badrun dkk. (2009): Analisis ujian nasional SMA tahun pelajaran 2008/2009. LPMP-Yogyakarta
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
35
PENYETARAAN (EQUATING) SKOR BIOLOGI SMA BERDASARKAN HASIL UJIAN NASIONAL TAHUN 2010/2011 Rumondang Purwati Peneliti di Pusat Penilaian Pendidikan, Kemdikbud E-mail:
[email protected] ABSTRACT National Exam (UN) 2011 is arranged in some parallel packages that assessed on three time zones (Western, Middle, and Eastern). To compare the scores obtained on different test packages, a process of equating scores is needed, using anchor (linking) item. The difficulty level of linking items is used to determine the difficulty level of test packages to arrange the conversion table. The conversion scores are used to compare the student ability. The aims of this study are to identify the characteristics of items linking, to compare the difficulty of tests packages, to make the conversion table, and to compare the scores before and after the equating process. Equating process is using data from all students responses on national exam (UN) 2011 of Biology in SMA.The data analysis is using Winstep program to determine the characteristics of item linking and the equating process is using fixed item parameter calibration. The lowest item linking difficulty level is on Eastern zone and the highest is on Western zone. For the nonlinking items, the lowest item difficulty is on the Western zone and the highest is on the Eastern zone. After the scores conversion, the SMA Biology scores on Westerns zone is higher than the scores on Middle zone to obtain the same scores from 0 to 3.89 and above 4.49. In the Middle zone for scores 3.89 – 4.49, Middle scores is higher than Westerns scores. In all scores, Western scores is higher than Eastern scores. The average scores in all of provinces has increased after equating process. The lowest average score after equating is achieved by Nusa Tenggara Timur (6.39) and the highest is Bali (8.90).
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
36
Keywords: equating, difficulty level, linking, conversion, and national exam
ABSTRAK Ujian Nasional (UN) 2011 disusun dalam beberapa paket tes yang paralel yang diujikan pada tiga zona waktu (Barat, Tengah, dan Timur). Agar skor antarpaket dapat dibandingkan, perlu dilakukan equating, yaitu proses penyetaraan paket tes dengan menggunakan soal-soal anchor (linking). Tingkat kesukaran soal-soal linking digunakan untuk menentukan tingkat kesukaran paket tes untuk membuat tabel konversi. Skor konversi dapat digunakan untuk membandingkan kemampuan siswa. Studi penyetaraan paket tes Biologi SMA pada UN 2011 bertujuan untuk mengidentifikasi karakteristik butir soal-soal linking antarpaket, membandingkan tingkat kesukaran paket-paket tes, membuat konversi skor, dan membandingkan rata-rata skor sebelum dan sesudah equating. Proses equating menggunakan data yang berasal dari semua jawaban siswa pada UN 2011 terhadap mata pelajaran Biologi SMA. Data tersebut dianalisis dengan menggunakan program winstep untuk mengetahui karakteristik soal lingking dan nonlinking dan selanjutnya dilakukan proses equating dengan menggunakan fixed item parameter calibration. Rata-rata tingkat kesukaran soal-soal linking Biologi terendah di zona Timur dan tertinggi di zona Barat. Soal-soal nonlinking Biologi memiliki tingkat kesukaran rata-rata terendah di zona Barat dan tertinggi di zona Timur. Setelah dikonversi, skor Biologi SMA zona Barat lebih tinggi daripada di zona Tengah untuk memperoleh nilai yang sama dari 0 hingga 3.89 dan di atas 4.49. Pada skor zona Tengah 3.89 – 4.49, skor zona Tengah lebih tinggi daripada skor Barat. Pada semua skor, skor Barat lebih tinggi daripada skor Timur. Di semua provinsi, skor rata-rata ujian nasional Biologi murni mengalami kenaikan setelah dikonversikan. Skor rata-rata setelah equating yang terendah dicapai oleh Nusa Tenggara Timur (6.39) dan yang tertinggi Bali (8.90). Kata kunci: penyetaraan, tingkat kesukaran, linking, konversi, dan ujian nasional
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
37
PENDAHULUAN Undang Undang Republik Indonesia nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional bab XVI pasal 57 sampai dengan 59 tentang evaluasi menyatakan bahwa dalam rangka pengendalian mutu pendidikan secara nasional dilakukan evaluasi sebagai bentuk akuntabilitas penyelenggara pendidikan kepada pihak-pihak yang berkepentingan. Evaluasi pendidikan dilaksanakan oleh guru, sekolah, dan pemerintah. Evaluasi yang dilakukan pemerintah disebut Ujian Nasional (UN) yang berfungsi untuk mengukur sejauh mana program pendidikan telah tercapai sesuai dengan tuntutan kurikulum yang berlaku. Soal-soal ujian nasional pada tahun 2011 disusun dalam beberapa paket yang berbeda yang diujikan di tiga zona waktu (Barat, Tengah, dan Timur. Semua paket tes UN ini disusun berdasarkan kisi-kisi yang sama untuk memperoleh paket-paket tes yang paralel dengan asumsi semua paket tes akan mengukur kompetensi yang sama.
Dengan demikian, setiap siswa yang memiliki kemampuan yang sama akan memperoleh skor atau nilai yang sama, walaupun menempuh paket tes yang berbeda. Pada kenyataannya, selalu ditemukan perbedaan tingkat kesukaran pada beberapa paket tes yang dianggap paralel. Dengan adanya perbedaan tingkat kesukaran ini, akan dihasilkan skor yang berbeda dari dua orang siswa yang kemampuannya sama. Tes yang seperti ini tidak adil karena siswa yang menempuh tes yang lebih mudah akan diuntungkan, sedangkan siswa yang menempuh tes yang lebih sulit akan dirugikan. Untuk mengatasi hal tersebut, perlu dilakukan penyetaraan hasil tes dari beberapa paket tes yang paralel. Dalam proses penyetaraan ini, hasil tes (skor) dari semua paket tes diskalakan ke dalam satu skala yang sama. Selain itu, skor dari suatu paket tes harus ditransformasi atau diubah ke dalam skala skor paket tes yang lain yang dijadikan paket tes referensi (acuan). Proses
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
38
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
transformasi skor ini equating (penyetaraan).
disebut
sebagai
untuk membandingkan kemampuan siswa antarpaket tes.
Salah satu cara yang dapat dilakukan pada proses penyetaraan paket tes ini adalah dengan menggunakan soal-soal yang sama persis yang diletakkan di semua paket tes. Soal-soal yang sama persis ini disebut sebagai soal anchor (linking). Diharapkan siswa-siswa yang memiliki kemampuan sama akan memperoleh skor yang sama ketika menjawab soal-soal linking ini. Perbedaan kemampuan siswa yang mengerjakan paket tes yang berbeda tercermin dari perbedaan kemampuan siswa-siswa tersebut dalam menjawab soal-soal anchor (linking). Perbedaan tingkat kesukaran paket tes akan diperkirakan berdasarkan perbedaan tingkat kesukaran soal-soal linking. Setelah itu, akan dihasilkan konversi skor untuk semua paket tes. Dengan menggunakan tabel konversi skor, skor siswa yang mengerjakan paket tes paralel tertentu kemudian dikonversikan terhadap skor pada paket tes referensi. Skor hasil konversi inilah yang dapat digunakan
Masalah yang ditemukan dari latar belakang di atas adalah (1) bagaimanakah karakteristik soal-soal anchor (linking) yang digunakan pada mata pelajaran Biologi SMA dalam UN 2011, (2) bagaimanakah perbandingan tingkat kesukaran paket-paket tes Biologi SMA dalam UN 2011, (3) bagaimanakah konversi skor menjawab benar (skor mentah) suatu paket tes Biologi SMA relatif terhadap skor mentah paket tes referensi, dan (4) bagaimanakah rata-rata nilai Biologi SMA di suatu wilayah setelah dilakukan konversi nilai? Studi penyetaraan paket tes Biologi SMA pada UN 2011 bertujuan untuk: (1) mengidentifikasi karakteristik butir soal-soal anchor (linking) antarpaket, (2) membandingkan tingkat kesukaran paketpaket tes, (3) membuat konversi skor satu paket tes paralel terhadap skor paket tes referensi, (4) membandingkan rat-rata nilai di suatu wilayah sebelum dan sesudah dilakukan proses equating.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
39
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
KAJIAN LITERATUR Desain Tes dengan Soal Anchor (Linking) Pada desain tes dengan soal anchor (linking), paket tes yang berbeda (misalnya, paket tes A dan paket tes B) diberikan kepada kelompok peserta yang berbeda, katakanlah kelompok 1 dan kelompok 2. Untuk menyetarakan skor dari beberapa paket tes yang berbeda ini, digunakan soal yang sama persis. Soal-soal yang sama di beberapa paket tes yang berbeda disebut common items (soal anchor-linking). Soal-soal linking mempresentasikan spesifikasi tes secara keseluruhan. Hambleton, Swaminathan, dan Rogers (1991) menyatakan bahwa pada desain tes dengan soal anchor (linking) peserta tes tidak perlu mengerjakan semua paket tes yang dapat menyebabkan waktu terlalu panjang dan timbulnya efek lelah. Dengan desain ini, tidak perlu membentuk kelompok peserta tes yang ekivalen karena di dalam praktiknya sangat sulit. Desain tes dengan menggunakan soal linking memungkinkan pengendalian jumlah serta frekuensi penggunaan butir soal.
Kalibrasi Butir Soal dengan Model Rasch Model Rasch merupakan teori analisis modern yang membentuk pemodelan dari peluang seseorang menjawab benar suatu soal. Dalam model Rasch dikenal beberapa parameter, di antaranya tingkat kesukaran soal, daya pembeda soal, dan faktor menebak soal. Model Rasch dengan satu parameter hanya memperhitungkan tingkat kesukaran soal sebagai parameter pembeda fungsi probabilitas butir soal. Peluang seseorang dapat menjawab benar suatu soal bergantung kepada tingkat kesukaran soal dan kemampuan orang tersebut. Hasil analisis dengan model Rasch berupa tabel konversi skor mentah ke kemampuan atau skor benar (true score) dalam skala -4 sampai +4. Dalam model Rasch semua peserta yang mendapatkan skor mentah sama maka estimasi skor benar (true score) akan sama. Artinya, jika jumlah soal yang dijawab benar sama, meskipun berasal dari nomor soal yang berbeda-beda, dianggap memiliki kemampuan (skor benar) sama.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
40
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Gambar 1 menunjukkan model Rasch tiga butir soal yang berbeda tingkat kesukarannya. Gambar 1. Kurva karakteristik tiga butir soal yang berbeda tingkat kesukaran dengan model Rasch.
probability correctly answer
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
-4
-3
-2
-1
0
1
2
3
4
theta scale
Saat melakukan kalibrasi dengan model Rasch akan dihasilkan karakteristik soal dalam bentuk klasik seperti proportion correct, item tes correlation (item discrimination), serta statistik pilihan jawaban. Namun, hasil utama dari model Rasch adalah measure butir soal atau disebut sebagai tingkat kesukaran soal
dalam skala -4 sampai +4. Pada model Rasch juga dihasilkan statistik item fit yang menunjukkan tingkat kecocokan data respon dengan model yang telah ditentukan. Statistik item fit dapat membantu kita menelaah kembali soal atau mendeteksi kesalahan dalam proses kalibrasi.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
41
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Kalibrasi dengan Parameter Butir Soal Ditentukan Salah satu metode penyetaraan adalah mengkalibrasi suatu paket tes dengan menentukan nilai parameter butir soal anchor sama dengan nilai parameter butir soal anchor di paket tes referensi. Diasumsikan bahwa parameter butir soal-soal anchor adalah konstan untuk semua paket tes. Diagram Test Characteristic Curve (TCC) untuk menentukan konversi skor Jika parameter butir soal telah diskalakan dalam skala yang sama melalui kalibrasi dengan parameter butir soal anchor ditentukan (fixed anchor item parameter calibration), selanjutnya dapat dilakukan proses equating. Jika equating yang digunakan adalah true score equating, prosedurnya akan sama tanpa memedulikan metode scaling yang digunakan. Langkah true score equating ini dilakukan hanya jika nilai theta tidak digunakan sebagai skor peserta tes.
Beberapa alasan nilai theta tidak digunakan sebagai skor siswa adalah 1) dengan menggunakan scoring pola, jumlah jawaban benar yang sama dapat menghasilkan nilai theta yang berbeda tergantung dari pola jawaban benarnya, hal ini sulit diterapkan pada tes yang bertujuan untuk penempatan, dan 2) untuk skor ekstrim (misal, skor yang sangat tinggi ataupun sangat rendah), kesalahan pengukuran seringkali menjadi lebih tinggi dibandingkan skor rentang tengah. Oleh karena itu, seringkali diperlukan tahapan equating true score. Equating true score meliputi tiga proses: 1) TCC dari paket tes A diplot sehingga terbentuk kurva yang menghubungkan estimasi theta dengan jumlah skor benar, 2) TCC untuk paket tes B juga diplot pada skala yang sama dengan paket tes A, kemudian dibuat tabel konversi yang menggunakan nilai estimasi theta sebagai anchor antara paket tes A dan paket tes B, 3) untuk setiap skor pada paket tes B, dihitung skor paket tes A dengan mencocokkan nilai thetanya. Proses ini
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
42
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
terlihat mudah untuk dijelaskan, namun sulit untuk dilakukan dan memerlukan proses iterasi. Proses ini dijelaskan secara mendetail dalam Kolen dan Brennan (2004). Gambar 2 menyajikan TCC (kurva karakteristik tes) untuk paket tes A dan B. Sementara itu, tabel 1 menyajikan tabel konversi true score (dan juga scaled score) yang dijelaskan oleh Kolen dan Brennan (2004).
Gambar 2. Kurva Karakteristik Tes untuk Paket A dan Paket B
Tabel 1. Tabel Konversi True Score dan Scaled Score Paket A 0.0 0.9 1.8 2.7 3.7 4.6 5.6 6.5 7.5 8.5 9.5 10.6 11.7 12.8 14.0
Theta
Paket B (skala skor Paket A yang dikonversikan)
Skala Skor
----4.0 -2.3 -1.8 -1.4 -1.1 -0.8 -0.5 -0.2 0.2 0.6 1.2 --
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
104 109 113 117 122 126 130 135 139 143 148 152 157 161 165
Pada prakteknya true score tidaklah benar-benar digunakan untuk mengubah skor, teori equating true score diaplikasikan untuk skor terobservasi. Namun demikian, Wingersky dan Lord (1984) melalui studi simulasi menemukan bahwa pada desain
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
43
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
equating NEAT akan diperoleh tabel konversi yang sama baik menggunakan true score ataupun observed score. Bertentangan dengan temuan ini, Kolen (1981) dan Han, Kolen, serta Pohlmann (1997) menemukan bahwa pada desain kelompok random, terdapat perbedaan antara penggunaan observed score dengan true score. Kelebihan menggunakan true score equating adalah kemudahan dalam hal komputasi dibandingkan metode lainnya. Selain itu konversi skor tidak bergantung pada distribusi kemampuan peserta tes (salah satu sifat dari observed score equating). Kelemahan true score equating adalah dalam prakteknya, tidak ada true score dan jika menggunakan model 3-parameter, ekivalen true score tidak diketahui untuk nilai di bawah total jumlah parameter-c serta untuk nilai sempurna. Skor jawaban benar juga jarang digunakan pada kehidupan nyata. Biasanya dilakukan transformasi skor lanjutan sampai dihasilkan skor baru untuk pelaporan hasil tes. Transformasi ini merupakan scaling tahap
pasca equating yang mengonversi skor jawaban benar ke dalam skor skala baru. Konversi Skor dan Penskalaan Scaled scores lebih sering dilaporkan dibandingkan true score, hal ini terjadi untuk menghindari kebingungan publik akan cara menginterpretasi skor. Seringkali skor pelaporan diasosiakan sebagai persentase menjawab benar soal-soal dalam tes (misal, skala nilai 0-100). Dalam UN digunakan skala skor 0-10 yang juga merupakan konversi dari persentase menjawab benar soal relatif terhadap jumlah soal keseluruhan dalam setiap paket tes. Namun dapat pula melakukan konversi true score menjadi skor dalam skala baru dengan cara menetapkan nilai rata-rata dan standar deviasi dari skala yang baru yang akan digunakan untuk kepentingan pelaporan. Cara yang paling mudah melakukan konversi ini adalah transformasi linear. Pada transformasi linear, skor mentah (A) ditransformasi menjadi scaled scores
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
44
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
dengan mengetahui nilai rata-rata dan standar deviasi dari skor mentah sampel peserta tes. Pada contoh ini, nilai rata-rata skor mentah adalah 10,5 dan standar deviasi 2,3. Kemudian harus ditentukan nilai ratarata scaled score dan standar deviasinya. Jika nilainya ditetapkan sebagai 150 dan 10, persamaan berikut merumuskan transformasi raw score menjadi scaled score, hasil transformasi dapat dilihat pada tabel 1.
METODE PENELITIAN Data Data berasal dari semua jawaban siswa pada UN 2011 terhadap mata pelajaran Biologi SMA. Pada mata pelajaran Biologi SMA jumlah soal yang diujikan sebanyak 40 soal. Paket tes Biologi di zona Barat adalah Paket 2, di zona Tengah Paket 5, dan di zona Timur Paket 4. Jumlah soal linking adalah 5 soal yang berada pada nomor 10, 17, 23, 28, dan 39. Provinsi yang termasuk zona Barat: Sumatera Utara, Aceh, Sumatera Barat, Kepulauan Riau, Bangka Belitung, Bengkulu,
Jambi, Riau, DKI Jakarta, Jawa Tengah, Jawa Timur, DI Yogyakarta, Banten, Jawa Barat, Lampung, Kalimantan Tengah, Kalimantan Barat, Sumatera Selatan. Provinsi yang termasuk zona Tengah: Gorontalo, Sulawesi Utara, Sulawesi Selatan, Sulawesi Tenggara, Kalimantan Timur, Bali, Sulawesi Barat, Kalimantan Selatan, Nusa Tenggara Barat, Nusa Tenggara Timur, Sulawesi Tengah. Provinsi yang termasuk zona Timur: Maluku Utara, Maluku, Papua, Papua Barat, paket soal Luar negeri. Teknik Analisis Studi penyetaraan paket UN 2011 dilakukan dalam beberapa tahapan. Tahapan pertama adalah analisis butir soal dengan menggunakan software Rasch model, yaitu Winstep. Setelah parameter butir soal dari masing-masing tes diketahui, kemudian dianalisis statistik deskriptif masing-masing tes berdasarkan tipe linking atau nonlinking. Perbandingan karakter soal linking juga disajikan dalam bentuk scatter plot item parameter. Kemudian dilakukan proses
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
45
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
equating dengan menggunakan fixed item parameter calibration (kalibrasi dengan parameter butir soal linking telah ditentukan). Hasil kalibrasi kedua dijadikan acuan untuk membuat test characteristic curve (TCC) paket tes yang akan disetarakan. Plot TCC paket yang akan disetarakan kemudian disandingkan dengan plot TCC paket referensi atau paket acuan. Berdasarkan hasil plot kedua paket tes tersebut dibuatlah tabel konversi dari raw score (skor mentah) suatu paket terhadap raw score (skor mentah) paket tes lainnya. Tabel konversi raw score to raw score kemudian dijadikan acuan untuk melakukan konversi skor Biologi peserta UN 2011 di zona Tengah dan zona Timur. Skor konversi kemudian diskalakan ke dalam skala nilai 0 sampai 10.
HASIL DAN BAHASAN Perbandingan tingkat kesukaran soalsoal linking, soal-soal nonlinking, dan paket tes Soal-soal linking sebanyak lima soal berada pada nomor-nomor soal yang sama di setiap zona. Karena kelima soal linking ini sama persis di semua zona, seharusnya siswasiswa yang memiliki kemampuan sama di semua zona akan mendapatkan skor yang sama. Akan tetapi, pada kenyataannya setelah dilakukan analisis terhadap tingkat kesukaran soal-soal linking di setiap zona diperoleh hasil bahwa tingkat kesukaran soalsoal linking di setiap zona tidak sama. Banyak faktor yang mempengaruhi hal ini, misalnya kemampuan siswa yang berbeda dan pengadministrasian tes yang mungkin tidak standar. Pada tabel 2 dapat dilihat bahwa ratarata tingkat kesukaran soal-soal linking Biologi yang terendah adalah di zona Timur. Siswa-siswa di zona Timur memiliki kemampuan Biologi yang lebih tinggi dibandingkan dengan siswa-siswa di zona
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
46
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Tabel 2. Tingkat Kesukaran Soal-soal Biologi Biologi link nonlink
Barat
Tengah
Timur
Mean
-.1140
-.1480
-.1880
Std. Dev
.67263
.43026
.40776
Mean
.0163
.0214
.0271
.87731
.99067
.95859
Std. Dev
Soal-soal nonlinking Biologi memiliki tingkat kesukaran rata-rata yang terendah di zona Barat dan yang tertinggi di zona Timur, namun perbedaannya tidak terlalu nyata. Soal-soal Biologi linking dan nonlinking memiliki tingkat kesukaran rata-rata sedang pada semua zona.
Gambar 3. Kurva Karakteristik Tes Biologi
Skor
Barat dan Tengah bila diukur dengan soalsoal linking. Tingkat kesukaran rata-rata soalsoal linking Biologi yang tertinggi adalah di zona Barat. Hal ini menunjukkan bahwa kemampuan yang dimiliki oleh siswa-siswa di zona Barat lebih rendah dibandingkan dengan kemampuan Biologi siswa-siswa di zona Tengah dan Timur.
Kemampuan siswa
Pada kurva karakteristik tes Biologi dapat dilihat bahwa kurva karakteristik tes pada masing-masing zona hampir berimpit yang berarti dengan kemampuan yang relatif sama akan diperoleh skor yang hampir sama di semua zona. Dikatakan hampir sama karena selisihnya hanya kecil. Antara zona Barat dan Tengah, dari kemampuan -4.0 hingga -0.5 dan dari kemampuan -0.1 hingga 3.3 siswa-siswa di zona Barat memperoleh skor yang lebih tinggi daripada siswa-siswa di zona Tengah. Antara kemampuan -0.4 hingga -0.2, siswa-siswa di zona Barat dan Tengah memperoleh skor yang sama. Pada kemampuan di atas -3.4 siswa-siswa di zona Tengah memperoleh skor
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
47
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
yang sedikit lebih tinggi daripada siswa-siswa di zona Barat. Pada kemampuan -4.0 hingga 2.0 siswa-siswa di zona Tengah memperoleh skor yang relatif lebih tinggi daripada skor yang diperoleh oleh siswa-siswa di zona Timur dengan kemampuan yang sama. Di atas kemampuan 2.0, siswa-siswa di zona Timur mendapatkan skor yang sedikit lebih tinggi daripada siswa-siswa di zona Tengah. Karena selisih skornya sangat kecil, dapat dikatakan bahwa pada kemampuan di atas 2.0, siswasiswa di zona Tengah dan Timur memperoleh skor yang relatif sama, pada gambar terlihat kurva keduanya berimpit. Antara zona Barat dan Timur, siswasiswa di zona Barat memperoleh skor yang lebih tinggi daripada siswa-siswa di zona Timur pada kemampuan yang sama antara 4.0 hingga 3.4. Di atas kemampuan 3.4, siswa-siswa di zona Timur memperoleh skor yang sedikit lebih tinggi daripada siswa-siswa di zona Barat.
Identifikasi karakteristik soal-soal linking Posisi soal-soal linking antarzona (Barat - Tengah dan Barat - Timur) digambarkan melalui scatter plot tingkat kesukaran pada masing-masing nomor soal linking. Gambar 4. Scatter Plot Butir Soal Biologi SMA
Pada gambar scatter plot soal-soal linking Biologi tampak penyebaran soal-soal linking berada paling dekat dengan garis regresi pada zona antara Barat dan Tengah. Antara Barat-Timur dan Timur-Tengah, posisi soal-soal linking menyebar jauh dari garis regresi. Berdasarkan tingkat kesukaran soalsoal linking, urutan nomor soal-soal linking
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
48
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
dari yang termudah hingga yang tersulit di zona Barat adalah 10 (-0.73), 17 (-0.7), 28 (0.34), 39 (0.51), dan 23 (0.69). Di zona Tengah, urutan soal-soal linking berdasarkan tingkat kesukarannya dari yang termudah hingga yang tersulit adalah 10 (-0.59), 17 (0.51), 28 (-0.19), 39 (0.11), dan 23 (0.44). Di zona Timur, urutan soal-soal linking berdasarkan tingkat kesukarannya dari yang termudah hingga yang tersulit adalah 17 (0.8), 23 (-0.39), 28 (-0.04), 10 (0.09), dan 39 (0.2). Di zona Barat dan tengah, urutan nomor soal berdasarkan tingkat kesukarannya adalah sama. Antara zona Barat dan Tengah, soalsoal linking nomor 10, 17, dan 28 memiliki tingkat kesukaran yang lebih rendah di zona Barat daripada di zona Tengah, sedangkan soal-soal linking nomor 23 dan 39 memiliki tingkat kesukaran yang lebih rendah di zona Tengah daripada di zona Barat. Perbedaan tingkat kesukaran soal-soal linking antara zona Barat dan zona Tengah yang tertinggi adalah 0.4 pada soal nomor 39 dan
perbedaan yang terendah sebesar 0.14 pada soal nomor 10. Antara zona Tengah dan Timur, siswasiswa di zona Tengah memiliki kemampuan Biologi yang lebih tinggi daripada siswa-siswa di zona Timur ketika menjawab soal-soal nomor 10, 28, dan 39, tetapi siswa-siswa di zona Tengah memiliki kemampuan yang lebih rendah daripada siswa-siswa di zona Timur ketika menjawab soal-soal linking nomor 17 dan 23. Perbedaan tingkat kesukaran soalsoal linking antara zona Tengah dan Timur yang tertinggi adalah 0.83 pada soal nomor 23 dan perbedaan tingkat kesukaran yang terendah adalah 0.15 pada soal nomor 28. Antara zona Barat dan Timur, soal-soal linking nomor 10 dan 28 memiliki tingkat kesukaran yang lebih rendah pada zona Barat daripada zona Timur, sebaliknya soal-soal linking nomor 17, 23, dan 39 memiliki tingkat kesukaran yang lebih rendah di zona Timur daripada di zona Barat. Perbnedaan tingkat kesukaran soal-soal linking antara zona Barat dan Timur yang tertinggi adalah sebesar 1.08 pada soal nomor 23 dan yang terendah adalah sebesar 0.1 pada soal nomor 17.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
49
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Tabel Konversi Berdasarkan hasil analisis terhadap soal-soal linking, skor siswa pada masingmasing zona diletakkan pada skala yang sama dengan referensi zona Barat dengan alasan jumlah provinsi yang terdapat di zona Barat paling banyak dibandingkan dengan jumlah provinsi di zona Tengah dan Timur. Apabila soal-soal linking lebih mudah di suatu zona, nilai siswa di zona tersebut akan lebih kecil daripada skor awal (skor mentah), tetapi bila soal-soal linking termasuk lebih sulit pada suatu zona nilai siswa akan lebih tinggi setelah dikonversikan. Pada uraian berikut akan digunakan istilah skor dan nilai. Skor adalah skor mentah yang diperoleh siswa dari jumlah jawaban benar. Secara umum, skor merupakan bilangan bulat, seperti 1, 2, 3, 4, dan seterusnya. Nilai adalah angka yang diperoleh siswa setelah skor dikonversikan atau diubah ke dalam skala yang digunakan. Pada penilaian ujian nasional digunakan skala 0 – 10 sehingga seorang siswa yang mempunyai skor 10 dari 40 soal secara konvensional akan memperoleh nilai 10/40 x 10 = 2.5.
Pada tabel konversi yang akan disajikan pada bagian berikut, skor merupakan skor dari seorang siswa di mana tabel konversi tersebut digunakan, misalnya tabel konversi untuk zona Tengah, berarti skor adalah jumlah jawaban benar seorang siswa di zona Tengah. Pada kolom kedua terdapat nilai dari seorang siswa dengan skor tersebut dan pada kolom ketiga tertulis skor Barat yang menunjukkan skor dari zona Barat yang setara dengan nilai pada zona yang dikonversi. Pada umumnya skor Barat tidak berupa bilangan bulat. Jumlah soal yang terdapat pada paket tes Biologi adalah 40. Skor terendah adalah 0 dan skor tertinggi 40. Skala nilai yang digunakan adalah 0 – 10, yang berarti nilai terendah 0 dan nilai maksimal 10. Pada tabel konversi Biologi zona Tengah terdapat skor untuk zona Tengah yang bergerak dari 0 hingga 40 (sesuai dengan jumlah soalnya). Siswa yang memperoleh skor 1 di zona Tengah akan memperoleh nilai 0.38. Nilai 0.38 ini setara atau sama dengan nilai yang akan diperoleh oleh seorang siswa di zona Barat dengan skor
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
50
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
1.50. Siswa yang memperoleh skor 2 di zona Tengah akan mendapat nilai 0.60 yang setara dengan skor 2.41 di zona Barat, dan seterusnya. Untuk tabel konversi Biologi zona Tengah, skor Barat lebih tinggi daripada skor Tengah untuk memperoleh nilai yang sama dari 0 hingga 3.89 dan di atas 4.49. Pada nilai
zona Tengah 3.89 – 4.49, skor Tengah lebih tinggi daripada skor Barat. Untuk tabel konversi Biologi zona Timur, pada semua nilai yang sama antara zona Barat dan zona Timur, skor Barat lebih tinggi daripada skor Timur.
Tabel 3. Tabel Konversi Biologi Zona Tengah dan Timur Skor 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nilai_Tengah 0.00 0.38 0.60 0.86 1.09 1.37 1.53 1.89 2.10 2.31 2.55 2.79 3.05 3.32 3.60 3.89 3.89
Skor_Barat
Skor
Nilai_Timur
Skor_Barat
0.00 1.50 2.41 3.45 4.36 5.47 6.11 7.56 8.38 9.25 10.18 11.16 12.20 13.28 14.40 15.56 15.56
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0.00 0.38 0.68 0.97 1.22 1.37 1.70 1.89 2.10 2.31 2.55 2.79 3.05 3.32 3.60 3.89 4.19
0.00 1.50 2.71 3.88 4.89 5.47 6.81 7.56 8.38 9.25 10.18 11.16 12.20 13.28 14.40 15.56 16.74
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
51
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Skor 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Nilai_Tengah 4.19 4.49 4.79 5.10 5.40 5.40 5.70 6.00 6.28 6.56 6.83 7.09 7.33 7.56 7.78 8.18 8.36 8.68 8.95 9.17 9.43 9.61 9.79 9.92
Skor_Barat
Skor
Nilai_Timur
Skor_Barat
16.74 17.95 19.17 20.38 21.60 21.60 22.80 23.98 25.13 26.24 27.31 28.34 29.32 30.25 31.13 32.72 33.43 34.71 35.78 36.67 37.71 38.43 39.16 39.66
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
4.49 4.49 4.79 5.10 5.40 5.70 6.00 6.28 6.28 6.56 6.83 7.09 7.33 7.78 7.99 8.18 8.53 8.68 8.95 9.17 9.43 9.61 9.79 9.92
17.95 17.95 19.17 20.38 21.60 22.80 23.98 25.13 25.13 26.24 27.31 28.34 29.32 31.13 31.95 32.72 34.10 34.71 35.78 36.67 37.71 38.43 39.16 39.66
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
52
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Perbandingan nilai Ujian Nasional murni dengan nilai ujian nasional setelah equating Nilai siswa setelah disetarakan (diequating) dapat dibandingkan karena nilai tersebut berada pada skala yang sama. Misalnya, nilai 5.0 di zona Barat sama dengan nilai 5.0 di zona Tengah maupun Timur yang berarti siswa-siswa yang memperoleh nilai 5.0 di semua zona diasumsikan memiliki kemampuan yang sama. Pada bagian berikut akan dibandingkan nilai rata-rata Bilogi SMA yang dicapai oleh siswa-siswa di 15 provinsi, yaitu provinsi yang berada di zona Tengah dan zona Timur. Provinsi-provinsi yang berada di zona Barat tidak dimasukkan dalam perbandingan ini karena zona Barat merupakan zona referensi (acuan) sehingga nilai di zona tersebut tidak mengalami perubahan (tidak dilakukan equating). Nilai hasil equating memiliki beberapa kemungkinan, yaitu naik, turun, atau tetap.
Hal ini dapat dilihat dari kurva karakteristik tes di masing-masing zona. Karena zona Barat sebagai referensi, kurva karakteristik tes dari setiap zona dibandingkan dengan zona Barat. Bila kurva karakteristik tes suatu zona berada di atas kurva zona Barat, berarti siswa-siswa di zona tersebut memperoleh skor lebih rendah daripada siswa-siswa di zona Barat dengan kemampuan yang sama. Dalam hal ini, skor siswa di zona tersebut akan naik mengikuti skor zona Barat apabila dilakukan konversi skor. Demikian juga sebaliknya, bila dibandingkan dengan zona Barat, kurva karakteristik tes dari zona tertentu berada di atas kurva karakteristik tes zona Barat yang berarti dengan kemampuan yang sama siswasiswa pada zona tersebut memperoleh skor yang lebih tinggi daripada siswa-siswa di zona Barat. Dalam hal ini, setelah dilakukan proses konversi, skor siswa pada zona tersebut akan lebih rendah mengikuti skor siswa pada zona Barat.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
53
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Gambar 5. Perbandingan Nilai UN Murni dan Setelah Equating Biologi
Di semua provinsi, nilai rata-rata ujian nasional Biologi murni mengalami kenaikan setelah dikonversikan, walaupun kenaikannya relatif kecil antara 0.07 hingga 0.17. Kenaikan 0.07 terjadi di provinsi Nusa Tenggara Timur
dan kenaikan 0.17 terjadi di provinsi Papua Barat dan Papua. Provinsi yang mencapai nilai rata-rata ujian nasional setelah equating di atas 8 hanyalah Bali, yaitu 8.90 dan ini merupakan nilai tertinggi. Tidak ada provinsi
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
54
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
yang memperoleh nilai rata-rata di bawah 6. Nilai rata-rata setelah equating yang terendah dicapai oleh Nusa Tenggara Timur, yaitu 6.39. Perbandingan nilai rata-rata ujian nasional di semua provinsi Pada tabel 2 tercantum nilai rata-rata ujian nasional Biologi SMA sebelum dan
sesudah konversi (equating). Karena zona yang merupakan referensi adalah zona Barat, nilai rata-rata ujian nasional di provinsiprovinsi yang termasuk zona Barat tidak mengalami perubahan, nilai rata-rata sebelum dan setelah equating adalah sama. Bila nilai rata-rata di zona Barat mengalami perubahan, perubahan ini terjadi karena adanya pembulatan dan sangat kecil sehingga bisa diabaikan.
Tabel 4. Perbandingan nilai rata-rata ujian nasional Biologi SMA NO
PROPINSI
PESERTA
SEBELUM EQUATING
SETELAH EQUATING
1
Dki jakarta
22,556
7.38
7.41
2
Jawa barat
87,740
8.24
8.25
3
Jawa tengah
62,246
7.70
7.72
4
Di yogyakarta
8,441
6.84
6.86
5
Jawa timur
86,377
8.03
8.04
6
Aceh
32,577
7.29
7.32
7
Sumatera utara
62,331
8.21
8.23
8
Sumatera barat
17,694
6.68
6.71
9
Riau
17,770
8.31
8.32
10
Jambi
9,101
8.35
8.36
11
Sumatera selatan
24,905
7.81
7.83
12
Lampung
18,444
8.04
8.05
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
55
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
PESERTA
SEBELUM EQUATING
SETELAH EQUATING
Kalimantan barat
6,935
6.84
6.87
14
Kalimantan tengah
5,337
6.60
6.63
15
Kalimantan selatan
7,434
7.62
7.73
16
Kalimantan timur
8,921
7.03
7.11
17
Sulawesi utara
6,486
7.86
7.97
18
Sulawesi tengah
8,102
7.06
7.15
19
Sulawesi selatan
32,088
7.68
7.79
20
Sulawesi tenggara
10,647
7.46
7.56
21
Maluku
7,185
7.74
7.90
22
Bali
11,853
8.77
8.90
23
Nusa tenggara barat
14,661
7.40
7.50
24
Nusa tenggara timur
8,102
6.32
6.39
25
Papua
5,073
7.21
7.38
26
Bengkulu
5,708
8.30
8.31
27
Maluku utara
5,713
7.01
7.17
28
Bangka belitung
2,155
6.74
6.76
29
Gorontalo
2,556
7.77
7.89
30
Banten
21,958
7.19
7.21
31
Kepulauan riau
2,898
6.83
6.86
32
Sulawesi barat
2,805
7.57
7.68
33
Papua barat
2,142
7.49
7.66
NO
PROPINSI
13
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
56
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
Pada pelajaran Biologi, nilai rata-rata sebelum equating yang terendah diperoleh oleh NTT (6.32), Kalimantan Tengah (6.60), dan Sumatera Barat (6.68), sedangkan nilai rata-rata Biologi tertinggi dicapai oleh Riau (8.31), Jambi (8.35), dan Bali (8.77). Posisi provinsi berdasarkan nilai rata-rata setelah equating tidaklah berubah, namun nilai ratarata Biologi NTT mengalami sedikit kenaikan menjadi 6.39 dan Bali pun mengalami kenaikan menjadi 8.90.
SIMPULAN DAN SARAN Simpulan Rata-rata tingkat kesukaran soal-soal linking Biologi terendah di zona Timur dan tertinggi di zona Barat. Soal-soal nonlinking Biologi memiliki tingkat kesukaran rata-rata terendah di zona Barat dan tertinggi di zona Timur. Soal-soal linking nomor 10, 17, dan 28 lebih mudah di zona Barat daripada di zona Tengah, nomor 23 dan 39 lebih mudah di zona Tengah daripada di zona Barat. Soal-soal linking nomor 10, 28, dan 39 lebih mudah di zona Tengah daripada di zona Timur, nomor
17 dan 23 lebih mudah di zona Timur daripada di zona Tengah. Soal-soal linking nomor 10 dan 28 lebih mudah di zona Barat daripada zona Timur, sebaliknya soal-soal linking nomor 17, 23, dan 39 lebih mudah di zona Timur daripada di zona Barat. Untuk tabel konversi Biologi, skor Barat lebih tinggi daripada skor Tengah untuk memperoleh nilai yang sama dari 0 hingga 3.89 dan di atas 4.49. Pada nilai Tengah 3.89 – 4.49, skor Tengah lebih tinggi daripada skor Barat. Pada semua nilai, skor Barat lebih tinggi daripada skor Timur. Di semua provinsi, nilai rata-rata ujian nasional Biologi murni mengalami kenaikan setelah dikonversikan. Nilai rata-rata setelah equating yang terendah dicapai oleh Nusa Tenggara Timur (6.39) dan yang tertinggi Bali (8.90). Saran 1. Proses equating sebaiknya dilakukan pada ujian nasional sehingga diperoleh nilai yang setara di semua provinsi.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
57
Penyetaraan (Equating) Skor Biologi SMA Berdasarkan Hasil Ujian Nasional Tahun 2010/2011
2. Melalui equating akan diperoleh tabel konversi. Sosialisasi penerapan tabel konversi perlu dilakukan oleh dinas pendidikan di seluruh provinsi sebelum pelaksanaan ujian nasional agar masyarakat mengerti perlunya penyetaraan skor dan mau menerimanya.
DAFTAR PUSTAKA American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (1999). Standards for educational and psychological testing. Washington, DC: American Educational Research Association. Brennan, R. L., & Kolen, M. J. (1987). Some practical issues in equating. Applied Psychological Measurement, 11(3), 279290.
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and Applications. Boston, MA: Kluwer-Nijhoff Publishing. Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory. Newbury Park, CA: Sage. Han, T., Kolen, M. J., & Pohlmann, J. (1997). A comparison among IRT true- and observed score equating and traditional equipercentile equating. Applied Measurement in Education, 10, 105–121. Kolen, M. J., & Brennan, R. L. (2004). Test equating, scaling and linking: Methods and practices. (2nd ed.). New York: Springer. Lord, F. M. (1980). Practical applications item response theory. Hillsdale, NJ: Lawrence Erlbaum.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
58
COMPUTERIZED ADAPTIVE TESTING (CAT) SALAH SATU ALTERNATIF PENGGANTI PAPER BASED TEST (PBT) Handaru Catu Bagus Peneliti Pertama di Puspendik Balitbang Kemdikbud Email:
[email protected]
ABSTRAK Selama ini, model penilaian pendidikan yang sering digunakan adalah Paper Based Test (PBT). Pada model penilaian PBT digunakan desain tes yang sama untuk setiap peserta didik dengan usia atau jenjang pendidikan yang sama. Praktek tersebut berdasar pada asumsi bahwa peserta didik dengan usia atau jenjang pendidikan yang sama mempunyai kemampuan yang sama. Namun dalam kenyataannya terdapat variasi kemampuan yang signifikan antara setiap penempuh tes, Hal ini mengakibatkan penempuh tes dengan kemampuan tinggi kemungkinan akan mendapat beberapa soal mudah, dimana mereka memiliki kemungkinan kecil untuk menjawab salah. Dengan demikian, soal tes seperti itu tidak memberikan informasi kemampuan penempuh tes. Sebaliknya, penempuh tes dengan kemampuan rendah kemungkinan akan mendapatkan beberapa soal yang terlalu sulit. Dengan demikian, jawaban salah memberikan sedikit informasi mengenai kemampuan mereka. Untuk mengatasi kelemahan pengukuran yang mengabaikan variasi kemampuan penempuh tes adalah dengan menggunakan model tes adaptif. Model tes adaptif menurut Wainer (1990) adalah tes dimana individu yang memiliki kemampuan tinggi akan mendapatkan soal yang berbeda dengan individu yang memiliki kemampuan lebih rendah. Oleh karena itu soal yang akan muncul pada setiap tes akan disesuaikan dengan kamampuan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
59
individu penempuh tesnya, sedangkan komputer adalah media untuk membantu pemilihan soal pertama hingga terakhir dan menghitung skor penempuh tesnya. Hal tersebut yang mendasari pentingnya model alternatif pengganti PBT yaitu dengan model CAT yang aplikasinya memanfaatkan pendekatan model Soal Response Theory (IRT) . Terdapat dua pembahasan dalam tulisan ini adalah pertama, tahap dalam penerapan CAT diantaranya menjelaskan tahap memulai dengan perkiraan estimasi kemampuan peserta, memilih dan menampilkan soal pertama, evaluasi Respons terhadap soal-soal, memperbaiki estimasi kemampuan peserta, memilih soal berikutnya, aturan pemberhentian tes, Soal Exposure Control, Content Balancing dan Setting Time periode per soal. Kedua, dibahas tentang persyaratan yang penting dalam penerapan CAT yaitu infrastruktur hardware dan software, melakukan sosialisasi dan edukasi ke pemangku kepentingan baik daerah maupun pusat terhadap model CAT, pengembangan bank soal terkalibrasi, dan pengembangan sumber daya manusia (SDM) Kata Kunci : Computerized Adaptive Testing (CAT), Paper Base Test (PBT), Soal Response Theory (IRT),
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
60
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
PENDAHULUAN Latar Belakang Selama ini, praktek penilaian pendidikan di sekolah-sekolah digunakan Paper Based Test (PBT). Pada model penilaian tersebut digunakan desain tes yang sama untuk setiap penempuh tes dengan usia atau jenjang pendidikan yang sama. Praktek tersebut didasarkan pada asumsi bahwa penempuh tes dengan usia atau jenjang pendidikan yang sama mempunyai kemampuan yang sama. Namun dalam kenyataannya terdapat variasi kemampuan yang signifikan antar setiap penempuh tes. Padahal model penilaian yang mengabaikan variasi kemampuan indvidu akan mengakibatkan lemahnya hasil penilaian dan informasi yang diberikan menjadi tidak optimal. Sebagai contoh, tes yang soalsoalnya dikategorikan sebagai mudah dan diberikan kepada sekelompok siswa yang memiliki kemampuan tinggi akan memberikan informasi yang kurang berarti, karena hampir dapat dipastikan bahwa
semua siswa akan menjawab benar pada soal tes. Sebaliknya, bila tes yang sosl-soalnya dikategorikan sulit dan diberikan kepada sekelompok siswa akan yang memiliki kemampuan rendah maka kemungkinan semua siswa memperoleh skor 0 atau minimal. Sebagian besar alat tes yang menggunakan PBT mengabaikan variasi kemampuan individu dan dianggap tidak efisien. Hal ini karena banyak soal yang tidak mampu memberikan informasi yang berguna untuk membedakan penempuh tes dalam rentang kemampuan tertentu. Penempuh tes dengan kemampuan tinggi yang mendapat beberapa soal mudah akan memiliki kemungkinan kecil untuk menjawab salah. Dengan demikian, soal tes seperti itu tidak menyediakan informasi mengenai kemampuan mereka. Sebaliknya, penempuh tes dengan kemampuan yang rendah dan mendapatkan beberapa soal yang sangat sulit. Dengan kondisi demikian maka jawaban salah akan memberikan sedikit informasi mengenai kemampuan mereka.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
61
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
Selain itu ujian menggunakan PBT mengandung resiko kecurangan antara penempuh tes dan kebocoran naskah soal. Hal ini karena PBT menggunaan desain tes yang sama untuk jenjang yang sama. Apabila distribusi soal ke penempuh tes melibatkan banyak pihak, maka soal tersebut sangat rawan kecurangan dan kebocoran. Oleh karena itu hasil tes akan menjadi tidak objektif dan informasinya menjadi sulit dipercaya. Untuk mengatasi kelemahan pengukuran di atas maka diajukan alternatif model tes adaptif. Model tes adaptif menurut Wainer (1990) adalah tes dimana individu yang memiliki kemampuan tinggi akan mendapatkan soal yang berbeda dengan individu yang memiliki kemampun lebih rendah. Soal yang akan muncul pada suatu tes akan disesuaikan dengan kamampuan individu penempuh tesnya. Model tes adaptif menggunakan pendekatan soal response theory (IRT). Menurut Hambleton, dkk (1999) IRT berorientasi pada soal tes, tidak seperti pendekatan klasikal yang berorientasi pada tes sehingga performa seseorang atau
sekelompok orang dalam sebuah soal dapat ditentukan. Dalam perkembangannya, penerapan model tes adaptif dengan pendekatan IRT mulai digunakan dengan bantuan media komputer. CAT dengan pendekatan IRT memungkinkan kemampuan individu dan kemampuan soal dinyatakan dalam skala yang sama. Dengan model ini komputer digunakan untuk menampilkan soal yang sesuai dengan kemampuan penempuh tes. Pemanfaatan komputer seperti ini disebut sebagai Computerized Adaptive Testing (CAT). Dari penjelasan di atas, diketahui bahwa pengukuran kemampuan individu dengan menggunakan CAT dan pendekatan IRT memiliki kelebihan dibandingkan PBT yang mengabaikan variasi kemampuan individu penempuh tesnya. Selain itu juga dengan penggunaan media komputer, mengakibatkan tidak ada tahap percetakan naskah soal, soal dapat di distribusikan ke setiap komputer individu penempuh tes sebagai user. Dengan demikian, CAT berbasis IRT biasanya berisi lebih sedikit soal dibandingkan pengukuran PBT yang
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
62
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
konvensional (Embretson & Reise, 2000), dan dengan bantuan media komputer hasil tes akan jauh lebih objektif. Rumusan Masalah Rumusan masaah dalam tulisan ini adalah : 1. Bagaimana prosedur CAT yang baku yang dapat menghasilkan skor sesuai dengan kemampuan individu dari penempuh tes? 2. Bagaimana persiapan dan persyaratan yang diperlukan agar aplikasi CAT dapat terlaksana? Tujuan Berdasarkan rumusan masalah, tulisan ini bertujuan untuk : 1. Menentukan prosedur CAT yang dapat menghasilkan skor sesuai dengan kemampuan individu dari penempuh tes. 2. Menentukan persiapan dan persyaratan yang diperlukan agar aplikasi CAT dapat terlaksana.
Manfaat Manfaat tulisan ini adalah untuk 1) menyediakan informasi bagi pengambil kebijakan di Kementerian Pendidikan dan Kebudayaan tenteng alternatif model penilaian pendidikan pengganti ujian akhir yang lebih objektif untuk penempuh tes, dan 2) memberikan solusi yang efektif bagi pemerintah untuk mengatasi permasalahan Ujian akhir berbasiskan PBT.
KAJIAN LITERATUR Computerized Adaptive dengan Pendekatan IRT
Testing
(CAT)
Computerized Adaptive Testing merupakan generasi kedua dari penggunaan komputer untuk pengetesan (Bunderson dkk, 1989). Salah satu aplikasi dari pendekatan IRT adalah penggunaan CAT. Makna Adaptif pada tulisan ini memiliki pengertian bahwa soal yang diberikan sesuai dengan kemampuan setiap penempuh tes, sehingga setiap individu akan mendapatkan seperangkat soal yang berbeda. Leung dkk (2005) mengatakan bahwa dalam CAT seorang penempuh tes
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
63
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
diberikan soal yang dipilih berdasarkan kemampuannya yang diperkirakan (θ). Berhubung setiap individu mendapatkan seperangkat soal yang sesuai dengan kemampuannya, maka CAT termasuk dalam tailored-testing. CAT dalam penerapannya menggunakan pendekatan IRT. Apabila kemampuan awal individu telah diketahui, maka soal-soal pada tes disesuaikan dengan kemampuan individu tersebut. Misalnya, untuk mengetes anak berbakat, maka soalsoal tesnya adalah soal-soal dengan kesukaran tinggi. Soal-soal tersebut digunakan untuk memperkirakan kemampuan individu. Dengan kata lain, jumlah soal tes yang diberikan tidak perlu banyak. Hal ini menyebabkan waktu pengetesan akan lebih singkat dibandingkan dengan pendekatan klasik yang harus memberikan seluruh soal tes. Selain itu, measurement error akan lebih kecil karena setiap individu hanya mendapatkan soal yang sesuai dengan kemampuannya. Penerapan CAT tidak hanya sekedar memindahkan soal ke dalam komputer,
tetapi memberikan soal sesuai dengan kemampuan penempuh tes. Penyebutan adaptif ini karena komputer digunakan untuk mengatur soal yang akan diberikan selanjutnya kepada penempuh tes terkait dengan jawaban pada soal sebelumnya. Selain individu dapat mengerjakan soal pada CAT sesuai dengan kemampuannya, Wainer (1990) mengemukakan beberapa keunggulan lain dari CAT, seperti tes lebih aman karena tersimpan dalam komputer, setiap peserta tes mendapatkan butir soal yang berbeda, tidak diperlukan lembar jawaban, serta tes dapat diskor dengan segera. Berbeda dengan pendekatan klasik atau konvensional dimana soal harus disusun berdasarkan derajat kesukaran, dalam pendekatan IRT urutan soal menjadi tidak relevan (Wainer & Mislevy, 1990). CAT menggunakan pendekatan IRT untuk menciptakan sebuah algoritma dimana setiap penempuh tes mendapatkan sebuah tes yang merupakan pengukuran yang terbaik terhadap individu tersebut (Embretson & Reise, 2000). Apabila penempuh tes tidak dapat menjawab benar pada soal yang
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
64
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
diberikan, maka komputer akan memberikan soal yang lebih mudah. Sebaliknya, apabila penempuh tes dapat menjawab benar, soal yang diberikan selanjutnya adalah soal yang lebih sulit. Olsen (dalam Bunderson dkk,
1989) mencatat pada sebuah tes prestasi belajar hanya dibutuhkan 30% hingga 50% dari keseluruhan soal tes untuk mencapai tingkat presisi yang sama dengan PBT
Perbandingan CAT dengan PBT Paper Based Test (PBT)
Computerized Adaptive Testing (CAT)
Desain tes yang sama untuk beberapa penempuh tes Informasi tidak optimal
Setiap Peserta tes memperoleh soal – soal yang disesuaikan dengan tingkat kemampuan penempuh informasi Optimal
Waktu pengerjaan tes dan jumlah soal sudah ditentukan dan perlu waktu pengolahan untuk memperoleh nilai
Tes akan berhenti apabila estimasi kemampuannya sudah tercapai sehingga waktu lebih efisien dan lebih efektif dan soal – soal yang muncul sesuai dengan kemampuan penempuh tes. Hasil tes dapat langsung diketahui.
Tingkat kebocoran soal yang tinggi
Tingkat kebocoran soal dapat di perkecil sebab keberadaan soal terpusat
Investasi awal yang lebih ekonomis, namun setiap tahun harus menggandakan soal dan ini membutuhkan biaya yang sama dengan investasi awal
Investasi awal yang mahal untuk pembelian infrastruktur dan jaringan di sekolah, namun setiap tahun tidak terbebani dengan biaya penggandaan soal, hanya biaya perawatan infrastruktur dan jaringan di sekolah
Waktu pelaksanaan yang tidak flexible karena kendala pendistribusian bahan tes ke seluruh Indonesia
Waktu pelaksanaan yang flexibel tergantung kesiapan sekolah dalam menyelenggarakan tes khususnya masalah kesiapan infrastruktur dan jaringan di sekolah
Sumber: Handaru (2011)
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
65
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
Gambar di bawah diberikan bagan proses CAT yang dikemukakan oleh Wainer (1990)
Gambar 1. Bagan proses CAT
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
66
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
PEMBAHASAN Tahapan Penerapan CAT Tahapan CAT merupakan kerangka kerja dari proses aplikasi program CAT. Berikut ini adalah tahapan CAT. 1. Mulai dengan perkiraan kemampuan penempuh tes
estimasi
Perkiraan estimasi kemampuan penempuh tes dapat dilakukan apabila penempuh tes sudah pernah mengikuti tes. Penentuan atau memilihan soal awal didasarkan pada kemampuan penempuh tes pada tes sebelumnya. Sementara penempuh tes yang belum pernah mengikuti tes, belum bisa ditentukan perkiraan estimasi kemampuan pesertanya. 2. Memilih dan menampilkan soal pertama Terdapat tiga metode dalam memilih dan menampilkan soal pertama, yaitu: (1) apabila penempuh tes belum pernah mengikuti tes atau belum memiliki data kemampuan atau ability maka soal pertama yang diberikan atau ditampilkan adalah soal dengan tingkat kesukaran menengah atau
sedang yaitu antara -0.5 sampai 0.5, (2) soal pertama yang dipilih dan ditampilkan dengan menggunakan mean dari kemampuan peserta (θ) populasi, dan (3) soal pertama dapat dipilih dan ditampilkan cara menggunakan data kemampuan penempuh tes (θ) terakhir, soal pertama tersebut sama dengan kemampuan penempuh tes. 3. Evaluasi Respon terhadap Soal Metode evaluasi respon terhadap soal digunakan metode Maximum Likehood (ML) dengan mencari θ. Terdapat 2 metode dalam evaluasi respon terhadap soal yaitu 1) Maksimum θ dimana memaksimumkan kemungkinan pola respon soal setiap individu. Apabila respon soal pertama benar maka estimasi kemampuan peserta (θ) adalah 3 dan apabila respon soal pertama salah maka estimasi kemampuan peserta (θ) adalah -3. 2) Step Sizing dimana penentuan θ peserta berdasarkan respon penempuh tes. Apabila respon soal pertama benar maka estimasi kemampuan peserta (θ) adalah penjumlahan dari indek tingkat kesukaran soal tersebut dengan nilai sizing yang
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
67
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
ditentukan oleh admin tes, dan apabila respons soal pertamanya salah maka estimasi kemampuan peserta (θ) adalah pengurangan dari nilai tingkat kesukaran soal tersebut dengan nilai sizing yang ditentukan oleh admin tes. Langkah ini diaplikasikan hingga pola respon penempuh tes menjadi heterogen. 4. Memperbaiki penempuh tes
estimasi
kemampuan
Estimasi kemampuan penempuh tes dapat diperbaiki dan dihitung setelah soal kedua dan seterusnya namun juga dapat dihitung dan diperbaiki apabila respon kedua dan seterusnya terjadi dengan pola soal 1 dengan respon salah dan soal 2 respon benar, atau soal 1 dengan respon benar dan soal 2 dengan respon salah. Apabila pola respon adalah soal 1 respon benar dan soal 2 dengan respon benar atau sebaliknya maka maximum likelihood belum bisa menghitung estimasi kemampuan penempuh tes.
5. Memilih soal berikutnya Untuk memilih soal berikutnya digunakan metode maximum information informasi maksimum untuk estimasi θ berdasar dari respon sebelumnya. Metode maximum information memberikan penurunan SEM yang cepat, sehingga CAT menjadi efisien. Umumnya soal berikutnya itu sesuai atau sama dengan estimasi θ kemampuan penempuh tes yang sudah diperbaiki. Umumnya apabila respon sebelumnya benar maka soal berikutnya akan lebih sulit dari sebelumnya dan sebaliknya apabila respon sebelumnya itu salah maka soal berikutnya akan lebih mudah dari soal sebelumnya. 6. Aturan Pemberhentian tes Aturan pemberhentian yang digunakan adalah variable length dengan Standard Error (SE) ≤ 0,4 untuk mencapai efektivitas. Hal ini karena bila SE ≤ 0,4 maka SE dari estimasi θ hanya berbeda sebesar 0,03 dari estimasi sebelumnya. Jadi jika SE sudah memenuhi syarat maka kemampuan penempuh tes sudah dapat ditentukan dan tes berhenti.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
68
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
7. Item Exposure Control, Content Balancing dan Setting Time periode per soal Item exposure control dan content balancing adalah syarat utama CAT. Content balancing pada CAT menuntut setiap penempuh tes harus mengerjakan seluruh aspek (content) di setiap mata pelajaran. Ability (kemampuan) penempuh tes dapat ditentukan bila materi yang dikerjakan sudah lengkap. Penentuan jumlah soal setiap aspek dinamis dan ditentukan oleh administrator tes serta didasarkan pada PBT. Misalnya dalam PBT terdapat 40 soal, yang terdiri atas 10 soal aspek I, 20 soal aspek II dan 10 soal aspek III, Informasi tersebut menjadi dasar CAT dalam menentukan jumlah soal setiap aspek. Untuk aspek I ditentukan sebanyak 25%, aspek II sebanyak 50%, dan aspek III sebanyak 25%. Ketiga aspek tersebut harus dikerjakan terlebih dahulu oleh penempuh, dan apabila SE belum tercapai maka penempuh akan diberikan lagi soal dengan materi dari ke tiga aspek tersebut dengan persentase yang sama, dan seterusnya hingga SE terpenuhi.
Untuk Item exposure control, cara untuk membatasi soal yang sering muncul, apabila sudah melebihi batas yang ditentukan oleh administrator tes maka soal itu tidak boleh lagi untuk ditampilkan. Untuk penentuan batasan jumlah soal, telah disepakati bahwa soal yang memiliki tingkat kesukaran tinggi dapat sering muncul atau batasan jumlahnya tinggi, sementara sebaliknya soal dengan tingkat kesukaran rendah akan dibatasi penampilannya lebih kecil. Penentuan item exposure control bersifat dinamis dan dapat disesuaikan dengan rata – rata kemampuan penempuh tes. Persiapan dan Persyaratan Penerapan Aplikasi CAT
Dalam
Aplikasi CAT dapat diterapkan untuk ujian akhir sebagai alternatif pengganti PBT dengan menyiapkan sistem pusat data yang terpadu dan tersebar di beberapa daerah. Pusat data ini fungsinya untuk mempercepat akses data, selain itu sebagai duplikasi karena pustusnya akses internet di suatu daerah. Selain itu perlu disiapkan infrastruktur
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
69
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
komputer yang relatif banyak termasuk di dalamnya jaringan LAN, WAN maupun internet khususnya masalah kecepatan akses yaitu Band Width (BW) untuk masing – masing daerah. Tipe jaringan yang harus dipakai adalah Virtual Private Network (VPN) karena lebih mudah dalam pengendalian jaringan, lebih mempercepat akses, dan yang paling penting adalah lebih aman security network. Seluruh sekolah yang telah memiliki infrastruktur baik hardware, maupun jaringan yang dapat mengakses internet, dapat mengaplikasikan CAT. Untuk komputer spesifikasi minimum adalah pentium IV yang memiliki software web aplikasi (contoh: Internet Explorer, Mozilla, Fire Fox, dll) Setelah infrastruktur dipersiapkan persiapan berikutnya adalah dengan melakukan sosialisasi penggunaan komputer kepada calon pengguna atau penempuh tes. Hal ini agar hasil tes tidak terpengaruh oleh faktor gagap teknologi dari penempuh. Kompetensi minimal yang diharapkan dari penempuh tes adalah dapat mengoperasikan komputer khususnya mouse dan keyboard.
Selain sosialisasi, aplikasi CAT dapat diterapkan untuk ujian yang sesungguhnya dengan memberikan informasi dan edukasi kepada stakeholder pendidikan tentang metode yang digunakan CAT yaitu menggunakan Soal Response Theory (IRT) dalam penentuan prediksi kemampuan penempuh tes atau penghitungan skor. Hal ini memungkinkan hasil CAT dapat langsung dibandingkan, antara peserta yang memang memiliki kemampuan tinggi dengan peserta yang memiliki kemampuan yang rendah, karena menggunakan bank soal yang sudah terkalibrasi. Hal yang paling penting dalam penerapan aplikasi CAT adalah menyiapkan bank soal terkalibrasi yang tersebar merata dalam seluruh tingkat kesukaran soal (mudah, sedang dan sulit) sehingga seluruh kemampuan penempuh tes dapat terwakili. Selain itu juga, bank soal tersebut memiliki jumlah yang banyak. Menurut keterangan dari Australian Council for Education Research (ACER) jumlah soal yang harus ada dalam Bank soal terkalibrasi sedikitnya adalah
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
70
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
3000 soal yang tersebar merata untuk tingkat kesukaran soalnya. Persyaratan akhir yang harus disiapkan adalah masalah sumber daya manusia (SDM) yang handal khususnya SDM untuk masalah teknologi ICT dan SDM yang handal dalam bidang psikometri. Hal demikian agar aplikasi CAT tetap dapat dikembangkan sesuai dengan kebutuhan. Teknologi pendukung tambahan penerapan Aplikasi CAT
dalam
Dalam penerapan CAT, teknologi web cam bisa sebagai pendukung. Hal ini untuk mengantisipasi adanya kecurangan dalam pelaksanaan tes. Setiap komputer dilengkapi oleh web kamera dan pengamatan dapat dilakukan di local server (sekolah, Kecamatan, Kabupaten/kota atau propinsi). Dalam penerapan CAT, teknologi Finger Print juga bisa sebagai pendukung, untuk mengantisipasi adanya joki tes. Prosedurnya adalah pada saat mendaftar penempuh harus melakukan scanning jari, dan pada saat memasuki lokasi tes penempuh tersebut harus melakukan scanning jari untuk
memastikan apakah yang bersangkutan terdaftar sebagai penempuh tes. Selain itu, harus tersedia generator set (genset). Hal ini untuk mengantisipasi aliran listrik di sekolah putus yang mengakibatkan tertundanya tes.
SIMPULAN DAN SARAN Simpulan Dari hasil kajian literatur menghasilkan dua kesimpulan. Pertama, penerapan aplikasi CAT memiliki tujuh tahapan hingga skor penempuh tes dapat di estimasi, yaitu: mulai dengan perkiraan estimasi kemampuan memilih dan menampilkan soal pertama, evaluasi respon terhadap soal, memperbaiki estimasi kemampuan, memilih soal berikutnya, aturan pemberhentian tes, Soal Exposure Control, Content Balancing dan Setting Time periode per soal. Kedua, CAT dapat diterapkan untuk ujian sesungguhnya dengan menyiapkan empat persyaratan diantaranya yaitu: Infrastruktur hardware (jaringan dan data center) dan infrastruktur software (aplikasi program CAT), melakukan sosialisasi ke
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
71
Computerized Adaptive Testing (CAT) Salah Satu Alternatif Pengganti Paper Based Test (PBT)
sekolah dan mengedukasi ke pemangku kepentingan baik daerah maupun pusat tentang model CAT, pengembangan bank soal terkalibrasi yang memiliki jumlah soal memadai dan tersebar merata untuk seluruh tingkat kesukaran soal, dan pengembangan sumber daya manusia (SDM). Saran Saran untuk menindaklanjuti hasil tulisan ini ialah: 1. Model CAT sangat penting sebagai alternatif pengganti model PBT untuk ujian akhir sesungguhnya. Oleh karena itu pemerintah dalam hal ini Kementerian Pendidikan dan Kebudayaan perlu memikirkan kebijakan alternatif model penilaian yaitu model CAT. 2. Bagi akademisi diharapkan bersedia melakukan penelitian dan pengembangan lebih lanjut khususnya masalah hasil keakuratan, efektifitas dan efisiensi model CAT dibandingkan dengan PBT agar hasilnya sebagai bahan penunjang dalam sosialisasi dan edukasi kepada seluruh pemangku kepentingan.
PUSTAKA ACUAN Hambleton, R.K., H. Swaminathan, and H.J.Rogers .(1991). Fundamental of Soal Response Theory. Volume 2. California: Sage Publications, Inc. Leung, C., H.Chang, and K.Hau. (2005). Computerized Adaptive Testing: A Mixture Soal Selection Approach for Constrained Situations. British Journal of Mathematical & Statistical Psychology, Nov 2005, 58, Proquest Psychology Journals, pp 239. Embretson, S.E, and S.P.Reise. (2000). Soal Response Theory for Psychologist. New Jersey : Lawrence Erlbaum Associates, Inc. Wainer, H. (1990). Introduction and History. Dalam H. Wainer, N.J. Dorans, R. Flugher, & B.F. Green. Computerized Adaptive Testing: a Primer. New Jersey: Lawrance Erlbaum Associates, Publishers. Bagus, H.C. (2011). Laporan Hasil kegiatan Model Adaptif APBN-P 2011, Puspendik.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
72
IMPLEMENTASI NEW PUBLIC MANAGEMENT PADA LEMBAGA PENGEMBANGAN TES Bagus Hary Prakoso Peneliti di Pusat Penilaian Pendidikan, Balitbang Kemdikbud Email:
[email protected]
ABSTRACT The purpose of the study is to explain best practice related to New Public Management practices of two cases of the institute for test development which have important role in national assessment programme. By using case study method, it generates a number of hyphotheses that the institute for test development will have high performance and competitiveness whether: (1) it has entrepreneurial traits; (2) it’s research outcome, product, and collaboration afford to generate public value for stakeholders; (3) it has independency and integrative work functions; and (4) it has support from environment authority and organizational capabilities in creating value. Keywords: new public management, institute for test development, entrepreneurial traits, environment authority, and public value.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
73
Implementasi New Public Management Pada Lembaga Pengembangan Tes
ABSTRAKS Tujuan studi ini adalah menjelaskan best practice yang terkait praktik new public management pada dua studi kasus lembaga pengembangan tes yang mempunyai peran penting dalam program asesmen nasional. Dengan menggunakan metode studi kasus, studi ini menghasilkan sejumlah hipotesis yaitu lembaga pengembangan tes akan memiliki daya saing dan kinerja yang lebih baik jika (1) memiliki karakter entrepreneurship; (2) hasil riset, produk, dan kerjasamanya mampu memberi public value bagi stakeholder; (3) memiliki independensi dengan fungsi kerja yang terintegrasi; (4) adanya dukungan dari otoritas lingkungan serta kemampuan organisasi dalam menciptakan public value.
Kata kunci: new public management, lembaga pengembangan tes, entrepreneurial traits, otoritas lingkungan, dan public value.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
74
Implementasi New Public Management Pada Lembaga Pengembangan Tes
PENDAHULUAN Ujian Nasional (UN) di Indonesia adalah kegiatan pengukuran dan penilaian kompetensi peserta didik secara nasional pada jenjang pendidikan dasar dan menengah (Permendiknas Nomor 2 tahun 2011). Selanjutnya UN yang diselenggarakan setiap tahun memiliki kegunaan untuk (1) pemetaan mutu program dan atau satuan pendidik, (2) dasar seleksi masuk jenjang berikutnya, (3) penentu kelulusan peserta didik dari satuan pendidikan, serta (4) dasar pembinaan dan pemberian bantuan. Dari keempat kegunaan tersebut, UN sebagai penentu kelulusan peserta didik masih menjadi masalah yang paling krusial dan debatable. Keberadaan UN sejak era reformasi sering menjadi isu hangat setiap tahun dimana suara-suara yang kontra sering lebih nyaring. Meskipun tidak selalu benar namun suara tersebut terkesan menjadi opini publik. Permasalahan tahunan UN tidak terlepas dari kinerja dan peranan organisasi yang bersifat strategis atau kebijakan (Badan Standar
Nasional Pendidikan atau BSNP), dan kinerja dan peranan organisasi yang bersifat operasional dan teknis (Pusat Penilaian Pendidikan Balitbang Kemdikbud). Bila dianalisis masalah tahunan UN sebenarnya mengerucut pada dua masalah yaitu: teknis (operasional) dan nonteknis (manajemen dan governance). Kedua masalah tersebut saling mempengaruhi dan dipengaruhi. Contohnya adalah pelaksanaan UN 2013 dimana masalah administrasi terkait anggaran dan manajemen internal organisasi mempengaruhi pekerjaan yang bersifat teknis di lapangan mulai dari proses penyiapan naskah hingga tertundanya pengiriman naskah ujian sampai ke sekolah, yang berakibat fatal pada tertundanya pelaksanaan UN SMA di sebelas provinsi. Dampak negatifnya luar biasa. Pembangunan kinerja bertahun-tahun hancur seketika karena masalah managerial (nonteknis) yang lemah termasuk dugaan adanya korupsi. Ekspektasi publik terhadap peran dan eksistensi UN semakin kabur. Salah satu cara untuk menyelesaikan masalah tahunan UN yang relatif sulit
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
75
Implementasi New Public Management Pada Lembaga Pengembangan Tes
mencapai top performance and legitimate, dibutuhkan suatu pendekatan yang lebih fundamental seperti perubahan paradigma manajemen dan governance structure sebagai bagian dari reformasi birokrasi. Dalam konsep administrasi publik dikenal adanya beberapa paradigma dan tahapan mulai dari Traditional Public Administration (TPA), New Public Management (NPM), New Public Service (NPS), dan Public Value Management (PVM). Penyelenggara UN pada organisasi yang banyak bersifat teknis sering mendapatkan masalah dan dipermasalahkan. Ini adalah suatu indikasi karena selama ini tidak dilakukan perbaikan sistem secara fundamental dan terencana terutama di tingkat internal (reformasi). Alasan regulasi dan birokrasi yang cenderung status quo menjadi sumber permasalahan UN yang tidak berkesudahan. Sistem birokasi pemerintah yang masih didominasi oleh penerapan TPA, sudah waktunya berubah lebih revolutif dengan melakukan reformasi birokrasi dengan penerapan NPM. Diskusi dan eksekusi penerapan NPM memang membutuhkan
kajian dan political will yang besar yang melibatkan banyak elemen mulai dari legislatif, eksekutif, dan sektor sosial. Beberapa negara maju dan berkembang memiliki lembaga pengembangan tes yang bisa dijadikan benchmarking bagi peningkatan kinerja organisasi dan acuan reformasi birokrasi. Bagaimana mereka bekerja dan mencapai prestasi perlu dilakukan perbandinganperbandingan. Tujuan studi ini adalah mencoba mengidentifikasi praktik-praktik terbaik (best practices) dan menghasilkan hipotesis dari dua studi kasus lembaga pengembangan tes yang menerapkan konsep New Public Management. Dalam mendeskripsikan lembaga pengembangan tes yang telah memiliki reputasi internasional digunakan dua organisasi sebagai studi kasus yaitu: CITO di Belanda dan ACARA di Australia. Dengan menggunakan metode studi kasus untuk perbandingan bisa menjadi cara yang bermanfaat untuk menghasilkan hipotesishipotesis tentang kasus yang menggabungkan fenomena kompleks, dinamika jangka
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
76
Implementasi New Public Management Pada Lembaga Pengembangan Tes
panjang, dan kesulitan dalam akses (Yin, 1984). Kasus-kasus yang digunakan diperoleh dari dokumentasi online, untuk itu penulis menerima berbagai keterbatasan ini untuk menghasilkan hipotesis bukan menguji hipotesis. Dalam menganalisis imlementasi NPM pada kedua lembaga, peneliti mengidentifikasi setiap informasi yang merefleksikan karakteristik NPM.
KAJIAN LITERATUR DAN PEMBAHASAN Benchmarking Untuk memperoleh best practice perbandingan digunakan benchmarking. Definisi benchmarking sangat beragam disesuaikan bidang kajiannya. Menurut Price (1994), “benchmarking is the open and collaborative evaluation of services and processes with the aim of emulating or improving best available practice.” Sementara menurut Jackson (1998a), “benchmarking is a process to facilitate the systematic comparison and evaluation of practice, process and performance to aid improvement and self-regulation.”
New Public Management New Public Management (NPM) adalah sebuah paradigma dalam praktik manajemen di sektor publik sebagai respon terhadap kelemahan paradigma lama yaitu Traditional Public Administration. Lan dan Rosenbloom (1992) mengistilahkan NPM sebagai market based public administration. Sementara Osborne dan Gaebler (1992) mengistilahkan sebagai entrepreneurial government. Hood dalam Hughes (1994) mencirikan organisasi yang menerapkan NPM dengan ciri-ciri adanya: (1) penerapan manajemen yang profesional di dalam sektor publik, (2) standar dan ukuran yang eksplisit terhadap kinerja, (3) penekanan yang lebih besar terhadap kontrol hasil, (4) pergeseran disaggregation suatu unit dalam sektor publik, (5) penerapan kompetisi, (6) penekanan gaya kepemimpinan seperti swasta dalam praktik manajemen, (7) penekanan disiplin tinggi dan efisiensi dalam penggunaan sumberdaya.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
77
Implementasi New Public Management Pada Lembaga Pengembangan Tes
Studi Kasus Studi Kasus 1: CITO – Netherlands CITO atau Dutch National Institute for Educational Measurement, berbasis di Belanda, adalah sebuah foundation di bidang penilaian dan pengujian di bidang pengukuran dan pemantauan potensi manusia sejak 1968. Cito dibangun di atas pengembangan terbaru ICT dan penelitian psikometri, bekerja untuk institusi pendidikan, pemerintah dan perusahaan. Cito menjadi lembaga swasta penuh sejak tahun 1999. Dengan reputasi yang kuat di tingkat nasional, Cito dengan cepat mencapai pengakuan internasional, melakukan ekspansi jaringan terhadap berbagai komite dan badan konsultasi, baik sebagai klien maupun sebagai partner kerja di seluruh dunia. Saat ini Cito mempunyai tiga cabang perusahaan yaitu: di Jerman (Cito Deutschland GmbH), di Amerika Serikat (Cito USA Inc.), dan di Turki (Cito Türkiye Ltd.). Para konsultan Cito mempunyai pengalaman global yang bekerja sama dengan pusat-pusat penilaian dan pengujian
di 30 kementerian di berbagai negara. Dalam bekerja sama dengan pendidik lokal, Cito telah membantu negara-negara tersebut menjadikan pendidikan yang lebih mudah diakses serta pengembangan keahlian di bidang tes dan monitoring. Penelitian dan Pengembangan Penelitian dan pengembangan memainkan peranan penting dalam menjelaskan, meneliti, dan meningkatkan kualitas tes dan ujian. Dalam penelitian dan pengembangan ada tiga bidang yang menjadi core product-nya yaitu psikometri, partisipasi pada riset internasional, serta komputer dan web based testing. Partisipasi Penelitian Internasional Sebagai pengembang tes dan evaluasi yang terkemuka, Cito berpartisipasi dalam banyak program penelitian: Periodical Assessment of the Research Level (National Assessment), COOL (International cohort study), Programme for International Student Assessment (PISA), Common European Framework of Reference (CEFR), European
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
78
Implementasi New Public Management Pada Lembaga Pengembangan Tes
Bank of Anchor items for Foreign Language Skill (EBAFLS), dan European Survey of Language Competence (ESLC). Pada bidang ini, Cito berperan dalam menunjang riset terkait: desain dan pengembangan instrument dan sistem yang mendukung pengembangan soal dan tes, validitas dan efisiensi suatu evaluasi, desain templet soal, dan desain computer adaptive test. Produk riset lainnya adalah Computercontrolled testing programs yang menawarkan beberapa keuntungan yaitu: bank soal yang besar, program komputer penyusunan tes, instruksi pada layar bagi siswa, pemberian modul bagi guru untuk memilih spesifikasi tes bagi siswa secara individu, modul bagi perekaman hasil kerja siswa, dan pedoman pengajaran. Konsultasi dan Pelatihan For our international clients, Cito provides consulting services in all our areas of expertise as well as courses and workshops covering a wide range of education and assessment issues. Untuk klien internasional,
Cito menyediakan jasa konsultasi dalam semua bidang keahlian serta kursus dan lokakarya meliputi berbagai pendidikan dan masalah penilaian. Cito offers a broad package of consulting services for the international market.Cito menawarkan paket luas layanan konsultasi untuk pasar internasional di bidang penilaian, penelitian, pengembangan kurikulum dan inovasi pendidikan. Cito already actively provides educational support and consulting services to Central and Western Europe, the former Balkans, the Soviet Republic, South Africa, Central America, Aruba and the Dutch Antilles. Cito sudah aktif menyediakan dukungan pendidikan dan jasa konsultasi kepada Tengah dan Eropa Barat, wilayah Balkan, Republik Soviet, Afrika Selatan, Amerika Tengah, Aruba dan Antillen Belanda. Courses and workshops are an important component of Cito's international activities, particularly in the area of evaluation and assessment.Kursus dan workshop ini merupakan komponen penting dari kegiatan internasional Cito, khususnya di
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
79
Implementasi New Public Management Pada Lembaga Pengembangan Tes
bidang evaluasi dan penilaian. Our course offerings cover the full spectrum of our expertise - from practical training support in the setting-up and application of Cito's monitoring & evaluation system to educational workshops on the development of qualitative test methods and testing using computers. Penawaran kursus mencakup keahlian dan dukungan pelatihan praktis serta pemantauan & sistem evaluasi untuk lokakarya pendidikan bagi pengembangan metode uji kualitatif dan pengujian menggunakan komputer. We also offer customised training programmes in a number of highly specific areas, such as competencebased testing and personal certification. Produk dan Layanan CITO Cito membantu lembaga pendidikan dan perusahaan secara obyektif tentang peta pengetahuan, keterampilan dan kompetensi peserta. Berbagai produk dan jasa dari Cito meliputi: bentuk pengujian, sistem pelacakan dan sertifikasi.
Peran CITO di Bidang Pendidikan Sekolah-sekolah di banyak negara mendapatkan keuntungan dari layanan Cito khususnya sekolah-sekolah yang menggunakan pengujian digital dan sistem pemantauan pendidikan. Dalam bidang ini produk yang ditawarkan adalah: Monitoring dan Sistem Evaluasi, Pemantauan Ujian, Pyramid Method, dan Digital Portofolio. Best Practice dari CITO Beberapa perilaku dan strategi dari CITO yang terkait penerapan NPM adalah: (1) merubah jenis organisasi dari publik menjadi perusahaan swasta tahun 1999 dimana saat ini CITO mempunyai 3 cabang perusahaan yang berada di Jerman, Amerika Serikat, dan Turkey; (2) bekerja sama dengan pusat penilaian dan pengujian di 30 kementerian di berbagai negara; (3) partisipasi penelitian internasional; (4) penyelenggaraan konsultasi dan kursus, dan workshop di bidang evaluasi dan penilaian; (5) penyediaan produk dan jasa meliputi: bentuk pengujian, sistem pelacakan, sertifikasi, serta jasa lain:
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
80
Implementasi New Public Management Pada Lembaga Pengembangan Tes
Monitoring dan Sistem Evaluasi, Pemantauan Ujian, Pyramid Method, dan Digital Portofolio. Dengan merubah jenis organisasi menjadi perusahaan swasta adalah mengarah pada salah satu karakter NPM yaitu swastanisasi. Perubahan tersebut, lebih memudahkan CITO dalam mewujudkan visi, misi dan tujuan organisasi. Ini juga berdampak pada kinerja CITO dalam melakukan penelitian, penciptaan dan layanan berbagai produk dan jasa kepada konsumen. Menawarkan dan berorientasi pada berbagai produk dan layanan kepada konsumen adalah refleksi dari market based public administration serta membutuhkan keahlian dan praktik kewirausahaan. Pada perusahaan terjadi budaya kompetisi dan peningkatan daya saing melalui skema NPM dan strategi lainnya. Karena jika tidak, CITO akan mengalami kesulitan dalam memperoleh dukungan dan legitimasi dari seluruh stakeholder. Hipotesis yang dihasilkan dari CITO adalah: (1) lembaga pengembangan tes akan memiliki daya saing dan kinerja yang lebih
baik jika memiliki karakter private and entrepreneurial minded; (2) lembaga pengembangan tes akan lebih mudah mendapatkan support and legitimacy jika hasil riset, produk, dan kerjasamanya mampu memberi value bagi stakeholder. Studi Kasus 2: ACARA - Australia The Australian Curriculum, Assessment, and Reporting Authority (ACARA) adalah organisasi independen yang bertanggung jawab terhadap seluruh manajemen dalam pengembangan kurikulum nasional, program asesmen nasional, dan program pelaporan dan pengumpulan data dalam rangka menunjang pembelajaran abad 21 bagi semua siswa di Australia. ACARA didirikan berdasarkan UU Federal Parlemen pada tanggal 8 Desember 2008 dan dioperasikan pada pertengahan 2009. ACARA menerima arahan dari the Standing Council on School Education and Early Childhood (SCSEEC). Melalui SCSEEC, seluruh negara bagian, teritorial dan kementerian pendidikan federal menyetujui rencana kerja ACARA dan menyusun arah
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
81
Implementasi New Public Management Pada Lembaga Pengembangan Tes
kebijakan umum tentang the National Assessment Program atau Program Penilaian Pendidikan. ACARA berdiri atas tiga pilar yaitu Kurikulum, Penilaian, dan Pelaporan bagi pendidikan sekolah di antara Foundation dan tahun ke 12. Ini diselenggarakan dalam konsultasi dan kolaborasi dengan seluruh stakeholder termasuk guru-guru, kepala sekolah, pemerintah, otoritas negara bagian dan teritori, asosiasi pendidikan profesional, grup komunitas, serta masyarakat umum. Kurikulum dan Pelaporan ACARA bertanggung jawab terhadap pengembangan kurikulum Australia dari Foundation hingga tahun ke 12. Sejak wilayah pembelajaran relevan tentang kurikulum Australia secara substantif diterapkan, Program Penilaian Nasional (NAP) mengetes dan merefleksikan kerangka kurikulum yang baru.
informasi ini dalam laporan nasional dan ringkasan laporan kepada semua negara bagian, teritori, dan jurisdiksi. Laporan lain terkait pekerjaan ACARA terdapat di My School website. Web ini menyediakan informasi kontekstual kepada orang tua dan komunitas tentang sekolah-sekolah di Australia, termasuk perkembangan siswa, keuangan sekolah, dan tingkat sekolah menurut kinerja NAPLAN. Keahlian ACARA ACARA adalah sebuah otoritas independen yang bertanggung jawab terhadap pengembangan dan manajemen Program Penilaian Nasional (NAP). Dalam rangka menjamin penyelenggaraan program penilaian yang berkualitas yang tinggi, ACARA melibatkan kerjasama baik dari para ahli internal dan ekternal di seluruh Australia, dimana seluruhnya memperhatikan relevansi bidang-bidang profesi mereka.
ACARA bertanggung jawab terhadap pengumpulan dan pelaporan data sekolahsekolah di Australia. Acara menyediakan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
82
Implementasi New Public Management Pada Lembaga Pengembangan Tes
Pengembangan dan Manajemen NAP ACARA mengawasi seluruh aspek pada NAP yang meliputi: (1) Pengembangan soal tes bagi NAPLAN dan sample NAP, (2) Penjaminan aksesabilitas pengembangan tes NAPLAN seperti penetapan versi akses bagi disability dan versions and special print versions (penyandang cacat atau kebutuhan khusus), (3) Pusat analisis data NAPLAN, (4) Pelaksanaan equating tests, dan (5) Penetapan dan penelitian bukti berdasarkan rekomendasi perbaikan untuk NAP. Administrasi NAP ACARA bekerja di dalam cakupan yang luas dengan partner-partner yang mengawasi pekerjaan NAP. Test Administration Authorities (TAAs) adalah semacam departemen pemerintah atau agen yang bertanggung jawab terhadap implementasi dan administrasi tes NAPLAN di negara bagian dan teritorial mereka. Staf ACARA bekerja dengan TAA di dalam setiap negara bagian dan teritorial untuk penjaminan administrasi NAPLAN konsisten secara nasional. ACARA juga memberikan konsultasi
untuk menjamin konsistensi administrasi tes seperti: (1) National Protocols for Test Administration (Protokol Nasional untuk Administrasi Tes) dan (2) pedoman dan pemeliharaan integritas tes (test integrity). Pedoman-pedoman ini menyediakan kerangka nasional yang didukung oleh materi penunjang dan konsultasi dimana TAAs menyediakan bagi sekolah-sekolah. NAP Pemacu Peningkatan Semua sekolah di Australia memanfaatkan outcomes dari tes nasional. Sekolah-sekolah dapat memperoleh informasi rinci tentang bagaimana prestasi mereka, dan mereka dapat mengidentifikasi kekuatan dan kelemahan yang menjadi titik perhatian selanjutnya. Hasil agregat dibuat dan tersedia melalui laporan komprehensif pada tingkat sekolah dan nasional. Hasil agregat tingkat nasional juga tersedia secara online. Pada level sistem, NAP menyediakan Menteri Pendidikan dengan informasi tentang kesuksesan kebijakan dan pemberdayaan bidang-bidang kurikulum yang
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
83
Implementasi New Public Management Pada Lembaga Pengembangan Tes
prioritas. NAP juga menyediakan kementerian dengan kapasitas untuk memonitor kesuksesan kebijakan yang bertujuan pada peningkatan prestasi bagi kelompok siswa yang berbeda seperti siswa warga pribumi (indigenous).
mengembangkan perspektif nasional secara umum tentang prestasi siswa, dan lebih spesifik adalah pemahaman bahwa sekolah mereka adalah mampu.
Tanpa data yang dapat dibandingkan secara nasional tentang prestasi siswa yang NAP sediakan, negara bagian dan teritorial hanya memiliki informasi terbatas tentang prestasi pada siswa mereka yang terkait dengan kolompok mereka. Data NAP menyediakan tambahan informasi yang cocok sehingga meningkatkan kapasitas dalam pengambilan keputusan suatu kebijakan, pemberdayaan, serta langkah-langkah sistematis.
Pengembangan penilaian sampel pada NAPLAN (National Assessment Program Literacy and Numeracy) and NAP dikelola oleh ACARA dengan berkonsultasi dan berkolaborasi dengan para ahli di bidang literasi, numerasi, ICT, sains, civics dan citizenship. Para ahli asesmen, termasuk guru-guru, otoritas pendidikan dari semua negara bagian dan teritorial, pemerintah Australia, dan sekolah-sekolah swasta terlibat di dalam proses ini.
AKUNTABILITAS NAP juga melakukan fungsi akuntabitas. Warga Australia dapat berharap sumberdaya yang dialokasikan sedemikian rupa yang menjamin bahwa siswa mereka memperoleh pembelajaran berharga selama mereka di sekolah. Outcomes dari laporan NAP memungkinkan warga Australia
Pengembangan Tes
Pengembangan tes NAPLAN di pimpin oleh national Statements of Learning dalam bahasa Inggris dan Matematika. Sedangkan pengembangan sample test NAP dipimpin oleh national Statements of Learning dalam bidang sains, ICT, civics dan citizenship. Tes-tes tersebut dikonstruksi untuk: (1) Menilai pengetahuan, keahlian, dan pemahaman yang tepat bagi siswa dalam
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
84
Implementasi New Public Management Pada Lembaga Pengembangan Tes
level tahun tertentu, (2) Menjadikan menarik dan komitmen bagi para siswa di seluruh Australia, dan (3) Menantang para siswa di semua level kemampuan. Pengembangan dan Proses Reviu Pengembangan dan reviu tes di dalam Program Asesmen Nasional membutuhkan waktu penyelesaian sekitar 18 bulan. Proses ini mengikuti tahapan spesifik yang didesain untuk menjamin bahwa tes memiliki standar tertinggi, yang meliputi 9 tahapan yaitu: Guidelines for test development, Question (‘item’) development, Review of test items, Trialling, Expert advice, Equating Program, Testing, Analysis, dan Reporting. Best Practice dari ACARA Beberapa praktik terbaik yang diterapkan oleh ACARA adalah institusi ini bersifat independen dengan fungsi kerja yang terintegrasi meliputi kurikum, penilaian, dan pelaporan. Strategi tersebut adalah bagian upaya penggunaan sumberdaya secara efisien dan efektif. ACARA didukung oleh
Standing Council on School Education and Early Childhood yang mewakili seluruh wilayah negara bagian dan teritorial. Keterlibatan semua elemen masyarakat adalah alat efektif dalam memperoleh dukungan dan legitimasi. Dalam konteks NPM yang teridentifikasi dari ACARA adalah penerapan manajemen yang profesional di dalam sektor publik, dan standar dan ukuran yang eksplisit terhadap kinerja. Hal itu dapat dilihat dari keahlian ACARA, pengembangan, manajemen, dan administrasi NAP (produk), serta proses pengembangan suatu tes yang membutuhkan waktu 18 bulan dengan 9 tahapan. Hipotesis yang dihasilkan dari ACARA adalah: (1) lembaga pengembangan tes akan mudah memiliki reputasi jika memiliki independensi dengan fungsi kerja yang terintegrasi; (2) legitimasi suatu lembaga kuat karena adanya dukungan dari otoritas lingkungan serta kemampuan organisasi dalam menciptakan public value yang bersumber dari kapabilitas organisasi.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
85
Implementasi New Public Management Pada Lembaga Pengembangan Tes
SIMPULAN DAN SARAN Kedua lembaga memiliki best practice yang berbeda karena adanya perbedaan jenis organisasi, lingkungan otoritas, serta produk, jasa, dan value yang dihasilkan. Hipotesis yang dihasilkan dari kedua lembaga yang terkait NPM adalah: (1) lembaga pengembangan tes akan memiliki daya saing dan kinerja yang lebih baik jika memiliki spirit kewirausahaan; (2) lembaga pengembangan tes akan lebih mudah mendapatkan support and legitimacy jika hasil riset, produk, dan kerjasamanya mampu memberi public value bagi stakeholder; (3) lembaga pengembangan tes akan mudah memiliki reputasi jika didukung oleh independensi dengan fungsi kerja yang terintegrasi; dan (4) legitimasi suatu lembaga kuat karena adanya dukungan dari otoritas lingkungan serta kemampuan organisasi dalam menciptakan public value yang bersumber dari kapabilitas organisasi. Saran bagi pemerintah Indonesia dalam rangka membentuk lembaga pengembangan tes credible and legitimate, yang mampu berperan dalam program
penilaian nasional termasuk di dalamnya UN, adalah: (1) dibentuk lembaga yang independen dengan fungsi kerja yang terintegrasi. (2) Perlunya menerapkan konsep manajemen publik baru seperti NPM yang memiliki spirit kewirausahaan (entrepreneurial government). (3) Mampu menghasilkan public value melalui produk dan jasa yang dihasilkan.
DAFTAR PUSTAKA Jackson, N.J. (1998a). Introduction to Benchmarking assessment practice in N. Jackson (ed.) Pilot studies in Benchmarking Assessment Practice in UK Higher Education. Gloucester: Quality Assurance Agency. Lan, Zhiyong and Rosenbloom , David H. (1992). Editorial, Public Administration Review, 52, 6, 1992. Osborne, David and Gaebler, Ted (1995). Mewirausahakan Birokrasi: Mentransformasi Semangat Wirausaha ke dalam Sektor Publik, Jakarta: Penerbit PPM.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
86
Implementasi New Public Management Pada Lembaga Pengembangan Tes
Price, I. (1994). A Plain Person’s Guide to Benchmarking. Special Report of the Unit for Facilities
Yin, Robert K. (1984). Case study researh: Design and Methods. Beverly Hills, CA: Sage Publications.
Management Research. Sheffield: Sheffield Halam University.
Permendiknas Nomor 2 tahun 2011 http://en.wikipedia.org/wiki/Netherlands https://en.wikipedia.org/wiki/Australia
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
87
PEMBELAJARAN KOOPERATIF NHT UPAYA MENINGKATKAN HASIL BELAJAR IPA SISWA KELAS VIII-I SMPN 228 JAKARTA Tri Suyani Guru IPA SMPN 228 Jakarta Pusat E-mail:
[email protected]
ABSTRACT To Improve the result of students science learning on the concept of System In life of Plant towards cooperative learning Numbered Heads Together (NHT) in class VIII-1 SMP 228 central Jakarta year 2009/2010. The purpose of this research is to improve the result of students science learning in the system concept in Life of Plants, also increase the activity of students in learning science. The method used is the method of classroom action research. Indicators that measure are the quality of the learning result, active learners in the learning process and students' motivationof learners.. The experiment was conducted in two cycles. In the first cycle, the indicator has achieved the learning outcomes of students achieving mastery learning 71.1% with an average score of 63.7. The average activity reached 60.5% learners and learners already motivated to be active in the learning process. In the second cycle, an increasing indicators of the learning result that 84.2% of students had reached KKM (completeness) with an average score of 69.3. The average active learners also increased to 72.4%, as well as increasing student motivation by looking at the results of the questionnaire and the positive response of students towards cooperative learning model NHT. This suggests cooperative learning model Numbered Heads Together (NHT) to improve learning outcomes of students in system concept in the Life of Plants. Keywords : Cooperatif learning, Cooperatif learning NHT, Result of science learning
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
88
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar IPA Siswa Kelas VIII-I SMPN 228 Jakarta
ABSTRAK Meningkatkan hasil belajar peserta didik dalam mata pelajaran IPA pada konsep Sistem Dalam Kehidupan Tumbuhan melalui pembelajaran kooperatif model Numbered Heads Together ( NHT ) di kelas VIII-1 SMPN 228 Jakarta Pusat tahun 2009/2010. Tujuan penelitian ini adalah meningkatkan hasil belajar peserta didik dalam mata pelajaran IPA pada konsep Sistem Dalam Kehidupan Tumbuhan, juga meningkatkan aktifitas siswa dalam pembelajaran IPA. Metode yang digunakan adalah metode Penelitian Tindakan Kelas. Indikator yang diukur adalah kualitas hasil belajar, keaktifan peserta didik dalam proses pembelajaran dan motivasi belajar peserta didik. Penelitian dilaksanakan dalam dua siklus. Pada siklus I, indikator hasil belajar telah tercapai yaitu ketuntasan belajar peserta didik mencapai 71,1 % dengan nilai rata-rata 63,7. Rata-rata keaktifan pserta didik mencapai 60,5 % dan peserta didik sudah mulai termotivasi untuk aktif dalam proses pembelajaran. Pada siklus II, terjadi peningkatan pada indikator hasil belajar yaitu 84,2 % peserta didik sudah mencapai KKM ( ketuntasan ) dengan nilai rata-rata 69,3. Rata-rata keaktifan peserta didik juga meningkat menjadi 72,4 %, demikian juga motivasi peserta didik semakin meningkat dengan melihat hasil kuesioner dan tanggapan positif peserta didik terhadap model pembelajaran kooperatif tipe NHT. Ini menunjukkan model pembelajaran kooperatif tipe Numbered Heads Together ( NHT ) dapat meningkatkan hasil belajar peserta didik pada konsep Sistem Dalam Kehidupan Tumbuhan. Kata kunci: pembelajaran kooperatif, pembelajaran kooperatif NHT, hasil belajar IPA
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
89
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
PENDAHULUAN
yang dicapai dapat diukur melalui penilaian hasilbelajar.
Pada umumnya mata pelajaran IPA (Ilmu Pengetahuan Alam) masih memiliki nilai akademik yang rendah pada kebanyakan sekolah di Jakarta. Hal ini diketahui dari diskusi antar guru pada pertemuan – pertemuan MGMP IPA, termasuk di SMP negeri 228 Jakarta Pusat, prestasi akademik mata pelajaran IPA masih rendah. IPA di SMP merupakan mata pelajaran gabungan dari disiplin ilmu biologi, fisika dan kimia yang menurut sebagian besar pesertadidik di SMPN 228 merupakan materi pelajaran yang sulit, sehingga kurang diminati. Hal ini disebabkan oleh banyak faktor antara lain adalah: (1) Strategi dan metode mengajar masih bersifat konvensional, (2) Peserta didik tidak dilibatkan secara aktif dalam proses pembelajaran. (3) Proses pembelajaran masih berpusat pada guru. Proses pembelajaran merupakan proses interaksi antara peserta didik dengan guru sebagai pengajar. Proses pembelajaran dilaksanakan dengan menggunakan strategi maupun metode mengajar. Keberhasilan belajar peserta didik
Jika diamati di lapangan, proses pembelajaran di sekolah dewasa ini kurang meningkatkan motivasi dan aktivitas siswa. Masih banyak tenaga pendidik yang menggunakan tipe konvensional secara monoton dalam kegiatan pembelajaran di kelas, sehingga suasana belajar terkesan kaku dan didominasi oleh guru. Pada penyampaian materi biasanya guru menggunakan tipe ceramah dimana siswa hanya duduk, mencatat dan mendengarkan apa yang disampaikan guru dan sedikit peluang bagi siswa untuk bertanya. Dengan demikian suasana pembelajaran menjadi tidak kondusif sehingga siswa menjadi pasif. Salah satu metode mengajar yaitu Cooperative Learning yangditandaidengan peserta didik belajar dalam kelompok/team untuk mencapai tujuan belajar. Metode ini sangat beragam, salah satu model pembelajaran Cooperative Learning adalah model pembelajaran tipe NHT (Numbered Heads Together), yang dikembangkan oleh Spencer Kagan ( 1998 ). Untuk meningkatkan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
90
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
hasil belajar peserta didik dalammata pelajaran IPA, penulis mencoba menggunakan model pembelajaran NHT yang berpusat pada peserta didik sehingga dapat merangsang siswa untuk lebih aktifdan kreatif. Belajar kooperatif merupakan salah satu upaya untuk mewujudkan pembelajaran yang aktif, inovatif, kreatif, efektif dan menyenangkan. Belajar kooperatif memberikan kesempatan pada siswa untuk saling berinteraksi. Siswa yang saling menjelaskan pengertian suatu konsep pada temannya sebenarnya sedang mengalami proses belajar yang sangat efektif yang bisa memberikan hasil belajar yang jauh lebih maksimal daripada kalau dia mendengarkan penjelasan guru. Berdasarkan latar belakang masalah di atas, maka penulis mengidentifikasi masalah sebagai berikut: 1) Apakah model pembelajaran cooperative type Numbered Heads Together (NHT) dapat meningkatkan hasil belajar peserta didik pada konsep sistem dalam
kehidupan tumbuhan di kelas VIII-1 SMP Negeri 228 jakarta pusat tahun 2009/2010? 2) Apakah model pembelajaran kooperative tipe Numbered HeadsTogether (NHT) dapat meningkatkan aktifitas belajar peserta didik pada konsep sistem dalam kehidupan tumbuhan di kelas VIII-1 SMP Negeri 228 Jakarta Pusat tahun 2009/2010? 3) Bagaimana penerapan pembelajaran kooperative tipe NHT di kelas dalam mata pelajaran IPA pada konsep sistem dalam kehidupan tumbuhan. Berdasarkan deskripsi di atas, masalah dalam tinjauan ilmiah ini adalah sebagai berikut: Apakah model pembelajaran kooperative tipe Numbered Head Together (NHT) dapat meningkatkan hasil belajar peserta didik pada konsep sistem dalam kehidupan tumbuhan di kelas VIII-1 SMP Negeri 228 Jakarta Pusat? Bertujuan untuk Meningkatkan hasil belajar siswa dalam mata pelajaran IPA.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
91
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Adapun mamfaat yang diharapkan adalah: 1. Bagi Siswa, menumbuhkan semangat belajar siswa yang tinggi 2. Bagi Guru, mengembangkan wawasan dalam mengunakan berbagai model Pembelajaran 3. Bagi sekolah, Mengembangkan strategi pembelajaran untuk meningkatkan hasil belajar peserta didik pada semua mata pelajaran di SMP Negeri 228 Jakarta Pusat.
KAJIAN LITERATUR Pembelajaran Menurut Degeng (lihat Hamzah B.Uno 2006:2) pembelajaran atau pengajaran adalah upaya untuk membelajarkan siswa. Dalam pengertian ini secara implisit dalam pengajaran terdapat kegiatan memilih, menetapkan, mengembangkan metode untuk mencapai hasil pengajaran yang diinginkan. Pemilihan, penetapan dan pengembangan metode ini didasarkan pada kondisi pengajaran yang ada. Kegiatan ini pada
dasarnya merupakan inti dari perencanaan pembelajaran. Istilah pembelajaran memiliki hakikat perenca-naan atau perancangan (desain) sebagai upaya untuk membelajarkan siswa. Dalam belajar, siswa tidak hanya berinteraksi dengan guru sebagai salah satu sumber belajar, tetapi berinteraksi dengan kaseluruhan sumber belajar yang dipakai untuk mencapai tujuan pembelajaran yang diinginkan. Karena itu pembelajaran memusatkan perhatian pada “bagaimana membelajarkan siswa”, bukan pada “apa yang dipelajari siswa”. Pembelajaran adalah proses interaksi peserta didik dengan pendidik dan sumber belajar pada suatu lingkungan belajar (Sisdiknas, Bab 1 pasal 1 ayat 20). Belajar pada dasarnya merupakan peristiwa yang bersifat individual yakni terjadinya perubahan tingkah laku sebagai dampak dari pengalaman individu. Pengalaman dapat berupa situasi belajar yang sengaja diciptakan oleh orang lain atau situasi yang tercipta begitu adanya. Peristiwa belajar yang terjadi karena dirancang oleh orang lain di luar diri individu sebagai pebelajar biasa disebut
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
92
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
proses pembelajaran. Proses ini biasa dirancang oleh guru. Istilah belajar berarti suatu proses perubahan sikap dan tingkah laku pada diri individu yang biasanya terjadi setelah adanya interaksi dengan sumber belajar, sumber belajar ini dapat berupa buku, lingkungan, guru atau sesama teman. Pembelajaran IPA Pembelajaran IPA sebaiknya dilaksanakan secara Inquary Ilmiah (Scientific Inquiry) untuk menumbuhkan kemampuan berfikir, bekerja dan bersikap ilmiah serta mengkomunikasikannya sebagai aspek penting kecakapan hidup ( KTSP, 2006 ). Ilmu Pengetahuan Alam adalah ilmu yang mempelajari fenomena–fenomena di alam semesta. Ilmu pengetahuan Alam memperoleh kebenaran tentang fakta dan fenomena alam melalui kegiatan empirik. Ilmu pengetahuan Alam berkaitan dengan fakta, konsep, prinsip dan juga proses penemuan itu sendiri. Penemuan diperoleh melalui eksperimen yang dapat dilakukan di laboratorium maupun di alam bebas.
Pengertian Hasil Belajar Menurut Ahmadi (1984 : 35) hasil belajar adalah hasil yang dicapai dalam satu usaha berupa prestasi belajar pada setiap tes. Menurut Ahmad Sabri ( 2007 : 39 ) kriteria keberhasilan belajar dapat dilihat dari sudut prosesnya dan ditinjaudari sudut hasil yang dicapainya. Dari sudut proses menekankan kepada pengajaran sebagai suatu proses haruslah merupakan interaksi dinamis. Sehingga siswa sebagai subjek yang belajar mampu mengembangkan potensinya secara efektif. Dari segi hasil atau produk menekankan kepada tingkat penguasaan tujuan oleh siswa baik dari segi kualitas maupun kwantitas. Kedua kriteria tadi tidak bisa berdiri sendiri tetapi harus merupakan pengajaran bukan hanya mengejar hasil yang setinggi-tingginya sambil mengabaikan proses, tetapi keduanya ada dalam keseimbangan. Dengan kata lain, pengajaran tidak semata-mata out oriented tetapi juga proses oriented. Hasil belajar yang dicapai peserta didik dipengaruhi oleh dua faktor yaitu :
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
93
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Faktor kemampuan yang dimiliki peserta didik dan faktor lingkungan. Menurut Clark (Ahmad Sabri 2007: 45) bahwa hasil belajar siswa di sekolah 70 persen dipengaruhi kemampuan siswa dan 30 persen dipengaruhi oleh lingkungan. Salah satu faktor lingkungan yang paling dominan mempengaruhi hasil belajar adalah kualitas pengajaran. Yang dimaksud kualitas pengajaran ialah tinggi rendahnya atau efektif tdaknya proses belajar-mengajar dalam mencapai tujuan pengajaran. Kualitas pengajaran sangat dipengaruhi oleh kompetensi guru. Selain itu dipengaruhi juga oleh karakteristik kelas dan karakteristik sekolah. Menurut E. Mulyana penilaian hasil belajar dalam KTSP dapat dilakukan dengan penilaian kelas, tes kemampuan dasar, penilaian akhir satuan pendidikan dan sertifikasi, penilaian program. Dalam penelitian penulis menggunakan penilaian kelas dengan ulangan harian. Ulangan harian dilakukan setelah selesai dalam proses pembelajaran pada konsep tertentu.
Model Pembelajaran Cooperative Learning Tipe NHT (Numbered Head Together) Menurut Richard I. Arends model Cooperative Learning dikembangkan untuk mencapai paling sedikit tiga tujuan penting : prestasi akademis, toleransi dan penerimaan terhadap keanekaragaman, danpengembangan ketrampilan sosial. Slavin, salah seorang pencetus cooperative learning, percaya bahwa fokus kelompok pada cooperative learning dapat mengubah norma – norma dalam budaya anak muda dan membuat prestasi tinggi dalam tugas – tugas belajar akademis lebih dapat diterima. Selain mengubah norma yang terkait dengan prestasi, cooperative learning dapat menguntungkan bagi siswa berprestasi rendah maupun tinggiyang mengerjakan tugas akademik bersama – sama. Lingkungan cooperative learning mempersiapkan siswa untuk belajar tentang kolaborasi dan berbagai ketrampilan sosial yang sangat berharga yang akan mereka gunakan sepanjang hidupnya.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
94
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Dalam tinjauan penelitian pembelajaran koperatif, kesepakatan umum didapat bahwa metode seperti pembelajaran koperatif ini dapat meningkatkan pen capaian belajar peserta didik, mempercepat pembelajaran, meningkatkan daya ingat dan memiliki hasil akhir yaitu tindakan positif terhadap pembelajaran itu sen diri. Johnson bersaudara telah menemukan dua komponen penting dari pendekat-an Colaborative learning yang berhasil meliputi: a) Pertanggungjawaban individual. Keberhasilan kelompok didasarkan pada kemampuan setiap anggota untuk menunjukkan bahwa dia telah belajar materi-materi yang sangat dibutuhkan. Pencapaian siswa terlihat meningkat ketika di ketahui keberhasilan kelompok yang didasarkan pada nilai quiz anggota kelompok yang digabungkan, atau ketika suatu proyek atau salah satu anggota kelompok berperan serta dalam suatu proyek tim.
b) Ketergantungan positif. Keberhasilan kelompok didasarkan atas kemampuan kelompok itu dalam bekerjasama untuk meraih hasil yang diinginkan, misalnya tingkatan penghargaan, waktu luang dan ketenaran (pengakuan). Menurut Richard I Arends ( 2007: 16 ), NHT adalah pendekatan yang dikembangkan oleh Spencer kagan (1998) untuk melibatkan lebih banyak peserta didik dalam reviu berbagai materi yang dibahas dalam sebuah pelajaran dan untuk memeriksa pemahaman mereka tentang isi pelajaran itu. Langkahnya adalah sebagai berikut: Langkah 1-Numbering. Guru membagi peserta didik menjadi beberapa kelompok beranggota tiga sampai lima orang dan memberi nomor sehingga setiap peserta didik pada masing-masing kelompok memiliki nomor antara satu sampai lima.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
95
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Langkah 2- Questioning. Guru mengajukan sebuah pertanyaan atau memberikan tugas pada peserta didik. Pertanyaan atau tugasnya bisa bervariasi. Langkah 3- Head Together. Peserta didik menyatukan kepalanya untuk menemukan jawabannya dan memastikan bahwa semua anggota kelompok dapat mengerjakannya atau mengetahui jawabannya. Langkah 4-Answering. Guru memanggil sebuah nomor dan peserta didik dari masing-masing kelompok yang memiliki nomor itu mengangkat tangannya dan memberikan jawabannya atau melaporkan hasil kerjasamanya kehadapan seluruh kelas. Lalu guru menunjuk nomor yang lain, demikian seterusnya sampai selesai, dan bersama-sama membuat kesimpulan.
METODE PENELITIAN Penelitian Tindakan Kelas ini dilaksanakan di SMP Negeri 228 Jakarta pusat tahun pelajaran 2009/2010 semester ganjil. Peserta didik di kelas tersebut berjumlah 38 orang dengan karakteristik siswa umum pada kelas-kelas lainnya. Penelitian ini dilaksanakan mulai bulan oktober sampai dengan bulan desember tahun 2009. Metode Penelitian Metode penelitian yang digunakan adalah Penilitian Tindakan Kelas (PTK). Langkah-langkah penelitian yang direncanakan selalu dalam bentuk siklus yang memungkinkan terjadinya kerja kelompok maupun kerja mandiri secara intensif (Sukardi, 2004 : 212) Sampling Subjek penelitian adalah siswa kelas VIII-1 SMP Negeri 228 Jl. Sumur Batu Raya no.6, Kelurahan Sumur Batu, kecamatan Kemayoran, Jakarta Pusat.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
96
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Analisis Data
RP
SM 100%
1. Analisis data kuantitatif Data kuantitatif diperoleh melalui evaluasi tes hasil belajar setelah siklus I dan setelah siklus II. Hal ini dimaksudkan agar setiapberakhirnya siklus dapat diketahui kemajuan dan perkembangan siswa melalui pembelajaran kooperatif tipe NHT. Data tes pada siklus I dapat dijadikan bahan pertimbangan dan acuan untuk merencanakan pelaksanaan pada siklus berikutnya.
Keterangan:
Tes tertulis
Indikator keaktifan siswa antara lain :
Pengolahan data tes tertulis dapat dihitung dengan rumus :
siswa aktif dalam proses pembelajaran dengan model pembelajaran yang diterapkan (kerja sama dengan teman/ kelompok)
B
N 100
NP RP SM 100
= = = =
Nilai prosen yang dicari Skor tiap item Skor maksimum Bilangan tetap
2. Analisis data kualitatif Data kualitatif diperoleh melalui angket siswa, dan wawancara untukmengetahui keaktifan belajar siswa.
Keterangan : B = Jawaban yang benar N = Banyaknya soal
Siswa aktif menanggapi dan menjawab dalam diskusi
Lembar observasi
Siswa aktif menjawab pertanyaan yang diberikan guru.
Pengolahan data obeservasi dapat dihitung dengan rumus :
Siswa bertanya pada guru bila tidak memahami materi yang disampaikan guru.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
97
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Prosedur Penelitian Penelitian tindakan kelas (PTK)ini dimaksudkan untuk meningkatkan hasil belajar siswa dan aktifitas belajar siswa yang berkaitan dengan proses pembelajaran di kelas. Langkah-langkah yang ditempuh mulai dari perencanaan sampai dengan pelaksanaan penelitian akan dijabarkan dalam uraian berikut ini. Desain Penelitian
HASIL PENELITIAN DAN PEMBAHASAN Pelaksanaan penelitian ini dilakukan dengan dua siklus yaitu siklus I dan siklus II. Siklus I dilaksanakan bulan oktober 2009 dan siklus II dilaksanakan bulan November 2009. Pada akhir setiap siklus diadakan evaluasi/ tes. Penelitian ini berupaya untuk mengemukakan hasil implementasi dari proses pembelajaran dengan model kooperatif learning tipe Numbered Heads Together dalam rangka meningkatkan hasil belajar dan aktifitas siswa dalam proses pembelajaran. Hasil penelitian dan beberapa temuan saat pelaksanaan berlangsung beserta pembahasannya akan diuraikan pada masingmasing siklus berikut ini: A. Siklus I Berdasarkan hasil evaluasi belajar pada materi kompetensi dasar sebelumnya yaitu sebelum melaksanakan siklus I, dengan menggunakan model pembelajaran konvensional diperoleh data awal sebagai
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
98
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
berikut nilai rata-rata siswa 56,7 , siswa yang tuntas sebanyak 19 orang, dan yang tidak tuntas sebanyak 19 orang, prosentase ketuntasan kelas 50 %. Hal ini menunjukkan bahwa kemampuan pemahaman konsep siswa secara umum masih dibawah Kriteria Ketuntasan Minimal yang telah ditetapkan yaitu 60. Berdasarkan hasil evaluasi belajar pada materi sebelumnya, ini dijadikan dasar pertimbangan dalam melakukan suatu upaya untuk meningkatkan pemahaman konsep Sistem dalam kehidupan tumbuhan dengan menggunakan model pembelajaran kooperatif tipe NHT/Numbered Heads Together. Setelah proses pembelajaran yang berlangsung di siklus I dengan konsep pada kompetensi dasar Mengidentifikasi Struktur dan Fungsi jaringan Tumbuhan, sebanyak 3 kali pertemuan maka untuk mengetahui adanya peningkatan hasil belajar setelah diberi tindakan, siswa diberikan evaluasi yang dilaksanakan hari jum’at tanggal 30 Oktober 2009. Berdasarkan hasil evaluasi pada akhir siklus I diperoleh skor nilai rata-
rata 63,7 dan prosentase ketuntasan belajar mencapai 71,1%, yaitu sebanyak 27 siswa yang sudah tuntas, dan hanya 11 orang siswa yang belum tuntas. Ini menunjukkan adanya peningkatan hasil belajar dibandingkan hasil belajar pada evaluasi sebelum diberikan tindakan siklus I. Tabel 1: Nilai hasil belajar tes siklus I Nilai rata-rata
63,7
Jumlah siswa yang tuntas
27
Jumlah siswa tidak tuntas
11
Prosentase siswa tuntas (%)
71,1
Prosentasi siswa tidak tuntas (%)
28,9
Tepat memenuhi KKM
7
Melewati KKM
20
Keterangan : Nilai diisi dengan skala 0 – 100 Kriteria Ketuntasan Minimal ( KKM ) = 60 Siswa dikatakan tuntas jika nilai ≥ 60
Prosentaseketuntasanbelajar Jumlahsiswayang tuntas 100% Jumlahseluruhsiswa
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
99
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Pada siklus I pertemuan pertama , yaitu hari rabu tanggal 21 Oktober 2009, setelah guru membuka pelajaran dengan memberikan motivasi dan menyebutkan tujuan pembelajaran, guru menjelaskan kegiatan yang akan dilakukan dan menjelaskan tentang model pembelajaran yang akan diterapkan yaitu model kooperatif tipe Numbered Heads Together. Selanjutnya siswa berada pada tatanan kelompok masingmasing yang terdiri dari sembilan kelompok, tujuh kelompok beranggotakan empat orang dan dua kelompok terdiri dari lima orang siswa. Kemudian guru membagikan LKS pada setiap kelompok. Masing-masing kelompok melakukan percobaan secara berkelompok dan menuliskan hasilnya dalam LKS. Diakhir pelajaran tiap anggota kelompok yang bernomor sama membacakan hasil kerja kelompoknya didepan kelas.Lalu guru mengajukan pertanyaan berupa kuis, dan membantu membuat kesimpulan bersamasama siswa. Dalam melaksanakan proses pembelajaran, peneliti mengamati aktifitas siswa, diantaranya kerjasama dalam
kelompok dan menjawab pertanyaan kuis yang diajukan oleh guru,aktif menanggapi diskusi, bertanya pada guru jika tidak mengerti, pengamatan peneliti juga dibantu oleh seorang observer teman sejawat. Pada siklus I pertemuan pertama, banyak siswa yang masih terlihat bingung, karena baru mengenal model pembelajaran NHT dan belum terbiasa. Pada pertemuan pertama masih sedikit siswa yang menanggapi siswa dari kelompok lain yang memberi jawaban pada saat diskusi. Tapi untuk pertemuan kedua dan ketiga terlhat siswa mulai terbiasa dengan model pembelajaran ini. Dan makin banyak siswa yang terlihat aktif. Namun masih ada siswa yang tidak terlalu berperan dalam kelompok hanya mengandalkan teman dalam satu kelompoknya. Berdasarkan data hasil observasi pada siklus I dengan tiga kali pertemuan diperoleh 27 orang siswa (71% ) yang aktif bekerja sama dalam kelompok, 26 orang siswa (68,4%) yang bertanya pada guru, dan 20 orang siswa (52,6% ) yang aktif menjawab pertanyaan guru,19 siswa (50%) yang aktif menanggapi
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
100
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
diskusi. Prosentase rata-rata aktifitas belajar siswa pada siklus I ini sebesar 60,06%. Berdasarkan hasil analisis data yang diperoleh dari hasil evaluasi di akhir siklus I dan dari data lembar observasi di siklus I, bahwa setelah proses pembelajaran yang dilakukan sebanyak 3 kali pertemuan ( setelah diberi tindakan ), ternyata penerapan pembelajaran dengan menggunakan model pembelajaran kooperatif tipe NHT pada konsep Sistem Dalam Kehidupan Tumbuhan memberikan hasil yang cukup memuaskan sesuai dengan target yang diharapkan. Apabila dibandingkan dengan hasil evaluasi sebelum dilakukan siklus terjadi peningkatan nilai rata-rata kelas sebesar 7 dan peningkatan prosentase ketuntasan belajar sebesar 21,1 %. Peningkatan ini cukup berarti dan bisa dikatakan memenuhi kategori berhasil, karena siswa yang mencapai nilai ≥60 (diatas KKM yang telah ditetapkan) sudah lebih dari 50 % (indikator keberhasilan siklus I ). Sedangkan dalam hal aktifitas, secara keseluruhan aktifitas belajar di siklus I sudah
termasuk kategori aktif, karena kriteria keaktifan kelas dikatakan aktif apabila proses aktifitas kelas berkisar antara 60-76%. Namun dalam menjawab pertanyaan yang diberikan guru, dan keaktifan menanggapi diskusi masih kurang, hal ini karena siswa belum terbiasa berbicara di depan forum diskusi. Dan juga diperkirakan siswa belum menguasai materi yang sedang dibahas, sehingga timbul rasa tidak percaya diri atau suatu keragu-raguan untuk menjawab pertanyaan. Sehingga perlu ada pendekatan guru terhadap siswa untuk bisa merangsang atau menumbuhkan rasa percaya diri bagi siswa dengan cara belajar yang maksimal dan menjelaskan bahwa hal ini masih sedang taraf belajar. Siswa juga perlu dilatih keberanian mentalnya untuk mau mencoba aktif dalam menanggapi diskusi. Hasil yang diperoleh dalam siklus I ini akan dijadikan acuan untuk dapat diperbaiki lagi pada siklus II. Kekurangaan metode dalam proses pembelajaran perlu diperbaiki, dan siswa juga lebih disiapkan lagi untuk materi pelajaran selanjutnya.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
101
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
B. Siklus II Siklus kedua dilaksanakan pad tanggal 4, 6, dan 11 november 2009. Terdiri dari tiga pertemuan yang merupakan proses pembelajaran dan satu pertemuan melaksanakan tes. Siklus kedua merupakan refleksi dari siklus pertama. Kekurangan pada siklus I diperbaiki pada siklus II ini antara lain penyampaian materi yang diperjelas, metode pembelajaran yang maksimal, menggunakan media yang lebih baik. Pada pertemuan pertama metode yang digunakan adalah eksperimen dan diskusi. Pelaksanaan percobaan fotosintesis dilaksanan setelah guru membuka pelajaran dengan member motivasi dan menyampaikan tujuan pembelajaran, dan guru mengarahkan bagaimana cara yang benar melaksanakan percobaan. Konsep yang dipelajari di siklus II pertemuan pertama dan kedua adalah kompetensi dasar Proses perolehan nutrisi dan Transformasi energi pada tumbuhan. Sedangkan pada pertemuan ketiga adalah kompetensi dasar Mendeskripsikan macammacam gerak pada tumbuhan. Hasil yang
diperoleh dari evaluasi/tes akhir siklus II adalah skor nilai rata-rata kelas sebesar 69,3 dan ketuntasan belajar siswa mencapai 84,2%, yaitu 32 orang siswa yang sudah tuntas dan hanya 6 orang siswa yang tidak tuntas. Rata -rata nilai
69,3
Jumlah siswa yang tuntas
32
Jumlah siswa tidak tuntas
6
Prosentasi siswa tuntas(%)
84,2
Prosentasi siswa tidak tuntas(%)
15,8
Tepat memenuhi KKM
7
Melewati KKM
25
Keterangan :
Nilai diisi dengan skala 0 – 100 Kriteria Ketuntasan Minimal ( KKM ) = 60 Siswa dikatakan tuntas jika nilai ≥ 60 T = Tuntas, TT = Tidak Tuntas
Prosentaseketuntasanbelajar Jumlahsiswayang tuntas 100% Jumlahseluruhsiswa Pada siklus II ini, prosentase aktifitas siswa meningkat dari siklus I. Siswa yang aktif bekerja sama dalam kelompok pada siklus II
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
102
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
sebanyak 31 orang (81,6 %) ini berarti naik 10,6 % dari siklus I (71 %), bertanya dengan guru sebanyak 29 orang (76,3%) naik 7,9% dari siklus I (68,4%), menjawab pertanyaan gurus sebanyak 25 orang (65,8 %) naik 13,2 % dari siklus I (52,6 %), aktif menanggapi diskusi sebanyak 25 orang (65,8%) naik15,8 % dari siklus I ( 50% ). prosentase rata-rata keaktifan siswa siklus II sebesar 72,4 % naik 11,9 % dari prosentase klasikal siklus I ( 60,5 % ). Setelah siklus I sampai siklus II dilaksanakan dengan proses pembelajaran sebanyak 6 kali pertemuan maka berdasarkan analisis data kegiatan siswa diperoleh hasil data peningkatan sebagai berikut .Untuk lebih jelasnya dapat dilihat pada tabel berikut ini Tabel 5 : Persentase hasil belajar Hasil Belajar Nilai ratarata Prosen ketuntasan belajar
Siklus
Perbedaan
II
III
663,7
69,3
5,6
71,1%
84,2%
13,1%
Tabel 6: Persentase Aktivitas Kelas Aktifitas
a. Kerjasama dengan teman/ kelompok. b. Bertanya pada guru bila tidak memahami materi c. Menjawab pertanyaan dari guru/kuis d. Aktif menanggapi diskusi Rata-rata Aktifitas
Persentasi Aktifitas Kelas (%)
Perbedaan
Siklus I
Siklus II
71
81,6
10,6
68,4
76,3
7,9
52,6
65,8
13,2
50
65,8
15,8
60,5
72,4
11,9
Berdasarkan data tabel tersebut di atas, secara umum dikatakan bahwa hasil belajar meningkat. Kenyataan ini bisa dijelaskan bahwa setelah peneliti melaksanakan perubahan dengan menggunakan model pembelajaran kooperatif tipe NHT, siswa menjadi lebih tertarik untuk belajar IPA khususnya pada konsep Sistem Dalam Kahidupan Tumbuhan. Dengan model pembelajaran kooperatif tipe
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
103
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
NHT siswa tertantang untuk selalu bekerja dalam kelompok dan aktif dalam proses pembelajaran.
dan keaktifan tiap siswa, hasil belajar siswa dapat meningkat.
Dengan meningkatnya keaktifan siswa dalam proses pembelajaran, siswa menjadi lebih memahami pelajaran itu terutama memahami konsep Sistem Dalam Kehidupan Tumbuhan. Dengan memahami konsep yang dipelajari tentu hasil belajar siswa menjadi meningkat. Dengan adanya peningkatan keaktifan siswa dalam proses pembelajaran, maka hasil belajar siswa siswa juga dapat meningkat. Hasil belajar siswa dapat dilihat dari nilai ulangan yang diberikan pada siklus I mengalami peningkatan dari ulangan sebelumnya dan ulangan setelah akhir siklus II mengalami lagi peningkatan dari siklus I.
SIMPULAN DAN SARAN
Hasil belajar juga dapat dilihat dari proses pembelajaran yang terus meningkat pada tiap pertemuannya. Interaksi siswa dengan guru, interaksi siswa dengan siswa pada tiap pertemuan terjadi peningkatan. Hasil laporan kerja tiap kelompok mengalami peningkatan menjadi lebih baik. Maka dapat dikatakan dengan adanya motivasi yang besar
Kesimpulan Berdasarkan hasil analisis data penelitian yang diuaraikan pada Bab. IV tentang proses pembelajaran pada konsep Sistem Dalam Kehidupan Tumbuhan dengan menggunakan model pembelajaran kooperatif tipe Numbered Heads Together (NHT ), dapat disimpulkan sebagai berikut: 1. Proses pembelajaran dengan model pembelajaran kooperatif tipe NHT dapat meningkatkan hasil belajar pada konsep Sistem Dalam Kehidupan Tumbuhan. Peningkatan hasil belajar dapat dilihat dari ketuntasan belajar siswa. Ternyata peningkatan ketuntasan belajar sebesar 13,1%, yaitu dari 71,1% pada siklus I menjadi 84,2% pada siklus II. 2. Proses pembelajaran dengan menggunakan model pembelajaran kooperatif tipe NHT dapat memotivasi
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
104
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
siswa dan meningkatkan aktifitas belajar siswa. Sehingga meningkatnya motivasi dan aktifitas siswa dalam proses pembelajaran dapat meningkatkan hasil belajar. Saran Saran-saran yang dapat disampaikan dari hasil penelitian tindakan kelas ini adalah sebagai berikut: 1. Guru sebaiknya menggunakan metode pembelajaran yang bervariatif, agar siswa tidak jenuh dalam menerima pelajaran, dam memilih metode pembelajaran yang sesuai degan materi yang akan disampaikan.
4. Pengelola pendidikan hendaknya lebih membantu menyediakan fasilitas sarana dan prasarana untuk kegiatan proses pembelajaran yang menggunakan model pembelajaran kooperatif khususnya tipe NHT. 5. Sebaiknya guru lebih banyak melakukan penelitian yang dapat menemukan caracara untuk meningkatkan mutu proses pembelajaran.
DAFTAR PUSTAKA Richard I. Arends. (2008). Learning To Teach (Belajar Untuk Mengajar). Yogjakarta: edisi ketujuh Pustaka Pelajar.
2. Guru hendaknya mengoptimalkan penggunaan model pembelajaran kooperatif tipe NHT, untuk meningkatkan hasil belajar siswa.
Ahmad, Sabri. (2007). Strategi belajar Mengajar & Micro Teaching, Quantum Teaching. Jakarta
3. Model-model pembelajaran kooperatif sebaiknya disosialisasikan pada guruguru,agar guru lebih banyak menggunakan model pembelajaran kooperatif.
Suhardjono (2009). Pertanyaan dan Jawaban disekitar Peneltian Tindakan Kelas dan
Hamzah, B. Uno. (2008). Perencanaan Pembelajaran. Jakarta: PT.Bumi Aksara.
Tindakan Sekolah. Indonesia.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
Malang:
Cakrawala
105
Pembelajaran Kooperatif NHT Upaya Meningkatkan Hasil Belajar Ipa Siswa Kelas VIII-I Smpn 228 Jakarta
Depdiknas (2003). Undang-Undang Republik Indonesia Nomor 20 Tahun 2003. Jakarta: Biro Hukum dan Organisasi Sekretariat Jendaral Depdiknas.
Mulyana (2006). Kurikulum Tingkat Satuan Pendidikan. Bandung: PT Rosdakarya. Depdikbud (1993). Pedoman Kegiatan Belajar Mengajar. Jakarta.
Dimiyati (1999). Belajar dan Pembelajaran. Jakarta: PT Rineka Cipta.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
106
KEMAMPUAN SISWA SMP DAN MTs DALAM MENGHITUNG HASIL OPERASI TAMBAH, KURANG, KALI, DAN BAGI PADA BILANGAN BULAT BERDASARKAN HASIL UJIAN NASIONAL 2010/2011 Safari Peneliti Utama di Pusat Penilaian Pendidikan, Balitbang Kemdikbud E-mail:
[email protected] ABSTRACT The main purpose of this study is to answer the following question. Are there differences in the level of Junior Secondary students' ability to add the ability to calculate the results of operations, less, times, and for the integers in the National Examination SMP/MTs in the Academic Year 2010/2011 in 33 provinces. The research method used was a survey method. The study population was all Mathematics items on UN SMP/MTs 2011, which is done by all students in 33 provinces, while the sample is one of the items on the ability to compute the results of operations added, less, times, and for the integers. Based on the results of analysis of variance obtained the following result. Firstly, Classification national capabilities, both junior and junior students, the ability to calculate the results of operations added , less , times , and for the integers is " very well "( 76.72 and 78.93 ), although there are some provinces that are included in the classification and well being. Second, the classification ability of students in Junior Secondary suggests that the ability to calculate the results of operations added, less, times, and for the integers in the junior students (mean 78.93 and SD 8.45) was better than junior high school students (mean 76.72 and 8.15 SD). Third, differences in the ability of students in Junior Secondary on the ability to calculate the results of operations added, less, times, and for the integers is not proven. It means that there is no significant difference in
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
107
Junior Secondary students' ability to add the ability to calculate the results of operations, less, times, and for the integers (P-value = 0.283). Keywords: ability students, counting, integers, UN. ABSTRAK Tujuan utama studi ini adalah menjawab pertanyaan berikut. Apakah terdapat perbedaan tingkat kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada Ujian Nasional SMP/MTs Tahun Pelajaran 2010/2011 di 33 Provinsi. Metode penelitian yang dipergunakan adalah metode survei. Populasi penelitian ini adalah semua butir soal Matematika pada UN SMP/MTs 2011 yang dikerjakan oleh semua siswa di 33 provinsi, sedangkan sampelnya adalah 1 butir soal tentang kemampuan terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Berdasarkan hasil analisis varian diperoleh hasil seperti berikut. Pertama, Klasifikasi kemampuan secara nasional, baik siswa SMP maupun MTs, kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah “baik sekali” (76,72 dan 78,93) walaupun ada beberapa provinsi yang termasuk dalam klasifikasi baik dan sedang. Kedua, klasifikasi kemampuan siswa SMP dan MTs menunjukkan bahwa kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada siswa MTs (Mean 78,93 dan SD 8,45) adalah lebih baik daripada siswa SMP (Mean 76,72 dan SD 8,15). Ketiga, perbedaan kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah tidak terbukti. Artinya tidak terdapat perbedaan yang signifikan kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat (P-value= 0,283). Kata kunci: kemampuan siswa, menghitung, bilangan bulat, UN.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
108
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
LATAR BELAKANG DAN MASALAH
pecahan dalam pemecahan masalah (Kelas 7 semester 1).
Dalam ujian nasional (UN) SMP/MTs tahun pelajaran 2010/2011 untuk mata pelajaran Matematika terdapat satu butir soal yang menanyakan hasil operasi pada bilangan bulat, yaitu kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Materi ini termasuk aspek bilangan. Mata pelajaran Matematika pada satuan pendidikan SMP/MTs meliputi aspek-aspek: bilangan, aljabar, geometri dan pengukuran, dan sitatistika dan peluang.
Masalah yang sering muncul adalah karena keterbatasan waktu belajar di kelas, guru menyuruh siswanya agar belajar mandiri. Penerapan metode belajar mandiri untuk kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat terdapat keunggulan dan keterbatasannya bagi siswa. Keunggulan belajar mandiri di antaranya adalah siswa lebih keras belajarnya, siswa mampu lebih lama untuk mengingat hal yang dipelajarinya, siswa memiliki rasa percaya diri dan tanggung jawab pribadi dapat. Adapun kelemahannya di antaranya adalah kurang adanya interaksi antara guru dengan siswa atau antarsiswa dengan siswa, apabila hanya dipakai metode satu jalur, kegiatan belajar bisa membosankan dan tidak menarik, program belajar mandiri belum tentu cocok untuk semua siswa atau semuaguru.
Dalam kurikulum SMP/MTs, kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat dijabarkan ke dalam dua kompetensi dasar (KD). Dalam standar kompetensi, aspek bilangan, peserta didik dapat memahami sifat-sifat operasi hitung bilangan dan penggunaannya dalam pemecahan masalah. Kemudian dirinci menjadi dua kompetensi dasar: (1) melakukan iperasi hitung bilangan bulat dan pecahan; (2) menggunakan sifatsifat operasi hitung bilangan bulat dan
Sekarang pertanyaannya adalah “Apakah siswa SMP dan MTs peserta ujian 2010/2011 sudah memenuhi syarat ketuntasan belajarnya untuk semua materi
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
109
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
pelajaran khususnya materi kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat?” Bila jawabannya sudah, siswa tidak akan mengalami kesulitan dalam menjawab pertanyaan UN karena peluang menjawab benar soal pasti tinggi. Bila jawabannya belum, siswa pasti akan mengalami kesulitan dalam menjawab pertanyaan UN karena peluang menjawab benar soal tergantung pada tingkat kemampuan siswanya. Bagaimana tingkat ketuntasan belajar siswa di setiap propinsi? Apakah mereka samasama tuntas atau sebaliknya? Bgaimana tingkat ketuntasan belajar antara siswa SMP dan MTs? Sesuai dengan lingkup penelitian ini, “Apakah siswa peserta ujian sudah memenuhi ketuntasan belajarnya untuk materi kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat?” Rumusan Masalah Dari berbagai uraian di atas rumusan masalah dalam penelitian ini adalah seperti berikut. Pertama, apakah tingkat kemampuan siswa SMP dan MTs dalam
menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat di 33 provinsi di Indonesia adalah sama? Kedua, apakah kemampuan siswa SMP lebih baik daripada kemampuan siswa MTs dalam hal menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat? Ketiga, apakah terdapat perbedaan tingkat kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat antara siswa SMP dan MTs? Oleh karena itu, permasalahan ini merupakan tujuan utama dalam penelitian ini. Tujuan Penelitian Berdasarkan rumusan masalah di atas, tujuan penelitian ini adalah seperti berikut ini. Pertama, untuk menentukan apakah tingkat kemampuan siswa SMP dan MTs dalam menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat di 33 provinsi di Indonesia adalah sama. Kedua, untuk menentukan apakah kemampuan siswa SMP lebih baik daripada kemampuan siswa MTs dalam hal menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
110
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
bulat. Ketiga, untuk menentukan apakah terdapat perbedaan tingkat kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat antara siswa SMP dan MTs. KAJIAN LITERATUR Matematika adalah ilmu pengetahuan tentang penalaran yang logic dan masalah yang berhubungan dengan bilangan (Sujono, 2006: 5). Matematika juga suatu ilmu yang memiliki objek dasar berupa fakta, operasi, dan prinsip (Pandoyo, 2002: 1). Di samping itu, matematika adalah bahasa yang menggambarkan serangkaian makna dari pernyataan yang ingin kita sampaikan, dengan matematika siswa dilatih untuk berpikir secara logika (Suriasumantri, 2005: 190). Sebagai ilmu pengetahuan pelajaran matematika bertujuan agar peserta didik memiliki kemampuan: (1) memahami konsep matematika, menjelaskan keterkaitan antarkonsep dan mengaplikasikan konsep atau algoritma, secara luwes, akurat, efisien, dan tepat, dalam pemecahan masalah; (2)
menggunakan penalaran pada pola dan sifat, melakukan manipulasi matematika dalam membuat generalisasi, menyusun bukti, atau menjelaskan gagasan dan pernyataan matematika; (3) memecahkan masalah yang meliputi kemampuan memahami masalah, merancang model matematika, menyelesaikan model dan menafsirkan solusi yang diperoleh; (4) mengomunikasikan gagasan dengan simbol, tabel, diagram, atau media lain untuk memperjelas keadaan atau masalah; (5) memiliki sikap menghargai kegunaan matematika dalam kehidupan, yaitu memiliki rasa ingin tahu, perhatian, dan minat dalam mempelajari matematika, serta sikap ulet dan percaya diri dalam pemecahan masalah. Penggunaan bilangan bulat dalam kehiduapan sehari-hari misalnya kapal selam digunakan untuk kepentingan penjagaan, perang, dan operasi-operasi penyelamatan. Karena bilangan bulat merupakan bilangan yang terdiri dari bilangan cacah dan negatifnya. Yang termasuk dalam bilangan cacah yaitu 0,1,2,3,4,… sehingga negatif dari bilangan cacah yaitu -1,-2,-3,-4,… dalam hal
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
111
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
ini -0 = 0 maka tidak dimasukkan lagi secara terpisah.Bilangan bulat terdiri atas himpunan bilangan bulat negatif {..., –3, –2, –1}, nol {0}, dan himpunan bilangan bulat positif {1, 2, 3, ...}. Oleh karena itu, para penyelam dan kapten kapal selam perlu mengetahui tingkat kedalaman laut. Jika permukaan air laut dinyatakan 0 meter maka tinggi di atas permukaan laut dinyatakan dengan bilangan positif dan kedalaman di bawah permukaan laut dinyatakan dengan bilangan negatif. Misalnya, kedalaman 10 m di bawah permukaan laut ditulis –10 m. Penggunaan bilangan bulat dalam kehidupan sehari-hari masih banyak lagi.
METODE PENELITIAN Metode penelitian yang dipergunakan adalah metode survei. Dasar penggunaan metode survei adalah disesuaikan dengan tujuan utama penelitian ini di antaranya adalah untuk memperoleh fakta-fakta dari
gejala-gejala yang ada dan mencari keterangan-keterangan secara faktual berdasarkan data penelitian ini. Populasi penelitian ini adalah semua butir soal Matematika pada UN SMP/MTs 2011, sedangkan sampelnya adalah 1 butir soal tentang menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Alasan pemilihan sampel adalah dari 40 butir soal yang diujikan hanya satu butir soal yang menanyakan hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Data dalam penelitian ini berbentuk skor tes yang dijawab siswa SMP dan MTs di 33 provinsi di seluruh Indonesia. Jumlah siswa SMP yang mengikuti Ujian Nasional (UN) tahun pelajaran 2010/2011 adalah 2853718 siswa yang belajar di 29951 SMP dan MTs 766783 siswa yang belajar di 13990 MTs. Jumlah siswa setiap provinsi dapat dilihat pada Tabel 1 berikut.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
112
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Tabel 1: Jumlah Siswa dan Sekolah SMP dan MTs Peserta Ujian Nasional Tahun Pelajaran 2010/2011 di 33 Provinsi
Sumber: Puspendik, Balitbang Kemdiknas 2012
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
113
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Metode analisis yang dipergunakan dalam penelitian ini adalah analisis varian. Analisis varian dipergunakan untuk menghitung perbedaan tingkat tingkat kemampuan memperbaiki kalimat tidak efektif dalam paragraf pada siswa SMP dan MTs. Agar hasil analisis penelitian ini dapat diperoleh secara akurat, maka semua data dalam penelitian ini diolah atau dianalisis dengan mempergunakan program SPSS 19.00.
HASIL PENELITIAN DAN PEMBAHASAN 1. Klasifikasi Kemampuan Setiap Provinsi Klasifikasi kemampuan pada setiap provinsi dapat dilihat pada hasil analisis Tabel 2 berikut ini. Tabel 2: Nilai Rata-rata Persentase Menjawab Benar pada Pertanyaan tentang Menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada Ujian Nasional SMP/MTs Tahun Pelajaran 2010/2011 di 33 Provinsi. Sumber: Puspendik, 2012
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
Balitbang
Kemdiknas
114
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Untuk mengetahui apakah nilai ratarata dalam Tabel 1 di atas termasuk klasifikasi baik sekali, baik, sedang, kurang, atau kurang sekali, nilai-nilai itu dikonversi atau disesuaikan dengan klasifikasi nilai pada Tabel 3 berikut (Pusat Penilaian Pendidikan, Badan Penelitian dan Pengembangan Pendidikan, 2012: 1). Tabel 3. Klasifikasi nilai UN Rata-Rata Nilai Un Rata-rata nilai UN > 7,50 6,50 < Rata-rata nilai UN ≤ 7,50 5,50 < Rata-rata nilai UN ≤ 6,50 4,50 < Rata-rata nilai UN ≤ 5,50 Rata-rata nilai UN ≤ 4,50
Kode A
Klasifikasi Baik Sekali
B
Baik
C
Sedang
D
Kurang
E
Kurang Sekali
Berdasarkan klasifikasi Tabel 3, data dalam Tabel 2 dengan mudah terlihat provinsi yang termasuk klasifikasi A= baik sekali, B= baik, C= sedang, D= kurang atau E=kurang sekali. Secara nasional, baik siswa SMP maupun MTs, kemampuan dalam menghitung hasil operasi tambah, kurang,
kali, dan bagi pada bilangan bulat adalah “baik sekali” (76,72 dan 78,93) walaupun ada beberapa provinsi yang termasuk dalam klasifikasi baik atau sedang. Klasifikasi “baik sekali”, untuk SMP terdapat pada Provinsi: Jawa Timur, Aceh, Sumatera Utara, Riau, Jambi, Sumatera Selatan, Lampung, Kalimantan Selatan, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Maluku, Bali, Nusa Tenggara Barat, Bengkulu, Maluku Utara, Gorontalo, dan Banten. Klasifikasi baik sekali untuk MTs terdapat pada Provinsi: Jawa Barat, Jawa Timur, Aceh, Sumatera Utara, Riau, Jambi, Sumatera Selatan, Lampung, Kalimantan Selatan, Sulawesi Utara, Sulawesi Selatan, Sulawesi Tenggara, Maluku, Bali, Nusa Tenggara Barat, Papua, Bengkulu, Maluku Utara, Gorontalo, Banten, Sulawesi Barat, dan Papua Barat. Klasifikasi “baik”, untuk SMP terdapat pada Provinsi: DKI, Jawa Barat, Jawa Tenggah, DIY, Sumatera Barat, Kalimantan Tengah, Kalimantan Timur, Sulawesi Tenggara, NTTR, Papua, Kepri, Sulawesi Barat, Papua Barat; untuk MTs terdapat pada Provinsi: DKI, Jawa
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
115
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Tengah, Sumatera Barat, Kalimantan Barat, Kalimantan Tengah, NTT, Kepri, dan Papua Barat. Klasifikasi “sedang”, untuk SMP terdapat pada Provinsi: Kalimantan Barat, untuk MTs terdapat pada Provinsi: DIY dan Bangka Belitung. Klasifikasi “kurang” dan “kurang sekali” untuk SMP dan MTs tidak ada. Berdasarkan informasi di atas, kita dapat melihat seberapa jauh para guru telah memaksimalkan kemampuan siswa terhadap materi/kompetensi yang berkaitan dengan kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Kompetensi ini termasuk kategori UKRK khususnya dalam mata pelajaran Matematika. UKRK adalah materi/ kemampuan yang: Urgensi (wajib dikuasai siswa), Kontinuitas (merupakan kemampuan/ materi lanjutan), Relevansi (manfaatnya terhadap mata pelajaran lain tinggi), Keterpakaian (keterpakaian dalam kehidupan sehari-hari tinggi).
Seharusnya “setiap siswa belajar berkemampuan maksimal/tinggi terhadap materi yang diajarkan guru”. Ini sering disebut dengan “belajar tuntas.” Bila ada siswa yang berkemampuan menengah dan rendah, maka ini menjadi kewajiban guru untuk memaksimalkannya atau menuntaskannya. Penulis yakin, bila belajar tuntas dilaksanakan guru di sekolah, InsyaAllah, para guru malu meluluskan anak didiknya dengan kriteria kurang dari 50,50 melainkan 100,00. Karena nilai 50,50 menunjukkan belum tuntas materi yang dikuasainya. 2. Klasifikasi Kemampuan Siswa SMP dan MTs Bila dilihat dari nilai rata-rata nasional, antara kemampuan siswa SMP dan MTs dalam menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah lebih tinggi kemampuan siswa MTs (78,93 dan 76,72) walaupun nilai standar deviasinya lebih besar daripada siswa SMP (8,45 dan 8,15). Data selengkapnya dapat dilihat pada Tabel 4.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
116
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Tabel 4. Nilai Rata-rata dan Standar Deviasi Skor Siswa pada Pertanyaan tentang menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada Ujian Nasional SMP/MTs Tahun Pelajaran 2010/2011 di 33 Provinsi Group Statistics SMP_MTs
N
Mean
Std. Deviation
Std. Error Mean
1. SMP
33
76,7197
8,14830
1,41844
2. MTs
33
78,9303
8,45331
1,47153
NILAI_RATA2
Berdasarkan data dalam Tabel 4 menunjukkan bahwa kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada siswa MTs (Mean 78,93 dan SD 8,45) adalah lebih baik daripada siswa SMP (Mean 76,72 dan SD 8,15). 3. Perbedaan Kemampuan Siswa SMP dan MTs Tabel 5 berikut merupakan hasil uji homogenitas setiap data dalam variabel sebelum dianalisis dengan analisis varian satu jalur. Hasilnya menunjukkan bahwa kedua variabel adalah homogen (Sig. > 0,05).
Tabel 5: Test of Homogeneity of Variances Levene Statistic
df1
df2
Sig.
,030
1
64
,864
Karena kedua variabel adalah homogen, variabel itu dapat dianalisis dengan analisis varian satu jalur dengan hasilnya seperti pada Tabel 6 berikut ini.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
117
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Tabel 6: ANOVA Sum of Squares Between Groups
Mean Square
df
80,632
1
80,632
Within Groups
4411,302
64
68,927
Total
4491,934
65
Tabel 6 menunjukkan bahwa perbedaan kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah tidak terbukti. Artinya tidak terdapat perbedaan yang signifikan kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat (P-value= 0,283). Hasil penelitian ini menunjukkan bahwa kemampuan menghitung hasil operasi pada bilangan bulat merupakan penalaran yang logik dan masalah yang berhubungan dengan bilangan. Hal ini sesuai dengan teori yang disampaikan Sujono (2006:5) bahwa matematika adalah ilmu pengetahuan
F 1,170
Sig. 0,283
tentang penalaran yang logic dan masalah yang berhubungan dengan bilangan. Di samping itu dikuatkan oleh pendapat Pandoyo (2002: 1) bahwa matematika juga suatu ilmu yang memiliki objek dasar berupa fakta, operasi, dan prinsip. Matematika adalah bahasa yang menggambarkan serangkaian makna dari pernyataan yang ingin kita sampaikan, dengan matematika siswa dilatih untuk berpikir secara logika (Suriasumantri, 2005: 190).
SIMPULAN DAN SARAN Berdasarkan semua uraian di atas, hasil penelitian dapat disimpulkan dengan adanya temuan-temuan dan saran seperti berikut ini.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
118
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
Pertama, Klasifikasi kemampuan secara nasional, baik siswa SMP maupun MTs, kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah “baik sekali” (76,72 dan 78,93) walaupun ada beberapa provinsi yang termasuk dalam klasifikasi baik dan sedang. Klasifikasi “baik sekali”, untuk SMP terdapat pada Provinsi: Jawa Timur, Aceh, Sumatera Utara, Riau, Jambi, Sumatera Selatan, Lampung, Kalimantan Selatan, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Maluku, Bali, Nusa Tenggara Barat, Bengkulu, Maluku Utara, Gorontalo, dan Banten. Klasifikasi baik sekali untuk MTs terdapat pada Provinsi: Jawa Barat, Jawa Timur, Aceh, Sumatera Utara, Riau, Jambi, Sumatera Selatan, Lampung, Kalimantan Selatan, Sulawesi Utara, Sulawesi Selatan, Sulawesi Tenggara, Maluku, Bali, Nusa Tenggara Barat, Papua, Bengkulu, Maluku Utara, Gorontalo, Banten, Sulawesi Barat, dan Papua Barat. Klasifikasi “baik”, untuk SMP terdapat pada Provinsi: DKI, Jawa Barat, Jawa Tenggah, DIY, Sumatera Barat, Kalimantan Tengah,
Kalimantan Timur, Sulawesi Tenggara, NTTR, Papua, Kepri, Sulawesi Barat, Papua Barat; untuk MTs terdapat pada Provinsi: DKI, Jawa Tengah, Sumatera Barat, Kalimantan Barat, Kalimantan Tengah, NTT, Kepri, dan Papua Barat. Klasifikasi “sedang”, untuk SMP terdapat pada Provinsi: Kalimantan Barat, untuk MTs terdapat pada Provinsi: DIY dan Bangka Belitung. Klasifikasi “kurang” dan “kurang sekali” untuk SMP dan MTs tidak ada. Kedua, klasifikasi kemampuan siswa SMP dan MTs menunjukkan bahwa kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat pada siswa MTs (Mean 78,93 dan SD 8,45) adalah lebih baik daripada siswa SMP (Mean 76,72 dan SD 8,15). Ketiga, perbedaan kemampuan siswa SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat adalah tidak terbukti. Artinya tidak terdapat perbedaan yang signifikan kemampuan siswa
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
119
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
SMP dan MTs terhadap kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat (P-value= 0,283). Berdasarkan hasil penelitian di atas, ada dua saran penting seperti berikut ini. Pertama, kepada guru khususnya guru yang mengajar mata pelajaran Matematika yaitu mata pelajaran yang di-UN-kan perlu memberi variasi contoh dan praktik kompetensi menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Kedua, kepada para siswa kelas 9 SMP dan MTs baik sekolah negeri maupun swasta yang sedang mempersiapkan ujian perlu meningkatkan kemampuan menghitung hasil operasi tambah, kurang, kali, dan bagi pada bilangan bulat. Selamat belajar!
DAFTAR PUSTAKA Pusat Penilaian Pendidikan, Badan Penelitian dan Pengembangan Kemdikbud. (2012). Panduan Pemanfaatan Hasil UN Tahun Pelajaran 2011/2012 untuk Perbaikan Mutu Pendidikan. Jakarta. Pandoyo. (2002). Matematika untuk SMP. Jakarta: Balai Pustaka. Sujono, S. (2006). Psikologi Pendidikan dengan Pendekatan Baru. Cetakan Ke6, edisi revisi. Bandung: Remaja Rosda Karya. Suriasumantri, J. (2005). Filsafat Ilmu Sebuah Pengantar Populer. Jakarta: Pustaka Sinar Harapan.
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
120
Kemampuan Siswa Smp Dan Mts Dalam Menghitung Hasil Operasi Tambah, Kurang, Kali, Dan Bagi Pada Bilangan Bulat Berdasarkan Hasil Ujian Nasional 2010/2011
VALUE, Jurnal Evaluasi & Asesmen Pendidikan, Vol.II/No.01/Juni/2013
121