INDEKS INTEGRITAS SEBAGAI KRITERIA LULUS SNMPTN? KATAKAN: BELUM SAATNYA…! Halmar Halide Pemantau Ujian Nasional 2016 kota Makassar
Ujian Nasional: Taruhan tingkat tinggi Walau kejadiannya terpisah jauh, ada benang merah yang menjadi penaut peristiwa kebocoran soal UN yang terjadi pada dua sekolah di kota Makassar – Sulawesi Selatan [Alfian, 2016] dan di Kabupaten Landak – Kalimantan Barat [Pahlevi, 2016]. Pada dua kejadian tersebut, tersangka pelakunya adalah para Kepala Sekolah dan tempat terjadinya kebocoran soal adalah kantor Kepala Sekolah yang dijadikan TST (Tempat Simpan Terakhir) soal UN. Kedua sekolah tersebut berperan sebagai ketua subrayon pendistribusian soal dan LJU (Lembar Jawaban Ujian). Menurut tersangka pembocor soal, perbuatannya ini dipicu oleh ketakutan akan banyaknya siswanya yang tidak akan lulus pada UN tahun ini. Tingginya ketidaklulusan tentu akan berdampak langsung pada suatu sekolah karena siswa pelamar sekolah tersebut tentu akan berkurang. Tampaknya, Ujian Nasional ini sudah masuk dalam kategori taruhan tingkat tinggi (high stakes test). Luaran/hasil ujian sejenis ini biasanya digunakan pada sejumlah hal misalnya untuk: memberikan gelar/ijazah/sertifikat sebagai penanda terpenuhinya strata pembelajaran tertentu, menuju strata pembelajaran/kompetensi yang lebih tinggi, menghukum sekolah melalui pemotongan dana dan pencitraan yang buruk, memuji sekolah dengan pengaliran bantuan dan peningkatan popularitas [anonim, 2014]. Ketika menghadapi tekanan Ujian Nasional yang begitu besar, seorang insan pendidik harus tetap berpegang teguh pada 7 (tujuh) komponen integritas akademik universal yakni: jujur, adil, amanah, hormat, bertanggung-jawab, berani, dan berorientasi Ilahi [ICAI, 2014; Halide, 2016]. Pada kejadian ini, sebenarnya yang patut melakukan shalat istigotshah bukan lagi para siswa yang akan ikut UN melainkan para kepala sekolah!. Apakah perilaku menyimpang kepala sekolah atau guru pada umumnya inikah yang digurui (gugu dan tiru) oleh seorang anak didik atau adakah faktor lainnya? Ketidak-jujuran: faktor ikut-ikutan teman Beberapa dekade yang lalu, McCabe dan Treviño (1993) seperti yang diulas oleh McCabe dkk (2001), telah menemukan alasan kuat mengapa seorang mahasiswa berlaku tak jujur pada ujian. Alasan itu dikenal sebagai faktor “perceptions of peers” – sang pelaku mencontoh perbuatan curang sejawatnya yang telah menganggap bahwa perbuatan curang adalah suatu norma agar nilai ujian tetap tinggi. Jika ia tak mengikuti perilaku kawan-kawannya, nilainya akan tertinggal jauh dari nilai teman-temannya yang lain. Apakah ini tidak mirip ketakutan seorang kepala sekolah seperti yang disebutkan diatas?. Tentu menarik juga untuk dicermati apakah faktor ‘ikut-ikutan teman’ untuk melakukan kecurangan pada tingkat mahasiswa ini juga telah menulari para siswa. Perlu pula dicatat bahwa ada pula faktor kepribadian yang dikenal sebagai ‘segitiga gelap – dark triad’ yang berkaitan dengan perilaku menyontek. Segitiga gelap itu adalah: narsis (merasa diri superior), Machiavelis (manipulasi orang lain) dan psikopat subklinis (berperilaku anti sosial) [Nathanson dkk., 2006].
Selanjutnya, McCabe dan Treviño (1993) menemukan pula bahwa tegaknya suatu ‘academic honor codes’ (integritas akademik) termasuk hukuman bagi para pelanggar (transgressors) dapat menurunkan tingkat kecurangan siswa pada ujian. Mereka menekankan kata ‘penegakan’ bukan hanya sekedar ungkapan ‘window dressing’ semata. Bing dkk. [2012] memberi contoh bagaimana usaha proaktif suatu institusi pendidikan bisnis untuk menekan fenomena ketakjujuran ini. Bagaimana dengan kita di Indonesia? Indeks Integritas: metrik ketidakjujuran Kita kelihatannya ingin kembali menegakkan perihal integritas akademik. Presiden Jokowi menyatakan bahwa kejujuran adalah fondasi bangunan karakter bangsa [Paramita, 2015]. Dua menteri Beliau yakni Mendikbud dan MenristekDikti segera menindaklanjutinya. Mendikbud mengeluarkan dan mengumumkan suatu alat ukur kejujuran yang disebut Indeks Integritas [Indriani, 2016]. Kedua menteri ini bahkan ingin menjadikan metrik ini sebagai bahan pertimbangan bagi calon mahasiswa jalur undangan SNMPTN [Linggasari, 2016; Wurinanda, 2016; Yuniasari, 2016]. Perlu dicatat bahwa MenristekDikti pernah tidak menyetujui penggunaan indeks ini sebagai kriteria penentuan kelulusan SNMPTN [Anonim, 2015]. Sejumlah orang sudah menyatakan ketidaksetujuannya pada Indeks Integritas [Musfah, 2015; Zubaidah, 2016]. Alasan ketidaksetujuan mereka tampaknya didasari pada tidak ditemukannya informasi tentang alat ukur Indeks Integritas ini seperti: komponen-komponen apa saja yang dinilai, bagaimana cara menghitung komponen-komponen tersebut serta bagaimana validitas instrumen ini. Indeks Integritas sebagai kriteria seleksi: kendala teknis Ketiadaan informasi tentang indeks ini hampir saja membuat penulis terkecoh karena mengira bahwa indeks ini diukur menggunakan KR-20 yang merupakan kasus khusus dari besaran alfa Cronbach [Sjitsma, 2009] – suatu ukuran kehandalan internal perangkat soal-soal UN. Untung saja ada publikasi Manoppo dan Murdapi [2014] tentang evaluasi UN tahun 2011/2012 untuk mata pelajaran Kimia dari Provinsi Maluku. Mereka menggunakan suatu peringkat lunak berbasis online bernama INTEGRITYTM (yang diproduksi oleh Castle Rock Research Corp.) untuk menyelidiki tingkat kecurangan/kolusi antar peserta ujian mulai dari level kelas, sekolah, hingga lingkup yang lebih luas lagi yakni tingkat Kota/Kabupaten/Provinsi. INTEGRITYTM menggunakan 5 perumusan statistik untuk tiba pada kesimpulan ada-tidaknya penyontekan (cheating) pada suatu pasangan siswa. Kelima perumusan ini adalah: indeks B [Angoff, 1974], G2 (Frary dkk., 1977], ACT Pair 1 [Hanson dkk., 1987], ACT Pair 2 [Hanson dkk., 1987], MESA [Belezza dan Belezza, 1991]. Tingkat penyontekan dinyatakan dalam kategori: rendah (low), sedang (moderate) dan tinggi (high). Kategori ini berbanding terbalik dengan False Positive – mengindikasikan ada penyontekan namun kenyataannya penyontekan tak terjadi. Semakin banyak ditemukan False Positive, kategorinya digolongkan pada tingkat low, dan sebaliknya jika jumlah False Positive lebih sedikit, maka ia akan berkategori high. Berdasarkan publikasi Manoppo dan Murdapi [2014] itu, tampak bahwa ada ketidakkonsistenan antara kelima rumusan dalam hal penggolongan pasangan yang masuk kedalam kategori penyontekan (low, medium ataupun high) dan jumlah pasangan yang ditemukan
menyontek. Ketidakkonsistenan ini terjadi tidak saja pada evaluasi untuk satu kelas namun ia juga dijumpai pada evaluasi pada tingkat kota. Jadi, meskipun kita menyamakan ketiga kategori penyontekan itu, jumlah pasangan yang diindikasikan menyontek oleh masing-masing perumusan statistik itu tetap berbeda. Fenomena ketidakkonsistenan ini sebenarnya telah ditemukan oleh Nelson [2006] dan Veldkamp [2008] yang mengkaji hasil ujian yang jumlah soalnya mencapai 60 item. Kelima statistik itu ternyata memberikan kategori penyontekan yang berbeda-beda untuk masing-masing pasangan yang terindikasi menyontek. Bahkan, berkas demonstrasi uji kolusi pada situs INTEGRITYTM [Castlerock, 2016] juga menunjukkan hal yang serupa yakni ada ketidakkonsistenan kategori pasangan-pasangan yang terindikasi melakukan kecurangan oleh kelima perumusan statistik itu. Sebelum digunakan untuk mengukur integritas peserta UN, pengguna pengukur kecurangan ini mesti menyelesaikan masalah ketidakkonsistenan ini. Setelah itu, ia juga harus membuktikan bahwa memang benar telah terjadi kecurangan pada pasangan-pasangan yang terindikasi menyontek. Kendala lain: prinsip Ekuitas (kesetaraan) Selain masalah teknis diatas, ada prinsip kesetaraan yang mesti diperhitungkan berkaitan dengan indeks integritas ini. Pertama, kehandalan soal ujian – sejauh mana tingkat kekonsistenan internal soal (item) yang diujikan. Ujian yang tergolong taruhan tingkat tinggi seperti UN minimal memiliki indeks Kuder-Richardson KR-20 sebesar 0,90 [Wells dan Wollack, 2003]. Kriteria ini belum terpenuhi sebab nilai indeks KR-20 untuk UN mata pelajaran Kimia hanya mencapai angka 0,77 [Manoppo dan Murdapi, 2014]. Selain itu, bagaimana kehandalan 2 versi UN yakni Ujian Tulis (UTUL) dan Ujian Berbasis Komputer (UBK). Apakah perangkat soal ujian yang mereka kerjakan sudah setara dalam hal kehandalan? Kedua, durasi pelaksanaan UN. Memang tak ada perbedaan pada durasi pengerjaan soal suatu mata pelajaran bagi peserta UN versi UTUL maupun UBK. Namun, ada perbedaan antara kedua kelompok peserta UN yakni pada jumlah mata pelajaran yang diujikan per hari. Peserta UTUL mengerjakan 2 mata pelajaran tiap hari, sedangkan peserta UBK mengerjakan 1 mata pelajaran per hari. Di kalangan peserta UBK sendiri pun ada perbedaan karena dalam sehari itu peserta dibagi pada 3 sesi kelompok ujian. Kembali isu kesetaraan mencuat, apakah hasil ujian mereka tak menggambarkan pengaruh perbedaan setting ujian? Dari literature, faktor waktu pengerjaan soal dan kelelahan kognitif (cognitive fatigue) ternyata mempengaruhi hasil ujian siswa [Pope dan Fillmore, 2015; Sievertsen dkk., 2016]. Dengan adanya kendala teknis dan isu kesetaraan diatas, seyogyanya kementerian terkait terlebih dahulu melakukan asesmen lanjut tentang hasil UN dan mengumumkan hasilnya ke masyarakat sebelum menjadikan Indeks Integritas sebagai kriteria penentuan kelulusan SNMPTN. Penutup: Taman pembelajar para penerus Ada hal yang menyentuh penulis ketika membaca amanat Mendikbud pada Hari Pendidikan Nasional pada bulan Mei 2015. Beliau menyatakan: “Ki Hadjar Dewantara menyebut sekolah dengan istilah “Taman”. Taman adalah tempat belajar yang menyenangkan. Anak datang ke taman dengan senang hati, berada di taman juga dengan senang hati dan pada saat harus meninggalkan taman maka anak akan merasa berat hati.” [Baswedan, 2015].
Mari kita semua membayangkan jika pada suatu hari kita mendekati suatu taman. Pada bagian luar taman tertera “Taman MADOSA – taman ini dihuni oleh manusia pendosa dengan tingkat ketidakjujuran terendah.” Akankah kita merelakan anak kita bermain di taman itu? Tentu tidak. Ini jika kita mampu menjauh darinya. Namun, tentu ada saja orangtua yang terpaksa memasukkan anaknya ke taman itu. Apakah adil jika anak tersebut ikut menanggung dosa sebagian besar pengunjung taman? Seorang manusia hanya memikul dosanya sendiri [QS al Isra ayat 15] dan dia tak akan pernah menanggung dosa orang lain [QS An Najm ayat 38]. Daripada menghukumnya dengan penyematan label yang buruk, tak dapatkah kita yang telah lebih dulu dewasa ini memperlakukan anak-anak kita seperti halnya yang dilukiskan dalam penggalan lagu “Greatest Love of All”-nya Whitney Houston: “I believe the children are our future Teach them well and let them lead the way Show them all the beauty they possess inside Give them a sense of pride to make it easier Let the children's laughter remind us how we used to be……..”? Fikirkanlah….!
Daftar Pustaka: Alfian, 2016. [http://makassar.tribunnews.com/2016/04/07/kepsek-sma-makassar-raya-akui-curi-soalun-saat-penyortiran] Anonim 2014. [http://edglossary.org/high-stakess-testing/] Anonim, 2015. http://kalteng.prokal.co/read/news/19377-indeks-integritas-sekolahtinggi-belum-tentu-bisa-lolos-di-ptn
Angoff W, 1974. The development of statistical indices for detecting cheaters. Journal of the American Statistical Association, 69, 44-49. Baswedan A, 2015. [http://kemdikbud.go.id/kemdikbud/sites/default/files/Sambutan%20Mendikbud %20untuk%20Hardiknas%202015.pdf]
Belezza F, Belezza S, 1991. Detection of cheating in multiple choice tests by using error- similarity analysis. Teaching of Psychology, 16, 151-155.
Bing MN, Davison HK, Vitell SJ, Ammeter AP, Garner BL, Novicevic MM, 2012. An Experimental Investigation of an Interactive Model of Academic Cheating Among Business School Students. Academy of Management Learning & Education 11 (1): 28–48. Castle Rock, 2016. [https://integrity.castlerockresearch.com/Secure/TrialRegistration.aspx] Frary, R.B., Tideman, T.N., & Watts, T.M. (1977). Indices of cheating on multiple-choice tests. Journal of Educational Statistics, 2, 235-256.
Halide Halmar, 2016. Kode Etik [http://www.unhas.ac.id/geofisika/kode-etik/] Hanson BA, Harris DJ, Brennan RL, 1987. A comparison of several statistical methods for examining allegations of copying. (ACT Research Report Series No 87-15). Iowa City, IA: American College Testing. Houston, Whitney. Song: Greatest Love of All. http://www.azlyrics.com/lyrics/whitneyhouston/ greatestloveofall.html ICAI (International Center for Academic Integrity), 2014. [http://www.academicintegrity.org/icai/ assets/Revised_FV_2014.pdf] Indriani, 2016. [http://www.antaranews.com/berita/553243/kemdikbud-bakal-umukan-indeksintegritas-yang-rendah] Linggasari Y, 2016. [http://www.cnnindonesia.com/nasional/20160115191646-20-104648/nilai-snmptnandalkan-indeks-integritas-sekolah/] Manoppo Y, Mardapi D, 2014. Analisis metode cheating pada tes berskala besar. Jurnal Penelitian dan Evaluasi Pendidikan 18 (1): 115-128. McCabe DL, Treviño LK, 1993. Academic dishonesty: Honor codes and other contextual influences. Journal of Higher Education 64: 522-538. McCabe DL, Treviño LK, Butterfield KD, 2001. Cheating in academic institutions: A decade of research. Ethics and Behavior 11 (3): 219-232. Musfah J, 2016. [http://www.republika.co.id/berita/koran/opini-koran/15/04/23/nn8wo911-indeksintegritas-sekolah] Nathanson C, Paulhus DL, Williams KM, 2006. Predictors of a behavioral measure of scholastic cheating: Personality and competence but not demographics. Contemporary Educational Psychology 31: 97–122. Nelson LR, 2006. Using selected indices to monitor cheating on Multiple-choice exams. Journal of Educational Research and Measurement 4 (1): 2-18. Pahlevi A, 2016. [https://m.tempo.co/read/news/2016/04/08/079760841/diduga-bocorkan-soal-unkepala-sekolah-diperiksa-polisi] Paramita RP, 2015. [https://beritagar.id/artikel/berita/revolusi-mental-dari-sekolah-dengan-indeksintegritas]
Pope DG, Fillmore I, 2015. The impact of time between cognitive tasks on performance: Evidence from advanced placement exams. Economics of Education Review 48: 30–40. http://kalteng.prokal.co/read/news/19377-indeks-integritas-sekolahtinggi-belum-tentu-bisa-lolos-di-ptn Sievertsen HH, Gino F, Piovesan M, 2016. Cognitive fatigue influences students’ performance on standardized tests. Proceedings of the National Academy of Sciences 113 (10): 2621–2624. Sijtsma K, 2009. On the use, the misuse, and the very limited usefulness of cronbach’s alpha, Psychometrika 74 (1): 107–120. Veldkamp, 2008. A Review of Integrity™, International Journal of Testing 8 (2): 202-207 Wells CS, Wollack JA, 2003. An Instructor’s Guide to Understanding Test Reliability. Testing & Evaluation Services University of Wisconsin
Wurinanda I, 2016. [http://news.okezone.com/read/2016/01/16/65/1289567/snmptn-2016mengacu-indeks-integritas-sekolah]
Yuniasari M, 2016. [http://www.mediaindonesia.com/news/read/37403/indeks-integritasdiumumkan/2016-03-31] Zubaidah N, 2016. [http://news.okezone.com/read/2016/03/28/65/1347573/fsgi-tak-setujuindeks-integritas-sekolah-diumumkan]