Prosiding Seminar Nasional 9 Mei 2015
BAGIAN 3. PENILAIAN PEMBELAJARAN SOFTWARE ANBUSO SEBAGAI ALAT ANALISIS BUTIR SOAL YANG PRAKTIS DAN APLIKATIF Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh Fakultas Ekonomi, Universitas Negeri Yogyakarta
[email protected]
Abstrak Penelitian ini bertujuan untuk mengembangkan, menguji kelayakan software AnBuso, dan mengidentifikasi kendala penggunaannya. Penelitian dan pengembangan ini menggunakan dokumentasi, kuesioner dan wawancara untuk mengumpulkan data. Data yang terkumpul dianalisis secara deskriptif. Penelitian ini menghasilkan software AnBuso dan buku panduan yang dapat dimanfaatkan guru dalam melakukan analisis butir soal secara praktis dan aplikatif. Software tersebut dinilai sangat layak oleh guru dilihat dari aspek kepraktisan dan kemudahan, kebermanfaatan, substansi isi, dan tampilan. Kendala yang dihadapi guru dalam menggunakan software ini terkait dengan lemahnya penguasaan guru terhadap program Microsoft Excel, kurang terbiasanya melakukan analisis butir soal, pemahaman konsep analisis butir soal yang terbatas, dan kendala teknis yang terdapat dalam software. Kata Kunci: AnBuso, kelayakan, analisis butir soal
PENDAHULUAN Pendidikan merupakan kunci utama kemajuan bangsa sehingga upaya peningkatan kualitas pendidikan harus terus dilakukan agar Indonesia mampu bersaing di kancah dunia global. Potret kualitas pendidikan di Indonesia masih memprihatinkan. UNESCO pada tahun 2011 melaporkan bahwa indeks Education Development Index (EDI) Indonesia belum beranjak dari kategori sedang (medium) dan berada di peringkat ke-57 dari 115 (UNESCO, 2011). Sementara itu The United Nations Development Programme (UNDP) tanggal 24 Juli 2014 melaporkan Human Development Index (HDI) Indonesia menempati peringkat 108 dari 187 negara, sementara Singapura di posisi 9, Malaysia (62), Thailand (89) (UNDP, 2014). Hal ini menunjukkan bahwa kondisi kualitas pendidikan di Indonesia masih perlu ditingkatkan agar tidak ketinggalan dengan negara lain. Proses pembelajaran menjadi bagian yang penting dalam menentukan kualitas pendidikan secara keseluruhan. Hal ini mengindikasikan bahwa pendidik memiliki peran yang sangat sentral dalam meningkatkan kualitas pendidikan. Peran pendidik tersebut tidak hanya dalam merancang dan melaksanakan pembelajaran saja melainkan juga dalam melakukan asesmen proses dan hasil belajar. Asesmen merupakan komponen yang penting dalam pembelajaran (Russel & Airasian, 2012: 2), karena memiliki pengaruh yang kuat dalam meningkatkan proses pembelajaran (Raymond, et.al., 2012; Bers, 2008: 32) bahkan penggunaan prosedur asesmen yang benar dapat memberikan kontribusi langsung kepada peningkatan belajar peserta didik (Miller, Linn & Gronlund, [ 384 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
2009: 34). Oleh karena itu, guru harus mampu mengembangkan alat asesmen yang baik yang mampu memotret secara tepat kompetensi yang telah dicapai peserta didik. Guna mengukur tingkat ketercapaian tujuan pendidikan perlu dikembangkan alat asesmen yang mampu mengungkap seluruh komponen yang ingin dicapai dalam pembelajaran. Asesmen merupakan kegiatan pengumpulan bukti-bukti tentang pembelajaran siswa sebagai informasi untuk pengambilan keputusan dalam pembelajaran (Stiggins & Chappius, 2012: 3). Oleh karena itu agar keputusan yang diambil tepat, asesmen harus memperhatikan keseluruhan aspek yang akan diukur agar mampu menggambarkan dengan tepat sasaran yang dituju. Pemberlakuan kurikulum 2013 dalam implementasinya masih banyak mengalami masalah (Republika, 2014), misalnya timbul masalah sulitnya mengubah mindset guru (Metronews, 2014; Tempo, 2013). Hasil kajian juga menunjukkan bahwa sebanyak 87 persen guru masih kesulitan dalam memahami cara asesmen autentik (Susilowati, 2013). Satu hal yang membuat guru repot adalah sistem asesmen yang memiliki terlalu banyak aspek (Tempo, 2014). Hal ini mengindikasikan bahwa kemampuan guru untuk melakukan asesmen secara baik masih perlu ditingkatkan. Asesmen adalah upaya sistematis dalam mengumpulkan, mengkaji, dan menggunakan informasi tentang program-program pendidikan yang dilakukan untuk tujuan meningkatkan dan mengembangkan pembelajaran (Banta, Palomba, & Kinzie, 2014: 2). Dengan demikian dalam asesmen terdapat proses pengumpulan informasi, pengkajian dan penggunaan informasi tersebut untuk membuat keputusan pembelajaran agar dapat meningkatkan proses pembelajaran. Agar asesmen menghasilkan informasi yang tepat maka perlu dilakukan dengan baik dengan cara mengumpulkan bukti akurat terkait pencapaian hasil belajar siswa dan menjadikan proses asesmen kelas dan hasilnya bermanfaat bagi siswa, yaitu mampu meningkatkan motivasi dan prestasi belajarnya (Stiggins & Chappuis, 2012: 3). Dengan demikian, asesmen harus dapat menilai kemajuan belajar siswa. Informasi tersebut dapat digunakan sebagai dasar untuk mengambil suatu keputusan tentang status siswa dalam kelompoknya dan menentukan langkah-langkah selanjutnya. Oleh karena itu dalam melakukan asesmen hasil pembelajaran perlu dirancang langkah-langkahnya secara rinci agar mampu memotret kompetensi siswa secara tepat. Asesmen membantu guru dalam memperjelas tujuan pembelajaran dan pencapaiannya, menciptakan pengalaman yang menerapkan pengetahuan dalam konteks kehidupan nyata, dan memberikan berbagai cara bagi siswa untuk menunjukkan kemampuan dan keterampilan mereka (Darling-Hammond, 2014: 54). Prosedur asesmen yang digunakan dengan benar dapat memberikan kontribusi langsung kepada peningkatan belajar siswa, yakni (1) mengklarifikasi sifat hasil belajar yang dimaksud, (2) menyiapkan tujuan jangka pendek agar terarah, (3) memberikan umpan balik terhadap kemajuan belajar, (4) memberikan informasi dalam mengatasi kesulitan belajar dan untuk memilih pengalaman belajar masa depan, dan (5) mengidentifikasi tujuan
P a g e [ 385 ]
Prosiding Seminar Nasional 9 Mei 2015 pembelajaran berikutnya (Miller, Linn & Gronlund, 2009: 34). Prosedur tersebut merupakan langkah yang saling berkaitan dan menentukan langkah berikutnya. Asesmen juga bertujuan menjaga keseimbangan kelas, merencanakan dan melaksanakan pembelajaran, menempatkan siswa, memberikan umpan balik dan penghargaan, mendiagnosis masalah siswa, dan menilai tingkat kemajuan akademik (Russell & Airasian, 2012: 5-8). Hal ini mengindikasikan bahwa melalui asesmen dapat ditentukan rancangan pembelajaran berikutnya dengan cara mendiagnosis masalah yang dihadapi siswa agar prestasi akademik siswa dapat berkembang secara optimal. Pendapat lain juga menyatakan bahwa ada tiga tujuan utama dilakukannya asesmen. Pertama, untuk memantau kemajuan pendidikan atau perbaikan. Pendidik, pembuat kebijakan, orang tua dan masyarakat ingin tahu berapa banyak siswa mencapai standar kinerja yang ditentukan. Tujuan ini, sering disebut asesmen sumatif. Tujuan kedua adalah untuk memberikan umpan balik kepada guru dan siswa. Para guru dapat menggunakan umpan balik untuk memperbaiki proses pembelajaran, dan siswa dapat menggunakan umpan balik untuk memantau pembelajaran mereka sendiri. Tujuan ini, sering disebut asesmen formatif. Tujuan ketiga asesmen adalah untuk mendorong perubahan dalam praktek dan kebijakan untuk mencapai perubahan yang diinginkan. Tujuan ini, disebut asesmen akuntabilitas (National Research Council, 1999, 1-2). Dengan demikian asesmen dapat berfungsi untuk memantau kemajuan pembelajaran, memberikan informasi sebagai dasar pemberian umpan balik, dan melakukan perbaikan pembelajaran. Dalam melakukan asesmen kelas tidak dapat dilakukan dengan mudah namun harus mendasarkan pada beberapa kriteria. Beberapa kriteria yang harus dipenuhi dalam melakukan asesmen kelas adalah validitas, reliabilitas, terfokus pada kompetensi, komprehensif, objektivitas, dan mendidik (Puskur, 2008). Pendapat lain juga menyatakan bahwa agar hasil asesmen dapat memberikan informasi yang tepat maka harus memenuhi validitas, reliabilitas, dan objektivitas (Anderson, 2003: 10; Kubiszyn & Borich, 2013: 326). Dengan demikian, validitas dan reliabilitas menjadi bagian yang penting dalam kegiatan asesmen agar informasi yang dihasilkan sesuai dengan yang diharapkan. Item analyses play a somewhat more important role in construct and predictive validation (Nunnally & Bernstein, 1994: 304). Hal ini berarti analisis butir menjadi bagian yang penting dalam menjamin validitas butir soal. Tiga hal yang diperhatikan dalam melakukan analisis butir soal adalah tingkat kesukaran, daya beda dan distraktor. Tingkat kesukaran suatu butir soal merupakan salah satu parameter butir soal yang sangat berguna dalam penganalisian suatu tes. Hal ini disebabkan karena dengan melihat parameter butir ini, akan diketahui seberapa baiknya kualitas suatu butir soal. Jika tingkat kesukaran mendekati 0, maka soal tersebut terlalu sukar, sedangkan jika tingkat kesukaran mendekati 1, maka soal tersebut terlalu mudah. Soal yang terlalu sukar dan terlalu mudah perlu dibuang karena butir tersebut tidak dapat membedakan kemampuan seorang siswa dengan siswa lainnya. Indeks kesukaran suatu butir yang baik terletak [ 386 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
dalam kategori sedang yakni pada interval 0,30 – 0,70 (Allen & Yen, 1979: 121; Kaplan & Saccuzzo, 2005: 170; Sudjana, 2011: 137). Pada interval ini, informasi tentang kemampuan siswa akan diperoleh secara maksimal. Kriteria kedua yang perlu diperhatikan adalah daya beda butir soal. Daya beda butir merujuk pada kemampuan butir soal untuk membedakan peserta tes yang berkemampuan tinggi dan berkemampuan rendah. Untuk menentukan daya pembeda dapat menggunakan indeks diskriminasi, indeks korelasi biserial, indeks korelasi point biserial, dan indeks keselarasan. Indeks daya pembeda suatu butir yang kecil nilainya akan menyebabkan butir tersebut tidak dapat membedakan siswa yang kemampuannya tinggi dan siswa yang kemampuannya rendah. Jika nilai daya beda rendah menunjukkan adanya kemencengan distribusi skor dari populasi sehingga mengakibatkan validitas tes menjadi rendah. Indeks daya beda dikatakan baik jika lebih besar atau sama dengan 0,3 (Nunnally & Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153). Sementara itu koefisien antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis, 2005: 8) dan koefisien di bawah 0,2 dianggap tidak baik sehingga perlu dibuang (Ebel & Frisbie, 1991: 232; Crocker & Algina, 2006: 315). Khusus untuk tes objektif bentuk multiple choice perlu dilengkapi dengan beberapa alternatif jawaban, atau yang sering dikenal dengan istilah option. Option atau alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinankemungkinan jawaban yang terpasang pada setiap butir item itu, salah satu di antaranya adalah merupakan jawaban betul (kunci jawaban) sedangkan yang lainnya salah. Alternatif jawaban salah itulah yang biasa dikenal dengan istilah distractor (pengecoh). Pada kenyataannya bisa terjadi alternatif yang diberikan pada butir tertentu sama sekali tidak dipilih oleh peserta tes. Hal ini berarti alternatif tersebut tidak mampu berfungsi sebagai pengecoh yang baik. Pengecoh dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5 % dari seluruh peserta tes. Asesmen akan menjadi bermakna dalam proses pembelajaran manakala hasil asesmen tersebut dimanfaatkan dan ditindaklanjuti. Umpan balik asesmen merupakan bagian yang tidak terpisahkan dari sebuah proses pembelajaran dan asesmen itu sendiri. Umpan balik bukanlah hal yang asing dalam dunia pendidikan dan asesmen (Irons, 2008: 1). Umpan balik akan sangat bermakna jika dilakukan secara tepat (Brookhart, 2008: 2) karena dapat meningkatkan proses pembelajaran (Irons, 2008: 7). Hasil penelitian juga menunjukkan bahwa umpan balik berdampak positif terhadap hasil belajar (James & Folorunso, 2012; Delacruz, 2012). Artinya diperlukan kemampuan dan strategi khusus dalam memberikan asesmen yang baik serta feedback (umpan balik) yang tepat agar mampu meningkatkan kualitas pembelajaran. Oleh karena itu sudah selayaknya jika guru memiliki kompetensi yang memadai dalam melakukan asesmen dan umpan balik. Umpan balik merupakan bukti yang menegaskan atas kebenaran suatu tindakan (Wiggins, 1993: 185). Umpan balik dikonseptualisasikan sebagai informasi yang diberikan oleh perantara (misalnya, guru, teman sebaya, buku, orang tua, diri, P a g e [ 387 ]
Prosiding Seminar Nasional 9 Mei 2015 pengalaman) mengenai aspek kinerja atau pemahaman seseorang (Hattie & Timperley 2007). Umpan balik formatif adalah setiap informasi, proses atau kegiatan yang memberi atau mempercepat belajar siswa berdasarkan komentar yang berkaitan dengan asesmen formatif dan kegiatan asesmen sumatif (Irons, 2008: 7). Umpan balik formatif biasanya disajikan sebagai informasi kepada peserta didik dalam menanggapi beberapa tindakan peserta didik. Bentuknya dapat berupa berbagai jenis (misalnya, verifikasi akurasi respon, penjelasan jawaban yang benar, petunjuk, pemberian contoh) (Shute 2007: i). Pengertian tersebut menunjukkan bahwa umpan balik merupakan sesuatu yang diberikan untuk dapat mengkaji apa yang telah dilakukan. Umpan balik itu sendiri adalah salah satu upaya untuk mengobservasi siswa berkaitan dengan bagaimana mereka melakukan aktivitas serta apa yang harus dilakukan guru untuk meningkatkan kemampuan siswa. Tujuan utama dari umpan balik formatif adalah untuk meningkatkan pengetahuan, keterampilan, dan pemahaman peserta didik (misalnya, pemecahan masalah) (Shute, 2007: 6) karena itu umpan balik harus bersifat interaktif, meningkatkan motivasi dan berupaya memecahkan masalah (Langer, 2011). Peterson & Irving (2008) dalam penelitiannya menjelaskan bahwa ternyata siswa berpandangan umpan balik dapat memberikan informasi dan balikan yang baik kepada mereka. Komentar yang diberikan dalam umpan balik formatif hanya dapat efektif jika siswa membaca dan memanfaatkannya (Higgins & Hartley, 2002). Umpan balik dapat digunakan untuk meningkatkan efektivitas pembelajaran di kelas (Hattie & Timperley, 2007). Umpan balik yang diberikan kepada peserta didik jika diberikan secara tepat akan membantu mereka meningkatkan kinerjanya, memberikan ide tentang bagaimana mereka berkembang, meningkatkan motivasi dan memberdayakan mereka sebagai peserta didik (Harvey, 2011: 20). Dengan demikian dapat dikatakan bahwa umpan balik memiliki peran yang penting dalam proses pembelajaran, artinya melalui umpan balik dapat mengarahkan proses pembelajaran sesuai dengan tujuan yang ingin dicapai. Kajian di atas menunjukkan bahwa asesmen pembelajaran merupakan kegiatan yang penting dilakukan. Asesmen harus mampu mengukur secara tepat kompetensi peserta didik sehingga instrumen yang digunakan haruslah valid. Analisis butir soal memiliki peran penting untuk mengidentifikasi butir soal yang baik. Hasil asesmen juga memberikan informasi yang akurat tentang kemampuan peserta didik sehingga dapat diidentifikasi materi mana yang dianggap sulit, bahkan hasil analisis juga memberikan informasi tentang materi mana yang belum dikuasai oleh masing-masing peserta didik sehingga dapat dilakukan upaya perbaikan melalui kegiatan remedial. Guna memenuhi hal tersebut perlu dikembangkan sebuah software analisis soal yang praktis dan aplikatif sehingga dapat memotivasi guru senantiasa melakukan analisis butir soal. Berbagai software analisis butir soal memang sudah banyak dikembangkan oleh para ahli namun belum dimanfaatkan secara optimal oleh guru. Hal itu terjadi karena sebagian besar software berbahasa asing sehingga sulit untuk memahami cara penggunaannya. Software tersebut juga cukup rumit untuk digunakan dan kurang praktis [ 388 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
dan aplikatif. Informasi yang diberikan dalam software tersebut juga ditampilkan dalam format yang sangat beragam sehingga mempersulit guru untuk menguasainya. Oleh karena itu perlu dikembangkan software analisis butir soal yang praktis dan aplikatif sesuai dengan kebutuhan guru di lapangan. Guna memenuhi tuntutan tersebut, Muhson, dkk (2013) telah berhasil mengembangkan software yang diberi nama AnBuso (Analisis Butir Soal). Dalam software AnBuso tersebut dapat diketahui baik tidaknya soal yang dibuat guru, baik dari sisi daya beda, tingkat kesulitan, maupun efektivitas distraktornya. Di samping itu dalam software tersebut juga memberikan informasi tentang kemampuan seluruh siswa dan tingkat ketercapaian KKM (Kriteria Ketuntasan Minimal). Software ini juga dirancang untuk mampu mengidentifikasi dan mengelompokkan siswa yang masuk dalam program remedial berdasarkan materi yang belum dikuasai sehingga akan mempermudah guru dalam pelaksanaan program remedial. Semua hasil analisis tersebut sudah ditampilkan dan dapat dicetak dalam format laporan yang sangat mudah untuk dibaca dan ditafsirkan. Hasil ujicoba terbatas ditemukan bahwa keberadaan software AnBuso disambut positif oleh guru sebagai alternatif untuk melakukan analisis butir soal. Bahkan beberapa guru yang telah menggunakan AnBuso merasa bahwa software ini lebih mudah digunakan, praktis, dan aplikatif sehingga mereka mengaku selalu menggunakan software AnBuso dibandingkan dengan software lain (Muhson, dkk, 2013). Hasil temuan di atas menunjukkan bahwa software AnBuso yang dikembangkan pada tahap awal ini telah direspon positif oleh guru serta sangat bermanfaat dan siap untuk digunakan. Sebagai produk awal, perlu lebih dikembangkan dan disempurnakan lagi agar kelemahan dan kekurangan yang ada di software tersebut dapat diatasi. Oleh karena itu software tersebut perlu dikaji dan diujicoba lagi dengan melibatkan guru dan pengawas yang lebih banyak agar diperoleh masukan yang lebih kompehensif. Penelitian ini dimaksudkan untuk mengetahui kelayakan dan mengidentifikasi kendala yang dihadapi dalam menggunakan software AnBuso. Tujuan akhirnya adalah menghasilkan produk berupa software AnBuso yang siap untuk dipublish kepada khalayak sasaran. METODE Penelitian ini menggunakan model Research and Development (R & D). Prosedur pengembangan dilakukan dengan langkah perancangan dan pengembangan produk, validasi produk, uji coba produk, dan diseminasi produk. Kegiatan perancangan dan pengembangan produk sudah dilakukan sampai pada tahap ujicoba produk tetapi masih pada ujicoba terbatas. Penelitian ini berusaha untuk melanjutkan pengembangan produk dengan melakukan ujicoba produk pada khalayak yang lebih luas agar diperoleh informasi dan masukan yang lebih komprehensif untuk kepentingan penyempurnaan produk. Penelitian ini melibatkan guru-guru dan pengawas sekolah di DIY. Responden yang dilibatkan 65 orang yang berasal dari lima kabupaten/kota di provinsi DIY. Penentuan responden dilakukan secara purposive sampling dengan mempertimbangkan P a g e [ 389 ]
Prosiding Seminar Nasional 9 Mei 2015 kemampuan guru dalam penguasaan komputer, khususnya program aplikasi Microsoft Excel. Teknik pengumpulan data yang digunakan dalam penelitian ini meliputi observasi, dokumentasi, angket, dan wawancara. Observasi digunakan untuk memperoleh data atau informasi tentang kemampuan guru dalam menggunakan program aplikasi yang telah dikembangkan. Hal ini diperlukan untuk diperoleh data tentang kemampuan guru dalam penggunaan software yang telah dikembangkan. Teknik dokumentasi dalam penelitian ini digunakan untuk memperoleh data tentang dokumen tes yang digunakan guru dalam mengukur kemampuan peserta didik, baik tes formatif maupun tes sumatif. Dokumen tersebut dapat berupa soal-soal ujian dan ulangan harian, program remedial, dan hasil analisis butir soal yang selama ini digunakan guru. Angket digunakan untuk mengungkap masukan-masukan yang diperlukan dari guru, pengawas, pejabat dinas pendidikan dan para pakar. Angket ini juga sekaligus digunakan untuk mengukur tingkat kelayakan dari software yang telah dikembangkan. Angket yang dikembangkan meliputi angket kelayakan software baik yang terkait dari sisi tampilan, substansi materi/isi, aspek kebermanfaatan, dan aspek kepraktisan dan kemudahan. Teknik terakhir yang digunakan adalah wawancara yang dilakukan kepada guru, pengawas, pejabat Dinas Pendidikan dan para pakar. Teknik ini digunakan untuk mengungkap berbagai kelebihan dan kelemahan dari software yang dikembangkan agar dapat dijadikan sebagai masukan untuk penyempurnaan. Analisis data yang digunakan meliputi analisis deskriptif. Analisis yang dilakukan meliputi analisis kelayakan software baik dilihat dari sisi tampilan, substansi materi/isi, maupun kepraktisan dan kemudahan. Dalam melakukan analisis ini digunakan lima kategori seperti terlihat pada Tabel 1. Tabel 1. Kategorisasi Penilaian Kelayakan Software No 1 2 3 4 5
Skor Lebih dari M + 1,8 SD M + 0,6 SD s.d. M + 1,8 SD M – 0,6 SD s.d. M + 0,6 SD M – 1,8 SD s.d. M – 0,6 SD Kurang dari M – 1,8 SD
Kategori Sangat layak Layak Cukup Tidak layak Sangat tidak layak
HASIL DAN PEMBAHASAN Untuk memperoleh gambaran tentang hasil pengembangan software dilakukan ujicoba luas yang melibatkan para user seperti guru, pengawas, dan pelaku pendidikan sebanyak 65 orang. Sebagian besar (72%) mereka mengajar di tingkat SLTA baik SMA, SMK maupun MA. Sebagian besar mereka 68% berasal dari sekolah negeri dan responden yang sudah PNS sebanyak 57%. Agar penelitian ini mampu memperoleh gambaran yang memadai maka guru-guru yang dilibatkan juga berasal dari berbagai [ 390 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
bidang studi, di antaranya Ekonomi, Akuntansi, Matematika, IPS, Bahasa Inggris, Bahasa Indonesia, Teknologi Informasi, Kimia, Fisika, Biologi, Geografi, Bahasa Arab, dan sebagainya. Jika dilihat dari kemauan guru dalam melakukan analisis butir soal tampaknya masih memprihatinkan. Sebagian besar guru 57% memang sudah melakukan analisis butir soal namun masih bersifat kadang-kadang. Hanya 11% saja yang selalu melakukan analisis butir soal sedangkan yang tidak pernah melakukan analisis butir soal sebanyak 12%. Hal ini tentu menjadi penting untuk dikaji mengapa guru sebagai pelaku pendidikan memiliki kemauan yang rendah dalam melakukan analisis butir soal. Pada umumnya guru hanya melakukan analisis butir soal jika memang dituntut oleh pengawas. Artinya kesadaran guru untuk melakukan analisis butir soal terhadap semua soal yang sudah diujikan kepada siswa masih kurang. Hal ini terjadi karena umumnya guru kurang menguasai software analisis butir soal yang sudah ada. Kalaupun menguasai tampaknya tidak mampu membangkitkan minat dan kemauan guru dalam melakukan analisis butir soal secara terus menerus. Tentu saja hal ini akan berdampak pada rendahnya kualitas butir soal yang dikembangkan guru karena tidak selalu dilakukan analisis. Penelitian ini berhasil mengembangkan software AnBuso dan buku panduannya yang sudah diperbaiki sesuai masukan responden. Buku panduan dikembangkan untuk memudahkan pengguna dalam memanfaatkan software ini. Buku panduan ini sekaligus memberikan informasi tentang langkah-langkah dan cara menggunakan software ini sehingga memudahkan user untuk memanfaatkan software dalam melakukan analisis butir soal. Panduan ini berisi tentang pendahuluan, kerangka isi, data input, dan data laporan. Beberapa perubahan yang penting yang dihasilkan adalah penyesuaian software ini dengan diberlakukannya kurikulum 2013 terutama yang terkait dengan masalah penilaian. Karena itu pada penelitian ini dilakukan revisi perbaikan yang meliputi perubahan tampilan, sheet Input01, sheet Laporan Peserta, sheet Peserta Remedial, dan perubahan formula.
Sebelum Perubahan Sesudah Perubahan Gambar 1. Tampilan Sheet Input01 Sebelum dan Sesudah Perubahan
P a g e [ 391 ]
Prosiding Seminar Nasional 9 Mei 2015 Perubahan tampilan perlu dilakukan karena dianggap terlalu banyak variasi warna sehingga terlihat kurang menarik. Oleh karena itu dilakukan perubahanperubahan sesuai masukan. Perubahan tampilan tidak hanya dilakukan pada sheet input (Gambar 1) tetapi juga dilakukan perubahan tampilan pada sheet laporan (Gambar 2).
Sebelum Perubahan Sesudah Perubahan Gambar 2. Tampilan Sheet Laporan Butir Sebelum dan Sesudah Perubahan Akibat diberlakukannya kurikulum 2013, software AnBuso juga dilakukan penyesuaian agar software ini mampu mengakomodasikan kepentingan guru dalam membuat penilaian sesuai dengan kurikulum 2013. Beberapa perubahan yang dilakukan mencakup dalam hal penentuan skala penilaian. Pada software sebelumnya skala penilaian yang disediakan hanya 1-10 dan 1-100, sementara itu kurikulum 2013 menggunakan skala penilaian 1-4, karena itu dalam software ini dilakukan penyesuaian dengan menyediakan skala penilaian 1-4 (Gambar 3).
Gambar 3. Perubahan Skala Penilaian [ 392 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
Berdasarkan hasil ujicoba luas juga ditemukan beberapa kendala dalam menentukan bobot penilaian antara soal objektif dan soal essay. Karena itu software ini juga dilakukan perubahan dalam penentuan bobot tersebut dengan menyediakan kolom tersendiri untuk bobot soal objektif dan soal essay (perubahannya dapat dilihat pada Gambar 4). Dengan cara tersebut diharapkan guru atau user akan semakin praktis dalam menentukan bobot penilaiannya. Bahkan software ini juga memungkinkan untuk digunakan hanya untuk soal objektif saja atau untuk soal essay saja.
Gambar 4. Penambahan Bobot Penilaian Penyesuaian dengan kurikulum 2013 juga berdampak pada perubahan pada Sheet Laporan Peserta. Pada bagian ini dimunculkan hasil penilaian peserta tes menurut kurikulum 2013 lengkap dengan predikatnya (hasil perbaikannya dapat dilihat pada Gambar 5). Predikat penilaian dilakukan penyesuaian berdasarkan Permendikbud Nomor 52. Sementara itu pada bagian yang lain tidak mengalami perubahan karena sudah sesuai dengan yang diharapkan guru. Pada dasarnya tujuan guru melakukan analisis butir soal di samping untuk mengetahui kualitas butir soal yang telah dibuat juga informasi hasil penilaian pesertanya dapat dimanfaatkan untuk melakukan rencana tindak lanjut baik untuk keperluan remedial maupun pengayaan. Oleh karena itu hasil laporan peserta haruslah mampu memberikan gambaran siapa saja peserta yang masuk pada kelompok pengayaan dan remedial. Pada pengembangan software ini sudah mampu mengantisipasi hal tersebut namun demikian pada versi sebelumnya hanya sebatas pengelompokan peserta remedial saja dan belum disediakan kolom untuk melakukan tindak lanjut. P a g e [ 393 ]
Prosiding Seminar Nasional 9 Mei 2015
Gambar 5. Perbaikan Sheet Laporan Peserta Guna memenuhi hal tersebut pada sheet Peserta Remedial dilakukan perbaikan yakni tidak hanya menemukan kelompok peserta remedial menurut kemampuan yang diukur melainkan disediakan kolom untuk pengisian jadwal kegiatan remedialnya. Hal itu diperlukan agar mampu meengkamodasikan kebutuhan guru dalam membuat jadwal remedial yang lebih praktis. Perbaikan pada sheet Laporan Peserta Remedial tersebut dapat dilihat pada Gambar 6.
Gambar 6. Perbaikan Sheet Laporan Peserta [ 394 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
Hasil uji kelayakan memperlihatkan bahwa software AnBuso yang dikembangkan dalam penelitian ini terbukti dinilai sangat layak. 51% responden menyatakan layak dan 46% menyatakan sangat layak sementara yang lainnya menyatakan cukup layak. Hal ini menunjukkan bahwa software yang dikembangkan ini memiliki kebermanfaatan yang tinggi dalam membantu guru untuk melakukan analisis butir soal. Aspek kelayakan yang dinilai paling tinggi adalah aspek kepraktisan dan kemudahan, dan aspek kebermanfaatan. Sementara aspek yang dinilai paling rendah adalah aspek tampilan (Gambar 7). Dilihat dari jenis kelamin guru juga tampak tidak menunjukkan adanya perbedaan yang signifikan terkait dengan penilaian mereka terhadap kelayakan software. Software AnBuso dianggap praktis dan mudah untuk digunakan serta bermanfaat dalam membantu melakukan analisis butir soal. AnBuso dikembangkan dengan Microsoft Excel sehingga mempermudah guru dalam menggunakannya. Hasil analisis yang dihasilkan juga memberikan informasi yang lengkap. AnBuso tidak hanya mampu menganalisis butir soal objektif saja melainkan juga soal essay. Hasil analisis juga sudah dibuat dalam format laporan sehingga mempermudah guru dalam menafsirkan hasilnya.
Gambar 7. Hasil Uji Kelayakan Software Aspek tampilan tampaknya dinilai paling rendah dibandingkan dengan yang lain. Hal ini terjadi karena adanya keterbatasan dalam mengatur tampilan karena program ini bukanlah program yang berdiri sendiri melainkan melekat dengan program Microsoft Excel. Akibatnya tampilan yang dihasilkan juga menyesuaikan dengan fitur yang tersedia dalam Mcrosoft Excel. Komponen yang dinilai rendah adalah kesesuaian pemilihan warna, tata letak dan topografi (pemilihan jenis font). Hal ini mengindikasikan bahwa software ini perlu perbaikan dari sisi tampilan. Variasi warna dan pemilihan font perlu dilakukan perubahan agar tampilannya menjadi lebih menarik. Bahkan bila perlu menggunakan program desain grafis dalam merancang tampilan. P a g e [ 395 ]
Prosiding Seminar Nasional 9 Mei 2015 Aspek substansi isi dari software dianggap sangat baik karena sesuai dengan kebutuhan guru. Sofware dinilai praktis untuk digunakan, menarik, inovatif, kreatif, interaktif dan unik. Informasi yang dihasilkan dari software ini sangat lengkap, tidak hanya menampilkan hasil analisis butir doal objektif dan essay melainkan juga menampilkan hasil pencapaian nilai dan KKM peserta didik. Bahkan dalam software ini dapat ditemukan materi-materi tertentu yang belum dikuasai oleh masing-masing peserta didik sehingga dapat memberikan informasi kepada guru dalam merancang program remedial dan pengayaan. Dilihat dari aspek kepraktisan dan kemudahan dari software dianggap sangat baik. Software dinilai mudah digunakan, dipahami, dipelajari, dibaca dan ditafsirkan hasilnya. Untuk memanfaatkan software ini tidak perlu belajar program baru namun cukup menggunakan pengetahuan dan keterampilan dalam menggunakan Microsoft Excel. Oleh karena program ini umumnya sudah dikuasai guru maka software ini menjadi mudah untuk dimanfaatkan dan diaplikasikan. Software juga dinilai memiliki manfaat yang tinggi oleh guru. Software yang dihasilkan dinilai sangat bermanfaat, aplikatif dan sesuai dengan kebutuhan guru. Hal ini menunjukkan bahwa keberadaan software ini memiliki kebermanfaatan yang tinggi dalam membantu guru untuk melakukan analisis butir soal. Hasil analisis yang ditampilkan dari software ini sangat sesuai dengan kebutuhan guru karena dapat dimanfaatkan untuk melakukan evaluasi terhadap instrumen dan soal yang dibuat guru dalam mengukur kompetensi peserta didik. Oleh karena tampilan hasil analisis sudah dibuat dalam format laporan maka hasil analisis ini juga dapat dipergunakan untuk keperluan membuat laporan administrasi guru. Walaupun software AnBuso ini dinilai layak namun dalam kenyataannya ada beberapa kendala yang dihadapi guru dalam menggunakan software ini. Dari sisi manfaat yang dihasilkan dari software ini memang sangat baik namun masih ada beberapa guru yang kurang mahir dalam penguasaan komputer, khususnya program Microsoft Excel. Umumnya pengetahuan guru terhadap program ini sangatlah terbatas. Masih banyak menu dan fasilitas yang disediakan Microsoft Excel namun belum dimanfaatkan secara optimal. Oleh karena software ini terintegrasi dengan program Excel maka akibatnya guru kurang lancar dalam memanfaatkan software ini. Kesediaan dan kebiasaan guru dalam melakukan analisis butir soal juga masih dalam kategori jarang. Hanya sedikit guru yang selalu melakukan analisis butir soal baik terhadap soal harian yang dibuatnya, soal semeseteran maupun soal ujian akhir. Karena kebiasaan mereka tersebut akibatnya guru kurang lancar dalam melakukan analisis butir soal karena memang belum terbiasa. Pengetahuan dan penguasaan guru tentang konsep analisis butir soal juga masih terbatas. Sementara pengembangan software ini juga didasarkan pada konsep analisis butir soal terutama analisis klasik, akibatnya pemahaman guru terhadap angka-angka yang dihasilkan dari software masih kurang. Walaupun hasil analisis sudah dikemas
[ 396 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
dalam bentuk laporan yang siap ditandatangani, namun masih perlu dijelaskan tentang arti dan makna dari hasil analisis tersebut. SIMPULAN Penelitian ini berhasil mengembangkan software AnBuso yang dapat dimanfaatkan guru dalam melakukan analisis butir soal secara praktis dan aplikatif. Software ini dibuat dengan program Microsoft Excel yang di dalamnya terdapat sheet untuk input data, sheet data processing, sheet laporan hasil analisis dalam bentuk tabel dan gambar. Software yang dihasilkan terbukti sangat layak oleh guru dilihat dari aspek kepraktisan dan kemudahan, aspek kebermanfaatan dan aspek substansi isi serta aspek tampilan. Walaupun demikian, ada beberapa kendala yang dihadapi guru dalam menggunakan software ini seperti lemahnya penguasaan guru terhadap program Microsoft Excel, kurang terbiasanya melakukan analisis butir soal, pemahaman konsep analisis butir soal yang terbatas, dan kendala teknis yang terdapat dalam software. Software ini terbukti sangat layak dan sangat bermanfaat bagi guru karena itu perlu sosialisasi yang lebih luas tentang penggunaan software ini agar lebih dikenal oleh guru sehingga mampu meningkatkan kinerja guru dalam melakukan analisis butir soal. Pengembangan software ini masih perlu terus dilakukan agar mampu memenuhi kebutuhan guru dalam melakukan analisis butir soal. DAFTAR PUSTAKA Alagumalai, S. & Curtis, D.D. 2005. Classical Test Theory. In Alagumalai, S., et.al. (Eds.). Applied Rasch Measurement: A Book of Exemplars. Norwell, MA: Springer. Allen, M. J. & Yen, W. M. 1979. Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company. Anderson, L.W. 2003. Classroom assessment: enhancing the quality of teacher decision making. New Jersey: Lawrence Erlbaum Associates, Inc. Azwar, S. 2003. Sikap Manusia: Teori dan Pengukurannya, Edisi ke-2. Yogyakarta: Pustaka Pelajar. Banta, T.W., Palomba, C.A., & Kinzie, J. 2014. Assessment essentials: Planning, implementing, and improving assessment in higher education. San Fransisco: Jossey-Bass. Bers, T.H. 2008. The role of institutional assessment in assessing student learning outcomes. New Directions for Higher Education, 141: 31-39. Brookhart, S.M. 2008. How to give effective feedback to your students. Virginia: Association for Supervision and Curriculum Development. Crocker, L & Algina, J. 2008. Introduction to classical and modern test theory. Ohio: Cengage Learning. Darling-Hammond, L. 2014. Next generation assessment: Moving beyond the bubble test to support 21st century learning. San Fransisco: Jossey-Bass. P a g e [ 397 ]
Prosiding Seminar Nasional 9 Mei 2015 Ebel, R.L. & Frisbie, D.A. 1991. Essentials of educational measurement. Englewood Cliffs, NJ: Prentice-Hall, Inc. Harvey, L. 2011. The nexus of feedback and improvement. Dalam Nair, C.S. & Mertova, P. (eds.). Student Feedback: The cornerstone to an effective quality assurance system in higher education. New Delhi: Oxford Cambridge. Hattie J. & Timperley, H. 2007. The power of feedback. Review of Educational Research. 77(1): 81-112. Higgins, R., & Hartley, P. 2002. The conscientious consumer: reconsidering the role of assessment feedback in student learning. Studies in Higher Education, 27(1): 5364. Irons, A. (2008). Enhancing learning through formative assessment and feedback. New York: Routledge. James, A.O. & Folorunso, A.M. 2012. Effect of feedback and remediation on students’ achievement in junior secondary school mathematics. International Education Studies, 5(5): 153-162. Kaplan, R.M. & Saccuzzo, D.P. 2005. Psychological Testing: Principles, Applications, and Issues, 6th edition. Belmont, CA: Thomson Wadsworth. Kubiszyn, T., & Borich, G.D. 2013. Educational testing and measurement: classroom application and practice. 10th edition. Hoboken, NJ: John Wiley & Sons, Inc. Langer, P. 2011. The use of feedback in education: a complex instructional strategy Psychological Reports, 109(3): 775-784. Metronews. 2014. Ini delapan masalah dalam implementasi kurikulum 2013. (Online) (News.metronews.com), diakses 19 Oktober 2014. Miller, M.D., Linn, R.L., & Gronlund, N.E. 2009. Measurement and assessment in teaching (tenth edition). New Jersey: Pearson Education Inc. Muhson, A., Lestari, B., Supriyanto, & Baroroh, K. 2013. Pengembangan Software AnBuso Sebagai Solusi Alternatif Bagi Guru dalam Melakukan Analisis Butir Soal Secara Praktis dan Aplikatif. Laporan Penelitian tidak dipublikasikan. Yogyakarta: LPPM UNY. National Research Council 1999. The assessment of science meets the science of assessment. Board on Testing and Assessment Commission on Behavioral and Social Sciences and Education, National Research Council. Washington, DC: National Academy Press. Nunnally, J.C. & Bernstein, I.H. 1994. Psychometric Theory (Third Edition). New York: McGraw-Hill, Inc. Peterson, E.R., & Irving, S.E. 2008. Secondary school students’ conceptions of assessment and feedback. Learning and Instruction, 18: 238-250. Puskur 2008. Model Penilaian Kelas Kurikulum Berbasis Kompetensi. Jakarta: Balitbang Depdiknas. Raymond, J.E., Homer, C.S.E., Smith, R. & Gray, J.E. 2012. Learning through authentic assessment: An evaluation of a new development in the undergraduate midwifery curriculum. Nurse Education in Practice, 30: 1-6.
[ 398 ] P a g e
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
Republika. 2014. Implementasi kurikulum 2013 masih dibayangi banyak masalah. (Online) (www.republika.co.id), diakses 18 November 2014. Russell, M.K. & Airasian, P.W. 2012. Classroom assessment: concepts and applications (7th edition). New York: McGraw-Hill. Shute, V.J. 2007. Focus on formative feedback. Research Report. Princeton, NJ: Educational Testing Service (ETS). Stiggins, R.J. & Chappuis, J. 2012. An introduction to student involved assessment for learning. Sixth edition. Boston: Pearson assessment training institute. Sudjana, N. 2011. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya. Susilowati. 2013. Kurikulum 2013, 87 persen guru kesulitan cara penilaian. (Online) (http://unnes.ac.id), diakses 18 November 2014. Tempo. 2013. Problematika implementasi kurikulum 2013, (Online) (www.tempo.co), diakses 10 Juli 2013. Tempo. 2014. Kurikulum 2013, Apa Saja Kendalanya?, (Online) (www.tempo.co), diakses 16 Agustus 2014. UNDP. 2014. 2014 human development report. (Online) (http://www.undp.org/ content/undp/en/home/librarypage/hdr/2014-human-developmentreport.html), diakses 5 Maret 2015. UNESCO. 2011. Education For All Global Monitoring Report. (Online) (http://www.unesco.org/ new/en/education/themes/leading-the-internationalagenda/efareport/statistics/efa-development-index/), diakses 5 Maret 2015. Wiggins, G. P. 1993. Assessing student performance: exploring the purpose and limits of testing. San Francisco: Jossey-Bass Publishers.
P a g e [ 399 ]
Prosiding Seminar Nasional 9 Mei 2015
ESTIMASI KESALAHAN PENGUKURAN PERANGKAT SOAL UJI COBA UJIAN NASIONAL MATA PELAJARAN EKONOMI SMA DI KABUPATEN BANJARNEGARA Khotimah Marjiastuti
Program Pascasarjana Universitas Negeri Yogyakarta
[email protected]
Abstrak Penelitian ini bertujuan untuk mengestimasi kesalahan pengukuran perangkat soal uji coba UN mata pelajaran ekonomi SMA Tahun Ajaran 2014/2015 di Kabupaten Banjarnegara berdasarkan teori respon butir. Analisis data dilakukan berdasarkan respon peserta didik terhadap perangkat soal uji coba UN mata pelajaran ekonomi SMA tahun ajaran 2014/2015 sebanyak 809 lembar yang diperoleh dari 13 SMA negeri dan swasta. Metode yang digunakan yaitu Teori Respon Butir (Item Respond Theory). Hasil analisis menunjukkan perangkat soal cocok dengan model Teori Respon Butir 1 Parameter Logistik. Berdasarkan metode tersebut, nilai estimasi kesalahan pengukuran terkecil pada soal paket 1 terjadi pada siswa dengan θ=0 dengan nilai sebesar 0,1990 sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0320. Nilai estimasi kesalahan pengukuran terkecil pada soal paket 2 terjadi pada siswa dengan θ=0 dengan nilai sebesar 0,2005, sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0073. Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebih cocok diberikan kepada siswa dengan kemampuan sedang. Kata kunci: perangkat soal, kesalahan pengukuran, teori respon butir.
PENDAHULUAN Lebih dari satu dekade lalu, para pemimpin ASEAN sepakat untuk membentuk sebuah pasar tunggal di kawasan Asia Tenggara pada akhir 2015 mendatang. Kesepakatan tersebut dilakukan agar daya saing ASEAN meningkat serta bisa menyaingi Tiongkok dan India untuk menarik investasi asing. Penanaman modal asing di wilayah ASEAN sangat dibutuhkan untuk meningkatkan lapangan pekerjaan serta meningkatkan kesejahteraan. Pembentukan pasar tunggal yang diberi nama Masyarakat Ekonomi ASEAN (MEA) memungkinkan suatu negara akan dengan mudahnya melakukan jual-beli barang dan jasa dengan negara lain di Asia Tenggara, sehingga secara otomatis persaingan akan semakin ketat. Masyarakat Ekonomi ASEAN tidak hanya membuka arus perdagangan barang atau jasa, tetapi juga tenaga kerja profesional, seperti dokter, pengacara, akuntan, guru dan lain sebagainya. Dengan demikian, dengan adanya MEA maka akan semakin membuka peluang tenaga kerja asing untuk mengisi berbagai profesi di Indonesia. Sudah siapkah tenaga kerja Indonesia bersaing dengan negara lain di Asia Tenggara? Salah satu tenaga profesional yang akan bersaing di era MEA adalah guru. Guruguru di Indonesia diharapkan siap untuk bersaing dengan guru-guru asing. Oleh karena itu, tentu harus diikuti dengan kesiapan guru untuk meningkatkan kualitas, kemampuan [ 400 ] P a g e
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
serta keterampilan di bidang pendidikan. Mengacu pada UU Nomor 14 Tahun 2005 menyatakan bahwa ada empat kompetensi yang harus dimiliki oleh guru, yaitu kompetensi pedagogik, kepribadian, profesional dan sosial. Keempat kompetensi tersebut memang idealnya dimiliki oleh guru di Indonesia. Salah satu di antara empat kompetensi yang ada yaitu kompetensi pedagogik. Kompetensi pedagogik menuntut guru untuk dapat memahami peserta didik dengan memanfaatkan prinsip-prinsip perkembangan kognitif dan kepribadian, perancangan pembelajaran, pelaksanaan pembelajaran yang kondusif, merancang dan melaksanakan evaluasi hasil belajar secara berkesinambungan dengan berbagai metode untuk kemudian sebagai acuan untuk menentukan tingkat ketuntasan belajar (mastery learning) dan memanfaatkan hasil evaluasi tersebut untuk perbaikan kualitas pembelajaran secara umum. Salah satu kompetensi yang harus dimiliki guru adalah melakukan evaluasi hasil belajar secara berkesinambungan, namun kegiatan evaluasi dalam pendidikan tidak akan terlaksana tanpa adanya kegiatan pengukuran dan penilaian. Menurut Allen dan Yen (1979: 2), measurement is the assigning of numbers to individuals in a systematic way as means of representing properties of the individuals. Definisi tersebut dapat diartikan sebagai penetapan angka dengan cara yang sistematik untuk menyatakan keadaan individu. Pengukuran dilaksanakan dengan tujuan memberikan atribut berupa angka pada individu. Kegiatan pengukuran dilaksanakan dengan menggunakan instrumen tes dan/atau nontes. Penggunaan instrumen tes atau nontes disesuaikan dengan ranah yang hendak diukur. Allen dan Yen menyatakan bahwa a test is a device for obtaining a sample of an individual’s behavior (Allen & Yen, 1979: 1). Kegiatan selanjutnya yaitu penilaian, yang merupakan pemberian label terhadap seseorang. Pemberian label dilakukan dengan memberikan kriteria atas nilai yang diperoleh. Nilai yang diperoleh dapat dikategorikan menjadi baik, cukup baik atau bahkan kurang baik. Kegiatan pengukuran yang cermat akan dapat memberikan informasi yang tepat untuk bahan evaluasi. Akan tetapi, dalam kegiatan pengukuran tidak terpisahkan dari kesalahan baku pengukuran (Standard Error of Measurement/SEM). Kesalahan pengukuran yang dimaksud yaitu nilai/skor hasil pengukuran lebih rendah daripada nilai/skor yang sebenarnya atau bahkan nilai/skor hasil pengukuran lebih tinggi dari nilai/skor yang sebenarnya. Tighe, dkk (2010) menyatakan bahwa sering orang mengandalkan kualitas soal hanya pada reliabilitasnya, namun di sisi lain bila diketahui, reliabilitas suatu tes tergantung pada tingkat kesalahan baku pengukuran (SEM). Kesalahan baku pengukuran erat kaitannya dengan koefisien reliabilitas suatu alat ukur. Miller (2008:93) mengemukakan, SEM is a quantitative expression of the magnitude of error in a test score based on the test reliability. Selanjutnya, the reliability of the test scores decreases, the SEM increases. The greater the reliability of the test score, the smaller the SEM and the more confidence we have in the precision of the test score (Reynolds, Livingston, dan Willson, 2010: 114). Pernyataan tersebut menjelaskan bahwa bila reliabilitas skor tes menurun maka kesalahan pengukuran yang terjadi justru akan meningkat. Reliabilitas yang tinggi akan menghasilkan kesalahan pengukuran yang P a g e [ 401 ]
Prosiding Seminar Nasional 9 Mei 2015 rendah. Dengan menganalisis tingkat SEM, maka dapat diketahui kemungkinan skor murni (true score) peserta tes, serta mengetahui tingkat kemampuan peserta tersebut berada pada kemampuan tinggi, sedang, atau rendah. Jadi, kualitas perangkat soal tidak hanya tergantung pada reliabilitas soalnya saja. Kesalahan pengukuran dalam bidang pendidikan tidak dapat dihindari karena subjek dan objek yang terlibat yaitu manusia. Ada dua macam kesalahan pengukuran, yaitu kesalahan acak dan kesalahan sistematis (Mardapi, 2008: 3). Kesalahan acak disebabkan oleh kondisi fisik dan mental yang diukur dan yang mengukur bervariasi. Kesalahan sistematis terjadi karena alat ukur yang digunakan. Ada pendidik yang memberikan soal terlalu mudah sehingga siswa mendapat skor yang tinggi. Sebaliknya, bila pendidik memberi soal yang sulit, maka siswa akan mendapat skor yang rendah. Apabila hal ini sampai terjadi, maka dapat merancukan evaluasi yang dihasilkan. Oleh karena itu, alat ukur (tes) memiliki peran yang sangat penting dalam dunia pendidikan sehingga soal tes perlu dipersiapkan sebaik mungkin dan seminimal mungkin kesalahan yang dihasilkan agar lebih representatif mencerminkan kemampuan peserta didik. Deteksi kesalahan baku pengukuran dapat dilakukan salah satunya dengan Teori Respon Butir. Hadirnya Teori Respons Butir (IRT) untuk menyempurnakan teori sebelumnya, yaitu Teori Tes Klasik (CTT). Kelemahan teori tes klasik salah satunya adalah tergantung pada karakteristik peserta tes (Mardapi, 2012: 189). Maksud dari pernyataan tersebut adalah bila sampel yang diberi soal kebetulan yang memiliki kemampuan tinggi, maka soal akan menjadi memiliki tingkat kesukaran yang rendah (indeks kesukaran tinggi). Sebaliknya bila soal diberikan kepada siswa dengan kemampuan rendah, maka soal akan menjadi memiliki tingkat kesukaran yang tinggi (indeks kesukaran rendah). Model teori respon butir berdasarkan jumlah parameter butir ada tiga, yaitu 1-P, 2-P dan 3-P. Peluang menjawab benar suatu butir soal sebagai berikut (Mardapi, 2012: 203).
Keterangan: a: daya pembeda b: tingkat kesukaran c: pseudo guessing e: eksponen θ: kemampuan Parameter lain yang perlu diketahui dari teori respons butir yaitu fungsi informasi perangkat tes yang terdiri dari beberapa butir soal. Fungsi informasi dapat dihitung [ 402 ] P a g e
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
dengan formula yang sesuai dengan model logistik perangkat tes yang akan dihitung nilai fungsi informasinya. Perhitungan nilai informasi perangkat tes untuk model logistik satu parameter sebagai berikut. (Hambleton, 1985: 91) Perhitungan nilai informasi perangkat tes untuk model logistik dua parameter sebagai berikut Perhitungan nilai informasi perangkat tes untuk model logistik tiga parameter sebagai berikut Keterangan: I (θ) : fungsi informasi suatu perangkat tes. bj : parameter indeks kesukaran butir ke-j aj : parameter daya beda butir ke-j cj : parameter guessing pada butir ke-j e : bilangan transeden yang besarnya mendekati 2,718 D : nilai distribusi logistic besarnya 1,7 Setelah memperoleh fungsi informasi selanjutnya dapat dilakukan perhitungan SEM dengan Formula umum teori respons butir yang dibangun sebagai berikut.
Keterangan: SEM : kesalahan baku pengukuran : teta/tingkat kecerdasan peserta tes : fungsi informasi pada nilai teta/tingkat kemampuan tertentu Penilaian yang dilakukan oleh pendidik terdiri atas berbagai jenis, seperti kuis, pertanyaan lisan, tugas individu, tugas kelompok, Ulangan Harian (UH), Ulangan Tengah Semester (UTS), dan Ulangan Akhir Semester (UAS) dan lain-lain. Semua itu dilakukan agar guru dapat mengetahui kemampuan dan kemajuan peserta didik, bahkan bila perlu dilakukan perbaikan atau pengayaan maka hal itu pun akan dilakukan. Hal tersebut dikarenakan pendidik memiliki tanggung jawab atas peserta yang dididik agar menjadi orang yang pandai, berakhlak mulia, tangkas dan terampil. Penilaian terhadap peserta didik tidak hanya dilakukan oleh guru, tetapi juga oleh pihak independen yaitu Badan Standar Nasional Pendidikan (BSNP) yang bekerja sama dengan instansi terkait di lingkungan Pemerintah, Pemerintah Provinsi, Pemerintah Kabupaten/Kota, dan satuan pendidikan. Penilaian tersebut dikenal dengan nama Ujian Nasional (UN). Pada tahun 2015 UN tidak lagi menjadi penentu kelulusan yang utama bagi siswa, sejak Menteri Pendidikan dan Kebudayaan, Anies Baswedan, mengeluarkan keputusan untuk merevisi PP nomor 32 tahun 2013. Tujuan UN sepenuhnya untuk menilai P a g e [ 403 ]
Prosiding Seminar Nasional 9 Mei 2015 pencapaian standar kompetensi lulusan pada mata pelajaran tertentu secara nasional, kemudian hasilnya digunakan untuk pemetaan mutu, dasar seleksi masuk jenjang pendidikan selanjutnya, dan untuk pembinaan. Melihat adanya tujuan yang besar dari penyelenggaraan UN walaupun sudah tidak lagi menjadi penentu kelulusan yang utama bagi siswa, tetapi sekolah tetap melaksanakan uji coba UN seperti tahun-tahun sebelumnya. Uji coba UN bertujuan untuk mempersiapkan siswa menghadapi UN sehingga diharapkan uji coba UN dapat memberikan gambaran terkait materi, jenis, bentuk serta cara pengerjaan UN kelak. Intensitas serta waktu pelaksanaan uji coba UN masing-masing sekolah berbeda-beda tergantung pada kebijakan Kepala Sekolah yang bersangkutan. Berdasarkan hasil observasi beberapa SMA di Kabupaten Banjarnegara, umumnya sekolah mengadakan dua kali uji coba UN dengan soal buatan guru sekolah yang bersangkutan dan satu kali uji coba UN dengan soal buatan MGMP yang diterapkan di seluruh SMA baik sekolah negeri maupun swasta di Kabupaten Banjarnegara. Kenyataan menunjukkan bahwa untuk pelaksanaan uji coba UN, guru masih menggunakan soal-soal uji coba tahun lalu atau mengambil dari buku latihan untuk dijadikan soal try out di tahun berikutnya. Permasalahannya pada soal-soal tersebut belum pernah dilakukan analisis butir soal untuk menguji validitas dan reliabilitas. Pertanyaannya adalah apakah soal-soal tersebut sudah sesuai dengan kisi-kisi yang diberikan BSNP, mampu mengukur kemampuan siswa dan dapat merepresentasikan UN yang kelak akan dihadapi siswa? Oleh karena itu, penelitian ini dipandang perlu dilakukan agar guru-guru mata pelajaran ekonomi SMA di Kabupaten Banjarnegara pada khususnya dapat mengetahui kualitas soal uji coba UN yang telah dibuat dalam rangka persiapan menghadapi UN para peserta didiknya. Persiapan dengan sebaik-baiknya menjelang UN merupakan salah satu bukti kesiapan guru untuk menghasilkan lulusan yang baik. Di samping itu, untuk melakukan analisis estimasi kesalahan pengukuran guru harus memiliki kemampuan dan keterampilan mengoperasikan program komputer. Kemampuan dan keterampilan ini dapat menjadi bekal bagi guru dalam menghadapi persaingan di era MEA. Alasan pendukung lainnya, penelitian mengenai estimasi kesalahan pengukuran perangkat soal uji coba UN terutama untuk mata pelajaran ekonomi SMA di Kabupaten Banjarnegara belum pernah dilakukan sebelum ini. METODE Penelitian ini termasuk jenis penelitian deskriptif eksploratif. Objek penelitian adalah seluruh lembar jawab komputer (LJK) siswa peserta uji coba Ujian Nasional mata pelajaran Ekonomi SMA yang dirancang oleh MGMP Ekonomi tahun ajaran 2014/2015 dari 13 sekolah baik Negeri maupun Swasta atau sebanyak 809 LJK. Teknik yang digunakan dalam penelitian ini adalah dokumentasi. Estimasi kesalahan pengukuran berdasarkan Teori Respon Butir dilakukan dengan bantuan Program Komputer Bilog_MG.
[ 404 ] P a g e
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
Tabel 1. Objek Penelitian Estimasi Kesalahan Pengukuran Perangkat Soal Uji Coba Ujian Nasional Mata Pelajaran Ekonomi SMA di Kabupaten Banjarnegara No 1 2 3 4 5 6 7 8 9 10 11 12 13
Nama Sekolah
Jumlah Peserta UN TA.2014/2015 SMAN 1 Banjarnegara 72 SMAN 1 Bawang 110 SMAN 1 Purwareja Klampok 81 SMA Muhammadiyah 4 Kalibening 28 SMAN 1 Sigaluh 58 SMA PGRI Purwareja Klampok 19 SMAN 1 Purwanegara 84 SMAN 1 Karangkobar 139 SMAN 1 Wanadadi 114 SMA Muhammadiyah 1 Banjarnegara 46 SMA Cokroaminoto Banjarnegara 20 SMAN 1 Batur 28 SMA Ma’arif Mandiraja 10 Total Peserta UN 809
HASIL DAN PEMBAHASAN Langkah-langkah yang dilakukan untuk menganalisis SEM berdasarkan teori respon butir meliputi uji kecocokan model (1 PL, 2 PL atau 3 PL) dengan bantuan perangkat komputer BILOG MG, yang perlu dicermati adalah pada hasil perhitungan fase dua. Tentukan butir mana saja yang memenuhi semua kriteria. Setelah itu baru dapat dilanjutkan dengan mengestimasi kesalahan pengukuran perangkat soal uji coba UN mata pelajaran ekonomi SMA di Kabupaten Banjarnegara. Uji Kecocokan Model Untuk mengetahui perangkat soal tes uji coba UN cocok dengan model 1 PL, 2 PL atau 3 PL perlu dilakukan perhitungan dengan menggunakan BILOG MG. Ada tiga fase yang dihasilkan oleh software tersebut, fase satu menjelaskan informasi butir berdasarkan teori tes klasik, fase dua menjelaskan kualitas butir soal berdasarkan teori respon butir, sedangkan fase tiga memberikan informasi kemampuan (ability) masingmasing siswa dalam menjawab soal yang diberikan. Berikut ini rangkuman dari fase dua.
Model 1 PL 2 PL 3 PL
Tabel 2. Uji Kecocokan Model Perangkat Soal (Paket 1) Jumlah Butir yang Cocok Butir yang Cocok dengan Model dengan Model 1, 2, 5, 7, 9, 12, 13, 16, 17, 18, 20, 22, 23, 24, 25, 25 28, 29, 30, 32, 33, 35, 36, 28, 39, 40 3, 6, 8, 9, 11, 14, 25, 26, 27, 28, 29, 31, 33, 34, 35 15 3, 6, 7, 11, 14, 20, 26, 32, 33, 34, 35 11
P a g e [ 405 ]
Prosiding Seminar Nasional 9 Mei 2015 Berdasarkan tabel di atas, maka dapat disimpulkan bahwa perangkat soal uji coba UN ekonomi paket 1 cocok dianalisis menggunakan teori respon butir 1 PL, karena jumlah butir yang cocok paling banyak dibandingkan model 2 PL dan 3 PL. Selanjutnya perlu diuji untuk soal paket 2 cocok dengan model logistik 1 PL, 2 PL atau 3 PL. Berikut ini rangkuman uji kecocokan model untuk soal paket 2.
Model 1 PL 2 PL 3 PL
Tabel 3. Uji Kecocokan Model Perangkat Soal (Paket 2) Jumlah Butir yang Cocok Butir yang Cocok dengan Model dengan Model 4, 5, 6, 7, 8, 9, 11, 13, 16, 17, 18, 19, 21, 22, 24, 22 26, 28, 32, 35, 36, 38, 40 1, 3, 5, 9, 13, 17, 19, 25, 29, 30, 32, 33, 37, 38 14 2, 3, 5, 9, 17, 19, 21, 24, 25, 26, 29, 32, 33, 35, 16 38, 40
Mencermati banyak butir yang cocok dengan model logistik 1PL, maka dapat disimpulkan bahwa perangkat soal uji coba UN mata pelajaran ekonomi SMA paket 2 cocok dengan model 1 PL menurut teori respon butir. Estimasi Kesalahan Pengukuran Setelah diketahui model yang cocok yaitu model IRT 1 PL, selanjutnya adalah mencari fungsi informasi butir dengan menggunakan formula 3 dan 4 dengan menghitung mulai dari tetha -3 s.d +3 selisih antar tetha 0,1. Setelah diketahui fungsi informasi selanjutnya dapat dilakukan perhitungan SEM dengan formula 7. Setelah itu dapat diketahui bahwa SEM untuk perangkat soal pertama berkisar antara 0,1990 sampai 1,0320. SEM terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM tertinggi berada pada siswa dengan kemampuan θ = +3. Sedangkan SEM untuk perangkat soal kedua berkisar antara 0,2005–1,0073 (SEM terendah sampai SEM tertinggi). SEM terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM tertinggi berada pada siswa dengan kemampuan θ = +3. SIMPULAN Berdasarkan uji kecocokan model, kedua perangkat soal uji coba UN mata pelajaran ekonomi SMA di Kabupaten Banjarnegara cocok dengan model IRT 1 parameter logistik. Besarnya estimasi kesalahan pengukuran (SEM) untuk soal paket satu berdasarkan teori respon butir sebesar 0,1990-1,0320 sedangkan untuk paket dua 0,2005-1,0073. Kedua perangkat soal memiliki kesamaan yaitu SEM terendah terjadi pada siswa dengan kemampuan θ=0 dan SEM tertinggi terjadi pada siswa dengan θ=+3. Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebih cocok diberikan kepada siswa dengan kemampuan sedang. Saran yang dapat peneliti berikan sebagai berikut:
[ 406 ] P a g e
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
1. Untuk pelaksanaan tes yang dibuat secara tim seperti Ujian Kenaikan Kelas dan uji coba UN hendaknya guru menggunakan soal yang telah valid dan reliabel, untuk meminimalisasi tingkat kesalahan pengukuran. 2. Hendaknya guru baik secara tim atau individu melakukan analisis estimasi kesalahan pengukuran secara berkelanjutan sebagai salah satu bentuk evaluasi hasil kerja. Jadi, evaluasi tidak hanya dengan melihat nilai atau rata-rata nilai yang dicapai siswa dari waktu ke waktu tapi perlu juga mengevaluasi soal yang telah dibuat. 3. Dinas pendidikan setempat hendaknya memfasilitasi guru-guru dengan memberikan pelatihan penyusunan soal yang baik dengan mengundang ahli. DAFTAR PUSTAKA Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey: Wadsworth Hambleton, R.K. & Swaminathan H. (1985). Item Response Theory Principles and Applications. New York: Springer. Mardapi, Djemari. (2008). Teknik penyusunan instrumen tes & non tes. Yogyakarta: Mitra Cendikia. Mardapi, Djemari. (2012). Pengukuran Penilaian & Evaluasi Pendidikan. Yogyakarta: Nuha Litera. Miller, P. W. (2008). Measurement and teaching. Muster: Partric W. Miller & Association. Tighe, J., McManus, I. C., Dewhurst, N. G., Chis, L., & Mucklow, J. (2010) The Standard Error of Measurement is a more Appropiate Measure of Quality for Postgraduate Medical Assessments Than is Reliability: An Analysis of MRCP (UK) Examinations. BMC Medical Education, 10:40.
P a g e [ 407 ]
Prosiding Seminar Nasional 9 Mei 2015
EVALUASI PENERAPAN PENILAIAN OTENTIK DALAM KAITANNYA DENGAN KESIAPAN SDM MENGHADAPI MEA Alita Arifiana Anisa
Penelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta
[email protected]
Abstrak Penelitian ini merupakan penelitian evaluasi. Penelitian ini berfokus untuk mengevaluasi penerapan penilaian otentik dalam kaitannya dengan upaya untuk mempersiapkan SDM Indonesia dalam menghadapi Masyarakat Ekonomi ASEAN (MEA) di SMK N 1 Wonosari, sekolah pilot project kurikulum 2013 di Daerah Istimewa Yogyakarta (DIY). Penelitian ini dilakukan dengan telaah dokumen guru, wawancara dan kuesioner. Hasil telaah dokumen dan kuesioner dianalisis tingkat kecenderungannya dan diklasifikasikan menjadi 4 kategori sedangkan data yang diperoleh melalui wawancara dianalisis secara kualitatif untuk mendukung data yang terkumpul melalui dokumen dan kuesioner. Berdasarkan analisis yang dilakukan, penerapan penilaian otentik di SMK N 1 Wonosari termasuk dalam kategori sangat sesuai dengan perolehan skor mencapai 2,62 didukung dengan capaian skor persepsi siswa sebesar 3,09 yang termasuk dalam kategori sesuai. Kendala yang dihadapi guru berkaitan dengan perumusan rancangan penilaian sikap spiritual mulai dari perumusan indikator pencapaian, penyusunan rubrik, pemilihan teknik penilaian hingga penyusunan instrument yang tepat. Kata Kunci: Penilaian Otentik, Masyarakat Ekonomi ASEAN
PENDAHULUAN Pada tahun 2013 lalu, pemerintah merilis gebrakan baru dalam dunia pendidikan. Gebrakan tersebut adalah kurikulum baru yang diberi nama kurikulum 2013, pemerintah melalui peraturan menteri pendidikan dan kebudayaan mengemukakan bahwa perubahan tersebut merupakan misi untuk menyempurnakan upaya Indonesia untuk mempersiapkan diri menghadapi tantangan internal maupun external. Salah satu tantangan yang menjadi PR besar bagi bangsa Indonesia adalah Masyarakat Ekonomi ASEAN (MEA). MEA merupakan komitmen untuk mewujudkan integrasi ekonomi negara-negara ASEAN yang bertujuan untuk meminimalisir kesenjangan antar negara. Dengan adanya MEA akan banyak peluang sekaligus risiko yang dihadapi Indonesia, yaitu competition risk, exploitation risk dan employment risk (Baskoro, 2014). Competition risk di mana tidak akan ada lagi hambatan dalam melakukan perdagangan, ekspor akan melimpah, begitu juga dengan impor. Barang-barang impor dengan harga murah dan kualitas tinggi akan mengancam industri lokal meskipun industri lokal akan mendapatkan peluang yang sama untuk mengekspansi pasar ASEAN. Exploitation risk, investasi akan terbuka lebar dan menstimulus pertumbuhan ekonomi, namun di sisi lain peluang asing untuk mengeksploitasi sumber daya Indonesia kian terbuka, didukung dengan potensi sumber daya alam Indonesia yang lebih banyak jika dibandingkan dengan negara lain. [ 408 ] P a g e
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
Employment risk berkaitan dengan persaingan tenaga kerja. Akan terdapat peluang besar bagi pencari kerja dengan berbagai keahlian, akses untuk bekerja di luar negeri pun akan semakin mudah, namun jika sumber daya Indonesia tidak memiliki kompetensi dan keterampilan yang memadahi, maka bangsa Indonesia akan kesulitan untuk bersaing dengan sumber daya manusia dari negara lain mengingat dilihat dari segi pendidikan dan produktivitasnya tenaga kerja Indonesia masih berada di bawah Singapura, Malaysia dan Thailand. Hingga Februari 2013, tercatat pengangguran di Indonesia mencapai 7.170.523 orang dari berbagai tingkat pendidikan. Tabel 1 Jumlah pengangguran Indonesia Per-Februari 2013 Tingkat Pendidikan Terakhir Jumlah Belum/tidak tamat SD 513,534.00 SD 1,421,653.00 SLTP 1,822,395.00 SLTA Umum 1,841,545.00 SLTA Kejuruan 847,052.00 Diploma I,II,III/Akademi 192,762.00 Universitas 421,717.00 7,170,523.00 Total Sumber: Data.go.id Dalam kaitannya dengan dunia pendidikan dan tenaga kerja di Indonesia, SMK menjadi bagian dari sistem pendidikan yang memiliki tanggungjawab lebih mengingat tujuan besar yang diusung SMK, yaitu mempersiapkan Sumber Daya Manusia (SDM) yang berkompetensi, handal dan siap kerja. Tujuan tersebut ditegaskan dalam Undang-undang Sistem Pendidikan Nasional (UUSPN) No. 20 tahun 2003 pasal 15 menyatakan bahwa pendidikan kejuruan adalah pendidikan menengah yang mempersiapkan peserta didik terutama untuk bekerja dalam bidang tertentu. Dengan adanya MEA tentu saja tugas SMK menjadi semakin berat karena saingan yang akan dihadapi lulusan-lulusan SMK bukan lagi hanya sesama bangsa Indonesia, tetapi juga lulusan-lulusan dari Negara lain. Lulusan-lulusan dari berbagai Negara akan bersaing untuk membuka peluang karier lintas Negara, termasuk di pasar Indonesia. Sepanjang 2014 saja sudah terdapat 68.762 tenaga asing yang menyerbu Indonesia versi Kementerian Ketenagakerjaan yang dirilis oleh Harian Terbit. Dengan adanya tantangan eksternal tersebut, Indonesia harus terus berupaya meningkatkan kualitas pendidikannya agar mampu menghasilkan SDM yang unggul. Mardapi (2008:5) mengemukakan bahwa upaya untuk meningkatkan kualitas pendidikan dapat ditempuh melalui peningkatan kualitas sistem pembelajaran dan penilaian, di mana keduanya saling berkaitan satu sama lain. Pernyataan tersebut didukung oleh Kunandar (2014:13) yang mengemukakan bahwa Kurikulum 2013 merupakan pengembangan dari kurikulum yang sebelumnya dengan penguatan pada proses pembelajaran dan penilaian. P a g e [ 409 ]
Prosiding Seminar Nasional 9 Mei 2015 Penguatan yang dimaksud adalah Kurikulum 2013 adalah proses pembelajaran dengan pendekatan saintifik dan sistem penilaian otentik. Proses pembelajaran dengan pendekatan saintifik merupakan pembelajaran yang menekankan pada proses bertanya dan menjawab pertanyaan dengan prosedur yang spesifik sesuai dengan tahap penyelidikan ilmiah, yaitu mengamati, menanya, mengumpulkan informasi, mengasosiasi dan mengkomunikasikan. Prosedur ilmiah tersebut kemudian dikenal dengan istilah 5M. Melalui pengalaman pada setiap tahapan 5M diharapkan proses belajar yang dialami siswa akan semakin bermakna. Kompetensi siswa sebagai hasil dari proses pembelajaran yang bermakna tersebut kemudian direkam secara sistematis dan prosedural melalui sistem penilaian otentik. Penilaian otentik dapat didefinisikan sebagai sistem penilaian yang menuntut siswa untuk mengkombinasikan kompetensi yang dimilikinya untuk memecahkan masalah dalam kehidupan nyata maupun kehidupan profesionalnya kelak (Gulikers,2004:67). Senada dengan Gulikers, Lund (1997,25) juga mengungkapkan bahwa penilaian otentik merupakan seperangkat tugas atau tes yang mampu membangun koneksi antara apa yang ada pada kehidupan sehari-hari siswa dengan ideide yang dikembangkan di sekolah. Demi mewujudkan misi besar penilaian otentik pemerintah melalui Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) nomor 66 tahun 2013 tentang standar penilaian mengatur pelaksanaan penilaian otentik di sekolah. Kurikulum 2013 sebagaimana yang diatur dalam permendikbud menuntut guru untuk mampu melaksanakan penilaian hasil belajar siswa yang berdasarkan pada (1) objektivitas penilaian, (2) keterpaduan kompetensi sikap, pengetahuan dan keterampilan, (3) nilai ekonomis penyelenggaraan penilaian, (4) transparansi proses penilaian, (5) akuntabilitas penilaian, serta (6) nilai-nilai pendidikan yang ada dalam pelaksanaan penilaian (edukatif). Selain itu Penilaian Acuan Kriteria (PAK) wajib menjadi landasan setiap penilaian yang dilakukan guru. PAK berarti menilai performa seseorang berdasarkan apa yang dapat dilakukan dan tidak dapat dilakukan oleh seseorang dibandingkan dengan standard atau acuan yang telah ditentukan sebelumnya bukan terhadap performa orang lain dalam melakukan dal yang sama (Reynolds, 2010:79). Berikut ini merupakan teknik dan instrument penilaian otentik yang dapat digunakan guru untuk menyelenggarakan penilaian hasil belajar yang berdasarkan pada prinsipprinsip di atas: 1. Guru dapat melakukan penilaian kompetensi sikap dengan menggunakan empat teknik, yaitu observasi, penilaian diri, penilaian teman sejawat dan jurnal. Instrumen yang dapat digunakan guru antara lain daftar cek, skala penilaian yang disertai rubric serta catatan pendidik. 2. Guru dapat melakukan penilaian kompetensi pengetahuan dengan menggunakan tes baik tes pilihan ganda, tes uraian, tes lisan maupun penugasan. Penilaian otentik juga dituntut untuk mengarahkan siswa untuk mengelola kemampuan high order thinking-nya yang meliputi kemampuan untuk menganalisis, mensintesis, dan mengevaluasi (Lund, 1997:25).
[ 410 ] P a g e
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
3. Guru dapat melakukan penilaian keterampilan siswa dengan menggunakan tes praktik, proyek dan penilaian portofolio. Lund (1997:25) mengungkapkan bahwa tugas yang diberikan guru harus mampu mewakili kinerja siswa pada bidang tertentu. Untuk mendapatkan nilai yang akuntabel dan sesuai dengan keadaan yang sebenarnya, guru juga disarankan untuk menggunakan teknik penilaian yang bervariasi atau triangulasi teknik. Berdasarkan uraian di atas dapat rumuskan bahwa Kurikulum 2013 dirancang untuk meningkatkan kualitas pendidikan melalui penguatan pada proses pembelajaran dan sistem penilaian. Pendidikan berkualitas tinggi diharapkan mampu menghasilkan SDM yang berkualitas, unggul dan memiliki daya saing, khususnya untuk menghadapi MEA. Penilaian otentik yang menjadi salah satu fokus penguatan pada kurikulum 2013 menjadi penting karena dengan terselenggaranya penilaian yang otentik, dalam artian penilaian yang mampu memfasilitasi siswa untuk menggunakan kompetensi-kompetensi yang dimilikinya untuk memecahkan masalah kehidupan profesionalnya, SDM yang dihasilkan akan terbiasa dengan kasus-kasus yang akan mereka hadapi di dunia kerja sehingga menjadi SDM yang berkompetensi, solutif dan siap kerja. SDM yang memiliki karakteristik unggul tersebut akan mampu bertahan dan berjaya dalam persaingan global. Namun, bukan tanpa tantangan penerapan penilaian otentik mengalami cukup banyak kendala. Kurikulum 2013 yang sebelumnya diujicobakan pada 3 SMK di Daerah Istimewa Yogyakarta pada tahun pelajaran 2013/2014 dan dimasukkan pada tahun ajaran 2014/2015 nyatanya kembali diperuntukkan untuk SMK pilot project, yaitu SMK N 1 Wonosari, SMK N 1 Bantul dan SMK N 1 Pengasih. Bukan tanpa alasan, kembalinya peruntukan Kurikulum 2013 untuk sekolah pilot project didasari banyaknya kendala yang dihadapi di lapangan. Dalam kaitannya dengan penerapan penilaian otentik di SMK, kendala yang dihadapi antara lain kompetensi guru untuk menyiapkan perangkat penilaian dan instrument yang sesuai dengan tuntutan sistem penilaian otentik dinilai masih minim. Hal tersebut didukung oleh data yang dirilis oleh Surabaya news, diketahui bahwa rata-rata penguasaan guru terhadap materi penilaian otentik selama pelatihan kurikulum 2013 hanya mencapai 58,52% di mana lebih dari 100 ribu guru mendapatkan nilai kurang dari 40. Bagi guru-guru mata pelajaran produktif SMK, Kurikulum 2013 dirasa semakin sulit karena belum adanya pelatihan untuk guru-guru mata pelajaran produktif, padahal mata pelajaran produktif menjadi andalan untuk menyiapkan lulusanlulusan yang memiliki kompetensi professional. Selain itu, keluhan lain berkaitan dengan sistem penyelenggaraan administrasi penilaian yang dinilai rumit, memakan waktu dan memecah konsentrasi guru dalam mengajar. Mengacu pada urgensi penerapan penilaian otentik bagi pendidikan di Indonesia khususnya SMK serta kendala-kendala yang dihadapi guru dalam penerapannya, proses evaluasi perlu dilakukan untuk mengidentifikasi seberapa baik penerapan penilaian otentik di SMK, apa yang sebenarnya menjadi kendala serta solusi seperti apa yang sebaiknya dilakukan. Evaluasi ini dinilai penting untuk dilakukan demi perbaikan P a g e [ 411 ]
Prosiding Seminar Nasional 9 Mei 2015 penerapan penilaian otentik yang lebih baik di kemudian hari dan terwujudnya SDM yang berorientasi professional. METODE Penelitian ini merupakan penelitian evaluasi dengan menggunakan model evaluasi discrepancy yang dikembangkan oleh Provus (Fitzpatrick, 2011: 155). Penelitian evaluasi ini dilaksanakan di salah satu SMK pilot project di DIY, yaitu SMK N 1 Wonosari. Penelitian ini dibatasi pada penerapan penilaian otentik pada mata pelajaran produktif kelas XI program keahlian keuangan yang terdiri dari 4 mata pelajaran, yaitu Akuntansi Perusahaan Dagang, Akuntansi Keuangan, Administrasi Pajak dan Komputer Akuntansi Penelitian ini dilakukan dengan pendekatan campuran antara pendekatan kuantitatif dan kualitatif. Pendekatan kuantitatif dimaksudkan untuk memperoleh informasi melalui teknik dokumentasi dengan lembar telah dokumen dan kuesioner dengan lembar kuesioner, sedangkan pendekatan kualitatif diperuntukkan untuk menggali informasi melalui wawancara. Teknik dokumentasi dilakukan untuk menelaah tiga dokumen buatan guru mata pelajaran produktif, yaitu Rancangan Pelaksanaan Pembelajaran (RPP), Instrumen Penilaian Pengetahuan, dan Instrumen Penilaian Keterampilan. Lembar telaah dokumen digunakan untuk mengumpulkan informasi tentang kelengkapan RPP, kesesuaian kompetensi yang diukur, penggunaan teknik penilaian, penggunaan perangkat penilaian, serta kesesuaian dengan prinsip umum dan khusus penilaian otentik. Lembar telaah dokumen akan diisi oleh 3 orang ahli di bidang pendidikan akuntansi dengan skala antara 0 sampai dengan 3 sesuai dengan banyaknya deskriptor yang tampak pada tiga dokumen tersebut. Hasil telaah tersebut kemudian dihitung tingkat kecenderungannya dengan tabel 2.
No 1. 2. 3. 4.
Skor
Tabel 2 Kriteria Evaluasi Kategori Sangat Sesuai Sesuai Tidak Sesuai Sangat Tidak Sesuai
Teknik pengumpulan data dengan kuesioner diperuntukkan untuk merekam persepsi siswa tentang penerapan penilaian otentik yang dilaksanakan guru sesuai dengan kapasitasnya. Dari 127 siswa kelas XI SMK N 1 Wonosari, 96 di antaranya dijadikan sampel dalam penelitian ini. Sama halnya dengan data yang diperoleh melalui lembar telaah dokumen, skor yang diperoleh dari lebar kuesioner juga akan dihitung tingkat kecenderungannya dengan tabel 2. Alternatif jawaban yang dapat dipilih siswa dalam kuesioner memiliki rentang skor antara 1 sampai dengan 4. [ 412 ] P a g e
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
Teknik pengumpulan data melalui wawancara dilakukan untuk mendapatkan tambahan informasi sekaligus data yang dapat ditriangulasikan dengan dua teknik sebelumnya. Wawancara dilakukan pada 4 guru mata pelajaran produktif terkait cara guru melakukan penilaian dan kendala yang dihadapi guru. Data yang terkumpul melalui wawancara kemudian direduksi, data yang relevan dengan penerapan penilaian otentik kemudian digunakan sebagai data pendukung atau penjelas. Penerapan penilaian otentik di SMK N 1 Wonosari dinilai sesuai jika data keseluruhan baik yang berasal dari lembar telaah dokumen dan kuesioner masuk dalam kategori sesuai.
Gambar 1 Variabel, Dimensi dan Indikator Penelitian P a g e [ 413 ]
Prosiding Seminar Nasional 9 Mei 2015 HASIL DAN PEMBAHASAN Berdasarkan hasil analisis yang dilakukan diketahui bahwa baik secara administrasi maupun persepsi siswa SMK N 1 Wonosari program keahlian keuangan telah sesuai dalam menerapkan penilaian otentik. Berdasarkan hasil telaah dokumen skor total yang diperoleh mencapai 2,62 dari maksimal skor 3. Terdapat kesenjangan sebesar 0,38 berkaitan dengan beberapa deskriptor yang tidak tampak. Hal tersebut didukung oleh persepsi siswa yang menyatakan bahwa guru telah sesuai dalam menerapkan penilaian otentik dengan skor total sebesar 3,09 dari maksimal skor 4.
Gambar 2 Grafik Skor tiap Indikator Indikator perencanaan penilaian otentik yang pertama mengumpulkan informasi tentang kelengkapan serta kejelasan RPP, khususnya rancangan penilaian yang dibuat guru. Indikator ini mencapai skor sempurna, yaitu 3, artinya keseluruhan RPP yang dibuat oleh guru mata pelajaran produktif telah lengkap, rinci dan jelas berkaitan dengan kelengkapan 4 kompetensi inti (KI 1, KI 2, KI 3, KI 4), kompetensi dasar yang mencakup ranah sikap, pengetahuan, dan keterampilan, indikator pencapaian, teknik penilaian, instrument penilaian dan sistem penilaian dengan menggunakan PAK. Berbeda dengan indikator sebelumnya, indikator kedua tentang kesesuaian kompetensi yang diukur hanya mampu mencapai skor 2,58, meskipun demikian indikator ini masih termasuk dalam kategori sangat sesuai. Kekurangan yang berkaitan dengan indikator ini dapat dilihat dari deskriptor yang paling sering tidak tampak, yaitu deskriptor kedua, kesesuaian indikator pencapaian kompetensi sikap spiritual dengan kompetensi dasar. Setengah dari 4 RPP yang dianalisis tidak mencakup adanya kesesuaian indikator pencapaian kompetensi sikap spiritual dengan kompetensi dasar. Hal tersebut didukung dengan hasil analisis untuk indikator ketiga yang berkaitan dengan teknik penilaian yang digunakan guru. Sama halnya dengan indikator kedua, meskipun indikator ketiga termasuk dalam kategori sangat sesuai, skor yang diperoleh hanya mencapai 2,33 dari skor maksimal 3. Kesenjangan dengan skor maksimal [ 414 ] P a g e
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
dikarenakan seringnya deskriptor pertama tidak muncul. Deskriptor pertama merepresentasikan penilaian sikap spiritual dengan menggunakan teknik observasi, penilaian diri, penilaian teman sejawat, dan jurnal. Meskipun dalam rancangan penilaian sikap spiritual yang dibuat guru dalam RPP kerap tidak muncul, namun persepsi siswa menunjukkan hasil berbeda, menurut siswa, guru telah sesuai dalam melakukan penilaian sikap spiritual dengan capaian skor 2,71, meskipun skor tersebut merupakan skor terendah jika dibandingkan dengan kompetensi inti lainnya. Siswa menilai bahwa guru memberikan nilai tambah dan nilai minus berkaitan dengan sikap spiritual siswa dalam berdoa dan menjawab salam. Hal tersebut berarti, meskipun guru tidak menuliskan rancangan penilaian sikap spiritual secara administrative melalui RPP, namun guru tetap menunjukkan perhatiannya pada sikap spiritual siswa dengan memberikan poin penilaian melalui observasi. Hal tersebut didukung oleh hasil wawancara oleh guru yang mengungkapkan kebiasaannya mencatat dan menegur siswa yang tidak berdoa dengan sungguh-sungguh sebelum memulai atau mengakhiri pembelajaran. Berikut ini grafik persepsi siswa tentang teknik penilaian yang dilakukan guru mata pelajaran produktif:
Gambar 3 Grafik Skor Persepsi Siswa tentang Teknik Penilaian Guru Tidak adanya teknik penilaian sikap spiritual yang jelas yang terjadi pada indikator ketiga menyebabkan ketidakjelasan instrument penilaian sikap spiritual, sehingga indikator keempat tentang instrument penilaian yang digunakan guru hanya memperoleh skor 2,25 meskipun masih termasuk dalam kategori sangat sesuai. Fenomena kekurangsempurnaan sistem penilaian sikap spiritual dijelaskan oleh guru mata pelajaran komputer akuntansi melalui proses wawancara sebagai fenomena kebingungan guru tentang bagaimana menilai sikap spiritual siswa. Guru mengaku kesulitan merumuskan indikator pencapaian kompetensi sikap spiritual karena kurang memahami bagaimana membuat rubrik penilaian sikap spiritual. Kebingungan tersebut P a g e [ 415 ]
Prosiding Seminar Nasional 9 Mei 2015 berkaitan dengan fenomena ketika diinstruksikan untuk berdoa apakah siswa yang menundukkan kepala pasti berdoa? Apakah siswa yang tidak menundukkan kepala tidak berdoa? Atau ketika kompetensi inti menyatakan rasa syukur, bagaimana guru bisa memastikan seorang siswa mensyukuri apa yang ia miliki? Pada kondisi apa rasa syukur yang ditunjukkan siswa dapat diberi poin 4, 3, 2 atau 1? Kompetensi sikap spiritual menjadi penting untuk dipertimbangkan dalam kaitannya dengan pendidikan, penilaian hasil belajar dan upaya untuk menghasilkan SDM yang profesional. Kualitas sikap spiritual seharusnya menjadi poin plus bagi SDM Indonesia, mengingat Indonesia dikenal dengan religiusitas dan fanatismenya terhadap kepercayaan tertentu serta semangat pendidikan karakter yang sedang marak dikembangkan di berbagai tingkatan pendidikan. Kekhasan ini seharusnya dipelihara serta dikembangkan agar dapat menjadi ujung tombak pembeda SDM Indonesia dengan SDM dari negara lain. Karena profesionalisme seseorang bukan hanya ditentukan oleh bagaimana keahliannya dalam melakukan sesuatu tetapi juga etika dan kesantunannya dalam bekerja. Berkaitan dengan prinsip umum penilaian otentik, yaitu objektif, terpadu, transparan, edukatif dan akuntabel, indikator keempat termasuk dalam kategori sangat sesuai dengan perolehan skor 2,91. Kesenjangan 0,09 berhubungan dengan prinsip edukatif, yaitu tentang bagaimana penilaian yang dirancang guru merangsang siswa untuk belajar, berprestasi dan mengelola kemampuan High Order Thinking-nya. Peningkatan kemampuan guru untuk merancang dan mengkonstruksi instrument yang mampu merangsang keinginan siswa untuk terus belajar dan berprestasi serta mengelola kemampuan HOT-nya penting dilakukan karena untuk bertahan dalam persaingan dengan SDM dari Negara lain, generasi Indonesia harus terbiasa terus belajar dan beradaptasi dengan perkembangan teknologi dan pasar. Sama halnya dengan prinsip umum penilaian otentik, prinsip khusus penilaian otentik yang mencakup penilaian berbasis kinerja, pengalaman belajar, kehidupan nyata dunia kerja dan keterpaduan ranah sikap, pengetahuan dan keterampilan belum berhasil memperoleh skor maksimal walaupun tergolong dalam kategori sangat sesuai dengan perolehan skor 2,62. Kesulitan ditemukan pada bagaimana menyusun perangkat penilaian yang mempertimbangkan ranah sikap, pengetahuan dan keterampilan secara terpadu. Informasi tentang prinsip khusus penilaian otentik kemudian dicari tau lebih lanjut dengan menelaah instrument penilaian pengetahuan dan keterampilan yang dibuat guru untuk mengetahui persentase butir soal yang telah memenuhi kriteria kesesuaian dengan kehidupan nyata, keterpaduan, kesinambungan, orientasi kinerja dan motivasi untuk mengelola kemampuan High Order Thinking (HOT). Berdasarkan analisis yang dilakukan, secara keseluruhan instrument penilaian pengetahuan yang dibuat guru telah sesuai dengan penilaian otentik, meskipun perolehan skor hanya 1,78, sedangkan instrumen penilaian ketrampilan memperoleh skor 2,15 dari maksimal skor 3. Berikut ini merupakan grafik rincian hasil telaah instrument pengetahuan dan keterampilan: [ 416 ] P a g e
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
Gambar 4. Hasil Analisis Telaah Instrumen Grafik tersebut memperlihatkan bahwa meskipun secara keseluruhan instrument penilaian keterampilan lebih sesuai dengan prinsip penilaian otentik, namun ternyata untuk indikator kesesuaian dengan konteks nyata instrument pengetahuan lebih sesuai. Dalam rangka memfasilitasi peserta didik dengan simulasi yang semirip mungkin dengan kasus yang akan mereka hadapi di kehidupan profesionalnya dibutuhkan instrument penilaian yang berbasis kinerja yang kompleks. Berbasis kinerja artinya benar-benar mampu untuk mengukur seberapa baik kinerja yang dilakukan peserta didik dalam rangka menyelesaikan suatu permasalahan. Kompleks artinya dalam menyelesaikan permasalahan, peserta didik harus mampu memadukan seluruh kompetensi yang dimilikinya sehingga tidak menimbulkan masalah baru. Oleh karena itu kemampuan guru untuk mengkonstruksi instrument penilaian yang baik menjadi penting dalam kaitannya untuk menyiapkan SDM Indonesia dalam menghadapi MEA. SIMPULAN Dari hasil analisis dan pembahasan di atas dapat disimpulkan bahwa penerapan penilaian otentik di SMK N 1 Wonosari program keahlian keuangan tergolong sesuai dengan perolehan skor mencapai 2,62 dari maksimal skor 3. Kesenjangan sebesar 0,38 berasal dari ketidaksesuaian rancangan penilaian sikap spiritual yang dilakukan guru. Hal tersebut terbukti dengan tidak adanya indikator pencapaian, teknik dan instrument kompetensi sikap spiritual. Selain itu, persentase butir yang terpadu dan berbasis kinerja juga minim. Berdasarkan simpulan tersebut, rekomendasi yang dapat menjadi pertimbangan bagi pihak-pihak yang berkecimpung di dunia pendidikan adalah: 1. Perlu dilakukan penyamaan persepsi antarpraktisi pendidikan tentang bagaimana mengukur kompetensi sikap spiritual siswa, khususnya yang berkaitan dengan rubrik penilaian. P a g e [ 417 ]
Prosiding Seminar Nasional 9 Mei 2015 2. Perlu dilakukan pelatihan penyusunan instrument penilaian pengetahuan dan ketrampilan yang kontekstual, terpadu, berkesinambungan, berbasis kinerja dan memotivasi siswa untuk mengelola kemampuan High Order Thinking (HOT)-nya. 3. Perlu dilakukan identifikasi kekhasan dan kekuatan SDM Indonesia yang mungkin dikembangkan. DAFTAR PUSTAKA Baskoro, Arya. (2014). Peluang, Tantangan, dan Resiko Bagi Indonesia dengan Adanya Masyarakat Ekonomi ASEAN. Diakses dari http://crmsindonesia.org/node/624. pada tanggal 25 April 2015 Fitzpatrick, J.L., Sanders, J.R., & Worthen, B.R., (2011). Program Evaluation Alternative Approaches and Practical Guidelines (4th ed.). New Jersey: Pearson. Gulikers, Judith T.M, Bastiens, Theo J, Kirschner, Paul A. (2004) A Five-Dimensional Framework for Authentic Assessment. Journal of Educational Technology, Research and Development, 52, 67-86. Kunandar. (2014). Penilaian Otentik (Penilaian Hasil Belajar Peserta Didik Berdasarkan Kurikulum 2013) (Ed.Rev). Jakarta: Rajawali Press. Lund, Jacalyn. (1997). Authentic Assessment: It’s Development and Applications. Journal of Physical Education, Recreation & Dance. 68, 25-40. Mardapi, D (2008). Teknik Penyusunan Instrumen Tes dan Nontes. Yogyakarta: Mitra Cendikia Press. Reynolds, C.R, Liwingston, R.B, Willson, V., (2009). Measurement and Assessment in Education (2nd ed.). New Jersey: Pearson.
[ 418 ] P a g e