JPPIPA, Vol.1 No.1 2016 Jurnal Penelitian Pendidikan IPA http://journal.unesa.ac.id/index.php/jppipa PENGEMBANGAN INSTRUMEN PENILAIAN OTENTIK: VALIDITAS TEORITIS DAN KEPRAKTISAN Oleh: Siti Nurul H.1, Wahyu Budi Sabtiawan2, Hasan Subekti3 1,2,3 Jurusan Ilmu Pengetahuan Alam, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Surabaya Abstrak Tujuan penelitian adalah melihat validitas penilaian otentik yang telah dikembangkan baik teoritis maupun empiris. Subyek penelitian ini adalah penilaian otentik yang telah dikembangkan. Penelitian yang telah dilakukan menggunakan desain penelitian R & D (Research and Development). Instrumen penilaian yang dikembangkan adalah rubrik penilaian project report dan presentasi. Penilaian yang telah dikambangkan diuji kelayakannya berdasarkan validitas teoritis dan empirisnya. Validitas teoritis diukur berdasarkan perspektif dari pakar, sedangkan kepraktisan dievaluasi berdasarkan pendapat mahasiswa terhadap penerapan penilaian tersebut. Hasil yang ditunjukkan penelitian ini adalah instrumen yang telah dikembangkan layak untuk diterapkan berdasarkan hasil validasi kepada pakar dan respon mahasiswa. Penilaian yang telah dikembangkan berada pada kategori “sangat baik” dan “baik”. Setiap item penilaian memperoleh skor 3 dan 4. Analisis kepraktisan yang digambarkan melalui hasil uji coba terbatas dan respon mahasiswa, menunjukkan bahwa mahasiswa memberikan respon positif terhadap penerapan penilaian tersebut, meskipun ada beberapa bagian dari rubrik penilaian perlu untuk direvisi lebih lanjut. Kata Kunci: Penilaian otentik, validitas teoritis, validitas empiris. Abstract The purpose of research is to evaluate the validity of authentic assessment that has been developed both theoretically and empirically. The subjects of this study is authentic assessments that have been developed. Research that has been conducted using research design R & D (Research and Development). Assessment instrument developed is an assessment rubric project report and presentation. Dikambangkan assessment that has been tested for feasibility based on theoretical and empirical validity. Validity measured by the theoretical perspectives of experts, while practicality is evaluated based on student opinion on the application of such assessments. The results of this study demonstrated is an instrument that has been developed feasible to implement based on the results of validation to the expert and student response. Ratings have been developed that are in the category of "very good" and "good". Each item ratings obtained a score of 3 and 4. Analysis of practicality which is illustrated by the results of limited testing and student responses, showed that students responded positively to the implementation of the assessment, although there are some parts of the assessment rubric needs to be revised further. Keywords: Authentic assessment, theoretical validity, empirical validity.
© 2016 Universitas Negeri Surabaya
2
Alamat Korespondensi: Jurusan IPA FMIPA Universitas Negeri Surabaya Gedung C12 Kampus Ketintang E-mail:
[email protected]
ISSN: 2527-7537
asesmen yang menuntut mahasiswa untuk mengintegrasikan antara pengetahuan, keterampilan, dan sikap belajar mereka seperti yang dibutuhkan seorang profesional di dunia kerja (Gulikers dkk., 2006). Hal yang terpenting dari asesmen ini adalah karakteristik yang terkandung di dalamnya karena melalui karakteristik asesmen ini dapat dibentuk sebuah pembelajaran yang otentik. Karakteristik tersebut antara lain task, physical context, social context, assessment result or form, and criteria (Gulikers, Bastiaens, & Kirschner, 2004). Task merupakan tugas otentik yang melibatkan mahasiswa dalam aktivitas seperti pada situasi nyata dalam dunia kerja. Physical context berhubungan dengan aspek fisik seperti tempat dan waktu yang dibutuhkan dalam menyelesaikan tugas seperti seorang profesioal. Social context merupakan aspek sosial yang juga harus terpenuhi dalam penerapan authentic assessment, misalnya dalam dunia kerja seorang profesional akan berkerja dalam tim. Assessment result or form berhubungan dengan bentuk asesmen yang digunakan, dalam hal ini adalah perfomance asessment. Criteria merupakan aspekaspek yang harus dipenuhi oleh mahasiswa selama menyelesaikan tugas, misalnya aspek-aspek dalam rubrik penilaian. Berdasarkan penjelasan mengenai karakteristik dari authentic assessment, salah satu keterampilan yang dapat dikembangkang melalui pembelajaran yang terbentuk berdasarkan karakteristik penialaian ini adalah keterampilan memecahkan masalah. Keterampilan ini merupakan representasi dari aspek yang mampu menjembatani gap tersebut, sehingga mahasiswa dapat mencapai level successful performance. Dengan demikian, penelitian yang akan diusulkan adalah pengembangan penilaian otentik untuk menuntut mahasiswa mempresentasikan keterampilan pemecahan masalah mereka melalui proyek penyusunan bahan ajar. Peneliti akan menguji kelayakan penilaian otentik yang telah dikembangkan berdasarkan tingkat validitas teoritis dan empirisnya.
PENDAHULUAN Peraturan Presiden Republik Indonesia Nomor 8 Tahun 2012 tentang Kerangka Kualifikasi Nasional Indonesia (KKNI) pasal 1 ayat 2 yang berbunyi capaian pembelajaran adalah kemampuan yang diperoleh melalui internalisasi pengetahuan, sikap, keterampilan, kompetensi, dan akumulasi pengalaman kerja. Aspek-aspek yang masih perlu peningkatan secara signifikan adalah keterampilan, kompetensi, dan akumulasi pengalaman kerja. Boud dalam Gulikers, Bastiaens, Kirschner dan Kester (2006) menjelaskan bahwa masih banyak lulusan yang mengalami kesulitan jika sudah dihadapkan pada situasi nyata di lapangan. Hal ini mengindikasikan adanya gap antara apa dinilai pengajar dengan kompetensi yang dibutuhkan oleh pembelajar ketika berada pada situasi nyata di lapangan. Hal ini dikarenakan asesmen umumnya masih dipandang sebagai “assessment of learning”. Dengan kata lain, asesmen hanya digunakan untuk mengukur hasil dari pembelajaran, sehingga pendidik akan cenderung untuk menggunakan asesmen tradisional. Menurut Herrington dan Herrington (2006) menyatakan bahwa asesmen tradisional (paper-pencil test) cenderung mengukur prestasi belajar mahasiswa berdasarkan item-item pertanyaan yang hanya mempunyai satu jawaban benar. Akan tetapi, asesmen seharusnya berada pada posisi “assessment for learning” dimana asesmen tidak hanya untuk mengukur hasil pembelajaran tetapi juga dapat digunakan untuk meningkatkan kualitas pembelajaran (Gibbs & Simpson, 2004). Cohen (1987), Steffe dan Gale (1995) dalam Vos (2015), dan Biggs (1996) telah mengungkap bahwa ketika penilain digunakan untuk aktivitas pengajaran dan mengukur kemampuan pembelajar, pembelajar akan lebih terlibat pada pembelajaran, mempunya kinerja yang lebih baik, dan keterampilan berfikir yang lebih tinggi. Penggunaan asesmen tradisional juga terjadi ditingkat perguruan tinggi. Menurut Reeves dalam Herrington, Reeves, dan Oliver (2010), hal ini terjadi karena dua alasan. Alasan pertama dikarenakan oleh pengajar kurang mendapatkan pelatihan mengenai penggunaan strategi asesmen yang berbeda, sehingga pengajar cenderung untuk menggunakan asesmen tradisional untuk menilai hasil belajar mahasiswa. Alasan kedua dikarenakan oleh kebijakan yang diterapkan di perguruan tinggi tersebut, sehingga kebijakan tersebut mampu membatasi inovasi pengajar yang ingin mengembangkan asesmen yang dapat meningkatkan pembelajaran. Terdapat sebuah asesmen alternatif yang mampu menjembatani gap di atas yaitu Authentic Assessment. Asesmen ini merupakan metode
METODE Subyek penelitian ini adalah penilaian otentik yang telah dikembangkan. Penilaian ini terdiri dari beberapa instrumen penilaian antara lain, rubrik penilaian laporan praktikum, rubric penilaian presentasi, rubrik psikomotor praktikan, dan rubrik untuk lembar observasi sikap mahasiswa. Kelayakan dari penilaian otentik akan ditentukan berdasarkan validitas teoritis dan empirisnya. Validitas teoritis diukur berdasarkan perspektif dari pakar asesmen, sedangkan validitas empiris 2
dievaluasi berdasarkan kepraktisannya yang direpresentasikan dari pendapat mahasiswa terhadap penerapan penilaian tersebut. Data yang diperoleh akan dianalisis secara deskriptif kualitatif, dengan rincian berikut ini.
adalah mahasiswa dengan tingkat keterampilan pemecahan masalah sedang. Kelompok ketiga adalah mahasiswa dengan tingkat keterampilan pemecahan masalah rendah. Wawancara digunakan untuk mengumpulkan informasi tentang respon mahasiswa terhadap penilaian yang dikembangkan. Selama wawancara diasumsikan bahwa mahasiswa menjawab dengan jujur dan tanggung jawab.
Analisis Validitas Teoritis Hasil validasi dari ahli dihitung secara komulatif, kemudian ditentukan nilai rata-ratanya. Tingkat validitas instrumen kemudian ditentukan menggunakan skor yang hasil perhitungan tersebut. Setelah itu, skor dikategorikan menggunakan kriteria yang dirujuk dari Ratuman dan Laurens (2006).
HASIL DAN PEMBAHASAN Validasi Teoritis Validasi instrumen dilakukan oleh dua ahli yang merupakan dosen pengampu mata kuliah asesmen di Prodi S1-Pendidikan IPA. Hasil validasi disajikan berikut ini.
Analisis Validitas Empiris Validitas empiris akan dievaluasi berdasarkan opini mahasiswa. Dengan kata lain, pada tahap analisis ini akan dilakukan penarikan kesimpulan yang didasarkan atas uji coba terbatas dan respon mahasiswa berdasarkan hasil wawancara. Teknik yang digunakan pada wawancara adalah semistructured interview, dimana interviewee akan dibagi menjadi tiga kelopok. Kelompok pertama adalah mahasiswa memiliki tingkat keterampilan pemecahan masalah yang tinggi. Kelompok kedua
Validasi keotentikan penilaian Tingkat keotentikan penilaian dilihat berdasarkan lima aspek, yaitu task, physical context, social context, dan critera
Tabel 1. Hasil Validasi mengenai Keotentikan Penilaian Skor Aspek V1 V2 Task: Mahasiswa diberikan tugas otentik. 4 4 Physical context: Pembelajaran dilakukan di Laboratorium. 4 4 Social context: Mahasiswa dituntut mengerjakan tugas dalam tim. 4 4 4 4 Assessment result/form: Penilaian dititikberatkan pada kinerja mahasiswa. Criteria: Kriteria penilaian telah dideskripsikan dengan rubrik 4 4 Ket: V1=Validator 1; V2=Validator 2
Penilaian Sikap
Sangat baik Sangat baik Sangat baik Sangat baik Sangat baik
Validasi Rubrik Penilaian Validasi rubrik penilaian ini meliputi validasi untuk rubrik penilaian sikap, laporan praktikum, presentasi, dan psikomotor untuk praktikan. Hasil validasi untuk semua rubrik tersebut disajikan pada Tabel 2.
Berdasarkan hasil validasi pada Tabel 1 dapat dikatakan bahwa penilaian yang telah dikembangkan merupakan penilaian otentik karena sudah memenuhi lima kriteria keotentikan (Gulikers dkk., 2004) meliputi task, physical conext, social context, assessment result/form, dan criteria.
Rubrik
Kriteria
Tabel 2. Hasil Validasi Rubrik Penilaian Aspek Skor Rata-rata V1 V2 Kriteria penilaian sesuai dengan 4 4 tujuan pembelajaran. Kriteria penilaian sesuai dengan 4 4 aspek sikap yang dipilih. Rubrik yang dikembangkan membantu penilai untuk 4 4 menentukan level pencapaian mahasiswa. 3
Level Sangat Baik Sangat Baik Sangat Baik
Kriteria untuk level pencapaian tidak ambigu.
Bahasa yang digunakan komprehensif. Laporan Praktikum Kriteria penilaian sesuai dengan tujuan pembelajaran. Komponen penilaian memenuhi semua aspek yang dibutuhkan oleh laporan praktikum. Rubrik yang dikembangkan membantu penilai untuk menentukan level pencapaian mahasiswa. Kriteria untuk level pencapaian tidak ambigu. Bahasa yang digunakan komprehensif. Presentasi Kriteria penilaian sesuai dengan tujuan pembelajaran. Komponen penilaian memenuhi semua aspek yang dibutuhkan oleh rubrik presentasi. Rubrik yang dikembangkan membantu penilai untuk menentukan level pencapaian mahasiswa. Kriteria untuk level pencapaian tidak ambigu. Bahasa yang digunakan komprehensif. Psikomotor untuk Kriteria penilaian sesuai dengan Praktikan tujuan pembelajaran. Komponen penilaian memenuhi semua aspek yang dibutuhkan oleh rubrik psikomotor untuk praktikan. Rubrik yang dikembangkan membantu penilai untuk menentukan level pencapaian mahasiswa. Kriteria untuk level pencapaian tidak ambigu. Bahasa yang digunakan komprehensif. Ket: V1=Validator 1; V2=Validator 2 Berdasarkan data yang disajikan pada Tabel 2, rubrik-rubrik yang telah dikembangkan adalah valid dan dapat diterapkan dengan tingkat pencapaian validasi sangat baik dan baik Meskipun
4
4
Sangat Baik
3
3
Baik
4
4
4
4
4
4
Sangat Baik
3
3
Baik
3
4
4
4
4
4
Sangat Baik Sangat Baik Sangat Baik
4
4
Sangat Baik
3
3
Baik
4
4
4
4
Sangat Baik Sangat Baik
4
4
Sangat Baik
4
4
Sangat Baik
3
3
Baik
3
3
Baik
Sangat Baik Sangat Baik
demikian, ada masukan dari validator yang tuliskan pada Tabel 3.
Tabel 3. Masukan dari Validator Sebelum Validasi Setelah Validasi Pada rubrik sikap (lembar observasi sikap) istilah Dipilih istilah kelompok untuk konsistensi untuk kelompok sangat bervariasi yaitu group dan penulisan pada lembar observasi sikap. 4
tim. Sebaiknya ditentukan penggunaan istilahnya.
secara
konsisten
Salah satunya adalah melakukan evaluasi melalui respon mahasiswa. Hasil respon mahasiswa yang diperoleh dari hasil wawancara disajikan pada Tabel 4.
Validasi Empiris Setelah instrumen dikatakan valid, maka perlu dilakukan evaluasi mengenai kepraktisan instrumen. Terdapat beberapa cara untuk mengevaluasi kepraktisan sebuah instrumen.
Pertanyaan Bagaimana menurut Anda penilaian yang diterapkan dalam pembelajaran ini?
Jelaskan efek positif dan neg atif menggunakan penilaian ini! Bagaimana menurut Anda, jika penilaian ini diterapkan pada pembelajaran ke depan?
Tabel 4. Respon Mahasiswa Respon Mahasiswa Mahasiswa 1 Mahasiswa 2 Penilaian yang diterapkan Penilaiannya sudah sesuai dengan apa yang ingin bagus... Kriteria dicapai pada pembelajaran... penilaian jelas dan penilaian yang diterapkan semua aspek dinilai menggabungkan antara penilaian pengetahuan, sikap, dan keterampilan...
Mahasiswa 3 Setiap aspek dinilai dan bisa dipertanggungjawabka n karena kriterianya sudah jelas...
Efek positifnya adalah penilaian menjadi jelas. Efek negatifnya tidak ada
Efek positif: Nilai yang diperoleh presisi. Efek negatif: tidak ada
Efek positif: Lebih mudah mencapai target. Efek negatif: terlalu detail, sehingga nilai mahasiswa bisa cenderung kecil. Sangat setuju jika diterapkan ke depannya.
Perlu untuk diterapkan ke depannya dan masih ada kriteria yang perlu direvisi yaitu kriteria penyajian hasil praktikum pada rubrik untuk laporan praktikum
Berdasarkan respon mahasiswa yang disajikan pada Tabel 4 penilaian yang dikembangkan memenuhi aspek kepraktisan dimana mahasiswa yang bertindak sebagai interviewee memberikan respon positif terhadap semua pertanyaan yang diajukan kepada mereka. Terdapat beberapa dari pernyataan mahasiswa yang perlu diperhatikan yaitu perlu adanya revisi kriteria pada rubrik untuk laporan praktikum, setuju untuk diterapkan, dan penilaian yang telah dikembangkan menghargai dan memperhitungkan integrase penilaian aspek pengetahuan, sikap, dan keterampilan.
... penilaian seperti ini bisa membuat mahasiswa lebih termotivasi karena semua aspek dihargai dan diperhitungkan.
SIMPULAN DAN SARAN Simpulan Instrumen penilaian yang dikembangkan telah memenuhi unsur otentik dan layak untuk diterapkan berdasarkan hasil validasi pakar (valid dengan revisi). Berdasarkan validasi empiris yang dievalusi melalui respon mahasiswa menunjukkan bahwa mahasiswa memandang instrumen penilaian ini perlu diterapkan kedepannya, meskipun ada beberapa bagian dari rubrik penilaian perlu untuk direvisi lebih lanjut. 5
& Kester, L. 2006. Relations between student perceptions of assessment authenticity, study approaches and learning outcome. Studies in Educational Evaluation, Vol. 32, pp. 381–400. Herrington, A., & Herrington, J. 2006. What is an authentic learning environment?. In T. Herrington and J. Herrington (Ed). Authentic learning environment in higher education, 48-60. Hersey, USA: Information Science Publishing. Herrington, J. & Herrington, A. 1998. Authentic assessment and multimedia: How university students respond to a model of authentic assessment. Higher Education Research & Development, Vol. 17 No. 3, pp. 305-322. Herrington, J., Reeves, T.C., & Oliver, R. 2010. A guide to authentic e-learning. UK: Routledge. Peraturan Presiden Republik Indonesia Nomor 8 Tahun 2012 tentang Kerangka Kualifikasi Nasional Indonesia (KKNI) pasal 1 ayat 2. Vos, L. 2015. Simulation Games in Business and Marketing Education: How Educators Assess Student Learning for Simulations. The International Journal of Management Education, 13, 57-74.
Saran Hal yang perlu diperhatikan pada instrumen penilaian yang telah dikembangkan adalah kriteria pada masing-masing aspek dari setiap rubrik. Dengan demikian, Saran dari peneliti adalah pengguna harus lebih memperhatikan kriteria dari aspek ke-5 (penyajian hasil praktikum) pada rubrik laporan praktikum dan aspek ke-3 (visualisasi) pada rubrik presentasi karena masih kurang operasional. Selain itu, perlu dilakukan evaluasi reliabilitas dari instrumen yang dikembangkan, sehingga terpenuhi aspek valid dan reliabel. DAFTAR PUSTAKA Biggs, J. B. 1996. Enhancing Teaching Through Constructive Alignment. Higher Education, 32, 347-364. Cohen, S. A. 1987. Instructional Alignment: Searching for Magic Bullet. Educational Research, 16(8), 16-20. Gibbs, G., & Simpson, C. 2004. Condition under which assessment supports students’ learning. Learning and Teaching in Higher Education, Issue 1. Gulikers, J.T.M., Bastiaens, T.J., Kirschner, P.A. 2004. A five-dimensional framework for authentic assessment. Educational Technology Research and Development, Vol. 52 No. 3, pp. 67- 86. Gulikers, J.T.M., Bastiaens, T.J., Kirschener, P.A.,
6