Penataran dan Pelatihan Profesi Kedosenan Pusat Sumberdaya Belajar (PSB) Universitas Tarumanagara, Jakarta, 5 Januari 2009
Evaluasi Belajar Berbasis Kompetensi P. Tommy Y. S. Suyasa Fakultas Psikologi Universitas Tarumanagara
1. Pendahuluan Belajar (learning) adalah pusat perhatian dari psikologi pendidikan. Hampir keseluruhan topik dalam psikologi pendidikan membahas hal-hal yang berkaitan dengan belajar, antara lain: jenis-jenis pendekatan/metode belajar, metode belajar pada berbagai budaya, perencanaan proses pembelajaran, dan faktor-faktor individu yang memengaruhi efektifitas belajar. Belajar juga adalah kata kunci dari aktivitas seorang siswa. Pada saat seorang siswa ditanya mengenai tujuan berangkat ke sekolah atau ke kampus, siswa tersebut secara spontan akan mengatakan “belajar”. Bahkan pada saat seorang siswa mencari alasan yang “aman” agar diizinkan pergi oleh orangtuanya, siswa tersebut berdalih “belajar bersama teman”. Kata “belajar” juga menjadi pembeda antara individu yang berhasil dan kurang berhasil. Individu yang berhasil identik dengan individu yang mau dan mampu belajar. Sebutlah beberapa tokoh yang berhasil, seperti: Newton, Einstein, Beethoven, Mahatma Gandhi, Bill Gates, dan lain-lain, mereka semua adalah orang-orang yang mau dan mampu belajar. Ruang lingkup belajar tidak hanya terbatas pada hal-hal yang bersifat akademik dan pada tempat yang bersifat formal (sekolah). Tetapi, belajar juga dapat terjadi pada hal-hal yang bersifat non-akademik dan terjadi di lingkungan non-formal, seperti: belajar masak, belajar menjahit, belajar piano, belajar melukis, belajar mengemudi, dan lain-lain. Namun, walaupun belajar dapat terjadi pada konteks yang bersifat non-akademik, dalam tulisan ini, konteks belajar adalah pada hal-hal yang bersifat akademik di lingkungan lembaga formal. Dalam kegiatan belajar yang bersifat akademik di lingkungan formal, timbul usaha-usaha untuk melakukan kegiatan evaluasi. Pemerintah secara resmi mengatur mengenai kegiatan evaluasi ini melalui beberapa undangundang dan peraturan. Dalam Undang-undang No. 20, Tahun 2003, tentang Sistem Pendidikan Nasional, pemerintah menyatakan pentingnya kegiatan evaluasi demi pengendalian dan penjaminan mutu pendidikan. Dalam Undangundang No. 14, Tahun 2005, tentang Guru dan Dosen, pemerintah mewajibkan setiap Guru/Dosen melakukan evaluasi terhadap peserta didiknya. Dalam Peraturan Pemerintah No. 19, Tahun 2005, tentang Standar Pendidikan Nasional, pemerintah mewajibkan setiap lembaga pendidikan menyelenggarakan evaluasi proses pembelajaran pada setiap akhir semester.
Halaman 1 dari 22 halaman
Sebagai tenaga pendidik, guru/dosen sebaiknya tidak melakukan evaluasi belajar semata-mata karena kewajiban yang diamanatkan oleh pemerintah melalui peraturan atau undang-undang. Dalam melakukan evaluasi, guru/dosen ada baiknya didorong oleh semangat dan nilai yang lebih luhur, yaitu sebagai bentuk penghargaan (respect) terhadap usaha yang dilakukan oleh siswa maupun dirinya (guru/dosen). Dengan didasari oleh nilai penghargaan (respect) terhadap siswa, seorang guru/dosen akan memperhatikan bentuk-bentuk pencapaian (achievement) yang berhasil dilakukan oleh siswa. Guru/dosen akan memperhatikan relevansi materi yang akan dijadikan bahan evaluasi dengan materi belajar yang telah dibahas selama ini. Bersamaan dengan hal itu, dengan didasari oleh semangat penghargaan (respect) terhadap dirinya, seorang guru/dosen akan memandang bahwa proses evaluasi merupakan sarana umpan balik atau pengakuan terhadap usaha yang telah dilakukannya selama ini sebagai seorang pendidik. Sebelum membahas lebih lanjut mengenai evaluasi belajar, perlu disepakati pengertian kata “evaluasi” dan kata “belajar”. Kata ”evaluasi” dalam Kamus Besar Bahasa Indonesia (2005), diartikan sebagai proses menilai, menghargai, atau memberikan angka. Memberikan angka identik dengan pengukuran (Thorndike, Cunningham, Thorndike, & Hagen, 1991; Cohen & Swerdlik, 2005; Kiess, 2002). Di dalam buku acuan psikologi pendidikan (Santrock, 2008) tidak disebutkan secara pasti kata ”evaluasi”. Dalam buku acuan psikologi pendidikan, kata ”evaluasi” tampak setara dengan kata ”assessment”, sebab kata ”assessment” yang berasal dari kata ”assess”, berarti menaksir atau menilai (Echols & Shadily, 2006). Dengan demikian dapat disimpulkan bahwa evaluasi adalah proses menilai, menghargai, menaksir, atau mengukur/memberi angka. Belajar adalah suatu perubahan kapasitas individu untuk bertingkah laku, sebagai suatu hasil dari suatu pengalaman khusus (Lieberman, 2000). Kata “perubahan kapasitas” pada definisi tersebut mengandung konotasi “bertambah”. Misalnya: seorang mahasiswa teknik arsitektur yang sebelum kuliah hanya mampu merancang gambar, saat setelah belajar di bangku kuliah, menjadi (bertambah) mampu merancang sebuah maket. Dengan demikian, kata “bertambah” dalam konteks evaluasi belajar, perlu menjadi catatan. Mengacu pada definisi tersebut, belajar dapat dikatakan efektif, bila ada kapasitas yang bertambah. Namun demikian, Lieberman menjelaskan bahwa tidak semua perubahan (kapasitas) tingkah laku dapat digolongkan dalam belajar. Perubahan tingkah laku yang terjadi karena suatu peristiwa, misalnya seorang yang bertambah agresif karena belum makan, tidak dapat digolongkan sebagai belajar. Definisi lain diungkapkan oleh Santrock (2008). Santrock menyatakan bahwa belajar adalah perubahan pada tingkah laku (behavior), pengetahuan (knowledge), atau metode/cara berpikir (thinking skills) yang dihasilkan dari suatu pengalaman. Tingkah laku dapat berupa verbal ataupun non-verbal dan dapat diamati (observable). Sedangkan pengetahuan dan metode berpikir bersifat lebih halus daripada tingkah laku. Pengetahuan dan metode berpikir sulit teramati secara kasat mata. Dalam konteks evaluasi belajar, aspek tingkah laku, pengetahuan, dan metode berpikir, dapat menjadi bahan dasar dari aspekaspek yang akan dievaluasi. Artinya, setelah melalui proses pembelajaran,
Halaman 2 dari 22 halaman
aspek yang berubah boleh jadi tidak dalam bentuk tingkah laku nyata, tetapi hanya dalam bentuk pengetahuan atau cara berpikir. Definisi belajar yang cukup operasional, dalam kaitannya dengan evaluasi belajar diungkapkan oleh Biggs (dalam Syah, 2003). Biggs mengungkapkan bahwa belajar adalah perubahan yang terjadi secara kuantitatif, kualitatif, dan institusional. Secara kuantitatif, belajar mengacu pada banyaknya perubahan yang terjadi (banyaknya materi pembelajaran yang diserap); secara kualitatif, belajar mengacu pada jenis perubahan yang terjadi (ranah & topik pembelajaran); dan terakhir secara institusional, belajar mengacu pada seberapa jauh perubahan atau proses pembelajaran tersebut mendapatkan pengakuan. Dengan demikian dalam tulisan ini akan dibahas mengenai evaluasi belajar dalam konteks akademik-formal. Evaluasi belajar diartikan sebagai proses menilai atau memberi angka terhadap perubahan/penambahan kapasitas pengetahuan, cara berpikir, dan tingkah laku, pada bidang tertentu yang secara formal dipelajari oleh mahasiswa.
2. Tujuan Evaluasi Belajar Tujuan kegiatan evaluasi belajar bukan sekedar memberi nilai atau angka pada siswa. Kegiatan evaluasi belajar adalah kegiatan penting yang harus terintegrasi dengan kegiatan perencanaan dan pelaksanaan proses belajar. Oleh karena itu, seorang guru yang kompeten, akan mengaitkan evaluasi belajar dengan tujuan/rencana belajar dan pelaksanaan kegiatan instruksional/proses belajar (McMillan, 2007). Sehubungan dengan keterkaitan evaluasi belajar dengan proses perencanaan dan pelaksanaan kegiatan belajar, ada beberapa pertanyaan yang perlu dipertimbangkan oleh guru/dosen pada saat merencanakan, melaksanakan, dan mengevaluasi kegiatan belajar. Pertanyaan-pertanyaan tersebut adalah: (a) Materi apa yang dianggap perlu/penting untuk dikuasai oleh siswa? Mengapa?; (b) Materi apa yang perlu diulangi/ditekankan berkali-kali? Mengapa?; (c) Seberapa lama waktu yang dibutuhkan oleh siswa untuk mempelajari berbagai materi yang dianggap penting tersebut?; (d) Apa yang perlu dilakukan agar siswa memiliki semangat/motivasi untuk mempelajari materi tersebut? Keempat pertanyaan tersebut mengarahkan si pembuat evaluasi terhadap empat tujuan evaluasi belajar. Tujuan pertama adalah untuk mengetahui seberapa jauh tingkat penguasaan siswa terhadap suatu materi tertentu yang dianggap penting. Tujuan kedua adalah untuk mengetahui materi apa yang sudah dikuasai dengan baik (sehingga tidak perlu diulang), dan materi apa yang belum dikuasai dengan baik (sehingga perlu diulang). Tujuan ketiga adalah untuk membantu guru/dosen dalam memutuskan apakah siswa layak untuk diluluskan atau tidak. Dengan kata lain, apakah siswa harus mengulang satu semester karena memerlukan tambahan waktu untuk mempelajari materi tersebut. Tujuan keempat dari evaluasi belajar adalah untuk mengetahui seberapa efektif metode instruksional yang telah dilakukan oleh guru/dosen.
Halaman 3 dari 22 halaman
3. Dasar Pemikiran Evaluasi Belajar Berbasis Kompetensi Dalam tujuan belajar yang berbasis kompetensi, individu setidaknya memiliki empat tujuan belajar. The International Bureau of Education UNESCO menyatakan empat kompetensi yang menjadi tujuan belajar individu, yaitu untuk: (a) mengetahui sesuatu (to know), (b) mampu mengerjakan sesuatu (to do), (c) dapat hidup bersama (to live together), dan (d) menjadi seseorang (to be). Keempat tujuan kompetensi tersebut tampak lebih rinci dalam Keputusan Menteri Pendidikan Nasional Republik Indonesia Nomor 045/U/2002, tentang Kurikulum Inti Pendidikan Tinggi, pasal 2 ayat 2, bahwa elemen dasar kompetensi mencakup: (a) landasan kepribadian; (b) penguasaan ilmu dan keterampilan; (c) kemampuan berkarya; (d) sikap dan perilaku dalam berkarya menurut tingkat keahlian berdasarkan ilmu dan keterampilan yang dikuasai; dan (e) pemahaman kaidah berkehidupan bermasyarakat sesuai dengan pilihan keahlian dalam berkarya. Keseluruhan dasar kompetensi yang ingin dicapai dalam pendidikan tersebut, bukanlah dirumuskan begitu saja tanpa dasar. Elemen-elemen kompetensi yang dirumuskan tersebut, pada hakikatnya dilatarbelakangi oleh tiga fenomena, yaitu: fenomena tekne, fenomena oikos, dan fenomena anthropos. Fenomena tekne yaitu fenomena yang menggambarkan bahwa untuk menyelenggarakan kehidupan di dunia, manusia membutuhkan suatu alat/objek material. Oleh karena itu, penting bagi manusia untuk mengetahui, memahami, atau menguasai ilmu pengetahuan tertentu hingga mampu menciptakan alat/objek material yang dapat mendukung kehidupannya. Latar belakang fenomena ini sesuai dengan kompetensi learn to know (dalam empat pilar pendidikan UNESCO) atau sesuai dengan kompetensi penguasaan ilmu dan keterampilan (dalam Kepmendiknas No. 045/U/2002). Fenomena oikos yaitu fenomena yang menggambarkan bahwa dalam hidupnya, manusia selalu berada di dalam kelompok, keluarga, dan masyarakat. Oleh karena itu, penting bagi manusia untuk memiliki keterampilan bersosialisasi, menjalin hubungan antar sesama. Latar belakang fenomena ini sesuai dengan kompetensi learn to live together (dalam empat pilar pendidikan UNESCO) atau sesuai dengan kompetensi landasan kepribadian dan pemahaman kaidah berkehidupan bermasyarakat (dalam Kepmendiknas No. 045/U/2002). Fenomena anthropos, yaitu fenomena yang menggambarkan bahwa manusia pada dasarnya adalah makhluk spritual yang ingin memberikan kontribusi/peran serta di dalam lingkungannya. Abraham Maslow menyebutkan fenomena tersebut sebagai pemenuhan kebutuhan Self-Actualization. Menanggapi fenomena yang terakhir, maka individu dipandang perlu untuk memiliki spesialisasi atau keterampilan tertentu untuk berkarya atau keterampilan yang bersifat aplikatif, yang dapat mendukung usaha mengaktualisasikan dirinya. Latar belakang fenomena ini sesuai dengan kompetensi learn to do dan learn to be (dalam empat pilar pendidikan UNESCO) atau sesuai dengan kompetensi bersikap/berperilaku berdasarkan ilmu dan keterampilan yang dikuasai (dalam Kepmendiknas No. 045/U/2002).
Halaman 4 dari 22 halaman
Ketiga fenomena tersebut, pada prinsipnya kongruen dengan dimensi/aspek psikologis yang dimiliki individu. Dimensi/aspek psikologis yang dimiliki individu, terdiri dari tiga komponen dasar, yaitu: cognitive, affective, dan psychomotor/behavior. Bila fenomena yang telah diuraikan di atas, diselaraskan dengan komponen dasar psikologis, maka dapat dianalogikan bahwa fenomena tekne identik dengan komponen cognitive, fenomena oikos identik dengan komponen affective, dan fenomena antrhopos identik dengan komponen psychomotor/behavior atau boleh jadi dengan keseluruhan komponen.
4. Metode Evaluasi Belajar Berbasis Kompetensi: Content Dalam metode belajar berbasis kompetensi, terdapat enam hal yang perlu diperhatikan, yaitu: content, instrument, unit, setting, schedule, dan analysis. Pertama adalah content. Content adalah target kompetensi yang ingin dicapai dan materi pembelajaran yang diberikan untuk mencapai kompetensi yang dimaksud. Kompetensi yang ingin dicapai tercermin dari aspek/dimensi psikologis individu, yang terdiri dari tiga komponen dasar, yaitu: cognitive, affective, dan psychomotor. Untuk mengevaluasi ketiga aspek/dimensi psikologis tersebut, referensi yang paling umum digunakan adalah Taksonomi Bloom (dikutip oleh Cohen & Swerdlik (2005). Di dalam taksonomi Bloom, komponen cognitive dapat dievaluasi dengan mengidentifikasi enam level pembelajaran, yaitu: level knowledge, comprehension, application, analysis, synthesis, dan level evaluation. Operasionalisasi evaluasi pembelajaran untuk keenam level tersebut akan diuraikan lebih lanjut pada sub-bab instrumen evaluasi belajar. Berikutnya, adalah evaluasi komponen affective. Komponen affective dapat dievaluasi dengan mengidentifikasi lima level pembelajaran, yaitu: receiving, responding, valuing, organizing, dan characterizing. Inti dari kelima level pembelajaran tersebut adalah, individu yang telah melalui proses belajar pada domain affective, akan mengenal, menganggap penting, menerapkan, hingga mampu menginternalisasi nilai-nilai kehidupan yang dipelajarinya. Nilai-nilai kehidupan yang sudah terinternalisasi dan menjadi karakter bagi dirinya, akan membuat individu memiliki social-competency atau mampu menjalankan kehidupan bermasyarakat. Namun demikian, dalam evaluasi belajar berbasis kompetensi, komponen affective yang diidentifikasi melalui lima level pembelajaran tersebut, tampak agak sulit dioperasionalisasikan. Untuk mengantisipasi hal ini, penulis mengusulkan pengukuran komponen affective (social-competency) menggunakan pendekatan teori interpersonalcompetency yang dikemukan oleh Buhrmester, Furman, Wittenberg, dan Reis (1988). Dalam pengukuran interpersonal-competency (social-competency), Buhrmester et al. menggusulkan lima dimensi yang mencerminkan kemampuan individu dalam bersosialisasi, yaitu: dimensi initiative, self-disclosure, asertif/respect to others, emotional support, dan tolerance. Penulis berpendapat dimensi-dimensi tersebut lebih operasional untuk digunakan dalam pengukuran domain affective yang mendukung kompetensi learn to live together atau
Halaman 5 dari 22 halaman
kompetensi kepribadian yang menunjang pemahaman kemampuan hidup bermasyarakat. Alat ukur interpersonal-competency, saat ini dapat diperoleh dari Bagian Riset dan Pengukuran Fakultas Psikologi Universitas Tarumanagara. Terakhir adalah evaluasi komponen psikomotor (behavioral). Komponen ini tampak menjadi sangat penting dalam kehidupan sehari-hari. Ilmu pengetahuan yang sudah dipelajari oleh mahasiswa akan semakin bermanfaat dan nyata, jika mahasiswa dapat menerapkan ilmunya dalam perilaku seharihari. Karena begitu pentingnya komponen tingkah laku, ada suatu kata-kata mutiara yang cukup terkenal, yaitu “orang akan lebih percaya pada apa yang kita lakukan daripada apa yang kita katakan”. Dalam pengukuran komponen psikomotor (kompetensi learn to do) atau kompetensi/kemampuan berkarya, dalam taksonomi Bloom dirumuskan lima level yang dapat diidentifikasi, yaitu: imitation, manipulation, precision, articulation, dan naturalization. Individu yang menjalankan proses pembelajaran yang bersifat penguasaan keterampilan (psychomotor domain), akan disebut kompeten, jika ia menampilkan perilaku/keterampilan tersebut secara alami (natural). Untuk dapat menampilkan perilaku/keterampilan secara alami, individu membutuhkan tahapan, mulai dari meniru (imitation), mencobacoba memodifikasi perilaku yang dipelajari (manipulation), mampu menampilkan perilaku secara akurat (precision), dan pada tingkatan yang lebih tinggi, individu sangat memahami setiap tahap atau seluk-beluk perilaku yang akan ditampilkannya, bahkan individu mengetahui dengan persis bagaimana perilaku ditampilkan secara cepat, kuat, ataupun halus. Pembelajaran domain psychomotor sangat jelas pada pengamatan terhadap individu yang mempelajari suatu keterampilan, misalnya keterampilan bermain alat musik. Sama seperti halnya pengukuran komponen affective, pengukuran komponen psychomotor tampak agak sulit dioperasionalkan. Untuk domain psychomotor, penulis mencoba mengambil analogi dari teori pengukuran kreativitas yang dikemukakan oleh Torrance (dalam Goff [2000]; Woolfolk, [2004]). Menurut penulis, pengukuran aspek psychomotor, berdasarkan anologi kreativitas lebih memungkinkan atau mudah untuk dioperasionalisasikan. Berdasarkan teorinya, Torrance mengemukakan bahwa kreativitas dapat diukur dengan menggunakan empat aspek, yaitu: fluency (jumlah perilaku/keterampilan/produk yang ditampilkan), flexibility (variasi perilaku/keterampilan/produk yang dihasilkan), elaboration (kompleksitas/kerumitan dari perilaku/keterampilan/produk yang dihasilkan), dan originality (keaslian/kemurnian/keunikan dari perilaku/ keterampilan/produk). Namun, sehubungan dengan pengukuran domain psychomotor (untuk mendukung pengukuran kompetensi learn to do, kemampuan berkarya, atau keterampilan), aspek yang digunakan bukan sekedar menggunakan keempat aspek yang ditawarkan oleh Torrance. Penulis mengajukan dua aspek tambahan yang dianggap penting dalam melakukan evaluasi belajar kemampuan berkarya, yaitu: aspek accuracy dan dexterity. Alasan penambahan kedua aspek tersebut adalah untuk melengkapi level pembelajaran dalam taksonomi Bloom, domain psikomotor, khususnya level precision dan naturalization. Level precision, yang belum tercakup dalam aspek kreativitas menurut Torrance, digantikan oleh aspek accuracy. Pengertian
Halaman 6 dari 22 halaman
accuracy adalah kesesuaian/ketepatan/kebenaran perilaku/keterampilan yang ditunjukkan dengan kriteria perilaku/keterampilan yang diharapkan. Level naturalization, yang belum tercakup dalam aspek kreativitas menurut Torrance, digantikan oleh aspek dexterity. Dexterity adalah kelincahan/kecepatan perilaku/keterampilan yang dimiliki, sehingga tampak alami. Dengan demikian, dalam pengukuran domain psychomotor (kompetensi learn to do atau kompetensi kemampuan berkarya), konsep-konsep yang dapat dioperasionalisasikan menjadi aspek-aspek pengukuran adalah fluency, flexibility, elaboration, originality, accuracy, dan dexterity.
5. Instrument Melanjutkan pengukuran komponen cognitive (kompetensi penguasaan ilmu atau tujuan pembelajaran learn to know) yang diurakan pada sub-bab Content, penulis akan menguraikan beberapa format instrument evaluasi belajar yang tergolong metode tradisional. Dalam metode tradisional, pelaksanaan evaluasi belajar pada dasarnya menggunakan kertas dan alat tulis (paper & pencil). Namun, penggunaan kertas dan alat tulis, bukanlah hal yang menyebabkan suatu metode evaluasi belajar dikatakan tradisional atau tidak. Hal yang menyebabkan suatu metode belajar dikatakan tradisional adalah karena format yang ditampilkannya. Dalam metode tradisional, format evaluasi belajar umumnya berbentuk benar/salah, pilihan berganda, essay, dan isian/jawaban singkat. Dengan demikian, walaupun saat ini banyak juga evaluasi belajar yang menggunakan komputer, tidak lagi menggunakan kertas dan alat tulis, namun tetap saja digolongkan sebagai evaluasi belajar dengan metode tradisional, selama format evaluasi belajarnya masih dalam bentukbentuk seperti di atas. Secara umum, Santrock (2008) membagi dua format evaluasi belajar yang tergolong tradisional, yaitu: (a) selected-response items dan (b) constructed-response items. Format pertama, selected-response items adalah bentuk soal, dimana siswa diminta untuk memilih salah satu pilihan jawaban yang diberikan. Suyasa (2007) mengategorikan selected-response items ke dalam bentuk soal objektif. Dikatakan objektif, karena bentuk soal seperti ini memiliki jawaban “benar” yang pasti, baik dari pihak pembuat soal, siswa, maupun pihak yang diminta bantuannya untuk memeriksa jawaban/hasil evaluasi belajar. Format kedua, constructed-response items adalah bentuk soal, dimana siswa diminta memberikan jawaban berupa respons kata-kata/kalimat, bukan sekedar memilih alternatif jawaban yang diberikan. Dalam konteks evaluasi belajar berbasis kompetensi, saat ini, kedua format di atas, dilengkapi dengan format-format lainnya. Formati lainnya akan diuraikan dalam sub-bab Metode Alternatif Evaluasi Belajar. 7.1.Selected-Responses Items Dalam format selected-response items dikenal tiga format yang paling populer, yaitu: (a) format benar/salah (true/false items format), (b) format pilihan ganda (multiple-choice items format), dan (c) format menjodohkan (matching items format). Masing-masing format tersebut
Halaman 7 dari 22 halaman
akan dijelaskan lebih lanjut, dengan menguraikan kriteria penulisan item beserta kekuatan dan kelemahannya. Format benar/salah. Format benar/salah adalah bentuk soal yang disajikan dengan cara menuliskan materi soal dalam bentuk pernyataan. Beberapa hal yang disarankan untuk penulisan soal dalam bentuk ini, yaitu: (a) Soal ditulis dalam bentuk pernyataan yang sangat akurat tanpa dapat diinterpretasikan lebih dari satu makna. Dalam kaitannya dengan hal ini, hindari penggunaan kata-kata yang dapat diinterpretasikan dalam dua ide (seperti kata dan/atau), serta tuliskan secara lengkap fenomena yang memiliki kategori/jenis/tanggal kejadian. (b) Dalam penulisan soal, hindari penggunaan double negative. Double negative terjadi pada saat si pembuat soal menggunakan kata yang bermakna “tidak” lebih dari satu kali di dalam soal. (c) Untuk penulisan butir soal yang bersifat opini, gunakan referensi. (d) Penulisan butir soal dibuat sesingkat mungkin dengan struktur kalimat yang sistematis. (e) Kalimat dalam soal, tidak begitu saja diambil/disalin dari buku teks. Menurut Gronlund (dalam Santrock, 2008), ada beberapa hal yang menjadi kekuatan dan kelemahan format benar/salah. Beberapa hal yang menjadi kekuatan format benar/salah adalah: (a) format ini baik untuk hal-hal yang bersifat fakta, peristiwa, dan opini; (b) waktu yang digunakan untuk membaca soal tipe ini lebih sedikit jika dibandingkan dengan waktu untuk membaca soal tipe pilihan ganda; (c) format ini sangat sesuai untuk evaluasi belajar dengan kuantitas pembelajaran yang banyak, namun waktu yang tersedia sangat terbatas; (d) skoringnya mudah, objektif, dan memiliki reliabilitas yang tinggi. Sebaliknya, hal-hal yang menjadi kelemahan format benar/salah adalah: (a) adakalanya si pembuat soal sulit menuliskan kalimat yang tidak ambigu; (b) pada saat jawaban yang benar adalah pilihan ”salah”, ada kemungkinan, siswa sebenarnya tidak mengetahui apa yang menjadi jawaban ”benar”; (c) sulit digunakan untuk mengukur level berpikir tingkat tinggi (misalnya, analisis, sintesis, & evaluasi); (d) siswa dapat menebaknebak dalam memberikan jawaban. Format pilihan ganda. Format pilihan ganda adalah bentuk soal yang terdiri dari dua bagian. Bagian pertama adalah kalimat soal; bagian kedua adalah satu set (3 atau 4) jawaban, yang terdiri dari satu jawaban benar dan beberapa jawaban salah (distractor). Untuk penghematan kertas, respons jawaban, dari soal dengan format pilihan ganda, dapat diletakkan di lembar yang terpisah. Namun demikian menurut menurut Sax (1997), respons pada lembar yang terpisah tidak cocok untuk siswa sekolah dasar. Dalam penyusunan evaluasi belajar dengan format pilihan ganda, ada beberapa hal disarankan, yaitu: (a) kalimat pada butir soal dirumuskan dengan jelas (tidak rancu). Sehubungan dengan hal ini, hindari penulisan butir soal yang diambil dari potongan kalimat buku teks; hindari penulisan soal dengan kalimat, “Sehubungan dengan soal nomor……” atau “Sehubungan dengan soal di atas…..”. (b) Alternatif jawaban dibuat dalam bentuk sesingkat mungkin. Pembuat soal disarankan tidak melakukan pengulangan kata dalam penulisan pilihan jawaban. (c) Kalimat pada butir soal hanya mengandung hal-hal yang
Halaman 8 dari 22 halaman
penting/perlu. (d) Penggunaan kalimat negatif dalam soal dilakukan secara hati-hati. Sehubungan dengan hal ini, hindari penggunaan kalimat “Di antara pilihan di bawah ini, mana yang tidak termasuk……”. Selain itu, kalimat sedapat mungkin dinyatakan dalam bentuk positif. (e) Untuk mengukur level pemahaman (tingkat berpikir yang lebih tinggi), pada bagian soal disarankan adanya penjelasan (seperti: contoh kasus, grafik, tabel, dll.). (f) Dalam kelompok jawaban, perlu ada kepastian bahwa hanya ada satu jawaban benar. (g) Di dalam kelompok pilihan jawaban, hindari penulisan pilihan jawaban yang mengandung petunjuk (clue). Untuk menghindari petunjuk (clue), maka penulisan pilihan jawaban diusahakan bersifat homogen (misalnya, semua pilihan jawaban berupa kata benda, kata kerja, atau semua pilihan jawaban adalah nama unsur/tokoh, dll.); struktur dan panjang kalimat dalam penulisan pilihan jawaban diusahakan bersifat setara; penulisan pilihan jawaban dibuat dalam susunan/daftar yang berurut ke bawah (vertikal); dan penempatan pilihan jawaban dibuat dalam format acak (random). (h) Dalam penulisan jawaban, hindari penggunaan pilihan jawaban “semua salah”, “semua benar”. Ada beberapa hal yang menjadi kekuatan dan kelemahan format pilihan ganda. Kekuatan format pilihan ganda adalah: (a) format ini dapat mengukur level berpikir yang yang lebih tinggi (pemahaman, analisis, sintesis), bukan sekedar level pengetahuan; (b) format ini lebih dapat mendeteksi usaha siswa dalam belajar. Dengan kata lain, kemungkinan siswa untuk menebak-nebak menjadi kecil (25-33%); (c) format ini mudah diskor, memiliki objektifitas, dan reliabilitas yang tinggi. Beberapa kelemahan format pilihan ganda adalah: (a) siswa membutuhkan waktu yang agak lama untuk membaca soal; (b) pembuatan soal menghabiskan banyak waktu, terutama pada saat merancang pilihanpilihan jawaban. Sehubungan dengan kelemahan format pilihan ganda yang kedua, ada beberapa tips yang dapat diajukan untuk mengatasinya, yaitu: pertama, siswa diminta untuk mengusulkan soal-soal yang akan diujikan, guru/dosen kemudian memodifikasi dan menyempurnakan usulan soal-soal tersebut; kedua, setiap selesai kelas, secara disiplin, guru/dosen menuliskan satu atau dua butir soal untuk dikeluarkan pada saat evaluasi belajar nanti; ketiga, guru/dosen memodifikasi soal-soal yang sudah pernah ada. Format menjodohkan. Dalam format ini, siswa diminta untuk mencari satu pilihan jawaban yang paling tepat di antara banyak pilihan (10 – 20) jawaban. Format menjodohkan sebenarnya identik dengan bentuk soal pilihan ganda, namun format ini dibuat dan disajikan dengan cara yang lebih efisien. Usaha yang dikeluarkan dalam proses pembuatan soal bentuk ini tidak sebanyak usaha yang dikeluarkan untuk pembuatan format pilihan ganda. Namun demikian, efek pengecoh (distractor) yang dimilikinya tidak kalah, bahkan boleh jadi lebih efektif. Jika dalam format pilihan ganda, setiap soal memiliki 2–3 pengecoh, dalam format menjodohkan, setiap soal dapat memiliki 10–20 pengecoh. Dengan demikian, jika siswa tidak benar-benar mengetahui/memahami jawaban, ia tidak dapat menjawab soal tersebut dengan benar.
Halaman 9 dari 22 halaman
Dalam penyusunan butir soal dengan bentuk ini, ada beberapa hal yang disarankan, yaitu: (a) Kolom untuk penulisan butir soal (pertanyaan/pernyataan) dan kolom untuk penulisan pilihan jawaban dibedakan. Kolom untuk penulisan butir soal diberi judul “soal”, dan kolom untuk pilihan jawaban diberi judul “jawaban”. (b) Pilihan jawaban dibuat secara berurut (berdasarkan abjad untuk kata-kata & berdasarkan angka untuk tahun/usia/waktu). (c) Pilihan jawaban dinyatakan secara singkat. (d) Pilihan jawaban diberi kode (a-z atau 1-20). (e) Jumlah pilihan jawaban lebih banyak daripada jumlah soal. (f) Perlu dibuat petunjuk, apakah jawaban hanya boleh dipilih satu kali atau lebih dari satu kali. Kekuatan format menjodohkan merupakan penggabungan dari kekuatan format benar/salah dan kekuatan format pilihan ganda, yaitu: (a) format ini dapat mengukur kuantitas pembelajaran yang banyak, dengan waktu yang terbatas; (b) Format ini dapat mendeteksi usaha siswa dalam belajar. Dengan format ini, kemungkinan siswa untuk menebak-nebak menjadi sangat kecil (5%-10%); (c) format ini mudah diskor, memiliki objektifitas, dan reliabilitas yang tinggi; (d) waktu untuk pembuatan format ini lebih efisien daripada format pilihan ganda. Dibandingkan dengan format benar/salah dan format pilihan ganda, tampaknya kelemahan format menjodohkan adalah yang paling sedikit. Kelemahan format ini adalah keterbatasannya dalam mengukur level berpikir tingkat tinggi (seperti: pemahaman, analisis, & sintesis). Format ini hanya dapat digunakan untuk mengevaluasi hal-hal yang bersifat fakta, peristiwa, atau opini. Di samping ketiga format populer yang telah diuraikan di atas, yaitu: format benar/salah, format pilihan ganda, dan format menjodohkan, ada satu bentuk format yang masih tergolong soal bentuk objektif (selectedresponse items). Format tersebut adalah format problem sets (Hambleton, dalam Suyasa, 2007). Problem sets adalah bentuk evaluasi belajar dengan format pilihan ganda sejumlah 5–10 butir soal. Keseluruhan butir soal tersebut mengacu pada satu fenomena yang ditampilkan dalam berbagai macam bentuk. Bentuk tersebut dapat berupa tulisan yang berisi 1–4 paragraf, berupa rekaman audio, atau berupa video. 7.2.Constructed-Response Items Suyasa (2007) menyebutkan format ini sebagai soal bentuk subjektif. Dikatakan subjektif, karena jawaban siswa belum tentu dinilai benar/salah, jika dilihat dari berbagai sudut pandang (siswa, guru/dosen, & pemeriksa lainnya). Format ini meminta siswa memberikan jawaban berupa katakata/kalimat sesuai dengan persoalan yang diajukan. Dalam constructedresponse items, jawaban berupa kata-kata singkat disebut sebagai shortanswer items, dan jawaban berupa kalimat uraian disebut sebagai essays. Format kata-kata singkat dan format jawaban berupa uraian kalimat akan dijelaskan lebih lanjut. Short-answer items. Wegener (n.d.) menyebut format ini sebagai format completion/supply response items. Format ini disajikan dengan cara menuliskan pernyataan yang tidak lengkap. Kemudian, siswa diminta
Halaman 10 dari 22 halaman
memberikan jawaban berupa kata-kata, untuk melengkapi pernyataan tersebut. Selain dengan pernyataan yang tidak lengkap, format shortanswer items, dapat pula disajikan dengan cara menuliskan pertanyaan yang bersifat tertutup (closed ended question). Beberapa hal yang disarankan dalam penulisan soal dengan bentuk ini, yaitu: (a) pastikan bahwa jawaban bersifat singkat (1–2 kata). Oleh karena itu pernyataan atau pertanyaan harus dirumuskan secara benar atau dengan memperhatikan grammar. (b) Sebisa mungkin, jawaban diletakkan pada posisi paling akhir, bukan di tengah-tengah (bila disajikan dalam bentuk pernyataan). (c) Bila soal disajikan dalam bentuk pertanyaan, gunakan kata-kata tanya yang bersifat tertutup, sesuai dengan jawaban yang diinginkan (siapa, kapan, di mana & apa). (d) Pastikan bahwa hanya ada satu jawaban benar dalam satu butir soal, atau hindari meminta lebih dari satu jawaban, di dalam satu kalimat soal. Kekuatan yang paling utama dari format short-answer items ini adalah kemudahan dalam pembuatan soal. Format ini relatif paling mudah dibuat dibandingkan dengan format evaluasi belajar lainnya. Kekuatan kedua, soal ini murni mengukur pengetahuan yang membutuhkan daya ingat. Bagi siswa yang tidak sungguh-sungguh mempersiapkan diri dalam menghadapi evaluasi belajar, akan kesulitan mengerjakan format seperti ini. Siswa sama sekali tidak mendapatkan clue berupa alternatif jawaban. Kelemahan dari format short-answer items ini adalah: (a) ada kemungkinan siswa memiliki alternatif jawaban “benar”, namun dianggap salah oleh pemeriksa; (b) untuk meningkatkan reliabilitas pengukuran, format ini membutuhkan penilai yang cukup ahli, penilaian jawaban dari evaluasi belajar dengan format ini tidak dapat diwakilkan; (c) tingkatan berpikir yang diukur hanya sampai pada level aplikasi; (d) banyaknya waktu yang dibutuhkan untuk memeriksa jawaban. Essay. Essay adalah format evaluasi belajar yang meminta siswa untuk menuliskan jawaban berupa uraian kalimat. Format ini dapat mengukur ketrampilan berpikir tingkat tinggi (higher level thinking skills). Ketrampilan berpikir tingkat tinggi adalah proses berpikir untuk memecahkan masalah, yang bukan saja membutuhkan kemampuan mengingat dan memahami, tetapi yang juga membutuhkan kemampuan analisis, sintesis, evaluasi, bahkan kemampuan kreasi (creativity level). Menurut Santrock (2008), karena kebebasan yang diberikan kepada siswa dalam menuangkan respons/jawabannya, format ini akan melatih kemampuan pengorganisasian kata-kata/informasi yang dimiliki siswa. Beberapa hal yang perlu diperhatikan dalam pembuatan soal essay adalah: (a) menentukan ranah kognitif (level berpikir) yang akan diukur. Jenis ranah kogntif tersebut, akan menentukan bentuk kalimat pertanyaan yang akan dibuat. (b) Butir soal dibuat dalam bentuk pertanyaan, bukan perintah, dengan maksud untuk memfasilitasi terjadinya proses elisitasi. (c) Pertanyaan yang digunakan bersifat terbuka (open ended). Seperti yang telah disebutkan di atas, format essay mampu mengukur ketrampilan berpikir tingkat tinggi. Ketrampilan berpikir tingkat tinggi yang akan diukur pada format essay mengacu kepada ranah/level kognitif yang dikemukakan oleh Bloom (dalam Anderson & Krathwohl,
Halaman 11 dari 22 halaman
2001). Bloom menyatakan bahwa ranah/level kognitif terbagi dalam enam tahapan berpikir, yaitu: level knowledge, comprehension, aplacation, analysis, synthesis, evaluation. Di dalam bukunya, Anderson dan Krathwohl menambahkan satu level lagi, yaitu creativity. Berikut ini merupakan contoh berbagai bentuk pertanyaan, berdasarkan ranah/level kognitif yang akan diukur, dimulai dari ranah/level kognitif pemahaman. Contoh pertanyaan essay untuk mengukur ranah/level kognitif pemahaman (comprehension) adalah: ”Apakah yang dimaksud dengan...?”, ”Bagaimana pengertian .... menurut tokoh...?”, ”Bagaimana karakteristik dari...?” Beberapa contoh pertanyaan essay untuk mengukur ranah/level kognitif penerapan (aplication) adalah: ”Berdasarkan konsep/teori....., mengapa perilaku X dapat terjadi dalam fenomena....?”, ”Berapa hasil perhitungan.... yang dilakukan dengan menggunakan rumus....?”, ”Bagaimana penerapan teori... dalam kasus...?” Beberapa contoh pertanyaan essay untuk mengukur ranah/level kognitif analisis (analysis) adalah: ”Apa saja perbedaan teori.... dan teori....?”, ”Bagaimana prosedur untuk melakukan...?”, ”Apa saja faktorfaktor yang mempengaruhi.... dan bagaimana penjelasan faktor-faktor tersebut?” Beberapa contoh pertanyaan essay untuk mengukur ranah/level kognitif sintesis (synthesis) adalah: ”Apa saja persamaan teori.... dan teori....?”, ”Bagaimana rumusan permasalahan dari bacaan di atas?”, ”Bagaimana hubungan antara.... dan ....?” Beberapa contoh pertanyaan essay untuk mengukur ranah/level kognitif evaluasi (evaluation) adalah: ”Apakah kelebihan dan kekurangan teori yang dikemukakan oleh.... dibandingkan dengan teori dari....?”, ”Konsep manakah yang paling sesuai untuk menjelaskan....?”, ”Mengapa di satu pihak, individu yang menunjukkan kebutuhan affiliasi yang tinggi dikatakan sebagai individu yang...., tetapi di sisi lain dikatakan sebagai individu yang....?” Beberapa contoh pertanyaan essay untuk mengukur ranah/level kognitif kreasi (creation) adalah: ”Apa yang akan terjadi, bila konsep.... digabung dengan konsep….?”, ”Berdasarkan teori-teori yang ada, apa saja solusi yang dapat Anda berikan untuk mengatasi fenomena...?” Terdapat beberapa kekuatan dari format essay dibandingkan dengan format evaluasi belajar lainnya. Kekuatan pertama, adalah kemampuan format ini untuk mengukur ranah/level berpikir tingkat tinggi, bahkan dapat mengukur kreativitas. Kekuatan kedua, waktu yang dipergunakan untuk menyusun evaluasi belajar dengan format ini relatif singkat, apalagi jumlah pertanyaan/soal essay yang diberikan pada saat ujian umumnya relatif sedikit (kurang dari 10 butir). Kekuatan ketiga, format ini melatih siswa untuk mengekspresikan dan mengorganisasi ide/pemikirannya melalui tulisan. Di samping kekuatan, adapun beberapa kelemahan format essay, yaitu: (a) reliabilitas penilaiannya tergolong rendah jika dibandingkan dengan format evaluasi yang bersifat objektif; (b) Pemeriksa seringkali memberikan nilai tinggi berdasarkan kerapian tulisan atau berdasarkan
Halaman 12 dari 22 halaman
panjangnya jawaban; (c) waktu yang digunakan oleh siswa untuk menjawab, maupun waktu yang digunakan oleh penilai untuk memeriksa jawaban, cukup banyak; (d) pemeriksaan tidak dapat diwakilkan kepada pihak yang awam, pemeriksa harus memiliki kualifikasi tertentu dan sudah terlatih. Untuk mengatasi berbagai kelemahan pada evaluasi belajar dengan format essay, khususnya yang berhubungan dengan proses penilaian, beberapa ahli (Devine & Yaghlian, n.d.; Santrock, 2008) menyarankan beberapa hal, yaitu: (a) proses pemberian angka mentah (raw score) dilakukan oleh expert/ahli. (b) Bila memungkinkan, penilai meminta orang lain yang juga expert sebagai penilai ke dua (second opinion). (c) Pada lembar jawaban essay, identitas siswa sebaiknya berupa kode/nomor ujian, bukan nama/nomor induk mahasiswa. Hal ini untuk mengurangi bias penilaian yang terjadi akibat faktor hubungan penilai dengan siswa. (d) Penilai hendaknya menyelesaikan pemeriksaan soal nomor tertentu untuk keseluruhan subjek/siswa, sebelum melakukan pemeriksaan pada nomor soal berikutnya. (e) Pertimbangan penilaian diberikan atas dasar isi (content), bukan atas dasar baik buruknya tulisan, dan bukan atas dasar panjang/pendeknya tulisan. (f) Pemeriksa membuat outline berdasarkan kriteria jawaban yang dianggap ideal. Dengan demikian, pada satu butir soal essay, sifat penilaian (pemberian raw score) tidak sekedar bersifat benar/salah (1 & 0), tetapi dalam bentuk range (misalnya 1–5). Semakin banyak kriteria yang terpenuhi, semakin tinggi pula angka yang diberikan. Kriteria jawaban yang dianggap ideal harus berhubungan dengan range pemberian angka (misalnya, angka 1 diberikan pada jawaban yang setidaknya menyebutkan kriteria....; angka 2 diberikan pada jawaban yang menyebutkan kriteria.... dan ....; dst.). 7.3.Metode Alternatif Evaluasi Belajar Metode alternatif adalah bentuk-bentuk penilaian yang sejalan dengan tuntutan output proses pembelajaran yang tidak saja hanya pada kemampuan/kompetensi kognitif, tetapi juga pada aspek kompetensi atau keterampilan riil lainnya (Depdiknas, 2006). Menurut Burz dan Marshall (dalam Santrock, 2008), saat ini terdapat tren/kecenderungan bahwa siswa bukan saja dituntut untuk mengetahui (knowing), tetapi juga dituntut untuk menunjukkan (showing) secara riil apa yang dipelajarinya. Dengan demikian siswa bukan saja diminta untuk menjawab pertanyaanpertanyaan, seperti pada metode tradisional, tetapi juga mampu menampilkan apa yang dipelajarinya dalam bentuk karya. Beberapa format evaluasi belajar yang dapat digolongkan ke dalam metode alternatif adalah: (a) pembuatan karya tulis (paper) berdasarkan hasil observasi, wawancara, penyebaran kuesioner, atau praktikum; (b) tugas presentasi berdasarkan studi literatur atau berdasarkan karya tulis yang sudah dibuat; (c) pembuatan produk/instrumen dengan dilengkapi manual atau laporan pembuatan produk yang bersangkutan; (d) pembuatan kumpulan/koleksi bahan-bahan yang relevan dengan materi pembelajaran; (e) penugasan untuk menampilkan perilaku tertentu yang sesuai dengan suatu prosedur pada materi pembelajaran.
Halaman 13 dari 22 halaman
Beberapa metode alternatif yang disebutkan di atas, sejalan dengan apa yang dikemukan Knotek (2005). Knotek menyebutkan bahwa portfolio assessment dapat digunakan sebagai metode evaluasi belajar. Portfolio assessment adalah penilaian terhadap segala sesuatu yang dikumpulkan oleh siswa, seperti: karya tulis yang pernah/belum pernah dipublikasi oleh siswa; video yang dibuat oleh siswa sehubungan dengan materi pembelajaran, atau kumpulan video yang dibuat orang lain, berkaitan dengan materi pembelajaran; karya-karya seni yang dibuat oleh siswa untuk menunjang proses pembelajaran; berbagai komentar guru tentang siswa bersangkutan sehubungan dengan prestasi yang pernah diraihnya; poster ilmiah yang dibuat oleh siswa, baik dalam rangka hobi maupun penugasan pameran; hasil interviu siswa dengan pihak-pihak tertentu (expert) sehubungan proses pembelajaran; puisi, hasil tes, dan berbagai macam dokumentasi hasil pemecahan masalah di bidang yang sedang dipelajari; serta catatan/evaluasi oleh siswa terhadap dirinya. Dibandingkan dengan metode tradisional, metode alternatif memiliki kekuatan, antara lain: evaluasi belajar dengan metode ini erat kaitannya dengan penerapan/aplikasi dalam kehidupan sehari-hari, bukan sekedar pada aspek pengetahuan/pemahaman. Kedua, aspek-aspek yang dievaluasi bersifat menyeluruh, bukan sekedar aspek kognitif. Namun demikian adapun kelemahan metode alternatif ini, yaitu: reliabilitas penilaian yang dimilikinya tergolong rendah, dan sama halnya dengan format essay, pemeriksaan tidak dapat diwakilkan kepada pihak awam, harus kepada pihak dengan kualifikasi tertentu atau sudah terlatih. Untuk mengatasi beberapa kelemahan yang ada, maka di dalam menerapkan metode alternatif evaluasi belajar, sebaiknya guru/dosen menyepakati beberapa hal bersama siswa. Hal-hal yang perlu disepakati adalah: bagaimana kriteria penilaian atau aspek-aspek pembelajaran apa saja yang akan diukur dengan metode ini, bagaimana format laporan yang diharapkan oleh guru/dosen, bagaimana prosedur pelaksanaan teknis penugasan, serta siapa pihak-pihak yang akan menilai karya tersebut. Saat membuat kesepakatan, ada baiknya guru/dosen mempertimbangkan aspek kemampuan dan waktu yang dimiliki oleh siswa. Pertimbangan ini dilakukan demi menjaga, atau bahkan untuk meningkatkan motivasi siswa.
6. Unit, Setting, Schedule Melakukan kegiatan evaluasi belajar, pada dasarnya sama dengan melakukan penelitian praktis (action research) dari suatu kegiatan intervensi. Di dalam melakukan penelitian dikenal istilah unit anlysis, setting, dan procedure. Unit analysis adalah satuan objek yang diteliti; dalam hal evaluasi belajar, unit analysis yang dimaksud adalah siswa/mahasiswa yang dapat bersifat individual, kelompok, maupun kelas. Pada kasus-kasus yang membutuhkan evaluasi belajar secara profesional, unit analysis pada level individual sangat diutamakan. Setting. Setting identik dengan lokasi penelitian. Dalam proses belajar berbasis kompetensi, lokasi pembelajaran dapat berada di dalam kelas ataupun
Halaman 14 dari 22 halaman
di luar kelas. Begitu pula, dalam proses evaluasinya, evaluasi belajar berbasis kompetensi dapat dilakukan di dalam kelas, maupun di kondisi alami lingkungan. Evaluasi belajar di kondisi lingkungan alami, perlu dilakukan untuk proses pembelajaran yang melibatkan kegiatan praktik kerja atau praktik lapangan. Dalam kondisi/situasi alami, penilaian kompetensi mahasiswa dapat diberikan oleh observer/supervisor/expert yang ditunjuk. Schedule. Schedule identik dengan procedure, khususnya prosedur yang berkaitan dengan jadwal pengukuran. Pada evaluasi belajar berbasis kompetensi, ujian akhir seharusnya akan dipersepsi lebih positif dibandingkan dengan ujian akhir dalam evaluasi belajar pada umumnya. Pada evaluasi belajar berbasis kompetensi, evaluasi dilakukan secara rutin dan berkesinambungan. Bahkan, jika memungkinkan, evaluasi belajar dilakukan setiap kali pertemuan atau setiap kali terjadi proses pembelajaran. Hal ini tentunya sangat ideal, namun membutuhkan strategi istimewa untuk mewujudkannya.
7. Analysis (Grading) Dalam evaluasi belajar, tahap analisis dapat dianalogikan dengan proses grading. Menurut Santrock (2008), grading adalah proses mengubah/ menerjemahkan informasi hasil penilaian (assessment information) ke dalam huruf atau angka yang menandakan kualitas hasil belajar (performa) siswa. Grading (pemberian nilai/angka) pada hakikatnya merupakan sarana komunikasi yang sangat penting bagi siswa dalam mengetahui kemajuan proses belajarnya (Butler & McMunn, 2006). Dengan huruf/angka, siswa dapat memahami secara objektif evaluasi belajarnya. Di dalam grading, baik evaluator maupun siswa perlu lebih kritis dalam menginterpretasikan nilai/angka. Dalam evaluasi belajar, nilai/angka yang diberikan, secara umum sering digolongkan dalam dua kategori. Kategori pertama adalah nilai berdasarkan norma (norm-reference grading). Kategori kedua adalah nilai berdasarkan acuan (criterion-referenced grading). Penilaian berdasarkan acuan norma (norm-reference grading) sangat umum digunakan untuk melakukan interpretasi hasil pengukuran dalam bidang psikologi, khususnya untuk menginterpretasi hasil tes bakat (aptitude test) dan hasil pengukuran skala kepribadian. Alasan digunakannya acuan norma dalam melakukan interpretasi hasil pengukuran tes bakat dan pengukuran kepribadian adalah ketidakpastian dalam kriteria pengukuran di dalam populasi. Dalam konteks populasi, penentuan tinggi rendahnya skor akan lebih mudah jika menggunakan acuan norma. Dalam arti, interpretasi terhadap kemampuan individu akan dinyatakan dengan membandingkan posisi individu tersebut di dalam populasi. Kemampuan individu akan dinyatakan dalam bentuk berbagai alternatif posisi, yaitu apakah ia berada di atas/di bawah atau pada range ratarata. Dalam penggunaan yang lebih advanced, posisi individu dinyatakan secara lebih detil, baik dalam bentuk standard score (z-score), maupun dalam bentuk T-Score. Populasi yang dimaksud di atas sangat relatif, bisa dalam konteks nasional (National Norms), daerah (Local Norms), sekolah (School Norms), mapun kelompok kecil (Subgroup Norms).
Halaman 15 dari 22 halaman
Penggunaan nilai berdasarkan norma (norm-reference grading) di dalam konteks evaluasi belajar, kurang disarankan. Pertama, penilaian berdasarkan norma tidak berdasarkan prinsip penguasaan materi oleh siswa, tetapi lebih kepada prinsip seberapa baik siswa dibandingkan dengan teman-temannya. Dengan demikian penggunaan nilai berdasarkan norma tersebut kurang sesuai dengan tujuan utama evaluasi belajar. Kedua, penggunaan penilaian berdasarkan norma terkadang melemahkan motivasi siswa (Santrock, 2008). Siswa yang sudah tergolong baik secara penguasaan materi, belum tentu terlihat baik bila dibandingkan dengan performa teman-temannya. Berdasarkan hal di atas, penilaian yang lebih disarankan untuk evalausi belajar adalah penilaian dengan berdasarkan acuan/kriteria (criterionreferenced grading). Penilaian ini sejalan dengan tujuan evaluasi belajar yang sifatnya mengukur tingkat pencapaian suatu aspek pembelajaran atau penguasaan kompetensi. Contoh: pada bidang ilmu psikologi, agar lulus mata kuliah psiko-diagnostik, siswa harus mampu mencapai kriteria, dalam hal ini mampu menyebutkan dan melaksanakan prosedur administrasi pemeriksaan psikologis secara benar dan mampu membuat interpretasi hasil pemeriksaan psikologis secara tertulis; pada pembelajaran yang bersifat informal, untuk lulus dan mendapatkan ijin mengemudi, siswa sekolah mengemudi harus mampu mencapai kriteria menyetir perlahan di area tanjakan dan mampu menjawab benar 80% pertanyaan mengenai rambu-rambu lalu lintas. Begitupula dalam konteks penguasaan materi di perguruan tinggi secara umum. Perguruan tinggi tentunya memiliki ketetapan mengenai kompetensi minimal yang harus dicapai oleh lulusannya. Kompetensi minimal tersebut menjadi acuan/kriteria yang dioperasionalisasikan ke dalam tujuan pembelajaran dan lebih lanjut akan ditetapkan ke dalam persentase kriteria yang harus dicapai dalam evaluasi belajar agar siswa dinyatakan lulus dalam suatu mata kuliah.
8. Hubungan Grading dan Tujuan Evaluasi Belajar Airasian (2005) menyatakan ada empat tujuan grading, yaitu: informational, guidance, administrative, dan motivational. Keempat tujuan grading tersebut, sejalan dengan keempat tujuan evaluasi belajar yang sudah dikemukakan di atas. Dengan perkataan lain, keempat tujuan evaluasi belajar yang telah disebutkan di atas, akan tercermin dari grading (penilaian/angka) hasil evaluasi belajar. Tujuan pertama evaluasi belajar, tercermin dari perbandingan antara angka yang diperoleh siswa dengan angka yang menjadi kriteria penguasaan materi (misalnya, siswa memperoleh angka 60/100, artinya siswa menguasai 60% dari materi yang ditargetkan). Tujuan pertama evaluasi belajar, yaitu untuk mengetahui tingkat penguasaan materi, sejalan dengan tujuan grading yang bersifat informational. Dengan adanya nilai/angka, siswa dan guru/dosen mendapatkan informasi mengenai tingkat penguasaan yang sudah dicapai oleh siswa. Tujuan kedua, tercermin dari perbandingan angka hasil evaluasi belajar pada setiap aspek/topik pembelajaran (misalnya, 60/100 untuk area/topik A, 30/100 untuk area/topik B, 90/100 untuk area/topik C; artinya siswa paling
Halaman 16 dari 22 halaman
menguasai area/topik C, dan siswa paling kurang menguasai area/topik B). Tujuan kedua evaluasi belajar, yaitu untuk mengetahui mana materi yang sudah dikuasai dengan baik dan mana materi yang belum dikuasai dengan baik (sehingga perlu diulang), sejalan dengan tujuan grading yang bersifat guidance. Penilaian/angka mengenai area/topik yang lebih dikuasai dan kurang dikuasai akan memberikan arahan (guidance) kepada siswa dan guru/dosen mengenai area/topik mana yang sulit, sehingga perlu mendapatkan pengulangan atau penekanan kembali. Tujuan ketiga, tercermin dari perbandingan angka yang diperoleh siswa dengan angka yang menjadi kriteria kelulusan (misalnya, skor 60/56, artinya siswa mendapatkan angka 60 yang sudah melebihi target/kriteria untuk lulus, yaitu 56). Tujuan ketiga evaluasi belajar, yaitu untuk membantu guru/dosen dalam memutuskan apakah siswa layak diluluskan atau tidak, sejalan dengan tujuan grading yang bersifat administrative. Penilaian/angka yang didapatkan oleh siswa dalam evaluasi belajar akan membantu guru/dosen secara administratif untuk menentukan apakah siswa layak diluluskan atau masih memerlukan waktu yang lebih lama lagi untuk mempelajari materi. Tujuan keempat, tercermin dari perbandingan antara angka rata-rata kelas dengan angka yang menjadi kriteria yang harus dicapai bila kelas dianggap menguasai materi (misalnya, angka rata-rata kelas adalah 70/100, artinya nilai efektifitas instruksional pengajaran adalah sebesar 70%; dengan kata lain, metode pengajaran, yang dilakukan oleh guru/dosen kepada kelas, sudah cukup efektif). Tujuan keempat evaluasi belajar, yaitu untuk mengetahui seberapa efektif metode instruksional yang telah dilakukan oleh guru/dosen, sejalan dengan tujuan grading yang bersifat motivational. Angka rata-rata kelas yang semakin tinggi, mencerminkan efektifitas metode instruksional yang membuat siswa termotivasi. Angka rata-rata kelas akan menjadi umpan balik kepada guru/dosen untuk merencanakan metode pembelajaran yang sekiranya dapat memotivasi siswa, sehingga proses pembelajaran menjadi efektif.
9. Paradigma seoerang Evaluator Wegener (n.d.), seorang ahli dalam konstruksi tes, menyatakan bahwa di dalam evaluasi belajar, terdapat tiga kesalahan persepsi yang seringkali dilakukan oleh para evaluator. Tiga kesalahan persepsi tersebut adalah: (a) hasil evaluasi belajar cenderung digunakan untuk mengurutkan siswa (statistically rank all students); (b) evaluasi belajar ditujukan untuk menguji potensi siswa; (c) evaluasi belajar dianggap baik bila cenderung membentuk kurva normal. Hasil evaluasi belajar cenderung digunakan untuk mengurutkan siswa. Tujuan dasar dari evaluasi belajar adalah untuk mengukur seberapa jauh penguasaan siswa terhadap materi yang dipelajarinya. Dengan mengurutkan hasil evaluasi belajar, apalagi mengumumkan siapa siswa yang paling tinggi atau yang paling baik prestasinya, akan berakibat pada dua hal yang berlawanan dengan tujuan evaluasi belajar. Pertama, pengumuman mengenai ranking akan membuat siswa yang memiliki motivasi rendah atau siswa yang mendapat nilai buruk pada materi ajar, merasa kurang berharga; sebagai pendidik tentunya dosen memahami bahwa harga diri adalah hal yang penting bagi penumbuhan
Halaman 17 dari 22 halaman
semangat belajar. Hal kedua, adalah penyempitan makna inteligensi ; perlu disadari bahwa hasil evaluasi belajar sebenarnya hanya merupakan sampling dari keseluruhan kecerdasaan/pengetahuan (knowledge) yang dimiliki siswa, oleh karena itu dengan mengurutkan siswa dari yang terbaik hingga terburuk berdasarkan hasil evaluasi belajar, pada bidang tertentu, cenderung mengabaikan potensi-potensi lainnya dari siswa. Evaluasi belajar ditujukan untuk menguji potensi siswa. Pembuat evaluasi tanpa disengaja terkadang menampilkan soal-soal yang isinya kurang mengukur hasil belajar. Soal yang kurang mengukur hasil belajar adalah soal yang isinya tidak mencerminkan materi yang menjadi target pembelajaran. Soal yang kurang mengukur hasil belajar tersebut, sering kali sifatnya mengukur potensi siswa yang tidak seharusnya terukur sebagai hasil belajar. Misalnya, siswa diberikan soal-soal untuk jenjang berikutnya atau siswa diberikan soalsoal yang bersifat pengetahuan umum. Kesalahan terjadi pada saat hasil pengukuran potensi tersebut dijadikan sebagai dasar keputusan untuk menentukan apakah siswa sudah menguasai materi pembelajaran atau sebagai dasar keputusan untuk menentukan kelulusan siswa. Evaluasi belajar dianggap baik bila cenderung membentuk kurva normal. Kurva normal adalah grafik distribusi/penyebaran suatu nilai dengan frekuensi tertentu yang bersifat simetris. Artinya grafik kurva norma akan menujukkan bahwa jumlah siswa yang mendapatkan nilai baik sama banyaknya dengan jumlah siswa yang mendapatkan nilai buruk, serta jumlah siswa yang paling banyak adalah siswa yang mendapatkan nilai sedang (tidak baik & tidak buruk). Dalam paradigma tes bakat (aptitude test) dan dalam asumsi pengujian dengan metode statistik parametrik, memang sangat diharapkan hasil pengukuran akan membentuk kurva normal. Generalisasi terjadi pada saat ada anggapan bahwa hasil pengukuran yang baik adalah pengukuran yang menghasilkan bentuk kurva normal. Anggapan ini sebenarnya tidak tepat pada saat akan diterapkan untuk hasil pengukuran tes prestatif. Harapan pihak yang terlibat dalam proses pembelajaran (siswa, guru, & pihak penyelenggara), adalah hasil pembelajaran yang terbaik. Harapan akan hasil belajar yang terbaik, secara statistik akan menghasilkan gambaran distibusi nilai yang tidak membentuk kurva normal, karena nilai akan menumpuk di sisi kanan (skor tinggi). Dengan kata lain, dari hasil evaluasi belajar, justru pihak-pihak yang terlibat dalam proses pembelajaran mengharapkan kurva yang bersifat negatively skewed.
10. Validitas dan Reliabilitas Evaluasi Belajar Seperti yang telah disinggung di atas, evaluasi belajar identik dengan pengukuran/assessment. Setiap pengukuran/assessment yang baik, memenuhi kriteria validitas dan reliabilitas (Thorndike et al., 1991; Cohen & Swerdlik, 2005). Sehubungan dengan kriteria tersebut, maka perlu diajukan pertanyaan mendasar: “Kapan suatu evaluasi belajar dikatakan valid?” dan “Kapan suatu evaluasi belajar dikatakan reliable?” Ada empat jawaban untuk pertanyaan pertama. Suatu pengukuran dikatakan valid, pertama, jika alat ukur yang digunakan dapat dipahami oleh
Halaman 18 dari 22 halaman
individu yang akan diukur (testee); kedua, jika alat ukur yang digunakan telah disetujui oleh para pakar; ketiga, jika alat ukur yang digunakan memiliki kemampuan meramalkan suatu kriteria; keempat, jika alat ukur yang digunakan sesuai dengan suatu teori. Sedangkan untuk pertanyaan kedua, ada tiga jawaban yang paling umum, yaitu: pertama, suatu pengukuran dikatakan reliabel, jika hasil ukur memiliki konsistensi dari waktu ke waktu; kedua, jika hasil pengukuran memiliki konsistensi pada saat diukur dengan alat ukur lain yang mengukur hal yang sama; ketiga, jika butir-butir di dalam alat ukur memiliki konsistensi satu sama lain, dalam arti mengukur hal yang sama; keempat, jika hasil pengukuran memiliki konsistensi pada saat diukur oleh berbagai pihak/penilai. Jawaban-jawaban untuk kedua pertanyaan di atas, jika dicermati identik dengan jenis-jenis validitas dan reliabilitas. Menurut Loewenthal (2001), ada berbagai jenis validitas, yaitu: face validity, content validity, criterion-related validity, construct validity. Inti dari berbagai jenis validitas tersebut, adalah sejauhmana pengukuran mendapatkan hal yang seharusnya diukur. Face validity dalam konteks evaluasi belajar mengandung pengertian sejauhmana struktur kalimat yang dibuat oleh si pembuat tes (dalam hal ini dosen) dapat dipahami oleh siswa; apakah tulisan dapat terbaca dengan jelas; apakah instruksi yang disajikan sudah cukup jelas; apakah waktu yang disediakan cukup; dll., yang pada dasarnya merumuskan sejauhmana tampilan tes dapat dipahami dan dikerjakan secara optimal oleh oleh siswa, sehingga tidak menyebabkan bias pengukuran. Artinya, bila ada siswa mendapatkan skor yang rendah, hal tersebut bukan karena masalah dalam hal penampilan tes (soal ujian) yang dihadapinya, tetapi memang karena faktor kemampuan siswa. Content validity dalam konteks evaluasi belajar, content validity mengandung pengertian sejauhmana isi tes (butir-butir soal) mencerminkan/sesuai dengan materi yang dipelajari. Isi tes yang diambil dari luar bahan/materi yang dipelajari akan menyebabkan terjadinya bias. Dengan kata lain, tes tidak mengukur hasil belajar. Begitu pula isi tes yang tidak sesuai dengan tujuan pembelajaran, akan menyebabkan terjadinya bias. Untuk menyatakan apakah suatu alat ukur (soal ujian) dapat dinyatakan valid secara content, alat ukur (soal ujian) tersebut perlu mendapatkan persetujuan dari pakar. Pakar yang dimaksud, dalam hal evaluasi belajar, adalah guru/dosen yang bersangkutan atau guru/dosen yang mengajar mata kuliah yang sama. Criterion-related validity dalam konteks evaluasi belajar, mengandung pengertian sejauhmana test/assessment yang ada, meramalkan tingkat pencapaian siswa dalam mempelajari bidang yang menjadi mata kuliah lanjutan, di kemudian hari. Misalnya sejauhmana hasil ujian statistik, yang menjadi mata kuliah prasyarat, mampu meramalkan keberhasilan siswa dalam mempelajari/mengerjakan soal-soal psikometri/ekonometri di kemudian hari. Dengan kata lain, metode criterion-related validity, menjadi dasar acuan untuk memutuskan apakah suatu mata kuliah perlu dijadikan sebagai mata kuliah prasyarat bagi mata kuliah lain. Construct validity dapat diartikan sebagai tingkat kesesuaian antara tes dengan (konstruk) teoretis yang ada. Ada beberapa hal yang dapat dijadikan bukti (evidence) apakah tes yang kita buat memiliki construct validity, antara lain: convergent evidence, discriminant evidence, evidence from distinct groups,
Halaman 19 dari 22 halaman
evidence of pretest/posttest changes. Dalam konteks evaluasi belajar, bila tes yang disusun menunjukkan korelasi yang cukup tinggi dengan tes lain yang mengukur konsep/materi pembelajaran yang sama, maka tes prestatif tersebut dikatakan memiliki construct validity (convergent evidence). Bila tes yang disusun tidak menunjukkan korelasi dengan tes lain yang mengukur konsep/materi pembelajaran yang berbeda, maka tes prestatif tersebut dikatakan memiliki construct validity (discriminant evidence). Construct validity juga dapat dinyatakan pada saat tes prestatif yang kita buat memiliki kemampuan membedakan antara kelompok yang mengikuti proses pembelajaran dan kelompok yang tidak mengikuti proses pembelajaran (evidence from distinct groups), serta dapat membedakan antara kondisi sebelum mengikuti proses pembelajaran dan kondisi setelah mengikuti kondisi pembelajaran (evidence of pretest/posttest changes). Setelah kriteria validitas, syarat utama lainnya agar evaluasi belajar dapat dikatakan baik, adalah reliabilitas. Reliabilitas adalah tingkat konsistensi dari suatu hasil pengukuran. Konsistensi tersebut dapat digolongkan ke dalam empat jenis, yaitu: test-retest reliability, parallel-forms reliability, internal consistency reliability, dan inter-scorer reliability. Dari keempat jenis reliabilitas di atas, hanya tiga jenis yang sesuai untuk diterapkan dalam pengembangan tes prestatif. Satu jenis reliabilitas yang tidak sesuai adalah jenis internal consistency reliability. Reliabilitas jenis ini mengungkapkan sejauh mana tes memiliki butir-butir yang mengukur hal yang sama (homogen). Semakin tinggi koefisien internal consitency reliability (KR20 atau ), maka semakin homogen tes tersebut. Untuk tes prestatif, bila pembuat tes mengharapkan butir-butir yang bersifat homogen, ada hal lain yang akan dikorbankan, yaitu dibuangnya butirbutir yang mengukur materi yang seharusnya diukur, atau butir-butir yang seharusnya menjadi kriteria pembelajaran. Dengan kata lain, validtas evaluasi belajar yang dibuat, khususnya content validity menjadi berkurang. Ketiga jenis reliabilitas lainnya sebenarnya cukup sesuai untuk diterapkan. Namun dalam praktek, jarang sekali dilakukan. Test-retest reliability adalah konsistensi hasil pengukuran tes prestatif yang dilakukan dengan menggunakan tes yang sama, namun dalam waktu yang berbeda. Misalnya soal ujian yang sama, pada saat diberikan di kesempatan I akan menghasilkan skor yang relatif sama dengan skor yang dihasilkan pada saat diberikan di kesempatan II. Parallel-forms reliability adalah tingkat yang menunjukkan sejauhmana konsistensi hasil pengukuran tes prestatif yang satu dengan hasil pengukuran tes prestatif yang lain (misalnya hasil tes soal kode A konsisten dengan hasil tes soal kode B), dengan catatan, kedua soal tersebut mengukur hal yang sama. Bila suatu tes telah teruji memiliki parallel-forms reliability, maka tes tersebut seyogyanya dapat digunakan untuk mencegah terjadinya perilaku cheating bagi peserta tes yang duduknya bersebelahan. Soal kode A dapat diberikan untuk peserta yang duduk pada lajur ganjil dan soal kode B dapat diberikan untuk peserta yang duduk pada lajur genap. Terakhir, jenis reliabilitas antar penilai (inter-scorer reliability). Jenis tes ini sangat sesuai untuk diterapkan pada pemeriksaan hasil tes prestatif yang bersifat essay. Hasil pengukuran tes prestatif dianggap memiliki inter-scorer reliability pada saat penilai memberikan angka yang tidak jauh berbeda pada
Halaman 20 dari 22 halaman
respons/jawaban subjek. Artinya penilai pertama dan penilai kedua cukup konsisten dalam memberikan penilaian terhadap hasil proses pembelajaran.
Demikian sekilas tinjauan mengenai evaluasi belajar berbasis kompetensi. Semoga tulisan ini dapat memberikan gambaran mengenai aspek-aspek yang perlu diperhatikan pada saat merencanakan, melaksanakan, dan memanfaatkan hasil evaluasi. Akhir kata, penulis sekedar mengingatkan kepada sesama rekan dosen, bahwa kegiatan evaluasi belajar bukan semata-mata kewajiban apalagi kewenangan, tetapi kegiatan evaluasi adalah bentuk penghargaan (respect) terhadap hal-hal yang sudah berhasil dicapai oleh siswa dalam proses pembelajarannya. Mengacu kepada definisi belajar (learning), sedapat mungkin tolok ukur keberhasilan proses belajar bukanlah kondisi orang lain, apalagi kondisi rekan dosen, tetapi kondisi diri siswa itu sendiri terhadap suatu kriteria.
Daftar Pustaka Airasian, P. (2005). Classroom assessment (5th ed.). New York: McGraw-Hill. Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). A taxonomy for learning, teaching, and assessing. New York: Longman. Buhrmester, D., Furman, W., Wittenberg, M. T., & Reis, H. T. (1988). Five domains of interpersonal competence in peer relationships. Journal of Personality and Social Psychology, 55(6), 991-1008. Butler, S. M., & McMunn, N. D. (2006). A teacher’s guide to classroom assessment. Thousand Oaks, CA: Corwin. Cohen, R. J., & Swerdlik, M. E. (2005). Psychological testing and assessment: An introduction to tests and measurement (6th ed.). New York: McGraw-Hill, Inc. Departemen Pendidikan dan Kebudayaan. (2005). Kamus Besar Bahasa Indonesia (3rd ed.). Jakarta: Balai Pustaka. Depertemen Pendidikan Nasional [Depdiknas]. (2006, Juli). Kurikulum berbasis kompetensi. Slide power point dipresentasikan pada kegiatan Pelatihan Kurikulum Berbasis Kompetensi, Pusat Sumber Belajar Universitas Tarumanagara, Jakarta. Devine, M., & Yaghlian, N. (n.d.). Construction of objective tests. Retrieved January 31th, 2004, from http://www.delweg.com/dpwessay/tests.htm Echols, J. M., & Shadily, H. (2006). Kamus Inggris Indonesia. Jakarta: Gramedia. Goff, K. (2000). Exploiting your creative resources. Journal Record, 1, 20. Retrieved November 10, 2006, from http://proquest.umi.com/pqdweb.html
Halaman 21 dari 22 halaman
Keputusan Menteri Pendidikan Nasional Republik Indonesia Nomor 045/U/2002 tentang Kurikulum Inti Pendidikan Tinggi. Retrieved Desember 2nd, 2008, from http://www.dikti.go.id/index.php?option=com_content&task=category§ionid =2&id=15&Itemid=34 Kiess, H. O. (2002). Statistical concepts for the behavioral sciences (3rd ed.). Boston: Pearson Education Co. Knotek, S. (2005). Portfolio assessment. In S. W. Lee (Ed.), Encyclopedia of school psychology. Thousand Oaks, CA: Sage. Learn to know, learn to do, learn to live together, and learn to be. (n.d.). Retrieved Desember 2nd, 2008, from http://portal.unesco.org/education/ Lieberman, D. A. (2000). Learning: Behavior and cognition (3rd ed.). Belmont, CA: Wadsworth, Thompson Learning. Loewenthal, K. M. (2001). An introduction to psychological tests and scales. London: Psychology Press, Ltd McMillan, J. H. (2007). Classroom assessment (4th ed.). Boston: Allyn & Bacon. Peraturan Pemerintah Republik Indonesia, Nomor 19, Tahun 2005, tentang Standar Nasional Pendidikan. Santrock, J. W. (2008). Educational psychology (3rd ed.). New York: McGraw-Hill. Sax, G. (1997). Principles of educational and psychological measurement and evaluation (4th ed.). Belmont, CA: Wardsworth. Syah, M. (2003). Psikologi belajar. Jakarta: PT RajaGrafindo Persada. Suyasa, P. T. Y. S. (2007, January). Evaluasi belajar dengan metode tes prestatif. Paper dipresentasikan pada kegiatan Pelatihan Profesi Kedosenan, Pusat Sumber Belajar Universitas Tarumanagara, Jakarta. Thorndike, R. M., Cunningham, G. K., Thorndike, R. L., & Hagen E. P. (1991). Measurement and evaluation in psychology and education (5th ed.). New York: Macmillan Publishing, Co. Undang Undang Republik Indonesia, Nomor 20, Tahun 2003, tentang Sistem Pendidikan Nasional. Undang Undang Republik Indonesia, Nomor 14, Tahun 2005, tentang Guru dan Dosen. Wegener, D. P. (n.d.). Test construction. Retrieved January 31th, 2004, from http://www.delweg.com/dpwessay/tests.htm Woolfolk, A. (2004). Educational psychology (9th ed.). MA: Allyn & Bacon.
Halaman 22 dari 22 halaman