ASESMEN DALAM PENDIDIKAN
Disusun oleh: Prof. Dr. I Wayan Koyan, M.Pd.
JURUSAN TEKNOLOGI PENDIDIKAN FAKULTAS ILMU PENDIDIKAN UNIVERSITAS PENDIDIKAN GANESHA TAHUN 2007
.
1
BAB I PENDAHULUAN A. Pendidikan Sebagai Suatu Sistem Sebelum sampai pengkajian tentang asesmen dalam pendidikan, terlebih dahulu perlu dikemukakan tentang pendidikan sebagai suatu sistem. Suatu sistem adalah jalinan antar beberapa komponen yang saling terkait dan saling mempengaruhi, sehingga jika salah satu komponen mengalami gangguan, keseluruhan sistem akan terganggu. Pendidikan sebagai sistem tersusun atas komponen konteks, input, proses, output, dan outcome. Konteks berpengaruh pada input, input berpengaruh pada proses, proses berpengaruh pada output, dan output berpengaruh pada outcome. Dengan demikian, jika mutu pendidikan rendah, maka yang mempengaruhinya adalah semua komponen yang terkait dalam sistem tersebut. Hal ini dapat dilihat dari kualitas masukan mentah, masukan instrumen (pendidik, kurikulum, sarana dan prasarana, dana pendidikan, tujuan pendidikan), mutu proses belajar, dan pengaruh lingkungan (lingkungan fisik maupun lingkungan sosial-budaya). Komponen-komponen inilah yang mempengaruhi kualitas hasil pendidikan. Berikut ini disajikan gambar yang menunjukkan kaitan antar beberapa komponen dalam suatu sistem. PENDIDIKAN SEBAGAI SUATU SISTEM INSTRUMENTAL INPUT
RAW INPUT
PROCESS
ENVIRONMENTAL INPUT
Gambar 01. Pendidikan sebagai Suatu Sistem
.
2
OUTPUT
Konteks, adalah eksternalitas yang berpengaruh terhadap penyelenggaraan pendidikan dan karenanya harus diiternalisasikan ke dalam penyelenggaraan pendidikan. Lembaga pendidikan yang mampu menginternalisasikan konteks ke dalam dirinya akan membuat lembaga pendidikan sebagai bagian dari konteks dan bukannya terisolasi darinya. Jika demikian, lembaga pendidikan akan menjadi sekolah masyarakat. Konteks meliputi kemajuan ipteks, nilai dan harapan masyarakat, dukungan pemerintah dan masyarakat, kebijakan pemrintah, landasan yuridis, tuntutan otonomi, tuntutan globalisasi, dan tuntutan pengembangan diri serta peluang tamatan untuk melanjutkan pendidikan ataupun untuk terjun ke masyarakat. Input, adalah segala sesuatu yang diperlukan untuk berlangsungnya proses pendidikan, khususnya proses pembelajaran. Input digolongkan menjadi dua, yaitu yang diolah dan pengolahnya. Input yang diolah adalah peserta didik dan input pengolah meliputi visi, misi, tujuan, sasaran, kurikulum, tenaga kependidikan, dana, sarana dan prasarana, regulasi pendidikan, organisasi pendidikan, administrasi pendidikan, budaya pada satuan pendidikan, dan peran masyarakat dalam mendukung lembaga pendidikan. Process, adalah kejadian berubahnya sesuatu menjadi sesuatu yang lain. Proses, meliputi manajemen, kepemimpinan, dan terutama proses pembelajaran. Dalam pendidikan, proses adalah kejadian berubahnya peserta didik yang belum terdidik menjadi peserta didik terdidik. Mutu proses pembelajaran sangat tergantung pada mutu interaksi antara pendidik dan peserta didik. Perilaku pendidik di kelas misalnya, kejelasan mengajar, penggunaan variasi metode mengajar, variasi penggunaan media pendidikan, kesungguhan mengajar, penggunaan jenis pertanyaan, manajemen kelas, penggunaan waktu, kedisiplinan, keempatian
terhadap
peserta
didik,
hubungan
interpersonal,
ekspektasi,
keinovasian pengajaran, dan penggunaan prinsip-prinsip pengajaran dan pembelajaran yang efektif. Demikian juga, mutu interaksi peserta didik di kelas sangat tergantung pada mutu perilaku peserta didik di kelas. Misalnya, keseriusan belajar, semangat belajar, perhatian terhadap pelajaran, keingintahuan, usaha, pertanyaan, dan kesiapan belajar.
.
3
Output pendidikan adalah hasil belajar atau prestasi belajar yang merefleksikan seberapa efektif proses pembelajaran diselenggarakan. Artinya, prestasi belajar ditentukan oleh tingkat efektivitas dan efisiensi proses pembelajaran. Prestasi belajar ditunjukkan oleh peningkatan kemampuan dasar dan kemampuan fungsional. Kemampuan dasar meliputi daya pikir, daya kalbu, dan daya raga yang diperlukan oleh peserta didik untuk terjun di masyarakat dan untuk mengembangkan dirinya. Daya pikir terdiri atas daya pikir deduktif, induktif, ilmiah, kritis, kreatif, eksploratif, diskoveri, nalar, lateral, dan berpikir sistem. Daya kalbu terdiri atas daya spiritual, emosional, moral, rasa kasih saying, kesopanan, toleransi, kejujuran dan kebersihan, disiplin diri, harga diri, tanggung jawab, keberanian moral, kerajian, komitmen, estetika, dan etika. Daya raga terdiri atas kesehatan, kestaminaan, ketahanan, dan keterampilan. Kemampuan fungsional antara lain meliputi kemampuan memanfaatkan teknologi dalam kehidupan,
kemampuan
mengelola
sumberdaya,
kemampuan
kerjasama,
kemampuan memanfaatkan informasi, kemampuan menggunakan sistem dalam kehidupan, kemampuan berwirausaha, kemampuan kejuruan, kemampuan menjaga harmoni dengan lingkungan, kemampuan mengembangkan karir. Outcome adalah dampak jangka panjang dari output atau hasil belajar, baik dampak bagi individu tamatan maupun bagi masyarakat. Outcome memiliki dua dimensi yaitu: (1) kesempatan melanjutkan pendidikan dan kesempatan kerja, dan (2) pengembangan diri tamatan. Berdasarkan konsep pendidikan sebagai suatu sistem, kita dapat mengadakan asesmen atau evaluasi pada masing-masing komponen atau pada beberapa komponen dalam sistem. Asesmen dalam pendidikan mencakup aspekaspek yang luas, paling sedikit mencakup tiga sasaran pokok, yaitu: (1) asesmen program pendidikan, (2) asesmen dalam proses pembelajaran, dan (3) asesmen hasil belajar. Asesmen program pendidikan, menyangkut penilaian terhadap semua komponen pendidikan, yaitu: penilaian pada konteks, input, proses, dan output; bahkan mungkin sampai pada outcome atau dampak. Atau hanya menyangkut beberapa aspek saja, antara lain: tujuan pendidikan, isi program, strategi pelaksanaan program, dan sarana pendidikan.
.
4
Asesmen proses pembelajaran menyangkut penilaian terhadap kualitas interaksi antara pendidik dan peserta didik, kegiatan pendidik dalam proses pembelajaran, kegiatan peserta didik, pola interaksi pendidik-peserta didik, dan keterlaksanaan program pembelajaran. Sedangkan asesmen hasil belajar menyangkut hasil belajar jangka pendek dan jangka panjang, meliputi ranah kognitif, afektif, dan psikomotor. Dalam buku teks ini, pengkajian difokuskan kepada asesmen proses dan hasil belajar. B. Pengertian Asesmen, Pengukuran, Tes, dan Evaluasi Sebelum diuraikan lebih lanjut, perlu dijelaskan mengenai beberapa istilah yang berkaitan dengan asesmen, yaitu mengenai istilah: assessment, test, evaluation, dan measurement, yang penggunaannya sering agak membingungkan karena semua istilah tersebut termasuk ke dalam proses yang sama. Menurut Linn dan Gronlund, asesmen (assessment) adalah istilah umum yang melibatkan semua rangkaian prosedur yang digunakan untuk mendapatkan informasi tentang hasil belajar peserta didik (misalnya: observasi, skala bertingkat tentang kinerja, tes tertulis) dan pelaksanan penilaian mengenai kemajuan belajar peserta didik. Sedangkan test adalah tipe khusus dari asesmen yang secara khusus terdiri atas seperangkat pertanyaan yang dilaksanakan pada periode waktu tertentu sampai dengan dapat membandingkan semua peserta didik. Di lain pihak, measurement atau pengukuran ialah pemberian tanda atau angka pada hasil sebuah tes atau bentuk lain dari asesmen menurut aturan tertentu. Pengertian asesmen hampir sama dengan pengertian evaluasi (evaluation), tetapi asesmen memberi penekanan yang lebih besar pada kinerja tugas-tugas pada bentuk nyata dan kompleks (Linn dan Gronlund, 1995). Penggunaan istilah asesmen tampaknya lebih ramah dan saat ini cenderung digunakan secara bergantian atau bersamasama dengan istilah evaluasi. Dengan demikian, jelaslah bahwa assessment memiliki pengertian yang lebih luas daripada pengertian evaluation, measurement, dan test. Dalam hubungan ini, Brown menyatakan bahwa pengukuran adalah pemberian tanda dengan angka terhadap perilaku menurut aturan tertentu (Brown, 1983). Sedangkan Kerlinger menyatakan bahwa pengukuran adalah pemberian angka
.
5
pada objek-objek atau kejadian-kejadian menurut suatu aturan (Kerlinger, terjemahan: 2000). Dengan demikian, dapat disimpulkan bahwa pengukuran adalah proses kuantifikasi atau pemberian tanda dengan bilangan atau angka kepada objek atau perilaku tertentu menurut aturan-aturan tertentu. Selanjutnya, mengenai tes, Gronlund menyatakan bahwa tes hasil belajar adalah suatu prosedur yang sistematis untuk mengukur sampel perilaku yang representatif tentang tugas-tugas pembelajaran peserta didik (Gronlund, 1993). Pendapat lain menyatakan bahwa tes adalah seperangkat pertanyaan atau tugastugas untuk menentukan bentuk-bentuk respon yang berkenaan dengan perilaku peserta didik (Salvia dan Ysseldyke, 1995). Sedangkan Nitko menyatakan bahwa tes adalah suatu instrumet atau prosedur yang sistematis untuk mengobservasi dan menggambarkan satu atau lebih ciri-ciri peserta didik dengan menggunakan skala numerik atau klasifikasi tertentu (Nitko, 1996). Berdasarkan pendapat-pendapat tersebut di atas dapat disimpulkan bahwa yang dimaksud dengan tes adalah instrumen atau alat atau prosedur yang sistematis yang terdiri atas seperangkat pertanyaan atau tugas-tugas untuk mengukur suatu perilaku tertentu pada peserta didik dengan menggunakan bantuan skala numerik atau kategori tertentu. Tes hasil belajar adalah alat atau instrumen untuk mengukur hasil belajar, baik hasil belajar pada ranah kognitif, afektif, maupun psikomotorik. Untuk melaksanakan asesmen terhadap proses dan hasil belajar, terlebih dahulu perlu dilakukan pengukuran terhadap sasaran ukur (atribut orang, objek, peristiwa). Selanjutnya, mengenai pengukuran (measurement) adalah pemberian angka pada objek atau peristiwa menurut aturan (Kerlinger). Pendapat yang hampir sama menyatakan bahwa pengukuran adalah pemberian angka pada objek atau peristiwa menurut aturan yang memberikan arti kuantitatif kepada angka itu (Wiersma dan Jurs, 1990). Selanjutnya, Gronlund menyatakan bahwa pengukuran adalah proses untuk memperoleh deskripsi angka tentang derajat karakteristik tertentu yang dimiliki oleh individu (Gronlund, 1993). Dari pendapat-pendapat tersebut dapat disimpulkan bahwa pengukuran adalah pemberian bilangan kepada atribut orang, objek, atau peristiwa menurut aturan tertentu. Hal ini dapat dibaca pada bagan mengenai proses pengukuran berikut ini.
.
6
Sasaran Ukur: Atribut orang, objek, Peristiwa
Alat Ukur (Skala Ukur) Aturan Cara Ukur
Responden: orang, objek, peristiwa
Skor (Data): Bilangan Gambar 02. Proses Pengukuran
Makna gambar tersebut di atas dapat dijelaskan sebagai berikut. 1) Sasaran ukur pada responden adalah atribut orang (hasil belajar mahapeserta didik, sikap karyawan), atribut objek (tinggi meja, kedalaman ilmu), peristiwa (kecepatan pengolahan data); biasanya berbentuk variable. 2) Alat ukur (skala ukur) dibuat, diuji coba, diperbaiki, dan harus cocok dengan sasaran ukur dan responden 3) Skala ukur adalah besaran pada alat ukur (Misalnya: satuan ukur) yang digunakan untuk memperoleh skor atau data. 4) Cara ukur adalah cara alat ukur diberikan kepada responden untuk memperoleh skor; dalam hal ini perlu diperhatikan sifat alat ukur, sifat responden, dan kualitas skor. 5) Skor adalah bilangan yang diberikan kepada atribut orang, objek, atau peristiwa. 6) Nilai adalah arti dari skor sebagai hasil pengukuran; skor ditransformasi menjadi nilai.
.
7
C. Manfaat Asesmen Asesmen atau evaluasi memiliki manfaat bagi berbagai pihak, antara lain bagi peserta didik, pendidik, pembimbing atau konselor, sekolah, dan bagi orang tua peserta didik. Bagi peserta didik, hasil evaluasi memberikan informasi tentang kompetensi yang telah dicapai oleh peserta didik. Atas dasar informasi itu, peserta didik dapat melakukan upaya untuk perbaikan hasil evaluasi terhadap dirinya. Bagi peserta didik yang belum mencapai kompetensi minimal, tentu hasil evaluasi yang diperolehnya dapat memberikan motivasi untuk belajar lebih giat. Sebaliknya, bagi peserta didik yang telah mencapai hasil memuaskan atau telah mencapai
kompetensi dasar minimal sesuai dengan kriteria, mereka akan
berupaya untuk mempertahankan prestasinya dan bahkan berusaha lebih giat untuk mencapai kompetensi ideal atau maksimal. Bagi pendidik, hasil evaluasi terhadap peserta didik dapat memberi gambaran tentang keadaan peserta didik, materi pembelajaran, metode pembelajaran, dan sistem evaluasi yang digunakan. Hasil evaluasi terhadap peserta didik akan memberikan informasi tentang kemajuan belajar tiap peserta didik dan kesulitan belajar yang dialami oleh peserta didik atau mengetahui pada indikator mana peserta didik belum memahami sehingga perlu diadakan pembelajaran
remedi.
Berdasarkan
petunjuk
tersebut,
pendidik
dapat
menupayakan langkah-langkah perbaikan dalam proses pembelajarannya. Demikian juga tentang penggunaan metode pembelajaran, pendidik dapat mengadakan refleksi dan mengupayakan penggunaan metode pembelajaran yang tepat sesuai dengan karakteristik materi pembelajaran. Bagi pembimbing atau konselor, bimbingan dan konseling dapat diarahkan kepada upaya peningkatan daya serap peserta didik dan penyesuaian lingkungan belajarnya. Bimbingan dan konseling diarahkan pada aspek intelektual atau emosional peserta didik, setelah memperoleh informasi yang akurat tentang hasil evaluasi terhadap peserta didik. Manfaat evaluasi bagi sekolah, tergantung pada hasil proses pembelajaran yang telah terjadi. Sekolah dapat melakukan introspeksi diri, apakah kondisi pembelajaran telah sesuai dengan standar pelayanan minimal sekolah. Jika terjadi
.
8
kendala dalam proses pembelajaran karena tidak tersedianya sarana belajar yang memadai, maka sekolah dapat mengupayakan untuk mengatasinya. Tetapi, jika kondisi sarana dan prasarana pembelajaran telah tersedia cukup memadai, maka sekolah dapat meningkatkan kualitas dan efektivitas proses pembelajaran. Bagi orang tua peserta didik, laporan hasil pendidikan yang tercermin dalam buku rapor, akan memberikan informasi yang cukup bagi orang tua tentang tingkat keberhasilan anaknya di sekolah pada periode waktu tertentu. Atas dasar informasi tersebut, orang tua peserta didik dapat mengupayakan intensitas bimbingan belajar di rumah atau melalui lembaga-lembaga kursus tertentu. D. Tujuan dan Fungsi Asesmen Tujuan
utama
melakukan
asesmen
atau
evaluasi
dalam
proses
pembelajaran adalah untuk memperoleh informasi yang akurat mengenai tingkat pencapaian proses pembelajaran. Berdasarkan informasi tersebut, dapat dilakukan tindak lanjut yang merupakan fungsi evaluasi, yang dapat berupa: (1) penempatan yang tepat, (2) pemberian umpan balik, (3) diagnosis kesulitan belajar, dan (4) penentuan kenaikan tingkat atau kelulusan pendidikan pada jenjang pendidikan tertentu. Dengan demikian, tindak lanjut tersebut dapat berupa: (1) tes penempatan (placement test), (2) tes formatif, (3) tes diagnostik, dan (4) tes sumatif. E. Beberapa Prinsip Asesmen Beberapa prinsip asesmen yang banyak dijumpai dalam kepustakaan tentang asesmen atau evaluasi, antara lain bahwa asesmen hendaknya dilakukan secara komprehensif, terpadu, dan berkelanjutan. Prinsip-prinsip asesmen seperti itu, saat ini dikenal dengan asesmen otentik, asesmen berbasis kelas, atau asesmen berbasis kompetensi yang dapat berupa esai, tes kinerja, tugas-tugas, proyek, atau portofolio. Mengenai hal ini, dikaji lebih lanjut pada bagian berikutnya.
.
9
BAB II KLASIFIKASI ALAT UKUR Setelah diuraikan mengenai pengertian tentang pengukuran, tes, evaluasi, dan asesmen, pada bab ini akan dikaji mengenai klasifikasi alat ukur dalam pendidikan. Jenis-jenis alat ukur dapat diklasifikasikan antara lain sebagai berikut: (a) alat ukur fisik (timbangan, meteran, stop watch, thermometer), (b) isian inventori (biasanya berbentuk isian atau kuesioner), (c ) tes (tes hasil belajar, tes kinerja, tes inteligensi, tes bakat, tes kepribadian), (d) kuesioner berisikan sejumlah butir yang ditanyakan kepada responden), (e) wawancara (interviu atau wawancara dilakukan oleh pewawancara kepada responden), (f) observasi (pengamatan), (g) daftar cocok (chek list), (h) skala (alat ukur kiraan atau rating), (i) studi kasus, (j) riwayat hidup, (k) sosiometri, dan (l) asesmen portofolio. A. Alat Ukur Tes 1. Hakikat Tes Mengenai alat ukur fisik tidak dibahas dalam buku ini, karena alat ukur tersebut telah ada secara baku yang digunakan oleh ilmu-ilmu alam. Dalam buku ini, uraian dibatasi pada alat ukur di lingkungan pendidikan. Salah satu alat untuk mengukur hasil belajar adalah tes. Tes sebagai salah satu alat ukur adalah suatu prosedur yang sistematis untuk membandingkan perilaku beberapa orang (Cronbach, 1960: 21). Untuk membandingkan perilaku beberapa orang dapat digunakan skala numerik atau sistem kategori tertentu. Dalam kaitan ini Fernandez mengungkapkan bahwa yang dimaksud dengan tes adalah suatu prosedur
yang
sistematis
untuk
mengamati
perilaku
seseorang
dan
menggambarkannya dengan bantuan skala numerik atau sistem kategori tertentu (Fernandez, 1984:1). Pendapat lain yang lebih rinci menyatakan bahwa tes adalah suatu instrumen atau prosedur yang sistematis untuk mengukur suatu perilaku tertentu (Gronlund dan Linn, 1995: 5). Dari pendapat-pendapat tersebut di atas dapat disimpulkan bahwa tes adalah suatu alat atau prosedur yang terencana dan sistematis untuk mengukur suatu perilaku tertentu serta menggambarkannya dengan bantuan angka-angka atau kategori tertentu. Prosedur yang sistematis mengandung pengertian suatu proses yang teratur.
.
10
Dalam hubungan ini, Brown menyatakan bahwa “measurement is the assignment of numerals to behavior according to rules” (Brown, 1983: 11). Ini berarti bahwa pengukuran adalah pemberian tanda dengan angka terhadap perilaku menurut aturan tertentu. Sedangkan Kerlinger menyatakan bahwa pengukuran ialah pemberian angka pada objek-objek atau kejadian-kejadian menurut suatu aturan (Kerlinger, 2000: 687). Pendapat yang hampir sama dikemukakan oleh Nunnally, yang menyatakan bahwa pengukuran terdiri dari aturan-aturan untuk mengenakan bilangan kepada objek sedemikian rupa guna menunjukkan kuantitas atribut pada objek itu (Nunnally, 1978: 3). Dengan demikian dapat disimpulkan bahwa pengukuran adalah proses kuantifikasi atau pemberian tanda dengan bilangan kepada objek atau perilaku tertentu menurut aturan-aturan tertentu. Selanjutnya, Gronlund menyatakan bahwa tes prestasi belajar adalah suatu prosedur sistematis untuk mengukur sampel yang representatif tentang tugas-tugas pembelajaran peserta didik (Gronlund, 1993:1). Pendapat yang lebih spesifik dikemukakan oleh Salvia dan Ysseldyke, yang menyatakan bahwa tes adalah seperangkat pertanyaan atau tugas-tugas untuk menentukan bentuk-bentuk respon yang berkenaan dengan perilaku peserta didik yang dicari (Salvia dan Ysseldyke, 1995:32). Pendapat lain menyatakan bahwa tes adalah suatu instrumen atau prosedur yang sistematis untuk mengobservasi dan menggambarkan satu atau lebih ciri-ciri peserta didik dengan menggunakan skala numerik atau klasifikasi tertentu (Nitko, 1996:6). Dari uraian dan pendapat-pendapat di atas dapat disimpulkan bahwa yang dimaksud dengan tes adalah instrumen atau alat atau prosedur yang sistematis, yang terdiri atas seperangkat pertanyaan atau tugas-tugas untuk mengukur suatu perilaku tertentu pada peserta didik dengan menggunakan bantuan skala numerik atau kategori tertentu. 2. Tes Formatif Pada uraian terdahulu telah dijelaskan bahwa yang dimaksud dengan tes adalah alat atau prosedur yang sistematis, yang terdiri dari seperangkat pertanyaan atau tugas-tugas untuk mengukur perilaku tertentu pada peserta didik dengan menggunakan bantuan skala numerik atau kategori tertentu. Dilihat dari tujuan
.
11
dan fungsinya, tes atau alat ukur atau instrumen tersebut dapat digunakan untuk mengadakan
tes penempatan, tes diagnostik, tes formatif dan tes sumatif
(Suharsimi Arikunto, 1986:30-34). Lebih lanjut akan diuraikan secara khusus mengenai tes formatif. Secara umum dapat dikatakan bahwa tes formatif adalah alat atau seperangkat pertanyaan atau tugas-tugas yang digunakan untuk melaksanakan evaluasi formatif. Evaluasi formatif atau disebut juga tes formatif adalah salah satu fungsi penilaian untuk mengetahui kekuatan dan kelemahan suatu proses pembelajaran dengan tujuan untuk memperbaiki dan meningkatkan efektivitas proses pembelajaran. Dalam kaitan ini, Tessmer menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah merupakan satu tahapan kegiatan yang dilakukan pada saat suatu bagian materi pelajaran telah selesai diberikan kepada peserta didik . Evaluasi ini dilakukan untuk mengetahui sejauh mana para peserta didik
telah memahami materi pelajaran tersebut dan juga untuk mengetahui
kelemahan-kelemahan yang terjadi pada proses pembelajaran, seperti ketepatan penggunaan metode, media, dan sistem evaluasi yang digunakan dalam proses pembelajaran tersebut. Kegiatan ini dilakukan untuk memperoleh umpan balik yang tepat sehingga proses pembelajaran bisa disempurnakan sehingga menjadi lebih baik (Tessmer, 1995:11). Dalam hubungan ini evaluasi formatif memiliki peranan yang sangat penting untuk memonitor dan memfasilitasi pembelajaran peserta didik , sehingga peserta didik menjadi peduli terhadap pelaksanaan tes formatif (Bailey, 2000:2). Dalam hubungan dengan evaluasi formatif ini, Popham menyatakan bahwa evaluasi formatif menunjuk pada proses penilaian program pembelajaran dengan maksud untuk memperbaiki program pembelajaran tersebut (Popham, 1995:246). Selanjutnya Tessmer menyatakan bahwa evaluasi formatif memiliki empat bentuk atau tipe dengan ciri-ciri sebagai berikut: (1) pandangan ahli (expertreview), (2) penilaian orang-perorang (one-to-one evaluation), (3) kelompok kecil (small group), dan (4) tes lapangan (field test). Keempat ciri evaluasi formatif tersebut merupakan suatu proses penilaian yang dapat digambarkan ke dalam bagan seperti tercantum pada halaman berikut.
.
12
Pada bentuk pandangan ahli, mereka meninjau proses pembelajaran dengan atau tanpa dihadiri oleh penilai. Para ahli dapat berupa ahli isi pelajaran, ahli teknik, ahli desain, atau instruktur dalam suatu proses pembelajaran. Pandangan ahli revisi?
Revisi
Kelompok kecil
Revisi
Tes lapangan
Penilaian orang-perorang Gambar 3. Rangkaian Umum Bentuk Evaluasi Formatif Sumber: Diadaptasi dari Martin Tessmer, Planning and Conducting Formative Evaluation (London: Kogan Page Limited, 1995: 15-16).
Pada bentuk penilaian orang-perorang, seorang peserta didik pada suatu waktu meninjau proses pembelajaran bersama dengan penilai dan memberikan komentar sesuai dengan keperluan. Pada bentuk kelompok kecil, penilai mengadakan uji-coba proses pembelajaran pada kelompok peserta didik
dan
mencatat kinerja mereka dan memberikan komentar sesuai dengan keperluan. Sedangkan pada bentuk tes lapangan, penilai mengamati proses pembelajaran yang sedang diujicobakan dalam situasi sesungguhnya dalam kelompok peserta didik . Secara ideal, pertama-tama penilai hendaknya sebagai ahli, merevisi proses pembelajaran, dan kemudian melakukan penilaian terhadap kelompok kecil dan memperbaiki proses pembelajaran sekali lagi. Dalam evaluasi formatif biasanya membutuhkan waktu khusus dari seluruh rangkaian proses pembelajaran. Waktu yang diperlukan untuk melaksanakan evaluasi formatif tidak boleh terlalu lama dan penilaian tersebut tidak sulit untuk dilaksanakan pada saat proses pembelajaran sedang berlangsung. Seperti telah dikemukakan di atas bahwa evaluasi atau tes formatif dilaksanakan pada saat proses pembelajaran sedang berlangsung atau setelah selesai membahas satu sub pokok bahasan, misalnya dalam bentuk ulangan harian atau kuis kecil. Sedangkan tes sumatif dilaksanakan pada suatu periode tertentu
.
13
setelah beberapa pokok bahasan selesai diberikan, misalnya dalam bentuk ulangan umum yang biasanya dilakukan setiap akhir catur wulan atau akhir semester. Secara diagram, hubungan antara tes formatif dan tes sumatif dapat digambarkan sebagai berikut. Program
Program
evaluasi formatif
Program
evaluasi formatif
Program
evaluasi formatif
Akhir
evaluasi formatif
evaluasi sumatif
Gambar 4. Diagram Hubungan antara Evaluasi Formatif dan Sumatif
Sumber: Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan (Jakarta: Bina Aksara, 1986), pp. 33-34.
Dalam diagram tersebut tampak bahwa evaluasi formatif atau tes formatif dapat dilakukan berkali-kali dalam satu satuan program pembelajaran. Frekuensi pemberian tes formatif tentu harus disesuaikan dengan banyaknya sub pokok bahasan dalam satu program pembelajaran tersebut. Sebaiknya setiap akhir sub pokok bahasan perlu diberikan tes formatif dengan maksud untuk memantau penguasaan peserta didik
terhadap materi
pelajaran tersebut, sehingga dapat diadakan perbaikan-perbaikan. Dalam hubungan ini, Bloom, Hastings, dan Madaus menyatakan bahwa evaluasi formatif tidak hanya digunakan untuk pembuatan atau perbaikan kurikulum, tetapi juga untuk memperbaiki proses pembelajaran dan cara belajar peserta didik . Evaluasi formatif digunakan untuk menilai proses pembuatan kurikulum, proses pembelajaran, dan cara belajar peserta didik dengan tujuan untuk memperbaiki setiap proses-proses tersebut. Ini berarti bahwa dalam evaluasi formatif, pendidik hendaknya berusaha mengembangkan beberapa jenis petunjuk yang sangat berguna selama proses pembelajaran berlangsung, mencari metode yang paling tepat untuk melaporkan kejadian dan mencari cara untuk mengurangi efek negatif yang terkait dengan evaluasi. Hal ini bisa dilakukan dengan memberi tahu pengguna evaluasi formatif, seperti guru, peserta didik , dan penyusun kurikulum. Tujuannya
.
adalah
supaya
pengguna
14
tes
formatif
menemukan
cara
menghubungkan hasil tes dengan tujuan pembelajaran yang dianggap penting (Bloom, Hasting, dan Madaus, 1971:118). Berdasarkan uraian dan pendapat-pendapat tersebut di atas dapatlah disimpulkan bahwa yang dimaksud dengan tes formatif adalah tes yang digunakan untuk mengukur dalam memantau kemajuan belajar peserta didik selama proses pembelajaran berlangsung dalam satu program pembelajaran tertentu, misalnya pada satu sub pokok bahasan dalam pembelajaran. Di samping itu, pelaksanaan tes formatif juga bermanfaat untuk memberikan umpan balik kepada peserta didik , guru-guru, dan penyusun kurikulum guna memperbaiki kelemahan-kelemahan yang terjadi dalam proses pembelajaran, baik pada peserta didik maupun guru. Melalui umpan balik tersebut diharapkan peserta didik dapat menguasai materi pelajaran secara optimal, dan pendidik dapat memperbaiki program pembelajaran, metode, media, dan sistem evaluasi yang digunakan. 3. Bentuk Tes Formatif Menurut bentuknya, tes formatif dapat berbentuk tes esai dan tes objektif dalam berbagai variasi. Dalam hubungan ini, Popham menyatakan bahwa bentuk tes tertulis dibedakan menjadi dua golongan besar, yaitu: (1) soal-soal jawaban memilih (selected-response tests), yang terdiri dari butir soal pilihan benar-salah (true-false items), butir soal pilihan ganda (multiple-choice items), dan butir soal menjodohkan (matching items); dan (2) soal-soal jawaban tersusun atau terstruktur (constructed-response tests), yang terdiri dari butir soal jawaban singkat (short-answer items), dan butir soal esai (essay items) (Popham, 1995:101132).
Sejalan dengan pendapat ini, Wiersma dan Jurs menyatakan bahwa terdapat
dua bentuk utama butir tes, yang secara umum disebut tes objektif dan esai, yang masing-masing memiliki format yang bervariasi. Selanjutnya dinyatakan bahwa istilah butir tes objektif secara umum berhubungan dengan butir jawaban pilihan (selected-response items). Sedangkan butir tes esai adalah salah satu bentuk dari butir jawaban tersusun (constructed-reasponse items) (Wiersma and Stephen G. Jurs, 1990: 41). Dengan demikian pada dasarnya tes tertulis terdiri atas: (1) tes objektif atau tes jawaban memilih dengan berbagai variasi, seperti bentuk pilihan benarsalah, pilihan ganda, dan butir soal menjodohkan; dan (2) tes esai atau tes jawaban
.
15
tersusun atau terstruktur, yang terdiri dari butir tes jawaban singkat dan butir tes uraian atau esai. Dalam kaitan dengan bentuk tes ini, Gronlund dan Linn menyatakan bahwa secara khusus tes yang digunakan dalam kelas dibedakan menjadi dua kategori umum, yaitu: (1) butir tes objektif, yang menuntut pada peserta didik untuk mengisi satu kata atau dua kata, atau memilih jawaban yang benar dari sejumlah alternatif; dan (2) tes esai, yang memberi kesempatan kepada peserta didik
untuk memilih, mengatur, dan mengemukakan jawaban dalam
bentuk esai atau uraian. Pendapat lain menyatakan bahwa pada umumnya terdapat dua bentuk butir tes, yaitu: (1) butir tes objektif yang menuntut peserta didik untuk memilih jawaban yang benar dari beberapa alternatif atau mengisi satu kata atau kalimat pendek untuk menjawab atau melengkapi pernyataan; dan (2) butir tes subjektif atau esai yang memberi kebebasan kepada peserta didik
untuk
menyusun dan mengemukakan jawaban yang orisinil. Selanjutnya masing-masing bentuk tes tersebut akan diuraikan secara lebih rinci pada bagian berikut. a. Tes Objektif Tes objektif memiliki beberapa variasi dan bentuk yang berbeda, tetapi dapat diklasifikasikan ke dalam butir tes yang meminta peserta didik mengisi jawaban dan butir tes yang meminta peserta didik
untuk
untuk memilih
jawaban dari sejumlah alternatif yang ada. Kedua golongan besar ini, menurut Gronlund dan Linn, secara umum dapat dibagi menjadi bentuk butir tes sebagai berikut. (1) Yang termasuk bentuk tes mengisi jawaban (supply type), yakni butir soal jawaban singkat (short answer) dan butir soal melengkapi (completion). (2) Yang termasuk bentuk butir tes yang meminta peserta didik
untuk memilih
jawaban, yakni butir soal benar-salah, menjodohkan, dan pilihan ganda (Gronlund dan Linn, 1993: 122). Mengenai bentuk butir tes jawaban singkat, pengarang lain seperti Popham, menggolongkannya ke dalam tes terstruktur atau tersusun seperti telah dikemukakan di atas. Berkenaan dengan hal tersebut, Ebel menyatakan bahwa bentuk tes yang paling umum dari tes objektif adalah bentuk pilihan ganda, benar-salah, menjodohkan, dan jawaban singkat (Ebel, 1972: 102). Di antara bentuk tes objektif yang umum digunakan adalah butir tes pilihan ganda, menjodohkan, dan benar-salah. Dari ketiga bentuk butir tes tersebut, bentuk pilihan ganda yang paling banyak digunakan (Salvia dan
.
16
Ysseldyke, 1995:223). Dalam hubungan ini Nitko mengemukakan bahwa tes bentuk jawaban singkat meminta pada peserta didik untuk menjawab setiap butir pertanyaan dengan sebuah kata, kalimat pendek, nomor, atau simbol. Tiga bentuk butir tes jawaban singkat biasanya dibedakan menjadi beberapa variasi, yaitu bentuk pertanyaan, melengkapi, dan asosiasi. Variasi bentuk pertanyaan, biasanya mengemukakan pertanyaan secara langsung. Variasi bentuk tes melengkapi meminta peserta didik
untuk menambahkan kata-kata untuk melengkapi suatu
pernyataan yang tidak lengkap. Sedangkan variasi bentuk asosiasi terdiri dari daftar istilah-istilah atau gambar terhadap mana peserta didik dapat menyebutkan nomor-nomor, label, simbol, atau bentuk lain. Selanjutnya, dijelaskan bahwa tes bentuk benar-salah terdiri dari sebuah pernyataan atau proposisi yang harus dinilai oleh peserta didik dan kemudian memberi tanda, apakah benar atau salah. Dalam hubungan ini paling sedikit terdapat enam variasi, yaitu: benar-salah (true-false), ya-tidak (yes-no), betul-salah (right-wrong), pembetulan atau koreksi (correction), pilihan benar-salah jamak (multiple true-false), dan ya-tidak dengan penjelasan (yes-no with explanation). Variasi ”benar-salah” berbentuk proposisi yang harus dinilai oleh peserta didik , apakah penyataan itu benar atau salah. Variasi bentuk “ya-tidak” menanyakan pertanyaan langsung, terhadap mana peserta didik menjawab ya atau tidak. Pada variasi bentuk ”betul-salah,” dikemukakan perhitungan, persamaan, atau kalimat yang harus dinilai oleh peserta didik apakah betul atau tidak betul. Variasi bentuk “koreksi atau pembetulan,” meminta kepada peserta didik untuk menilai sebuah proposisi, seperti pada bentuk benar-salah, tetapi peserta didik
juga diminta untuk memperbaiki atau mengoreksi setiap
pernyataan yang salah dan membetulkannya. Variasi bentuk pilihan “benar-salah” tampaknya sama dengan butir pilihan ganda, malahan pada saat memilih satu opsi yang benar, peserta didik memperlakukan tiap opsi sebagai suatu pernyataan “benar-salah” yang terpisah, yakni lebih dari satu pilihan bisa benar. Sedangkan pada variasi “ya-tidak” dengan penjelasan, menanyakan pertanyaan langsung dan meminta peserta didik
untuk menjawab “ya” atau “tidak,” dan dijelaskan
mengapa pilihannya benar (Nitko, 1996: 124-129). Dalam penelitian ini, bentuk tes objektif yang akan digunakan adalah bentuk pilihan ganda. Oleh karena itu, pada uraian lebih lanjut mengenai tes
.
17
objektif, difokuskan pada tes bentuk pilihan ganda. Mengenai tes bentuk pilihan ganda ini, Nitko menjelaskan bahwa butir tes pilihan ganda terdiri dari satu atau lebih kalimat pengantar dan diikuti oleh daftar tentang dua atau lebih jawaban sugestif. Peserta didik diminta untuk memilih jawaban yang benar di antara alternatif jawaban yang didaftar. Kalimat pengantarnya disebut “stem” dan daftar jawaban sugestif disebut “alternative, responses, choices, atau option.” Alternatif jawaban selalu harus diurut secara bermakna, yakni disusun secara logis, numerik, menurut abjad, dan susunan lain (Nitko, 1996: 138-153). Berkaitan dengan tes pilihan ganda ini, Ebel memberikan petunjuk sebagai berikut. (1) Susun tes pilihan ganda berdasarkan ide-ide yang penting dan menunjukkan pernyataan yang bermakna, relevan, dan independen, (2) pilih topik dan ide, kemudian tulis butir soal pilihan ganda yang mampu memaksimalkan daya beda butir-butir tes tersebut, (3) susun draf awal dan adakan revisi, sehingga penggabungan menjadi seperangkat tes akhir menjadi sempurna, (4) awali stem pertanyaan dengan pernyataan yang tidak lengkap dan disertai jawaban yang tepat serta dilengkapi dengan jawaban yang salah, tetapi masuk akal, (5) susun jawaban yang benar sedemikian rupa atau secara acak tanpa menampakkan adanya petunjuk ke arah jawaban benar tersebut, dan (6) pilih susunan pengecoh sedemikian rupa sehingga menjadi salah, tetapi tampak masuk akal, khususnya bagi peserta didik yang bodoh (Ebel, 1972: 191-202). Dalam kaitan ini, Hopkin dan Antes memberikan petunjuk yang lebih rinci dan praktis dalam menyusun tes pilihan ganda, yaitu: (1) definisikan tugas-tugas dalam stem secara jelas, (2) tulis alternatif jawaban pada akhir pertanyaan, (3) tempatkan sebanyak mungkin katakata dalam stem, (4) hindari penggunaan kata-kata negatif, (5) hindari stem yang mengarah pada alternatif jawaban yang salah atau benar, (6) buat alternatif jawaban yang paralel, (7) tulis alternatif jawaban secara vertikal, (8) hindari jawaban “semua di atas”, (9) buat alternatif jawaban sama panjang, (10) hilangkan petunjuk ke arah jawaban benar, (11) buat pengecoh yang masuk akal, (12) usahakan stemnya dalam bentuk pertanyaan, (13) kontrol tingkat kesulitan soal sehingga
persentase
jawaban
benar
kira-kira
separuhnya,
(14)
hindari
kemungkinan menebak, (15) gunakan jawaban “tidak ada jawaban benar” hanya kalau tidak ada jawaban lain, (16) susun alternatif jawaban sesuai dengan abjad
.
18
atau urutan lainnya, (17) letakkan jawaban benar secara acak, dan (18) usahakan memiliki empat sampai lima alternatif jawaban (Hopkin dan Antes, 1990: 185191). Demikianlah beberapa petunjuk penting yang diperlukan dalam menyusun butir soal pilihan ganda yang baik dan bermutu. Dengan memperhatikan petunjuk tersebut, diharapkan pendidik dapat menyusun butir tes pilihan ganda yang baik. Masing-masing bentuk tes memiliki kelebihan dan kekurangan masingmasing. Kelebihan tes objektif, antara lain dapat mengurangi subjektivitas dalam pemberian skor, menuntut kemampuan tertentu untuk membedakan pilihan yang tepat, lebih cepat untuk mengoreksi pekerjaan peserta didik , bisa mencakup materi pelajaran secara komprehensif, dan bisa menguji peserta didik dalam jumlah yang besar sekaligus. Sedangkan kelemahannya, antara lain: sulit untuk menyusun butir soal yang baik, membutuhkan waktu cukup lama untuk menyusunnya, mengandung sifat “coba-coba”(guessing), dan kurang bisa melatih peserta didik untuk memecahkan masalah serta kurang bisa melatih berpikir evaluatif, divergen yang bersifat holistik, lateral, intuitif, imajinatif, dan kreatif. Berkaitan dengan kelebihan dan kekurangan tes objektif, Gronlund dan Linn berpendapat bahwa kelebihan dan kelemahan tes objektif, antara lain adalah sebagai berikut. (1) Kelebihan pada butir soal jawaban singkat adalah sangat mudah menyusunnya, karena secara relatif biasanya mengukur hasil belajar yang sederhana. Kecuali untuk mengukur hasil belajar pemecahan masalah pada matematika dan sain, butir tes jawaban singkat hanya mengukur ingatan (recall) tentang informasi ingatan. Kelebihan lain butir tes jawaban singkat adalah bahwa peserta didik
harus menyisipkan jawaban sehingga mengurangi kemungkinan
bahwa peserta didik
menjawab dengan benar karena tebakan. Sedangkan
kelemahan tes jawaban singkat adalah tidak cocok untuk mengukur hasil belajar yang kompleks dan kesulitan untuk memberi skor.(2) Kelebihan pada butir tes benar-salah adalah bahwa butir tes benar-salah mudah disusun, tetapi untuk menyusun butir tes benar-salah yang tidak ambigius diperlukan keterampilan tertentu. Kelebihan kedua pada butir tes banar-salah adalah bahwa dapat mencakup materi yang luas. Di samping itu, salah satu kekurangan atau kelemahan yang serius pada butir benar-salah adalah bentuk hasil belajar yang
.
19
dapat diukur. Di samping itu bentuk tes benar-salah bisa ditebak, dan peluang benarnya adalah 50%. (3) Kelebihan pada butir tes menjodohkan adalah bentuknya yang kompak dan dapat mengukur sejumlah besar hasil belajar yang berkaitan dengan fakta-fakta, dan mudah menyusunnya. Sedangkan kelemahannya adalah bahwa butir tes menjodohkan terbatas untuk mengukur informasi tentang fakta-fakta pada belajar hafalan, dan kesulitan untuk menemukan materi yang homogen yang signifikan dengan tujuan dan hasil belajar. (4) Kelebihan pada butir tes pilihan ganda adalah efektif untuk mengukur berbagai tipe pengetahuan dan hasil belajar yang kompleks. Di samping itu, butir tes pilihan ganda memiliki tingkat reliabilitas yang lebih tinggi daripada bentuk butir tes benar-salah, karena kesempatan untuk menebak dapat dikurangi. Sedangkan kelemahan butir tes pilihan ganda adalah bahwa sebagai tes tertulis memiliki keterbatasan untuk mengukur hasil belajar yang bersifat verbal, mengukur keterampilan pemecahan masalah, mengukur kecakapan untuk mengorganisasikan dan mengemukakan pendapat. Di samping itu, butir tes pilihan ganda memiliki kesulitan untuk menemukan pengecoh yang tepat (Linn dan Gronlund, 1995: 153-183). Sehubungan dengan adanya kelebihan dan kelemahan butir tes objektif tersebut di atas, Ebel menyarankan bahwa tes objektif hendaknya digunakan dalam kondisi sebagai berikut: (1) kelompok yang diberikan tes jumlahnya besar atau banyak, dan tes akan digunakan kembali, (2) reliabilitas skor tes yang tinggi harus diperoleh seefisien mungkin, (3) kejujuran penilaian, keterbukaan, dan bebas dari “halo effect”, (4) pengajar atau pendidik lebih percaya akan kemampuannya untuk menyusun butir-butir tes objektif secara jelas dibandingkan dengan kemampuannya untuk menilai jawaban tes esai secara jelas, dan (5) lebih menekankan pada kecepatan laporan skor tes daripada kecepatan menyiapkan tes (Ebel, 1972: 144). Berdasarkan uraian dan pendapat-pendapat tersebut di atas dapatlah disimpulkan bahwa tes objektif adalah butir tes yang menuntut jawaban memilih, yang terdiri dari butir tes bentuk jawaban benar-salah, menjodohkan, dan pilihan ganda dalam berbagai variasi; dan butir soal yang menuntut jawaban mengisi, yang terdiri dari butir tes jawaban singkat dan butir tes melengkapi. Dalam penelitian ini hanya digunakan tes objektif dalam bentuk pilihan ganda, karena
.
20
bentuk tes ini yang umum digunakan untuk mengukur hasil belajar peserta didik . Butir tes objektif memiliki beberapa kelebihan dan keterbatasan yang berkaitan dengan cara penyusunan butir tes, tingkat reliabilitas, cakupan materi yang bisa diukur, peluang untuk menebak dan menjawab benar, dan jumlah peserta didik yang bisa diuji atau di tes pada waktu yang bersamaan. Untuk mengatasi kelemahan dari masing-masing bentuk tes objektif tersebut, dianjurkan kepada penulis butir tes objektif untuk mengikuti petunjuk penulisan butir soal obyektif yang baik. b. Tes Esai atau Tes Uraian Tes esai sering disebut tes subjektif, karena proses pemberian skornya dipengaruhi oleh opini atau penilaian dari pendidik atau pemeriksa tes tersebut. Seperti telah dikemukakan di atas bahwa tes esai termasuk ke dalam kelompok tes dengan jawaban tersusun (constructed-response tests). Jenis tes esai menghendaki peserta didik untuk mengorganisasikan, merumuskan, dan mengemukakan sendiri jawabannya. Dengan perkataan lain bahwa peserta didik tidak memilih jawaban, akan tetapi memberikan jawaban dengan kata-katanya sendiri secara bebas. Oleh karena itu, jawaban peserta didik tersebut hanya bisa diperiksa oleh mereka yang menulis butir tes tersebut atau oleh orang yang ahli atau mengetahui dengan jelas mengenai inti pokok persoalan yang ditanyakan dalam butir tes tersebut. Dalam hubungan ini, Hopkins dan Antes menyatakan bahwa tes esai adalah tes untuk mengembangkan jawaban atau respon peserta didik secara penuh. Keakuratan dan kualitas dari jawaban peserta didik
harus dinilai oleh seseorang yang
memiliki pengetahuan dan keahlian tentang materi yang diujikan, dalam hal ini biasanya adalah orang yang membuat butir soal tersebut. Menurut Mehrens dan Lehmann, tes esai dapat digolongkan menjadi dua bentuk, yaitu tes esai jawaban terbuka (extended-response) dan jawaban terbatas (restricted-response), dan hal ini tergantung pada kebebasan peserta didik untuk mengorganisasikan atau menyusun ide-idenya dan menuliskan jawabannya. Pada tes esai bentuk jawaban terbuka atau jawaban luas dari pertanyaan uraian atau esai, mengijinkan peserta didik untuk mendemonstrasikan kecakapannya untuk: (1) menyebutkan atas pengetahuan faktual, (2) menilai pengetahuan faktualnya,
.
21
(3) menyusun ide-idenya, dan (4) mengemukakan idenya secara logis dan koheren. Sedangkan pada tes esai jawaban terbatas atau terstruktur, peserta didik lebih dibatasi pada bentuk dan ruang lingkup jawabannya, karena secara khusus dinyatakan konteks jawaban yang harus diberikan oleh peserta didik (Mehrens dan Lehmann, 1973: 206-207). Seperti halnya pada tes objektif, butir tes esai juga memiliki kelebihan dan kelemahan. Kelebihan atau keunggulan tes esai, yaitu: (1) secara relatif lebih mudah untuk menyiapkan butir soalnya dibandingkan dengan menyusun butir soal pilihan ganda, (2) merupakan alat yang bisa mengukur kecakapan peserta didik untuk menyusun jawaban dan mengemukakannya dalam prosa, (3) dapat membantu pendidik untuk melihat kejujuran peserta didik
dengan memberi
tekanan pada kemampuan peserta didik untuk mengisi jawaban yang benar, dan (4) dapat membantu merangsang hasil yang baik bagi pembelajaran peserta didik . Di samping keunggulannya, tes esai juga memiliki kelemahan, yaitu: (1) terbatas pada cakupan materi yang bisa diukur, khususnya pada bentuk tes esai jawaban terbuka, dan (2) memiliki reliabilitas keterbacaan yang rendah (Mehrens dan Lehmann, 1973: 73-76). Menurut Wiersma dan Jurs, kelebihan tes esai adalah memiliki potensi untuk mengukur hasil belajar pada tingkatan yang lebih tinggi atau kompleks. Pada butir tes esai memberi kesempatan kepada peserta didik untuk menyusun, menganalisis, dan mensintesis ide-ide, dan peserta didik harus mengembangkan sendiri buah pikirannya serta menuliskannya dalam bentuk yang tersusun atau terorganisasi. Hal ini tidak terjadi pada penggunaan tes objektif. Sedangkan kelemahan tes esai adalah berkaitan dengan pensekoran. Ketidak konsistenan pembaca merupakan penyebab kurang objektifnya dalam memberikan sekor dan terbatasnya reliabilitas tes. Pensekoran dapat dipengaruhi oleh baik-buruknya tulisan peserta didik atau kerapian dan keindahan tulisan peserta didik (Wiersma dan Jurs, 1990: 73-76). Dalam hubungan ini, Hopkins dan Stanley mengemukakan bahwa keterbatasan tes esai adalah sebagai berikut. (1) tidak konsistennya pembaca (reader reliability), (2) adanya efek dari kecenderungan menilai yang dipengaruhi oleh keadaan lain (halo effect), (3) akibat yang timbul karena adanya pengaruh pada jawaban butir soal sebelumnya (item-to-item
.
22
carryover effects), (4) akibat yang timbul karena pengaruh hasil tes sebelumnya (test-to-test carryover effects), (5) akibat yang timbul karena urutan penilaian (order effects), dan (6) akibat yang timbul karena bentuk tulisan atau bahasa (language mechanics effects). Sedangkan kelebihan tes esai adalah bahwa dengan tes esai, mampu untuk mengukur tingkat berpikir lebih tinggi dan kompleks, serta bisa mengembangkan sikap untuk memecahkan masalah (Hopkins dan Stanley, 1981: 205-213). Untuk mengatasi kelemahan-kelemahan tes esai, berikut ini akan diuraikan mengenai beberapa petunjuk praktis dalam menyusun butir tes esai. Dalam hubungan ini, Hopkins dan Stanley menganjurkan bahwa untuk menyusun tes esai yang baik perlu memperhatikan langkah-langkah berikut. (1) Siapkan secara pasti perlengkapan yang diperlukan dalam menyiapkan peserta didik untuk mengikuti ujian dengan tes esai. (2) Yakinkan bahwa pertanyaan-pertanyaan telah terfokus dan disiapkan secara hati-hati. (3) Isi dan panjang pertanyaan perlu disusun sedemikian rupa. (4) Gunakan teman-teman sejawat untuk memberi masukan terhadap tes yang disusun. (5) Hindari penggunaan pertanyaan pilihan. (6) Kecuali untuk kemampuan menulis, batasi penggunaan tes esai pada tujuan pembelajaran yang sesuai. (7) Pada umumnya beberapa pertanyaan singkat lebih baik disiapkan untuk mengurangi pertanyaan-pertanyaan yang digunakan untuk mengukur prestasi secara umum (Hopkins dan Stanley, 1981: 216-220). Selanjutnya Linn dan Gronlund menyatakan bahwa untuk menyusun tes esai hendaknya memperhatikan beberapa petunjuk sebagai berikut. (1) Batasi penggunaan tes esai pada hasil belajar yang tidak bisa diukur dengan tes objektif. (2) Susun pertanyaan yang akan mengungkap perilaku yang menentukan hasil belajar. (3) Susun pertanyaan sedemikian rupa sehingga tugas-tugas yang harus dikerjakan oleh peserta didik bisa dipahami secara jelas. (4) Berikan batas waktu untuk setiap pertanyaan. (5) Hindari penggunaan pertanyaan yang bersifat pilihan. Lebih kanjut dijelaskan bahwa dalam pemberian skor hendaknya mengikuti petunjuk-petunjuk berikut ini, yaitu: (1) siapkan garis besar jawaban yang diharapkan dikuasai; (2) gunakan metode pensekoran yang paling tepat, yakni dengan metode analitik atau metode holistik; (3) tentukan bagaimana menangani faktor-faktor yang tidak relevan dengan hasil belajar yang akan diukur; (4)
.
23
berikan penilaian untuk semua jawaban peserta didik pada satu nomor pertanyaan sebelum beralih pada nomor pertanyaan berikutnya; (5) jika memungkinkan, berikan nilai pada jawaban-jawaban peserta didik tanpa memperhatikan identitas atau nama peserta didik ; dan (6) Gunakan dua atau lebih penilai bebas jika keputusan penting akan diambil atau dibuat (Linn dan Gronlund, 1995; 225-234). Mengenai metode pemberian skor pada tes esai, dapat dijelaskan sebagai berikut. Pada metode pemberian skor secara analitik, tiap jawaban dibandingkan dengan jawaban ideal dan nilai diberikan untuk setiap elemen. Penilaian didasarkan pada angka kumulatif secara absolut, misalnya, A = 10 atau lebih, B = 6-9 poin, dan sebagainya, atau secara relatif, A = skor tertinggi 15%, B = skor berikutnya 30%, dan sebagainya. Sedangkan pada metode global, tiap jawaban peserta didik dibaca dan diberikan skor didasarkan pada kualitas total jawaban peserta didik atau pada kualitas total dari jawaban peserta didik jawaban
peserta didik
dibandingkan dengan
yang lain. Di samping pendapat-pendapat tersebut,
Mehrens dan Lehmann juga memberikan beberapa petunjuk tentang penyusunan tes esai yang baik, yaitu: (1) berikan waktu dan pikiran yang cukup untuk menyusun pertanyaan tes esai; (2) pertanyaan hendaknya ditulis sedemikian rupa sehingga memperoleh bentuk perilaku yang akan diukur; (3) pertanyaan esai yang disusun dengan baik akan membuat peserta didik mengerti tentang kerangka jawaban yang harus dikerjakan: (4) tentukan dengan jelas, penguasaan fakta-fakta apa yang akan dipertimbangkan dalam menilai jawaban tes esai; (5) hindari menyediakan pertanyaan pilihan dalam tes esai; (6) gunakan sejumlah besar pertanyaan yang menuntut jawaban singkat (sekitar setengah halaman) daripada hanya menyediakan sedikit pertanyaan yang memerlukan jawaban panjang; (7) jangan memulai pertanyaan esai dengan kata-kata, seperti: daftarlah, siapakah, apakah, tahukah anda; (8) sesuaikan kompleksitas dan panjang jawaban yang diharapkan dengan tingkat kematangan peserta didik ; (9) jika memungkinkan, gunakan pertanyaan bentuk novel; dan (10) siapkan kunci jawaban. Lebih lanjut dijelaskan bahwa dalam memeriksa jawaban tes esai hendaknya diperhatikan petunjuk berikut, yaitu: (1) gunakan metode yang tepat (metode analitik atau metode global) untuk mengurangi bias; (2) berikan perhatian hanya pada aspek jawaban yang signifikan dan relevan; (3) hati-hati, jangan terpengaruh oleh aspek
.
24
pribadi yang dinilai; dan (4) terapkan patokan yang sama untuk semua lembar jawaban peserta didik .Dalam hubungan dengan penyusunan tes esai ini, terdapat sejumlah kata-kata kunci yang perlu diperhatikan, yaitu: (1) analyze atau analisis, (2) coment atau berikan komentar, (3) compare atau bandingkan, (4) contrast atau perbedaan antara dua hal atau lebih, (5) criticize, interpret, review atau berikan kritik, intepretasikan, dan berikan pandangan, (6) define atau definisikan, (7) diagram, illustrate, atau buat diagram dan berikan ilustrasi, (8) discuss atau diskusikan, (9) evaluate atau berikan penilaian, (10) explain, relate, atau jelaskan, hubungkan, (11) justify, prove, atau berikan alasan, buktikan, (12) list, enumerate, atau buat daftar, sebutkan satu-persatu, (13) outline atau buat garis besar, (14) summarize atau buat ringkasan, dan (15) trace atau berikan deskripsi tentang kemajuan secara runtut. Berkenaan dengan pemerikasaan dan pemberian skor pada butir tes esai ini, Wiersma dan Jurs menyatakan bahwa prosedur pemberian skor butir tes esai hendaknya mengikuti langkah-langkah berikut ini, yaitu: (1) siapkan daftar yang jelas tentang konsep-konsep, fakta-fakta, dan lain-lain yang dianggap penting yang termasuk dalam jawaban soal, serta bekerjalah berdasarkan garis besar model jawaban yang diinginkan; (2) bacalah sejumlah sampel (sekitar lima atau enam orang) dari jawaban-jawaban tersebut tanpa memberikan skor dengan maksud untuk memperoleh gambaran tentang kualitas jawaban yang bisa diharapkan; (3) jika memungkinkan, bacalah lembaran kerja peserta didik tanpa memperhatikan identitas peserta didik effect”, seperti memberi skor
untuk menghindari terjadinya “halo
yang tinggi kepada peserta didik
yang telah
diketahui sebagai peserta didik yang baik; (4) beri skor untuk semua jawaban peserta didik
pada satu nomor soal sebelum memberi skor pada butir soal
berikutnya, sehingga dapat menjaga konsistensi pemberian skor; (5) atur kembali lembaran kerja peserta didik secara random setelah pemberian skor untuk tiap butir soal, sehingga posisinya tidak sama; (6) Jika jumlah soal yang akan diberi skor cukup banyak, aturlah waktu pemeriksaan tersebut sedemikian rupa dengan maksud untuk mengurangi kelelahan dan kebosanan (Wiersma dan Jurs, 1990: 8485).
.
25
Dari uraian dan pendapat-pendapat tersebut di atas dapatlah disimpulkan bahwa tes esai adalah butir tes yang menuntut peserta didik untuk menyusun, merumuskan, dan mengemukakan sendiri jawabannya menurut kata-katanya sendiri secara bebas. Tes esai dapat dibedakan menjadi dua golongan besar, yaitu tes esai yang menginginkan jawaban luas atau terbuka dan tes esai yang menginginkan jawaban terbatas atau terstruktur. Pada bentuk tes esai yang menginginkan jawaban terbuka, peserta didik
boleh mendemonstrasikan
kecakapannya untuk menyebutkan pengetahuan faktual, menilai pengetahuan faktualnya, menyusun ide-idenya, dan mengemukakan ide-idenya secara logis dan koheren. Sedangkan pada tes
esai dengan jawaban terbatas atau terstruktur,
peserta didik lebih dibatasi pada bentuk dan lingkup jawabannya yang harus diberikan oleh peserta didik . Di samping memiliki beberapa keunggulan, seperti dapat mengukur aspek kemampuan yang tinggi dan kompleks, tetapi tes esai juga memiliki beberapa kelemahan, misalnya, sulit memberikan skor secara objektif, sehingga tingkat reliabilitasnya lebih rendah dari tes objektif. Namun demikian, tes esai secara keseluruhan lebih unggul jika dibandingkan dengan tes objektif, karena tes esai bisa mengukur tingkat kemampuan yang paling rendah sampai dengan tingkat kemampuan paling tinggi. Untuk mengatasi kelemahan pada tes esai, dapat dilakukan dengan cara mengikuti secara cermat petunjuk-petunjuk penulisan tes esai yang dikemukakan oleh para ahli pada bidang pengukuran dan evaluasi. Di samping itu, pemeriksaan dan pemberian skor pada tes esai harus dilakukan oleh orang yang membuat soal tersebut atau oleh orang yang ahli dan menguasai materi yang ditanyakan dalam butir tes esai, serta harus mengikuti prosedur pemberian skor secara ketat, antara lain dengan cara memberi skor tanpa memperhatikan identitas peserta didik , memberi skor untuk satu nomor butir soal bagi semua peserta didik sebelum melangkah kepada butir soal berikutnya, dan memeriksa butir soal secara periodik untuk mengurangi kelelahan dan kebosanan. c. Perbandingan antara Tes Esai dan Tes Objektif Antara kedua bentuk tes, yaitu esai dan tes objektif, terdapat perbedaan dan persamaannya. Perbedaan tersebut tampak pada berbagai aspek, misalnya
.
26
dilihat dari tujuan pengukuran, ranah atau jenis kemampuan yang diukur, cara penulisan butir soal, dan cara pemberian skor untuk setiap butir soal. Sedangkan persamaannya, antara lain adalah sama-sama berupa alat untuk mengukur sebagian besar hasil pendidikan yang dapat diukur dengan tes tertulis. Di samping itu, baik tes objektif maupun tes esai dapat digunakan untuk mendorong peserta didik supaya belajar memahami prinsip-prinsip, menyusun dan memadukan ideide, dan penerapan pengetahuan pada proses pemecahan masalah. Mengenai perbedaan antara tes esai dan tes objektif, Ebel menyatakan sebagai berikut. (1) Pada tes esai, meminta peserta didik untuk merencanakan, menyusun, dan mengemukakan jawabannya dengan menggunakan kata-katanya sendiri; sedangkan pada tes objektif, peserta didik diminta untuk memilih di antara beberapa alternatif jawaban yang telah disediakan. (2) Pada tes esai, secara relatif terdiri dari sedikit pertanyaan yang bersifat umum, dan memerlukan jawaban yang luas; sedangkan pada tes objektif terdiri dari banyak pertanyaan, dan menuntut jawaban secara singkat atau hanya memilih jawaban. (3) Pada tes esai, peserta didik menghabiskan waktu untuk berpikir dan menulis jawban pada saat mengerjakan soal; sedangkan pada tes objektif, waktu lebih banyak digunakan untuk membaca dan berpikir ketika mengerjakan soal objektif. (4) Pada tes esai, kualitas tes sebagian besar ditentukan oleh keterampilan membaca jawaban peserta didik ; sedangkan pada tes objektif, kualitas tes ditentukan oleh pembuat soal. (5) Secara relatif, ujian tes esai lebih mudah disiapkan, tetapi relatif membosankan serta sulit untuk memberi skor secara akurat; sedangkan ujian pada tes objektif secara relatif membosankan dan sulit untuk menyiapkan, tetapi relatif mudah untuk memberi skor secara akurat. (6) Pada ujian tes esai, memberi kebebasan kepada peserta didik
untuk mengemukakan jawabannya secara
individual, dan bebas bagi pemeriksa untuk memberikan skor sesuai dengan pandangan pribadi pemeriksa; sedangkan pada ujian tes objektif, memberi banyak kebebasan bagi penyusun soal untuk mengemukakan pengetahuan dan nilainya, tetapi kepada peserta didik diberikan kebebasan untuk memilih dan menunjukkan proporsi jawaban benar yang ia berikan, dan berapa banyak yang ia ketahui dan kerjakan. (7) Tuntutan pada tes esai yang digunakan sebagai dasar penentuan derajat penguasaan peserta didik , kurang jelas; sedangkan pada tes objektif,
.
27
tugas-tugas peserta didik yang digunakan sebagai dasar untuk menentukan derajat penguasaan, lebih jelas daripada tes esai. (8) Pada tes esai, memberi kesempatan kepada peserta didik untuk berpura-pura bisa mengerjakan soal, sedangkan pada tes objektif memberi kesempatan kepada peserta didik
untuk menebak. (9)
Distribusi skor hasil tes esai dapat dikontrol oleh kesungguhan penilai; sedangkan pada tes objektif, distribusi skor ditentukan oleh banyaknya butir tes (Ebel, 1972: 123-138). Dari pendapat Ebel tersebut dapat diketahui bahwa perbedaan antara tes esai dan tes objektif tampak pada cara peserta didik menjawab soal, jumlah butir soal, waktu yang digunakan untuk mengerjakan soal, kualitas dan reliabilitas tes, penyelenggaraan ujian, pemberian skor, kebebasan mengemukakan pendapat peserta ujian, kriteria untuk menentukan derajat penguasaan peserta didik , kesempatan untuk menebak jawaban, dan distribusi skor hasil penilaian. Dalam hubungan ini, Hoffman, yang dilaporkan oleh Hopkins dan Stanley menyatakan bahwa tes objektif dapat mengukur pengetahuan tentang fakta-fakta, tetapi tes esai dapat mengukur kemampuan berpikir yang lebih kompleks, dan berpikir pada tingkat tinggi. Di samping itu tes objektif tidak dapat mengembangkan kualitas penalaran, kemampuan menyusun ide-ide, merancang, dan pemahaman yang kompleks pada peserta didik (Hopkins dan Stanley, 1981: 205). Berdasarkan pendapat tersebut dapat diketahui bahwa secara keseluruhan tes esai lebih unggul jika dibandingkan dengan tes objektif, karena dengan tes esai dapat mengukur kemampuan pada tingkat tinggi dan kompleks, serta dapat mengembangkan kualitas penalaran, kemampuan menyusun ide-ide, merancang, dan mengembangkan pemahaman yang kompleks pada peserta didik . Kemampuan-kemampuan tersebut sangat bermanfaat bagi peserta didik untuk memecahkan masalah yang dihadapi dalam kehidupan sehari-hari. Selanjutnya, Gronlund dan Linn (1990:
124) mengemukakan bahwa
terdapat tujuh aspek yang dapat dibandingkan antara tes esai dan tes objektif, seperti tercantum dalam tabel pada halaman berikut .
.
28
Tabel 01. Perbandingan antara Tes Esai dan Tes Objektif Tes Objektif 1.Hasil belajar yang diukur
2.Penyiapan butir soal
Tes Esai
Baik untuk mengukur hasil belajar pada tingkat pengetahuan tentang fakta, pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks. Tetapi tidak mampu untuk mengukur kemampuan untuk memilah dan menyusun ide-ide, kecakapan menulis, dan beberapa bentuk keterampilan untuk memecahkan masalah
Tidak efisien untuk mengukur pengetahuan tentang fakta. Dapat mengukur pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya (khususnya sangat berguna jika jawaban orisinil yang diinginkan). Cocok untuk memilih dan menyusun ide-ide, keterampilan menulis, dan keterampilan untuk memecahkan masalah yang menuntut pemikiran yang orisinil Banyak memerlukan waktu untuk Hanya sedikit pertanyaan yang menyusun butir soal. Sukar diperlukan untuk seperangkat tes. mempersiapkan butir soal yang baik Menyiapkan butir soal relatif dan memerlukan waktu lama mudah, tetapi lebih sulit daripada anggapan orang.
3.Mengambil sampel materi pelajaran
Dapat mewakili semua materi pelajaran dan dapat memuat butir soal yang banyak dalam seperangkat tes.
4.Kontrol terhadap jawaban peserta didik 5.Pemberian skor 6.Pengaruh pada proses pembelajaran
Tinggal memilih jawaban yang telah tersedia. Menghindari gertak sambal dan pengaruh keterampilan menulis, bisa menebak jawaban Pensekoran secara objektif dan cepat, mudah, dan konsisten Biasanya mendorong peserta didik untuk mengembangkan pengetahuan tentang fakta-fakta khusus dan kemampuan untuk pembedaan di antara fakta tersebut. Dapat mendorong pengembangan pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya
7.Reliabilitas
Reliabilitas yang tinggi mungkin dicapai, khususnya jika tes disusun secara baik
Tidak dapat mewakili seluruh materi pelajaran, karena hanya sedikit pertanyaan yang bisa dimasukkan dalam seperangkat tes. Bebas menjawab atas dasar katakatanya sendiri, dan keterampilan menulis mempengaruhi sekor, berpikir menebak bisa dikurangi Pensekoran subjektif dan lambat, sulit, dan tidak konsisten Mendorong peserta didik untuk memusatkan pikiran pada sejumlah besar materi pelajaran, dengan penekanan khusus pada kemampuan untuk menyusun, mengintegrasikan, dan mengemukakan ide-ide secara efektif. Dapat mendorong kebiasaan menulis buruk jika waktunya mendesak. Reliabilitasnya lebih rendah, terutama karena pensekoran yang tidak konsisten.
Dari pendapat-pendapat tersebut di atas dapat dicermati bahwa jika dilihat dari tujuan pengukuran, tes objektif lebih cocok untuk mengukur hasil belajar pada tingkat pengetahuan tentang fakta-fakta, pemahaman, aplikasi, dan analisis.
.
29
Sedangkan tes esai lebih efisien untuk mengukur hasil belajar pada tingkat pengetahuan, pemahaman, dan aplikasi, serta sangat baik untuk mengukur hasil belajar pada tingkat tinggi dan kompleks, seperti analisis, sintesis, dan evaluasi. Dengan perkataan lain bahwa tes esai sangat baik untuk mengukur kemampuan berpikir kritis, divergen, holistik, imajinatif, dan berpikir kreatif. Dengan demikian berarti bahwa jika dilihat dari tujuan pengukuran, tes esai lebih luas penggunaannya, yaitu pada semua tingkat berpikir pada ranah kognitif. Sedangkan penggunaan tes objektif paling tinggi dapat mengukur hasil belajar sampai pada tingkat sintesis. Jika diamati dari segi cakupan materi yang bisa dijangkau oleh tes, bentuk tes objektif dapat menjangkau seluruh materi pelajaran, karena tes objektif dapat memuat butir-butir soal yang banyak dalam waktu ujian yang sama yang telah ditentukan. Sedangkan tes esai, kurang representatif luas materi yang bisa dicakup dalam seperangkat tes, karena butir-butir tes yang dimuat dalam seperangkat tes hanya sedikit atau terbatas jumlahnya untuk waktu ujian yang ditentukan. Selanjutnya, dalam hal penulisan butir-butir tes, pada tes objektif lebih sukar dan membutuhkan keakhlian tinggi dan waktu yang lebih lama, karena jumlah butir soal yang ditulis cukup banyak, di samping kesulitan dalam memilih pengecoh atau distraktor yang baik atau efektif. Jika dilihat dari cara pemberian skor, memeriksa tes objektif lebih mudah, konsisten, dan objektif, sehingga memiliki derajat reliabilitas yang lebih tinggi jika dibandingkan dengan tes esai. Di samping hal-hal yang telah disebutkan di atas, pada tes objektif ada peluang untuk menebak jawaban, sehingga mempengaruhi skor yang diperoleh oleh peserta didik , dan biasanya menjadi lebih meningkat, karena nilai sesungguhnya (skor murni) ditambah dengan nilai tebakan. Pada tes esai juga terjadi peningkatan perolehan nilai karena pengaruh faktor tulisan, yaitu tulisan peserta didik yang rapi, bagus, indah, dan mudah dibaca oleh pemeriksa, cenderung pemeriksa memberikan skor lebih tinggi. Sebaliknya, jika tulisan peserta didik
tidak baik, kotor, banyak
coretan, dan sulit dibaca oleh pemeriksa, cenderung menurunkan skor yang diberikan oleh pemeriksa ujian. Apabila dicermati pengaruhnya terhadap proses pembelajaran, maka penggunaan tes objektif dapat mendorong peserta didik untuk mengingat fakta-fakta, kemampuan membedakan, menginterpretasi, dan
.
30
menganalisis ide-ide orang lain, dan bukan kemampuan atau keterampilan untuk menyusun dan mengungkapkan ide-idenya sendiri yang berkaitan dengan materi yang dikaji dalam pelajaran. Sedangkan dengan penggunaan tes esai yang baik, dapat mendorong dan mengembangkan keterampilan peserta didik
untuk
menyusun dan mengorganisasikan ide-idenya serta mengemukakannya secara bebas dan orisinil. Dari uraian tersebut di atas dapatlah disimpulkan bahwa penggunaan tes esai dapat mengukur hasil belajar dari kemampuan berpikir tingkat rendah (pengetahuan, pemahaman, dan aplikasi) sampai dengan kemampuan berpikir tingkat tinggi (analisis, sintesis, dan evaluasi). Sedangkan penggunaan tes objektif hanya mampu untuk mengukur hasil belajar pada tingkat rendah dan sebagian hasil belajar tingkat tinggi. Dengan demikian dapat dikatakan bahwa dalam rangka mengembangkan daya nalar peserta didik , kapasitas peserta didik untuk berpikir kritis, divergen, holistik, dan kreatif, maka penggunaan tes esai akan lebih efektif. Berdasarkan analisis terhadap konsep tes formatif menurut bentuknya, yaitu tes esai dan tes objektif bentuk pilihan ganda, dapat dikemukakan kesimpulan sebagai berikut. Tes formatif adalah instrumen atau alat ukur yang digunakan untuk mengukur hasil belajar dan memantau kemajuan belajar peserta didik
selama proses pembelajaran berlangsung dalam satu program tertentu,
misalnya dalam satu sub pokok bahasan dalam proses pembelajaran, yang bermanfaat untuk memberikan umpan balik kepada peserta didik
dan guru,
dengan maksud untuk memperbaiki kelemahan-kelemahan yang terjadi dalam proses pembelajaran, baik pada peserta didik maupun guru. Melalui umpan balik itu diharapkan peserta didik dapat menguasai materi pelajaran secara penuh, dan pendidik dapat memperbaiki program pembelajaran, metode pembelajaran, media, dan sistem evaluasi yang digunakan dalam proses pembelajaran. Tes objektif adalah seperangkat tes atau alat ukur yang setiap butirnya menuntut jawaban memilih, yang terdiri dari butir tes bentuk jawaban singkat, benar-salah, menjodohkan, dan pilihan ganda dalam berbagai variasi. Dalam penelitian ini bentuk tes objektif yang digunakan adalah bentuk pilihan ganda. Tes pilihan ganda adalah seperangkat tes yang setiap butirnya menyediakan pilihan
.
31
jawaban dan salah satu opsinya merupakan jawaban yang benar, sedangkan opsi lainnya berfungsi sebagai distraktor atau pengecoh. Butir tes pilihan ganda memiliki beberapa kelemahan dan kelebihan yang berkaitan dengan penyusunan butir tes, tingkat reliabilitas, cakupan materi yang bisa diukur, peluang untuk menebak dan menjawab benar, dan jumlah peserta didik yang bisa diuji dalam waktu bersamaan. Untuk mengatasi kelemahan tersebut, penyusun butir tes diharapkan mengikuti beberapa petunjuk untuk penulisan butir tes yang baik. Pemeriksaan dan cara pemberian skor pada tes objektif pilihan ganda dapat dilakukan oleh pendidik dan siapa saja, asalkan diberikan kunci jawaban yang benar oleh pembuat tes yang profesional. Selanjutnya, tes esai adalah butir tes yang menuntut peserta didik untuk menyusun, merumuskan, dan mengemukakan sendiri jawabannya menurut katakatanya sendiri secara bebas. Tes esai dapat dibedakan menjadi tes esai yang menuntut jawaban terbuka dan tes esai yang menginginkan jawaban terbatas. Di samping memiliki keunggulan, seperti: dapat mengukur hasil belajar pada kemampuan berpikir tingkat rendah sampai dengan kemampuan berpikir tinggi tinggi yang kompleks, tetapi tes esai juga memiliki kelemahan-kelemahan, seperti: kesulitan dalam pemberian skor secara objektif, sehingga tingkat reliabilitasnya rendah. Untuk mengatasi kelemahan tersebut, dapat dilakukan dengan cara mengikuti beberapa petunjuk penulisan butir soal yang baik, serta dalam penskorannya harus dilakukan oleh pembuat soal atau oleh ahli lainnya, serta mengikuti petunjuk pemberian skor secara ketat. Berdasarkan pendapat-pendapat tersebut di atas, dapat dicermati bahwa jika dilihat dari tujuan pengukuran, tes objektif lebih cocok untuk mengukur hasil belajar pada tingkat pengetahuan tentang fakta-fakta, pemahaman, aplikasi, dan analisis. Sedangkan tes esai lebih efisien untuk mengukur hasil belajar pada tingkat pengetahuan, pemahaman, dan aplikasi, serta sangat baik untuk mengukur hasil belajar pada tingkat tinggi dan kompleks, seperti analisis, sintesis, dan evaluasi. Dengan perkataan lain bahwa tes esai sangat baik untuk mengukur kemampuan berpikir kritis, divergen, holistik, imajinatif, dan berpikir kreatif. Dengan demikian, berarti bahwa jika dilihat dari tujuan pengukuran, tes esai lebih luas penggunaannya, yaitu pada semua tingkat berpikir pada ranah kognitif.
.
32
Sedangkan penggunaan tes objektif paling tinggi dapat mengukur hasil belajar sampai pada tingkat sintesis. Jika diamati dari segi cakupan materi yang bisa dijangkau oleh tes, bentuk tes objektif dapat menjangkau seluruh materi pelajaran karena tes objektif dapat memuat butir-butir soal yang banyak dalam waktu ujian yang sama yang telah ditentukan. Sedangkan tes esai kurang representatif terhadap luas materi yang bisa dicakup dalam seperangkat tes karena butir-butir tes yang dimuat dalam seperangkat tes hanya sedikit atau terbatas jumlahnya untuk waktu ujian yang ditentukan. Selanjutnya, dalam hal penulisan butir-butir tes objektif lebih sukar dan membutuhkan keakhlian tinggi dan waktu yang lebih lama karena jumlah butir soal yang ditulis cukup banyak, di samping kesulitan dalam memilih pengecoh atau distraktor yang baik atau efektif. Jika dilihat dari cara pemberian skor, memeriksa tes objektif lebih mudah, konsisten, dan objektif sehingga memiliki derajat reliabilitas yang lebih tinggi jika dibandingkan dengan tes esai. Di samping hal-hal yang telah disebutkan di atas, pada tes objektif ada peluang untuk menebak jawaban sehingga mempengaruhi skor yang diperoleh oleh peserta didik , dan biasanya menjadi lebih meningkat, karena nilai sesungguhnya (skor murni) ditambah dengan nilai tebakan. Pada tes esai juga terjadi peningkatan perolehan nilai karena pengaruh faktor tulisan, yaitu untuk tulisan peserta didik yang rapi, bagus, indah, dan mudah dibaca oleh pemeriksa, cenderung pemeriksa memberikan skor lebih tinggi. Sebaliknya, jika tulisan peserta didik tidak baik, kotor, banyak coretan, dan sulit dibaca oleh pemeriksa, cenderung menurunkan skor yang diberikan oleh pemeriksa ujian. Apabila dicermati pengaruhnya terhadap proses pembelajaran, maka penggunaan tes objektif dapat mendorong peserta didik
untuk mengingat fakta-fakta, kemampuan membedakan,
menginterpretasi, dan menganalisis ide-ide orang lain, dan bukan kemampuan atau keterampilan untuk menyusun dan mengungkapkan ide-idenya sendiri yang berkaitan dengan materi yang dikaji dalam pelajaran. Sedangkan penggunaan tes esai yang baik dapat mendorong dan mengembangkan keterampilan peserta didik untuk menyusun dan mengorganisasikan ide-idenya serta mengemukakannya secara bebas dan orisinil.
.
33
Dari uraian tersebut di atas, dapatlah disimpulkan bahwa penggunaan tes esai dapat mengukur hasil belajar dari kemampuan berpikir tingkat rendah (pengetahuan, pemahaman, dan aplikasi) sampai dengan kemampuan berpikir tingkat tinggi (analisis, sintesis, dan evaluasi). Sedangkan penggunaan tes objektif hanya mampu untuk mengukur hasil belajar pada tingkat rendah dan sebagian hasil belajar tingkat tinggi. Dengan demikian, dapat dikatakan bahwa dalam rangka mengembangkan daya nalar peserta didik , kapasitas peserta didik untuk berpikir kritis, divergen, holistik, dan kreatif, maka penggunaan tes esai akan lebih efektif. B. Alat Ukur Non Tes (Typical Performance Test) Beberapa jenis alat ukur non test (typical performance test), antara lain: (1) skala (alat ukur kiraan atau rating), (2) observasi, (3) wawancara, (4) kuesioner, (5) studi kasus, (6) daftar cocok (check-list), (7) riwayat hidup, dan (8) sosiometri. 1. Skala atau Alat Ukur Kiraan (Rating) Skala adalah seperangkat lambang atau angka yang dibuat sehingga melalui aturan, lambang atau angka itu dapat ditempatkan pada individu yang menjadi sasaran penggunaan skala itu. Urutan level skala dari tinggi ke rendah adalah: level rasio, level interval, level ordinal, dan level nominal. Pada alat ukur kiraan (rating), memberi kesempatan kepada responden untuk: (1) memilih satu letak pada suatu bentang jawaban, (b) memilih butir yang cocok dengan kiraan responden, (c) memberi peringkat kepada beberapa hal sesuai dengan kiraan responden. Banyak alat ukur kuesioner dan wawancara berbentuk alat ukur kiraan. Tipe skala ada beberapa macam, antara lain: (1) skala kategoris, yakni skala yang hanya menunjukkan kategori objek ukur; misalnya: orang desa = 1; orang kota = 2. (2) skala kualitatif berperingkat, yaitu skala yang menunjukkan peringkat pada objek ukur; misalnya: tingkat status social ekonomi: tinggi = 1, sedang = 2, rendah = 3; ragam tutur bahasa: halus = 1, menengah = 2, kasar = 3; frekuensi: tidak pernah = 1, kadang-kadang = 2, agak sering = 3, sering = 4, selalu = 5. (3) skala kiraan (rating) model Likert dan sejenisnya.
.
34
a. Alat Ukur Kiraan Skala Likert Skala Likert: Setiap butir terdiri atas suatu pernyataan; dan untuk pernyataan
itu, responden dapat memilih satu di antara lima tawaran: SS S R TS STS
= sangat setuju = setuju = ragu = tidak setuju = sangat tidak setuju
Jika pilihan SS dianggap baik, maka butir itu adalah butir yang positif. Sebaliknya, jika pilihan STS dianggap baik, maka butir itu adalah butir negatif. Cara pemberian skor adalah sebagai berikut. Pilihan jawaban
Pertanyaan/ Pernyataan Positif
Negatif
Sangat setuju
5
1
Setuju
4
2
Ragu
3
3
Tidak setuju
2
4
Sangat tidak setuju
1
5
b. Alat Ukur dengan Skala Frekuensi Verbal Skala untuk dipilih:
1
= selalu
2
= sering
3
= ada kalanya
4
= jarang
5
= tidak pernah
c. Alat Ukur dengan Skala Ordinal Biasanya, kapan anda atau keluarga anda di rumah pertama kali menghidupkan pesawat TV (pilih satu saja). --- Hal pertama di pagi hari --- Sejenak setelah bangun --- Tengah pagi --- Sesaat sebelum makan siang
.
35
--- Segera setelah makan siang --- Tengah petang --- Segera setelah makan malam
d. Alat Ukur dengan Skala Komparatif Bandingkan pelayanan Toko di bawah ini dengan Toko “X” (Pilih satu saja) Toko
Sangat Rendah
Kira-kira Sama
Sangat Tinggi
A
1
2
3
4
5
B
1
2
3
4
5
C
1
2
3
4
5
e. Alat Ukur dengan Skala Numerik Pilih satu angka pada skala di bawah ini sebagai tempat untuk membeli alat olah raga Sangat tidak
Skala 2
Sangat
penting
1
3
4
5
Kualitas barang
---------------------------------------
Pemilihan merek
---------------------------------------
Garansi dari toko
---------------------------------------
Ukuran toko
---------------------------------------
penting
Ketersediaan kredit --------------------------------------f. Alat Ukur dengan Pilihan Kata Sifat Beri tanda di depan kata yang cocok dengan keadaan pekerjaan anda -- Mudah
--- Aman
-- Teknis
--- Melelahkan
-- Membosankan
--- Susah
-- Menarik
--- Memberi hasil
-- Gaji kecil
--- Terjamin
-- Ketat
--- Lambat
.
36
g. Alat Ukur dengan Skala Stapel Pilihlah
angka
skala
dan
letakkan
pada
setiap
kata
sehingga
menggambarkan pekerjaan anda Sama Sekali Tidak
Skala 1
2
3
Sempurna 4
5
6
7
-- Mudah
--- Aman
-- Teknis
--- Melelahkan
-- Membosankan
--- Susah
-- Menarik
---Memberi
-- Gaji kecil
--- Terjamin
-- Ketat
--- Lambat
h Alat Ukur dengan Skala Peringkat Berilah peringkat 1,
2,
3,
4, pada daftar di bawah ini menurut urutan
preperensi (1 tertinggi dan 4 terendah) --------- Mangga Harumanis --------- Mangga Kuini --------- Mangga Manalagi --------- Mangga Lalujiwa i. Alat Ukur dengan Skala Diferential Semantik dari OSGOOD Tandakan opini anda tentang pelayanan PIZZA Panas
1
2
3
4
5
6
7
Dingin
Tawar
1
2
3
4
5
6
7
Gurih
Mahal
1
2
3
4
5
6
7
Murah
j. Alat Ukur Kiraan Skala Thurstone Skala ini dibuat oleh L.L. Thurstone untuk mengukur sikap dengan skala interval. Alat ukur Skala Thurstone terdiri atas sejumlah butir. Setiap butir mempunyai nilai yang terletak di antara 1 sampai 11. Jarak nilai di antara butir
.
37
adalah sama atau kira-kira sama. Nilai butir tidak diketahui oleh responden. Responden menconteng V butir yang disetujuinya (dan membiarkan butir yang tidak disetujuinya). Penentuan nilai butir, diserahkan kepada sejumlah pakar untuk ditanggapi. Rentangan nilai untuk tanggapan para pakar adalah dari A sampai K (11 kategori) sebagai berikut. A 1
B 2
C 3
D 4
E
F
5
G
6
H
7
8
I 9
J
K
10
11
Sangat
Sangat
Tidak dikehendaki
dikehendaki
Para pakar diminta untuk memilih salah satu di antara A sampai K, pada A sampai K diberi nilai 1 sampai 11, dengan interval = 1. Nilai butir dihitung Mediannya (M), sedangkan kualitas butir adalah jarak interkuartil (Q75 – Q25 atau K3 – K1). Makin kecil jarak interkuartil, makin besar kecocokan di antara para pakar, dan ini berarti makin tinggi kualitas butir. Contoh: Butir 1 ditanggapi oleh 200 pakar dengan hasil sebagai berikut. A
B
C
D
E
F
G
H
I
J
K
1
2
3
4
5
6
7
8
9
10
11
f. 2
2
6
2
6
62
64
26
18
8
4
Setelah dihitung Mediannya, ternyata diperoleh: 6,8; K1 = 6,0 dan K3 = 7,7. Dengan demikian, nilai butir 1= 6,8; jarak interkuartil = 7,7 – 6,0 = 1,7. 2. Alat Ukur Observasi Observasi atau pengamatan digunakan untuk mengukur perilaku peserta didik atau kegiatan proses pembelajaran. Observasi harus dilakukan pada saat proses kegiatan berlangsung. Pengamat terlebih dahulu harus menetapkan apek-aspek tingkah laku yang hendak diamati/diobservasi. Paling sedikit ada tiga jenis observasi, yaitu: (1) observasi langsung, yakni pengamatan yang dilakukan terhadap proses yang terjadi dalam siatuasi yang sebenarnya dan langsung diobservasi oleh pengamat; (2) observasi tidak langsung, yakni pengamatan yang dilakukan dengan menggunakan alat bantu (misalnya, dengan mikroskop untuk pengamatan bakteri); dan (3) observasi partisipasi, yakni observasi yang
.
38
dilakukan dengan melibatkan diri pengamat pada kegiatan yang diamati, sehingga pengamat dapat lebih menghayati, merasakan dan mengalami sendiri. Model alat ukurnya: (1) pengamat lebih dari seorang melakukan pengamatan, (2) pengamat membawa lembar evaluasi yang terdiri atas banyak hal yang harus diisi atau diconteng, (3) pengamatan dilakukan pada suatu jangka waktu tertentu berkenaan dengan hal yang sudah ditentukan terlebih dahulu. Contoh 1: Pedoman Observasi Kelas Hasil Pengamatan Tinggi Sedang Rendah
Aspek yang diamati 1. Memberikan pendapat 2. Memberikan tanggapan 3. Mengerjakan tugas Contoh 2:
Keterangan
Isian Pengamat tentang kegiatan kelas. Beri tanda V pada pilihan yang sesuai! 1. Keheningan 2. Pendidik berceramah 3. Pendidik bertanya 4. Peserta didik bertanya 5. Pendidik menjawab 6. Peserta didik menjawab 7. Kegaduhan Pedoman Observasi Kelas Waktu (menit)
KEGIATAN 1
2
3
5 10 15 20 25 30
.
39
4
5
6
7
Angelo dan Patricia Cross (1993), mengajukan suatu teknik untuk mengamati proses pembelajaran di kelas (Classroom Assessment Techniques = CAT). CAT adalah suatu pendekatan yang dirancang untuk membantu pendidik menemukan bagaimana peserta didik belajar di kelas dan seberapa baik mereka mempelajari materi pelajaran tertentu. Tujuan CAT adalah untuk memberdayakan pendidik dan peserta didik untuk mengembangkan kualitas pembelajaran di kelas. Asumsi yang mendasari pendekatan ini adalah bahwa kualitas belajar peserta didik di kelas secara langsung berkaitan dengan kualitas proses pembelajaran. 3. Wawancara Wawancara atau interviu dapat digunakan untuk menilai hasil dan proses belajar. Wawancara bisa direkam sehingga jawaban responden bisa dicatat secara lengkap. Ada dua jenis wawancara, yaitu: (1) wawancara berstruktur, yakni wawancara yang jawabannya telah disiapkan sehingga pewawancara tinggal mengkategorikannya pada alternatif jawaban yang telah dibuat; dan (2) wawancara bebas, yakni wawancara yang tidak menyiapkan alternative jawaban, tetapi responden bisa secara bebas mengemukakan pendapatnya. Ada tiga aspek yang perlu diperhatikan dalam melaksanakan wawancara, yakni: (1) tahap awal pelaksanaan wawancara, yakni untuk membuat suasana yang baik, (2) penggunaan pertanyaan, yakni pertanyaan supaya diajukan secara bertahap dan sistematis, dan (3) pencatatan hasil wawancara, sebaiknya dilakukan pada saat wawancara berlangsung, supaya tidak lupa. Contoh wawancara bebas Tujuan: memperoleh informasi mengenai cara belajar peserta didik Bentuk: wawancara bebas Responden: peserta didik yang nilainya tinggi Nama peserta didik : Budiman Pertanyaan
Jawaban responden
1. Berapa lama anda belajar di rumah setiap hari 2. Bagaimana cara anda mempersiapkan diri untuk belajar 3. Kegiatan apa yang anda lakukan pada saat belajar, dan seterusnya
.
40
Hasil wawancara
4. Kuesioner Kuesioner (questionnaire) juga sering dikenal sebagai angket (daftar pertanyaan). Pada dasarnya, kuesioner adalah sebuah daftar pertanyaan yang harus diisi oleh responden (objek ukur). Ditinjau dari siapa yang menjawab, ada kuesioner langsung dan tidak langsung. Ditinjau dari segi cara menjawab, ada kuesioner tertutup (jawaban telah disediakan, tinggal memilih) dan terbuka (responden bebas mengemukakan pendapatnya). Contoh kuesioner tertutup: Tingkat pendidikan anda sekarang ? (1) SD; (2) SLTP; (3) SLTA; (4) S1, (5) S2; (6) S3. Contoh kuesioner terbuka: Bagaimana pendapat anda tentang keharusan mahapeserta
didik
untuk
membaca
literatur
ber
Bahasa
Inggris
?
Jawab:………………………………… Petunjuk teknis membuat kuesioner. (1) Mulai dengan kata pengantar untuk mohon kesediaan responden untuk menjawab kuesioner (2) Jelaskan petunjuk atau cara pengisiannya dengan memberikan contoh (3) Mulai pertanyaan untuk mengungkapkan identitas responden (4) Pertanyaan hendaknya disusun dalam beberapa kategori/ variable (5) Rumusan pertanyaan dibuat secara singkat, tidak ambigius (6) Jawaban dibuat lebih singkat dari pertanyaan (7) Hindari membuat pertanyaan terlalu banyak. 5. Studi Kasus Studi kasus pada dasarnya bertujuan untuk mempelajari secara mendalam seorang individu yang dipandang mengalami suatu kasus tertentu. Misalnya, mempelajari anak nakal, malas belajar, dan sejenisnya. Tekanan utama dalam studi kasus adalah mengapa individu melakukan apa yang dilakukannya dan bagaimana perilakukanya dalam kondisi dan pengaruhnya terhadap lingkungan. Untuk mengungkap hal tersebut, perlu dicari data yang berkaitan dengan pengalaman individu tersebut pada masa lalu, sekarang, lingkungan yang membentuknya, dan kaitan variable-variabel yang berkaitan dengan kasusnya. Beberapa petunjuk untuk melaksanakan studi kasus, antara lain:
.
41
(1) Temukenali peserta didik yang mengalami masalah khusus untuk dijadikan suatu kasus (2) Menetapkan jenis masalah yang dihadapi oleh peserta didik
dan perlu
mendapatkan bantuan pemecahan (3) Mencari bukti-bukti lain untuk lebih meyakinkan kebenaran masalah yang dihadapi oleh peserta didik (4) Mencari sebab-sebab timbulnya masalah dari berbagai aspek (5) Menganalisis sebab-sebab tesebut dan mengkaitakannya dengan perilaku peserta didik /klien (6) Pendidik menentukan sejumlah alternative untuk membantu pemecahannya (7) Memilih alternative yang terbaik (8) Terus mengadakan pengamatan dan pemamntauan terhadap perilaku peserta didik tersebut untuk melihat perubahan perilakukanya. 6. Daftar cocok (Check list) Daftar cocok adalah sejumlah pernyataan (biasanya singkat), dimana responden yang dinilai hanya membubuhkan tanda cocok (V) pada tempat yang telah disediakan. 7. Riwayat Hidup Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam masa hidupnya. Dengan mempelajari riwayat hidup, penilai akan dapat menarik kesimpulan tentang kepribadian, kebiasaan, dan sikap dari orang yang dinilai. 8. Sosiometri Sosiometri adalah suatu teknik untuk mempelajari atau mengetahui hubungan sosial peserta didik atau subjek yang dinilai. Dengan teknik sosiometri dapat diketahui posisi seseorang peserta didik dalam hubungan sosialnya dengan teman-temannya. Misalnya, peserta didik yang terisolasi dari teman-temannya, peserta didik
yang popular, dan sebagainya. Posisi peserta didik
dalam
kaelompoknya sangat diperlukan untuk menentukan kelompok belajar, organisasi kelas, pemberian tugas kelompok, dan sebagainya. Teknik sosiometri dapat dilakukan dengan cara menugaskan kepada semua peserta didik di kelas tersebut untuk memilih satu,dua atau tiga temannya yang
.
42
paling disukai atau paling akrab. Hasil pilihan peserta didik tersebut, kemudian dibuat diagramnya, yang disebut sosiogram. Contoh: Didut (D) adalah pemilih, ditulis pada bagian bawah. Dedy (D) = pilihan pertama, Nina (N) = pilihan ke dua, Boby (B) = pilihan ketiga Atas dasar pilihan semua peserta didik , kemudian dianalisis dan dibuat sosiogramnya, sehingga diketahui siapa peserta didik yang paling populer, siapa yang terisolir, dan sebagainya. Contoh Sosiogram: G
H
O
E
P
Q
R
F
L
S
N
J
T
K
M A
D
B
C
Gambar 05. Sosiogram
.
I
43
Berdasarkan sosiogram tersebut, dapat diketahui: (1) bagaimana hubungan antarpeserta didik di kelas tersebut secara keseluruhan sehingga dapat diketahui kadar hubungan social di antara mereka; (2) dapat diketahui kedudukan setiap peserta didik dalam hubungan sosialnya sehingga dapat ditentukan siapa yang paling disenangi dengan melihat arah anak panah yang ditujukan kepada yang bersangkutan; makin banyak anak panah yang ditujukan kepadanya, berarti semakin banyak orang senang kepada dirinya. Beberapa kategori peserta didik yang dapat diperoleh dari sosiogram, yakni: (1) peserta didik yang populer, yaitu peserta didik yang banyak dipilih oleh kawan-kawannya (peserta didik N), (2) peserta didik yang terisolasi (peserta didik L), (3) peserta didik yang membentuk satu klik (peserta didik
A,B,C,D), dan (4) peserta didik
yang membentuk
hubungan mata rantai (misalnya, sisa E,F,G,H,I,M). Cara lain untuk menentukan posisi peserta didik
adalah dengan cara
memberi skor kepada pilihan peserta didik . Misalnya, jika peserta didik diminta memilih dua orang teman yang paling dekat secara berurutan, peserta didik pilihan pertama diberi skor 3 dan peserta didik pilihan ke dua diberi skor 1. Setiap peserta didik dihitung perolehan skornya. Peserta didik yang memperoleh skor terbanyak menunjukkan peserta didik yang paling disenangi. Peserta didik yang tidak mendapat skor disebut peserta didik yang terisolasi.
.
44
BAB III ASESMEN BERBASIS KOMPETENSI Saat ini sejumlah pembaharuan pendidikan sedang dilaksanakan dalam upaya untuk meningkatkan mutu pendidikan. Fokus pembaharuan pendidikan diletakkan pada tingkat sekolah melalui Manajemen Berbasis Sekolah (MBS) dan implementasi Kurikulum Berbasis Kompetensi (KBK). MBS adalah paradigma baru pengelolaan sekolah berdasarkan kekhasan, keunikan, kebolehan, kebutuhan, dan kemampuan sekolah dengan melibatkan partisipasi stakeholders. Sedangkan KBK merupakan bagian dari Pendidikan Berbasis Kompetensi (PBK), yaitu pendidikan yang mengacu pada standar kompetensi yang ingin dicapai dan diperlukan oleh peserta didik. Standar kompetensi adalah pernyataan tentang kompetensi yang harus dimiliki oleh peserta didik untuk melakukan sesuatu sesuai dengan unjuk kerja yang dipersyaratkan, baik logos, etos, maupun patos. Pendekatan pembelajaran yang cocok untuk melaksanakan Pendidikan Berbasis Kompetensi, antara lain adalah belajar tuntas (mastery learning), belajar melalui kegiatan nyata (learning by doing), dan pembelajaran yang memperhatikan kemampuan peserta didik (individualized learning). Untuk mengetahui tingkat keberhasilan pendidikan berbasis kompetensi adalah dengan melaksanakan sistem evaluasi yang tepat, yakni asesmen berbasis kompetensi. Asesmen berbasis kompetensi adalah asesmen yang disusun dan dilaksanakan berdasarkan standar kompetensi, yaitu suatu proses penilaian dengan cara membandingkan kompetensi yang dicapai oleh peserta didik dengan standar kompetensi yang telah ditetapkan. Hal ini dilakukan dengan maksud untuk memperoleh informasi tentang tingkat ketercapaian kompetensi peserta didik. Asesmen semacam ini, oleh beberapa ahli disebut evaluasi otentik atau evaluasi berbasis kelas. Evaluasi otentik merupakan kombinasi dari berbagai cara penilaian, seperti: tes tertulis, hasil pekerjaan rumah, projek, kuis, karya tulis, laporan, jurnal, portofolio, observasi, praktek, dan kinerja (performance) peserta didik. Evaluasi otentik termasuk jenis asesmen berbasis kelas (classroom-based assessment), yang memiliki prinsip dasar keberlanjutan dan komprehensif, dalam
.
45
arti dilakukan secara berencana, bertahap, dan terus menerus untuk memperoleh informasi yang lengkap tentang keberhasilan belajar peserta didik. A. Pendidikan Berbasis Kompetensi Saat ini secara bertahap diimplementasikan
Kurikulum Berbasis
Kompetensi (KBK) pada semua jenjang pendidikan. Kurikulum Berbasis Kompetensi disusun berdasarkan atas kebutuhan untuk mencapai standar kompetensi dan harus menjamin adanya artikulasi antar jenjang kompetensi. Bahan ajar yang disusun harus menampilkan sosok utuh standar kompetensi dan artikulasi antar jenjang standar kompetensi, sehingga akan lebih baik jika bahan ajar dirancang dengan menggunakan sistem moduler atau paket sehingga keluwesan dan konsistensinya dapat dijamin. Kurikulum Berbasis Kompetensi merupakan bagian dari Pendidikan Berbasis Kompetensi (PBK), yaitu pendidikan yang mengacu pada standar kompetensi yang akan dicapai dan diperlukan oleh peserta didik. Artinya, setelah mengikuti PBK, peserta didik mampu melakukan sesuatu. Dengan kata lain, PBK tidak sekedar mendidik peserta didik untuk mengenal nilai (logos), tetapi juga mendidik mereka untuk menginternalisasikan nilai-nilai (etos), dan dapat menerapkan nilai-nilai yang telah diinternalisasi ke dalam kehidupan sehari-hari (patos). Kompetensi adalah kemampuan melakukan sesuatu yang berbeda dengan sekedar kemampuan mengetahui sesuatu. Kompetensi tersusun atas tiga unsur utama yaitu pengetahuan, keterampilan, dan sikap. Standar kompetensi adalah pernyataan tentang kompetensi yang harus dimiliki oleh peserta didik untuk melakukan sesuatu sesuai dengan unjuk kerja yang dipersyaratkan. Secara rinci, standar kompetensi adalah pernyataan yang: (1) mendeskripsikan tugas dan fungsi yang dinyatakan dalam kompetensi yang tersusun atas sejumlah sub-komptensi, (2) mendeskripsikan standar atau kriteria unjuk kerja dari setiap sub-kompetensi, (3) mendeskripsikan konteks mengenai pekerjaan atau tugas yang dilakukan dan memberikan pedoman tentang hal-hal yang dipersyaratkan untuk unjuk kerja, (4) mendeskripsikan pedoman untuk melakukan penilaian setiap sub-kompetensi, dan (5) mencakup kemampuan mengerjakan sesuatu, kemampuan mengorganisasikan, kemampuan mengatasi
.
46
masalah, dan kemampuan menyesuaikan diri terhadap lingkungan yang berbeda (Slamet, 2004). Strategi pembelajaran yang lebih cocok untuk melaksanakan Pendidikan Berbasis Kompetensi, antara lain adalah belajar tuntas (mastery learning), belajar melalui
kegiatan
nyata
(learning
by
doing),
dan
pembelajaran
yang
memperhatikan kemampuan peserta didik (individualized learning). Hal ini sejalan dengan pendekatan pembelajaran dan pengajaran kontekstual (Contextual Teaching and Learning atau CTL). CTL adalah suatu pendekatan pembelajaran dan pengajaran yang mengaitkan antara materi yang diajarkan dengan situasi dunia nyata peserta didik dan mendorong peserta didik membuat hubungan antara pengetahuan yang dimilikinya dengan penerapannya dalam kehidupan mereka sebagai individu. Dengan pendekatan CTL, proses pembelajaran menjadi lebih konkrit, realistik, aktual, nyata, menyenangkan, dan bermakna. Pergeseran pendekatan proses pembelajaran dari konvensional menuju CTL diperlukan strategi seperti tabel berikut. Tabel 02. Perbedaan antara Pendekatan Konvensional dan CTL No. 1. 2. 3. 4. 5.
Pendekatan Konvensional Abstrak Tekstual Verbal Artifisial Maya
Pendekatan CTL Riil Aktual Konkrit Realita Nyata
Sumber: Slamet PH. 2004.
Keterkaitan antara CTL dan KBK adalah bahwa KBK menyangkut materi yang harus diajarkan, sedangkan CTL menyangkut cara mengajar dan belajarnya. Dengan demikian, fokus CTL adalah pada proses pembelajaran yang mendukung ketercapaian Kurikulum Berbasis Kompetensi sebagai bagian dari Pendidikan Berbasis Kompetensi. Pendidikan
Berbasis
Kompetensi
diterapkan
untuk
melengkapi
kekurangan pendidikan konvensional yang cenderung abstrak, verbal, artifisial, dan maya. Perbedaan antara pendidikan berbasis kompetensi dengan pendidikan konvensional, dapat dilihat pada tabel berikut.
.
47
Tabel 03. Perbedaan antara Pendidikan Konvensional dan Pendidikan Berbasis Kompetensi Pendidikan Konvensional (PK)
Pendidikan Berbasis Kompetensi (PBK)
1. Berbasis isi
1. Bebasis Kompetensi
2. Berbasis Waktu
2. Berbasis Kinerja
3. Kecepatan Kelompok
3. Kecepatan Individu
4. Umpan Balik Tertunda
4. Umpan Balik Seketika
5. Berbasis Textbook 6. Orientasi Matapelajaran
5. Berbasis Bahan Ajar yang Multimedia 6. Orientasi Modular
7. Berbasis Ruang Kelas
7. Berbasis Lapangan
8. Guru
8. Fasilitator/Nara Sumber
9. Tujuan Umum
9. Tujuan Spesifik
10. Kriteria Subjektif
10. Kriteria Objektif
11. Acuan Norma
11. Acuan Kriteria
Sumber: Slamet PH, 2004.
B. Asesmen Berbasis Kompetensi 1. Standar Kompetensi dan Kompetensi Dasar Kompetensi adalah kemampuan yang dapat dilakukan oleh peserta didik yang mencakup pengetahuan, afeksi atau sikap dan perilaku. Tujuan utama dari standar kompetensi adalah untuk memberi arah kepada pendidik tentang kemampuan dan keterampilan yang menjadi fokus proses pembelajaran dan asesmen atau penilaian. Dengan demikian, standar kompetensi adalah batas dan arah kemampuan yang harus dimiliki dan dapat dilakukan oleh peserta didik setelah mengikuti suatu proses pembelajaran tertentu. Pada umumnya, standar kompetensi menganalisis,
menggunakan
kata
mengevaluasi,
kerja
operasional
membandingkan,
(seperti;
menafsirkan,
mendemonstrasikan,
dan
sebagainya) atau yang tidak operasional (seperti: mengetahui dan memahami). Jumlah standar kompetensi bervariasi sekitar 6 sampai 15. Standar kompetensi bersifat umum sehingga perlu dijabarkan kedalam sejumlah kompetensi dasar atau kemampuan minimal. Selanjutnya, setiap kompetensi dasar diuraikan menjadi materi pokok dan sejumlah pengalaman belajar. Kompetensi dasar dengan memperhatikan materi pokok dan pengalaman
.
48
belajar dikembangkan sejumlah indicator. Tiap kompetensi dasar dapat diuraikan menjadi beberapa indicator. Selanjutnya, setiap indicator dapat dikembangkan paling sedikit tiga butir soal. Indikator ini menjadi pedoman tentang tingkat pencapaian belajar peserta didik sesuai dengan kompetensi dasar yang harus dimiliki oleh peserta didik. 2. Sistem Penilaian Berkesinambungan Ada tiga hal yang perlu diperhatikan dalam pengembangan sistem asesmen berbasis kompetensi dasar, yaitu: (1) definisi tentang apa yang dipelajari dan apa yang dinilai; (2) spesifikasi peringkat unjuk kerja; dan (3) menekankan pada komparasi antara unjuk kerja peserta didik dengan standar atau kriteria. Sistem penilaian berbasis kompetensi adalah sistem penilaian yang berkesinambingan, dalam arti semua komponen indicator dibuat butir soalnya, hasilnya dianalisis untuk menentukan kompetensi yang telah dimiliki dan yang belum dimilikinya. Untuk keperluan tersebut, dapat digunakan berbagai jenis alat ukur, seperti tes tertulis atau lisan, kuis, ulangan harian, tugas-tugas, ulangan semester, observasi, wawancara, daftar cocok, kuesioner, tes tindakan, dan portofolio. Selanjutnya, hasil penilaian dianalisis untuk menentukan tindakan perbaikan berupa program remidi atau pengayaan. Pendidikan Berbasis Kompetensi yang menekankan pada pencapaian kompetensi dasar menggunakan berbagai teknik penilaian dalam upaya untuk memantau dan menentukan program perbaikan. Oleh karena itu, dalam penilaian berkesinambungan, harus dibuat kisi-kisi penilaian secara menyeluruh untuk satu semester dengan memilih teknik penilaian yang tepat. Contoh kisi-kisi sistem penilaian secara berkesinambungan sebagai berikut. Tabel 04. Kisi-kisi Penilaian Berkesinambungan Mata Kuliah Semester Program Studi Standar Kompetensi Kompetensi Materi Dasar Pelajaran
.
: . . . . . .. . . : ……. . . . :........ :........ Strategi Pembelajaran Tatap Pengalaman Muka Belajar
49
Indikator
Penilaian Jenis Bentuk Tagihan Instrumen
Contoh Soal
Pengembangan sistem penilaian berbasis kompetensi dasar mencakup masalah; (1) standar kompetensi, (2) kompetensi dasar atau minimal, (3) rencana penilaian, (4) proses penilaian, (5) proses implementasi, dan (6) pencatatan serta pelaporan. 3. Jenis Tagihan Jenis tagihan yang dapat digunakan, antara lain sebagai berikut: (1) kuis, yaitu waktu penilaian singkat, sekitar 15 menit dan menanyakan hal yang penting saja, (2) pertanyaan lisan di kelas, (3) ulangan harian, (5) tugas individual, (6) tugas kelompok, dan (7) ulangan blok, yaitu materi diambil dari kumpulan kompetensi dasar. Tingkat berpikir yang terlibat dalam penilaian meliputi pengetahuan deklaratif yang berisi konsep, prinsip, dan fakta-fakta; dan pengetahuan prosedural mencakup proses, strategi, aplikasi, dan keterampilan. 4. Bentuk Instrumen Bentuk instrumen yang dapat digunakan, antara lain sebagai berikut. (1) Pertanyaan lisan di kelas, (2) Pilihan ganda, (3) Uraian objektif, (4) Uraian bebas, (5) Jawaban singkat, (6) Menjodohkan, (7) Unjuk kerja (tes tindakan), (8) Portofolio, (9) Observasi, (10) Kuisioner, (11) Daftar cocok, (12) Sosiometri, (13) Riwayat hidup, (14) Studi kasus, dan (15) Skala atau kiraan (rating). 5. Penyusunan Tes Kognitif Bentuk Tes Kognitif, antara lain sebagai berikut. a. Tes Lisan di kelas, untuk mengetahui taraf serap peserta didik dalam aspek kognitif; b. Tes Pilihan Ganda, untuk ulangan harian dan ulangan umum. Pedoman yang perlu diperhatikan dalam menyusun butir soal pilihan ganda sebagai berikut: (1) pokok soal harus jelas, (2) pilihan jawaban harus homogen, (3) panjang kalimat pilihan jawaban diusahakan sama, (4) tidak ada petunjuk yang mengarah ke pilihan jawaban yang benar, (5) hindari penggunaan kata-kata: semua salah/benar, ketiganya salah, atau sejenisnya, (6) pilihan jawaban dalam bentuk angka diurutkan dari yang terbesar ke yang terkecil atau sebaliknya, (7) semua pilihan jawaban mempunyai hubungan logis
.
50
dengan pokok soal, (8) kalimat yang digunakan sesuai dengan tingkat perkembangan peserta tes, (9) memakai bahasa yang baku, (10) tidak menggunakan istilah lokal, dan (11) letak pilihan jawaban benar diletakkan secara acak. c. Bentuk Uraian Objektif. Bentuk soal uraian objektif sangat baik digunakan untuk ulangan harian dan ulangan umum d. Bentuk Uraian Subjektif. Bentuk soal uraian subjektif dipakai untuk ulangan harian dan tugas-tugas rumah. Untuk menghindari subjektivitas penskoran, disarankan sebagai berikut; (1) jawaban tiap soal tidak panjang, (2) tidak melihat nama peserta ujian, (3) memeriksa tiap butir secara keseluruhan tanpa istirahat, dan (4) menyiapkan pedoman penskoran. Kaidah penulisan soal bentuk uraian bebas sebagai berikut. (1) menggunakan kata tanya: mengapa, uraikan, jelaskan, bandingkan, hitunglah, buktikan, (2) hindari penggunaan pertanyaan; siapa, apabila, (3) menggunakan bahasa baku, (4) hindari penggunaan kata-kata yang dapat ditafsirkan ganda, (5) petunjuk mengerjakan soal dibuat sejelasjelasnya, (6) membuat kunci jawaban, dan (7) membuat pedoman penskoran. Penskoran dilakukan secara global atau analitik. e.Bentuk Jawaban Singkat. Disediakan tempat kosong untuk menuliskan jawaban sesuai dengan petunjuk. Ada tiga bentuk, yaitu: pertanyaan, melengkapi, atau isian, dan jenis identifikasi atau asosiasi. Kaidah penyusunan soal: (1) soal harus sesuai dengan indicator, (2) hanya ada satu jawaban benar, (3) rumusan soal harus komunikatif, (4) menggunakan bahasa baku, dan (5) tidak menggunakan istilah lokal. f. Bentuk Menjodohkan Menjodohkan atau memasangkan terdiri atas suatu premis, suatu daftar kemungkinan jawaban, dan suatu petunjuk untuk menjodohkan masingmasing premis itu dengan kemungkinan jawaban. Kaidah penyusunan soalnya: (1) soal harus sesuai dengan indicator, (2) jumlah alternative jawaban harus lebih banyak dari premis, (3) alternative jawaban harus memiliki hubungan logis dengan premisnya, (4) rumusan soal harus
.
51
komunikatif, (5) menggunakan bahasa baku, dan (6) tidak menggunakan istilah lokal. 6. Asesmen Kinerja (Performance Assessment) Asesmen kinerja (Performance Assessment) adalah suatu prosedur dengan jalan memberikan tugas-tugas untuk memperoleh informasi tentang seberapa baik peserta didik telah belajar. Dalam asesmen kinerja ini, dituntut untuk
menerapkan
pengetahuan
dan
keterampilannya
dengan
cara
mendemonstrasikan yang dapat mereka kerjakan sesuai dengan tujuan atau target pembelajaran. Untuk itu, perlu ditentukan target-target kompetensi yang harus dicapai oleh peserta didik. Misalnya, membuat laporan suatu projek, atau mendemonstrasikan bagaimana caranya membuat suatu skala pengukuran sikap (Nitko, 1996). Untuk menilai kinerja peserta didik, lakukan pengamatan dengan format yang telah disediakan (amati aspek pengetahuan, afeksi dan atau sikap, dan psikomotorik mereka). Tipe atau bentuk asesmen kinerja, antara lain (1) dengan bentuk terstruktur (latihan) seperti penyelesaian tugas-tugas yang menuntut penggunaan alat dan sumber-sumber, baik secara individual maupun kelompok; (2) tes tindakan khusus, dan amati cara-cara peserta didik memecahkan masalah; (3) projek jangka panjang, baik individual, kelompok, maupun kombinasi kelompok dan individual; (4) portofolio pekerjaan yang baik (best-work portfolios) dan portofolio kemajuan belajar (learning-progress portfolios), seperti telah diuraikan di atas; (5) demonstrasi; (6) eksperimen; (7) presentasi lisan; dan (8) simulasi. Untuk menilai keberhasilan peserta didik, perlu diperhatikan 2 hal yaitu (1) pencapaian target itu sendiri, dan (2) kualitas penampilan atau performansi peserta didik. 7. Asesmen Portofolio (Assessment Portfolios) Sebagai
konsekuensi
desentralisasi
pendidikan,
saat
ini
sejumlah
pembaharuan pendidikan sedang dilaksanakan dalam upaya untuk meningkatkan mutu pendidikan. Fokus pembaharuan pendidikan diletakkan pada tingkat sekolah melalui Manajemen Berbasis Sekolah (MBS) dan implementasi Kurikulum Berbasis Kompetensi (KBK). MBS adalah paradigma baru pengelolaan sekolah berdasarkan kekhasan, keunikan, kebolehan, kebutuhan, dan kemampuan sekolah
.
52
dengan melibatkan partisipasi stakeholders. Sedangkan KBK merupakan bagian dari Pendidikan Berbasis Kompetensi (PBK), yaitu pendidikan yang mengacu pada standar kompetensi yang akan dicapai dan diperlukan oleh peserta didik. Standar kompetensi adalah pernyataan tentang kompetensi yang harus dimiliki oleh peserta didik untuk melakukan sesuatu sesuai dengan unjuk kerja yang dipersyaratkan, baik logos, etos, maupun patos. Pendekatan pembelajaran yang cocok untuk melaksanakan Pendidikan Berbasis Kompetensi, antara lain adalah belajar tuntas (mastery learning), belajar melalui kegiatan nyata (learning by doing), dan pembelajaran yang memperhatikan kemampuan peserta didik (individualized learning).
Untuk mengetahui tingkat keberhasilan pendidikan
berbasis kompetensi adalah dengan melaksanakan sistem evaluasi yang tepat, yakni evaluasi berbasis kompetensi. Evaluasi berbasis kompetensi adalah evaluasi yang disusun dan dilaksanakan berdasarkan standar kompetensi, yaitu suatu proses penilaian dengan cara membandingkan kompetensi yang dicapai oleh peserta didik dengan standar kompetensi yang telah ditetapkan. Hal ini dilakukan dengan maksud untuk memperoleh informasi tentang tingkat ketercapaian kompetensi peserta didik. Evaluasi semacam ini, oleh beberapa ahli disebut evaluasi otentik. Evaluasi otentik merupakan kombinasi dari berbagai cara penilaian, seperti: tes tertulis, hasil pekerjaan rumah, proyek, kuis, karya tulis, laporan, jurnal, portofolio, observasi, praktek, dan kinerja (performance) peserta didik. Evaluasi otentik termasuk jenis evaluasi berbasis kelas (classroom-based assessment), yang memiliki prinsip dasar keberlanjutan dan komprehensif, dalam arti dilakukan secara berencana, bertahap, dan terus menerus untuk memperoleh informasi yang lengkap tentang keberhasilan belajar peserta didik. Menurut Engel (dalam Fogarty, 1996), asesmen otentik (authentic assessment) adalah alat untuk membantu pendidik dan peserta didik untuk bekerja bersama-sama dengan cara yang paling produktif dan merupakan cara efektif untuk berkomunikasi dengan orang tua peserta didik. Engel mengajukan dua cara koleksi data, yaitu koleksi data yang dilakukan oleh pendidik, meliputi: catatan kurikulum, observasi, refleksi atas peserta didik atau kelas secara keseluruhan, catatan-catatan tentang konferensi orang tua peserta didik, hasil tes, dan apa saja yang diperlukan oleh pendidik. Koleksi peserta didik (portofolio), meliputi sampel pekerjaan peserta
.
53
didik untuk semua bidang studi. Kedua koleksi tersebut memberi informasi tentang profil peserta didik, dan laporan dikirimkan kepada orang tua peserta didik. Salah satu bentuk penilaian yang dipandang lebih sesuai dan cocok dalam Pendidikan Berbasis Kompetensi adalah dengan asesmen portofolio (assessment portfolios), karena asesmen portofolio ini menyatu dengan proses pembelajaran dan dapat mencakup beberapa jenis penilaian lainnya. Asesmen portofolio adalah suatu prosedur pengumpulan informasi mengenai perkembangan dan kemampuan peserta didik
melalui portofolionya (Marhaeni, 2004). Salvia dan Ysseldyke
(1995) menyatakan bahwa portofolio adalah sekumpulan hasil karya peserta didik yang dapat menunjukkan apa yang bisa dilakukan oleh peserta didik tersebut. Kumpulan dokumen tersebut, berupa
tugas-tugas kelas,
daftar buku yang telah dibaca, videotapes,
draf, audio tapes,
hasil ulangan, check list, journal,
penyelesaian projek, kerja keterampilan, dan semua hasil kerja peserta didik , termasuk evaluasi diri. Menurut Moss (1994), asesmen portofolio berbeda dengan bentuk asesmen konvensional. Asesmen portofolio menggunakan pendekatan “bottom-up”, sedangkan testing menggunakan pendekatan “top-down” (dalam Robin Fogarty, ed. 1996). Dasar filosofis yang melandasi asesmen portofolio adalah filsafat konstruktivisme sosial yang dimotori oleh Vigotsky (dalam Suparno, 1997) dengan konsep “Zone of Proximal Development” (ZPD) yang menyumbangkan konsep perkiraan wilayah perkembangan tempat peserta didik membangun pemahaman dan interpretasinya apabila digandengkan dengan orang yang lebih berpengalaman. Selanjutnya, Wallace (1991) dengan pendekatan reflektif dalam pengembangan profesi keguruan, menyumbangkan konsep tentang pentingnya dilakukan refleksi dalam proses belajar, sehingga dapat meningkatkan kinerja dan pemahaman pendidik yang mengarah pada cara-cara pengajaran yang lebih baik. Asesmen portofolio sesuai dengan dasar filosofis tersebut, karena (1) menilai performansi yang menunjukkan hasil dari suatu konstruksi makna, (2) bersifat kolaboratif, (3) membimbing peserta didik menjadi peneliti, (4) menunjukkan perkembangan peserta didik secara berkelanjutan, (5) memberikan penilaian yang tinggi terhadap perkembangan pengetahuan dan aplikasinya, dan (6) memberikan kesempatan kepada peserta didik untuk melakukan asesmen dan refleksi diri ((Marhaeni, 2004). Dalam asesmen portofolio paling sedikit terdapat
.
54
tujuh elemen pokok, yaitu (1) adanya tujuan yang jelas dan mencakup ranah kognitif, afektif, dan psikomotorik, (2) dapat menunjukkan kualitas hasil belajar, (3) mencakup bukti-bukti otentik yang mencerminkan dunia nyata dan multidimensi, (4) menunjukkan profil kerja sama antar peserta didik dan antara peserta didik dengan pendidik, (5) penilaian yang integratif dan dinamis karena mencakup multidimensi, (6) adanya kepemilikan (ownership) melalui refleksi diri dan evaluasi diri, dan (7) perpaduan antara asesmen dan pembelajaran (Dantes, 2003). Dalam beberapa kajian, asesmen portofolio dipandang sebagai asesmen alternatif, asesmen otentik, atau asesmen kinerja (Salvia & Ysseldyke, 1995; O’Malley,
1996).
Dalam
kajian
lain,
Wyaatt
III
dan
Loper
(1999)
mengembangkan suatu model asesmen portofolio yang diakronimkan menjadi CORP, yaitu (1) collecting documents, (2) organizing, yakni disusun secara kronologis berdasarkan fokus atau karya terbaik, (3) reflecting, yaitu refleksi terhadap proses belajar yang telah dilalui serta evaluasi atas karya sendiri, dan (4) presenting, yakni menampilkan semua hasil dalam sebuah folder. Dalam kaitan ini, Paulson and Paulson (dalam Fogarty, 1996) mengemukakan tentang cara mengukur portofolio, yang disebut “A Cognitive Model for Assessing Portfolios (MAP)”. CMAP memandang portofolio dari tiga dimensi secara simultan, yaitu (1) dimensi stakeholders, yakni orang-orang yang berminat terhadap portofolio, seperti peserta didik, pendidik, orang tua, dan agensi lainnya; (2) dimensi proses, yakni semua aktivitas yang membentuk portofolio, seperti: tujuan, isu, standar, eksibisi (exhibits), dan penilaian; dan (3) dimensi history, yakni semua catatan tentang perubahan yang terjadi sepanjang proses pembelajaran. Menurut O’Malley dan Valdez Pierce (1996), paling sedikit ada tiga elemen penting dalam asesmen portofolio, yakni (1) sampel karya peserta didik, (2) evaluasi diri, dan (3) kriteria penilaian yang jelas dan terbuka. Dengan demikian, dapat dikatakan bahwa suatu kumpulan karya dapat diklarifikasi menjadi pendekatan asesmen portofolio jika (1) kumpulan karya tersebut mampu memberikan informasi yang komprehensif mengenai performansi peserta didik, (2) peserta didik dipandang sebagai subjek dalam proses asesmen, dan (3) menyediakan forum bagi peserta didik untuk mengembangkan kemampuan-kemampuannya agar dapat menjadi pebelajar yang independen dan mampu mengarahkan diri sendiri.
.
55
Sebagai asesmen alternatif, asesmen portofolio merupakan lawan dari tes baku, tes objektif, atau bentuk tes yang mensyaratkan hanya satu pilihan jawaban. Dalam kaitan ini, De Fina (1992) membandingkan ciri-ciri asesmen portofolio dengan tes-tes baku sebagai tabel berikut ini. Tabel 05. Perbandingan antara Asesmen Portofolio dan Tes Baku No. 1
Asesmen Portofolio
Tes Baku
Terjadi pada situasi alamiah
2 3. 4. 5.
6. 7. 8.
9. 10.
Terjadi pada situasi ujian, tidak alamiah Memberi kesempatan kepada Menunjukkan kelemahan peserta peserta didik untuk menunjukkan didik dalam suatu hal tertentu kelebihan dan kelemahannya Informasinya bersifat langsung Tidak memberikan informasi pada saat proses pembelajaran dianostik secara langsung (informasi berlangsung tertunda) Asesmen dilakukan bersama oleh Asesmen dilakukan hanya oleh guru, orang tua peserta didik , dan pendidik dan menunjukkan peringkat peserta didik itu sendiri peserta didik Penilaian berlangsung terus- Kesempatan hanya sekali untuk menerus selama proses menilai kemampuan dalam hal pembelajaran sehingga tertentu memberikan kesempatan untuk menilai berbagai kemampuan Menilai hal-hal yang realistik dan Menilai hal-hal yang artifisial, tidak bermakna sesuai dengan keseharian yang ada Memberi kesempatan kepada Mengharapkan hanya ada satu peserta didik untuk mengadakan respon tentang pengetahuan atau refleksi terhadap hasil karyanya kemampuannya Memberikan kesempatan kepada Memberikan data numerik yang orang lain yang berkepentingan kadangkala menakutkan dan tidak untuk mengadakan refleksi tentang bermakna secara esensial pengetahuan dan karya-karya peserta didik Mendorong terwujudnya temu Mengharuskan pertemuan antara wicara antara pendidik dan peserta pendidik dan administrator didik Menempatkan peserta didik Menempatkan peserta didik sebagai sebagai pusat proses pembelajaran objek proses pembelajaran dan sehingga bermanfaat untuk mendukung kurikulum sebagai pusat perbaikan kurikulum dan proses pembelajaran pembelajaran
Sumber: Diadaptasikan dari De Fina, 1992.
.
56
Berdasarkan uraian tersebut di atas, dapat disimak bahwa penilaian berbasis kelas, khususnya esesmen portofolio lebih adaptif digunakan dalam proses pembelajaran yang menggunakan Kurikulum Berbasis Kompetensi. Tabel 06. Contoh Penilaian Portofolio MK. Evaluasi Pendidikan
Kompetensi Dasar Menentukan kualitas alat ukur tes Indikator
Nama Mahasiswa: Sujana Tanggal: 10 Agustus 2006 1
2
3
4
Penilaian 5 6 7
X
3. Menghitung daya beda butir tes 4. Menghitung taraf kesukaran butir tes
3. Kelompok kecil 4. Sendiri 5. Komentar orang tua (khusus untuk siswa di sekolah)
9
10
X X
1. Menguji validitas butir tes 2. Menghitung reliabilitas tes
Dicapai melalui 1. Petolongan dosen 2. Seluruh kelas
8
X
Komentar Dosen Sujana telah mencapai hasil yang baik dalam menguji validitas butir tes dan reliabilitas tes, tetapi perlu ditingkatkan kemampuannya dalam menghitung daya beda dan taraf kesukaran tes .......................................................................
Tabel 07. Perbedaan antara Tes dan Portofolio TES PORTOFOLIO 1. Menilai peserta didik dengan tugas 1. Berdasarkan seluruh tugas dan hasil terbatas kerja 2. Hanya pendidik/dosen yang menilai 2. Peserta didik turut menilai 3. Menilai semua peserta didik dengan 3. Menilai secara individual satu kinerja 4. Penilaian tidak kolaboratif 4. Penilaian kolaboratif 5. Penilaian diri sendiri bukan merupakan 5. Pesrta didik menilai diri sendiri sebagai tujuan tujuan 6. Hanya pencapaian yang menjadi 6. Yang menjadi perhatian meliputi perhatian kemajuan, usaha, dan pencapaian 7. Terpisah antara kegiatan pembelajaran, 7. Terkait erat antara kegiatan penilaian, testing, dan pengajaran pengajaran, dan pembelajaran
.
57
8. Penyusunan Tes Afektif Paling sedikit ada dua komponen afektif yang penting untuk diukur, yaitu sikap dan minat terhadap suatu pelajaran. Langkah pembuatan instrument afektif adalah sebagai berikut; (1) memilih aspek afektif yang akan dinilai (misal, sikap atau minat), (2) menentukan indikatornya, (3) memilih tipe skala yang digunakan, (4) menelaah instrument oleh sejawat, (5) memperbaiki instrument, (6) menyiapkan inventori laporan diri, (7) menghitung skor inventori, (8) menganalisis hasil inventori. 9. Penyusunan Tes Psikomotor a. Bentuk Tes Psikomotor Tes psikomotor adalah tes untuk mengukur penampilan atau kinerja (performance) yang telah dikuasai oleh peserta didik
yang berkaitan dengan
pemakaian atau mengkonstruksi suatu alat. Tes psikomotor dapat berupa: (1) tes paper and pencil, tetapi yang menjadi sasarannya adalah kemampuan peserta didik untuk menampilkan karya, (2) tes identifikasi, yaitu ditujukan untuk mengukur kemampuan peserta didik
untuk mengidentifikasi sesuatu hal, misalnya
menemukan bagian alat yang rusak, (3) tes simulasi, yaitu dilakukan jika tidak ada alat yang sesungguhnya, (4) tes sampel atau contoh kerja, yang dilakukan dengan alat sesungguhnya. b. Bentuk daftar cek Daftar Cek berisi seperangkat butir soal yang mencerminkan rangkaian tindakan atau perbuatan, yang merupakan indicator-indikator dari keterampilan yang diukur yang harus ditampilkan oleh peserta ujian. Dalam menyusun daftar cek hendaknya menentukan indicator-indikator penguasaan keterampilan yang diujikan dan mengurutkan indicator-indikator tersebut sesuai dengan urutan penampilannya. Dengan lembar observasi, penilai melakukan pengamatan terhadap aktivitas subjek
untuk mengetahui pemunculan indicator-indikator
tersebut.
.
58
c. Bentuk Skala Penilaian Penyusunan skala penilaian hampir sama dengan daftar cek, yaitu mencari indicator-indikator yang mencerminkan keterampilan yang akan diukur, tetapi cara penyajiannya berbeda. Dalam skala penilaian, setelah diperoleh indicatorindikator keterampilan, selanjutnya ditentukan skala penilaian untuk setiap indicator. Misalnya, skala 5 jika suatu indicator dikerjakan dengan tepat, 4 jika tepat, 3 jika agak tepat, 2 tidak tepat, dan 1 sangat tidak tepat.
.
59
BAB IV TEKNIK DAN PROSEDUR PENGEMBANGAN INSTRUMEN EVALUASI HASIL BELAJAR A. Mengkonstruksi Tes Hasil Belajar Dalam mengkonstruksi alat ukur tes, perlu diperhatikan langkah-langkah sebagai berikut ini. 1. Menetapkan tujuan tes Tes hasil belajar dapat dibuat untuk bermacam-macam tujuan, seperti: Ujian Akhir Nasional (UAN), seleksi, diagnostic, formatif, dan keperluan lain-lain. 2. Analisis Kurikulum Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok bahasan yang akan dijadikan sebagai dasar dalam menentukan jumlah item atau butir soal untuk setiap pokok bahasan untuk soal objektif atau bobot soal untuk bentuk uraian, dalam membuat kisi-kisi tes. Menentukan bobot untuk setiap pokok bahasan tersebut dilakukan berdasarkan jumlah jam pertemuan yang tercantum dalam kurikulum atau Garis-garis Besar Program Pengajaran (GBPP). 3. Analisis buku pelajaran dan sumber materi belajar lainnya. Analisis buku pelajaran dan sumber dari materi belajar lainnya mempunyai tujuan yang sama dengan analisis kurikulum, yaitu menentukan bobot setiap pokok bahasan. Akan tetapi dalam analisis buku pelajaran menentukan bobot setiap pokok bahasan berdasarkan jumlah halaman materi yang termuat dalam buku pelajaran atau sumber materi belajar lainnya. Tes yang akan disusun diharapkan dapat mencakup seluruh konten (populasi materi) yang diajarkan. Untuk itu kedua langkah yang disebutkan sangat diperlukan dalam memperkecil error dalam memilih sample soal. Hal ini penting karena apabila soal tidak disampel maka akan menghasilkan beratus-ratus soal pada tiap bidang studi untuk mewakili populasi materi yang pernah diajarkan. Hal ini sangat sulit dilakukan mengingat waktu yang dibutuhkan oleh peserta tes untuk menyelesaikan tes dengan jumlah butir soal sebanyak itu terlalu lama. Untuk dapat memilih sampel soal yang tepat diperlukan: (a) analisis kurikulum, dan (b) analisis buku pelajaran dan sumber materi belajar lainnya.
.
60
4. Membuat Kisi-kisi Tes Istilah lain untuk kisi-kisi ialah blue-print atau lay-out, atau table spesifikasi (table of specification). Manfaat kisi-kisi ialah untuk menjamin sample soal yang baik, dalam arti mencakup semua pokok bahasan secara proporsional. Agar item-item atau butir-butir tes mencakup keseluruhan materi (pokok bahasan atau sub-pokok bahasan) secara proporsional maka sebelum menulis butir-butir tes, terlebih dahulu harus membuat kisi-kisi sebagai pedoman. Sebuah kisi-kisi, memuat nomor butir dan jumlah yang harus dibuat untuk setiap bentuk soal, untuk setiap pokok bahasan dan untuk setiap aspek kemampuan yang hendak diukur. 5. Penulisan Tujuan Instruksional Khusus (TIK) Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan. TIK harus mencerminkan tingkah laku peserta didik, oleh karena itu harus dirumuskan secara operasional, dan secara teknis menggunakan kata-kata operasional (KKO). KKO adalah suatu kata kerja yang menunjuk pada perilaku yang dapat diamati dan dapat diukur. Untuk merumuskan TIK yang mengandung KKO, berikut ini ada beberapa contoh kata kerja operasional yang berkaitan dengan ranah kognitif, afektif, dan psikomotorik (BS. Bloom). KKO yang dapat digunakan untuk menyusun TIK pada ranah kognitif pada tingkatan ‘pengetahuan’ (C1) antara lain: menyebutkan, menunjukkan, menyusun daftar, menjodohkan, mendefinisikan, dan memilih. Pemahaman C2, antara lain: menjelaskan, membedakan, merumuskan, menerangkan, memperkirakan, dan menyimpulkan.
Aplikasi
(C3),
antara
lain:
mengubah,
menghitung,
menggunakan rumus-rumus, memodifikasi, membuktikan, memecahkan masalah, dan mengoperasikan. Analisis (C4), antara lain: merinci, mengidentifikasikan,
memisahkan,
menunjukkan
hubungan
antara,
mempertentangkan, membuat diagram, dan menghubungkan. Sintesis (C5), antara lain: mengkategorikan, mengarang, merancang, menyusun kembali, membuat rencana, merevisi, mereorganisasi, dan merekonstruksi. Evaluasi (C6),
antara
lain:
menilai,
mengkriktik,
mendeskripsikan,
menolak,
mendukung, memberi argumentasi, dan memutuskan. Ranah afektif (menurut Krathwohl), mengandung tingkatan: menerima atau menaruh perhatian,
.
61
merespon
atau
menanggapi,
menghargai,
dan
mengorganisasikan,
mengkarakterisasikan nilai. Selanjutnya, ranah psikomotorik (menurut J. Harrow), mengandung tingkatan: gerakan refleks, gerakan fundamental, kemampuan perceptual, kemampuan fisik, gerakan-gerakan keterampilan, dan komunikasi tanpa kata. 6. Penulisan Soal Setelah kisi-kisi dalam tabel spesifikasi telah tersedia, dilanjutkan dengan membuat butir-butir soal. Banyaknya butir soal yang harus dibuat untuk setiap bentuk soal, untuk setiap pokok bahasan, dan untuk setiap aspek kemampuan yang hendak diukur harus disesuaikan dengan yang tercantum dalam kisi-kisi. Ada beberapa petunjuk yang perlu diperhatikan dalam membuat butir-butir soal, antara lain: (a) soal yang harus dibuat harus valid dalam arti mampu mengukur tercapai tidaknya TIK yang telah dirumuskan, (b) soal yang dibuat harus dapat dikerjakan dengan menggunakan satu kemampuan spesifik, tanpa dipengaruhi oleh kemampuan lain yang tidak relevan, (c) soal yang dibuat harus terlebih dahulu dikerjakan atau diselesaikan dengan langkah-langkah lengkap sebelum digunakan pada tes yang sesungguhnya, (d) hindari kesalahan ketik, karena hal itu dapat mempengaruhi
validitas soal, (e)
tetapkan sejak awal kemampuan yang hendak diukur untuk setiap soal, dan (f) berikan petunjuk cara mengerjakan soal secara jelas. 7. Reproduksi Tes Terbatas, untuk kepentingan uji-coba. 8. Uji-coba Tes. Tes yang sudah dibuat dan diperbanyak itu akan diujicobakan kepada sejumlah sampel. Sampel uji coba harus memiliki karakteristik yang relatif sama dengan karakteristik peserta tes sesungguhnya. Jumlah sampel uji-coba harus mencukupi, minimal 5 kali jumlah butir soal. 9. Analisis Hasil Tes Uji-coba Analisis butir soal, meliputi: analisis validitas, tingkat kesukaran, daya pembeda, dan analisis pengecoh. Soal yang tidak valid, didrop atau diperbaiki. Selanjutnya, dihitung reliabilitasnya untuk memperoleh gambaran tentang kualitas tes tersebut secra empirik. j. Revisi Soal
.
62
Soal-soal yang valid secara empirik, kemudian dikonfirmasikan dengan kisikisi. Jika soal-soal tersebut telah memenuhi syarat atau telah mencerminkan secara proporsional semua materi yang akan diujikan, soal-soal tersebut selanjutnya dirakait menjadi seperangkat tes. Tetapi, jika soal-soal yang valid belum memenuhi syarat berdasarkan hasil konfirmasi dengan kisi-kisi, dapat dilakukan perbaikan terhadap beberapa soal yang diperlukan (ini disebut revisi soal). k. Merakit Soal menjadi Tes Butir-butir soal yang valid dan secara keseluruhan telah memenuhi syarat validitas konten (isi), dirakit menjadi sebuah tes yang valid atau tes final. Tes final ini dihitung reliabilitasnya dan dilaporkan menyertai tes. B. Mengkonstruksi Instrumen Non Tes Dalam mengkonstruksi alat ukur atau instrumen non tes, perlu ditempuh langkah-langkah sebagai berikut ini. 1. Berdasarkan sintesis dari teori-teori yang dikaji, pertama-tama dirumuskan konstruk dari variabel yang hendak diukur atau dibuatkan instrumennya. 2. Berdasarkan konstruk tersebut dikembangkan dimensi dan indikator dari variabel yang akan diukur. 3. Membuat kisi-kisi instrument yang memuat dimensi, indicator, nomor butir dan jumlah butir untuk setiap dimensi dan indikator. 4. Menetapkan besaran atau parameter yang bergerak dalam suatu rentangan kontinum dari suatu kutub ke kutub lain yang berlawanan, misalnya dari rendah ke tinggi, dari positif ke negatif, dari otoriter ke demokratik, dari dependen ke independen, dan sebagainya. 5. Menulis butir-butir instrument yang dapat berbentuk pernyataan atau pertanyaan. Biasanya butir instrument yang dibuat terdiri atas dua kelompok, yaitu kelompok butir positif dan kelompok butir negative. Butir positif adalah pernyataan yang menandakan cirri atau keadaan atau sikap atau persepsi yang positif atau mendekati ke kutub positif, sedangkan butir negative adalah pernyataan yang menandakan cirri atau keadaan atau persepsi atau sikap negatif atau mendekati ke kutub negatif.
.
63
6. Butir-butir yang telah ditulis merupakan konsep instrumen yang harus melalui proses validasi, baik validasi teoretik maupun validasi empirik. 7. Tahap validasi pertama yang ditempuh adalah validasi teoretik, yaitu melalui pemeriksaan pakar atau melalui panel. 8. Revisi atau perbaikan berdasarkan saran dari pakar atau berdasarkan hasil panel. 9. Setelah konsep instrument dianggap valid secara teoretik atau secara konseptual, kemudian dilakukan penggandaan instrumen secara terbatas untuk keperluan uji-coba. 10. Uji-coba instrumen di lapangan yang merupakan bagian dari proses validasi empiris. Melalui uji-coba instrument diberikan kepada sejumlah responden yang mempunyai karakteristik sama atau ekivalen dengan karakteristik populasi penelitian untuk direspon atau dijawab. 11. Analisis data hasil uji-coba untuk menguji validitas. Pengujian validitas harus menggunakan kriteria, baik kriteria internal, yaitu instrument itu sendiri sebagai suatu kesatuan yang dijadikan kriteria, maupun criteria eksternal, yaitu instrument atau hasil ukur tertentu di luar instrument yang dibuat yang dijadikan kriteria. 12. Berdasarkan kriteria tersebut diperoleh kesimpulan menganai valid atau tidaknya sebuah butir atau sebuah perangkat instrumen. Jika digunakan kriteria internal, maka keputusan pengujian adalah mengenai valid atau tidaknya butir instrument sehingga proses pengujiannya biasa disebut analisis butir, sedangkan jika digunakan kriteria eksternal, maka keputusan pengujiannya adalah mengenai valid atau tidaknya perangkat instrumen sebagai suatu kesatuan. 13. Berdasarkan hasil analisis butir, maka butir-butir yang tidak valid dikeluarkan atau diperbaiki untuk diuji-coba ulang, seangkan butir-butir yang valid dirakit kembali menjadi sebuah perangkat instrumen untuk melihat kembali validitas kontennya berdasarkan kisi-kisi. Jika secara konten butir- butir yang valid atau memenuhi syarat, maka perangkat instrumen yang terakhir ini menjadi instrumen final yang akan digunakan untuk mengukur variabel penelitian tersebut.
.
64
14. Selanjutnya dihitung koefisien reliabilitas instrument tersebut. Koefisien reliabilitas dengan rentangan niali (0 – 1) adalah besaran yang menunjukkan kualitas atau konsistensi hasil ukur instrument. Makin tinggi koefisien reliabilitas, makin tinggi pula kualitas instrument tersebut. Mengenai batas nilai koefisien reliabilitas yang dianggap layak tergantung pada presisi yang dikehendaki oleh suatu penelitian. Untuk itu, dapat dirujuk pendapat-pendapat yang sudah ada, karena secara eksak tidak ada tabel atau distribusi statistik mengenai angka reliabilitas yang dapa dijadikan rujukan. 15. Perakitan butir-butir instrumen yang valid untuk dijadikan instrumen final.
.
65
BAB V KONSEP DASAR STATISTIK DESKRIPTIF A. Pengertian Statistik 1. Statistik adalah kumpulan data, disajikan dalam bentuk table/daftar, gambar, diagram atau ukuran-ukuran tertentu. Misalnya, statistic penduduk, statistic kelahiran, statistic pertumbuhan ekonomi, statistic pendidikan, dan lain-lain. 2. Statistika, adalah pengetahuan mengenai pengumpulan data, klasifikasi data, pengolahan data, penarikan kesimpulan dan pengambilan keputusan berdasarkan alasan yang cukup kuat. 3. Statstika Matematik/Statistika Teoretik, adalah statistika yang membahas bagaimana sifat-sifat, dalil-dalil dan rumus-rumus statistika diturunkan, bagaimana menciptakan model-model teoretis dan matematis 4. Statistika terapan/Teknik Analisis Data, adalah statistika yang membahas cara-cara penggunaan statistik, antara lain untuk penelitian. 5. Macam Statistik: a. Statistik Deskriptif, yaitu statistik yang digunakan untuk menggambarkan atau menganalisis suatu statistik hasil penelitian tetapi tidak digunakan untuk generalisasi/inferensi. Penelitian yang tidak menggunakan sampel, analisisnya menggunakan statistik deskriptif. Demikian juga penelitian yang menggunakan sampel, tetapi tidak bermaksud untuk membuat kesimpulan untuk populasi dari mana sampel diambil, analisis datanya menggunakan statistik deskriptif. Dalam hal ini, teknik korelasi dan regresi juga dapat berperan sebagai statistik deskriptif. b. Statistik Inferensial adalah statistik yang digunakan untuk menganalisis
data
sampel
dan
hasilnya
akan
digeneralisasikan/diinferensikan kepada populasi dimana sampel diambil. Statistik inferensial ada dua macam, yaitu: (a) statistik
.
66
parametrik, yang digunakan untuk menganalisis data interval dan rasio, yang diambil dari populasi yang berdistribusi normal; dan (b) statistik non parametrik, yang digunakan untuk menganalisis data nominal dan ordinal, yang diambil dari populasi yang bebas disribusi (tidak harus normal).Dalam hal ini, teknik korelasi dan regresi dapat berperan sebagai statistik inferensial. Mengenai macam-macam statistik, dapat diperiksa bagan berikut.
Deskriptif
Statistik
Parametrik
Inferensial Nonparametrik
Bagan 06. Macam-macam Statistik B. Data Statistik Data dalam penelitian dapat digolongkan sebagai berikut ini. 1. Data mentah, data yang belum diolah atau dianalisis 2. Data primer dan data sekunder 3. Data kuantitatif (dapat dinyatakan dalam bilangan), terdiri atas: a. data kontinum, data interval, data rasio b. data diskrit: (1) data nominal, (2) data ordinal, (3) data dikotomi 4. Data kualitatif: berupa atribut
.
67
Mengenai jenis data, disajikan pada bagan berikut. Kualitaif
Nominal
Ordinal
Macam data
Deskrit Dikotomi Kuantitatif Interval Kontinum Rasio
Gambar 07. Macam-macam Data C. Fungsi Statistika 1. Statistik Deskriptif berfungsi untuk membuat data bermakna, yang dapat disajikan dengan berbagai bentuk, seperti: a. tabel/daftar, gambar, diagram/grafik; b. ukuran tendensi sentral (mean atau rerata, median atau nilai tengah, dan modus c. ukuran dispersi (penyebaran): rentangan, simpangan (deviasi), simpangan baku, dan varians 2. Statistik Inferensial/induktif, digunakan untuk melakukan: (a) generalisasi, dari sampel ke populasi, (b) uji hipotesis (membandingkan atau uji perbedaan/kesamaan,
dan
menghubungkan,
yaitu
uji
keterkaitan,
kontribusi) 3.
Untuk memprediksi, dengan teknik: (a) regresi linier (hubungan fungsional), (b) regresi kurvilinier, kuadratik, logaritmik hiperbolik, dll),
.
68
(c) korelasi, keterkaitan, hubungan timbal balik, yaitu derajat hubungan (koefisien korelasi) dan kadar sumbangan (koefisien determinasi). D. Teknik Penyajian Data Penyajian data dapat dilakukan dengan cara-cara berikut. 1. Dengan Tabel atau Daftar, antara lain dengan: (a) daftar tunggal, (b) daftar kontingensi, (c) distribusi frekuensi a. Tabel data nominal Penyajian data nominal dapat digunakan tabel seperti contoh berikut. Tabel 08. Tingkat Pendidikan Pegawai di Kantor/Persusahaan X No Bagian
Jumlah S3
S2
S1
SM
SMA SMK SMP SD
1.
Keuangan
25
90
45
156
12
3
2.
Umum
5
6
6
8
4
1
3.
Penjualan
7
65
37
5
4.
Litbang
1
8
35
Jumlah
1
8
72
229
53
9
96
51
519
Sumber data: Bagian Personalia b. Tabel Data Ordinal Data yang bersifat ordinal dapat disajikan seperti contoh berikut. Tabel 09. Rangking Kualitas Kinerja Pegawai No. 1. 2. 3. 4. 5. 6. 7. 8. 9. 9 10 12
.
Aspek Kerja Kualitas Kinerja (%) Kondisi fisik tempat 61,90 Alat-alat kerja 61,02 Ortal 58,72 Kemampuan kerja 58,70 Peranan Korpri 58,42 Kepemimpinan 58,05 Performansi kerja 57,02 Manajemen Personalia 54,61 Produktivitas kerja 54,51 Motivasi kerja 54,02 Diklat yang diperoleh 53,16 Kebutuhan individu 53,09 Rata-rata kualitas kerja 56,935 Sumber Data: Biro Kepegawaian
69
Rangking Kinerja 1 2 3 4 5 6 7 8 9 10 11 12 -
c. Tabel Data Interval Data yang bersifat interval dapat disajikan seperti contoh berikut. Tabel 10. Tingkat Kepuasan Kerja Pegawai No
Aspek Kepuasan Kerja
Tngkat Kepuasan
1
Gaji
37,58
2
Insentif
57,18
3
Transportasi
68,60
4
Perumahan
48,12
5
Hubungan kerja
54,00
Sumber Data: Biro Kepegawaian 2. Tabel Distribusi Frekuensi Contoh: Skor Mata Kuliah Statistik dari 150 orang mahasiswa sebagai berikut. 27 79 69 40 51 88 55 48 36 61 53 44 94 51 65 42 58 55 69 63 70 48 61 55 60 25 47 78 61 54 57 76 73 62 36 67 40 51 59 68 27 46 62 43 54 83 59 13 72 57 82 45 54 52 71 53 82 69 60 35 41 65 62 75 60 42 55 34 49 45 49 64 40 61 73 44 59 46 71 86 43 69 54 31 36 51 75 44 66 53 80 71 53 56 91 60 41 29 56 57 35 54 43 39 56 27 62 44 85 61 58 89 60 51 71 53 58 26 77 68 62 57 48 69 76 52 49 45 54 41 33 61 80 57 42 45 59 44 68 73 55 70 39 59 69 51 85 46 55 67 Ada beberapa cara yang dapat digunakan untuk menyusun daftar distribusi frekuensi. Salah satu cara yang umu digunakan adalah dengan menggunakan
.
70
rumus Sturges. Langkah-langkah yang ditempuh dalam membuat distribusi frekuensi, dengan menggunakan rumus Sturges adalah sebagai berikut a. Hitung jumlah kelas interval dengan Rumus Sturges: k = 1 + 3,3 log n Jika jumlah data 150 (=n), maka k (jumlah kelas) = 1+3,3 log 150 = 8,18 dibulatkan: 9 b. Menghitung rentang data atau range ( skor tertinggi dikurangi skor terendah): 94 – 13 = 81 c. Menghitung panjang kelas = rentang dibagi jumlah kelas = 81:9 = 9 d. Menyusun interval kelas sebagai di bawah ini (bisa dimulai dari atas atau dari bawah) Tabel 11.Distribusi Frekuensi Skor Mata Kuliah Statistik Klas interval 10 – 19
X (nilai tengah 14,5
f. absolut
f. kumulatif
1
f.relatif (%) 0,65
1
f.kumulatif (%) 0,67
20 – 29
24,5
6
4,00
7
4,67
30 – 39
34,5
9
6,00
16
10,67
40 – 49
44,5
31
20,66
47
31,33
50 – 59
54,5
42
28,00
89
59,33
60 – 69
64,5
32
21,13
121
80,67
70 – 79
74,5
17
11,33
138
92,00
80 – 89
84,5
10
6,66
148
98,67
90 - 99
94,5
2
1,30
150
100,00
N = 150
100%
100%
3. Grafik Ada beberapa macam grafik, antara lain sebagai berikut. a. Grafik garis (polygon), biasanya digunakan untuk menunjukkan perkembangan suatu keadaan. Perkembangan tersebut bisa naik, bisa turun.
.
71
Contoh: f35302520151050
o.
o
o +
|
|
2001
|
o +
+
2000
+
o
o = TV + = Radio
|
|
|
|
2002 2003 2004 2005 2006
Gambar 08: Perkembangan produk elektronika
b. Grafik batang 8000 7000 6000 5000 4000 3000 2000 1000
f_ _ _ _ _ _ _ _ _
|
|
|
|
0 SMP-1 SMP-2 SMP-3 SMP-4 Gambar 09: Keadaan Siswa SMP tahun 2006/2007
4. Diagram lingkaran (Pie Chart) 10% 15%
11 55%
20%
.
72
5. Grafik Histogram dan Poligon f 60 55 50 45 40 30 25 20 15 1050
42 32 31
= polygon = histogram
17 9 6
1 |
10
|
|
14,5 24,5
|
34,5
|
44,5 54,5
|
|
|
2 |
|
64,5 74,5 84,5 94,5 104,5
|
X
Gambar 10: Histogram dan Polygon Skor Statistik 6. Grafik gambar (Pictogram) Ada kalanya data disajikan dalam bentuk gambar supaya lebih komunikatif. Misalnya, untuk menunjukkan perbandingan penjualan mobil merek Jepang, seperti Toyota, Zuzuki, Mitsubisi, dan lain-lain, ditampilkan dengan gambar-gambar mobil merek tersebut. E. Pengukuran Tendensai Sentral (kecenderungan memusat) 1. Modus (mode) Modus
adalah
skor
yang
paling
sering
muncul
(frekuensi
terbanyak/tertinggi) Untuk data pada distribusi bergolong, menghitung modus digunakan rumus berikut.
Mo b p (
b1 ) b1 b2
, dimana
Keterangan: Mo = modus b = batas kelas interval dengan frekuensi terbanyak (batas bawah) p
.
= panjang kelas (i = interval) dengan frekuensi terbanyak
73
b1
= Frekuensi pada kelas modus (frekuensi pada kelas interval yang
terbanyak) dikurangi frekuensi kelas interval terdekat sebelumnya b2 = frekuensi kelas modus dikurangi frekuensi kelas interval berikutnya Contoh: Tabel . Distribusi Frekuensi Kemampuan Manajerial 100 pegawai Kantor X Kelas interval
Batas kelas
frekuensi
F kumulatif
21 - 30
30,5
2
2
31 - 40
40,5
6
8
41 - 50
50,5
18
26
51 - 70
70,5
30
56
71 - 80
80,5
20
76
81 - 90
90,5
16
92
91 - 100
100,5
8
100
Jumlah
100
Diketahui: Kelas modus = kelas yang frekuensinya 30 b = 51-0,5 = 50,5 b1 = 30 - 18 = 12 b2 = 30 – 20 = 10
Mo b p (
b1 12 ) 50,50 10( ) 50,50 5,45 55,95 b1 b2 12 10
2. Median (Md) Median atau nilai tengah adalah nilai yang menunjukkan bahwa di bawah dan di atas nilai tersebut, masing-masing terdapat 50% nilai (data). Pada data distribusi frekuensi bergolong, median (Md) dapat dihitung dengan rumus berikut.
.
74
Md b p (
1 / 2n F ) f
, dimana
Keterangan: Md = median B = Batas bawah, dari daerah median P
= panjang kelas (interval)
N = banyak data/jumlah sampel F = f kumulatif sebelum kelas median (jumlah semua frekuensi sebelum kelas median) f = frekuensi kelas/daerah median Berdasarkan tabel di atas, mediannya adalah:
Md b p (
1 / 2n F 50 26 ) 50,5 10( ) 58,5 f 30
3. Mean (M = nilai rerata hitung ) Untuk menghitung mean atau nilai rata-rata hitung digunakan rumus berikut:
M M
X n
X
fX f
F. Pengukuran Variasi (Penyebaran/dispersi) 1. Rentang Data (range = R) Rentang data atau range adalah skor tertinggi dikurangi skor terendah.
.
75
2. Varians Varians adalah jumlah kuadrat semua deviasi nilai-nilai terhadap rata-rata kelompok dibagi jumlah data. Akar varians adalah standar deviasi (simpangan baku). Varians populasi diberi simbul σ2 dan standar deviasi σ. Sedangkan varians untuk sampel diberi simbul s2 dan standar deviasi diberi simbul s. Rumus simpangan (deviasi) = x X X Varians adalah rerata kudrat simpangan, dengan rumus:
s2
2
s
x
2
n
x
2
(n 1)
(X X )
2
untuk sampel besar atau populasi
n
(X X )
2
(n 1)
( X ) 2 n X 2 ( X ) 2 1 2 X n (n 1) n(n 1)
untuk sampel kecil 3. Standar Deviasi (simpangan baku) Standar deviasi atau simpangan baku adalah akar varians, yang dinyatakan dengan rumus berikut.
s
x
2
(n 1)
(X X ) (n 1)
2
n X 2 ( X ) 2 n(n 1)
4. Ukuran letak. Ada beberapa ukuran letak, antara lain: Kuartil, Decil, dan Persentil. Dasar perhitungannya sama dengan menghitung median. Kuartil 1 (1/4n), Kuartil 2 (2/4n = Median), dan Kuartil 3 (3/4n) Decil (1/10n, 2/10n, 3/10n ...9/10n) Persentil (1/100n, 2/100n ...99/100n)
.
76
5. Skor Baku (standar) Ada beberapa skor baku atau skor standar, namun yang sering digunakan dalam pendidikan, antara lain Skor Z dan Skor T.
Skor Z =
XX SD
Skor T = 50 + 10Z = 50+10(
XX ) SD
6. Kurve Normal dan Skor Standar (Skor Baku)
34%
34% 68%
13,5%
13,5% 2,15%
95%
0,13%
99,7% |
SD
2,15% 0,13%
|
-3SD -2SD
| -1SD
| 0
|
|
|
+1SD +2SD +3SD
MEAN Z SCORES
-3
-2
-1
0
+1
+2
+3
T-SCORES
20
30
40
50
60
70
80
IQ SCORES
55
70
85
100
115
130
145
GRE SCORES
200
300
400
500
600
700
800
7. Menghitung Rata-rata Ideal dan Standar Deviasi Ideal Berdasarkan kurve normal di atas, dapat dihitung rata-rata hitung ideal dan standar deviasi ideal. Rata-rata hitung ideal atau harapan adalah setengah dari skor maksimal ideal ditambah dengan skor minimal ideal. Standar deviasinya adalah seperenam dari skor maksimal ideal dikurangi skor minimal ideal. Contoh perhitungannya adalah sebagai berikut. Jika 30 butir skala sikap yang skalanya dari 1 sampai dengan 5, maka skor maksimal idealnya adalah 30 x 5 = 150; sedangkan skor minimal idealnya adalah 30 x 1 = 30. Rata-rata hitung
.
77
idealnya = ½ x (150 + 30) = 90. Sedangkan standar deviasinya (SD) = 1/6 x (150 – 30) = 20. Berdasarkan rata-rata ideal dan standar deviasi ideal, dapat dibuat skala penilaian sebagai berikut. Skala Penilaian atau Kategori/ Klasifikasi pada Skala Lima Rentang Skor
Klasifikasi/Predikat
M + 1,5 SD M + 3,0 SD
Sangat Baik
M + 0,5 SD M + 1,5 SD
Baik
M – 0,5 SD M + 0,5 SD
Cukup
M – 1,5 SD M – 0,5 SD
Tidak Baik
M – 3,0 SD M – 1,5 SD
Sangat Tidak Baik
8. Kurve Juling positif f
+ 0
X Mo, Md, M, dimana Mo < Md < M
Gambar ini menunjukkan bahwa sebagian besar skor cenderung rendah 9. Kurve Juling Negatif f
_ 0
X M, Md, Mo, dimana Mo > Md >M
.
78
Gambar ini menunjukkan bahwa sebagian besar skor cenderung tinggi. G. Teknik Korelasi Product Moment (Pearson) .Rumus korelasi produk moment Korelasi : rxy = rxy
N XY X Y
N X
2
X N Y 2 Y 2
2
Contoh perhitungan: Misalnya, korelasi antara kebiasaan belajar dengan hasil belajar statistik adalah seperti tabel 13 berikut. Tabel 13. Skor Hasil Belajar Statistik Mahasiswa X (N=25) Responden X Y X2 Y2 1 75 85 5625 7225 2 80 90 6400 8100 3 65 75 4225 5625 4 70 75 4900 5625 5 75 75 5625 5625 6 80 90 6400 8100 7 65 70 4225 4900 8 80 85 6400 7225 9 90 95 8100 9025 10 75 70 5625 4900 11 60 65 3600 4225 12 70 75 4900 5625 13 75 85 5625 7225 14 70 65 4900 4225 15 80 95 6400 9025 16 65 65 4225 4225 17 75 80 5625 6400 18 70 80 4900 6400 19 80 90 6400 8100 20 65 60 4225 3600 21 75 75 5625 5625 22 80 85 6400 7225 23 70 80 4900 6400 24 90 95 8100 9025 25 70 75 4900 5625 Jumlah (∑) 1850 1980 138250 159300
Korelasi : rxy = rxy
.
N XY X Y
N X
2
X N Y 2 Y 2
79
2
XY 6375 7200 4875 5250 5625 7200 4550 6800 8550 5250 3900 5250 6375 4550 6800 4225 6000 5600 7200 3900 5625 6800 5600 8550 5250 148100
=
25 * 148100 1850 * 1980
25 *138250 1850 25 *159300 1980 2
2
= 0,863 Koefisien korelasi 0,863 dikonsultasikan dengan tabel nilai-nilai r (korelasi Product Moment) dengan derajat kebebasan 25. Harga nilai r pada taraf signifikansi 5 % = 0,396. Dengan demikian, nilai r hitung lebih besar dari nilai r tabel pada taraf signifikansi 5%. Ini berarti terdapat korelasi yang signifikan antara skor kebiasaan belajar dengan skor hasil belajar statistik.
.
80
BAB VI PENILAIAN ACUAN KRITERIA DAN PENILAIAN ACUAN NORMA A. Pendekatan Penilaian Acuan Kriteria (PAP) Pendekatan ini digunakan apabila tujuan pembelajaran menuntut kompetensi atau penguasaan tertentu. Misalnya, seseorang dinyatakan telah memiliki kompetensi tertentu jika telah menguasai materi pelajaran minimal 65%. Penetapan besaran persentase kompetensi minimal ini bergantung pada patokan yang telah ditentukan atau disepakati. Dalam bidang pendidikan, khususnya pada bidang pengetahuan dan keterampilan tertentu digunakan pedoman PAP sebagai berikut. Tabel 14. PAP dengan Skala 5 (lima) Presentase Penguasaan 90 – 100 80 – 89 *65 – 79 55 – 64 0 – 54
Nilai Angka 4 3 2 1
Nilai Huruf A B C D
0
E
*Dinyatakan lulus, jika minimal memiliki penguasaan 65%
Predikat Sangat Baik Baik Cukup Kurang Sangat Kurang
Tabel 15. PAP dengan Skala 11 (sebelas) Presentase Penguasaan
Nilai Angka
Nilai Huruf
95 – 100
10
A
Istimewa
85 – 94
9
B
Sangat Baik
75 – 84
8
C
Baik
*65 – 74
7
D
Lebih dari cukup
*55 – 64
6
E
Cukup
45 – 54
5
F
Hampir Cukup
35 – 44
4
G
Kurang
25 – 34
3
H
Sangat kurang
15 – 24
2
I
Buruk
5 – 14
1
J
Sangat Buruk
0–4
Predikat
Sangat Buruk Sekali * Dinyatakan lulus, jika minimal memiliki penguasaan 55%; idealnya 65%.
.
0
K
81
B. Pendekatan Penilaian Acuan Norma (PAN) Pendekatan Penilaian Acuan Norma digunakan apabila materi pelajaran tidak menuntut persentase penguasaan tertentu dan untuk menentukan kedudukan seorang peserta didik dalam kelompoknya, sehingga sering disebut “Pendekatan Acuan Kelompok". Misalnya, si A menduduki ranking satu di kelasnya, hal ini menunjukkan bahwa si A adalah orang yang paling pintar di kelas (kelompok) tersebut. Apabila si A kemudian dimasukkan ke kelompok kelas lain belum tentu ia mendapat ranking satu. Hal itu bergantung pada kondisi atau kemampuan peserta didik di kelas yang dimasukinya. Ada beberapa cara untuk menentukan kedudukan peserta didik dengan pendekatan PAN, yaitu (1) dengan Simple Rank (SR.), (2) Percentile Rangk (PR), (3) Statistic Mean (M) dan Standar Deviasi (SD), (4) skor Z, dan (5) Skor T (Tscore). Cara SR dilakukan dangan mengurut skor testee dari skor tertinggi sampai skor terendah, dengan catatan apabila ada dua atau lebih testee yang memperoleh skor sama, mereka harus mendapat nilai atau ranking yang sama pula. Cara Percentile Rank (PR) ini merupakan cara menentukan kedudukan testee dalam kelompok dengan skala 100. Misalnya, si A menduduki PR 85, berarti ia mengatasi 85% teman di kelasnya atau sekitar 85% temannya menduduki ranking di bawah si A. Percentile Rank diperoleh dengan rumus berikut. Rumus: PR
N SR x100 N
Keterangan: N= banyaknya testee dalam kelompok Misalnya si A dalam kelas menduduki SR -1 dan 10 orang temannya di kelas tersebut, Percentile Rank si A adalah sebagai berikut. PR
10 1 x100 90 10
Selanjutnya, dengan menggunakan Mean (M) dan Standar Deviasi (SD), kedudukan atau keberhasilan belajar peserta didik dapat ditentukan dengan cara berikut ini.
.
82
Tabel 16. Pedoman Konversi PAN dengan skala 3 (tiga) M +1 SD M + 3 SD
Kelompok atas
M - 1 SD M + I SD
Kelompok tengah
M - 3 SD M - 1 SD
Kelompok bawah
Tabel 17. Pedoman Konversi PAN dengan skala 5 (lima) Rentangan Skor
Nilai Angka/Huruf
Predikat
M +1,5 SD M + 3,0 SD
4=A
Sangat Baik
M + 0,5 SD M + 1,5 SD
3=B
Baik
M – 0,5 SD M + 0,5 SD
2=C
Cukup
M - 1,5 SD M - 0,5 SD
1=D
Kurang
M – 3,0 SD M - 1,5 SD
0=E
Sangat Kurang
Tabel 18. Pedoman Konversi PAN dengan skala 9 (sembilan)
.
Rentangan Skor
Nilai Angka/Huruf
M +1,75 SD M + 3,00 SD
9
M + 1,25 SD M + 1,75 SD
8
M + 0,75 SD M + 1,25 SD
7
M + 0,25 SD M + 0,75 SD
6
M – 0,25 SD M + 0,25 SD
5
M – 0,75 SD M - 0,25 SD
4
M – 1,25 SD M - 0,75 SD
3
M – 1,75 SD M – 1,25 SD
2
M – 3,00 SD M – 1,75 SD
1
83
Tabel 19. Pedoman Konversi PAN dengan skala 11 (sebelas) Rentangan Skor
Nilai Angka/Huruf
M +2,25 SD M + 3,00 SD
10
M +1,75 SD M + 2,20 SD
9
M + 1,25 SD M + 1,75 SD
8
M + 0,75 SD M + 1,25 SD
7
M + 0,25 SD M + 0,75 SD
6
M – 0,25 SD M + 0,25 SD
5
M – 0,75 SD M - 0,25 SD
4
M – 1,25 SD M - 0,75 SD
3
M – 1,75 SD M – 1,25 SD
2
M – 2,25 SD M – 1,75 SD
1
M – 3,00 SD M – 2,25 SD
0
C. Skor Baku (Standar) 1. Skor Z (z-score) Rumus z-score : 2. T-score (skor-T)
.
z
X M SD
X M T = 50 + 10Z atau T = 50+ l0 SD
84
BAB VII ANALISIS KUALITAS INSTRUMEN Kualitas alat ukur hasil belajar pada ranah kognitif, ditentukan oleh beberapa faktor, antara lain: (1) validitas butir tes, (2) reliabilitas tes, (3) taraf kesulitas butir tes, dan (4) daya pembeda tes. Untuk tes bentuk obyektif, perlu juga dianalisis efektivitas pengecohnya . A. Validitas Alat Ukur Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas
konstruksi (construct validity), (3) validitas ramalan (predictive
validity), dan (4) validitas kesamaan (concurrent validity). 1. Validitas Isi (Content Validity) Suatu tes dikatakan valid dari segi isinya apabila mengukur tujuan khusus tertentu yang sejajar dengan sisi atau materi pelajaran yang diberikan. Oleh karena isi pelajaran ini terdapat kurikulum, sering juga disebut validitas “kurikuler”. Validitas isi dapat dilihat dari kisi-kisi atau spesifikasi instrumen (alat ukur), yaitu dengan cara mengkaji
butir-butir instrumen tersebut, apakah telah mewakili
materi secara keseluruhan atau belum representatif. Cara lain untuk menguji validitas isi instrumen adalah melalui penilaian pakar (judges) atau panel para pakar dalam bidangnya. 2. Validitas Konstruksi (Construct Validity) Validitas konstruksi adalah validitas yang berkenaan dengan kesanggupan alat ukur tersebut untuk mengukur pengertian-pengertian yang terkandung dalam materi yang diukurnya.
Suatu
alat
ukur
dikatakan
valid
dari
segi
konstruksinya apabila butir-butir alat ukur tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Pembelajaran atau Sasaran Belajar. 3. Validitas ada Sekarang (Concurrent Validity) Suatu tes dikatakan memiliki validitas concurrent atau validitas empiris apabila hasil pengukuran sesuai dengan pengalaman yang ada pada saat ini. Pengalaman itu selalu mengenai hal yang telah terjadi sehingga data tersebut sekarang telah ada (konkuren = ada sekarang)
.
85
4. Validitas Ramalan (predictive validity) Validitas ramalan adalah validitas alat ukur yang berkenaan dengan kemampuan alat ukur tersebut untuk meramalkan suatu ciri atau perilaku tertentu. Suatu alat ukur dikatakan memiliki validitas prediktif
apabila alat ukurs tersebut
mempunyai kemampuan untuk meramalkan (memprediksi) apa yang akan terjadi di masa yang akan datang. Keempat jenis validitas tersebut dapat digambarkan sebagai berikut.
Validitas
Validitas Logikal (Teoretik)
Validitas Empiris
Validitas IsiIsi Validitas
Validitas ValiditasKonkuren Konkuren
Validitas Konstruksi Validitas Konstruksi
Validitas ValiditasRamalan Prediksi
Gambar 11. Penggolongan Validitas Alat Ukur B. Cara Menghitung Validitas Berikut akan diuraikan mengenai cara menghitung validitas empiris (Validitas butir tes). Jika datanya berbentuk polytomi, sebaiknya menggunakan korelasi Product Moment dengan rumus:
rxy
N XY X Y
N X
2
X
2
N Y
2
Y
2
Keterangan: rxy = korelasi antara skor butir dengan skor total Berikut ini diberikan contoh untuk menghitung validitas butir dengan rumus tersebut di atas.
.
86
Tabel 20. Skor Skala Sikap terhadap Mata Kuliah Statistik
Responden
Nomor Butir s
Total
1
2
3
4
5
6
7
8
9
10
A
3
5
4
3
4
5
3
4
5
4
40
B
4
5
5
3
5
4
4
5
5
4
44
C
2
3
4
2
3
4
4
3
4
4
33
D
1
3
4
3
3
3
3
3
3
3
29
E
3
4
5
3
4
3
3
4
3
4
36
F
1
2
3
2
1
2
1
2
3
2
19
G
3
3
4
2
1
3
2
2
3
3
26
Misalnya, cara untuk menghitung validitas butir alat ukur nomor 1, digunakan rumus product moment. Berdasarkan rumus tersebut, setelah dihitung dengan kalkulator diperoleh harga rxy = 0,769. Sedangkan rxy tabel pada taraf signifikansi 5% adalah 0,754. Ternyata harga rxy hitung lebih besar daripada harga rxy tabel. Oleh karena itu dapat diinterpretasikan bahwa butir tes nomor 1 adalah valid. Tabel 21. Cara Menghitung Korelasi Skor Butir 6 dengan Skor Total
rxy
.
X
Y
XY
X2
Y2
5
40
200
25
1600
4
44
176
16
1936
4
33
132
16
1089
3
29
87
9
841
3
36
108
9
1296
2
19
38
4
361
3
26
78
9
676
24
227
819
88
7799
N XY X Y
N X
2
X
2
N Y
2
Y
2
87
7 x819 24 x 227
rxy
7 x88 24 7 x88 227 2
2
0,814
Apabila banyaknya butir tes yang diuji kurang dari 30 butir, dalam menghitung validitas butir tes sebaiknya harga rxy dikoreksi dengan rumus rpq sebagai berikut ini.
rpq
SD
r SD SD : SD 2r SD SD pq
y
2
y
x
2
x
tp
x
y
Keterangan : rpq
: koefisien korelasi setelah dikoreksi
rxy
: rtp = koefisien korelasi sebelum dikoreksi
SDx
: SD dari variabel X
SDy
: SD dari variabel Y
Suatu butir tes dinyatakan valid jika rxy hitung lebih besar daripada rxy tabel dengan taraf signifikansi atau taraf kekeliruan 5% (rxy-hit > rxy-tab dengan t.s 5%). Untuk data yang berbentuk dikotomi, sebaiknya menggunakan teknik korelasi Point Biserial, dengan rumus sebagai berikut: rpbi
M p Mt st
p , dimana: q
rpbi = koefisien korelasi point biserial Mp = rerata skor dari subjek yang menjawab betul bagi butir yang dicari Validitasnya Mt = rerata skor total st = standar deviasi dari skor total p
= proporsi peserta didik yang menjawab betul (banyaknya peserta
didik yang menjawab betul dibagi dengan jumlah seluruh peserta didik ) q = proporsi peserta didik yang menjawab salah (q = 1 – p)
.
88
Tabel 22. Cara menghitung Validitas Butir Instrumen Dengan Korelasi Point Biserial Nomor Butir s
Responden
1
2
3
4
5
6
7
8
9
10
A
1
0
1
0
1
1
1
1
1
1
8
B
0
0
1
0
1
0
0
1
1
1
5
C
0
1
0
0
0
1
0
1
0
1
4
D
1
1
0
0
1
1
0
0
1
0
5
E
1
1
1
1
1
1
0
0
0
0
6
F
1
0
1
0
1
0
1
0
0
0
4
G
1
1
1
1
1
1
1
0
0
0
7
H
0
1
0
1
1
1
1
1
1
1
8
p
0,625 0,625 0,625 0,375 0,875 0,75 0,50 0,50 0,50 0,50
q
0,375 0,375 0,375 0,625 0,125 0,25 0,50 0,50 0,50 0,50
Misalnya akan diuji validitas butir soal nomor 6, maka perhitungannya sebagai berikut. 1) mencari Mp = (8+4+5+6+7+8) : 6 = 38:6 = 6,33 2) mencari Mt = (8+5+4+6+4+7+8) = 47:8 = 5,875 3) harga standar deviasi dapat dihitung dengan kalkulator atau dengan rumus
n X 2 X
2
berikut: st =
n(n 1)
=
(8 x 295) (47) 2 1,642 8(8 1)
4) menentukan harga p, yaitu 6:8 = 0,75 5) menentukan harga q , yaitu 2:8 =0,25 6) memasukkan ke dalam rumus: rpbi
.
Skor total
M p Mt st
p q
=
6,33 5,875 0,75 = 0,4799 = 0,480. 1,642 0,25
89
Perhitungan validitas dengan korelasi produk moment dan korelasi point biserial, hampir sama
hasilnya. Namun demikian, jika datanya berbentuk dikotomi,
sebaiknya menggunakan teknik korelasi point biserial. C. Reliabilitas Instrumen (Keajegan, Keterandalan) Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya, kapanpun alat ukur itu digunakan akan menghasilkan hasil ukur yang relative tetap. Ada beberapa jenis reliabilitas, yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen. 1. Reliabilitas Konsistensi Internal Reliabilitas konsistensi internal alat ukur dapat
dihitung dengan
menggunakan rumus Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21), dan Teknik Belah Dua. Sedangkan reliabilitas stabilitas atau test-retest dapat dihitung dengan menggunakan teknik korelasi
product moment.
Selanjutnya, reliabilitas ekuivalen atau tes setara/sejajar dapat dihitung dengan menggunakan teknik korelasi product moment. Faktor-faktor yang mempengaruhi tingkat reliabilitas, antara lain sebagai berikuti ini. a. Panjang tes (banyak sedikitnya butir tes); semakin panjang tes, semakin tinggi reliabilitasnya. Cara meningkatkan reliabilitas dengan penambahan butir tes, sebagai berikut.
rnn r
n.r 1 n 1r
= koefisien reliabilitas
rnn = koefisien relibilitas setelah butir tes ditambahkan n = ratio penambahan butir : “jumlah butir akhir dibagi jumlah butir semula Misalnya koefisien reliabilitas semula r = 0,70 Jumlah butir awal
= 40
Jumlah butir akhir
= 60
N = 60 : 40 = 1,5, kemudian masukkan harga r dan n ke dalam rumu rnn tersebut di atas.
rnn
.
n.r 1,5 x0,70 1,05 0,78 1 n 1r 1 1,5 10,70 1,35
90
Ini berarti dengan menambah 20 butir tes dari jumlah butir tes semua 40 butir, ternyata mampu meningkatkan koefisien reliabilitas dari 0,70 menjadi 0,78 atau naik sekitar 0,08. b. Karakteristik Testee Tes yang dicobakan kepada kelompok yang diambil secara acak (random), akan menunjukkan reliabilitas lebih besar daripada yang dicobakan pada kelompok nonrandom. c. Proses pelaksanaan tes (pengadministrasian tes), seperti:(1) Kejelasan petunjuk mengerjakan tes, (2) Ketertiban pengawas tes, dan (3) Suasana lingkungan dan tempat diselenggarakannya tes Aplikasi Rumus KR-20 Untuk menghitung reliabilitas konsistensi internal yang datanya bersifat dikotomi, digunakan rumus Kuder Richadson 20 (KR-20). KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi, seperti contoh berikut. Rumus:
r1.1 kk1 SDtSD 2 pq 2
t
Keterangan : r1.1 p q n SD2t pq k
= = = = = = =
koefisien reliabilitas tes proporsi testee yang menjawab betul proporsi testee yang menjawab salah banyaknya testee varian total tes pxq banyak butir tes
Jika taraf kesulitan butir tes homogen, digunakan KR – 21, dengan rumus sebagai berikut.
Rumus:
k M k M r1.1 1 2 k 1 k .SDt
Keterangan:
.
r1.1
= reliabilitas tes
M
= rata-rata hitung
k
= banyak butir
91
SD2t = varian total tes
Tabel 23. Cara Menghitung Reliabilitas dengan KR-20 Butir
1
Subjek
2
3
4
5
6
7
Total
8
X
(X)2
1
1
1
1
1
1
1
1
0
7
49
2
1
0
1
0
1
0
1
1
5
25
3
1
0
1
0
0
0
1
0
3
9
4
1
1
1
1
1
1
1
1
8
64
5
1
0
1
0
1
1
1
0
5
25
6
0
0
0
0
0
0
0
1
1
1
7
1
0
0
0
0
0
0
0
1
1
8
0
1
1
0
0
0
0
1
3
9
9
1
1
0
0
0
0
0
1
3
9
10
1
1
0
0
0
0
0
1
3
9
p
0,8
0,5
0,7
0,3
0,4
0,3
0,5
0,5
39
201
q
0,2
0,5
0,3
0,7
0,6
0,7
0,5
0,5
-
-
pq
0,16
0,25
0,21
0,21
0,24
0,21
0,25
0,25
1,78
∑pq
n X 2 X
2
SD =
n(n 1)
=
10 x 201 392 10(10 1)
2,33
SD2 = (2,33)2 = 5,43
r1.1 kk1 SDtSD 2 pq 2
t
r1.1 10101 5, 435,431, 78 = 0,747 = 0,75
Aplikasi Rumus Koefisien Alpha-Cronbach Jika datanya berbentuk politomi, digunakan rumus Alpha-Cronbach, seperti contoh berikut ini.
.
92
Rumus:
Keterangan : r1.1 k
= = 2 SDi =
2 2 k SDt SDi r1.1 2 SDt k 1
koefisien reliabilitas perangkat tes banyak butir tes varians skor tiap butir (item)
2 = varian skor total SDtot
Tabel 24. Menghitung Reliabilitas dengan Koefisien Alpha-Cronbach BTR SUBJ
1
2
3
4
5
Skor X
Skor X2
1
6
6
7
2
7
28
784
2
4
0
5
4
2
15
225
3
6
7
5
6
4
28
784
4
4
4
2
4
7
21
441
5
3
2
0
4
4
13
169
6
6
7
2
5
2
22
484
7
6
3
7
3
7
26
676
8
8
4
5
5
3
25
625
9
7
6
6
9
5
33
1089
10
5
4
7
8
6
30
900
Total
55
43
46
50
47
241
6177
∑X2
323
231
266
292
257
SD
1,43
2,15
2,33
2,05
1,9
SD2
2,05
4,62
4,43
4,2
3,61
(∑X)
(∑X2) 18,91
Diketahui : k = 5 2 ∑ SDi = 18,91(diperoleh dari jumlah SD2 tiap butir tes) 2 SDtot
= 40,99 (diperoleh dari perhitungan berikut):
n X 2 X
2
SDt =
.
n(n 1)
=
10 x6177 2412 10(10 1)
93
6,40. SDt2 = 40,99
2 2 k SDt SDi r1.1 2 SDt k 1
5 40,99 18,91 0,67 5 1 40 , 99 Berdasarkan perhitungan di atas, dengan memasukkan ke rumus koefisien Alpha-Cronbach, diperoleh reliabilitas r1.1 = 0,67 Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria yang dikemukakan oleh Guilford (1951) sebagai berikut. 0,20 0,40 0,60 0,80
≤ 0,20 ≤ 0,40 ≤ 0,60 ≤ 0,80 ≤ 1,00
: sangat rendah : rendah : sedang : tinggi : sangat tinggi
2. Reliabilitas Stabilitas atau Test-Retest Reliabilitas stabilitas dapat dihitung dengan menggunakan (1) metode tes paralel (setara) yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan tetapi butir-butir soal berbeda, (2) metode tes ulang (test-retest) yaitu seperangkat tes diberikan dua kali kepada testee yang sama pada waktu hampir bersamaan, kemudian hasilnya dikorelasikan, dan (3) metode belah dua (split-half method) atau genap-ganjil, yaitu dengan cara mengkorelasikan skor butir tes bernomor ganjil dengan butir tes bernomor genap. Untuk ini dianjurkan menggunakan rumus formula Flanagan sebagai berikut. Rumus :
SD 2 SD 2 r1.1 21 1 2 2 SDtot
Keterangan rumus: SD12 = varian skor butir tes ganjil
SD22 = varian skor butir tes genap SDtet2 = varian skor butir tes ganjil dan genap
.
94
Antara skor butir tes belahan awal dan belahan akhir. Untuk ini dianjurkan menggunakan rumus formula Rulon sebagai berikut.
r1.1 1
SDd2 2 SDtot
Keterangan rumus : d: perbedaan (selisih) antara skor belahan awal dan belahan akhir SDd2 :
varian beda
2 : SDtot
varian total
Hasil korelasi tersebut merupakan reliabilitas separuh tes. Oleh karenanya, untuk koefisien reliabilitas seluruh tes digunakan rumus Spearman-Brown berikut.
r1.1
2.r 12 . 12 1 r 12 . 12
Keterangan : r1.1
: koefisien reliabilitas seluruh butir tes
r 12 . 12
: koefisien korelasi antara skor setiap belahan
3. Reliabilitas Equivalen atau Tes Sejajar Untuk mencari reliabilitas equivalen, digunakan rumus korelasi Product Moment, yaitu mengkorelasikan skor butir pertama (X) dengan skor butir tes ke dua (Y). Kedua tes tersebut harus setara atau sejajar. Rumus korelasi Product Moment yang digunakan adalah sebagai berikut.
rxy
N XY X Y
N X
2
X
2
N Y
2
Y
2
rxy = korelasi antara skor tes pertama dengan skor tes ke dua.
D. Taraf Kesukaran Tes Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk menjawab soal tersebut; artinya, tes tersebut akan lebih banyak dapat dijawab benar oleh peserta didik yang pandai dan lebih banyak
.
95
dijawab salah oleh peserta didik yang bodoh. Taraf kesukaran tes yang baik adalah antara 20% - 80% atau antara 30% - 70%. Cara Menghitung Tingkat Kesukaran Tes (P) Tingkat kesukaran butir tes merupakan bilangan yang menunjukkan proporsi peserta ujian (testee) yang dapat menjawab betul butir soal tersebut. Sedangkan tingkat kesukaran perangkat tes adalah bilangan yang menunjukkan rata-rata proporsi testee yang dapat menjawab seluruh (perangkat) tes tersebut.
Rumus : Pp
P n
Keterangan : Pp
= tingkat kesukaran perangkat tes
P
= tingkat kesukaran tiap butir
N
= banyaknya butir tes
Tingkat kesukaran tiap butir, dihitung dengan Rumus : P
nB n
Keterangan : P
= tingkat kesukaran butir tes
nB
= banyaknya subyek yang menjawab soal dengan betul
n
= jumlah subyek (testee) seluruhnya
Kriteria tingkat kesukaran (P) : 0,00 – 0,29 = sukar 0,30 – 0,70 = sedang* 0,71 – 1,00 = mudah Tes yang baik adalah tes yang memiliki taraf kesukaran antara 0,25 – 0,75 (Fernandes, 1984). E. Daya Pembeda Tes Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik yang pandai dan bodoh; artinya, jika tes tersebut diberikan kepada anak yang tergolong pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada peserta didik yang tergolong bodoh akan lebih
.
96
banyak dijawab salah. Daya pembeda tes yang baik adalah antara 20% - 80% atau antara 30% - 70%. Rumus untuk menghitung tingkat daya beda tes adalah sebagai berikut Dp
P
A
PB
n
Dp = Daya beda tes n
= jumlah butir tes
Rumus untuk menghitung daya beda butir tes adalah sebagai berikut :
DB
nB A nBB atau D = PA- PB nA nB
Keterangan: nBA = jumlah subyek yang menjawab betul pada kelompok atas nBB = jumlah subyek yang menjawab betul pada kelompok bawah nA
= jumlah subyek kelompok atas
nB
= jumlah subyek kelompok bawah
Kritteria Daya Beda (D) : 0,00 – 0,19 = kurang baik 0,20 – 0,39 = cukup baik 0,40 – 0,70 = baik 0,71 – 1,00 = sangat baik * Jika “D” negative, soal tersebut sangat buruk dan harus dibuang. Tes yang baik, apabila memiliki D antara 0,15 – 0,20 atau lebih (Fernandes, 1984) F. Analisis Pengecoh Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik ; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit pengecoh tersebut dipilih oleh 2% atau 3% dari peserta tes. Pengecoh yang baik (efektif) ialah pengecoh yang dipilih oleh minimal 2-3% dari pengikut tes. Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes objektif yang memiliki 4 option a,b,c, dan d.
.
97
Pilihan
A*
B
C
D
*kunci
Kelompok atas
5
4
0
1
10
Kelompok bawah
3
3
0
4
10
Jumlah
8
7
0
5
20
Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (a). Pilihan jawaban b, c, dan d sebagai pengecoh. Pada umumnya sebuah pengecoh yang baik dapat mengundang jawaban lebih besar jumlahnya pada peserta didik kelompok lemah, dan lebih sedikit pada kelompok pandai. Pilihan jawaban b, sebagai pengecoh tidak efektif, sebab mcnarik jawaban lebih banyak dari kelompok peserta didik pandai. Kejadian itu disebabkan karena distractor (b) membingungkan. Pilihan jawabao c sama sekali tidak efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang telah memenuhi fungsinya., sebab dapat mengundang jawaban oleh peserta didik pandai yang lebih sedikit.
.
98
kelompok
DAFTAR PUSTAKA Angelo, Thomas A. and K. Patricia Cross. 1993.Classroom Assessment Techniques. A Handbook for College Teachers. San Francisco: Jossey-Bass Publishers. Anastasi, Anne and Susana Urbina. 1997. Psychologicsl Testing. Upper Saddle River, NJ: Prentice-Hall International Company, Inc. Anrderson, T.W. 1958. An Introductin to Multivariate Statistical Analysis. New York: John Wiley & Sons, Inc. Azra, Azyumardi. 2002. Paradigma Baru Pendidikan Nasional. Rekonstruksi dan Demokrasi. Jakarta: Penerbit Buku Kompas. Caldwell, B.J. 1988. Self Managing School and Improved Learning Outcomes. Canberra: Department of Employment, Education, Training and Yout Affairs. Cronbach, Lee J. 1990. Essentials of Psychological Testing. New York: Harper and Row Publishers. Ching Chun Lie. Path Analysis – a primer. California: Pacific Grove, 1975. Dantes, Nyoman. 2003. Kurikulum Berbasis Kompetensi: Harapan untuk Peningkatan Mutu Pendidikan. Jurnal Pendidikan dan Pengajaran. Edisi Khusus, Desember 2003. Singaraja: IKIP Negeri Singaraja. Dantes, Nyoman. 2003. Paradigma dan Orientasi Pendidikan Nasional dalam Bingkai Otonomi Pendidikan (Dalam Implikasi pada Model Evaluasi Pembelajaran). Jurnal IKA. Vol. 1, No. 2, Nopember 2003. Singaraja: Ikatan Keluarga Alumni IKIP Negeri Singaraja. De Fina, A.A. 1992. Portfolios Assessment. Getting Started. New York: Schoolastic Professional Book. Direktorat Pendidikan Lanjutan Pertama. 2002. Manajemen Peningkatan Mutu Berbasis Sekolah. Jakarta: Direktorat Pendidikan Lanjutan Pertama. Direktorat Pendidikan Lanjutan Pertama. 2002. Pendekatan Kontekstual (Contextual Teaching and Learning/CTL). Jakarta: Direktorat Pendidikan Lanjutan Pertama Ebel, Robert L. 1990. Essential of Psychological Testing. New York: Harper and Row Publishers. Edwards, Allen L. 1957. Techniques of Attitude Scale Constructions. New York: Appleton-Century-Crofts, Inc. Everit, Brian S & Graham Dunn. 1991. Applied Multivariate Data Analysis. New York: Halsted Press. Fattah, Nanang. 2004. Landasan Manajemen Pendidikan. Bandung: PT. Remaja Rosdakarya. Fogarty, Robin (ed.). 1996. Student Portoflios. A Collection of Articles. Australia: Hawker Brownlow Education. IRI/Skylight Publishing Inc.
.
99
Gronlund, Norman E. and Robert R. Linn. 1982. Measurement and Evaluation in Teaching. New York: MacMillan Publishing Company, Gronlund, Norman E. Constructing Achievement Test. Englewood Cliffs, NJ: Prentice-Hall, Inc. Gregory, Robert J. 2000. Psychological Testing: History, Principles, and Applications. Boston: Allyn and Bacon. Guilford, J.P. and Fruchter, B. 1978. Fundamental Statistics in Psycholoy and Education. New York: McGraw-Hill Ltd, Hair, Joseph F. Jr. cs. Multivariate Data Analysis. 1998.Upper Saddle River, NJ: Prentice Hall International Inc. Hopkins, Kenneth D. and Julian C. Stanley. 1981. Educational and Psychological Measurement and Evaluation. Englewood Cliffs, NJ: Prentice-Hall, Inc. Imam Ghazali. 2001. Applied Analisis Multivariat dengan Program SPSS. Semarang: Badan Penerbit Universitas Diponegoro. Kerlinger, F.N. and Pedhazur, E.J. 1973.Multiple Regression in Behavioral Research. New York: Holt Rinehart and Winston, Inc. Nana Sudjana. 1999. Penilaian Hasil Proses Pembelajaran. Bandung: PT. Remaja Rosdakarya. Nitko, Anthony J. 1996. Educational Assessment of Students. Englewood Cliffs, New Jersey: Prentice-Hall, Inc. Nunnaly, Jum C. 1967. Psychometric Theory. New York: McGraw Hill Book Company. Popham, W. James. 1993. Educational Evaluation. Boston: Allyn and Bacon. Salvia, John and James E. Ysseldyke. 1995. Assessment. New Jersey: Houghton Mifflin Company. Thorndike, Robert M, et al. 1991.Measurement and Evaluation in Psychology and Education. New York: MacMillan Publishing Company. Wiersma, William and Stephen G. Jurs. 1990.Educational Measurement and Testing. Boston: Allyn and Bacon. Marhaeni, A.A. Istri N. 2004. Portofolio Sebagai Pendekatan Asesmen dalam Pembelajaran. Jurnal Pendidikan dan Pengajaran. No. 1 TH. XXXVII Januari 2004. Singaraja: IKIP Negeri Singaraja. Mulyasa, E. 2002. Manajemen Berbasis Sekolah. Konsep, Strategi, dan Implementasi. Bandung: PT. Remaja Rosdakarya. Mulyasa, E. 2002. Kurikulum Berbasis Kompetensi. Konsep, Karakteristik, dan Implementasi. Bandung: PT. Remaja Rosdakarya. O’Malley, J.M. & Valdez Pierce. 1996. Authentic Assessment for English Language Learners. New York: Addison-Wesley Publishing Company. Slamet PH. 2000. Manajemen Berbasis Sekolah. Jurnal Pendidikan dan Kebudayaan Nomor 27, Tahun ke 6. Jakarta: Balitbang Depdiknas.
.
100
Singgih Santoso. 2002. SPSS Statistik Multivariat. Jakarta: Elex Media Komputindo. Sutrisno Hadi. 1986.Statistik, Jilid 1, 2, 3. Yogyakarta: UGM. Sutrisno Hadi. 1986. Analisis Regresi. Yoyakarta: UGM. Sudjana. 1992.Metoda Statistika. Bandung: Tarsito. Sudjana. 1992.Teknik Analisis Regresi dan Korelasi bagi Para Peneliti. Penerbit “Tarsito”, Bandung. Sugiyono. 2002. Statistika untuk Penelitian. Bandung: Penerbit CV Alfabeta. Undang-undang Republik Indonesia Nomor 20 Tahun 2003 Tentang Sistem Pendidikan Nasional. Jakarta: BP. Panca Usaha. UNESCO Sub-Regional Training Workshop. 2001. Decentralizing Basic Education for Quality Improvement Toward School Based Management and Community Participation. (Bandung, 10-12 October 2001). Wallace, R. 1991. The Reflective Approach to Professional Teaching Development. Sydney: McMillan. Wyaatt III, R. L. & S. Looper. 1999. So You Have to Have A Portofolio, a Teacher’s Guide to Preparation and Presentation. California: Corwin Press Inc.
.
101