BAB
I
PENDAHULUAN
A. Latar Belakang Undang-Undang Nomor 20 Tahun 2003 Tentang Sistem Pendidikan Nasional (UUSPN) menegaskan bahwa evaluasi pendidikan adalah kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan. Selanjutnya pasal 57 ayat (1), menyebutkan evaluasi dilakukan dalam rangka pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara pendidikan kepada pihak-pihak yang berkepentingan, dan ayat (2); evaluasi dilakukan terhadap peserta didik, lembaga, dan program pendidikan pada jalur formal dan nonformal untuk semua jenjang, satuan, dan jenis pendidikan. Evaluasi pendidikan di tingkat satuan pendidikan merupakan bagian yang melekat dengan kegiatan pembelajaran yang dilakukan pendidik untuk mengetahui pencapaian standar kompetensi lulusan. Sesuai dengan penerapan kurikulum yang berbasis kompetensi, penilaian yang dilakukan menggunakan acuan kriteria, yaitu membandingkan hasil yang dicapai dengan kriteria atau standar yang ditetapkan. Ditinjau dari sudut profesionalisme tugas kependidikan, bahwa kegiatan evaluasi merupakan tugas yang melekat pada pendidik profesional. Seorang pendidik profesional selalu menginginkan umpan balik atas program pendidikan yang telah dilakukannya. Melalui suatu evaluasi yang dilakukan secara sistematis dapat ditentukan keputusan sampai sejauh mana tujuan program telah tercapai. Evaluasi bukan hanya sekumpulan teknik semata, tetapi evaluasi merupakan suatu proses berkelanjutan yang mendasari keseluruhan kegiatan belajar mengajar untuk mewujudkan proses belajar mengajar yang efektif.
EVALUASI PENDIDIKAN
Halaman 1
Sesuai dengan prinsip belajar yang menyatakan bahwa belajar merupakan proses terjadinya perubahan tingkah laku dalam diri peserta didik, dengan sendirinya evaluasi pendidikan dapat dijadikan alat untuk mengetahui perubahan tersebut. Ini berarti bahwa dalam proses belajar mengajar harus ada kriteria tertentu yang dapat dijadikan patokan untuk pelaksanaan evaluasinya. Materi penunjang pelatihan ini bermaksud membekali pengawas untuk dapat membina para guru dalam melaksanakan evaluasi pendidikan dengan baik dan benar.
B. Dimensi Kompetensi Dimensi kompetensi yang dilatihkan pada pendidikan dan latihan ini adalah “ Kompetensi Evaluasi Pendidikan”
C. Kompetensi Capaian Setelah menyelesaikan materi pelatihan ini, pengawas diharapkan dapat membimbing guru dalam menentukan aspek-aspek penting yang harus dinilai oleh guru dalam pembelajaran.
D. Indikator Capaian Kompetensi Setelah mengikuti pelatihan ini pengawas diharapkan mampu: 1.
Menjelaskan pengertian, fungsi, tujuan, kedudukan, prosedur dan dan ruang lingkup.
2.
Menjelaskan aspek-aspek yang dievaluasi dalam pembelajaran.
3.
Menjelaskan kriteria penilaian, jenis-jenis penilaian dan teknik penilaian di sekolah, dan bentuk-bentuk soal tes penilaian hasil belajar.
4.
Membuat soal tes hasil belajar berdasarkan langkah-langkah konstruksi tes yang benar.
5.
Membuat pensekoran dan menggunaan hasil evaluasi untuk perbaikan program pembelajaran.
EVALUASI PENDIDIKAN
Halaman 2
E.
Alokasi Waktu
No. 1. 2. 3. 4. 5.
F.
Materi Diklat Pengertian, fungsi, tujuan, kedudukan, prosedur lingkup evaluasi.
Alokasi dan ruang
Aspek-aspek yang dievaluasi dalam pembelajaran Kriteria penilaian, Jenis-jenis alat dan teknik penilaian di sekolah, dan Bentuk-bentuk soal tes hasil belajar Penyusunan Tes Hasil Belajar Pensekoran, Pemberian Nilai dan penggunaan hasil penilaian untuk perbaikan kualitas pembelajaran
4 Jam
Skenario Dilkat I
Introduction (Pendahuluan)
Pada tahap pengalaman pembelajaran ini, para instruktur menanamkan pemahaman tentang isi dari materi kepada para peserta. Bagian ini berisi penjelasan tujuan pelajaran/sesi dan apa yang akan dicapai-hasil selama pelajaran/sesi tersebut. Introduction (pendahuluan) harus singkat dan sederhana. C
Connection (Menghubungkan)
Semua pengalaman pembelajaran yang baik perlu dimulai dari apa yang sudah diketahui, dapat dilakukan oleh peserta, dan mengembangkannya. Pada tahap connection dari pelajaran/sesi, instruktur berusaha menghubungkan bahan ajar yang baru dengan sesuatu yang sudah dikenal para peserta dari pembelajaran atau pengalaman sebelumnya. Anda dapat melakukan hal ini dengan mengadakan latihan brainstorming yang sederhana untuk memahami apa yang telah diketahui para peserta, dengan meminta mereka untuk memberitahu anda apa yang mereka ingat dari pelajaran/sesi sebelumnya atau dengan mengembangkan sebuah kegiatan yang dapat dilakukan peserta sendiri. Sesudah itu, anda dapat menghubungkan para peserta dengan informasi baru. Ini dapat dilakukan melalui presentasi atau penjelasan yang sederhana. Akan tetapi, perlu diingat bahwa presentasi seharusnya tidak terlalu lama. EVALUASI PENDIDIKAN
Halaman 3
A
Application (Penerapan)
Tahap ini adalah yang paling penting dari pelatihan. Setelah peserta memperoleh informasi atau kecakapan baru melalui tahap connection, mereka perlu diberi kesempatan untuk mempraktikkan dan menerapkan pengetahuan dan kecakapan tersebut. Bagian application harus berlangsung paling lama dari pelatihan di mana peserta bekerja sendiri, tidak dengan instruktur, secara pasangan atau dalam kelompok untuk menyelesaikan kegiatan nyata atau memecahkan masalah nyata menggunakan informasi dan kecakapan baru yang telah mereka peroleh. R
Reflection (Refleksi)
Bagian ini merupakan ringkasan dari materi/sesi, peserta diberi kesempatan untuk merefleksikan apa yang telah mereka pelajari. Tugas intruktur adalah menilai sejauh mana keberhasilan pembelajaran. Kegiatan refleksi atau ringkasan dapat melibatkan diskusi kelompok dimana instruktur meminta peserta untuk melakukan presentasi atau menjelaskan apa yang telah mereka pelajari. Mereka juga dapat melakukan kegiatan penulisan mandiri dimana peserta menulis sebuah ringkasan dari hasil pembelajaran. Refleksi ini juga dapat berbentuk kuis singkat dimana instruktur memberi pertanyaan berdasarkan isi materi/sesi. Poin penting untuk diingat dalam refleksi adalah bahwa instruktur perlu menyediakan kesempatan bagi para peserta untuk mengungkapkan apa yang telah mereka pelajari. E
Extend (Memperluas)
Extension adalah kegiatan dimana fasilitator menyediakan kegiatan yang dapat dilakukan peserta setelah sesi berakhir untuk memperkuat dan memperluas pembelajaran. Kegiatan Extension dapat meliputi penyediaan bahan bacaan tambahan, atau latihan.
EVALUASI PENDIDIKAN
Halaman 4
BAB
II
EVALUASI DI BIDANG PENDIDIKAN
A. Pengertian, Fungsi, Tujuan, Kedudukan, Prosedur, dan Ruang Lingkup Evaluasi 1. Pengertian Evaluasi Istilah evaluasi berasal dari bahasa Inggris, yaitu evaluation.
Menurut
Gronlund (1985), evaluasi adalah suatu proses yang sistematis untuk menentukan atau membuat keputusan, sampai sejauh mana tujuan program telah tercapai. Evaluasi mencakup sejumlah teknik yang tidak dapat diabaikan oleh pelatih. Evaluasi bukan sekumpulan teknik semata, tetapi evaluasi merupakan suatu proses berkelanjutan yang mendasari keseluruhan kegiatan belajar mengajar untuk mewujudkan proses belajar mengajar yang efektif. Dalam rangka kegiatan belajar mengajar, selanjutnya Norman E. Gronlund (1976 : 6) mendefinisikan evaluasi sebagai suatu proses sistematik dalam menentukan tingkat pencapaian tujuan pembelajaran. Ada dua aspek penting dari definisi tersebut. Pertama, evaluasi menunjuk pada proses yang sistematik. Kedua, evaluasi mengasumsikan bahwa tujuan pembelajaran ditentukan terlebih dahulu sebelum proses belajar mengajar berlangsung. Edwind Wand dan Gerald W. Brown (1957 : 1) menyatakan bahwa evaluasi berkenaan dengan kegiatan atau proses untuk menentukan nilai dari sesuatu. Sesuai dengan pendapat tersebut, evaluasi pendidikan dapat diartikan sebagai suatu kegiatan atau proses untuk menentukan nilai dari segala sesuatu yang berkenaan dengan pendidikan. Witherington (1980 : 24) menyatakan bahwa evaluasi adalah pernyataan bahwa sesuatu itu mempunyai nilai atau tidak. Jadi, mengevaluasi diartikan sebagai memberikan pernyataan bahwa sesuatu hal, apakah ia bernilai atau tidak. Yang dimaksud dengan nilai di sini dapat dalam bentuk kuantitatif, kualitatif, atau pun keduanya. Mechrens dan Lechman (1984 : 5) menyatakan bahwa evaluasi diartikan sebagai penentuan kesesuaian antara tampilan dengan tujuan-tujuan. Dalam EVALUASI PENDIDIKAN
Halaman 5
hubungan ini, hal yang dievaluasi bukanlah orang secara fisik, tetapi karakteristikkarakteristik dari orang itu dengan menggunakan suatu tolok ukur tertentu. Karakteristik-karakteristik tersebut dalam ruang lingkup kegiatan proses belajar mengajar adalah tampilan peserta didik dalam bidang kognitif (pengetahuan, intelektual, akal), afektif (sikap, minat, motivasi, emosional), dan psikomotorik (keterampilan, gerak, dan tindakan). Tampilan tersebut dapat dievaluasi melalui lisan, tertulis, maupun perbuatan. Dengan demikian, mengevaluasi adalah menentukan apakah tampilan peserta didik telah sesuai dengan tujuan instruksional yang telah dirumuskan atau belum. Sesuai dengan prinsip belajar yang menyatakan bahwa belajar merupakan proses terjadinya perubahan tingkah laku dalam diri peserta didik, dengan sendirinya evaluasi dapat dijadikan alat untuk mengetahui perubahan tersebut. Ini berarti bahwa dalam proses belajar mengajar harus ada kriteria tertentu yang dapat dijadikan patokan untuk pelaksanaan evaluasinya. Dari beberapa pengertian evaluasi yang telah dikemukakan di atas menunjukkan bahwa evaluasi sifatnya lebih luas dari pengukuran. Evaluasi meliputi aspek kuantitatif dan kualitatif. Pengukuran hanya terbatas pada deskripsi kuantitatif saja. 2. Fungsi Evaluasi Untuk mengetahui perkembangan dan kemajuan prestasi belajar perlu dilakukan evaluasi. Evaluasi tidak hanya memberikan gambaran tentang kemampuan yang dimiliki peserta didik, tetapi dapat pula untuk memberikan informasi lain. Misalnya tentang sikap, minat, bakat, dan kepribadian peserta didik dalam kegiatan belajar mengajar atau sesudahnya. Selain daripada itu evaluasi dapat pula bermanfaat untuk menentukan kebijakan dan balikan (feed back). Peranan evaluasi begitu hakiki dalam situasi belajar mengajar. Data evaluasi yang dikumpulkan secara hati-hati membantu pelatih dalam memahami peserta didik, merencanakan pengalaman belajar bagi peserta didik, dan merumuskan tujuan pembelajaran yang akan dicapai sehingga keputusan-keputusan instruksional didasari oleh informasi yang akurat, relevan, dan komprehensif. EVALUASI PENDIDIKAN
Halaman 6
Pencapaian tujuan instruksional, diagnosa kesulitan belajar peserta didik, penentuan kesiapan belajar untuk dapat mencerna pengetahuan dan pengalaman baru, penempatan peserta didik dalam suatu kelompok atau kelas tertentu, bantuan kepada peserta didik dalam menyelesaikan masalahnya, persiapan laporan kemajuan belajar peserta didik, semuanya harus berdasarkan program evaluasi yang cermat. Efisiensi dan efektifitas suatu kegiatan akan terwujud jika terlebih dahulu dilakukan evaluasi terhadap rencana kegiatan tersebut. Dalam bidang pendidikan, evaluasi mempunyai makna bagi peserta didik dan guru maupun institusi pendidikan karena evaluasi biasanya dilakukan sebelum, selama, dan setelah kegiatan belajar mengajar berlangsung. Bagi peserta didik dapat diketahui apakah ia telah berhasil atau belum dalam mengikuti kegiatan belajar mengajar. Jika ia berhasil akan mendapat kepuasan. Hal ini akan mendorong peserta didik untuk lebih termotivasi dalam meraih prestasi akademiknya. Sebaliknya, jika ia tidak berhasil, ia tidak mendapat kepuasan. Dua kemungkinan yang dapat terjadi, kesadaran yang mendorong motivasi belajarnya atau sebaliknya menjadi frustasi. Makna bagi guru, ia akan mengetahui kualitas peserta didiknya, secara individual maupun kelompok. Di samping itu ia dapat mengevaluasi diri mengenai kegiatan belajar mengajar yang telah dilaksanakannya, kekurangan atau kelebihannya. Dengan mengetahui makna evaluasi dalam sistem pendidikan seperti yang diuraikan di atas, evaluasi (pendidikan) berfungsi selektif untuk menentukan input (calon peserta didik), sebagai alat penempatan untuk pengelompokan peserta didik sesuai dengan bakat dan kemampuannya. Selain itu, evaluasi dalam pendidikan dapat pula berfungsi sebagai alat untuk mendiagnosa kesulitan belajar peserta didik dan pengukur keberhasilan belajar dan sebagai balikan bagi lembaga pendidikan. Secara terinci, fungsi evaluasi tersebut di atas adalah sebagai berikut: 1)
Sebagai alat seleksi Evaluasi dapat digunakan untuk melakukan penyaringan (seleksi) dalam penerimaan peserta didik baru.. Dengan evaluasi ditentukan sejumlah peserta
EVALUASI PENDIDIKAN
Halaman 7
didik tertentu yang memenuhi syarat dari sejumlah peserta didik pendaftar sebagai calon peserta didik yang akan diterima. 2)
Sebagai alat pengukur keberhasilan Fungsi evaluasi sebagai alat ukur keberhasilan adalah untuk mengukur seberapa jauh tujuan pembelajaran dapat dicapai setelah kegiatan belajar mengajar dilaksanakan. Selain itu, melalui evaluasi dapat dilihat pula sampai sejauh mana seorang pelatih telah berhasil dalam menerapkan metode dan pendekatan, penguasaan materi, serta kebaikan dan kelemahan kurikulum yang dipakai.
3)
Sebagai alat penempatan Untuk dapat mengetahui dengan baik termasuk kelompok mana seorang peserta didik harus ditempatkan digunakan evaluasi. Penempatan yang cocok dengan kondisi masing-masing peserta didik lebih memungkinkan untuk dapat mengembangkan bakat dan kemampuannya secara optimal.
4)
Sebagai alat diagnostik Dengan melakukan evaluasi, guru dapat mendiagnosis kesulitan belajar peserta didik, ia dapat mengetahui letak kelemahan dan kebaikan peserta didik dalam penguasaan setiap konsep yang telah diajarkan. Dari hasil diagnosis ini guru dapat mengambil langkah untuk memberikan upaya “penyembuhan” yang tepat sesuai dengan jenis dan tingkat kesulitan yang dialami.
3.
Tujuan Evaluasi Sesuai dengan fungsi evaluasi yang telah dikemukakan, evaluasi mempunyai
tujuan seperti berikut ini. 1)
Dalam fungsi evaluasi sebagai alat seleksi terkandung di dalamnya tujuan evaluasi, yaitu untuk mendapatkan calon peserta didik pilihan yang cocok dengan suatu program dan jenjang pendidikan tertentu. Hal ini dimaksudkan
EVALUASI PENDIDIKAN
Halaman 8
agar peserta didik yang menempuh program pendidikan tersebut berjalan lancar dan mencapai prestasi yang optimal. 2)
Dalam fungsi evaluasi sebagai alat pengukur keberhasilan dan diagnostik digunakan untuk mengetahui seberapa jauh hasil yang telah dicapai dalam proses pendidikan dan pembelajaran yang telah dilaksanakan. Apakah hasil yang dicapai sudah sesuai dengan yang diharapkan atau belum. Kalau belum perlu dicari faktor penyebab yang menghambat tercapainya tujuan tersebut. Selanjutnya dapat dicari jalan untuk mengatasinya.
3)
Dalam fungsi evaluasi sebagai alat penempatan (replacement), evaluasi bertujuan untuk menentukan pendidikan lanjut peserta didik agar sesuai dengan minat, bakat, dan kemampuannya. Hal ini dimaksudkan agar pendidikan yang ditempuhnya berjalan lancar dan mencapai prestasi yang optimal.
4)
Evaluasi dalam rangka kegiatan belajar mengajar dikenal dengan istilah tes awal, yaitu evaluasi yang dilaksanakan sebelum kegiatan belajar mengajar berlangsung. Evaluasi ini bertujuan untuk mengetahui taraf kesiapan peserta didik dalam memahami konsep-konsep baru yang akan dipelajarinya.
5)
Dalam rangka promosi, evaluasi bertujuan untuk mendapatkan bahan informasi dalam menentukan peserta didik berhasil dalam suatu pogram pendidikan atau mengulang pada program tersebut. Jika berdasarkan hasil evaluasi dari sejumlah mata pelajaran yang ditempuh peserta didik tersebut telah memenuhi kriteria minimal untuk lulus, maka peserta didik tersebut dapat mengikuti program berikutnya. Jika tidak, dengan diberikan nasihat untuk mengulang program tersebut.
6)
Secara intuitif, seorang pelatih dalam mengajar telah berusaha untuk memilih metode mengajar yang paling tepat sesuai dengan kondisi peserta didik, lingkungan, atau pun sifat materi yang disajikan.
EVALUASI PENDIDIKAN
Halaman 9
4.
Kedudukan Evaluasi Sesuai dengan fungsi dan tujuan evaluasi dalam pendidikan, kedudukan
evaluasi dalam kegiatan belajar mengajar sebelum, selama, dan sesudah kegiatan belajar berlangsung. Kedudukan evaluasi selama kegiatan belajar mengajar berlangsung dimaksudkan sebagai evaluasi yang dilakukan dalam interval waktu pelajaran dimulai hingga saat berakhirnya kegiatan belajar mengajar. Setelah kegiatan belajar mengajar berlangsung dapat melaksanakan evaluasi terhadap pencapaian hasil belajar peserta didik, baik individual maupun kelompok. Dari hasil evaluasi tersebut dapat diketahui pula kelemahan dan kelebihan peserta didik dalam memahami konsep-konsep yang telah dipelajari. Jadi kedudukan evaluasi ditinjau dari segi waktu pelaksanaannya terdiri dari tiga jenis, yaitu sebelum, selama, dan sesudah kegiatan belajar berlangsung. Ditinjau dari sudut transformasi pendidikan, kedudukan evaluasi berperan untuk mengevaluasi input (calon peserta didik), proses (kegiatan belajar mengajar beserta komponenkomponen penunjangnya seperti pelatih, metode dan pendekatan, materi, sumber, alat pelajaran dan sarana lainnya, lingkungan), out put (lulusan), tujuan dan balikan (feed back) dalam rangka perbaikan dan peningkatan mutu dalam kegiatan yang akan datang. Balikan ini terutama ditujukan untuk peninjauan input maupun proses. Balikan tersebut dapat diungkapkan berupa input yang kurang baik, seleksi yang kurang tepat, pelatih dan personal yang kurang berkualitas dan kurang tepatnya fungsi dan tugas, materi yang kurang cocok, metode dan sistem evaluasi yang kurang memadai, kurangnya sarana penunjang, dan sistem administrasi yang kurang baik. 5.
Prosedur Evaluasi Prosedur evaluasi dimaksudkan sebagai langkah-langkah terurut yang harus
ditempuh dalam melaksanakan evaluasi. Langkah-langkah tersebut merupakan tahapan dari kegiatan permulaan sampai kegiatan akhir dalam rangka pelaksanaan evaluasi pendidikan.
EVALUASI PENDIDIKAN
Halaman 10
Muchtar Buchari (1972 : 24) menyebutkan bahwa langkah-langkah pokok yang harus ditempuh sebagai prosedur evaluasi terdiri dari perencanaan (planning), pengumpulan data (collecting), verifikasi data (verification), analisis data (analysis), dan penafsiran (interpretation). Tahap perencanaan meliputi kegiatan merumuskan tujuan evaluasi yang akan dilaksanakan. Tujuan ini harus disesuaikan dengan tujuan yang hendak dicapai dalam program pendidikan dan latihan tersebut. Tentunya tujuan evaluasi berbeda satu sama lain, tergantung pembuatnya. Tujuan evaluasi yang dibuat oleh panitia seleksi akan berbeda dengan tujuan evaluasi yang dibuat oleh pelatih. Hal lain yang termasuk dalam tahap perencanaan adalah metode evaluasi yang akan dipakai, seperti inventori, checklist, interview, observasi, atau tes; menyusun alat evaluasi yang akan digunakan, misalnya pedoman observasi dan wawancara, kisi-kisi tes hasil belajar; menentukan kriteria penilaian yang akan digunakan, misalnya penilaian acuan patokan (PAP) atau penilaian acuan normatif (PAN). Selanjutnya tahap pengumpulan data, terdiri dari : pemeriksaan hasil dan pemberian sekor. Setelah pemberian sekor selesai kemudian dikelompokkan menurut tinggi rendahnya, jenis kelamin, atau hal lainnya sesuai dengan tujuan pengelompokan tersebut. Langkah-langkah tersebut dinamakan langkah verifikasi data. Setelah diverifikasi, data tersebut dianalisis atau diolah dengan menggunakan teknik analisis statistik atau non-statistik. Tahap akhir dalam prosedur evaluasi adalah interpretasi. Interpretasi dimaksudkan sebagai pernyataan atau keputusan tentang hasil evaluasi. Data interpretasi ini dilakukan atas dasar kriteria tertentu yang telah disusun secara rasional atau telah dibakukan. Interpretasi hasil evaluasi tersebut dapat berupa pernyataan atau keputusan yang diungkapkan dengan kata-kata baik-cukup-buruk, tinggi-sedang-rendah, lulus-tidak lulus, dan lain-lain. Julian C. Stanley (1964 : 299) mengemukakan hal yang hampir sama dengan pendapat tersebut di atas mengenai prosedur evaluasi. Bedanya ia mengungkapkan dengan cara lain. Langkah-langkah evaluasi menurut J.C. Stanley adalah
EVALUASI PENDIDIKAN
Halaman 11
menetapkan tujuan program, memilih alat yang layak, pelaksanaan evaluasi, pemberian sekor, menganalisis dan menginterpretasi sekor, membuat catatan, dan menggunakan hasil evaluasi. . 6. Ruang Lingkup Evaluasi Sesuai dengan tujuan pendidikan, khususnya tujuan pembelajaran, ruang lingkup evaluasi yang akan dibicarakan adalah mengenai obyek evaluasi, ciri-ciri evaluasi dalam pendidikan, evaluasi program, evaluasi hasil belajar (tes), dan evaluasi non hasil belajar (non tes). 1) Obyek evaluasi Obyek atau sasaran evaluasi adalah segala sesuatu yang menjadi titik pusat perhatian evaluasi. Obyek evaluasi terdiri dari tiga bagian, yaitu input, proses, dan output. a. Input atau Masukan Karakteristik peserta didik sebagai input dalam proses belajar mengajar yang dievaluasi mencakup empat hal, yaitu: i)
Kemampuan. Untuk dapat mengikuti program dalam suatu lembaga pendidikan, calon peserta didik harus memiliki kemampuan dasar yang cocok. Alat evaluasi yang digunakan untuk mengukur kemampuan ini disebut tes kemampuan (aptitude test).
ii)
Kepribadian. Kepribadian adalah sifat yang terdapat pada diri seorang individu dan tampak dalam bentuk tingkah laku. Alat evaluasi untuk mengetahui tentang kepribadian disebut tes kepribadian (personality test).
iii) Sikap. Sikap lebih cenderung bersifat psikis daripada fisik. Tingkah laku seseorang yang sifatnya fisik adalah manifestasi dari sikap yang dimiliki seseorang yang bersumber pada kepribadiannya. Alat evaluasi untuk
EVALUASI PENDIDIKAN
Halaman 12
mengetahui sikap seseorang terhadap sesuatu hal disebut dengan tes sikap (attitude test). Sebenarnya istilah tes di sini kurang tepat, seharusnya non tes karena berbentuk angket. iv) Inteligensi.
Inteligensi
berkenaan
dengan
kemampuan
berpikir.
Inteligensi seseorang disebut tinggi bila kemampuan berpikirnya tinggi pula. Manifestasi dari inteligensi ini dapat berupa tingkat pemahaman atau daya ingat terhadap rangsangan (stimulus) terhadap struktur kognitif. Struktur kognitif yang dimiliki seseorang dapat dengan cepat mengadaptasi dan tahan mengingat stimulus itu disebut inteligensinya tinggi. b. Proses Unsur-unsur yang terlibat dalam proses kegiatan belajar mengajar adalah kurikulum, materi pelajaran, pendekatan dan metode, cara menilai, sarana dan media, sistem administrasi, guru dan personal lainnya. Unsur-unsur tersebut saling berinteraksi secara fungsional satu sama lain dalam rangka kelancaran kegiatan belajar mengajar. Jadi tidak berdiri sendiri. Untuk mengevaluasi proses dapat dilakukan dengan menyajikan soal tertulis. Di samping itu evaluasi proses dapat dilakukan melalui observasi . c. Keluaran (output) Output pendidikan dan latihan dalah lulusan suatu jenjang pendidikan tertentu. Namun dalam hal kegiatan belajar mengajar, yang disebut output adalah kondisi setelah kegiatan belajar mengajar (proses) dilaksanakan, baik untuk 1 kali pertemuan, 1 semester, atau bahkan setelah lulus pada tingkat akhir. Evaluasi terhadap output ini dilakukan untuk mengetahui seberapa jauh tingkat pencapaian peserta didik setelah menjalani proses belajar mengajar.
2) Evaluasi Hasil Belajar Evaluasi hasil belajar dapat dilakukan pada saat kegiatan belajar mengajar berlangsung atau sesudahnya. Selama kegiatan belajar mengajar berlangsung, EVALUASI PENDIDIKAN
Halaman 13
peserta didik dapat dievaluasi melalui tanya jawab lisan sambil mengarahkannya pada konsep atau materi baru. Evaluasi pada akhir kegiatan dapat dilaksanakan pada setiap akhir pertemuan, pada setiap minggu, setiap akhir program. Evaluasi hasil belajar sifatnya berupa tes kemampuan, yaitu mengukur sampai sejauh mana tingkat penguasaan materi pelajaran yang telah disajikan dalam kegiatan belajar mengajar.
B. Aspek-Aspek yang Dievaluasi Dalam Kurikulum Kompetensi adalah seperangkat pengetahuan, sikap, keterampilan yang harus dimiliki, dihayati, dan dikuasai oleh siswa dalam melaksanakan tugas kehidupannya. Berdasarkan pengertian ini, maka secara garis besar aspek-aspek yang dinilai dalam penilaian berbasis kompetensi meliputi aspek kognitif, afektif, dan psikomotor atau kompetensi intelektual, emosional (ahlak dan moral), spritual, dan keterampilan. Sejalan dengan hal tersebut diatas, Benyamin S. Bloom dan (1956), telah mengklasifikasi tujuan pendidikan yang dikenal dengan Taksonomi Bloom. Bloom mengelompokkan kemampuan manusia ke dalam tiga ranah (domain), yaitu: (1) Ranah kognitif (cognitive domain), (2) Ranah afektif (affective domain), dan (3) Ranah psikomotor (psychomotorik domain).
Baru-baru ini, taksonomi ini telah
direvisi oleh sekelompok siswa Bloom (Anderson et al., 2001) dan beri nama baru taxonomy for learning, teaching, and assessing (taksonomi untuk belajar, mengajar, dan menilai). Seperti disiratkan oleh namanya, taksonomi yang telah direvisi ini memberikan kerangka kerja dalam mengklasifikasikan tujuan belajar dan cara untuk menilainya.
EVALUASI PENDIDIKAN
Halaman 14
Tabel 1. Tabel Taksonomi Dimensi Pengetahuan
C1 Mengingat
C2 Memahami
Dimensi Proses Kognitif C3 C4 C5 Menerapkan Menganalisis Mengevaluasi
C6 Menciptakan
A. Pengetahuan Faktual B. Pengetahuan Konseptual C. Pengetahuan Prosedural D. Pengetahuan Metakognitif Sumber : Adrerson et al. (2001), hlm.28
Taksonomi Bloom yang telah direvisi itu bersifat dua dimensi. Salah satu dimensinya, dimensi pengetahuan, mendeskripsikan berbagai tipe pengetahuan mengorganisasikan pengetahuan menjadi pengetahuan kognitif. Kategori-kategori tersebut terletak di sepanjang kontinum yang bergerak mulai dari pengetahuan yang sangat konkret (faktual) sampai yang lebih abstrak (metakognitif). Dimensi kedua, dimensi proses kognitif (cara berpikir) berisi enam kategori: remember (mengingat),
understand
(memahami),
apply
(menerapkan),
analyze
(mengaanaalisis), evaluate (mengevaluasi), dan create (menciptakan). Seperti halnya dimensi pengetahuan, dimensi proses kognitif juga diasumsikan terletak di sepanjang kontinum kompleksitas kognitif. Sebagai contoh, memahami sesuatu lebih kompleks dibanding semata-mata meningatnya saja; menerapkan dan menganalisis suatu ide lebih kompleks dari sekadar memahami ide itu. Tabel 1 menunjukkan kedua dimensi taksonomi itu dan hubungan antara dimensi pengetahuan dan dimensi proses kognitif. Kategori-Kategori Dimensi Pengetahuan. Taksonomi yang telah direvisi itu membagi pengetahuan menjadi empat kategori: Pengetahuan faktual termasuk elemen-elemen dasar yang perlu diketahui siswa yang akan dipelajari dengan sebuah topik. Pengetahuan konseptual adalah pengetahuan tentang saling keterkaitan di antara elemen-elemen dasar. Pengetahuan prosedural adalah mengetahui cara mengerjakan "sesuatu". Pengetahuan metakognitif adalah pengetahuan tentang kognisi siswa sendiri dan pengetahuan tentang kapan
EVALUASI PENDIDIKAN
Halaman 15
menggunakan pengetahuan konseptual atau prosedural tertentu. Tabel 2 menjelaskan keempat tipe utama pengetahuan dan contohnya masing-masing. Tabel 2. Tipe-Tipe Utama Pengetahuan daiam Dimensi Pengetahuan
BEBERAPA TIPE DAN SUB-TIPE UTAMA A
Aa Ab B
Ba Bb Bc C
Ca
CONTOH
PENGETAHUAN FAKTUAL
elemen-elemen dasar yang harus diketahui siswa, yang dipelajari dengan sebuah disiplin atau dengan menyetesaikan masalah yang ada di dalamnya. Pengetahuan tentang terminologi Perbendaharaan kata teknis, simbol-simbol musik. Pengetahuan tentang detail-detail Sumber-sumber alam utama, sumberdan elemen-elemen yang spesifik sumber informasi yang dapat dipercaya. PENGETAHUAN KONSEPTUAL
Saling keterkaitan di antara elemen-elemen dasar dalam struktur yang lebih besar yang memungkinkan mereka untuk berfungsi bersama-sama. Pengetahuan tentang klasifikasi dan Periode-periode waktu geologis, kategori bentuk-bentuk kepemilikan usaha/ bisnis. Pengetahuan tentang prinsip dan Dalil Pythagoras, hukum supply and generalisasi demand (penawaran dan permintaan), Pengetahuan tentang teori, model, Teorievolusi, struktur pemerintahan, dan struktur Struktur DPR, dsb. PENGETAHUAN PROSEDURAL Bagaimana cara melakukan sesuatu, metode penyelidikan, dan kriteria untuk menggunakan berbagai keterampilan, algoritma, teknik, dan metode.
Cc
Pengetahuan tentang berbagai Berbagai keterampilan yang digunakan keterampilan spesifik-subjek dan dalam menggambar dengan cat air algoritma Algoritma pembagian bilangan bulat. Pengetahuan tentang berbagai Teknik-teknik wawancara, metode ilmiah. teknik dan metode Spesifik-subjek Pengetahuan tentang krtteria untuk Kriteria yang digunakan untuk menentukan kapan meng-gunakan menentukan kapan menerapkan prosedur prosedur yang tepat yang melibatkan hukum Kedua Newton Kriteria yang digunakan untuk menilai fisibilitas penggunaan metode tertentu untuk mengestimasikan biaya usaha.
D
PENGETAHUAN METAKOGNITIF
Cb
EVALUASI PENDIDIKAN
Pengetahuan tentang kognisi secara umum maupun kesadaran dan pengetahuan tenteng
Halaman 16
Da
Db
Dc
kognisinya sendiri. Pengetahuan strategis Pengetahuan tentang membuat ikhtisar sebagai cara menangkap struktur sebuah unit subjek dalam sebuah textbook Pengetahuan tentang penggunaan heuristik Pengetahuan tentang tugas-tugas Pengetahuan tentang tipe-tipe tes yang di kognitif, termasuk pengetahuan administrasikan guru-guru tertentu kontekstual dan kondisional yang Pengetahuan tentang tuntutan kognitif tepat berbagai tugas. Pengetahuan tentang diri-sendiri Pengetahuan bahwa mengkritik esai adalah kekuatan personal, sedangkan menulis esai adalah kelemahan personal; Kesadaran tentang tingkat pengetahuannya sendiri. Sumber : Adrerson et al. (2001), hlm.29
Tabel 3. Dimensi Proses Kognitif dan Proses Kognitif yang Terkait KATERGORI PROSES 1.
Remember (mengingat)
1.1 Recognizing (mengenali) 1.2 Recalling (mengingat kembali) 2
Understand (memahami)
2.1 Interpreting (menginterpretasikan) 2.2 Exemplifying (memberi contoh) 2.3 Classifying (mengklasifikasikan) 2.4 Summarizing (merangkum) 2.5 Inferring (menyimpulkan) 2.6 Comparing (membandingkan) 2.7 Explaining (menjelaskan) 3
Apply (menerapkan)
EVALUASI PENDIDIKAN
PROSES KOGNITIF DAN CONTOH MengambIl pengetahuan yang relevan dari ingatan jangka panjang (misalnya, mengenali tanggal peristiwaperistiwa penting dalam sejarah) (misalnya, mengingat kembali tanggal peristiwa-peristiwa penting dalam sejarah) Mengonstruksikan makna dari pesan-pesan instruksional, termasuk komunikasi lisan, tulisan, dan grafis (misalnya, menafsirkan pidato dan dokumen penting) (misalnya, memberikan contoh berbagai gaya lukisan artistik) (misalnya, mengklasifikasikan kasus-kasus gangguan mental) (misalnya, menulis ringkasan pendek dari rekaman peristiwa tertentu) (misalnya, dalam mempelajari bahasa asing, menyimpulkan prinsip gramatikal dari contohcontoh) (misalnya, membandingkan peristiwa bersejarah dengan situasi sekarang) (misalnya, menjelaskan penyebab peristiwa penting abad kedelapan belas di Perancis) Melaksanakan atau menggunakan prosedur dalam situasi tertentu
Halaman 17
3.1 Executing (melaksanakan) 3.2 4
4.1 4.2
4.3 5 5.1 5.2 6 6.1
(misalnya, membagi sebuah bilangan bulat dengan bilangan bulat lain, keduanya dengan banyak digit) Implementing (misalnya, menentukan dalam situasi mana (menglmplementasikan) hukum Newton kedua dapat diterapkan) Analyze (menganalisis) Memecah materi menjadi bagian-bagian konstituen dan menentukan hubungan antara satu bagian dengan bagian lain dan dengan struktur atau maksud keseluruhan Differentiating (mendiferensiasikan) (misalnya, membedakan antara bilangan yang relevan dan tidak relevan dalam soal kalimat matematika) Organizing (mengorganisasikan) (misalnya, bukti struktur dalam deskripsi historis menjadi bukti-bukti yang mendukung dan yang bertentangan dengan penjelasan historis tertentu) Attributing (mengatribusikan) (misalnya, menentukan sudut pandang penulis sebuah esai dalam kaitannya dengan perepektif politisnya Evaluate (mengevaluasi) Membuat judgment berdasarkari kriteria atau standar. Checking (mengecek) (misalnya, menentukan apakah kesimpulan seorang ilmuwan sesuai dengan data yang terobservasi) Critiquing (mengkritik) (misalnya, memutuskan mana di antara dua metode yang merupakan cara terbaik untuk menyelesaikan masalah tertentu) Menciptakan (Creating) Meletakkan unsur-unsur secara bersama untuk membentuk sesuatu yang koheren atau fungsional Reorganizing (mengorganisasikan Mereorganisasi unsur-unsur ke dalam pola kembali) baru atau struktur baru dengan cara membangun (generating), merencanakan (planning) atau memproduksi (producing).
Kategori-Kategori Dimensi Proses Kognitif. Dimensi kognitif memberikan skema klasifikasi untuk berbagai proses kognitif yang mungkin termasuk dalam sebuah tujuan instruksional. Proses-proses ini terletak di sepanjang kontinum yang bergerak mulai dari yang agak sederhana (mengingat) ke yang lebih kompleks (menriptakan). Seperti ditunjukkan dalam Tabel 3, mengingat, menurut para kreator taksonomi, berarti mengambil informasi yang relevan dari ingatan jangka parijang, sementara memahami berarti mengonstruksikan makna dari berbagai pesan instruksional. Menerapkan berarti melaksanakan atau menggunakan suatu prosedur; menganalisis berarti menguraikan materi menjadi bagian-bagian EVALUASI PENDIDIKAN
Halaman 18
konstituen dan menentukan bagaimana hubungan bagian yang satu dengan bagian yang lain. Mengevaluasi dan menciptakan, dua kategori yang terletak dalam ujung kontinum yang lebih kompleks, berarti membuat judgment berdasarkan kriteria dan menyatukan berbagai elemen untuk membentuk sebuah pola atau struktur baru. Perhatikan juga dalam Tabel 3 bahwa masing-masing kategori proses dikaitkan dengan dua proses kognitif atau lebih. "Mengingat", misalnya, termasuk proses kognitif mengenali dan mengingat kembali. "Mengevaluasi" termasuk proses kognitif checking (memeriksa), dan critiquing (mengkritik). RANAH AFEKTIF. Taksonomi orisinal Bloom membagi tujuan dalam affective domain (ranah afektif) menjadi limajkategori. Masing-masing kategori menyebutkan derajat komitmen atau intensitas emosional yang dibutuhkan dari siswa: Receiving (menerima)—
Siswa menyadari atau memerhatikan sesuatu di lingkungan.
Responding (merespons)—Siswa memperlihatkan perilaku baru tertentu sebagai hasil pengalaman dan respons terhadap pengalaman. Valuing (menghargai)—
Siswa
memperlihatkan
keterlibatan
mutlak
atau
komitmen terhadap pengalaman tertentu. Organization (organisasi)—Siswa telah mengintegrasikan sebuah nilai baru ke dalam nilai-nilai umumnya dan memberinya tempat yang layak dalam sistem prioritas. Characterization by value (karakterisasi menurut nilai)— Siswa bertindak secara konsisten menurut nilainya dan memiliki komitmen yang kuat terhadap pengalaman itu.
EVALUASI PENDIDIKAN
Halaman 19
RANAH PSIKOMOTOR. Kita biasanya mengaitkan kegiatan psikomotorik paling dekat dengan pendidikan jasmani dan atletik, meskipun pada kenyataannya banyak subjek lain yang membutuhkan gerakan fisik tertentu. Jelas, menulis dengan tangan dan worJrnut essitig berhubungan erat dengan semua subjek. Pekerjaan di laboratorium untuk siswa sains membutuhkan penggunaan rumit berbagai peralatan yang kompleks. Koordinasi mata dibutuhkan untuk melihat semua bentuk karya seni rupa; koordinasi tangan dibutuhkan untuk menghasilkan karya seni tersebut Find ah dari satu siswa ke siswa lain, menggunakan peralatan audiovisual, dan mengomunikasikan berbagai maksud dengan gerakan wajah dan tangan adalah contoh contoh keterampilan guru di ranah psikomotorik. Berikut ini adalah rentang kategori mulai dari reaksi refleks sederhana sampai tindakan kompleks yang mengomunikasikan berbagai ide dan ernosi kepada orang lain: Gerakan refleks—
Tindakan siswa dapat terjadi di luar kehendak sebagai respons terhadap stimulus tertentu.
Gerakan fundamental dasar—Siswa memiliki pola gerakan bawaan yang terbentuk dari kombinasi berbagai gerakan refleks. Kemampuan perseptual—Siswa dapat mentranslasikan stimuli yang diterima melalui indra menjadi gerakan yang tepat seperti yang diinginkan. Gerakan yang terampil— Siswa telah mengembangkan gerakan-gerakan yang lebih kompleks yang membutuhkan derajat efisiensi tertentu. Komunikasinon diskursif— Siswa memiliki kemampuan untuk berkomunikasi melalui gerakan tubuh. Taksonomi-taksonomi orisinal untuk tujuan afektif dan psikomotorik belum pernah direvisi.
EVALUASI PENDIDIKAN
Halaman 20
Taksonomi orisinal Bloom juga tidak terlepas dari kritik. Sebagian orang keliru menginterpretasikannya dengan mengatakan bahwa tipe pengetahuan tertentu yang tidak begitu kompleks tidak sepenting tipe pengetahuan yang lebih kompleks. Hal ini bukan yang dimaksudkan oleh Bloom. Sebagian lainnya menantang pengurutan hierarkis tujuan-tujuan instruksional itu. Kemungkinan besar kritik yang sama akan terjadi pada taksonomi yang telah direvisi, terutama terkait dengan kontinum kompleksitasnya yang baru. Terakhir, para pengkritik mengatakan, dan memang benar demikianlah adanya, bahwa taksonomi dan pengurutan kategori-kategori itu tidak selalu cocok dengan semua bidang pengetahuan. Terlepas dari kritik dan kelemahan yang diidentifikasi dalam taksonomi orisinalnya, taksonomi itu masih tetap populer di antara para guru. Kemungkinan besar versi yang direvisi dari taksonomi itu akan menemukan audiens pendidik yang sama reseptifnya karena memberikan cara yang berharga untuk memikirkan tentang maksud dan asesmen instruksional dan, oleh sebab itu, dipandang sebagai alat perencanaan yang berharga. Taksonomi itu memberikan reminder yang baik bahwa kita menginginkan siswa untuk mempelajari beragam pengetahuan dan keterampilan dan mampu berpikir dan bertindak dengan cara-cara yang efektifpraktis maupun kompleks.
C. Jenis-jenis Instrumen Evaluasi Secara umum, yang dimaksud dengan instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai alat untuk mengukur suatu obyek ukur atau mengumpulkan data mengenai suatu variabel. Pada dasarnya, instrumen dapat dibagi dua, yaitu tes dan non-tes. Termasuk dalam kelompok tes adalah tes prestasi belajar, tes intelegensi, tes bakat, dan tes kemampuan akademik, sedangkan yang termasuk dalam kelompok non-tes ialah skala sikap, skala penilaian, pedoman observasi, pedoman wawancara, angket, pemeriksaan dokumen, dan sebagainya. Instrumen yang berbentuk tes bersifat performansi maksimum sedang instrumen non-tes bersifat performansi tipikal. EVALUASI PENDIDIKAN
Halaman 21
a. Tes 1) Pengertian Secara umum tes diartikan sebagai alat ukur yang dipergunakan untuk mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat konten dan materi tertentu. Menurut Sudijono (1996), tes adalah alat atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian. Tes dapat juga diartikan sebagai suatu prosedur yang sistematis untuk mengamati atau mendeskripsikan satu atau lebih karakteristik seseorang dengan menggunakan standar numerik atau sistem kategori (Cronbach , 1984). Norman (1976) mengemukakan bahwa tes merupakan salah satu prosedur evaluasi yang komprehensif, sistematik, dan obyektif yang hasilnya dapat dijadikan sebagai dasar dalam pengambilan keputusan dalam proses pengajaran yang dilakukan oleh pelatih. Dari beberapa pengertian di atas, maka dapat disimpulkan bahwa tes memiliki peranan yang sangat penting dalam dunia pendidikan. 2) Fungsi Tes Secara umum, ada beberapa macam fungsi tes di dalam dunia pendidikan. Pertama, tes dapat berfungsi sebagai alat untuk mengukur prestasi belajar peserta didik. Kedua, tes dapat berfungsi sebagai motivator dalam pembelajaran. Ketiga, tes dapat berfungsi untuk upaya perbaikan kualitas pembelajaran. Keempat, tes yang dimaksudkan untuk menentukan berhasil tidaknya peserta didik sebagai syarat untuk melanjutkan pendidikan pada jenjang yang lebih tinggi. Salah satu tes yang perlu dibahas untuk upaya perbaikan kualitas pembelajaran adalah tes formatif. Tes formatif pada dasarnya adalah tes yang bertujuan untuk mendapatkan umpan balik bagi usaha perbaikan kualitas pembelajaran dalam konteks kelas. Tes formatif ini akan memberikan masukan atau umpan balik yang dapat digunakan oleh guru sebagai pengelola kegiatan pembelajaran dalam meningkatkan intensitas proses belajar dalam diri setiap diri peserta didik melalui peningkatan kesesuaian antara tiga unsur, yaitu EVALUASI PENDIDIKAN
Halaman 22
struktur kognitif peserta didik, karakteristik konsep yang dipelajari, dan strategi pembelajaran yang digunakan. Selanjutnya, untuk keperluan menentukan berhasil tidaknya peserta didik sebagai syarat untuk melanjutkan pendidikan pada jenjang yang lebih tinggi dikenal dengan istilah tes sumatif. Tes sumatif (summative test) adalah tes hasil belajar yang dilaksanakan setelah sekumpulan materi pelajaran atau satuan program pengajaran selesai diberikan. Di sekolah, tes sumatif ini dikenal dengan tes ulangan umum. Tes sumatif ini dilaksanakan dengan tujuan untuk menentukan nilai yang menjadi lambang keberhasilan peserta didik setelah mereka menempuh proses pembelajaran dalam waktu tertentu. Hasil tes sumatif berguna untuk (a) menentukan kedudukan atau ranking masing-masing peserta didik di kelompoknya; (b) menentukan dapat atau tidaknya peserta didik melanjutkan program pembelajaran berikutnya; dan (c) menginformasikan kemajuan peserta didik untuk disampaikan kepada pihak lain. 3) Penggolongan Tes Ditinjau dari fungsinya sebagai alat untuk mengukur hasil belajar peserta didik sebagai efek atau pengaruh kegiatan pembelajaran, tes dibedakan menjadi dua golongan. Pertama, tes awal (pre-test). Tes jenis ini dilaksanakan dengan tujuan untuk mengetahui sejauhmana materi pelajaran yang akan diajarkan telah diketahui oleh peserta didik. Kedua, tes akhir (post-test). Tes jenis ini dilaksanakan dengan tujuan untuk mengetahui apakah semua materi pelajaran yang penting telah dikuasai dengan baik oleh peserta didik atau belum. Ditinjau dari aspek psikis yang akan diungkap, tes dibedakan menjadi lima golongan. Pertama, tes inteligensi (intellegency test) yang dilaksanakan dengan tujuan untuk mengungkap atau memprediksi tingkat kecerdasan seseorang. Kedua, tes kemampuan (aptitude test) yang dilaksanakan dengan tujuan untuk mengungkap kemampuan dasar atau bakat khusus yang dimiliki oleh peserta tes. Ketiga, tes sikap (attitude test) yang dilaksanakan dengan tujuan untuk mengungkap pre-disposisi atau kecenderungan seseorang untuk melakukan
EVALUASI PENDIDIKAN
Halaman 23
sesuatu respon terhadap obyek yang disikapi. Keempat, tes kepribadian (personality test) yaitu tes yang dilaksanakan dengan tujuan untuk mengungkap ciri-ciri khas dari seseorang yang sedikit banyaknya bersifat lahiriah, seperti gaya bicara, cara berpakaian, nada suara, hobi, bentuk tubuh, cara bergaul, cara mengatasi masalah, dan lain sebagainya. Kelima, tes hasil belajar (achievement test) yaitu tes yang dilaksanakan dengan tujuan untuk mengungkap tingkat pencapaian terhadap tujuan pembelajaran atau prestasi belajar. Ditinjau dari jumlah peserta yang mengikuti tes, maka tes dibedakan menjadi dua golongan.
Pertama, tes individual (individual test), yaitu tes
dimana pelaksana tes hanya berhadapan dengan satu orang peserta. Kedua, tes kelompok (group test), yaitu tes dimana pelaksana tes berhadapan dengan lebih dari satu orang peserta. Ditinjau dari waktu yang disediakan bagi peserta, maka tes dibedakan menjadi dua golongan, yaitu power test dan speed test. Ditinjau dari bentuk respon, tes dibedakan menjadi dua golongan, yaitu tes verbal dan tes non verbal. Ditinjau dari cara mengajukan pertanyaan, tes dibedakan menjadi tiga golongan, yaitu tes tertulis (pencil and paper test), tes tidak tertulis (non-pencil and paper test), dan tes perbuatan. Ditinjau dari aspek yang hendak diukur, tes dibedakan atas tes tertulis, tes lisan dan ter perbuatan atau tes praktek. Tes tertulis digunakan untuk mengukur aspek kognitif, tes lisan digunakan untuk pendalaman terhadap aspek kognitif yang belum terukur melalui tes tertulis, sedang tes perbuatan atau tes praktek digunakan untuk mengukur aspek psikomotorik atau keterampilan. b. Non Tes 1) Pedoman Observasi Secara umum pengertian observasi adalah cara menghimpun bahanbahan/keterangan yang dilakukan dengan mengadakan pengamatan dan pencatatan secara sistematis terhadap fenomena-fenomena yang dijadikan obyek pengamatan.
EVALUASI PENDIDIKAN
Halaman 24
Observasi sebagai alat evaluasi banyak digunakan untuk menilai tingkah laku individu atau proses terjadinya suatu kegiatan yang dapat diamati. Observasi dapat dilakukan baik secara partisipatif maupun non-partisipasi. Observasi dapat pula berbentuk observasi eksperimental yaitu observasi yang dilakukan dalam situasi yang dibuat dan observasi non-eksperimental yaitu observasi yang dilakukan dalam situasi yang wajar. Jika observasi digunakan sebagai alat evaluasi, maka pencatatan hasil observasi lebih sukar daripada mencatat jawaban yang diberikan oleh peserta tes terhadap pertanyaan yang diberikan dalam suatu tes karena respon observasi adalah tingkah laku dimana proses kejadiannya berlangsung cepat. Obervasi yang dilakukan dengan perencanaan yang matang disebut observasi sistematis. 2) Pedoman Wawancara Secara umum yang dimaksud dengan wawancara adalah cara menghimpun bahan-bahan keterangan yang dilaksanakan dengan tanya jawab baik secara lisan, sepihak, berhadapan muka, maupun dengan arah dan tujuan yang telah ditentukan. Ada dua jenis wawancara yang dapat digunakan sebagai alat evaluasi, yaitu: (a) Wawancara terpimpin, yang juga dikenal dengan wawancara terstruktur atau wawancara sistematis. (b) Wawancara tidak terpimpin, yang dikenal dengan wawancara sederhana atau wawancara bebas. Salah satu kelebihan wawancara adalah pewawancara sebagai evaluator dapat melakukan kontak langsung dengan peserta didik yang akan dinilai, sehingga dapat diperoleh hasil penilaian yang lebih lengkap dan mendalam. Jika wawancara dilakukan secara bebas, maka pewawancara tidak perlu persiapan yang matang, tetapi jika wawancara dilakukan secara sistematis, maka pewawancara perlu ada pedoman wawancara yang berisi pokok-pokok pertanyaan yang akan ditanyakan kepada responden. Mencatat dan
EVALUASI PENDIDIKAN
Halaman 25
mengolah hasil wawancara jauh lebih sulit dibandingkan dengan mencatat dan mengolah hasil observasi atau hasil tes. 3) Angket (Kuesioner) Angket dapat juga digunakan sebagai alat ukur untuk menilai hasil belajar. Angket dapat diberikan langsung kepada responden, dapat juga diberikan kepada orang lain yang mengenal berbagai karakteristik responden. Data yang dihimpun melalui angket biasanya adalah data yang berkenaan dengan kesulitan-kesulitan yang dihadapi oleh peserta didik dalam mengikuti pelajaran. Angket pada umumnya dipergunakan untuk menilai hasil belajar pada ranah afektif. Selain sebagai alat ukur untuk mengukur hasil belajar peserta didik, angket juga berguna untuk mengungkapkan latar belakang orangtua peserta didik maupun peserta didik itu sendiri. 4) Pemeriksaan Dokumen Untuk mengukur kemajuan belajar peserta didik dapat juga dilakukan dengan tanpa pengujian tetapi dengan cara melakukan pemeriksaan dokumen-dokumen, misalnya dokumen yang memuat informasi kapan peserta didik itu diterima di lembaga kursus tersebut, darimana lembaga kursus asalnya, apakah peserta didik tersebut pernah tidak lulus dalam suatu program, dan sebagainya. Berbagai informasi yang direkam melalui angket, baik informasi pribadi peserta didik dan lingkungannya akan bermanfaat pada saat-saat tertentu. Dengan demikian, maka dalam pelaksanaan pengukuran hasil belajar tidak semata-mata dilakukan dengan tes, tetapi dapat juga dilakukan dengan menggunakan non-tes, terutama untuk masalah-masalah yang berhubungan dengan masalah kejiwaan peserta didik, seperti persepsi terhadap mata pelajaran tertentu, persepsi terhadap pelatih, minat, bakat, tingkah laku, dan sikap yang tidak mungkin diukur dengan tes.
EVALUASI PENDIDIKAN
Halaman 26
D. Kriteria Penilaian Kriteria penilaian hasil belajar pada umumnya dibedakan ke dalam dua standar, yakni kriteria penilaian acuan norma (PAN) dan penilaian acuan patokan (PAP). a. Penilaian Acuan Norma (PAN) Penilaian Acuan Norma (PAN) adalah penilaian yang menggunakan acuan pada rata-rata kelompok. Dengan demikian dapat diketahui posisi kemampuan peserta didik dalam kelompoknya. Untuk itu norma atau kriteria yang digunakan dalam menentukan derajat prestasi seorang peserta didik selalu dibandingkan dengan nilai rata-rata kelasnya. Atas dasar itu akan diperoleh tiga kategori prestasi peserta didik, yakni prestai peserta didik di atas rata-rata kelas, berkisar pada rata-rata kelas, dan prestasi peserta didik yang berada di bawah rata-rata kelas. Dengan kata lain, prestasi yang dicapai seseorang posisinya sangat bergantung pada prestasi kelompoknya. Keuntungan kriteria ini adalah dapat diketahui prestasi kelompok atau kelas sekaligus dapat diketahui keberhasilan pembelajaran bagi semua peserta didik. Kelemahannya adalah kurang meningkatkan kualitas hasil belajar. Jika nilai rata-rata kelompok atau kelasnya rendah, misalnya sekor 40 dari seratus, maka peserta didik yang memperoleh nilai 45 (di atas rata-rata) sudah dikatakan baik, atau dinyatakan lulus, sebab berada di atas rata-rata kelas, padahal sekor 45 dari maksimum sekor 100 termasuk rendah. Kelemahan yang lain ialah kurang praktis sebab harus dihitung dahulu nilai rata-rata kelas, apalagi jika jumlah peserta didik cukup banyak. Sistem ini kurang menggambarkan tercapainya tujuan pembelajaran sehingga tidak dapat dijadikan ukuran dalam menilai keberhasilan mutu pendidikan. Demikian juga kriteria keberhasilan tidak tetap dan tidak pasti, bergantung pada rata-rata kelas, makanya standar penilaian ini disebut standar relatif. Dalam konteks yang lebih luas penggunaan standar penilaian ini tidak dapat digunakan untuk menarik generalisasi prestasi peserta didik sebab rata--
EVALUASI PENDIDIKAN
Halaman 27
rata kelompok untuk kelas yang satu berbeda dengan kelas yang lain, sekolah yang satu akan berbeda dengan sekolah yang lain. Standar penilaian acuan norma tepat jika digunakan untuk penilaian formatif. b. Penilaian Acuan Patokan (PAP) Penilaian Acuan Patokan (PAP) adalah penilaian yang menggunakan acuan pada tujuan pembelajaran atau kompetensi yang harus dikuasai peserta didik. Derajat keberhasilan peserta didik dibandingkan dengan tujuan atau kompetensi yang seharusnya dicapai atau dikuasai peserta didik bukan dibandingkan dengan prestasi kelompoknya. Dalam penilaian ini ditetapkan kriteria minimal harus dicapai atau dikuasai peserta didik. Kriteria minimal yang biasa digunakan adalah 80% dari tujuan atau kompetensi yang seharusnya dikuasai peserta didik. Makin tinggi kriterianya makin baik mutu pendidikan yang dihasilkan. Standar penilaian acuan patokan berbasis pada konsep belajar tuntas atau mastery learning. Artinya setiap peserta didik harus mencapai ketuntasan belajar yang diindikasikan oleh penguasaan materi ajar minimal mencapai kriteria yang telah ditetapkan. Jika peserta didik belum mencapai kriteria tersebut peserta didik belum dinyatakan berhasil dan harus menempuh ujian kembali. Karena itu penilaian acuan patokan sering disebut standar mutlak. Dalam sistem ini pendidik tidak perlu menghitung nilai rata-rata kelas sebab prestasi peserta didik tidak dibandingkan dengan prestasi kelompoknya. Melalui sistem penilaian acuan patokan sudah dapat dipastikan prestasi belajar peserta didik secara bertahap akan lebih baik sebab setiap peserta didik harns mencapai kriteria minimal yang telah ditentukan. Namun sistem ini menuntut pendidik bekerja lebih keras sebab setiap pendidik harus menyediakan remedial bagi peserta didik yang belum memenuhi standar yang telah ditentukan. Sistem penilaian ini tepat digunakan baik untuk penilaian formatif maupun penilaian sumatif.
EVALUASI PENDIDIKAN
Halaman 28
E. Penyusunan Tes Hasil Belajar Untuk memperoleh gambaran yang lebih komprehensif mengenai evaluasi hasil pembelajaran, maka uraian berikut ini akan membahas konstruksi dan pengembangan tes. Konstruksi dan pengembangan tes dimaksudkan untuk memperoleh tes yang valid sehingga hasil ukurnya dapat mencerminkan secara tepat hasil belajar dicapai peserta didik setelah selesai mengikuti proses pembelajaran. Untuk itu maka langkah-langkah konstruksi tes yang ditempuh adalah sebagai berikut: 1. Menetapkan tujuan tes Tes hasil belajar dapat dibuat untuk bermacam-macam tujuan, seperti: a. Evaluasi Belajar Tahap Akhir (EBTA) atau evaluasi belajar pada akhir program Pendidikan. b. Seleksi, misalnya untuk ujian saringan masuk lembaga pendidikan tertentu (misalnya SPMB untuk masuk PT). c. Diagnosis kesulitan belajar, yang dikenal dengan tes diagnosis. Untuk evaluasi bersifat akhir diperlukan tes yang terdiri atas butir-butir yang mudah sampai yang sukar, tes semacam ini merupakan Mastery Tes. Dengan hasil tes ini dapat dilihat level mastery peserta tes, yaitu sejauh mana ia menguasai materi yang diberikan. Untuk tujuan seleksi dibutuhkan tes dengan butir-butir soal dengan tingkat kesukaran yang lebih tinggi (tingkat kesukaran di atas rata-rata) terutama jika calon yang diseleksi cukup banyak. Untuk ujian diagnosis, butir-butir soal harus dinilai menurut pokok bahasan atau sub pokok bahasan. Pada tes diagnosis bukan nilai akhir yang diperhatikan, melainkan nilai pada tiap pokok bahasan (pokok bahasan mana belum dikuasai atau bermasalah). 2. Analisis kurikulum Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok bahasan sebagai dasar dalam menentukan jumlah item atau butir soal baik soal obyektif
EVALUASI PENDIDIKAN
Halaman 29
maupun soal bentuk uraian pada setiap pokok bahasan. Penentuan bobot untuk setiap pokok bahasan dilakukan berdasarkan jumlah jam pertemuan yang tercantum dalam silabus pembelajaran. 3. Analisis buku pelajaran dan sumber materi belajar lainnya Analisis buku pelajaran dan sumber materi belajar lainnya mempunyai tujuan sama dengan analisis kurikulum, yaitu menentukan bobot setiap pokok bahasan. Akan tetapi analisis buku pelajaran menentukan bobot setiap pokok bahasan berdasarkan kedalaman materi (jumlah halaman materi) yang termuat dalam buku pelajaran atau sumber materi belajar lainnya. Tes yang akan disusun merupakan sampel yang dapat mewakili populasi materi yang telah diajarkan. Soal yang tidak di sampel akan menghasilkan beratus-ratus soal pada setiap bidang studi untuk mewakili populasi materi yang pernah diajarkan. Hal ini sangat sulit dilakukan mengingat waktu yang dibutuhkan peserta tes untuk menyelesaikan tes dengan butir soal sebanyak itu terlalu lama. Untuk dapat memilih sampel yang tepat diperlukan (a) analisis kurikulum, dan (b) analisis buku pelajaran dan sumber materi lainnya. Kegiatan inilah yang dimaksudkan dengan timbangan buku, sehingga tidak mengakibatkan kesimpulan dan penilaian yang sesat. 4. Membuat Kisi-kisi Kisi-kisi atau Blueprint atau Tabel of Spesification bermanfaat untuk menjamin sampel soal yang baik, dalam arti mencakup semua pokok bahasan secara proporsional. Agar butir-butir tes mencakup keseluruhan materi secara proporsional maka sebelum menulis butir-butir tes terlebih dahulu harus dibuat kisi-kisi sebagai pedoman. Sebuah kisi-kisi memuat jumlah butir yang harus dibuat untuk setiap bentuk soal, untuk setiap pokok bahasan dan untuk setiap aspek kemampuan yang akan diukur. 5. Penulisan Indikator (PI)
EVALUASI PENDIDIKAN
Halaman 30
Penulisan PI harus sesuai dengan ketentuan yang telah ditetapkan. PI harus mencerminkan tingkah laku peserta didik, oleh karena itu harus dirumuskan secara operasional, dan secara teknis menggunakan kata-kata operasional. 6. Penulisan Soal Berdasarkan kisi-kisi dalam bentuk tabel spesifikasi yang tersedia, maka dibuat butir-butir soal atau item-item tes. Banyaknya butir yang harus dibuat untuk setiap bentuk soal, untuk setiap kompetensi dasar, dan untuk setiap aspek kemampuan yang hendak diukur harus disesuaikan dengan yan tercantum dalam kisi-kisi. 7. Telaah Soal (Validasi konsep) Setelah soal dibuat sesuai dengan indikator dan sudah mewakili KD, selanjutnya ditelaah dari aspek isi dan bahasa. 8. Reproduksi Tes Terbatas Tes yang sudah dibuat diperbanyak dalam jumlah yang cukup menurut jumlah sampel uji-coba atau jumlah peserta yang akan mengerjakan tes tersebut dalam suatu kegiatan uji-coba tes. 9. Uji-Coba Tes Tes yang telah direproduksi atau diperbanyak itu diuji-cobakan pada sejumlah sampel yang telah ditentukan. Sampel uji-coba harus mempunyai karakteristik yang kurang lebih denga peserta tes yang sesungguhnya , untuk itu cara penentuan sampel harus dilakukan dengan menggunakan metode yang tepat dan disesuaikan dengan tujuan uji-coba. 10. Analisis hasil uji-coba Berdasarkan data hasil uji-coba dilakukan analisis meliputi validitas butir, tingkat kesukaran, dan fungsi pengecoh. Berdasarkan validitas butir soal tersebut diadakan seleksi soal dengan menggunakan validitas tertentu. Soal-soal yang tidak valid akan didrop dan soal-soal yang valid akan ditetapkan atau dirakit menjadi suatu tes yang valid. Selanjutnya untuk memberikan gambaran kualitas tes tersebut secara empirik dihitung reliabilitasnya. EVALUASI PENDIDIKAN
Halaman 31
11. Revisi soal Soal-soal yang valid berdasarkan kriteria validitas empirik dikonfirmasikan dengan kisi-kisi. Soal-soal yang sudah memenuhi syarat dan telah mewakili semua materi yang akan diujikan, dirakit menjadi sebuah tes sedangkan soalsoal valid belum memenuhi syarat berdasarkan konfirmasi dengan kisi-kisi dapat diperbaiki atau direvisi sesuai keperluan. 12. Merakit soal menjadi tes Soal-soal yang valid dan telah mencerminkan semua pokok bahasan serta aspek kemampuan yang hendak diukur dapat dirakit menjadi sebuah tes yang valid. Urutan soal dalam suatu tes pada umumnya dilakukan menurut tingkat kesukaran soal, yaitu dari soal yang mudah sampai soal yang sulit.
Penulisan Butir Tes Tipe Pilihan Ganda 1.
Butir tes atau soal hendaklah menanyakan hal yang penting untuk diketahui,
2.
Tulislah butir tes yang berisi pernyataan yang jelas.
3.
Utamakan butir tes yang mengandung pernyataan urnum yang bertahan lama.
4.
Buatlah butir tes yang berisi hanya satu gagasan saja.
5.
Buatlah butir tes yang menyatakan inti pertanyaan dengan jelas. Gunakan kalimat sederhana dan tidak berlebih-lebihan.
6.
Sebaiknya butir tes tidak didasari oleh pemyataan negatif.
7.
Gunakan bahasa yang jelas, kata yang sederhana, dan pernyataan yang langsung.
8.
Butir tes harus memberikan alternatif bagi isi pernyataan yang paling penting.
9.
Berikan alternatif jawaban yang jelas berbeda.
10. Alternatif yang ditawarkan hendaknya mempunyai struktur dan arti yang sejajar atau dalam satu kategori. Penggunaan alternatif yang semata-mata meniadakan atau bertentangan dengan alternatif yang lain, haruslah dihindari.
EVALUASI PENDIDIKAN
Halaman 32
11. Bilamana mungkin, susunlah alternatif jawaban dalam urutan besamya atau urutan logisnya. 12. Penggunaan alternatif "bukan salah satu di atas" atau "semua yang di atas" hanya baik apabila kebenaran bersifat mutlak dan bukan semata-mata masalah lebih dan kurang baik atau masalah ; kebenaran relatif. 13. Jangan menjebak peserta tes dengan menanyakan hal yang tidak ada jawabannya. 14. Hindari penggunaankata-kata yang dapat dijadikan petunjuk oleh siswa dalam menjawab. Tipe Benar-Salah Kaidah atau petunjuk penulisan butir tes tipe benar salah telah dikemukakan oleh Ebel (1979) sebagai berikut ini: 1.
Butir tes haruslah mengungkap ide atau gagasan yang penting.
2.
Butir tes tipe benar salah hendaknya menguji pemahaman, jangan hanya mengungkap ingatan mengenai suatu fakta atau hafalan.
3.
Kebenaran atau ketidakbenaran suatu butir tes haruslah bersifat mutlak.
4.
Butir tes harus menguji pengetahuan yang spesifik dan jawabannya tidak jelas bagi semua orang, kecuali bagi mereka yang menguasaipelajaran.
5.
Butir tes harus dinyatakan secara jelas.
Tipe Jawaban Pendek 1.
Pernyataan atau pertanyaan butir tes harus ditulis dengan hati-hati, sehingga dapat dijawab dengan hanya satujawaban yang pasti.
2.
Sebaiknya rumuskan jawabannya lebih dahuiu baru kemudian menulis pertanyaannya.
3. Gunakan pertanyaan langsung, kecuali bilamana model kalimat tak selesai akan memungkinkan jawaban yang lebih jelas.
EVALUASI PENDIDIKAN
Halaman 33
4.
Usahakan agar dalam pertanyaan tidak terdapat petunjuk yang mungkin digunakan oleh subjek dalam menjawab butir tes.
5.
Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku.
Tipe Pasangan 1.
Premis dan respon hendaknya dibuat dalam jumlah yang tidak sama.
2.
Baik premis maupun respon haruslah berisi hal yang homogen, yaitu dari sejenis kategori isi.
3.
Usahakan agar premis dan responnya berisi kalimat-kalimat atau kata yang pendek.
4.
Buatlah petunjuk pernasangan yang jelas, sehingga penjawab soal atau pertanyaan mengetahui dasar apakah yang harus digunakan dalam memasangkan premis dan responnya.
5.
Sedapat mungkin susunlah premis dan respon masing-masing secara alfabetik atau menurut besarankuantitatifnya.
Tipe Karangan (Esai) 1.
Berikan pertanyaan atau tugas yang mengarahkan penjawab pertanyaan (siswa) agar dapat menunjukkan penguasaan pengetahuan yang penting.
2.
Buatlah pertanyaan yang arah jawabannya jelas, sehingga para ahli dapat setuju bahwa satu jawaban akan lebih baik dari pada yang lainnya.
3.
Jangan menanyakan sikap ataupendapat.
4.
Sebaiknya pertanyaan diawali oleh kata-kata seperti, "Bandingkan ...", "Berikan alasan ...", "Jelaskan mengapa ..."",
"Beri contoh ...", dan
semacamnya. 5.
Jangan memberi kesempatan kepada penjawab soal untuk memilih dan menjawab hanya sebagian di antara nomor pertanyaan yang disediakan.
6.
Sebaiknya, tulis lebih dahulu satu jawaban ideal yang dikehendaki, baru kemudian menyusun pertanyaannya.
EVALUASI PENDIDIKAN
Halaman 34
BAB III PENSEKORAN, PEMBERIAN NILAI DAN PELAPORAN HASIL EVALUASI
Tes yang telah disusun dengan sebaik-baiknya, dan dikembangkan menurut prosedur yang benar, maka diharapkan bahwa hasil ukur tes tersebut akan dapat mengungkapkan dengan tepat ciri atau keadaan sesungguhnya dari peserta tes. Dengan kata lain, tes yang telah mempunyai validitas dan reliabilitas yang memadai, misalnya untuk mengukur tingkat pencapaian atau penguasaan peserta didikt terhadap materi pelajaran A diharapkan dapat mengungkapkan dengan tepat penguasaan (kemampuan) siswa terhadap materi pelajaran A tersebut. Artinya sekor yang diperoleh sebagai hasil ukur tes itu, betul-betul menggambarkan kemampuan atau penguasaan terhadap materi A itu, sehingga hasil ukur itu tepat digunakan untuk menentukan nilai atau kelulusan/keberhasilan peserta tes. A. Pengertian Sekor dan Nilai Selain penyusunan dan pengembangan tes, seperti telah dibahas seblumnya, hal penting lain dalam penilaian hasil belajar dengan menggunakan tes, adalah memberi nilai atau memberi sekor. Sebelum dibahas tentang pengertian sekor, terlebih dahulu dibahas mengenai bobot (weight). Bobot adalah bilangan atau angka yang dikenakan terhadap setiap butir soal yang nilainya ditentukan berdasarkan usaha peserta tes dalam menyelesaikan soal itu. Tinggi-rendahnya usaha itu dipengaruhi oleh derajat kesukaran dan waktu yang diperlukan untuk menjawab soal tersebut dengan benar. Jika derajat kesukaran suatu butir soal makin tinggi, maka makin besar pula bobot untuk soal tersebut, karena memerlukan usaha (kognitif) yang derajatnya lebih tinggi. Disamping itu waktu penyelesaian soal tersebut lebih lama dari soal lainnya. Bobot suatu butir soal disebut sekor untuk butir soal tersebut. Sekor untuk keseluruhan butir soal dari perangkat tes yang diperoleh seseorang disebut sekor tes dari orang tersebut. Sekor ini disebut sekor aktual, artinya sekor kenyataan EVALUASI PENDIDIKAN
Halaman 35
(empirik) atau sekor mentah yang diperoleh peserta tes. Jika seluruh soal dalam perangkat tes dapat dijawab dengan benar sesuai harapan pembuat soal, sekor untuk menyatakan kondisi ini disebut sekor maksimal ideal.
Sebaliknya untuk
kondisi tidak ada satupun benar disebut sekor minimal ideal. Dengan demikian sekor adalah bilangan yang merupakan data mentah dari hasil suatu penilaian, belum diolah lebih lanjut. Jadi bersifat kuantitatif. Sekor merupakan data mentah yang tidak dapat diinterpretasikan bila ia masih berdiri sendiri tanpa informasi lain yang relevan. Misalnya sekor peserta Diklat dalam suatu tes akhir adalah 80. Sekor tersebut tidak dapat diinterpretasikan karena tidak ada pembanding sebagai kriteria (tolok ukur). Jika sekor maksimum ideal (SMI) nya adalah 100, interpretasi dari sekor 80 dapat ditafsirkan tergolong baik, karena tingkat penguasaanya sekitar 80%. Sedangkan jika SMI-nya 500 dapat ditafsirkan tergolong jelek, karena tingkat penguasaanya hanya sekitar 16%. Begitu pula jika diketahui dua buah sekor dari dua peserta diklat yang berbeda, tidak dapat ditafsirkan mana yang lebih baik sebelum diketahui data lain sebagai kriteria. Data mentah yang telah diolah lebih lanjut dengan menggunakan aturan dan kriteria tertentu sehingga dapat diinterpretasikan dinamakan nilai. Nilai ini dapat berupa bilangan (kuantitatif), misalnya nilai 9 dalam skala 1 sampai 10, atau berupa kualitatif, misalnya B dalam skala penilaian A, B, C, D, dan E. 1. Penentuan Sekor dan Pemberian Nilai Dalam kaitan dengan memberi sekor dan menilai terhadap hasil tes dapat dibedakan atas dua macam berdasarkan jenis sekor yang diperoleh dari masingmasing butir tes, yaitu (1) memberi sekor untuk tes bentuk uraian, dan (2) memberi sekor untuk tes obyektif (pilihan ganda, benar-salah, menjodohkan, dan sejenisnya). (a) Pemberian Sekor untuk Tes Uraian Untuk tes uraian (subyektif) setiap butir diberi sekor dari 0 sampai dengan 10 tergantung dari tingkat kebenaran jawabannya, yaitu diberi sekor 10 jika jawabannya tepat sama dengan pendapat pemberi sekor, diberi sekor 5 jika EVALUASI PENDIDIKAN
Halaman 36
jawabannya setengah benar menurut pendapat pemberi sekor, diberi sekor 0 jika jawabannya salah sama sekali, dan seterusnya. Sekor setiap peserta tes diperoleh dari jumlah sekor semua item atau buitr tes. Sekor yang diperoleh di sini di sebut sekor mentah. Misalnya seorang peserta mendapat sekor 75 dengan SMI-nya 100 berarti peserta tersebut telah mencapai 75% tingkat penguasaan dari tes uraian tersebut. (b) Pemberian Sekor untuk Tes Obyektif Tes obyektif seperti pilihan berganda, setiap butir tes hanya dapat dijawab benar atau dijawab salah oleh peserta tes. Oleh karena itu maka setiap butir hanya mempunyai sekor 0 atau 1. Jenis tes semacam ini juga disebut sebagai tes dikotomus. Jika peserta tes menjawab benar diberi sekor 1, dan jika siswa menjawab salah diberi sekor 0. Sekor setiap peserta tes diperoleh dari jumlah sekor semua butir tes. Pendapat pemberi sekor tidak mempengaruhi sekor peserta tes dalam tes obyektif. Dengan demikian maka sekor tes obyektif ditentukan oleh banyaknya butir yang dijawab benar. Sekor yang diperoleh di sini juga masih disebut sekor mentah. Dalam suatu ujian dengan tes obyektif seorang peserta tes, misalnya dapat menjawab 8 buah soal dari 10 soal bentuk B – S. Apakah tingkat penguasaan peserta tes tersebut 80%? Menurut teori probabilitas option (pilihan) B dan S masing-masing nilai kemungkinannya sama untuk terpilih jika ditebak, yaitu ½ . Untuk menentukan tingkat penguasaan soal bentuk obyektif diperoleh hubungan: Jumlah jawaban benar = banyaknya jawaban yang benar-benar dikuasai + banyaknya jawaban tebakan. Jika kita misalkan banyaknya jawaban yang benar-benar dikuasai peserta tes X, maka untuk contoh B – S di atas diperoleh persamaan:
8 = X + (10 - X). ½ , diperoleh X = 6. Jadi tingkat
penguasaan sebenarnya dari peserta tes tersebut adalah 60%. Jika soal tersebut berbentuk pilihan ganda dengan 4 pilihan, maka tingkat penguasaan peserta tes dapat dicari melalui hubungan: 8 = X + (10 - X). 1/4 ,
EVALUASI PENDIDIKAN
Halaman 37
diperoleh X = 7. Jadi tingkat penguasaan sebenarnya dari peserta tes tersebut adalah 70%. Misalkan disajikan 100 butir soal pilihan ganda dengan 5 pilihan. Seorang peserta tes menjawab benar sebanyak 60 butir. Berapa butir soal yang benarbenar dikuasai oleh peserta tes tersebut? Untuk menjawab pertanyaan ini, kita misalkan banyak butir yang dikuasai dengan X. Sisanya, yaitu (10 – X) butir dijawab dengan tebakan, sehingga diperoleh hubungan: 60 = X + (100 - X). 1/5 , diperoleh X = 50. Jadi banyaknya butir soal yang benar-benar dikuasai sebanyak 50 butir atau 50% dari seluruh materi. Pada contoh-contoh di atas, tampak bahwa tingkat penguasaan selalu relatif lebih kecil dari jumlah jawaban yang benar. Untuk menanggulangi masalah tersebut, maka pemberian sekor untuk soal tipe obyektif menggunakan rumusrumus seperti di bawah ini. (a) Rumus sekor untuk soal bentuk B – S S = (JB - JS) x b dengan: S JB JS b
= sekor = Jumlah jawaban benar = Jumlah jawaban salah = bobot
(b) Rumus sekor untuk soal bentuk Pilihan Ganda (P–G) S
=
JS J B x b ( n 1 )
Dengan n = banyaknya pilihan yang disediakan setiap butir (c) Rumus sekor untuk soal bentuk menjodohkan S
=
JS J B x b ( n 1 )( n 1 ) 1 2
dengan n1 = banyaknya stem pada kolom sebelah kiri
EVALUASI PENDIDIKAN
Halaman 38
n2 = banyaknya alternatif jawaban pada kolom sebelah kanan (d) Rumus sekor untuk soal bentuk Isian S
= JB x b
Tanpa pengurangan (hukuman) sebab tidak ada pilihan. Misalkan suatu tes sumatif terdiri dari 10 bentuk Benar-Salah, 20 butir bentuk P-G dengan 4 option, 5 butir bentuk Memasangkan dengan 7 alternatif jawaban, dan 10 butir isian. Mengingat kadar kesulitan dan usaha peserta Diklat dalam mengerjakan setiap bentuk soal tersebut berlainan maka bobot untuk soal bentuk B-S ditentukan 1, bentuk P-G bobotnya 3, bentuk Memasangkan bobotnya 1 ½, dan bentuk isian bobotnya 2. jika seorang siswa dapat menjawab benar bentuk B-S 7 soal, bentuk P-G 15 soal, bentuk Memasangkan 2 soal, dan bentuk isian 8 soal, maka berapa sekor yang diperoleh peserta Diklat tersebut? Berapa pula tingkat penguasaannya? (Silahkan dikerjakan)
(c) Pemberian Nilai Berdasarkan Acuan Patokan Pemberian nilai jenis ini berdasarkan atas tujuan instruksional yang telah ditentukan. Artinya nilai diberikan kepada peserta tes menunjukkan tingkat pencapaian tujuan instruksional atau tingkat penguasaan terhadap materi yang telah ditentukan. Untuk keperluan tersebut, pertama-tama sekor mentah diterjemahkan ke dalam sekor 1 sampai 100, yang menunjukkan prosentase pencapaian tujuan instruksional yang dicapai. Untuk yang menggunakan nilai 1 – 10, maka sekor 1 – 100 yang ditransformasikan ke nilai 1- 10, sedang yang menggunakan 0 – 4, maka sekor 1 – 100 ditransformasikan ke nilai 0 – 4 misanya dengan ketentuan berikut: X < 56 diberi nilai 0 56 < X < 65 diberi nilai 1 65 < X < 80 diberi nilai 2 80 < X < 90 diberi nilai 3
EVALUASI PENDIDIKAN
Halaman 39
X > 56 diberi nilai 4
(Djaali, 2004)
(d) Pemberian Nilai Berdasarkan Acuan Kelompok Pemberian nilai sejenis ini menggunakan kelompok sebagai kriteria. Nilai peserta tes ditentukan oleh posisinya dalam kelompok. Misalnya seorang peserta Diklat mendapat sekor 75 (hanya 75% dari tujuan instruksional yang dicapai) dapat diberi nilai 9 dalam penilaian acuan kelompok. Atau peserta Diklat yang hanya mendapat sekor 35 dapat diberi nilai 6, sehingga dapat lulus dalam tingkat penguasaan 35%. Tetapi dapat terjadi bahwa Peserta Diklat yang mendapat sekor 75 tidak berhasil lulus karena peserta-peserta lain dalam kelompoknya mendapat nilai di atas 75 (75% dari tujuan tercapai). Ada beberapa cara yang dapat ditempuh dalam pemberian nilai dengan menggunakan acuan kelompok, yang akan dibahas dengan menggunakan beberapa skala penilaian. B. Skala Penilaian Untuk mengubah sekor menjadi nilai digunakan teknik analisis tertentu dan skala penilaian sebgai berikut. 1. Skala Sebelas Skala sebelas atau “standard Eleven” yang disingkat Stanel
adalah cara
mengubah sekor mentah yang diperoleh peserta tes ke dalam 11 kelompok nilai, yaitu 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Skala ini paling biasa, sering , dan paling mudah proses perhitungannya. Ada dua cara pengolahan dengan menggunakan skala 11, yaitu dengan (1) menghitung prosesntase tingkat penguasaan, dan (2) pendekatan distribusi normal sistem PAP dan PAN. 2. Skala Sepuluh Dengan menggunakan skala 10, maka sekor mentah ditransfer ke dalam nilai 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Pembagian interval untuk skala 10 dilakukan dengan cara selang kurva normal dibagi menjadi 10 selang bagian yang sama jaraknya, yaitu 0,6 s. Cara lain yang lebih mudah dan banyak dipakai adalah dengan
EVALUASI PENDIDIKAN
Halaman 40
menggunakan selang konversi untuk skala 11, dengan membuang satu selang yang paling kiri pada kurva normal atau paling bawah pada tabel konversi. 3. Skala Sembilan Skala sembilan atau “standard nine” yang disingkat Stanin. Dengan menggunakan skala 9, maka sekor mentah ditransfer ke dalam nilai 1, 2, 3, 4, 5, 6, 7, 8, dan 9. Pembagian interval untuk skala 9 dilakukan dengan cara selang kurva normal dibagi menjadi 9 selang bagian yang sama jaraknya, yaitu 0,67s. Cara lain yang lebih mudah dan banyak dipakai adalah dengan menggunakan selang konversi untuk skala 10, dengan membuang satu selang yang paling kanan pada kurva normal atau paling atas pada tabel konversi. 4. Skala Lima Skala lima disebut pula skala huruf karena nilai akhir biasanya tidak dinyatakan dengan angka, melainkan dengan huruf A, B, C, D, dan E. Pembagian interval untuk skala 5 dilakukan dengan cara selang kurva normal dibagi menjadi 5 selang bagian yang sama jaraknya, yaitu 1,20s atau 1s.
Misalkan seorang
instruktur menentukan batas lulus dalam suatu tes, jika pesera tes telah menguasai 40% atau lebih dari materi yang harus dikuasainya. Tabel konversi yang dapat digunakan adalah: 90% A 100% istimewa, sangat baik 75% B < 90%
baik
55% C < 75%
sedang, cukup
40% D < 55%
kurang
00% E < 40%
jelek, buruk, tidak lulus
5. Skala Baku Agar sekor mentah mempunyai arti kaitannya dengan posisi atau kedudukan relatif secara keseluruhan, diperlukan adanya sekor yang dapat dibandingkan satu sama lain yang disebut sekor baku. Sekor baku disebut juga skala baku atau sekor Z.
EVALUASI PENDIDIKAN
Halaman 41
Sekor baku adalah sekor mentah yang ditransformasikan secara linear ke dalam bentuk lain berdasarkan rata-rata hitung dan deviasi standar distribusinya. Konversi sekor mentah X menjadi sekor baku Z dilakukan dengan menggunakan rumus konversi Z seperti berikut.
Xi X S dengan : Z skor z X i skor mentah ke i Z
X rata rata hitung s deviasi baku Misalnya Peserta Diklat memperoleh sekor
75 pada pelajaran A dan
memperoleh sekor 90 pada pelajaran B. Dari sekor ini belum dapat ditentukan pada pelajaran mana Peserta Diklat tersebut lebih berprestasi. Apabila rata-rata sekor pelajaran A (X) = 55 dan deviasi bakunya (S) = 10, sedangkan untuk pelajaran B rata-ratanya (X) = 80 dan deviasi bakunya (S) = 12. Untuk pelajaran A:
Z
Untuk pelajaran B:
75 55 2 10
Z
90 80 0.83 12
melalui perhitungan sekor- Z dapat dibandingkan posisi relatif kedua sekor peserta Diklat tersebut. Tampak bahwa prestasi pada pelajaran A relatif lebih baik dibandingkan pada pelajaran B. 6. Skala Seratus Nilai dengan menggunakan skala 100 disebut juga sekor T yang bergerak dari 10 sampai dengan 90. Sekor T mempunyai rata-rata 50 dan simpangan baku 10. Rumus sekor T adalah: T = 50 + 10Z
atau
T = 50 + 10
Xi X s
Jika nilai Z pada skala Z di atas ditransformasikan ke sekor T, maka diperoleh: Untuk pelajaran A:
EVALUASI PENDIDIKAN
Untuk pelajaran B:
Halaman 42
T = 50 + 10(2) =70
T = 50 + 10(0.83) =58,3
Jadi prestasi peserta diklat tersebut pada pelajaran A relatif lebih baik dibandingkan pada pelajaran B. C. Sekor Komposit dan Nilai Akhir Dalam kaitannya dengan penilaian, terkadang sekor harus diperoleh dari beberapa kali pelaksanaan tes. Sekor yang dipakai dalam kasus seperti ini adalah sekor akhir. Jika sekor akhir diperoleh dari beberapa komponen, misalnya dari ujian formatif, kuis harian, tugas rumah, dan ujian akhir, maka sekor tunggal diperoleh dengan melakukan penggabungan sekor dari berbagai komponen disebut sekor komposit. Sekor komposit merupakan ukuran yang lebih reliabel terhadap prestasi peserta tes daripada sekor yang diperoleh dari satu tes saja. Penetapan sekor komposit dimaksudkan untuk memperoleh satu ukuran yang mencerminkan secara proporsional berbagai sumber sekor dari berbagai komponen yang diujikan secara terpisah. Salah satu rumusan sekor komposit misalnya adalah: Sekor komposit
=
bz b
dimana b = bobot komponen,
z = sekor- z pada setiap komponen
Pembobotan komponen ditentukan dengan melihat urgensi komponen yang bersangkutan dalam program pengajaran. Apabila tugas praktikum, misalnya sangat penting dalam penguasaan suatu pelajaran, maka sekor pada tugas ini harus diberi bobot lebih tinggi. Jika ujian formatif mencakup setengah dari keseluruhan materi pelajaran, maka sekor pada ujian tersebut perlu diberi bobot yang sama besar dengan ujian akhir.
EVALUASI PENDIDIKAN
Halaman 43
Contoh menentukan sekor komposit. Misalnya nilai akhir Diklat PSD diperoleh dari ujian teori dengan bobot 60% dan ujian praktek laboratorium 40%. Ujian teori menggunakan tes pilihan ganda dengan jumlah butir 50 sehingga sekor mentah ujian teori adalah (0 – 50), sedang ujian praktikum diberi sekor mentah (0 – 10). Karena kedua sekor tidak layak banding maka sebelum dibandingkan kedua sekor harus dibakukan dulu menjadi sekor T, dengan rumus T = 50 + 10Z. Hasil ujian teori dan ujian praktikum 15 orang siswa No
Sekor Teori (X1)
T1
T2
N
46
Sekor Praktek (X2) 5
1
69,96
42,30
58,90
2
40
8
55,70
61,55
58,00
3
42
4
60,46
35,88
50,63
4
30
6
31,94
48,72
38,65
5
36
8
46,20
61,55
52,34
6
36
6
46,20
35,88
42,07
7
36
6
46,20
48,72
47,21
8
38
7
50,95
61,55
55,20
9
38
5
50,95
48,72
50,06
10
34
5
41,44
48,72
44,35
11
34
7
41,44
55,14
46,92
12
32
3
36,69
29,46
33,80
13
40
9
55,70
67,97
60,61
14
38
7
50,95
55,14
52,63
15
44
7
65,21
55,14
61,18
Keterangan: (data fiktif)
EVALUASI PENDIDIKAN
Halaman 44
Penyelasaian: X1 37,6
S1 4,208
X 2 6,20
S 2 1,558
NM
Rumus: N
6(55,70) 4(67,97) 60,61 10
6T1 4T2 10
NN
6(50,95) 4(55,14) 52,63 10
Nilai-nilai tersebut adalah nilai dalam bentuk sekor T, nilai akhit harus disesuaikan dengan rentangan nilai sesuai kebutuhan. Penentuan nilai akhir ini dilakukan terutama pada saat pendidik akan mengisi nilai raport. Beberapa rumus yang mencerminkan sekor komposit yang dapat digunakan antara lain sebagai berikut. a) Penentuan nilai akhir dengan mempertimbangkan nilai tes formatif dan tes sumatif
( F1 F2 ........ Fn ) 2S n NA = 3 Keterangan: NA = Nilai Akhir F
= Nilai tes formatif
S
= Nilai tes sumatif
b) Penentuan nilai akhir dengan mempertimbangkan nilai tugas, nilai formatif dan nilai sumatif dengan bobot 2, 3, dan 5. NA =
2T 3 F 5S 10
Keterangan: T
= Nilai Tugas,
F
= Nilai tes formatif , S = Nilai tes sumatif
c) Penentuan nilai akhir dengan mempertimbangkan nilai formatif, nilai formatif dan nilai praktek dengan bobot 2, 2, dan 1.
EVALUASI PENDIDIKAN
Halaman 45
NA =
2T 2 F P 5
Keterangan: T
= Nilai tes formatif
F
= Nilai tes sumatif
P
= Nilai tes praktek
D. Daya Serap Dengan menentukan daya serap peserta tes, dapat diketahui materi mana yang telah dikuasai dan mana yang belum dikuasai. Dalam ruang lingkup yang lebih besar dapat diketahui keberhasilan belajar dalam berbagai mata pelajaran. Hal ini berguna sebagai feed back untuk perbaikan pengajaran yang akan dilaksanakan kemudian. Pengertian daya serap itu sendiri adalah sebagai prosentase penguasaan peserta tes terhadap bahan pelajaran yang telah dipelajarinya atau materi tes yang telah disajikan. Ada beberapa daya serap, diantaranya daya serap pokok/sub pokok bahasan, daya serap mata pelajaran, dan daya serap umum. a.Daya serap Kompetensi Dasar Daya serap Kompetensi Dasar ditentukan dengan cara menghitung rata-rata prosentase jawaban benar dari semua soal yang disajikan dalam Kompetensi Dasar. Tabel. Daya Serap Kompetensi Dasar X Nomor Soal
EVALUASI PENDIDIKAN
Prosentase
1
90%
2
85%
3
70%
4
45%
5
15%
Rata-rata
61%
Halaman 46
Misalkan untuk soal yang berkenaan dengan Kompetensi Dasar X, disajikan 5 butir soal dengan prosentase jawaban benar seperti pada tabel di atas. Tampak pada tabel bahwa daya serap Kompetensi Dasar X adalah 61%. b. Daya serap pokok bahasan Daya serap mata pelajaran adalah rerata prosentase jawaban benar dari seluruh pokok bahasan dalam mata pelajaran tertentu. Misalkan untuk pokok bahasan berkenaan dengan mata pelajaran A, disajikan 6 pokok bahasan dengan daya serap sebagai berikut. Tabel Daya Serap pokok bahasan No
Pokok Bahasan
Daya Serap
1
Persamaan Kuadrat
2
Suku Banyak dan Teorema Sisa
85%
3
Fungsi Eksponen dan Logaritma
82%
4
Vektor
65%
5
Fungsi f(x) = a Cos x + b Sin x
6
Diferensial dan Integral
Rata-rata
75%
67% 40% 69%
Keterangan: cantoh dan data fiktif Tanpak pada tabel di atas bahwa daya serap Mata Pelajaran Matematika adalah sebesar 69%.
c. Daya serap umum Daya serap umum adalah rerata dari daya serap seluruh mata pelajaran. Pada tabel di atas merupakan contoh dari daya serap salah satu mata pelajaran. Tabel berikut merupakan contoh daya serap umum.
EVALUASI PENDIDIKAN
Halaman 47
Tabel Daya Serap Mata Pelajaran No
Mata Pelajaran
Daya Serap
1
PPKn
69%
2
Pendidkan Agama
80%
3
Bahasa Indonesia
65%
4
Matemátika
75%
5
IPA
87%
6
IPS
62%
Rata-rata
73%
Keterangan: data fiktif Tampak pada tabel di atas bahwa daya serap seluruh Mata Pelajaran adalah 73%. E. Penentuan Peringkat Peringkat atau rank adalah suatu istilah untuk menyatakan kedudukan seseorang peserta tes dalam kelompoknya menurut urutan tingkatan. Proses penentuan rank disebut rangkin, yaitu dengan cara mengurutkan nilai-nilai peserta mulai dari sekor paling tinggi menuju ke sekor paling rendah. Ada beberapa macam cara untuk menentukan peringkat, diantaranya
dengan
menggunakan: 1. Peringkat sederhana (Simple Rank) Peringkat sederhana merupakan urutan yang dinyatakan dengan nomor untuk menunjukkan letak kedudukan peserta tes dalam kelompoknya. Misalkan dalam suatu pelatihan terdiri dari 20 orang peseta didik, dengan nilai untuk setiap peserta adalah seperti di bawah ini. Salman = 73
Rani
Vijay = 48
Esha = 63
Ajay
Fikran = 55
Rahul = 90
Taqur = 84 Juhi
Dixit
Rohan = 69 Liza
= 65
EVALUASI PENDIDIKAN
= 63
Kajol = 86
= 56
= 73 Dian
Poeja = 56 Kumar = 47 = 73
= 82
Halaman 48
Anjani = 77
Mirza = 57
Desi
= 56
Inul
= 56
Untuk menentukan peringkat dari 20 peserta tersebut di atas, dilakukan dengan langkah-langkah sebagai berikut. (i)
urutkan nilai-nilai tersebut dari yang tertinggi ke terendah;
(ii)
beri nomor urut sesuai dengan urutan pada bagian (i);
(iii) untuk nomor urut yang menyatakan satu nilai, maka nomor urut tersebut adalah nomor peringkat peserta yang bersangkutan; (iv) untuk nomor urut yang menyatakan dua nilai, nomor peringkat untuk kedua peserta yang bersangkutan adalah rerata dari dua nomor urut tersebut. Begitupula untuk tiga nomor urut yang menyatakan tiga nilai sama, dan seterusnya. Tabel Peringkat Sederhana Sekor Terurut
Nomor Urut
Peringkat
Subyek
90
1
1
Rahul
86
2
2
Kajol
84
3
3
Taqur
82
4
4
Dian
77
5
5
Anjani
73
1 (6 7 8) 7 3
73
6 7 8
Salman Ajay Juhi
69
9
65
10
63 63
11 12
57
13
73
56
9 10
1 1 (11 12 ) 11 2 2 13
Rohan Dixit
Rani Esha Mirza
56
EVALUASI PENDIDIKAN
Halaman 49
56 56 55 48 47
14 15 16 17
1 1 (14 15 16 17) 15 4 2
Liza Desi Poeja Inul
18
Fikran
19
Vijay
20
Kumar
18 19 20
Keterangan: nama dan data fiktif Tolok ukur untuk membandingkan peserta tes adalah jumlah seluruh peserta dalam kelompoknya. Dengan demikian untuk menuliskan peringkat peserta harus disertai dengan jumlah seluruh siswa dalam kelompoknya. Misalnya peringkat untuk “Anjani” adalah 5 dari 20 atau biasa ditulis 5/20. Jadi Anjani tergolong 5 orang pandai di kelompoknya. Peserta lainnya, yaitu sebanyak 15 orang prestasinya adalah di bawah Anjani. Dalam praktek peserta yang nilainya sama kadang-kadang diberi peringkat berbeda dengan meninjau aspek-aspek lain, misalnya kerajinan, gains, disiplin, kesungguhan, kreativitas dan aktivitas lainnya.
2. Peringkat dengan Simpangan Baku Peringkat dengan menggunakan simpangan baku menggolongkan peserta tes dalam kelompok-kelompok kecil yang dibatasi oleh suatu simpangan baku tertentu. Pengelompokan ini ada dua cara, yaitu pengelompokan menjadi tiga peringkat dan pengelompokan menjadi beberapa peringkat. Pengelompokan menjadi 3 peringkat menggunakan kurva normal standar, yaitu: a. Kelompok atas sebanyak 15,87% yang berada pada interval lebih dari atau sama dengan X 1 S b. Kelompok tengah sebanyak 68,26% yang berada pada interval dari
X 1 S sampai X 1 S
EVALUASI PENDIDIKAN
Halaman 50
c. Kelompok bawah sebanyak 15,87% yang berada pada interval lebih dari atau sama dengan X 1 S . Sebagai contoh dengan menggunakan data tabel 4.1 diperoleh X 66,45 dan s = 13,52. Kemudian dihitung batas-batas kelompok: X 1 S = 78,97
dan
X 1 S = 53,93, sehingga pengelompokan itu adalah: Kelompok atas
: X
78,97, sebanyak 4 orang; Kelompok tengah : 53,93 X 78,97, sebanyak 14 orang; Kelompok bawah : X 53,93, sebanyak 2 orang. Pengelompokan yang lain adalah dengan pembagian ke dalam 5 kelompok, 9 kelompok, kelompok 10 dan 11 yang prinsipnyan sama dengan pembagian dalam 3 kelompok di atas.
PUSTAKA ACUAN
Bloom, Benyamin S (1979). Taxonomy of Educational Objective. London: Longman, 1979. Bloom, Benyamin S, et al.(1985) Evaluation to Improve Learning. New York: McGraw-Hill Book Company, 1981. Djaali. (2004). Pengukuran Dalam Bidang Pendidikan. Jakarta: PPs Universitas Negeri Jakarta Nana Sudjana. 2006. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya. Nana Sudjana, R. Ibrahim. 2000. Penelitian dan Penilaian Guruan. Bandung: Sinar Baru. Suherman, Erman. (1990). Wijayakusuma
Penilaian
Pendidikan
Matematika.
Bandung:
Nitko, Anthony J. Educational Assessment of Students. Ohio: Merril, 1996. Suryabrata, Sumadi. Pengembangan Alat Ukur Psikologis, Yogyakarta: Penerbit ANDI, 2000.
EVALUASI PENDIDIKAN
Halaman 51