5
BAB II KAJIAN PUSTAKA
2.1 Evaluasi Pendidikan 2.1.1 Pengertian Evaluasi Evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Dengan demikian secara harfiah evaluasi pendidikan (educational evaluation) dapat diartikan sebagai penilaian dalam (bidang) pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan (Sudijono, 2011:1). Sedangkan dalam arti luas, evaluasi adalah suatu proses merencanakan, memperoleh, dan menyediakan informasi yang sangat diperlu kan untuk membuat alternatif - alternatif keputusan (Mehrens & Lehman 1978 dalam Purwanto, 2008 : 3). Edwind wand dan Gerald W. Brown (dalam Sudijono, 2001:1) menjelaskan: Evaluation refer to the act process to determining the value of something. Menurut definisi ini, maka evaluasi adalah tindakan atau proses untuk menentukan nilai dari sesuatu. Sesuai dengan pendapat tersebut maka evaluasi pendidikan dapat diartikan sebagai suatu tindakan atau proses untuk menentukan nilai dari sesuatu dalam dunia pendidikan atau segala sesuatu yang ada hubungannnya dengan dunia pendidikan. Evaluasi pendidikan adalah kegiatan atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu dan hasilnya.
6
Arikunto (2002:13) mendefinisikan evaluasi dengan terlebih dahulu menjelaskan tentang mengukur dan menilai. Mengukur adalah membandingkan sesuatu dengan satu ukuran dan bersifat kuantitatif. Menilai adalah mengambil sesuatu keputusan terhadap sesuatu dengan ukuran baik buruk dan bersifat kualitatif. Sedangkan mengadakan evaluasi meliputi kedua langkah diatas, yaitu mengukur dan menilai. Dengan demikian evaluasi adalah menilai (tetapi dilakukan dengan mengukur terlebih dahulu). Dalam konteks kalimat yang berbeda tetapi mengandung arti yang sama, Wrigstone dkk 1956 (dalam Purwanto 2008 : 3) mengemukakan rumusan evaluasi pendidikan sebagai berikut : “Educational evaluation is the estimation of the growth and progress of pupils toward objectives or values in the curriculum.” (Evaluasi pendidikan ialah penafsiran terhadap pertumbuhan dan kemajuan siswa kearah tujuan-tujuan dan nilai-nilai yang telah ditetapkan di dalam kurikulum). 2.1.2 Dasar-Dasar Evaluasi Pendidikan Dalam pelaksanaannya, evaluasi harus mempunyai dasar yang kuat. Dasar yang dimaksud adalah prinsip ilmiah yang melandasi penyusunan dan pelaksanaan evaluasi yang mencakup 7 konsep yaitu: filsafat, psikologi, komunikasi, kurikulum, manajemen dan sosiologi-antropologi (Slameto, 2001:8). Dasar filsafat dalam evaluasi pendidikan berhubungan dengan masalah masalah yang merupakan dasar dalam pendekatan sistem yang menyangkut pertanyaan-pertanyaan apakah evaluasi itu, mengapa evaluasi perlu diberikan dan bagaimana cara memberikannya, yang dimaksud dengan dasar psikologi adalah bahwa evaluasi itu dilaksanakan harus mempertimbangkan tingkat kesukaran
7
dengan tingkat perkembangan siswa, tingkat kemampuan yang dimiliki siswa, dan teori-teori yang dianut dalam pendidikan. Dasar komunikasi dimaksudkan bahwa evaluasi itu dapat dilaksanakan secara langsung maupun tidak langsung. Adapun yang menjadi dasar evaluasi selanjutnya adalah kurikulum, maksudnya, isi evaluasi harus sesuai dengan materi yang diajarkan seperti tercantum dalam kurikulum yang telah ada dan dilaksanakan. Sedangkan dasar manajemen, artinya bahwa evaluasi perlu diorganisasikan pelaksanaannya, apakah secara individual atau kelompok dan bagaimana pengelolaannya. Disamping itu evaluasi harus sesuai dan berguna dalam masyarakat untuk mencapai suatu kemajuan. 2.1.3 Tujuan dan Fungsi Evaluasi Pendidikan Dalam konteks yang lebih luas lagi, Sax (1980 : 28) mengemukakan tujuan evaluasi dan pengukuran adalah untuk “selection, placement, diagnosis and
remediation,
feedback
:
norm-referenced
and
criterion-referenced
interpretation, motivation and guidance of learning, program and curriculum improvement : formative and summative evaluations, and theory development”. (seleksi, penempatan, diagnosis dan remediasi, umpan balik : penafsiran acurannorma dan acuan-patokan, motivasi dan bimbingan belajar, perbaikan program dan kurikulum : evaluasi formatif dan sumatif, dan pengembangan teori). Cronbach (1963 : 236) menjelaskan “evaluation used to improved the course while it is still fluid contributes more to improvement of education than evaluation used to appraise a product already on the market”. Cronbach nampaknya lebih menekankan fungsi evaluasi untuk perbaikan, sedangkan Scriven (1967) (dalam Purwanto, 2008) membedakan fungsi evaluasi menjadi dua
8
macam, yaitu fungsi formatif dan fungsi sumatif. Fungsi formatif dilaksanakan apabila hasil yang diperoleh dari kegiatan evaluasi diarahkan untuk memperbaiki bagian tertentu atau sebagian besar bagian kurikulum yang sedang dikembangkan. Sedangkan fungsi sumatif dihubungkan dengan penyimpulan mengenai kebaikan dari sistem secara keseluruhan. Fungsi ini baru dapat dilaksanakan jika pengembangan program pembelajaran telah dianggap selesai. Menurut Purwanto (2008:5) fungsi evaluasi sebagai berikut: a. Mengetahui tarap kesiapan siswa untuk menempuh suatu tujuan tertentu (pendidikan tertentu). b. Mengetahui seberapa jauh hasil yang telah dicapai dalam proses pendidikan yang telah dilaksanakan. c. Mengetahui apakah suatu mata pelajaran yang diajarkan dapat dilanjutkan dengan bahan yang baru atau harus kembali ke bahan semula. d. Mendapatkan bahan-bahan informasi dalam memberikan bimbingan tentang jenis pendidikan atau jenis jabatan untuk siswa tersebut e. Untuk mendapatkan bahan-bahan informasi untuk menentukan apakah seorang anak dapat dinaikan kelasnya atau tidak f. Untuk membandingkan prestasi yang telah dicapai siswa sesuai dengan kapasitasnya atau belum g. Untuk menafsirkan apakah seorang anak telah cukup matang untuk dilepaskan ke masyarakat atau ke jenjang pendidikan yang lebih tinggi h. Untuk mengadakan seleksi untuk mengetahui taraf efesiensi/efektivitas metode yang dipergunakan dalam pembelajaran Bagi penyusun soal, fungsi evaluasi perlu diperhatikan secara sungguhsungguh agar evaluasi yang diberikan betul-betul mengenai sasaran yang diharapkan. Berikut ini dikemukakan pendapat para ahli tentang tujuan dan fungsi evaluasi. Nurgiyantoro (1987:14) (dalam Purwanto, 2008) menyebutkan 5 tujuan dan fungsi evaluasi, yaitu: a. untuk mengetahui seberapa jauh tujuan-tujuan pendidikan yang telah ditetapkan itu dapat dicapai dalam kegiatan belajar mengajar yang dilakukan, b. untuk memberikan objektifitas pengamatan kita terhadap tingkah laku hasil belajar siswa,
9
c. untuk mengetahui kemampuan siswa dalam bidang-bidang atau topik-topik tertentu, d. untuk menentukan layak tidaknya seorang siswa dinaikkan ketingkat diatasnya atau dinyatakan lulus dari tingkat pendidikan yang ditempuhnya, e. untuk memberikan umpan balik bagi kegiatan belajar mengajar yang dilakukan. Menurut Arikunto (2001:10), tujuan atau fungsi penilaian ada beberapa hal, yaitu: 1) penilaian berfungsi selektif, 2) penilain berfungsi diagnostik, 3) penilain berfungsi sebagai penempatan dan 4) penilaian berfungsi sebagai pengukur keberhasilan. 2.2 Tes 2.2.1 Pengertian Tes Menurut Anne Anastasi (dalam Sudijono, 2001: 66), yang dimaksud dengan tes adalah alat pengukur yang mempunyai standar yang objektif sehingga dapat digunakan secara meluas, serta dapat betul-betul digunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan Sudijono (2001: 67) menyatakan bahwa tes adalah suatu tugas atau serangkaian tugas yang diberikan kepada individu atau sekelompok individu, dengan maksud untuk membandingkan kecakapan mereka, satu dengan yang lain. Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturanaturan yang sudah ditentukan. Sedangkan menurut Jacobs & Chase (1992) dalam Alwasilah (1996), tes merupakan suatu alat penilaian dalam bentuk tulisan untuk mencatat atau mengamati prestasi siswa yang sejalan dengan target penilaian. Selanjutnya, tes didefinisikan sebagai pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang suatu atribut
10
pendidikan atau suatu atribut psikologis tertentu. Setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar (Zainul dan Nasution, 2001). Menurut Muljono (2008) ada beberapa istilah yang terkait dengan tes, yaitu: 1. Tes: alat atau prosedur yang digunakan dalam pelaksanaan tes. 2. Testing: saat pada waktu pelaksanaan tes. 3. Testee: responden atau individu yang sedang mengerjakan tes. 4. Tester: orang yang melaksanakan pengambilan tes terhadap para testee yang bertugas untuk: (a) Mempersiapkan ruangan dan perlengkapan yang diperlukan (b) Membagikan lembaran tes dan alat-alat lain untuk mengerjakan (c) Menerangkan cara mengerjakan tes (d) Mengawasi testee mengerjakan tes (e) Memberikan tanda-tanda waktu (f) Mengumpulkan pekerjaan testee (g) Mengisi berita acara atau laporan yang diperlukan (jika ada). 2.2.2 Fungsi Tes Beberapa fungsi tes dalam dunia pendidikan menurut Djaali (dalam Muljono 2008) adalah: 1. Sebagai alat untuk mengukur prestasi belajar siswa.Tes dimaksudkan untuk mengukur tingkat perkembangan atau kemajuan yang telah dicapai siswa setelah menempuh proses belajar-mengajar dalam jangka waktu tertentu. 2. Sebagai motivator dalam pembelajaran. Tes dianggap sebagai motivator ekstrinsik, yaitu siswa akan belajar lebih giat dan berusaha lebih keras untuk memperoleh nilai dan prestasi yang baik.
11
3. Sebagai upaya perbaikan kualitas pembelajaran. Dalam rangka perbaikan kualitas pembelajaran, ada tiga jenis tes yang perlu dibahas yaitu; tes penempatan, tes diagnostik, dan tes formatif. 4. Sebagai penentu berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan
pendidikan
ke
jenjang
yang
lebih
tinggi
dengan
melaksanakan tes sumatif. 2.2.3 Jenis-Jenis Tes Jenis – jenis tes menurut Muljono (2008) adalah: 1. Berdasarkan fungsinya sebagai alat pengukur perkembangan atau kemajuan siswa, yaitu: a. Tes seleksi (selection test). Tes seleksi digunakan untuk memilih atau menyeleksi siswa yang terbaik dari semua peserta tes, materinya berupa materi prasyarat untuk mengikuti program pendidikan yang akan diikuti oleh calon siswa. Tes seleksi dapat dilakukan secara lisan, secara tertulis, dengan tes perbuatan, dan dapat juga ketiganya dikombinasikan secara serempak. b. Tes awal (pre-test). Tes awal merupakan tes yang dilaksanakan sebelum bahan pelajaran diberikan kepada siswa dengan tujuan untuk mengetahui sejauh manakah materi atau bahan pelajaran yang akan diajarkan telah dapat dikuasai oleh siswa.
12
c. Tes akhir (post-test) Tes akhir merupakan tes yang dilaksanakan dengan tujuan untuk mengetahui apakah semua materi pelajaran yang tergolong penting sudah dikuasai dengan sebaik-baiknya oleh siswa. Pada dasarnya materi pre-test sama dengan materi post-test. d. Tes diagnostik (diagnostic test) Tes diagnostik merupakan tes yang dilaksanakan untuk menentukan tepat jenis kesukaran yang dihadapi oleh para siswa dalam mata pelajaran tertentu. Tes diagnostik dapat dilaksanakan dengan secara lisan, tertulis, perbuatan atau kombinasi dari ketiganya. e. Tes formatif (formative test) Tes formatif merupakan tes hasil belajar yang bertujuan untuk mengetahui sudah sejauh manakah siswa sudah memahami pelajaran setelah mereka mengikuti proses pembelajaran dalam jangka waktu tertentu dan memperbaiki kualitas pembelajaran. Tes formatif biasa dilaksanakan di tengah-tengah perjalanan program pembelajaran, yaitu dilaksanakan pada setiap kali satuan pelajaran atau sub pokok bahasan berakhir atau dapat diselesaikan dan dikenal dengan istilah ulangan harian. f. Tes sumatif (summative test) Tes sumatif merupakan tes hasil belajar yang dilaksanakan setelah sekumpulan materi pelajaran atau satuan program pengajaran selesai diberikan. Tes sumatif dilaksanakan dengan tujuan untuk menentukan nilai
13
yang menjadi lambang keberhasilan siswa setelah mereka menempuh proses pembelajaran dalam jangka waktu tertentu. 2. Berdasarkan aspek psikis yang ingin diungkapkan, yaitu: a. Tes intelegensi (intellegency test) Tes intelegensi merupakan tes yang dilaksanakan dengan tujuan untuk mengungkapkan atau memprediksi kecerdasan seseorang. b. Tes kemampuan (aptitude test) Tes kemampuan merupakan tes yang dilaksanakan dengan tujuan untuk mengungkap kemampuan dasar atau bakat khusus yang dimiliki oleh testee. c. Tes sikap (attitude test) Tes sikap merupakan tes yang dilaksanakan dengan tujuan untuk mengungkap predisposisi atau kecenderungan seseorang untukmelakukan suatu respon tertentu terhadap dunia sekitarnya, baik berupa individuindividu maupun objek-objek tertentu. d. Tes kepribadian (personality test) Tes kepribadian merupakan tes yang dilaksanakan dengan tujuan mengungkapkan dengan ciri-ciri khas dari seseorang yang banyak sedikitnya bersifat lahiriyah, seperti gaya bicara, cara berpakaian, nada suara, hobi, bentuk tubuh, cara bergaul, cara mengatasi masalah, kesenangan, dan lain sebagainya.
14
e. Tes hasil belajar (achievement test) Tes hasil belajar merupakan tes yang dilaksanakan dengan tujuan untuk mengungkap tingkat pencapaian terhadap tujuan pembelajaran atau prestasi belajar, untuk melaksanakaan evaluasi mengajar seorang guru pada tes belajar ini dapat menggunakan dua macam tes, yakni tes yang telah distandarkan (standardized tes) dan tes buatan guru (teacher-made test). Menurut Purwanto (2008:34) adapun perbedaan tes standard an tes buatan guru adalah sebagai berikut : Standardized achievement tes a) Didasarkan atas isi dan tujuan-tujuan umum bagi sekolah-sekolah (yang sejenis) diseluruh negara atau daerah. b) Berhubungan dari bagian-bagian yang luas dari pengetahuan, kecakapan atau keterampilan, biasanya dengan hanya sejumlah item yang diperlukan untuk mengukur suatu skill atau topic tertentu. c) Dikembangkan dengan bantuan penulis-penulis professional, para ahli me-review dan editor-editor soal tes. d) Menggunakan item-item yang telah di-tryout-kan, dianalis, direvisi, sebelum menjadi bagian dari tes itu. e) Memiliki keadaan yang tinggi f) Memiliki ukuran-ukuran untuk bermacam-macam kelompok yang secara luas mewakili performance seluruh negara atau daerah.
15
Techaer – made test a) Berdasarkan isi dan tujuan-tujuan khusus untuk kelas atau sekolah di tempat guru itu mengajar. b) Dapat menyangkut topik, kecakapan, atau keterampilan khusus dan tertentu, tetapi dapat juga menyangkut bagian-bagian yang lebih luas dari pengetahuan dan keterampilan. c) Biasanya dikembangkan oleh seorang guru dengan sedikit atau tanpa bantuan dari luar. d) Menggunakan item-item yang jarang atau tidak pernah di-tryout-kan, di analisis, atau direvisi sebelum menjadi bagaian dari tes tersebut. e) Memiliki kendala yang sedang atau rendah. f) Biasanya terbatas pada suatu kelas atau sekolah sebagai kelompok pemakainya. 3. Berdasarkan dari banyaknya peserta yang mengikuti tes, yaitu: a. Tes individual (individual test) Tes individual merupakan tes dimana tester hanya berhadapan dengan satu orang testee saja. b. Tes kelompok (group test) Tes kelompok merupakan tes dimana tester berhadapan dengan lebih dari satu orang testee. 4. Berdasarkan waktu yang disediakan bagi testee untuk melaksanakan tes,yaitu:
16
a. Power test Power test merupakan tes dimana waktu yang disediakan buat testee untuk menyelesaikan tes tidak terbatas. b. Speed test Speed test merupakan tes dimana waktu yang disediakan buat testee untuk menyelesaikan tes dibatasi. 5. Berdasarkan bentuk responnya, yaitu: a. Tes verbal (verbal test) Tes verbal merupakan tes yang menghendaki jawaban yang tertuang dalam bentuk kata-kata atau kalimat, baik secara lisan maupun tertulis. b. Tes non-verbal (non-verbal test) Tes non-verbal merupakan tes yang menghendaki jawaban bukan berupa ungkapan kata-kata atau kalimat, melainkan berupa tindakan atau tingkah laku. 6. Berdasarkan cara mengajukan pertanyaan dan cara memberikan jawaban, yaitu: a. Tes tertulis (pencil and paper test) Tes tertulis merupakan tes dimana tester dalam mengajukan butir-butir pertanyaan atau soalnya dilakukan secara tertulis dan testee memberikan jawabannnya juga secara tertulis. b. Tes lisan (non-pencil and paper test) Tes lisan merupakan tes dimana tester dalam mengajukan butir-butir pertanyaan atau soalnya dilakukan secara tidak tertulis (lisan) dan testee memberikan jawabannya juga tidak tertulis.
17
7. Berdasarkan dari segi bentuk soal dan kemungkinan jawabannya, yaitu: a. Tes Essay (Uraian) Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri. b. Tes Objektif Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya. Tes ini terdiri dari berbagai macam bentuk, antara lain ; a) Tes Betul-Salah (TrueFalse) b) Tes Menjodohkan (Matching) c) Tes Analisa Hubungan (Relationship Analysis) d) Tes Pilihan Ganda (Multiple Choice) 2.2.4 Karakteristik Tes yang Baik Arikunto (2010) menyatakan bahwa suatu tes dapat dikatakan sebagai alat pengukur yang baik jika memenuhi karakteristik berikut ini yaitu: 1. Memiliki validitas Tes dikatakan memiliki validitas jika tes tersebut dengan secara tepat, secara benar, secara shahih, atau secara absah dapat mengukur apa yang seharusnya diukur, yaitu mengukur hasil belajar yang telah dicapai oleh siswa setelah mereka menempuh proses belajar mengajar dalam jangka
18
waktu tertentu. Untuk menganalisis validitas suatu tes dapat dianalisis secara logika (logical analysis) dan secara empirik (empirical analysis). 2. Memiliki reliabilitas Tes dikatakan memiliki reliabilitas jika hasil-hasil pengukuran yang dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap subjek yang sama, senantiasa menunjukkan hasil yang tetap atau sifatnya stabil. Dengan kata lain, tes memiliki reliabel jika nilai-nilai yang diperoleh para testee adalah stabil kapan saja, dimana saja, dan oleh siapa saja ujian itu dilaksanakan, diperiksa dan dinilai. 3. Memiliki objektivitas Tes dikatakan memiliki objektivitas jika tes tersebut disusun dan dilaksanakan menurut tujuan instruksional khusus yang telah ditentukan, bukan atas kemauan dan kehendak dari tester, serta dalam pemberian skor dan penentuan nilai harus terhindar dari unsur-unsur subjektivitas tester. 4. Memiliki praktikabilitas Tes dikatakan memiliki praktikabilitas jika tes tersebut praktis (mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas) dan mudah mudah pengadministrasiannya. 5. Memiliki nilai ekonomis Tes dikatakan memiliki nilai ekonomis jika pelaksanaan tes tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga banyak, dan waktu yang lama.
19
2.2.5 Langkah-Langkah untuk Menyusun Tes Purwanto (2008:30) menyatakan bahwa para ahli penyusunan tes maupun para pengajar umumnya telah menyepakati langkah-langkah sebagai berikut: 1. Menetapkan tujuan tes Sebelum tes dibuat, hendaknya tujuan pembuatan tes harus jelas seperti tes yang bertujuan untuk mengadakan seleksi, mendiagnosis kesulitan belajar siswa, dan lain sebagainya. 2. Analisis kurikulum Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok bahasan yang akan dijadikan dasar dalam menentukan jumlah item atau butir soal untuk setiap pokok bahasan soal objektif atau bobot soal untuk bentuk uraian, dalam membuat kisi-kisi tes sesuai dengan kurikulum yang berlaku. 3. Analisis buku pelajaran dan sumber dari materi belajar lainnya Analisis buku pelajaran dan sumber dari materi belajar lainnya bertujuan untuk menentukan bobot setiap pokok bahasan berdasarkan jumlah halaman materi yang termuat dalam buku pelajaran atau sumber materi belajar lainnya dengan harapan dapat mencakup seluruh construct atau content yang diajarkan. 4. Membuat kisi-kisi Kisi – kisi bermanfaat untuk menjamin sampel soal yang baik yaitu mencakup semua pokok bahasan secara proporsional. Sebuah kisi-kisi
20
memuat jumlah butir yang harus dibuat untuk setiap bentuk soal dan setiap pokok bahasan serta untuk setiap aspek kemampuan yang hendak diukur. 5. Penulisan Tujuan Instruksional Khusus (TIK) Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan yang mencerminkan tingkah laku siswa. 6. Penulisan soal Banyaknya butir soal yang harus dibuat untuk setiap bentuk soal dan untuk setiap pokok bahasan, serta untuk setiap aspek kemampuan yang hendak diukur harus disesuaikan dengan yang tercantum dalam kisi-kisi. 7. Reproduksi tes terbatas Tes yang sudah dibuat diperbanyak dalam jumlah yang cukup menurut jumlah sampel uji-coba atau peserta yang akan mengerjakan tes tersebut dalam suatu kegiatan uji-coba tes. 8. Uji-coba tes Tes yang sudah dibuat dan sudah direproduksi atau diperbanyak itu diuji cobakan kepada sejumlah sampel yang telah ditentukan. Sampel uji-coba harus mempunyai karakteristik yang kurag lebih sama dengan karakteristik peserta tes sesungguhnya. 9. Analisis hasil uji-coba Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir soal yang meliputi validitas butir, tingkat kesukaran, dan fungsi pengecoh. Soal-soal yang tidak valid akan didrop dan soal-soal yang valid akan ditetapkan untuk dipakai atau dirakit menjadi suatu tes yang valid.
21
10. Revisi soal Soal-soal yang valid berdasarkan kriteria validitas empiric dikonfirmasikan dengan kisi-kisi. Apabila soal-soal tersebut sudah memenuhi syarat dan telah mewakili semua materi yang akan diujikan, soal-soal tersebut selanjutnya dirakit menjadi sebuah tes, tetapi apabila soal-soal yang valid belum memenuhi syarat berdasarkan hasil konfirmasi dengan kisi-kisi maka dapat dilakukan perbaikan terhadap beberapa soal yang diperlukan. 11. Merakit soal menjadi tes Soal-soal yang valid dan telah mencerminkan semua pokok bahasan serta aspek kemampuan yang hendak diukur dapat dirakit menjadi sebuah tes yang valid. Urutan soal dalam suatu tes pada umumnya dilakukan menurut kesukaran soal, yaitu dari soal mudah sampai soal yang sulit. 2.2.6 Tes Sebagai Hasil Belajar Kognitif Dalam penyusunan tes perlu diperhatikan tipe hasil belajar atau tingkat kemampuan berpikir mana saja yang akan diukur atau dinilai. Untuk menentukan tipe hasil belajar atau tingkat kemampuan berpikir yang akan dinilai, penyusun tes dapat berpedoman pada indikator pembelajaran atau tujuan evaluasi itu sendiri. Sehingga pemilihan alat evaluasi dan penyusunan instrumen tes akan tepat sesuai dengan tingkat kemampuan peserta didik ( Purwanto, 2008). Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk aspek kognitif menjadi enam yaitu pengetahuan hafalan, pemahaman atau komprehensif, penerapan atau aplikasi, analisis dan sintesis, evaluasi serta kreativitas. Berikut adalah penjelasannya yaitu:
22
1.
Mengetahui (C1) atau knowledge ialah tingkat kemampuan yang hanya meminta responden atau testee untuk mengenal atau mengetahui adanya konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai atau dapat menggunakannya. Dalam hal ini biasanya testee hanya dituntut untuk menyebutkan kembali (recall) atau menghafal saja.
2.
Memahami (C2) adalah tingkat kemampuan yang mengharapkan testee mampu memahami arti atau konsep, situasi serta fakta yang diketahuinya. Dalam hal ini testee tidak hanya hafal secara verbal akan tetapi juga memahami konsep dari masalah atau fakta yang ditanyakan
3.
Menerapkan (C3) adalah penggunaan abstraksi pada situasi konkret atau situasi khusus. Testee dituntut kemampuannya untuk menerapkan atau menggunakan apa yang telah diketahuinya dalam situasi baru baginya (diabstrakkan). Abstraksi ini dapat berupa ide, teori, atau petunjuk praktis.
4.
Menganalisis (C4) adalah kemampuan yang mengukur testee untuk menganalisis atau menguraikan suatu integritas atau situasi tertentu ke dalam komponen-komponen atau unsur-unsur pembentuknya. Diharapkan siswa dapat memahami dan sekaligus mampu memilah-milahnya menjadi bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya. Sedangkan kemampuan sintesis adalah penyatuan unsur-unsur atau bagian bagian ke dalam suatu bentuk yang menyeluruh. Diharapkan testee mampu menemukan hubungan kausal atau urutan tertentu atau menemukan abstraksinya yang berupa integritas.
23
5.
Mengevaluasi (C5) adalah kemampuan testee untuk membuat suatu penilaian tentang suatu pernyataan, konsep, situasi, dan sebagainya berdasarkan suatu kriteria tertentu. Kegiatan penilaian dapat dilihat dari segi tujuannya, gagasannya, cara bekerjanya, cara pemecahannya, metodenya, materinya atau lainnya.
6.
Mengkreasi (C6) adalah tingkat kemampuan untuk merancang, membangun, merencanakan, memproduksi, menemukan, membaharui, menyempurnakan, memperkuat dan menggubah sesuatu menjadi baru (Ratumanan dan laurens, 2011).
2.2.7 Bentuk Soal Tes Pilihan Ganda Soal pilihan ganda merupakan bentuk soal yang jawabannnya dapat dipilih dari beberapa kemungkinan jawaban yang telah disediakan. Konstruksinya terdiri dari pokok soal dan pilihan jawaban. Pilihan jawaban terdiri atas kunci dan pengecoh. Kunci harus merupakan jawaban benar atau paling benar sedangkan pengecoh merupakan jawaban tidak benar, namun daya jebak harus berfungsi, artinya siswa memungkinkan memilihnya jika tidak menguasai materi (Depdiknas, 2007). Menurut Sudjana (2008:48) soal pilihan ganda adalah bentuk tes yang mempunyai satu jawaban yang benar atau paling tepat. Dilihat dari strukturnya, bentuk soal pilihan ganda terdiri atas: a) Stem – pertanyaan atau pernyataan yang berisis permasalahan yang akan ditanyakan, b) Option – sejumlah pilihan atau alternative jawaban, c) Kunci – jawaban yang benar atau yang paling tepat, d) Distractor – jawaban-jawaban lain selain kunci jawaban.
24
Soal pilihan ganda dapat diskor dengan mudah, cepat dan memiliki objektivitas yang tinggi, mengukur berbagai tingkatan kognitif, serta dapat mencakup ruang lingkup materi yang luas dalam suatu tes. Bentuk ini sangat tepat digunakan untuk ujian berskala besar dan hasilnya harus segera diumumkan, seperti ujian nasional dan ujian akhir sekolah. Hanya saja, untuk menyusun soal pilihan ganda bermutu perlu waktu lama dan biaya cukup besar, disamping itu, penulis soal akan kesulitan membuat pengecoh yang homogen dan berfungsi, terdapat peluang untuk menebak kunci jawaban, dan peserta mudah mencontek kunci jawaban. Secara umum, setiap soal pilihan ganda terdiri dari pokok soal (stem) dan pilihan jawaban (option). Pilihan jawaban terdiri atas kunci jawaban dan pengecoh (distractor) (Depdiknas, 2007). Menurut Sudjana (2008:49) bentuk soal tes pilihan ganda memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes pilihan ganda (1) Materi yang diujikan dapat mencakup sebagian besar dari bahan pengajaran yang telah diberikan. (2) Jawaban siswa dapat dikoreksi (dinilai) dengan mudah dan cepat dengan menggunakan kunci jawaban. (3) Jawaban untuk setiap pertanyaan sudah pasti benar atau salah sehingga penilaiannya bersifat objektif. Kelemahan bentuk soal tes pilihan ganda (1) Kemungkinan untuk melakukan tebakan jawaban masih cukup besar. (2) Proses berpikir siswa tidak dapat dilihat dengan nyata. 2.2.8 Bentuk Soal Tes Uraian Menurut Ratumanan dan laurens (2008:67), tes uraian tepat digunakan untuk
mengukur
kemampuan
mengorganisasikan,
menuangkan
gagasan,
mengekspresikan gagasan, menganalisis, atau kemampuan tingkat tinggi lainnya yang tidak dapat diukur menggunakan tes pilihan gada atau objektif lainnya. Sedangkan menurut Sudjana (2008:35) tes uraian disebut juga essay, merupakan
25
alat penilaian yang hasil belajar yang paling tua. Secara umum tes uraian ini adalah pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan katakata dan bahasa sendiri, Dengan demikian, dalam tes ini dituntut kemampuan siswa dalam mengekspresikan gagasannya melalui bahasa tulisan. Menurut Sudjana (2008:36) bentuk soal tes uraian memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes uraian: (1) Dapat mengukur proses mental yang tinggi atau aspek kognitif tingkat tinggi; (2) Dapat meningkatkan kemampuan berbahasa, baik lisan maupun tulisan, dengan bail dan benar sesuai dengan kaidah-kaidah bahasa; (3) Dapat melatih kemampuan berfikir teratur atau penalaran, yakni berfikir logis, analitis dan sistematis; (4) Mengembangkan keterampilan pemecahan masalah (problem solving); (5) Adanya keuntungan teknis seperti mudah membuat soalnya sihingga tanpa memakan waktu yang lama, guru dapat secara langsung melihat proses berfikir siswa. Kekurangan bentuk soal tes uraian: (1)Sampel tes sangat terbatas sebab dengan tes ini tidak mungkin dapat menguji semua bahan yang telah diberikan, tidak seperti pada tes objektif yang dapat menanyakan banyak hal melalui sejumlah pertanyaan. (2)Sifatnya sangat subjektif, baik dalam menanyakan, dalam membuat pertanyaan, maupun dalam cara memeriksanya. (3)Tes ini bisaanya kurang reliabel, mengungkap aspek yang terbatas, pemeriksaannya memerlukan waktu lama sehingga tidak praktis bagi kelas yang jumlah siswanya relatif besar. 2.3 Analisis Butir Soal Analisis butir soal atau analisis item adalah pengkajian pertanyaanpertanyaan tes agar diperoleh perangkat tes yang memiliki kualitas yang memadai. Ada dua jenis analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas dan reliabilitas. Menganalisis tingkat kesukaran pada soal artinya mengkaji soal-soal tes dari segi kesulitannya sehingga
26
dapat diperoleh soal-soal mana yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis daya pembeda artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk dalam kategori lemah atau rendah dan kategori kuat atau tinggi prestasinya. Sedangkan validitas dan reliabilitas mengkaji kesulitan pertanyaan tes (Sudjana, 2008:135). Menurut Aiken (dalam Ratumanan dan laurens, 2008), analisis butir soal bertujuan untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak efektif, serta untuk mengetahui informasi diagnostic pada peserta didik apakah mereka sudah/ belum memahami materi yang telah diajarkan. Kualitas butir soal dapat dilakukan dengan cara menganalisis butir soal melalui analisis empiric atau validitas empiric meliputi tingkat kesukaran, daya beda, validitas, reliabilitas dan kualitas pengecoh untuk soal pilihan ganda dan analisis teoritik atau validitas logis yang meliputi isi, konstruksi dan bahasa. 2.3.1 Analisis empirik 2.3.1.1 Tingkat Kesukaran Tingkat kesukaran adalah angka yang menunjukan proporsi siswa yang menjawab betul suatu soal (Slameto, 2001). Jika semua atau bagian peserta didik dapat menjawab atau menyelesaikan soal dengan benar, maka soal tersebut dapat dikategorikan sebagai soal mudah. Sebaliknya jika semua atau sebagian besar peserta didik tidak dapat menyelesaikan soal tersebut dengan benar, maka soal tersebut dikategorikan sebagai soal sulit. Sedangkan menurut Taruh (2008) tingkat kesukaran butir soal sangat dipengaruhi oleh tingkat kemampuan anggota kelompok pada tes. Tingkat kesukaran berada pada interval 0,0 sampai 1.
27
Semakin tinggi tingkat kesukaran soal berarti semakin mudah soal tersebut dan sebaliknya semakin rendah tingkat kesukaran soal berarti semakin sukar soal tersebut . 2.3.1.2 Validitas Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut (Sudijono, 2001). Suatu alat penilaian dikatakan mempunyai validitas yang tinggi apabila alat penilaian tersebut mampu mengukur apa yang seharusnya diukur (Purwanto, 2008). Arikunto (2001) menjelaskan adanya empat bentuk validitas yaitu: validitas isi, validitas konstruksi, validitas yang ada sekarang, dan validitas prediksi. Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Alat tes yang dianggap layak dan dapat dipertanggungjawabkan validitas isinya apabila dalam penyusunannya mendasarkan diri pada tabel kisikisi. Nurgiyantoro (1987) (dalam Purwanto 2008) menjelaskan bahwa validitas isi merujuk pada kesesuaian antara butir-butir soal dengan tujuan dan bahan pengajaran. Karena tujuan dan bahan pengajaran tersebut tercantum pada tabel kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan butir-butir soal yang
mendasar
pada
Tabel
kisi-kisi
dianggap
layak
dan
dapat
dipertanggungjawabkan validitas isinya. Secara sederhana dapat dikatakan bahwa
28
tes yang disusun tidak boleh keluar dari isi mata pelajaran yang ada di dalam kurikulum. Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir (ingatan, pemahaman dan aplikasi) seperti yang disebutkan dalam indikator dalam Tabel kisi-kisi. Validitas isi dan validitas konstruksi ini digolongkan ke dalam validitas logis atau validitas rasional (Arikunto, 2001). Untuk mengetahui tingkat validitas rasional dapat dilakukan dengan mengadakan analisis rasional (Nurkancana, 1986) dalam Sudjana (2008), yaitu analisis berdasarkan pikiran-pikiran yang logis bahan-bahan apa yang perlu dikemukakan dalam suatu tes. Jika penganalisaan secara rasional itu menunjukan hasil yang membenarkan tentang telah tercerminnya tujuan instruksional khusus itu di dalam tes hasil belajar yang telah memiliki validitas isi maupun validitas konstruksi. Menurut Sudijono (2001), upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dan validitas konstruksi sebuah tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam diskusi tersebut para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Adapun sebuah tes dikatakan memiliki validitas ada sekarang (concurent validity) jika hasilnya sesuai dengan pengalaman. Nurkancana (1986) (dalam Sudjana, 2008) menjelaskan, untuk
menilai
validitas
ada
sekarang
dapat
dilakukan
dengan
jalan
mengkorelasikan hasil-hasil yang dicapai dalam tes yang sejenis yang telah
29
diketahui mempunyai validitas yang tinggi. Sedangkan sebuah tes memiliki validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Cara pengujian dengan jalan mencari korelasi antara nilai-nilai yang dicapai oleh anak-anak dalam tes tersebut dengan nilai-nilai yang dicapai kemudian. 2.3.1.3 Reliabilitas Menurut Gualford (1978) dalam Dewanto (1995), realibilitas adalah proporsi dari varian dengan varian yang sesungguhnya. Reliabilitas suatu tes pada hakekatnya menguji keajegan pertanyaan tes yang di dalamnya berupa seperangkat butir soal apabila diberikan berulang kali pada objek yang sama. Suatu tes dikatakan reliabel apabila beberapa kali pengujian menunjukan hasil yang relatif sama (Sudjana, 2008). Menurut (Sudjana, 2008:148), untuk melakukan analisis reliabilitas suatu tes dapat digunakan beberapa metode yaitu: 1)
Reliabilitas tes ulang Tes ulang adalah penggunaaan alat penilaian terhadap subjek yang sama, dilakukan dua kali dalam waktu yang berlainan.
2) Reliabilitas belah dua Reliabilitas belah dua mirip dengan reliabilitas pecahan setara, terutama dalam pelaksanaannya. Butir-butir soal dibagi menjadi dua bagian yang sebanding, biasanya dengan membedakan soal nomor genap dengan soal nomor ganjil.
30
3) Kesamaan rasional Prosedur menghitung reliabilitas tanpa melakukan korelasi dari dua pengukuran atau pecahan setara atau belah dua. Prosedur ini dilakukan dengan menghubungkan setiap butir dalam satu tes dengan butir-butir lainnya dalam tes itu sendiri secara keseluruhan. Reliabilitas
dapat
tinggi
dapat
rendah.
Ada
faktor-faktor
yang
mempengaruhi koefisien reliabilitas. Faktor-faktor tersebut adalah: panjang pendeknya tes, kadar homogenitas tes, rentangan kemampuan siswa, luas dan tidaknya sampel yang diambil, suasana dan kondisi waktu tes serta keakuratan penskoran (Purwanto, 2008). Dengan demikian, untuk memperoleh hasil penilaian yang sesuai dengan tuntutan syarat-syarat penilaian (valid dan reliabel) maka pemilihan alat penilaian menjadi sangat penting. Hal ini disebabkan karena kemampuan dari siswa yang akan diungkapkan ditentukan oleh alat penilaian yang akan digunakan. 2.3.1.4 Daya Pembeda Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee yang kemampuannya rendah demikian rupa sehingga sebagian besar testee yang memiliki kemampuan yang tinggi untuk menjawab butir item tersebut lebih banyak menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk menjawab butir item tersebut sebagian besar tidak dapat menjawab item dengan betul (Sudijono, 2001).
31
Menurut (Sudjana, 2008:141), daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang mampu atau lemah prestasinya. Artinya, bila soal tersebut diberikan kepada anak yang mampu, hasilnya menunjukkan prestasi yang tinggi; dan bila diberikan pada siswa yang lemah, hasilnya rendah. 2.3.1.5 Distraktor Distraktor hanya untuk soal pilihan ganda, distractor yaitu suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabanannya terhadap kemungkinan jawabn-jawaban yang telah dipasangkan pada butir item (Sudijono, 2001). Suatu option dikatakan efektif jika memenuhi fungsi atau tujuan disajikannya option tersebut. Hal ini berarti bahwa setiap option yang disajikan memiliki kemungkinan yang sama untuk dipilih, jika testee menjawab soal tersebut dengan cara menerka (spekulasi). Kusaeri (2012: 107) mengemukakan bahwa: “Pengecoh adalah jawaban yang tida benar atau kurang tepat, namun memungkinkan seseorang terkecoh untuk memilihnya apabila ia tidak menguasai materi dengan baik”. Jawaban pengecoh yang terdapat pada soal-soal obyektif atau pilihan ganda yang digunakan untuk mengecoh siswa sebagai peserta tes. Oleh karena itu jawaban pengecoh harus diformulasikan sedemikian rupa agar berfungsi dengan baik dan tepat sasaran.
32
2.3.2 Analisis teoritik/ validitas logis Ada beberapa teknik yang dapat dilakukan untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik panel. Teknik panel merupakan teknik menelaah butir soal berdasarkan kaidah penulisan butir soal yaitu ditelaah dari segi materi, konstruksi dan bahasa yang dilakukan oleh beberapa penelaah. Kriteria telaah dari segi materi, konstruksi, dan bahasa adalah sebagai berikut: 1) Materi Dari segi materi yang harus diperhatikan adalah: a. Kesesuaian soal dengan indikator, apabila soal didasarkan atas kisi-kisi yang memuat indikator soal harus sesuai dengan kisi-kisi b. Kesesuaian materi yang diukur dengan kompetensi relevansi, kontinuitas, keterpakaian sehari-hari tinggi. c. Pilihan jawaban homogen dan logis. d. Hanya ada satu kunci jawaban. 2) Konstruksi a. Pokok soal dirumuskan dengan singkat, jelas, dan tegas. b. Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja. c. Pokok soal tidak memberi petunjuk kunci jawaban. d. Pokok soal bebas dari pernyataan yang bersifat negatif ganda. e. Pilihan jawaban homogeny dan logis ditinjau dari segi materi. f. Gambar, Grafik, Tabel, diagram, atau sejenisnya jelas dan berfungsi. g. Panjang pilihan jawaban relatif sama.
33
h. Pilihan jawaban tidak menggunakan pernyataan “semua jawaban di atas salah/benar” dan sejenisnya. i. Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya. j. Butir soal tidak bergantung pada jawaban soal sebelumnya. 3) Bahasa a. Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. b. Menggunakan bahasa yang komunikatif. c. Tidak menggunakan bahasa yang berlaku setempat/ tabu. d. Pilihan jawaban tidak mengulang kata/kelompok kata yang sama, e. kecuali merupakan satu kesatuan pengertian (Suke Silverius 1991 : 8081).