BAB II LANDASAN TEORI : ANALISIS ITEM TES A. TES 1. Pengertian Tes Secara harfiah, kata "test" berasal dari bahasa Perancis kuno: testum yang artinya piring untuk menyisihkan logam-logam mulia. Dalam bahasa Inggris ditulis dengan "test" yang dalam bahasa Indonesia diterjemahkan dengan tes, ujian atau percobaan.1 Beberapa istilah yang memerlukan penjelasan sehubungan dengan masalah di atas, yaitu istilah test, testing, tester dan testee. Test adalah alat atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian; testing berarti saat dilaksanakannya pengukuran dan penilaian;
tester
artinya orang yang melaksanakan tes atau pembuat tes; sedangkan testee adalah peserta tes.2 Adapun dilihat dari segi istilah, definisi tes menurut beberapa tokoh adalah sebagai berikut: Lee
J.
Cronbach
dalam
bukunya
berjudul
Essential
Of
Psichological Testing menyebutkan bahwa : "A test is a systematic procedure for Comparing the behavior of two or more persons".3 Tes adalah suatu prosedur yang sistematis untuk membandingkan tingkah laku dari dua orang atau lebih. Clinton I. Chase dalam bukunya yang berjudul Measurement for Educational Evaluation, menyebutkan bahwa: “A test is systematic procedure for comparing the performance of an individual with a designated standard of performance”.4 Tes adalah suatu prosedur yang 1 Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada, 2003), cet. 4, hlm. 66. 2 Ibid. 3 Lee J. Cronbach, Essential of Psychological Testing, (New York: Harper, 1970), hlm. 20. 4 Clinton I. Chase, Measurement for Educational Evaluation, (London: Addison Wesley, 1978), hlm. 6.
9
10
sistematis untuk membandingkan tingkah laku individu dengan standar tingkah laku yang telah ditentukan. Anderson dalam bukunya yang berjudul Encyclopedia of Educational Evaluation, menjelaskan bahwa : "A test is any series of questions or exercises or other means of measuring the skill, knowledge, intelligence, capacities or aptitudes of an individual or group".5 Tes adalah serangkaian pertanyaan atau latihan atau alat lain yang digunakan untuk mengukur ketrampilan, pengetahuan, inteligensi, kemampuan atau bakat yang dimiliki oleh individu atau kelompok Doughlas Brown mendefinisikan tes sebagai berikut :6
ﻃﺮﻳﻘـﺔ ﻟﻘـﻴﺎس اﻻﻓـﺮاد وﻣـﻌﺎرﻓﻬﻢ ﻓﻲ ﻣﺠﺎل ﻣﻌـﻴّﻦ: اﻹﺧﺘﺒﺎر "Tes adalah cara untuk mengukur pengetahuan individu (testee) dalam bidang tertentu" Sedangkan Sumardi Suryabrata menjelaskan bahwa:7 Tes adalah pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang berdasar atas bagaimana testee menjawab pertanyaan-pertanyaan dan atau melakukan perintah-perintah itu, penyelidik mengambil kesimpulan dengan cara membandingkannya dengan standar atau testee lainnya. Dari beberapa definisi di atas, maka dapat disimpulkan bahwa tes adalah cara atau prosedur yang di gunakan untuk mengukur kemampuan testee dengan memberikan serangkaian pertanyaan yang harus dijawab oleh testee, sehingga dari hasil pengukuran tersebut dapat dihasilkan nilai yang dapat di bandingkan dengan nilai-nilai yang dapat dicapai oleh testee lainnya, atau dibandingkan dengan nilai standar tertentu. Jadi inti dari suatu tes adalah sebagai berikut: a. Tes adalah tugas atau serangkaian tugas yang berbentuk pertanyaanpertanyaan dan atau perintah-perintah.
5
Anderson, et.al., Encyclopedia of Educational Evaluation, (London: Jossey – Bass Inc., 1981), hlm. 425 6 Douglas Brown, Ususu at-Ta'allumi al-Lughati wa Ta'limiihaa, terj. Abd. Rajhi dan Ali Ahmad Syu'ban, (Arab: darun an-Nadhoh, t.t.), hlm. 266. 7 Sumadi Suryabrata, Pembimbing ke Psikodiagnostik, (Yogyakarta: Rake Sarasin, 1984), hlm. 22.
11
b. Tes itu di berikan kepada testee (seorang atau lebih). c. Tingkah laku testee dalam mengerjakan tes dapat dibandingkan dengan sesuatu, yaitu standar tes atau tingkah laku testee lain. 2. Macam-macam Tes Sebagai alat pengukur, tes dapat dibedakan menjadi beberapa macam atau golongan tergantung dari segi mana atau dengan alasan apa penggolongan tes itu dilakukan. a. Penggolongan menurut objek pengukurannya. Ditinjau dari segi objek pengukurannya, tes dapat dibedakan menjadi dua, yaitu tes kepribadian (personality test) dan tes hasil belajar (achievement test). 1) Tes kepribadian (personality test) Tes kepribadian adalah tes yang ditujukan untuk mengukur salah satu atau lebih aspek-aspek non intelektif dari mental atau psikis seorang individu. Yang termasuk dalam jenis tes ini, antara lain: pengukuran sikap, pengukuran minat, pengukuran bakat dan tes inteligensi.8 2) Tes hasil belajar (achievement test) Tes hasil belajar adalah tes yang digunakan untuk menilai hasil-hasil pelajaran yang telah diberikan oleh guru kepada muridmuridnya, atau oleh dosen kepada mahasiswa, dalam jangka waktu tertentu.9 b. Penggolongan tes menurut fungsinya Ditinjau dari segi fungsinya, tes dibedakan menjadi empat, yaitu: 1) Tes penempatan Tes penempatan adalah tes untuk mengukur kemampuan dasar yang dimiliki oleh anak didik; kemampuan tersebut dapat 8
hlm. 44.
9
M. Chabib Thoha, Teknik Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada, 1996),
M. Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja Rosdakarya, 1997), hlm. 33.
12
dipakai meramalkan kemampuan peserta didik pada masa mendatang, sehingga kepadanya dapat dibimbing, diarahkan atau ditempatkan pada jurusan yang sesuai dengan kemampuan dasarnya.10 2) Tes formatif Tes formatif adalah tes untuk mengukur sejauh mana siswa telah menguasai bahan pelajaran, setelah mengikuti suatu program kegiatan instruksional tertentu. Tes ini diberikan pada akhir setiap program kegiatan instruksional sebagai post test.11 3) Tes diagnostik Tes
diagnostik
adalah
tes
yang
digunakan
untuk
mengetahui sebab kegagalan peserta didik dalam belajar. Oleh karena
itu
dalam
menyusun
butir-butir
soal
seharusnya
menggunakan item yang memiliki tingkat kesukaran rendah.12 4) Tes sumatif Tes sumatif adalah tes yang dilaksanakan setelah pemberi keseluruhan program dalam suatu kegiatan instruksional pada suatu periode berakhir. Tes ini harus dilaksanakan akhir semester, setelah diadakannya beberapa tes formatif. Oleh karena itu, bahan tes sumatif biasanya lebih luas daripada bahan tes formatif.13 c. Penggolongan tes menurut tingkat mutunya Dilihat dari segi tingkat mutunya, tes dibagi menjadi 2 macam, yaitu:14 1) Tes buatan guru Adalah suatu tes yang dibuat dan digunakan oleh seorang guru sendiri di sekolah. Hasil tes buatan guru dipakai untuk 10
Chabib Thoha dan Abdul Mu’thi, PBM PAI di Sekolah (Eksistensi dan Proses Belajar Mengajar Pendidikan Agama Islam), (Yogyakarta: Pustaka Pelajar, 1998), hlm. 289. 11 Masidjo, Penilaian Hasil Belajar Siswa di Sekolah, (Yogyakarta: Kanisius, 1995), hlm. 55. 12 James S. Cangelosi, Merancang Tes Untuk Menilai Prestasi Siswa, (Bandung: ITB, 1995), hlm. 48. 13 Masidjo, op.cit., hlm. 56. 14 Ibid., hlm. 57-58.
13
mengetahui antara lain kedudukan prestasi belajar siswa di kelasnya setelah mengikuti suatu kegiatan instruksional suatu mata pelajaran dan mengetahui kemajuannya dan sebagainya. 2) Tes Standar Tes standar adalah suatu tes yang distandarisasikan atau yang disusun secara cermat oleh seorang atau tim ahli penyusun tes melalui uji coba berkali-kali, sehingga tes tersebut memiliki mutu yang tinggi. Dengan demikian, taraf kesukaran item, taraf pembeda item, taraf validitas tes, dan taraf reliabilitas tesnya sudah meyakinkan. d. Penggolongan lain-lain15 Dari segi banyaknya orang yang mengikuit tes, tes dibedakan menjadi dua macam, yaitu: 1) Tes individual, yaitu tes dimana tester hanya berhadapan dengan satu orang testee saja. 2) Tes Kelompok, yaitu tes dimana tester berhadapan dengan lebih dari satu orang testee. Dari segi bentuk responnya, tes dapat dibedakan menjadi 2 macam, yaitu: 1) Verbal Test, yakni suatu tes yang menghendaki respon (jawaban) yang tertuang dalam bentuk ungkapan kata-kata atau kalimat, baik secara lisan maupun secara tertulis 2) Non Verbal Test, yakni tes yang menghendaki respon (jawaban) dari testee bukan berupa ungkapan kata-kata atau kalimat, melainkan berupa tindakan atau tingkah laku. Dilihat dari segi cara mengajukan pertanyaan dan cara memberikan jawabannya, tes dapat dibedakan menjadi 2 macam, yaitu: 1) Tes tertulis, yakni tes yang dilaksanakan secara tertulis, baik pertanyaan maupun jawaban.
15
Anas Sudijono, op.cit., hlm. 74-75.
14
2) Tes lisan, yakni tes dimana tester di dalam mengajukan pertanyaanpertanyaan atau soalnya dilakukan secara lisan, dan tester memberikan jawabannya secara lisan pula. 3. Bentuk-Bentuk Tes Sebagai alat pengukur perkembangan dan kemajuan belajar peserta didik, apabila ditinjau dari segi bentuk soalnya, tes hasil belajar dapat dibedakan menjadi 2 macam, yaitu : tes subjektif (bentuk uraian) dan tes bentuk objektif. a. Tes Subjektif (bentuk uraian) Tes bentuk uraian adalah sejenis tes kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti; uraikan, jelaskan,
mengapa,
bagaimana,
bandingkan,
simpulkan,
dan
16
sebagainya..
Tes bentuk uraian dibedakan atas dua jenis, yaitu :17 1) Uraian bebas, yakni tes yang soal-soalnya harus dijawab dengan uraian secara bebas. 2) Uraian terbatas, yakni tes yang soalnya menuntut jawaban dalam bentuk uraian yang telah terarah. Tes bentuk uraian (tes subjektif) mempunyai beberapa kelebihan, yaitu : 1) Mudah disiapkan dan disusun. 2) Tidak banyak memberi kesempatan untuk berspekulasi atau untung-untungan. 3) Mendorong siswa untuk berani mengemukakan pendapat serta menyusun kalimat dalam bentuk yang bagus. 4) Memberi
kesempatan
kepada
siswa
untuk
mengutarakan
maksudnya dengan gaya bahasa dan caranya sendiri. 16
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi aksara, 2001), cet. 2, hlm. 162. 17 R. Ibrahim, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 1995), hlm. 90.
15
5) Dapat diketahui sejauh mana siswa mendalami suatu masalah yang diteskan. Adapun beberapa kelemahan dari tes bentuk uraian, adalah : 1) Kadar validitas dan realibilitasnya rendah dan sukar diketahui segisegi mana dari pengetahuan siswa yang betul-betul dikuasai. 2) Kurang representatif dalam hal mewakili seluruh scope bahan pelajaran karena soalnya hanya beberapa saja (terbatas). 3) Cara
memeriksanya
banyak
dipengaruhi
oleh
unsur-unsur
subjektif. 4) Pemeriksaannya lebih sulit karena membutuhkan pertimbangan individual lebih banyak dari penilai. 5) Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada orang lain.18 b. Tes Objektif Tes Objektif adalah tes yang dibuat sedemikian rupa sehingga hasil tes tersebut bisa dinilai secara objektif, dinilai oleh siapapun akan menghasilkan nilai yang sama. Tes objektif disebut juga short answer test, karena memerlukan jawaban ringkas dan pendek-pendek.19 Sebagai salah satu bentuk tes hasil belajar, tes objektif dapat dibedakan menjadi lima macam, yaitu : 1) Tes objektif bentuk benar-salah (True-false test). True-false Test adalah suatu bentuk tes dimana itemnya berupa statement yang mengandung dua kemungkinan : benar atau salah.20 2) Tes objektif bentuk menjodohkan (Matching Test). Matching Test yaitu suatu bentuk tes dimana disediakan dua kelompok bahan, dan testee harus mencari pasangan-pasangan yang sesuai antara yang terdapat pada kelompok pertama dan
18
Suharsimi Arikunto, op.cit., hlm. 163. Harjanto, Perencanaan Pengajaran, (Jakarta: Rineka Cipta, 2000), cet. 2, hlm. 279. 20 M. Chabib Thoha, op.cit., hlm. 69. 19
16
bahan yang terdapat pada kelompok kedua, sesuai dengan petunjuk pada tes itu.21 3) Tes objektif bentuk melengkapi (Completion Test). Completion Test yaitu salah satu bentuk tes objektif dimana butir-butir soalnya berupa satu kalimat dimana bagianbagian tertentu yang dianggap penting dikosongkan kemudian kepada testee diminta untuk
mengisi bagian-bagian yang
ditiadakan tersebut.22 4) Tes objektif bentuk Isian (Fill in Test). Fill in Test yaitu suatu tes yang biasanya berbentuk cerita atau karangan dimana kata-kata penting dalam cerita tersebut dikosongkan, kemudian testee diminta untuk mengisi bagianbagian yang telah dikosongkan itu.23 5) Tes objektif bentuk pilihan ganda (Multiple Choice Item Test). Multiple Choice Item yaitu tes bentuk objektif yang terdiri atas pertanyaan atau pernyataan yang sifatnya belum selesai, dan untuk menyelesaikannya harus dipilih salah satu dari beberapa kemungkinan jawaban yang telah disediakan pada tiap-tiap butir soal yang bersangkutan.24 Tes objektif mempunyai beberapa kelebihan, diantaranya:25 1) Lebih representatif mewakili isi dan luas materi pelajaran. 2) Lebih objektif dalam penilaian dan dapat diserahkan kepada orang lain. 3) Pemeriksaannya dapat diserahkan orang lain 4) Dalam pemeriksaan tidak ada unsur subjektif yang mempengaruhi 5) Lebih mudah dan cepat memeriksanya karena menggunakan kunci tes bahkan alat-alat kemajuan teknologi. 21
Sumadi Suryabrata, Psikologi Pendidikan, (Jakarta: Rajka Grafindo Persada, 1993), cet. 6, hlm. 344. 22 M. Chabib Thoha, op.cit., hlm. 67. 23 Anas Sudjono, op.cit., hlm. 114. 24 Ibid., hlm. 118. 25 Suharsimi Arikunto, op.cit., hlm. 164
17
Adapun kelemahan-kelemahan dari tes bentuk ini, adalah :26 1) Persiapan untuk menyusunnya lebih sulit karena soalnya banyak dan harus diteliti. 2) Sukar untuk mengukur proses mental yang tinggi. 3) Banyak kesempatan untuk main untung-untungan (spekulasi). 4) "Kerjasama" antar siswa pada waktu mengerjakan soal tes lebih terbuka. 4. Kriteria Tes Yang Baik Menurut
Sumadi
Suryabrata
dalam
bukunya
"Psikologi
Pendidikan" menyebutkan bahwa kriteria dari suatu tes yang baik, adalah sebagai berikut:27 a. Valid Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang seharusnya diukur. b. Reliable Suatu tes dikatakan reliable apabila tes tersebut memiliki ketetapan hasil atau consistency. Artinya jika tes tersebut diberikan kepada subjekf yang sama pada waktu yang berbeda maka hasilnya akan tetap sama atau hampir sama. c. Obyektif Obyektivitas adalah suatu faktor yang penting yang dapat mempengaruhi validitas dan reliabilitas. Suatu tes dikatakan memiliki obyektivitas apabila dalam melaksanakan tes itu tidak ada faktor subjekftif yang mempengaruhi, baik dari segi scoring-nya maupun dari segi interpretasi terhadap score pada tes tersebut. d. Diskriminatif Suatu tes tersebut diskriminatif apabila tes tersebut disusun sedemikian rupa sehingga menunjukkan perbedaan-perbedaan kecil
26 27
Ibid., hlm. 165 Sumadi Suryabrata, op.cit., hlm. 327-330.
18
diantara para testee. Makin baik suatu tes maka makin dapatlah tes itu membuat perbedaan secara teliti. e. Komprehensif Suatu tes dikatakan komprehensif apabila tes tersebut mencakup segala persoalan yang harus diselidiki. Jadi dalam menyelidiki hasil pelajaran yang telah diterima oleh peserta didik, maka tes itu harus dapat memberi informasi tentang seluruh bahan yang telah diajarkan itu, tidak hanya sebagian saja. f. Praktis Kriteria untuk mengukur praktis tidaknya suatu tes hasil belajar dapat ditinjau dari:28 1) Biaya yang diperlukan untuk menyelenggarakan tes itu 2) Waktu yang diperlukan untuk menyusun tes 3) Sukar – mudahnya menyusun tes itu 4) Sukar – mudahnya menilai tes itu 5) Sulit tidaknya menginterpretasikan (mengolah) hasil tes itu 6) Lamanya waktu yang diperlukan untuk melaksanakan tes itu. 5. Kegunaan Tes Suharsimi Arikunto dalam bukunya "Dasar-Dasar Evaluasi Pendidikan" menyebutkan bahwa kegunaan atau fungsi tes dapat ditinjau dari tiga segi, yaitu :29 a. Fungsi untuk kelas, diantaranya : 1) Mengadakan diagnosis terhadap kesulitan belajar siswa Sebagaimana disebutkan oleh Muhammad Atiyah Al-Abrosyi, bahwa :30
ﻟﻤﻌﺮﻓ ﺔ ﻣﻘ ﺪار ﻣ ﺎ اﺳ ﺘﻔﺎدﻩ اﻟﻤﺘﻌﻠﻤ ﻮن ﻣ ﻦ:اﻻﻣﺘﺤﺎﻧ ﺎت اﻟﻤﺪرﺳ ﻴﺔ ﻟﺘﺪارك ﻣﺎ ﻳﺒﺪو ﻣﻨﻬﻢ ﻣﻦ ﺿﻌﻒ,اﻟﻤﻮاد اﻟﺘﻲ درﺳﻮهﺎ 28
M. Chabib Toha, op.cit., hlm. 142. Suharsimi Arikunto, op.cit., hlm. 152. 30 Muhammad Atiyah al-Abrosyi, Ruhu at-Tarbiyah wa Ta'lim, (Arab: Darul Haya, 1950), hlm. 362. 29
19
"Tes digunakan untuk mengetahui sejauh mana kemampuan para siswa dalam menerima materi-materi pelajaran yang dipelajarinya dan untuk menemukan kesulitan-kesulitan belajar mereka" 2) Mengevaluasi celah antara bakat dengan pencapaian. 3) Menaikkan tingkat prestasi. 4) Mengelompokan siswa dalam kelas pada waktu metode kelompok. 5) Menentukan siswa mana yang memerlukan bimbingan khusus 6) Merencanakan kegiatan proses belajar mengajar untuk siswa secara perseorangan. 7) Menentukan tingkat pencapaian hasil belajar untuk setiap anak b. Fungsi untuk Bimbingan 1) Menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka. 2) Membantu siswa dalam menentukan pilihan. 3) Membantu siswa mencapai tujuan pendidikan dan jurusan. 4) Memberi kesempatan kepada pembimbing, guru, dan orang tua dalam memahami kesulitan anak. c. Fungsi untuk Administrasi 1) Memberi petunjuk dalam mengelompokkan siswa. 2) Penempatan siswa baru. 3) Membantu siswa memilih kelompok. 4) Menilai kurikulum. 5) Memperluas hubungan masyarakat (public relation). 6) Menyediakan informasi untuk badan-badan lain di luar sekolah.
B. ANALISIS ITEM TES Salah satu cara untuk memperbaiki proses belajar-mengajar
yang
paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang di peroleh dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita oleh sedemikian rupa sehingga dari hasil pengolahan itu dapat di ketahui komponen-komponen manakah dari proses belajar-mengajar itu yang masih lemah.
20
Pengolahan tes hasil belajar dalam rangka memperbaiki proses belajarmengajar dapat di lakukan dengan membuat analisis soal (item analysis). 1. Pengertian Analisis Item Tes Analisis soal (item analysis) adalah suatu kegiatan yang berkaitan dengan proses mengumpulkan, meringkas, dan menggunakan informasi tentang jawaban siswa terhadap butir soal tes tersebut.31 Nana Sudjana menyebutkan bahwa analisis item tes adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai.32 Menurut Saifuddin Azwar, analisis item tes adalah
pengujian
seluruh item tes yang didasarkan pada item empirik (data yang diperoleh dari hasil pengenaan tes yang sesungguhnya), agar diperoleh bukti mengenai kualitas item-item tes.33 Sedangkan menurut Wilmar Tinambunan dalam bukunya yang berjudul "Evaluation of student Achievement" menyebutkan bahwa "The item analysis is reexamining each test item to discover its strength and flaws".34 Analisis item adalah pengujian terhadap setiap butir tes agar diketahui kelebihan dan kelemahan-kelemahan dari butir tes tersebut. Berdasarkan beberapa definisi di atas, maka dapat disimpulkan bahwa analisis item tes adalah proses pengkajian butir-butir tes hasil belajar yang didasarkan pada jawaban siswa terhadap tes tersebut, sehingga dapat diketahui kualitas dari suatu tes sebagai alat pengukur hasil belajar siswa. 2. Unsur-unsur Analisis Item Tes Analisis soal (item analysis) merupakan salah satu cara untuk menilai kualitas suatu tes hasil belajar. 31
Suke Silverius, Evaluasi Hasil Belajar dan Umpan Balik, (Jakarta: Gramedia, 1991),
hlm. 166.
32
Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar, (Bandung: Remaja Rosdakarya offset, 1991), hlm. 135. 33 Saifuddin Azwar, Tes Prestasi (Fungsi Pengembangan Pengukuran Prestasi Belajar), (Yogyakarta: Pustaka Pelajar offset, 2000), hlm. 130. 34 Wilmar Tinambunan, Evaluation of Student Achievement, (Jakarta: Departemen Pendidikan dan Kebudayaan, 1988), hlm. 137.
21
Kualitas tes hasil belajar ditentukan oleh kualitas dari itemitemnya. Untuk mengetahui apakah masing-masing butir tes itu mempunyai kualitas yang baik, maka dapat dilakukan analisis terhadap lima hal, yaitu: validitas, reliabilitas, tingkat kesukaran, daya beda dan efektivitas fungsi distraktor. a. Validitas 1) Pengertian Validitas Suatu tes disebut valid apabila tes tersebut dapat mengukur apa yang hendak dan seharusnya diukur.35 Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukut apa yang seharusnya diukur.36 William wiesma menyebutkan bahwa : "Validity is the extent to which a test measure what it is intended to measure". Validitas adalah sejauh mana sebuah tes dapat mengukur apa yang seharusnya diukur.37 Menurut Nana Sudjana, validitas adalah ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.38 Dari beberapa definisi di atas, dapat disimpulkan bahwa suatu tes dapat dikatakan valid yaitu apabila tes tersebut dapat mengukur apa yang hendak dan seharusnya diukur. Sedangkan yang dimaksud dengan validitas item tes adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian yang tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.39
35
Mudjijo, Tes Hasil Belajar, (Jakarta: Bumi Aksara, 1995), hlm. 40. Sumartana Suryapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes, (Bandung: Remaja Rosdakarya, 2004), hlm. 50. 37 William Wiersma dan Stephen G. Jurs, Educational Measurement And Testing, (United States of Amerika: University Toledo, 1990), hlm. 183. 38 Nana Sudjana, op.cit., hlm. 12. 39 Anas Sudijono, op.cit., hlm. 182. 36
22
2) Teknik Analisis Validitas Validitas adalah salah satu ciri tes hasil belajar yang baik. Untuk menentukan apakah suatu tes hasil belajar telah memiliki validitas atau daya ketepatan mengukur, dapat dilihat dari dua segi, yaitu dari segi tes itu sendiri sebagai totalitas (validitas tes), dan dari segi itemnya, sebagai bagian tak terpisahkan dari tes tersebut (validitas item tes).40 a) Validitas tes Penganalisisan terhadap validitas tes dapat dilakukan dengan dua cara. Pertama, penganalisisan yang dilakukan dengan jalan berpikir secara rasional (validitas rasional). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris (validitas empiris). Analisis validitas rasional atau logis dapat dilihat dari dua segi, yaitu: (1) Validitas isi (content validity) Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu; sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan.41
(2) Validitas konstruksi (contruct validity) Suatu tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut
40 41
Ibid., hlm. 163. Ibid., hlm. 164.
23
mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan instruksional khusus.42 Adapun analisis validitas empiris juga dapat dilihat dari dua segi, yaitu: (1) Validitas ramalan (predictive validity) Suatu tes dikatakan memiliki validitas ramalan jika hasil korelasi tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa mendatang di dalam lapangan tertentu. Tepat tidaknya ramalan tersebut dapat dilihat dari korelasi koefisien antara hasil tes itu dengan alat ukur lain pada masa mendatang.43 (2) Validitas bandingan (concurren validity) Suatu tes dikatakan memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama secara tepat telah mampu menunjukkan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya.44 b) Validitas item tes Apa yang sudah dibicarakan di atas adalah validitas tes secara keseluruhan. Disamping mencari validitas tes, perlu juga dicari validitas item sebagai bagian dari validitas tes. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-butir manakah yang menyebabkan soal secara keseluruhan jelek karena memiliki validitas tes rendah. Maka untuk keperluan inilah dicari validitas butir soal (validitas item). Sebuah item memiliki validitas yang tinggi, jika skor pada item mempunyai kesejajaran
42
Suharsimi Arikunto, op.cit., hlm. 67. M. Ngalim Purwanto, op.cit., hlm. 138 44 Anas Sudijono, op.cit., hlm. 176-177. 43
dengan skor total.
24
Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi.45 Untuk soal-soal bentuk objektif, skor untuk item biasanya diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal tersebut. Salah satu teknik korelasi yang terkenal untuk menghitung validitas item adalah menggunakan teknik korelasi point biserial (rpbi), dengan rumus: 46 rp bi =
Mp − Mt SDt
p q
Keterangan: rpbi = Koefisien korelasi point biserial Mp = Relata skor dari subjekf yang menjawab betul bagi item yang dicari validitasnya Mt = Relata skor total SDt = Standar deviasi dari skor total p = Proporsi testee yang menjawab betul terhadap item yang sedang di uji validitasnya q = Proporsi siswa yang menjawab salah b. Reliabilitas 1) Pengertian Reliabilitas Rebialitas sering diartikan dengan keterandalan. Artinya suatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama.47 Menurut Muhammad Abdul Kholik dalam bukunya yang berjudul "Ikhtibaarotun al Lughoh", menyebutkan bahwa:48
ﻳﻘﺼﺪ ﺑﺎﻟﺜﺒﺎت ﻋﺪم اﻟﺘﺬﺑﺬب ﻓﻰ اﻻﺧﺘﺒ ﺎر اذا ﻣ ﺎ ﻗﺼ ﺪ ﺑ ﻪ أن:اﻟﺜﺒﺎت ﻳﻜﻮن ﺑﻤﺜﺎﺑﺔ اﻟﻤﻘﻴﺎس 45
Suharsimi Arikunto, op.cit., hlm. 76. Anas Sudijono, op.cit., hlm. 185. 47 M. Chabib Thoha, op.cit., hlm. 118. 48 Muhammad Abdul Kholik, Ikhtibaarotun al-Lughoh, (Riyadh: Jami'ah Malik Su'ud, 1989), hlm. 39. 46
25
"Reliabilitas tes adalah tidak adanya perubahan-perubahan dalam tes yang dilaksanakan dengan menggunakan tes yang serupa" Charles E. Skinner dalam bukunya yang berjudul "Essentials
of Educational Psychology" menyebutkan bahwa: "A test is reliable if it measures consintenly". Suatu tes dikatakan reliabel yaitu apabila tes tersebut dapat mengukur secara ajeg atau konsisten.49 Adapun Anne Anastasi dalam bukunya Psychological
testing, menjelaskan bahwa: "Reliability refers to the consistency of scores obtained by the same persons when they are reexamined with the same test on different occasions".50 Reliabilitas adalah keajegan atau ketetapan nilai yang diperoleh dari individu-individu yang sama ketika mereka diuji dengan tes yang sama pada waktu yang berbeda. Dari definisi-definisi di atas, maka dapat disimpulkan bahwa reliabilitas tes adalah suatu tes yang memberikan hasil yang relatif sama kapanpun tes itu diujikan kepada sejumlah testee yang sama. 2) Faktor-faktor yang mempengaruhi reliabilitas a) Luas tidaknya sampling yang diambil Makin luas suatu sampling, berarti tes makin andal. b) Perbedaan bakat dan kemampuan murid yang di tes Makin variabel kemampuan peserta tes, berarti makin tinggi keandalan koefisien tes. Tes yang diberikan kepada beberapa tingkat kelas yang berbeda lebih tinggi keandalannya daripada yang hanya diberikan kepada beberapa kelas yang sama karena tingkat kelas yang berbeda akan menghasilkan achievement yang lebih luas. c) Suasana dan kondisi testing
49
Charles E. Skinner (ed), Essentials of EducationalPsychology, (englewood Cliffs: Prentice – Hall inc., t.t.), hlm. 443. 50 Anne Anastasi dan Susana Urbina, Psychological Testing, (New York: Prentice – Hall Inc., 1984), hlm. 84.
26
Suasana ketika sedang berlangsung testing, seperti tenang, gaduh, banyak gangguan, pengetes yang marah-marah dapat mengganggu pengerjaan tes sehingga dapat mempengaruhi pula hasil dan keandalan tes.51 3) Teknik Analisis Reliabilitas Tes Dalam rangka menentukan apakah tes hasil belajar bentuk objektif yang disusun oleh tester telah memiliki keajegan mengukur
ataukah
belum,
maka
dapat
dilakukan
dengan
menggunakan tiga pendekatan. a) Pendekatan Single Test-Single Trial (Single Test-Single Trial Method) Pendekatan Single Test-Single Trial adalah pendekatan "serba single" atau pendekatan "serba satu", yaitu satu kelompok subjek, satu jenis alat pengukur, dan satu kali pengukuran; atau satu kelompok testee, satu jenis tes, dan satu kali testing. Dengan menggunakan pendekatan ini, maka tinggi rendahnya reliabilitas tes bentuk objektif dapat diketahui dengan melihat besar kecilnya koefisien realibilitas tes (r11). Adapun untuk menghitung atau mencari r11 dapat digunakan lima jenis formula, yaitu : (1) formula Spearman-Brown, (2) Formula Flanagan, (3) Formula Rulon, (4) Formula KuderRichardson dan (5) Formula C. Hoyt.52
b) Pendekatan Test-retest (single test-double trial) Pendekatan test-retest adalah pendekatan untuk menguji reliabilitas tes dengan jalan menguji tes tersebut dua kali atau lebih, kemudian hasilnya dikorelasikan. 51 52
Ngalim Purwanto, op.cit., hlm. 141. Ibid., hlm. 214.
27
Pada
pendekatan
ini,
penentuan
reliabilitas
tes
didasarkan pada konsistensi dari "batang tubuh" tes yang bersangkutan, yang terbangun dari kumpulan butir-butir item. Adapun langkah-langkah yang dapat ditempuh pada uji reliabilitas ini adalah sebagai berikut :53 (1) Menyusun sebuah tes yang akan diukur reliabilitasnya. (2) Mengujikan tes yang tersusun tersebut (tahap I). (3) Menghitung skor hasil tes tahap I. (4) Mengujikan ulang tes yang tersusun tersebut (tahap II). (5) Menghitung skor hasil tes ulang (tahap II). (6) Menghitung reliabilitas tes dengan jalan mengkorelasikan skor tes I dengan skor tes II dengan rumus korelasi product
moment. c) Pendekatan Alternate Form (double test-double trial) Pendekatan alternate form adalah pendekatan untuk menguji reliabilitas tes dengan jalan menyusun dua buah tes yang memiliki kemiripan atau kesamaan untuk diujikan kepada sekelompok testee tanpa adanya tenggang waktu. Adapun langkah-langkah yang dapat ditempuh dalam pendekatan ini adalah :54 (1) Menyusun dua buah tes yang sejenis. (2) Mengujikan tes tersebut (dalam waktu yang bersamaan atau beriringan). (3) Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan antara tes A dan tes B. (4) Mencari koefisien stabilitas kedua tes (A dan B) dengan jalan mencari korelasinya melalui rumus korelasi product
moment.
53 54
M. Chabib Thoha, op.cit., hlm. 119-120. Ibid., hlm. 122-123.
28
Dari ketiga pendekatan di atas, yang lebih tepat untuk menentukan reliabilitas tes hasil belajar bentuk objektif secara langsung terhadap butir-butir tes hasil belajar adalah pendekatan single test-single trial yang berbentuk formula Kuder-Richardson dengan salah satu rumusnya yaitu K-R2055. Adapun cara menggunakan rumus K-R20 adalah:56 a) Membuat tabel analisis butir tanpa harus dikelompokan nomor ganjil dan genap. b) Menghitung proporsi yang menjawab benar dan proprosi yang menjawab salah pada masing-masing butir dalam tabel analisis butir. c) Mengalikan proporsi yang menjawab benar dan proporsi yang menjawab salah. d) Mencari varians (standar deviasi kuadrat) dari skor total. e) Menghitung reliabilitas tes dengan rumus K-R20. ⎡ n ⎤ ⎡ St − Σpiqi ⎤ r11 = ⎢ ⎥ ⎥⎢ St 2 ⎣ n − 1⎦ ⎣ ⎦ Keterangan: = Koefisien reliabilitas tes r11 n = Banyaknya butir item I = Bilangan konstan 2 St = Varian total pi = Proporsi testee yang menjawab benar qi = Proporsi testee yang menjawab salah = Jumlah dari hasil perkalian pi dengan qi 2
c. Tingkat Kesukaran 1) Pengertian tingkat kesukaran item Tingkat kesukaran Item adalah pernyataan tentang seberapa mudah dan seberapa sulit sebuah butir soal bagi siswa yang dikenai pengukuran.57
55
Anas Sudijono, op.cit., hlm. 252. M. Chabib Thoha, op.cit., hlm. 133-134. 57 Burhan Nurgiyanto, Penilaian Dalam Pengajaran Bahasa dan Sastra, (Yogyakarta: BPFE, 1987), hlm. 126. 56
29
Suke Silverius menyebutkan bahwa tingkat kesukaran item adalah persentase siswa yang dapat menjawab benar butir soal tersebut.58 Adapun
menurut
Anne
Anatasi
dalam
bukunya
Psychological Testing menjelaskan bahwa; "The difficulty of an item is defined in terms of the precentage of persons who answer it correctly".59 Tingkat kesukaran suatu butir soal adalah ditandai oleh persentase siswa (testee) yang menjawab dengan benar terhadap butir soal yang bersangkutan. Dari beberapa pengertian di atas, dapat disimpulkan tingkat kesukaran adalah seberapa besar tingkat kesukaran suatu butir soal yang ditunjukkan dengan persentase siswa yang menjawab benar terhadap butir soal tersebut. 2) Teknik analisis tingkat kesukaran Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi validitas dan reliabilitas adalah adanya keseimbangan dari tingkat kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk mudah, sedang, dan sukar secara proporsional. Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal.60 Secara tentatif dapat dikatakan bahwa salah satu ciri butir soal yang baik adalah bahwa ia tidak terlalu sukar dan tidak terlalu mudah untuk kelompok tertentu yang akan dites.61 Cara yang dapat ditempuh untuk mengetahui apakah item tes hasil belajar itu sudah memiliki tingkat kesukaran yang
58 59
Suke Silverius, op.cit., hlm. 167. Anne Anastasi, Psychological Testing, (New York: Macmillan Publishing Inc., 1976),
hlm. 199.
60 61
Nana Sudjana, op.cit., hlm. 135. Mudjijo, op.cit., hlm. 62.
30
memadai ataukah belum, maka dapat diketahui dari besar kecilnya indeks kesukaran item (difficulty index).
Difficulty index (indeks kesukaran item) adalah bilangan atau angka yang menunjukkan sukar mudahnya suatu item soal. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,00 artinya, soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya terlalu mudah. Untuk lebih jelasnya perhatikan bagan di bawah ini: 0,00
1,00
terlalu sukar
terlalu mudah
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P, singkatan dari kata "proporsi". Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dari pada soal dengan P = 0,80.62 Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas, karena semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.63 Angka indeks kesukaran (P) dapat diperoleh dengan menggunakan rumus sebagai berikut:64 P=
NP N
keterangan: P = Indeks kesukaran (proporsi) NP = banyaknya siswa yang menjawab soal itu dengan benar N = Jumlah seluruh siswa peserta tes (testee)
62
Daryanto, Evaluasi Pendidikan, (Jakarta: Rineka Cipta, 2001), cet. 2, hlm. 180. Suharsimi Arikunto, op.cit., hlm. 208. 64 Anas Sidijono, op.cit., hlm. 372. 63
31
Sebagai tindak lanjut hasil analisis terhadap tingkat kesukaran item tes, maka perlu dilakukan hal-hal sebagai berikut:65
Pertama, untuk butir-butir item yang tingkat kesukarannya cukup atau sedang, maka butir item tersebut segera dicatat dalam buku bank soal. Selanjutnya butir-butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tindak lanjut, yaitu: (1) Butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2) Diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee; apakah kalimat soalnya kurang jelas, apakah petunjuk mengerjakan soalnya sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas, dan sebagainya. Setelah dilakukan perbaikan kembali, butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang. (3) Butir-butir item tersebut dapat diambil manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang sifatnya sangat ketat, dalam arti; sebagian besar dari testee tidak akan diluluskan dalam tes seleksi tersebut.
Ketiga, untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan tindak lanjutnya, yaitu: (1) Butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes hasil belajar yang akan datang. (2) Diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui faktor yang menyebabkan butir item tersebut dapat dijawab betul oleh hampir seluruh testee; ada kemungkinan option atau alternatif yang dipasang pada butir-butir item tersebut "terlalu 65
Ibid., hlm. 375-378.
32
mudah diketahui" oleh testee; mana option yang merupakan kunci jawaban item dan mana option yang berfungsi sebagai pengecoh. Di sini testee harus berusaha memperbaiki atau menggantinya dengan option yang lain sehingga antara kunci jawaban dengan pengecoh sulit dibedakan oleh tester. Setelah dilakukan perbaikan, item tersebut dicoba untuk dikeluarkan lagi pada tes berikutnya. (3) butir-butir item ini dapat dimanfaatkan pada tes-tes (terutama tes seleksi) yang sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan dinyatakan lulus dalam tes seleksi. d. Daya Pembeda 1) Pengertian Daya Pembeda Item Daya
pembeda
suatu
soal
tes
adalah
bagaimana
kemampuan soal itu untuk membedakan siswa-siswa yang termasuk kelompok pandai (upper group) dengan siswa-siswa yang termasuk kelompok kurang (lower group)66 Menurut Wilmar Tinambunan, "The discriminating power
of a test item is its ability to differentiate between pupils who have achieved well (the upper group) and those who have achieved poorly (the lower group)".
67
Daya pembeda item tes adalah
kemampuan item tes tersebut untuk membedakan antara siswasiswa yang berkemampuan tinggi dengan siswa-siswa yang berkemampuan rendah. Sedangkan Anas Sudijono menjelaskan bahwa:68 Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi (pandai) dengan testee yang kemampuannya rendah (bodoh) demikian rupa, sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk 66
Ngali Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja Rosadakarya, 1997), cet. 8, hlm. 120. 67 Wilmar Tinambunan, op.cit., hlm. 139. 68 Anas Sudijono, op.cit., hlm. 385-386.
33
menjawab butir item tersebut, sebagian besar tidak dapat menjawab item dengan betul. Dari beberapa definisi di atas, maka dapat disimpulkan bahwa suatu item tes memiliki daya pembeda yaitu apabila item tes itu dapat dijawab benar oleh siswa kelompok atas (pandai) dan tidak dapat dijawab benar oleh siswa kelompok bawah (bodoh). 2) Teknik Analisis Daya Pembeda Item Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan bahwa kemampuan antara testee yang satu dengan testee yang lain itu berbeda-beda, dan bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaanperbedaan kemampuan yang terdapat di kalangan testee tersebut. Sejalan dengan pernyataan di atas maka kegiatan analisis terhadap daya pembeda item itu ditujukan untuk menjawab pertanyaan: "Apakah testee yang kita anggap pandai jawabannya pada umumnya betul, dan apakah testee yang kita anggap bodoh itu pada umumnya jawabannya salah?". Jika jawaban atas pertanyaan itu adalah "ya", maka butir item tersebut dapat kita anggap sebagai butir item yang baik, dalam arti bahwa butir item itu telah menunjukkan kemampuannya di dalam membedakan antara testee yang termasuk dalam kategori pandai dengan testee yang termasuk dalam kategori bodoh. Sebaliknya, jika jawab atas pertanyaan itu "tidak", maka butir item tersebut dapat kita nyatakan sebagai butir item yang jelek, sebab hasil yang dicapai dalam tes itu justru bertentangan atau berlawanan arah dengan tujuan tes itu sendiri.69 Daya pembeda item dapat diketahui dengan melihat besar kecilnya
angka
indeks
diskriminasi
item.
Angka
indeks
diskriminasi item adalah sebuah angka atau bilangan yang 69
Ibid., hlm. 396.
34
menunjukkan besarnya daya pembeda yang dimiliki oleh sebutir item. Indeks diskriminasi item, umumnya diberi lambang D (discriminatory power). Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi digunakan jika suatu soal "terbalik" menunjukkan kualitas testee. Artinya anak pandai disebut bodoh dan anak bodoh disebut pandai. Dengan demikian ada tiga titik pada daya pembeda item, yaitu70 - 1,00
0,00
1,00
daya pembeda
daya pembeda
daya pembeda
negatif
rendah
tinggi (positif)
Indeks diskriminasi pada dasarnya dihitung atas dasar pembagian testee ke dalam dua kelompok, yaitu kelompok atas (pandai) dan kelompok bawah (bodoh). Cara menentukan dua kelompok itu bervariasi, misalnya: dapat membagi dua kelompok tersebut menjadi 27% dari kelompok atas dan 27% dari kelompok bawah; dapat juga menggunakan median, yaitu 50% testee kelompok atas dan 50% testee kelompok bawah; dan dapat juga dengan hanya mengambil 20% dari testee kelompok atas dan 20% dari testee kelompok bawah. Dari beberapa pembagian tersebut, para
pakar
di
bidang
evaluasi
pendidikan
lebih
banyak
menggunakan presentase sebesar 27% dari testeekelompok atas dan 27% dari testee kelompok bawah. Hal ini disebabkan adanya bukti-bukti empirik bahwa pembagian tersebut telah menunjukkan kesensitifannya, atau dengan kata lain cukup dapat diandalkan.71 70 71
Suharsimi Arikunto, op.cit., hlm. 211. Anas Sudijono, op.cit., hlm. 387.
35
Sebagaimana yang dijelaskan oleh Sumadi Suryabrata, bahwa pembagian 27% kelompok atas dan 27% dari kelompok bawah itu, memberikan efisiensi tertinggi dalam memperkirakan daya pembeda soal.72 Indeks diskriminasi (D) dapat dihitung menggunakan rumus, sebagai berikut: 73 BA BB − = PA − PB JA JB keterangan: D=
D BA BB JA JB PA PB
= Discriminatory Power (Angka indeks diskriminasi item) = Banyaknya testee kelompok atas yang menjawab benar = Banyaknya testee kelompok bawah yang menjawab benar = banyaknya testee kelompok atas. = banyaknya testee kelompok bawah. = Proporsi testee kelompok atas yang menjawab benar = Proporsi testee kelompok bawah yang menjawab benar Sebagai tindak lanjut dari hasil analisis terhadap daya
pembeda item tes, maka perlu dilakukan hal-hal sebagai berikut:74 Pertama, untuk butir-butir item yang sudah memiliki daya pembeda item baik, hendaknya dicatat dalam buku bank soal tes hasil
belajar.
Selanjutnya
butir-butir
item
tersebut
dapat
dikeluarkan pada tes hasil belajar yang akan datang. Kedua, untuk butir-butir item yang daya pembedanya masih rendah, ada dua kemungkinan tindak lanjut, yaitu: (1) Ditelusuri, untuk kemudian diperbaiki, dan setelah diperbaiki dapat diajukan lagi dalam tes hasil belajar yang akan datang. (2) Dibuang (didrop) dan tidak akan dikeluarkan lagi pada tes yang akan datang. Ketiga,
untuk
butir-butir
item
yang
angka
indeks
diskriminasi itemnya bertanda negatif, sebaiknya tidak dikeluarkan lagi pada tes yang akan datang, karena butir item tersebut memiliki 72
Sumadi Suryabrata, Pengembangan tes Hasil Belajar, (Jakarta: Rajawali Pers, 1987),
hlm. 108.
73 74
Suharsimi Arikunto, op.cit., hlm. 213-214. Anas Sudijono, op.cit., hlm. 408-409
36
kualitas sangat jelek (testee yang termasuk pandai lebih banyak yang menjawab salah daripada testee yang termasuk bodoh, justru hanya sedikit saja yang jawabannya salah). e. Efektivitas Fungsi Distraktor Dalam setiap tes objektif selalu digunakan alternatif jawaban yang mengandung dua unsur sekaligus, yaitu jawaban tepat dan jawaban yang salah sebagai penyesat (distraktor)75 Tujuan utama pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul. Makin banyak testee yang terkecoh, maka distraktor tersebut dapat menjalankan fungsinya dengan baik. Sebaliknya, apabila distraktor yang dipasang pada setiap butir item itu "tidak laku" (maksudnya: tidak ada seorangpun dari sekian banyak testee yang merasa tertarik atau terangsang untuk memilih distraktor tersebut sebagai jawaban betul), maka distraktor tersebut tidak dapat menjalankan fungsinya dengan baik. Dengan kata lain, distraktor baru dapat dikatakan telah menjalankan fungsinya dengan baik, apabila distraktor tersebut memiliki daya rangsang atau daya tarik, sehingga testee (khususnya testee dari kelompok bawah) menjadi terkecoh untuk memilih distraktor sebagai jawaban betul.76 Analisis fungsi distraktor yang sering dikenal dengan istilah lain, yaitu pola penyebaran jawaban soal. Adapun yang dimaksud pola penyebaran jawaban soal adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya testee yang
75 76
M. Chabib Thoha, op.cit., hlm. 149. Anas Sudijono, op.cit., hlm. 410.
37
memilih option a, b, c, atau d atau yang tidak memilih option manapun (blangko). Dalam istilah evaluasi disebut omit, disingkat O.77 Suatu distraktor dapat diperlakukan dengan 3 cara:78 1) Diterima, karena sudah baik. 2) Ditolak, karena tidak baik. 3) Ditulis kembali, karena kurang baik. Cara untuk menentukan, apakah suatu distraktor telah dapat menjalankan fungsinya dengan baik atau belum, maka dapat dianalisis menggunakan rumus:79
Distraktor =
Banyaknya testee yang memilih option X100% Jumlah peserta tes ( testee)
Apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh testee, maka distraktor itu telah berfungsi dengan baik. Sebaliknya apabila distraktor tersebut dipilih kurang dari 5% dari seluruh testee, maka distraktor itu belum berfungsi dengan baik. 3. Kegunaan Analisis Item Tes Analisis item tes (item analysis) merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun. Suharsimi Arikunto dalam bukunya yang berjudul “Dasar-Dasar Evaluasi Pendidikan”, menjelaskan bahwa faedah atau kegunaan dari analisis item tes adalah:80 a. Membantu kita dalam mengidentifikasikan butir-butir soal yang jelek. b. Memperoleh
informasi
yang
akan
dapat
digunakan
untuk
menyempurnakan soal-soal untuk kepentingan lebih lanjut. c. Memperoleh gambaran secara selintas tentang keadaan tes yang kita susun.
77
Suharsimi Arikunto, op.cit., hlm. 219. Daryanto, op.cit., hlm. 193. 79 Anas Sudijono, op.cit., hlm. 412. 80 Suharsimi Arikunto, op.cit., hlm. 205. 78
38
Adapun manfaat atau kegunaan analisis soal buatan guru menurut Suke Silverius dalam bukunya yang berjudul “Evaluasi Hasil Belajar dan Umpan Balik”, adalah sebagai berikut:81 a. Menentukan apakah butir soal berfungsi tepat seperti yang dimaksudkan oleh guru. Untuk
menentukan
apakah
butir
soal
telah
berfungsi
sebagaimana mestinya, guru perlu mempertimbangkan hal-hal berikut: 1) Apakah tes itu ditujukan untuk mengukur pencapaian tujuan instruksional yang dimaksudkan? 2) Apakah tes itu mempunyai tingkat kesukaran yang memadai, dipandang dari materi yang dipakai untuk menulis butir soal itu dan tingkat kemampuan yang diukur? 3) Apakah kunci jawaban telah betul? 4) Apakah distraktor berfungsi dengan baik? b. Umpan balik bagi siswa mengenai penampilannya dan merupakan dasar untuk diskusi kelas Siswa berhak mengetahui bagaimana tesnya dinilai dan jawaban yang benar dari setiap butir soal. Dengan demikian dia dapat membetulkan
kesalahan
jawabannya,
sementara
guru
dapat
menjelaskan sejauhmana jawaban yang diinginkan dari setiap soal. Hal ini menyebabkan siswa lebih memahami pokok bahasan atau subpokok bahasan melalui jawaban yang baik dan benar dari setiap soal. c. Umpan balik bagi guru tentang kesulitan belajar siswa. Suatu prosedur sederhana seperti mentabulasi presentase siswa yang menjawab benar suatu butir soal dapat memberikan informasi kepada guru mengenai pokok-pokok bahasan yang membutuhkan penjelasan tambahan dan perbaikan. Tentu saja sekelompok butir soal yang menanyakan bahan yang sama akan memberikan informasi yang lebih reliabel (ajeg) daripada satu soal saja.
81
Suke Silverius, op.cit., hlm. 176-177.
39
Mengidentifikasi kesalahan apa yang ada dalam jawaban terhadap soal-soal dapat sangat membantu guru untuk perbaikan tingkat pemahaman siswa terhadap
pokok bahasan atau subpokok
bahasan yang diteskan itu. d. Bidang-bidang kurikulum yang memerlukan perbaikan. Jika ada butir soal tertentu yang selalu sukar bagi siswa, atau selalu ada jenis kesalahan tertentu yang sering terjadi, maka mungkin masalahnya di luar jangkauan guru-guru. Mungkin kurikulumnya yang perlu direvisi. Analisis soal dapat membantu menemukan hal ini. e. Perbaikan butir soal. Hasil analisis butir soal dapat menunjukkan kualitas butir soal itu. Maka hasil analisis dapat dipakai untuk mengupayakan perbaikan butir soal tersebut. Butir-butir soal yang diperbaiki itu dapat disimpan untuk dipakai lagi pada tahun yang akan datang. f. Meningkatkan ketrampilan penulisan soal. Cara yang paling efektif untuk meningkatkan keterampilan menulis soal tes adalah menganalisis butir-butir soal dan cara siswa menjawab soal-soal itu. Kemudian, memanfaatkan informasi ini untuk perbaikan butir soal dan mencobanya lagi kepada para siswa. Hanya membaca buku teori tidaklah cukup.
C. MATA PELAJARAN AQIDAH AKHLAK
1. Kurikulum Aqidah Akhlak Pendidikan aqidah akhlak adalah upaya sadar dan terencana dalam menyiapkan peserta didik untuk mengenal, memahami, menghayati dan mengimani Allah dan merealisasikannya dalam perilaku akhlak mulia dalam kehidupan sehari-hari melalui kegiatan bimbingan, pengajaran latihan, penggunaan pengalaman dan pembiasaan. Dalam kehidupan masyarakat yang majemuk dalam bidang keagamaan, pendidikan ini juga diarahkan pada peneguhan aqidah di satu sisi dan peningkatan toleransi
40
serta saling menghormati dengan penganut agama lain dalam rangka mewujudkan kesatuan dan persatuan bangsa.82 a. Tujuan Pendidikan Aqidah Akhlak Berdasarkan UU RI No. 20 Tahun 2003, Pendidikan Agama bertujuan untuk membentuk peserta didik menjadi manusia yang beriman dan bertaqwa kepada Tuhan Yang Maha Esa serta berakhlak mulia.83 Menurut Zuhairini, tujuan umum pendidikan agama adalah membimbing peserta didik agar mereka menjadi muslim sejati, beriman teguh, beramal shaleh, dan berakhlak mulia serta berguna bagi masyarakat, agama dan negara.84 Sedangkan M. Arifin menjelaskan bahwa: 85 Tujuan Pendidikan Islam adalah perwujudan nilai-nilai Islami dalam pribadi manusia didik yang diikhtiarkan oleh pendidik muslim melalui proses yang terminal pada hasil (produk) yang berkepribadian Islam yang beriman, bertakwa dan berilmu pengetahuan yang sanggup mengembangkan dirinya menjadi hamba Allah yang taat. Ketaatan kepada Allah Swt merupakan tujuan akhir dari pendidikan Islam. Sebagaimana firman Allah dalam surat Adz-Dzariat ayat 56, yaitu:
ن ِ ﻻ ِﻟ َﻴ ْﻌ ُﺒ ُﺪ ْو ﺲ ِإ ﱠ َ ﻹ ْﻧ ِ ﻦ َو ْا ﺠﱠ ِ ﺖ ا ْﻟ ُ ﺧَﻠ ْﻘ َ َو َﻣﺎ “Aku tidak menjadikan jin dan manusia kecuali agar mereka itu beribadah kepada-Ku” (QS. Adz-Dzariyat: 56). 86 Salah satu bagian dari pendidikan agama Islam adalah pendidikan Aqidah Akhlak. Adapun tujuan pendidikan Aqidah akhlak di Madrasah Aliyah adalah untuk menumbuhkan dan meningkatkan
82
Departemen Agama RI, Kurikulum 2004 (Pedoman Khusus Pengembangan Silabus dan Sistem Penilaian Akidah Akhak Madrasah Aliyah), (Jakarta: Direktorat Kelembagaan Agama Islam, 2004), hlm. 21. 83 Undang-Undang SISDIKNAS (Sistem Pendidikan Nasional) 2003, (UU RI No.20 Th. 2003), (Jakarta: Sinar Grafika Offset, 2003), hlm. 50. 84 Zuhairini dkk., Metodologi Pendidikan Agama, (Solo: Ramadhani, 1993), hlm. 35. 85 Arifin, Ilmu Pendidikan Islam, (Jakarta: Bumi Aksara, 2000), hlm. 224. 86 Departemen Agama Ri, Al-Qur'an dan Terjemahnya, (Jakarta: Yayasan Penyelenggara Penerjemah/Penafsir Al-Qur'an, 1990), hlm. 862.
41
keimanan peserta didik yang diwujudkan dalam akhlaknya yang terpuji, melalui pemberian dan pemupukan pengetahuan, penghayatan, pengamalan serta pengalaman peserta didik tentang aqidah dan akhlak Islam, sehingga menjadi manusia muslim yang terus berkembang dan meningkat kualitas keimanan dan ketaqwaannya kepada Allah Swt serta berakhlak mulia dalam kehidupan pribadi, bermasyarakat, berbangsa san bernegara, serta untuk dapat melanjutkan pada jenjang pendidikan yang lebih tinggi.87 b. Materi Aqidah Akhlak Pelajaran Aqidah Akhlak di Madrasah Aliyah berisi bahan pelajaran yang dapat mengarahkan pada pencapaian kemampuan dasar peserta didik untuk dapat memahami rukun iman secara ilmiah serta pengalaman dan pembiasaan berakhlak Islami, untuk dapat dijadikan landasan perilaku dalam kehidupan sehari-hari serta sebagai bekal untuk jenjang pendidikan berikutnya. Ruang lingkup pelajaran Aqidah akhlak meliputi: aspek aqidah, aspek akhlak dan aspek kisah keteladanan.88 Materi pelajaran Aqidah Akhlak untuk kelas I semester genap, adalah sebagai berikut:89 -
Iman kepada Malaikat.
-
Akhlak terpuji (kreatif, dinamis, sabar dan tawakal).
-
Akhlak tercela (pasif, pesimis, putus asa, dan bergantung pada orang lain).
-
Iman kepada Kitab Allah.
-
Akhlak terpuji (Sikap bijaksana, amanah dan futuristik).
-
Akhlak tercela (memfitnah, mencuri, picik, hedonisme, ananiah, dan materialistik).
87
Departemen Agama RI, op.cit., hlm. 22. Ibid. 89 Ibid., hlm. 30-32. 88
42
2. Pembelajaran Aqidah Akhlak Untuk mencapai tujuan pembelajaran aqidah akhlak, maka diperlukan adanya beberapa pendekatan dalam proses belajar mengajar, yaitu:90 a. Keimanan, yang mendorong peserta didik untuk mengembangkan pemahaman dan keyakinan tentang adanya Allah SWT. Sebagai sumber kehidupan. b. Pengamalan, mengkondisikan peserta didik untuk mengembangkan dan merasakan hasil-hasil pengamalan akhlak mulia dalam kehidupan sehari-hari. c. Pembiasaan, melaksanakan pembelajaran dengan membiasakan sikap dan perilaku yang baik yang sesuai dengan ajaran Islam yang terkandung dalam al-Qur’an dan Hadits serta dicontohkan oleh para ulama. d. Rasional, usaha meningkatkan kualitas proses dan hasil pembelajaran aqidah akhlak dengan pendekatan yang memfungsikan rasio peserta didik, sehingga isi dan nilai-nilai yang ditanamkan mudah dipahami dengan penalaran. e. Emosional, upaya menggugah perasaan (emosi) peserta didik dalam menghayati aqidah dan akhlak mulia sehingga lebih terkesan dalam jiwa peserta didik. f. Fungsional, menyajikan materi aqidah akhlak yang memberikan manfaat nyata bagi peserta didik dalam kehidupan sehari-hari dalam arti luas. g. Keteladanan, yaitu pendidikan yang menempatkan dan memerankan guru serta komponen madrasah lainnya sebagai teladan; sebagai cerminan dari individu yang memiliki keimanan teguh dan berakhlak mulia.
90
Ibid., hlm. 25-27.
43
3. Evaluasi Mata Pelajaran Aqidah Akhlak Evaluasi merupakan rangkaian akhir dari proses pendidikan. Berhasil atau tidaknya pendidikan dalam mencapai tujuannya dapat dilihat setelah dilakukan evaluasi atau penilaian terhadap out put yang dihasilkan. Dalam pendidikan Islam, penilaian atau evaluasi dapat dilakukan dengan dua cara, yaitu :91 a. Evaluasi terhadap diri sendiri (self evaluation / intropeksi) Evaluasi terhadap diri sendiri adalah mengadakan intropeksi atau perhitungan terhadap diri sendiri. Evaluasi ini tentunya berdasarkan kesadaran sendiri yang bertujuan untuk meningkatkan kreativitas dan produktivitas (amal saleh) pribadi. Evaluasi terhadap diri sendiri sangat dianjurkan dalam Islam. hal ini sesuai dengan firman Allah Swt dalam surat al-Hasyr ayat 18, yaitu:
{18 : }اﻟﺤﺸﺮ... ﺖ ِﻟ َﻐ ٍﺪ ْ ﺲ ﻣﱠﺎ َﻗ ﱠﺪ َﻣ ٌ ﻈ ْﺮ َﻧ ْﻔ ُ ﻦ ﺁ َﻣﻨُﻮا ا ﱠﺗﻘُﻮا اﻟﱠﻠ َﻪ َو ْﻟﺘَﻨ َ ﻳَﺎ َأ ﱡﻳﻬَﺎ اﱠﻟﺬِﻳ “Hai orang-orang yang beriman, bertakwalah kepada Allah dan hendaklah setiap diri memperhatikan apa yang telah diperbuatnya untuk hari esok (akhirat)” (QS. Al-Hasyr : 18).92 Dalam sebuah hadits yang diriwayatkan oleh Umar bin Khattab juga disebutkan adanya anjuran untuk mengevaluasi terhadap diri sendiri, yaitu: 93
ﷲ ُ ﺻ ﻠﱠﻰا َ ﷲ ِ لا ُ ﺳ ْﻮ ُ ل َر َ َﻗ ﺎ:ل َ ﻋ ْﻨ ُﻪ َﻗ ﺎ َ ﷲ ُ ﻲا َ ﺿ ِ ب َر ِ ﻄﺎ ﺨﱠ َ ﻦ ا ْﻟ ِ ﻋ َﻤ َﺮ ْﺑ ُ ﻦ ْ ﻋ َ {ﺳ ُﺒﻮْا }رواﻩ اﻟﺘﺮﻣﺬى َ ن ُﺗﺤَﺎ ْ ﻞ َأ َ ﺴ ُﻜ ْﻢ َﻗ ْﺒ َ ﺳ ُﺒﻮْا َأ ْﻧ ُﻔ ِ ﺣَﺎ: ﺳﱠﻠ َﻢ َ ﻋَﻠ ْﻴ ِﻪ َو َ “Dari Umar bin Khattab r.a berkata, Rasulullah Saw bersabda: Evaluasilah dirimu sebelum engkau di evaluasi” Berdasarkan ayat dan hadits di atas, maka manusia dituntut selalu waspada dan memperhitungkan segala tindakannya, agar kehidupannya kelak tidak merugi. b. Evaluasi terhadap orang lain (peserta didik)
91
Ramayulis, Ilmu Pendidikan Islam, (Jakarta : Kalam Mulia, 2004), hlm. 200-201. Departemen Agama RI, op.cit., hlm. 919 93 At-Tirmidzi, Sunan al-Tirmidzi, (Beirut Libanon: Dar al-Fikr, 1994), hlm. 208. 92
44
Evaluasi terhadap orang lain (peserta didik) merupakan bagian dari kegiatan pendidikan Islam. Kegiatan ini tidak sekedar boleh, tetapi bahkan diwajibkan. Kewajiban di sini tentunya berdasarkan niat “amar ma’ruf nahi munkar” yang bertujuan untuk perbaikan perbuatan sesama umat Islam. Salah satu bagian dari pendidikan Islam adalah pendidikan aqidah akhlak. Hal ini berarti bahwa evaluasi dalam pendidikan aqidah akhlak juga sangat dianjurkan. Sebagaimana evaluasi yang dilakukan oleh Nabi Sulaiman, yaitu:
{27 : ﻦ }اﻟﻨﻤﻞ َ ﻦ ا ْﻟﻜَﺎ ِذﺑِﻴ َ ﺖ ِﻣ َ ﺖ َأ ْم آُﻨ َ ﺻ َﺪ ْﻗ َ ﻈ ُﺮ َأ ُ ﺳﻨَﻨ َ ل َ ﻗَﺎ Berkata Sulaiman: "Akan kami lihat, apa kamu benar, ataukah kamu termasuk orang-orang yang berdusta”. (QS. An-Naml : 27).94 Pada umumnya ada tiga sasaran pokok dalam penilaian atau evaluasi terhadap peserta didik, yaitu :95 1) Segi tingkah laku, artinya segi yang menyangkut sikap, minat, perhatian, ketrampilan siswa sebagai akibat dari proses mengajar dan belajar. 2) Segi isi pendidikan, artinya penguasaan bahan pelajaran yang diberikan guru dalam proses mengajar-belajar. 3) Segi yang menyangkut proses mengajar dan belajar itu sendiri. Proses mengajar dan belajar perlu diadakan penilaian secara objektif dari guru, sebab baik tidaknya proses mengajar dan belajar akan menentukan baik tidaknya hasil belajar yang dicapai siswa. Evaluasi mata pelajaran Aqidah Akhlak untuk Madrasah Aliyah didasarkan pada pencapaian kompetensi yang harus dikuasai oleh peserta didik selama menempuh pendidikan di MA. Kompetensi ini berorientasi pada perilaku afektif dan psikomotorik dengan dukungan pengetahuan kognitif dalam rangka memperkuat aqidah serta meningkatkan kualitas
94
Departemen Agama RI, op.cit., hlm. 596. Nana Sudjana, Dasar-Dasar Proses Belajar Mengajar, (Bandung: Sinar Baru Algensindo, 1995), hlm. 44. 95
45
akhlak sesuai dengan ajaran Islam. Adapun kompetensi mata pelajaran aqidah akhlak untuk kelas I semester genap adalah sebagai berikut :96 a). Memahami dan meyakini hakekat iman kepada Malaikat serta mampu menganalisis secara ilmiah dan terbiasa berakhlak terpuji (kreatif, dinamis, dan tawakal) dan menghindari akhlak tercela (pasif, pesimis, putus asa, dan tergantung pada orang lain) dalam kehidupan sehari-hari b). Memahami dan meyakini kebenaran kitab-kitab Allah serta mampu menganalisis secara ilmiah dan terbiasa berakhlak mulia (bersikap amanah, berpikir dan berorientasi masa depan) dan menghindari akhlak tercela
(memfitnah,
mencuri,
picik,
hedonisme,
ananiah
dan
materialistik) dalam kehidupan sehari-hari. Berdasarkan kurikulum 2004, penilaian atau evaluasi mata pelajaran aqidah akhlak dilakukan dengan rambu-rambu sebagai berikut :97 1). Penilaian yang dilakukan meliputi penilaian kemajuan belajar dan penilaian hasil belajar peserta didik yang terdiri dari pengetahuan (aspek kognitif), sikap (aspek afektif), dan perilaku mereka (aspek psikomotorik) 2). Penilaian kemajuan belajar merupakan pengumpulan informasi tentang kemajuan belajar peserta didik. Penilaian ini bertujuan untuk mengetahui tingkat kemampan dasar yang dicapai peserta didik setelah mengikuti kegiatan pembelajaran dalam kurun waktu, unit satuan, atau jenjang tertentu 3). Penilaian hasil belajar aqidah dan akhlak adalah upaya untuk pengumpulan informasi untuk menentukan tingkat penguasan peserta didik terhadap kompetensi meliputi : pengetahuan, sikap dan nilai. Penilaian hasil belajar ini dilakukan sepenuhnya oleh madrasah yang bersangkutan. Hasil penilaian dijadikan sebagai pertimbangan utama dalam memasuki pendidikan jenjang berikutnya
96 97
Departemen Agama RI, Op.Cit., hlm 24 Ibid., hlm. 26-27
46
4). Penilaian hasil belajar aqidah dan akhlak secara nasional dilakukan dengan mengacu pada kompetensi dasar, hasil belajar, materi standar, dan indikator yang telah ditetapkan di dalam Kurikulum Nasional. Penilaian tingkat Naional berfungsi untuk memperoleh informasi dan data tentang mutu hasil penyelenggaraan mata pelajaran aqidah dan akhlak 5). Teknik dan instrument penilaian yang digunakan adalah yang dapat mengukur dengan tepat kemampuan dan usaha belajar peserta didik 6). Penilaian dilakukan melalui tes dan non tes 7). Pengukuran
terhadap
ranah
afektif
dapat
dilakukan
dengan
menggunakan cara non tes, seperti skala penilaian, observasi, dan wawancara. 8). Penilaian terhadap ranah psikomotorik dengan tes perbuatan dengan menggunakan lembar pengamatan atau isntrumen lainnya
D. KAJIAN PENELITIAN YANG RELEVAN
Untuk memperoleh gambaran yang jelas tentang posisi penelitian ini di antara karya-karya yang sudah ada, berikut ini akan penulis ilustrasikan dua karya yang mengkaji tentang kualitas tes. Pertama, Mohamad Nurdin (3100330) dalam karya skripsinya yang
berjudul “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata Pelajaran Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang Tahun 2003/2004”, menyebutkan bahwa kualitas tes mata pelajaran akhlak kelas III yang berjumlah 108 siswa pada semester VI di SMP Muhammadiyah 08 Mijen Semarang adalah sebagai berikut:98 1. Ditinjau dari segi validitas butir soalnya adalah cukup / sedang karena sebanyak 28 butir soal (58 %) dikategorikan valid dan 22 butir soal lainnya (44 %) adalah invalid.
98
Mohamad Nurdin, “Uji Validitas dan Reliabilitas Instrumen Tes Objektif Mata Pelajaran Akhlak kelas III Semester VI di SMP Muhammadiyah 08 Mijen Semarang Tahun 2003/2004”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 67.
47
2. Ditinjau dari segi reliabilitas tesnya adalah cukup / sedang karena nilai koefisien reliabitasnya (r11) adalah sebesar 0,640. Kedua, Indras Rahmawati (3101206) dalam karya skripsinya yang
berjudul “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas Fungsi Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”, menjelaskan bahwa kualitas tes mata pelajaran PAI kelas II yang berjumlah 207 siswa di SMP Negeri 36 Semarang tahun 2004/2005 adalah sebagai berikut:99 1. Ditinjau dari segi tingkat kesukarannya adalah cukup / sedang, karena 11,1 % adalah butir soal yang terlalu sukar, 37,8 %butir soal yang cukup dan 51,1 % butir soal lainnya adalah terlalu mudah. 2. Ditinjau dari segi daya pembedanya adalah cukup /sedang, karena 31,1 % merupakan butir soal yang memiliki daya pembeda lemah, 46,7 % memiliki daya pembeda cukup dan 20 % memiliki daya pembeda baik. 3. Dinjau dari segi fungsi distraktornya adalah baik karena 63 % dari seluruh distraktor yang dipasang pada soal tes tersebut telah berfungsi dengan baik. Dari kedua penelitian di atas, dapat diketahui bahwa posisi penelitian ini memang mempunyai tema yang sama yaitu tentang kualitas tes hasil belajar, akan tetapi berbeda objek penelitiannya, dimana pada penelitian ini yang menjadi objek penelitian adalah tes bentuk objektif pada mata pelajaran Aqidah Akhlak pada tingkat Madrasah Aliyah di Kabupaten Demak, sedangkan objek penelitian dari kedua penelitian sebelumnya adalah tes mata pelajaran PAI pada tingkat SMP di Kota Semarang.
99
Indras Rahmawati, “Analisis Tingkat Kesukaran, Daya Pembeda dan Efektivitas Fungsi Distraktor Pada Tes Mata Pelajaran PAI di SMP Negeri 36 Semarang”, (Perpustakaan Fakultas Tarbiyah IAIN Walisongo Semarang: 2005), t.d, hlm. 64-65.