135
STAIN Palangka Raya
KUALITAS BUTIR SOAL UJIAN AKHIR MADRASAH IBTIDAIYAH GUGUS II TAHUN PELAJARAN 2010/2011 DI KOTA PALANGKA RAYA Gito Supriadi Abstract The study objectives were to analyze and describe the level of difficulty, istinguishing, the validity, and reliability of test items Ibtidaiyah subjects Qur'an Hadith , Morals Aqeedah , Fiqh , Arabic and SKI academic year 2010/2011 in Palangkaraya City Cluster II. This study uses a quantitative approach , the descriptive format . Data collection techniques with engineering documentation in the form of exam questions and answer sheets of students . While the techniques of data analysis using statistical analysis consists of formulas difficulty level items , distinguishing items , validity and reliability of the test items .The results showed that : (1) difficulty level exam Qur'an Hadith eligible items whose difficulty level is as much as 6 good items . Morals Aqeedah exam no difficulty levels that meet the criteria of good items . Fiqh exam there are 6 items that include criteria for level of difficulty of the good items . Arabic exam there are 17 good items. Reliability final exam Elementary School Academic Year 2010/2011 in Cluster II of Palangkaraya city 5 ( five ) subjects tested , there are 4 (four) subjects had reliable ie Quran Hadith , Fiqh , Arabic and SKI . While the exam Aqeedah Morals unreliable. Key Words: Difficulty level, Differential Power, Validity, and Reliability A. LATAR BELAKANG PENELITIAN Sebagai alat ukur, suatu tes dapat dikatakan berhasil menjalankan fungsi ukurnya apabila mampu memberikan hasil ukur yang cermat dan akurat. Tes yang hasil ukurnya tidak cermat atau tidak dapat menunjukkan perbedaan-perbedaan kecil yang ada pada objek ukurnya tidaklah banyak memberikan informasi yang berguna. Jika sebuah tes tidak mampu menunjukkan perbedaan antara siswa yang mempunyai sedikit kemampuan dan yang mempunyai lebih banyak kecakapan, maka tidak tes tersebut belum dikatakan tes yang baik. Sebuah tes yang berisi soal-soal berkualitas tinggi walaupun dalam jumlah yang sedikit akan jauh lebih berguna daripada sebuah tes yang berisi puluhan soal berkualitas rendah. Soal-soal yang berkualitas rendah tidak saja akan menurunkan fungsi tes akan tetapi akan memberikan hasil pengukuran yang menyesatkan. Oleh karena itu setiap tes yang telah selesai ditulis, masih harus diuji kualitasnya secara empirik. Soal-soalnya masih harus diuji dengan menggunakan data yang diperoleh melalui suatu prosedur try-out atau dari hasil pengenaan tes di kelas yang sesungguhnya (field tested). Dari data hasil pengenaan tes ini akan diperoleh bukti mengenai kualitas soal-soal tes yang bersangkutan. Kemudian dari hasil analisis terhadap data empirik ini pula diperoleh dasar
Dosen pada Sekolah Tinggi Agama Islam Negeri (STAIN) Palangka Raya dan Ketua Program Studi Pendidikan Agama Islam STAIN. Alumni Program Studi Penelitian dan Evaluasi Pendidikan (PEP) Universitas Negeri Yogyakarta. Email//
[email protected]
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
136
STAIN Palangka Raya
untuk melakukan perbaikan-perbaikan yang diperlukan. Prosedur kerja dalam melakukan pengujian seluruh soal tes yang didasarkan pada data empirik tersebut dinamai prosedur analisis butir soal. Pada tahun ajaran 2010/2011 pada jenjang pendidikan termasuk Madrasah Ibtidaiyah di Palangka Raya mengadakan ujian sekolah/madrasah yang penyelenggaraannya dilakukan bersama atau gabungan yaitu madrasah swasta menggabungkan diri dengan madrasah negeri, seperti halnya pada tahun ajaran 2010/2011 Madrasah Ibtidaiyah Negeri Langkai di Palangka Raya sebagai penyelenggara ujian madrasah ibtidaiyah yang membawahi 9 madrasah ibtidaiyah yang ada di gugus II. Berdasarkan wawancara yang penulis lakukan dengan Ketua Panitia Ujian Akhir Madrasah Ibtidaiyah gugus II bahwa pelajaran yang diujikan adalah terdiri mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI, yang cara pembuatan soal ujian dilakukan oleh Kelompok Kerja Madrasah (KKM) Gugus II yang terdiri dari 9 Madrasah Ibtidaiyah. Soal ujian yang disusun tersebut secara teoritis sudah dilakukan analisis misalnya terkait dengan kesesuaian antara kompetensi yang diukur dengan soal yang dibuat, akan tetapi soal secara empiris belum dilakukan analisis, sehingga belum diketahui bagaimana tingkat kesukaran soal, daya pembeda butir soal, validitas butir soal dan reliabilitas soal ujian madrasah yang digunakan pada ujian madrasah ibtidaiyah tahun ajaran 2010/2011 di Palangka Raya.1 Guna mengetahui lebih lanjut bagaimana tingkat kesukaran butir soal, daya pembeda butir soal, validitas butir soal, dan reliabilitas soal ujian Madrasah Ibtidaiyah tahun ajaran 2010/2011 maka perlu lakukan penelitian dengan judul Kualitas Butir Soal Ujian Akhir Madrasah Ibtidaiyah Tahun Ajaran 2010/2011 di Gugus II Kota Palangka Raya. B. MASALAH DAN TUJUAN PENELITIAN Berdasarkan latar belakang penelitian di atas, maka masalah dalam penelitian ini adalah: 1. Bagaimana tingkat kesukaran butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya? 2. Bagaimana daya pembeda butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya? 3. Bagaimana validitas butir soal ujian madrasah ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya? 4. Bagaimana reliabilitas soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya? Sedangkan tujuan penelitian ini adalah: 1. Menganalis dan mendeskripsikan tingkat kesukaran butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya. 1
Wawancara dengan Ketua Panitia Ujian Madrasah Ibtidaiyah Gugus 2 di MIN Langkai Palangka Raya tanggal 10 April 2011
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
137
STAIN Palangka Raya
2. Menganalis dan mendeskripsikan daya pembeda butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya. 3. Menganalis dan mendeskripsikan validitas butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya. 4. Menganalis dan mendeskripsikan reliabilitas soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya. C. MANFAAT PENELITIAN Berdasarkan tujuan penelitian tersebut di atas, maka kegunaan penelitian ini adalah sebagai berikut: 1. Memberikan informasi kepada Kelompok Kerja Madrasah (KKM) Madrasah Ibtidayah terkait dengan kualitas butir soal ujian Madrasah Ibtidaiyah, yang dapat dijadikan sebagai bahan evaluasi penyusunan butir soal. 2. Berdasarkan hasil analisis butir soal yang peneliti lakukan, maka butir soal yang memenuhi syarat dapat dijadikan sebagai bank soal, sehingga pada tahun-tahun berikutnya soal tersebut dapat digunakan kembali sebagai alat ukur hasil belajar. D. KAJIAN PUSTAKA 1. Hasil Penelitian Yang Relevan Penelitian serupa pernah penulis lakukan yaitu tentang analisis butir soal ujian semester mata pelajaran Sejarah Kebudayaan Islam (SKI) kelas III Madrasah Aliyah Negeri Yogyakarta tahun 2007. Hasil penelitian menujukkan bahwa dari 40 butir soal bentuk pilihan ganda terdapat tingkat kesukaran soal yang kategori sedang 22 butir soal, kategori sukar 10 soal dan kategori mudah sebanyak 8 butir. Sedangkan soal yang memenuhi kriteria validitas yang baik yaitu kooefisen biserial sebesar >0,30 sebanyak 32 butir soal dan sisanya gugur (8 soal). Selanjutnya hasil analisis reliabiltas soal SKI sebanyak 40 butir soal tersebut memiliki reliabilas cukup yaitu berdasarkan analisis dengan menggunakan rumus KR20 bahwa soal SKI yang digunakan pada ujian semester di Kelas III MAN Yogyakarya pada tahun 2007 sebesar 0,653.2 Penelitian di atas hanya melakukan analisis satu mata pelajaran saja, sedangkan yang akan penulis lakukan pada penelitian ini adalah menganalisis butir soal ujian madrasah ibtidaiyah untuk 5 (lima) mata pelajaran yang diujikan, yaitu Pkn, Bahasa Indonesia, IPA, Matematika dan IPS yang terkait dengan tingkat kesukaran butir soal, daya pembeda butir soal, validitas butir soal dan reliabilitas tes. Penelitian ini akan dilakukan di gugus 2 madrasah ibtidaiyah Kota Palangka Raya. 2. Analisis Butir Soal Analisis butir soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis soal secara teoritik atau kualitatif dan analisis soal secara empiris atau analisis soal secara kuantitatif. 2
Gito Supriadi, Analisis Butir Soal Ujian Semester Mata Pelajaran SKI di MAN Yogyakarta,( Yogyakarta: Pustaka Pelajar, 2007), hal.20.
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
138
STAIN Palangka Raya
Analisis soal secara teoritik atau analisis kualitatif dilakukan sebelum diadakan ujicoba, yakni dengan cara mencermati butir-butir soal yang telah disusun dilihat dari kesesuaian dengan kemampuan dasar dan indikator yang diukur serta pemenuhan persyaratan baik dari aspek materi, kontruksi, dan bahasa.3 Sedangkan analisis soal secara kuantitatif menekankan pada karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, distribusi jawaban, dan reliabilitas.4 Pada penelitian ini penulis tidak akan melakukan analisis soal secara kualitatif, akan tetapi difokuskan pada analisis soal secara kuantitatif yang meliputi parameter tingkat kesukaran soal, daya pembeda, validitas, dan reliabilitas. 3. Alasan Perlunya Analisis Butir Soal Butir soal buatan guru atau kelompok kerja guru pada umumnya dikonstruksikan secara tergesa-gesa dan jarang atau tidak diujicobakan sebelum diadministrasikan. Akibatnya banyak butir soal yang digunakan dalam ujian tidak dapat memberikan atau menghasilkan informasi yang tidak tepat atau tidak akurat tentang kemampuan siswa. Padahal hasil ujian acapkali digunakan sebagai bahan keputusan tentang kelulusan siswa. Bila keputusan yang diambil didasarkan kepada informasi yang tidak benar atau tidak akurat, yang disebabkan oleh alat yang digunakan untuk mengumpulkan informasi yaitu butir soal yang tidak terkonstruksi secara baik, maka tentu saja keputusan demikian itu adalah keputusan yang tidak dapat dipertanggungjawabkan. Jadi jelasnya bahwa dibutuhkan alat yang dapat dipercaya yang dapat mengukur apakah alat ukur (butir soal) yang digunakan memang dapat dijadikan dasar untuk menentukan keputusan yang bijaksana. Menurut Asmawi Zainul dan Noehi Nasution ada beberapa alasan mengapa diperlukan analisis butir soal, yaitu: 1. Untuk dapat mengetahui kekuatan dan kelemahan butir tes, sehingga dapat ditentukan butir yang baik atau yang harus direvisi. 2. Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih memudahkan bagi guru dalam menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam bidang dan tingkat tertentu. 3. Untuk segera dapat diketahui masalah yang terkandung dalam butir soal seperti: kemenduaan butir soal, kesalahan meletakkan kunci jawaban, soal yang terlalu sukar atau terlalu mudah atau soal yang tidak membedakan antara siswa yang mempersiapkan diri secara baik atau tidak dalam menghadapi tes. 4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal atau bank soal. 5 4. Indeks Kesukaran Butir Soal Sangatlah penting untuk melihat tingkat kesukaran soal dalam rangka menyediakan berbagai macam alat diagnostik kesulitan belajar peserta didik ataupun dalam rangka meningkatkan penilaian berbasis kelas. Baik buruknya butir tes juga 3
Djemari Mardapi, Tes Hasil Belajar, Universitas Negeri Yogyakarta, (Yogyakarta: Tp, 2004) hal. 130 Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, ( Bandung: Remaja Rosdakarya, 2005), hal. 10. 5 Asmawi Zainul dan Noehi Nasution, Penilaian Hasil Belajar, Direktorat Jenderal Pendidikan Tinggi Departemen Pendidikan Nasional, (Jakarta: PAU-PPAI-UT, 2001), hal. 172 4
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
139
STAIN Palangka Raya
ditentukan oleh tingkat kesukaran butir tersebut, yang diperoleh dari analisis soal. Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui beberapa cara diantaranya (1) proporsi menjawab benar, (2) skala kesukaran linear, (3) indeks Davis, dan (4) skala bivariat. Proporsi jawaban benar (p), yaitu jumlah peserta tes yang menjawab benar pada butir soal yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya merupakan tingkat kesukaran yang paling umum digunakan.6 Indeks kesukaran suatu soal dinyatakan oleh suatu indeks yang dinamakan indeks kesukaran soal dan disimbolkan oleh huru p. Indeks kesukaran soal merupakan rasio antara penjawab soal dengan benar dan banyaknya penjawab soal. Secara teoretik dikatakan bahwa p sebenarnya merupakan probabilitas empirik untuk lulus soal tertentu bagi kelompok siswa tertentu. Secara matematis tingkat kesukaran butir soal dapat dihitung dengan rumus sebagai berikut: 𝐵 p=𝑁 Keterangan: p = proporsi menjawab benar atau tingkat kesukaran B = banyaknya siswa yang menjawab soal dengan benar N = jumlah peserta tes Besarnya indeks kesukaran berkisar antara 0,00 sampai dengan 1,00. Suatu soal yang mempunyai p = 0, artinya soal itu terlalu sukar karena tidak ada peserta tes yang menjawab benar, sedangkan butir yang mempunyai harga p = 1, artinya soal itu terlalu mudah karena setiap peserta tes dapat menjawab dengan benar. Dari penjelasan diatas dapat disimpulkan bahwa semakin tinggi harga p, butir soal tersebut semakin mudah. Hal demikian secara logis sebetulnya dikatakan tingkat kemudahan butir soal.7 Menurut Fernandes seperti dikutip Adi Suryanto8 kategori tingkat kesukaran dibedakan menjadi tiga kategori seperti nampak pada tabel 1 berikut: Tabel 1 : Kategori Tingkat Kesukaran Nilai p Kategori 0,00 – 0,24 Sukar 0,25 – 0,75 Sedang 0,76 – 1,00 Mudah Guna menyusun butir soal untuk naskah ujian menurut Asmawi dan Nasution sebaiknya digunakan butir soal yang tingkat kesukarannya berimbang yaitu: sukar = 25%, sedang = 50%, dan mudah = 25%. Dalam penggunaan butir soal dengan komposisi seperti itu maka dapat diterapkan penilaian berdasarkan acuan norma atau acuan patokan. Bila komposisi butir soal dalam suatu naskah ujian tidak berimbang, maka penggunaan penilaian acuan norma tidaklah tepat, karena informasi kemampuan yang dihasilkan tidaklah akan terdistribusi dalam suatu kurva normal.9
6
Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, hal. 12 Allen, M.J. and Yen, W. Introduction to Measurement Theory.( Monterey: Brooks/Cole Company, 1979), hal. 120 8 Adi Suryanto, dkk, Evaluasi Pembelajaran di SD, (Jakarta: Universitas Terbuka, 2009), hal. 5.23 9 Asmawi Zainul dan Noehi Nasution, Penilaian Hasil Belajar, hal. 177. 7
Jurnal Studi Agama dan Masyarakat
Publishing
Volume 7, Nomor 2, Desember 2013
140
STAIN Palangka Raya
Tingkat kesukaran (p) sebenarnya merupakan nilai rata-rata dari kelompok peserta tes. Oleh karena itu tingkat kesukaran sebenarnya adalah rata-rata sari suatu distribusi skor kelompok dari suatu soal. paling tidak ada dua ciri tingkat kesukaran. Pertama, tingkat kesukaran merupakan ukuran soal, tidak menunjukkan karakteristik soal. Tingkat kesukaran soal dalam hal ini didefinisikan sebagai frekuensi relatif terhadap pengambil tes. Kedua, tingkat kesukaran merupakan karakteristik soal itu sendiri maupun pengambil tes.10 Butir soal yang dianggap dapat digunakan (baik) adalah butir soal yang mempunyai tingkat kesukaran dalam kategori sedang.11 5. Daya Pembeda Soal Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (siswa yang mempunyai kemampuan tinggi) dengan siswa yang kurang pandai (siswa yang mempunyai kemampuan rendah). Fungsi dari daya beda itu adalah mendeteksi perbedaan individual yang sekecil-kecilnya di antara para subjek tes, sejalan dengan fungsi dan tujuan tes itu sendiri. Butir yang demikian dikatakan valid atau cermat.12 Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah adalah indeks daya pembeda (item discrimination). Indeks daya pembeda soal-soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-masing kelompok. Indeks ini menunjukkan keseuaian antara fungsi soal dengan fungsi tes secara keseluruhan. Angka yang menunjukkan besarnya daya pembeda berkisar antara -1 sampai dengan +1. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar, sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Dengan demikian soal yang indeks daya pembedanya negatif menunjukkan terbaliknya kualitas peserta tes. Indeks daya pembeda dihitung atas dasar pembagian kelompok menjadi dua bagian, yaitu kelompok atas yang merupakan peserta yang berkemampuan tinggi dengan kelompok bawah yaitu kelompok peserta tes yang berkemampuan rendah. Kemampuan tinggi ditunjukkan dengan perolehan skor yang tinggi dan kemampuan rendah ditunjukkan dengan perolehan skor yang rendah. Pada umumnya para ahli tes membagi kelompok ini menjadi 27% kelompok atas dan 27% kelompok bawah.13 Daya pembeda butir soal dapat dihitung dengan menggunakan rumus: D = PA - PB D = indeks daya beda butir soal PA = proporsi kelompok atas yang menjawab benar PB = Proporsi kelompok bawah yang menjawab benar Indeks daya pembeda yang ideal adalah yang sebesar mungkin mendekati angka 1, semakin besar indeks daya pembeda berarti soal tersebut semakin mampu membedakan antara mereka yang menguasai bahan yang diujikan dan mereka yang tidak menguasai bahan. Semakin kecil indeks daya pembeda (mendekati 0) berarti semakin tidak jelaslah 10
Sumarna Surapranata, Analisis, Validitas, Reliabilitas Tes dan Interpretasi Hasil Belajar... hal. 19 Adi Suryanto, dkk, Evaluasi Pembelajaran di SD, (Jakarta: Universitas Terbuka, 2009), hal. 5.23 12 Saifudin Azwar, Tes prestasi : Fungsi dan Pengembangan Pengukuran Prestasi Belajar, (Yogyakarta: Pustaka Pelajar Offset, 2005), hal.137 13 Sumarna Surapranata, Analisis, Validitas, Reliabilitas Tes dan Interpretasi Hasil Belajar,... hal. 24. 11
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
141
STAIN Palangka Raya
fungsi soal yang bersangkutan dalam membedakan mana subjek yang menguasai bahan pelajaran dan mana subjek yang tidak tahu apa-apa. Menurut Ebel kriteria indeks daya beda adalah sebagai berikut: Tabel 2: Indeks Daya Pembeda Soal14 Nilai D D ≥ 0,40 0,30 ≤ D ≤ 0,39 0,20 ≤ D ≤ 0,29 D ≤ 0,19
Kategori Sangat baik Baik Cukup Tidak baik
Keterangan Diterima Perlu peningkatan Revisi Dibuang
6. Validitas Butir Soal Dua prinsip dasar permasalahan dalam penilaian adalah menentukan apakah sebuah tes telah mengukur apa yang hendak diukur dan apakah sebuah tes telah tepat digunakan untuk membuat suatu keputusan tentang pengambil tes. Secara umum validitas dapat dikatakan sebagai ketepatan alat ukur untuk mengukur sesuatu. Validitas dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris. Validitas logis sama dengan analisis kualitatif terhadap sebuah soal, yaitu untuk menentukan berfungsi tidaknya suatu soal berdasarkan kriteria yang telah ditetantukan, misalnya kriteria materi, konstruksi dan bahasa. Sedangkan validitas empiris adalah analisis kuantitatif yang berhubungan dengan indeks validitas. Validitas adalah kualitas yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku. Di dalam buku Encyclopedia of Education yang ditulis oleh Scarvia B. Anderson dan kawan-kawan, disebutkan : A test is valid if it measures what it purpose to measure. Artinya sebuah tes dikatakan valid apabila benar-benar dapat mengukur apa yang diukur.15 Purwanto menyatakan, validitas merupakan syarat terpenting dalam suatu alat evaluasi. Suatu teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur.16 Sebagaimana dikatakan oleh Cronbach: “How well a test or evaluative technique does the job that it is employed to do”.17 Validitas bukanlah suatu ciri atau sifat yang mutlak dari suatu teknik evaluasi, ia merupakan suatu ciri yang relatif terhadap tujuan yang hendak dicapai oleh pembuat tes. Dari pendapat di atas maka dapat dikatakan bahwa validitas adalah menunjukkan adanya kesesuaian, ketepatan, kebenaran alat tes dengan antara hasil tes. Atau dengan kata lain, bahwa sebuah tes dapat dikatakan valid apabila dapat mengukur atau mengungkap apa yang seharusnya diungkap atau diukur melalui tes tersebut.
14
Robert L Ebel, Essentials of Educational Measurement Third Edition, (New Jersey: Prentice-Hall Inc, Englewood Cliffs, 1979), h. 267. 15 Suharsimi Arikunto Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi), (Bumi Aksara, Jakarta, 1999), hal. 6465 16 Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (PT. Remaja Rosdakarya, Bandung, 2000), hal. 138. 17 Cronbach, L.J, Essentials of Psychologycal Testing, (New York: Harper & Row, Publisher. Icn., 1984), hal. 26
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
142
STAIN Palangka Raya
Jadi tes hasil belajar dapat dinyatakan valid apabila hasil belajar sebagai alat pengukur keberhasilan belajar peserta didik, dengan secara tepat, benar, shahih, telah dapat mengukur atau mengungkap hasil belajar yang telah dicapai oleh peserta didik,setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu. Surapranata berpendapat bahwa validitas soal juga merupakan indeks diskriminasi soal atau daya pembeda soal. Angka yang menunjukkan besarnya validitas soal disebut dengan indeks validitas soal yang besarnya berkisar antara -1 sampai dengan +1.18 Terdapat berbagai cara yang digunakan untuk menentukan validitas diantaranya adalah dengan menggunakan korelasi biserial sebagai berikut: rbis
M p Mt SDt
x
p q
Keterangan: rbis = Koefisien korelasi biserial Mp = rerata skor pada tes dari peserta tes yang memiliki jawaban benar Mt = rerata skor total St = standar deviasi skor total p = proporsi peserta tes yang jawabannya benar pada soal q=1–p Guna menetapkan butir soal yang valid dalam penelitian ini memberikan batasan indeks validitas sebesar > 0,30. Hal ini sebagaimana pendapat Nunaly dalam Surapranata bahwa korelasi di atas 0,30 dipandang sebagai butir tes yang baik.19
7. Reliabilitas Tes Evaluasi pendidikan melibatkan banyak kegiatan teknis dalam menentukan metode dan format penilaian yang dapat digunakan untuk mendapatkan informasi yang dibutuhkan. Informasi tersebut diperlukan dalam menafsir dan menetapkan keputusan untuk kepentingan pendidikan. Penilai membutuhkan keterampilan dalam mengidentifikasi dan memahami berbagai macam perspektif penilaian, baik penilaian kontekstual dan proses maupun penilaian hasil. Karena penilaian merupakan pusat kontrol keberhasilan program pendidikan, maka terdapat dua syarat utama yang harus dipenuhi oleh suatu instrumen penilaian, yaitu validitas dan reliabilitas. Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dan kesesuaian skor tes. Validitas merupakan karakteristik suatu tes ketika diujikan pada suatu kelompok peserta tes. Validasi suatu instrumen mencakup pengumpulan data empiris dan argumentasi logis untuk menunjukkan bahwa kesimpulan tertentu adalah tepat. Sedangkan reliabilitas yang berarti konsistensi adalah ciri umum dari suatu instrumen pengukuran dan penilaian pendidikan. Konsistensi tinggi skor instrumen dari suatu pengukuran ke pengukuran berikutnya merupakan ciri terpenting dari instrumen yang berkualitas tinggi.
18 19
Sumarna Surapranata, Analisis, Validitas, Reliabilitas Tes dan Interpretasi Hasil Belajar,... hal. 60. Ibid. Hal. 64
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
143
STAIN Palangka Raya
Reliabilitas telah didefinisikan dengan cara yang berbeda oleh pengarang yang berbeda. Cara yang terbaik untuk membahas reliabilitas adalah sejauhmana hasil pengukuran dari suatu instrumen mewakili karakteristik yang diukur. Sebagai contoh, reliabilitas didefinisikan seberapa besar konsistensi skor tes yang dicapai peserta tes pada pengujian ulang. Definisi ini akan memuaskan jika skor tes dapat menggambarkan kemampuan peserta tes; jika tidak maka skor tes tidak sistematis, tidak dapat diulangi atau tidak terikat. Reliabilitas juga diartikan sebagai indikator ketidakhadiran kesalahan acak. Jika kesalahan acak dapat diperkecil maka skor tes akan lebih konsisten dari suatu pengujian ke pengujian berikutnya. Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes yang disebabkan oleh keragaman sistematis dalam populasi peserta tes. Jika terdapat keragaman sistematis yang lebih besar dalam suatu populasi dibanding dengan populasi lainnya, seperti dalam semua siswa sekolah negeri dibandingkan hanya dengan kelas tertentu, tes akan mempunyai reliabilitas lebih besar untuk populasi yang lebih bervariasi. Reliabilitas adalah karakteristik bersama antara tes dan kelompok peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan kelompok lainnya. Arikunto mengartikan bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil.20 Para profesional pengukuran menganggap reliabilitas sebagai persyaratan utama suatu instrumen penilaian. Dalam teori tes diakui bahwa skor tes akan valid (benar) jika skor tes tersebut reliabel. Asumsi ini didasarkan pada suatu model matematika teori tes dimana skor perolehan terdiri atas skor tulen dan skor galat (obtained score = true score + error score). Semakin sedikit kesalahan dalam suatu tes (yaitu semakin reliabel) semakin valid skor tes. Karenanya, suatu penilaian yang tidak reliabel secara otomatis tidak valid. Penekanan utama dalam mengumpulkan data untuk menentukan reliabilitas tes adalah pada konsistensi dihubungkan dengan reliabilitas skor atau reliabilitas penilai. Reliabilitas skor berarti bahwa jika suatu tes telah diadministrasikan pada penempuh ujian untuk kedua kalinya, maka penempuh ujian akan tetap memperoleh skor yang sama dengan pengadministrasian yang pertama. Salah satu cara para spesialis pengukuran dalam menentukan reliabilitas skor tes adalah melalui tes standar. Jika penempuh ujian diuji kembali, mereka harus melengkapi tugas yang sama persis dalam kondisi yang juga persis sama. Hal ini akan membantu dalam pencapaian hasil tes yang konsisten. Tinggi rendahnya koefisien reliabilitas dipengaruhi oleh beberapa faktor. Crocker dan Algina dalam Surapranata menyebutkan bahwa faktor yang mempengaruhi koefisien reliabilitas antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. menurut Crocker dan Algina tingkat kesukaran memegang peranan paling dominan mempengaruhi reliablibitas tes. Hasil penelitian Aiken menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan paling besar pada koefisien reliabilitas. Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar pula reliabilitas tes tersebut. Sebaliknya semakin rendah tingkat kesukaran suatu soal semakin kecil pula 20
Suharsimi Arikunto Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi),... hal. 86
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
144
STAIN Palangka Raya
reliabilitasnya.21 Untuk dapat mengestimasi reliabilitas terdapat beberapa metode reliabilitas yaitu (1), test-retest atau stabilitas (2) pararel atau ekuivalen, (3) split-half atau belah dua, (4) interval consintency, dan (5) dengan KR-20. Dalam penelitian ini teknik yang digunakan untuk mencari reliabilitas tes adalah dengan persamaan KR-20 sebagai berikut: 𝑘 𝑆 2 − ∑ 𝑝𝑞 𝑟11 = ( )( ) 𝑘−1 𝑆2 Keterangan: r11 = reliabiltas tes p = proporsi peserta tes menjawab benar q = proporsi peserta tes menjawab salah (q = 1-p) ∑pq = jumlah perkalian antara p dan q k = banyaknya soal Sedangkan kriteria yang digunakan untuk memberikan interpretasi hasil penelitian ini digunakan batasan indeks reliabilitas sebesar 0,70. Artinya bahwa jika tes hasil belajar yang memiliki koofesien reliabilitas sebesar ≥ 0,70 merupakan tes yang baik. Hal ini sebagaimana pendapat Nunnaly dalam Surapranata bahwa koefisien reliabilitas 0,70 sampai 0,80 termasuk reliabilitas cukup tinggi.22 METODE PENELITIAN Penelitian ini akan dilaksanakan di Madrasah Ibtidaiyah Negeri (MIN) Langkai Kota Palangka Raya yang merupakan sebagai tempat diselenggarakannya ujian madrasah ibtidaiyah pada tahun ajaran 2010/2011. Penelitian ini menggunakan pendekatan kuantitatif, dengan format deskriptif, yang bertujuan untuk menjelaskan berbagai kondisi, berbagai situasi atau variabel yang timbul di masyarakat yang menjadi objek penelitian berdasarkan apa yang terjadi. 23 Berbagai kondisi yang dimaksud dalam penelitian ini adalah karakteristik butir soal yang digunakan sebagai naskah ujian madrasah ibtidaiyah tahun ajaran 2010/2011, yang mencakup tingkat kesukaran soal, daya pembeda soal, validitas soal dan reliabilitas tes. Data yang digunakan dalam penelitian ini adalah butir soal ujian madrasah ibtidaiyah tahun ajaran 2010/2011 yang terdiri dari mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika dan IPS serta lembar jawaban siswa. Teknik yang digunakan untuk pengumpulan data dalam penelitian ini adalah dengan teknik dokumentasi, yaitu: 1. Naskah soal ujian madrasah ibtidaiyah tahun ajaran 2010/2011 yang terdiri dari naskah soal mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika, dan IPS. 2. Lembar jawaban siswa yang terdiri dari lembar jawaban soal mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika, dan IPS. Adapun teknik analisis data yang digunakan dalam penelitian ini adalah:
21
Sumarna Surapranata,... hal. 92 Ibid hal. 114. 23 Burhan Bungin, Metodologi Penelitian Kuantitatif, (Jakarta: Kencana, 2006), hal. 36 22
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
145
STAIN Palangka Raya
1. Menggunakan rumus proporsi untuk menganalisis tingkat kesukaran butir soal. Rumus yang dimaksud adalah sebagai berikut: 𝐵 𝑝= 𝑁 p = tingkat kesukaran butir soal B = banyaknya peserta tes yang menjawab benar N = banyaknya peserta tes 2. Menggunakan rumus daya pembeda soal untuk menganalisis daya pembeda soal. persamaan yang digunakan adalah: D = PA - PB D = indeks daya beda butir soal PA = proporsi kelompok atas yang menjawab benar PB = Proporsi kelompok bawah yang menjawab benar 3. Menggunakan rumus korelasi biserial untuk menganalisis validitas butir soal, sebagai berikut:
rbis
M p Mt SDt
x
p q
Keterangan: rbis = Koefisien korelasi biserial Mp = rerata skor pada tes dari peserta tes yang memiliki jawaban benar Mt = rerata skor total St = standar deviasi skor total p = proporsi peserta tes yang jawabannya benar pada soal q = 1–p 4. Dengan rumus KR-20 untuk menganalisis reliabilitas tes sebagai berikut: 𝑘 𝑆 2 − ∑ 𝑝𝑞 𝑟11 = ( )( ) 𝑘−1 𝑆2 Keterangan: r11 = reliabiltas tes p = proporsi peserta tes menjawab benar q = proporsi peserta tes menjawab salah (q = 1-p) ∑pq = jumlah perkalian antara p dan q k = banyaknya soal Guna melakukan perhitungan dan pengolahan data, maka penulis menggunakan alat bantu komputer program Microsoft Excel, dengan tetap mengacu pada rumus-rumus yang telah ditetapkan.
HASIL PENELITIAN Hasil penelitian tentang kualitas butir soal ujan akhir Madrasah Ibtidaiyah tahun pelajaran 2010/2011 di Palangka Raya ini difokuskan pada mata pelajaran yang penyusunan
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
146
STAIN Palangka Raya
soalnya dilakukan oleh Kelompok Kerja Madrasah (KKM) yang terdiri dari mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan Sejarah Kebudayaan Islam. Kualitas butir soal dalam penelitian ini adalah kualitas butir soal ditinjau dari segi tingkat kesukaran, daya pembeda, validitas dan reliabilitas. Adapun hasil penelitian tersebut disajikan sebagai berikut: A. Tingkat Kesukaran Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam 1. Tingkat Kesukaran Butir Soal Ujian Qur’an Hadits Soal ujian akhir madrasah ibtidaiyah tahun pelajaran 2010/2011di Palangka Raya mata pelajaran Qur’an Hadits yang diujikan sebanyak 50 soal dalam bentuk pilihan ganda dengan alternatif pilihan jawaban sebanyak 4 (empat) pilihan (A, B, C, D). Hasil analisis tingkat kesukaran butir soal Qur’an Hadits diperoleh bahwa dari 50 soal Qur’an Hadits yang diujikan terdapat 3 soal (6%) kategori sangat mudah, 39 soal (78%) kategori mudah, 6 soal (12%) kategori sedang, dan 2 soal (4%) kategori sukar. Sedangkan tingkat kesukaran soal kategori sangat sukar tidak ditemukan. Berdasarkan data tersebut bahwa soal ujian Qur’an Hadits yang dapat digunakan adalah soal yang memiliki tingkat kesukaran dalam kategori sedang sebanyak 6 soal. Hal ini sebagaimana pendapat Suryanto bahwa butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai tingkat kesukaran dalam kategori sedang.24 Soal-soal yang dimaksud adalah sebagaimana dalam tabel berikut: Tabel 3 Soal Ujian Qur’an Hadits Yang Memiliki Tingkat Kesukaran Kriteria Sedang B
P
Kategori
1
Nomor Soal 6
237
0.595
Sedang
2
18
227
0.570
Sedang
3
35
235
0.590
Sedang
4
36
228
0.573
Sedang
5
45
234
0.588
Sedang
6
49
218
0.548
Sedang
Nomor
2. Tingkat Kesukaran Butir Soal Ujian Akidah Akhlak Jumlah soal ujian mata pelajaran Akidah Akhlak sebanyak 50 soal dan disajikan dalam bentuk soal pilihan ganda terdiri 4 (empat) pilihan jawaban (A,B,C,D). Hasil analisis tingkat kesukaran butir soal ujian mata pelajaran Akidah Akhlak diperoleh bahwa butir soal yang memiliki kategori Sangat mudah sebanyak 32 soal (64%) dan 24
Adi Suryanto dkk, Evaluasi Pembelajaran di SD, (Jakarta: Universitas Terbuka, 2009), h. 5.23
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
147
STAIN Palangka Raya
soal yang memiliki kategori mudah sebanyak 18 soal (36%). Sedangkan soal dalam kategori sukar, sangat sukar, dan sedang tidak ditemukan. Berdasarkan analisis data di atas bahwa soal ujian Akidah Akhlak tidak terpenuhinya butir soal yang kategori sedang sehingga dapat dikatakan bahwa soal ujian Akidah Akhlak tidak terdapat kriteria tingkat kesukaran soal yang baik. 3. Tingkat Kesukaran Butir Soal Ujian Fiqih Soal ujian mata pelajaran Fiqih juga dalam bentuk pilihan ganda dengan jumlah soal 50 butir soal. Hasil analisis diperoleh bahwa jumlah soal yang memiliki kategori sangat mudah sebanyak 2 soal (4%), soal yang memiliki kategori mudah sebanyak 42 soal (84%), dan soal yang kategori sedang sebanyak 6 soal (12%). Sedangkan soal dalam kategori sukar dan sangat sukar tidak ditemukan. Berdasarkan kriteria yang ditetapkan dalam penelitian ini bahwa butir soal yang dapat digunakan untuk alat tes adalah butir soal yang memiliki tingkat kesukaran sedang. Dengan demikian untuk soal ujian Fiqih hanya 6 butir soal yang memenuhi kriteria baik, yaitu sebagaimana tertera dalam tabel berikut: Tabel 4 Daftar Soal Ujian Fiqih Yang Termasuk Kriteria Sedang B
P
Kategori
1
Nomor Soal 6
234
0.588
Sedang
2
18
228
0.573
Sedang
3
19
192
0.482
Sedang
4
23
169
0.425
Sedang
5
37
237
0.595
Sedang
6
49
217
0.545
Sedang
Nomor
4. Tingkat Kesukaran Butir Soal Bahasa Arab Jumlah soal ujian Bahasa Arab sebanyak 50 soal disajikan dalam bentuk piligan ganda. Hasil analisis tingkat kesukaran butir menunjukkan bahwa soal yang memiliki kategori mudah sebanyak 32 soal (64%) dan yang memiliki kategori sedang sebanyak 17 soal (34%) serta kategori kesukaran sukar sebanyak 1 soal (2%). Sedangkan butir soal yang kategori sangat mudah dan sangat sukar tidak ditemukan. Berdasarkan data analisis tersebut maka butir soal ujian Bahasa Arab yang memenuhi kriteria tingkat kesukaran soal yang dapat digunakan adalah sebanyak 17 soal sebagaimana disajikan dalam tabel berikut: Tabel 5 Daftar Soal Ujian Bahasa Arab Yang Termasuk Kriteria Sedang Nomor 1
Nomor Soal 5
Jurnal Studi Agama dan Masyarakat
B
P
Kategori
232
0.583
Sedang Volume 7, Nomor 2, Desember 2013
148
STAIN Palangka Raya
2
6
233
0.585
Sedang
3
16
232
0.583
Sedang
4
18
228
0.573
Sedang
5
19
188
0.472
Sedang
6
26
227
0.570
Sedang
7
28
237
0.595
Sedang
8
30
230
0.578
Sedang
9
31
188
0.472
Sedang
10
32
222
0.558
Sedang
11
35
221
0.555
Sedang
12
36
223
0.560
Sedang
13
37
215
0.540
Sedang
14
41
231
0.580
Sedang
15
45
235
0.590
Sedang
16
49
214
0.538
Sedang
17
50
229
0.575
Sedang
5. Tingkat Kesukaran Butir Soal Sejarah Kebudayaan Islam Berdasarkan hasil analisis tingkat kesukaran butir soal, bahwa dari 50 butir soal ujian Sejarah Kebudayaan Islam diperoleh 2 butir soal (4%) kategori sangat mudah dan 44 butir soal (88%) termasuk kategori mudah, serta 4 soal (8%) termasuk kategori sedang. Butir soal dalam kategori sukar dan sangat sukar tidak ditemukan. Dengan demikian maka soal ujian Sejarah Kebudayaan Islam yang termasuk butir soal dilihat dari tingkat kesukaran hanya 4 soal yang memenuhi kriteria tingkat kesukaran soal yang baik yaitu nomor soal yang tertera dalam tabel berikut: Tabel 6 Daftar Soal Ujian SKI Yang Termasuk Kriteria Sedang B
P
Kategori
1
Nomor Soal 18
228
0.573
Sedang
2
19
195
0.490
Sedang
3
23
180
0.452
Sedang
4
49
225
0.565
Sedang
Nomor
B. Daya Pembeda Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
149
STAIN Palangka Raya
Guna menganalisis daya pembeda butir soal dalam penelitian ini dilakukan dengan cara menyusun tingkatan skor dari skor tertinggi sampai terendah berdasarkan hasil skor yang diperoleh peserta ujian, dan membagi 27% kelompok atas dan kelompok 27% kelompok bawah dari jumlah peserta ujian sebanyak 398 orang. Dengan pembagian tersebut diperoleh 107 peserta tes kelompok atas, dan 107 peserta tes kelompok bawah. Hasil analisis daya pembeda butir soal masing-masing mata pelajaran dijasikan sebagai berikut: 1. Daya Pembeda Butir Soal Ujian Qur’an Hadits Berdasarkan hasil analisis daya pembeda butir soal ujian Qur’an Hadits diperoleh bahwa butir soal ujian Qur’an Hadits yang memiliki daya pembeda soal yang sangat baik hanya 1 soal (2%), dan yang memiliki daya pembeda soal yang baik sebanyak 10 soal (20%), dan yang memiliki daya pembeda soal cukup sebanyak 18 soal (36%), serta 21 soal (42%) memiliki daya pembeda soal yang tidak baik. Dari sebaran data tentang daya pembeda tersebut maka soal yang memiliki kriteria daya pembeda sebesar minimum 0.30 merupakan soal yang memiliki daya pembeda yang baik.25 Berdasarkan kriteria tersebut maka untuk soal ujian Qur’an Hadits yang digunakan di Madrasah Ibdidaiyah tahun pelajaran 2010/2011 di Kota Palangka Raya terdapat 11 butir soal yang memiliki daya pembeda yang baik. Untuk lebih jelasnya dapat dilihat pada tabel berikut: Tabel 7 Daftar Soal Ujian Qur’an Hadits Yang Memiliki Daya Pembeda Butir Soal Yang Baik
1
Nomor Soal 12
2
13
92
60
0.86
0.56
0.30
Baik
3
14
94
59
0.88
0.55
0.33
Baik
4
16
93
48
0.87
0.45
0.42
Sangat Baik
5
19
60
23
0.56
0.21
0.35
Baik
6
24
98
60
0.92
0.56
0.36
Baik
7
29
98
57
0.92
0.53
0.38
Baik
8
31
83
50
0.78
0.47
0.31
Baik
9
35
80
44
0.75
0.41
0.34
Baik
10
41
91
56
0.85
0.52
0.33
Baik
11
45
82
45
0.77
0.42
0.35
Baik
No.
25
BA
BB
BA/NA
BB/NB
D
Keterangan
88
56
0.82
0.52
0.30
Baik
Purwanto, Evaluasi Hasil Belajar,... h. 108.
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
150
STAIN Palangka Raya
Butir soal yang terdapat pada tabel 7 di atas merupakan butir soal yang memiliki daya pembeda soal yang baik, karena telah menunjukkan indeks daya pembeda sebesar ≥0,30. Daya pembeda soal yang baik juga dapat dilihat dan dibandingkan pada jumlah peserta yang menjawab benar antara kelompok atas (BA) dan kelompok bawah (BB). Misalnya soal nomor 12 kelompok atas yang benar menjawab sebanyak 88 orang dan kelompok bawah sebanyak 56 orang.
2. Daya Pembeda Butir Soal Ujian Akidah Akhlak Hasil analisis daya pembeda butir soal ujian Akidah Akhlak diperoleh bahwa soal yang memiliki daya pembeda sangat baik sebanyak 3 soal (6%), dan soal yang daya bedanya baik tidak ditemukan, soal yang memiliki daya pembeda cukup sebanyak 7 soal (14%), serta soal yang daya pembedanya tidak baik sebanyak 40 soal (80%). Berdasarkan sebaran data tentang daya pembeda butir soal ujian Akidah Akhlak yang digunakan sebagai ujian akhir madrasah ibtidaiyah di Kota Palangka Raya, hanya terdapat 3 butir soal yang memiliki kualifikasi daya pembeda butir soal yang baik. Ketiga soal tersebut adalah sebagai berikut:
Tabel 8 Daftar Soal Ujian Akidah Akhlak Yang Memiliki Daya Pembeda Butir Soal Yang Baik
1
Nomor Soal 23
2
34
No.
BA
BB
BA/NA
BB/NB
D
Keterangan
98
55
0.92
0.51
0.40
Sangat Baik
101
58
0.94
0.54
0.40
Sangat Baik
3
36 99 55 0.93 0.51 0.41 Sangat Baik Dari tabel 8 di atas maka ketiga butir soal tersebut telah memenuhi kriteria minimal indeks daya pembeda butir soal yaitu sebesar 0,30. Hal ini dapat dibuktikan bahwa misalnya soal nomor 23 peserta kelompok atas lebih banyak menjawab benar dibandingkan dengan peserta kelompok bawah, begitu pula soal nomor 34 dan 36, peserta yang menjawab benar lebih banyak kelompok atas daripada peserta kelompok bawah sehingga menghasilkan indeks daya beda minimal 0.30. 3. Daya Pembeda Butir Soal Fiqih Dari 50 soal ujian mata pelajaran Fiqih terdapat 2 soal (4%) yang memiliki daya pembeda cukup, daya pembeda soal kategori sangat baik dan baik tidak ditemukan, sedangkan soal yang daya pembedanya tidak baik sebanyak 48 soal (96%). Berdasarkan analisis tentang daya pembeda butir soal ujian mata pelajaran Fiqih dari 50 soal yang diujikan ternyata tidak terdapat butir soal yang memenuhi kriteria minimal daya pembeda butir soal yang baik. Dengan demikian dapat dikatakan semua butir soal ujian mata pelajaran Fiqih yang digunakan di Madrasah Ibtidaiyah Kota Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
151
STAIN Palangka Raya
Palangka Raya tahun pelajaran 2010/2011 tidak memiliki daya pembeda soal yang baik. Artinya soal yang diujikan tidak dapat digunakan untuk membedakan kelompok peserta ujian yang memiliki kemampuan di atas dan kelompok peserta ujian yang memiliki kemampuan bawah. 4. Daya Pembeda Butir Soal Bahasa Arab Berdasarkan hasil analisis daya pembeda butir soal ditemukan hanya 1 soal (2%) yang memiliki daya pembeda soal sangat baik, dan sisanya sebanyak 49 soal (98%) memiliki daya pembeda yang tidak baik. Butir soal ujian Bahasa Arab berdasarkan sebaran hasil analisis tentang daya pembeda butir soal ternyata hanya ada 1 butir soal yang mmenuhi kriteria daya pembeda soal yang baik, yaitu soal nomor 1 dengan indeks daya beda sebesar = 0,44 kategori sangat baik. Sedangkan butir-butir soal yang lain tidak memiliki daya pembeda soal yang baik. Dengan demikian maka soal ujian Bahasa Arab yang digunakan untuk ujian akhir Madrasah Ibtidaiyah di Kota Palangka Raya tahun pelajaran 2010/2011 belum memiliki daya pembeda soal yang baik. Artinya soal ujian tersebut belum dapat digunakan untuk membedakan peserta tes yang memiliki kemampuan tinggi dan peserta tes yang memiliki kemampuan rendah. 5. Daya Pembeda Butir Soal Sejarah Kebudayaan Islam Hasil analisis mengenai daya pembeda butir soal ujian Sejarah Kebudayaan Islam ditemukan bahwa hanya ada 1 soal (2%) yang memiliki daya pembeda butir soal yang baik, kemudian 4 soal (8%) memiliki daya pembeda butir soal yang cukup, tidak ada soal yang memiliki kategori sangat baik daya pembedanya, serta ditemukan 45 soal (90%) memiliki daya pembeda butir soal tidak baik. Berdasarkan analisis tersebut, maka soal ujian Sejarah Kebudayaan Islam yang memenuhi syarat atau memiliki daya pembeda soal yang baik hanya ada satu soal yaitu soal ujian nomor 21 dengan indeks daya beda sebesar = 0,31. Dengan demikian soal ujian Fiqih di Madrasah Ibtidaiyah pada tahun pelajaran 2010/2011 belum memiliki daya pembeda butir soal yang baik. C. Validitas Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam Guna menguji validitas butir soal ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam di Madrasah Ibtidaiyah peneliti menggunakan perhitungan statistik korelasi. Sehingga pengujian signifikansi korelasi dilakukan dengan membandingkan antara korelasi hitung (rXY) dengan r pada tabel. Hasil pengujian validitas masing-masing soal ujian disajikan sebagai berikut: 1. Validitas Butir Soal Ujian Qur’an Hadits Berdasarkan pengujian validitas butir soal ujian Qur’an Hadits diperoleh bahwa soal yang valid sebanyak 47 soal (94%) dan soal yang tidak valid sebanyak 3 soal (6%). Soal-soal yang valid tersebut adalah sebagai berikut: Tabel 9 Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
152
STAIN Palangka Raya
Nomor 1
Daftar Soal Ujian Qur’an Hadits Yang Valid Nomor Indeks r Tabel Keterangan Soal Korelasi 2 0.223 0.098 Valid
2
4
0.231
0.098
Valid
3
5
0.121
0.098
Valid
4
6
0.108
0.098
Valid
5
7
0.250
0.098
Valid
6
8
0.259
0.098
Valid
7
9
0.273
0.098
Valid
8
10
0.260
0.098
Valid
9
11
0.288
0.098
Valid
10
12
0.265
0.098
Valid
11
13
0.254
0.098
Valid
12
14
0.256
0.098
Valid
13
15
0.147
0.098
Valid
14
16
0.337
0.098
Valid
15
17
0.212
0.098
Valid
16
18
0.219
0.098
Valid
17
19
0.244
0.098
Valid
18
20
0.196
0.098
Valid
19
21
0.265
0.098
Valid
20
22
0.152
0.098
Valid
21
23
0.175
0.098
Valid
22
24
0.319
0.098
Valid
23
25
0.259
0.098
Valid
24
26
0.175
0.098
Valid
25
27
0.152
0.098
Valid
26
28
0.172
0.098
Valid
27
29
0.323
0.098
Valid
28
30
0.243
0.098
Valid
29
31
0.271
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
153
STAIN Palangka Raya
30
32
0.162
0.098
Valid
31
33
0.116
0.098
Valid
32
34
0.208
0.098
Valid
33
35
0.261
0.098
Valid
34
36
0.216
0.098
Valid
35
37
0.112
0.098
Valid
36
38
0.105
0.098
Valid
37
39
0.140
0.098
Valid
38
40
0.242
0.098
Valid
39
41
0.308
0.098
Valid
40
42
0.140
0.098
Valid
41
43
0.171
0.098
Valid
42
44
0.222
0.098
Valid
43
45
0.246
0.098
Valid
44
46
0.166
0.098
Valid
45
47
0.184
0.098
Valid
46
48
0.203
0.098
Valid
47
49
0.110
0.098
Valid
Butir-butir soal tersebut dikatakan valid karena besarnya indeks korelasi lebih besar dari nilai r korelasi pada tabel. 2. Validitas Butir Soal Ujian Akidah Akhlak Melalui pengujian statistik korelasi product moment bahwa butir-butir soal ujian Akidah Akhlak yang valid sebanyak 29 soal (58%), dan soal yang tidak valid sebanyak 21 soal (42%). Butir soal Akidah Akhlak yang valid tersebut adalah sebagai berikut: Tabel 10 Daftar Soal Ujian Akidah Akhlak Yang Valid
Nomor
Nomor Soal
Indeks Korelasi
Jurnal Studi Agama dan Masyarakat
r Tabel
Keterangan
Volume 7, Nomor 2, Desember 2013
154
STAIN Palangka Raya
1
2
0.190
0.098
Valid
2
6
0.101
0.098
Valid
3
9
0.188
0.098
Valid
4
12
0.154
0.098
Valid
5
13
0.154
0.098
Valid
6
16
0.116
0.098
Valid
7
17
0.202
0.098
Valid
8
18
0.149
0.098
Valid
9
19
0.215
0.098
Valid
10
21
0.214
0.098
Valid
11
22
0.153
0.098
Valid
12
23
0.243
0.098
Valid
13
25
0.118
0.098
Valid
14
26
0.198
0.098
Valid
15
27
0.187
0.098
Valid
16
29
0.226
0.098
Valid
17
31
0.246
0.098
Valid
18
32
0.201
0.098
Valid
19
33
0.099
0.098
Valid
20
34
0.328
0.098
Valid
21
35
0.198
0.098
Valid
22
36
0.353
0.098
Valid
23
37
0.165
0.098
Valid
24
38
0.135
0.098
Valid
25
39
0.147
0.098
Valid
26
40
0.107
0.098
Valid
27
41
0.121
0.098
Valid
28
44
0.100
0.098
Valid
29
46
0.238
0.098
Valid
3. Validitas Butir Soal Fiqih
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
155
STAIN Palangka Raya
Berdasarkan pengujian bahwa butir soal ujian mata pelajaran Fiqih yang valid sebanyak 46 soal (92%) dan yang tidak valid sebanyak 4 soal (8%). Berikut disajikan soal-soal Fiqih yang valid dalam tabel di bawah ini. Tabel 11 Daftar Soal Ujian Fiqih Yang Valid Indeks r Tabel Keterangan Korelasi
Nomor
Nomor Soal
1
1
0.149
0.098
Valid
2
2
0.178
0.098
Valid
3
3
0.117
0.098
Valid
4
4
0.241
0.098
Valid
5
7
0.154
0.098
Valid
6
8
0.237
0.098
Valid
7
9
0.214
0.098
Valid
8
10
0.262
0.098
Valid
9
11
0.279
0.098
Valid
10
12
0.172
0.098
Valid
11
13
0.283
0.098
Valid
12
14
0.284
0.098
Valid
13
15
0.144
0.098
Valid
14
16
0.262
0.098
Valid
15
17
0.182
0.098
Valid
16
18
0.200
0.098
Valid
17
19
0.222
0.098
Valid
18
20
0.147
0.098
Valid
19
21
0.214
0.098
Valid
20
23
0.136
0.098
Valid
21
24
0.230
0.098
Valid
22
25
0.209
0.098
Valid
23
26
0.226
0.098
Valid
24
27
0.168
0.098
Valid
25
28
0.155
0.098
Valid
26
29
0.251
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
156
STAIN Palangka Raya
27
30
0.214
0.098
Valid
28
31
0.252
0.098
Valid
29
32
0.151
0.098
Valid
30
33
0.129
0.098
Valid
31
34
0.125
0.098
Valid
32
35
0.206
0.098
Valid
33
36
0.226
0.098
Valid
34
37
0.165
0.098
Valid
35
39
0.103
0.098
Valid
36
40
0.207
0.098
Valid
37
41
0.294
0.098
Valid
38
42
0.173
0.098
Valid
39
43
0.102
0.098
Valid
40
44
0.197
0.098
Valid
41
45
0.190
0.098
Valid
42
46
0.152
0.098
Valid
43
47
0.174
0.098
Valid
44
48
0.180
0.098
Valid
45
49
0.114
0.098
Valid
46
50
0.129
0.098
Valid
4. Validitas Butir Soal Bahasa Arab Butir soal ujian mata pelajaran Bahasa Arab yang valid adalah sebanyak 47 soal (94%) dan butir soal yang tidak valid sebanyak 3 soal (6%). Butir soal ujian Bahasa Arab yang valid dapat dilihat pada tabel berikut:
Tabel 12 Daftar Soal Ujian Bahasa Arab Yang Valid Nomor
Nomor Soal
Indeks Korelasi
r Tabel
Keterangan
1
1
0.188
0.098
Valid
2
4
0.287
0.098
Valid
3
5
0.131
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
157
STAIN Palangka Raya
4
6
0.106
0.098
Valid
5
7
0.199
0.098
Valid
6
8
0.185
0.098
Valid
7
9
0.168
0.098
Valid
8
10
0.226
0.098
Valid
9
11
0.235
0.098
Valid
10
12
0.129
0.098
Valid
11
4
0.287
0.098
Valid
12
5
0.131
0.098
Valid
13
13
0.205
0.098
Valid
14
14
0.181
0.098
Valid
15
15
0.177
0.098
Valid
16
16
0.263
0.098
Valid
17
17
0.166
0.098
Valid
18
18
0.232
0.098
Valid
19
19
0.199
0.098
Valid
20
20
0.230
0.098
Valid
21
21
0.179
0.098
Valid
22
23
0.129
0.098
Valid
23
24
0.236
0.098
Valid
24
25
0.188
0.098
Valid
25
26
0.224
0.098
Valid
26
27
0.226
0.098
Valid
27
28
0.166
0.098
Valid
28
29
0.259
0.098
Valid
29
30
0.286
0.098
Valid
30
31
0.241
0.098
Valid
31
32
0.288
0.098
Valid
32
33
0.168
0.098
Valid
33
34
0.260
0.098
Valid
34
35
0.159
0.098
Valid
35
36
0.150
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
158
STAIN Palangka Raya
36
37
0.173
0.098
Valid
37
38
0.159
0.098
Valid
38
39
0.250
0.098
Valid
39
40
0.240
0.098
Valid
40
41
0.268
0.098
Valid
41
42
0.178
0.098
Valid
42
43
0.169
0.098
Valid
43
44
0.189
0.098
Valid
44
45
0.215
0.098
Valid
45
46
0.127
0.098
Valid
46
47
0.123
0.098
Valid
47
48
0.208
0.098
Valid
5. Validitas Butir Soal Sejarah Kebudayaan Islam Butir soal Sejarah Kebudayaan Islam setelah diuji dengan korelasi product moment diperoleh bahwa butir soal yang valid adalah sebanyak 45 soal (90%) dan butir soal yang tidak valid sebanyak 5 soal (10%). Butir-butir soal Sejarah Kebudayaan Islam yang valid adalah sebagai berikut:
Tabel 12 Daftar Soal Ujian SKI Yang Valid Indeks r Tabel Keterangan Korelasi
Nomor
Nomor Soal
1
1
0.137
0.098
Valid
2
2
0.206
0.098
Valid
3
3
0.163
0.098
Valid
4
4
0.203
0.098
Valid
5
7
0.195
0.098
Valid
6
8
0.271
0.098
Valid
7
9
0.250
0.098
Valid
8
10
0.306
0.098
Valid
9
11
0.328
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
159
STAIN Palangka Raya
10
12
0.173
0.098
Valid
11
13
0.303
0.098
Valid
12
14
0.331
0.098
Valid
13
15
0.182
0.098
Valid
14
16
0.263
0.098
Valid
15
17
0.199
0.098
Valid
16
18
0.198
0.098
Valid
17
19
0.204
0.098
Valid
18
20
0.203
0.098
Valid
19
21
0.277
0.098
Valid
20
22
0.101
0.098
Valid
21
23
0.128
0.098
Valid
22
24
0.228
0.098
Valid
23
25
0.311
0.098
Valid
24
26
0.266
0.098
Valid
25
27
0.145
0.098
Valid
26
28
0.181
0.098
Valid
27
29
0.261
0.098
Valid
28
30
0.164
0.098
Valid
29
31
0.219
0.098
Valid
30
33
0.098
0.098
Valid
31
35
0.169
0.098
Valid
32
36
0.232
0.098
Valid
33
37
0.110
0.098
Valid
34
38
0.110
0.098
Valid
35
39
0.145
0.098
Valid
36
40
0.201
0.098
Valid
37
41
0.278
0.098
Valid
38
42
0.161
0.098
Valid
39
43
0.137
0.098
Valid
40
44
0.215
0.098
Valid
41
45
0.150
0.098
Valid
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
160
STAIN Palangka Raya
42
46
0.134
0.098
Valid
43
47
0.153
0.098
Valid
44
48
0.207
0.098
Valid
45
50
0.122
0.098
Valid
D. Reliabilitas Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam Guna menguji reliabilitas soal ujian mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam dalam penelitian ini menggunakan rumus KR-21. Rumus KR-21 ini digunakan karena sesuai dengan bentuk soal yang digunakan dalam ujian akhir madrasah ibtidaiyah yaitu pilihan ganda. Hasil pengujian reliabilitas untuk masing-masing soal dapat dilihat sebagai berikut: 1. Relibilitas Soal Ujian Qur’an Hadits Berdasarkan perhitungan data dengan menggunakan program Microsoft Excel diperoleh rata-rata skor total = 33,930, varians total = 21,567 dan Jumlah Butir = 50. Selanjutnya dimasukkan ke rumus KR-21 sebagai berikut: 50 33,930(50 − 33,930) ] [1 − ] 50 − 1 50𝑥21,567 = (1.020)(0,494) = 0,504
𝑟11 = [ 𝑟11 𝑟11
Berdasarkan hasil perhitungan tersebut maka diperoleh r11 = 0,504 dibandingkan dengan r tabel = 0,098. Karena r hitung > r tabel maka soal ujian Qur’an Hadits di Madrasah Ibtidaiyah Kota Palangka Raya sudah reliabel. 2. Reliabilitas Soal Ujian Akidah Akhlak Berdasarkan perhitungan bahwa untuk soal ujian Akidah Akhlak diperoleh ratarata skor total = 41,327 dan varians total = 4,140, selanjutnya dimasukkan ke dalam rumus KR-21 untuk menentukan reliabilitas soal ujian Akidah Akhlak sebagai berikut: 50 41,327(50 − 41,327) 𝑟11= [ ] [1 − ] 50 − 1 50𝑥4,140 𝑟11 = (1,020)(−0,731) 𝑟11 = −0,746 Berdasarkan hasil perhitungan tersebut maka soal ujian Akidah Akhlak tidak reliabel. Karena nilai KR-21 sebesar -0,746 lebih kecil dari nilai r tabel = 0,098. 3. Reliabilitas Soal Ujian Fiqih
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
161
STAIN Palangka Raya
Berdasarkan perhitungan data bahwa soal ujian fiqih diperoleh rata-rata sebesar = 33,859 dan varians = 17,592 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut: 50 33,859(50 − 33,859) 𝑟11 = [ ] [1 − ] 50 − 1 50𝑥 17,592 𝑟11 = (1,020)(0,379) 𝑟11 = 0,386 Hasil perhitungan r11 = 0,386 tersebut selanjutnya dibandingkan dengan kriteria reliabilitas yang telah ditetapkan yaitu 0,098, dengan demikian soal ujian fiqih sudah reliabel, karena r11 > r tabel. 4. Reliabilitas Soal Ujian Bahasa Arab Berdasarkan perhitungan rata-rata skor total soal ujian Bahasa Arab diperoleh sebesar 30,799 dan varian total sebesar 20,761 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut: 50 30,799(50 − 30,799) 𝑟11 = [ ] [1 − ] 50 − 1 50𝑥 20,761 𝑟11 = (1,020)(0,430) 𝑟11 = 0,439 Hasil perhitungan tersebut selanjutnya dibandingkan dengan r tabel sebesar 0,098, maka soal ujian Bahasa Arab di MI Palangka Raya sudah reliabel. 5. Reliabilitas Soal Ujian Sejarah Kebudayaan Islam Berdasarkan perhitungan rata-rata skor total soal ujian Bahasa Arab diperoleh sebesar 30,799 dan varian total sebesar 20,761 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut: 50 33,61(50 − 33,61) 𝑟11 = [ ] [1 − ] 50 − 1 50𝑥 19,082 𝑟11 = (1,020)(0,423) 𝑟11 = 0,431 Hasil perhitungan tersebut selanjutnya dibandingkan dengan r tabel sebesar 0,098, maka soal ujian Sejarah Kebudayaan Islam di MI Palangka Raya sudah reliabel.
KESIMPULAN Berdasarkan hasil penelitian di atas, maka dapat disimpulkan bahwa: 1. Tingkat kesukaran soal ujian Qur’an Hadits yang memenuhi kriteria tingkat kesukaran butir soal yang baik adalah sebanyak 6 butir soal, yaitu soal nomor: 6, 18, 35, 36, 45 dan 49. Soal ujian Akidah Akhlak tidak memenuhi kriteria tingkat kesukaran butir soal yang baik. Soal ujian Fiqih terdapat 6 butir soal yang termasuk kriteria tingkat kesukaran butir soal yang baik yaitu nomor: 6, 18, 19, 23, 37, dan 49. Soal ujian Bahasa Arab terdapat 17 butir soal yang memenuhi kriteria tingkat kesukaran butir soal yang baik, yaitu nomor: Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
162
STAIN Palangka Raya
5, 6, 16, 18, 19, 26, 28, 30, 31, 32, 35, 36, 37, 41, 45, 49, dan 50. Sedangkan soal ujian Sejarah Kebudayaan Islam yang memenuhi kriteria tingkat kesukaran butir soal yang baik adalah sebanyak 4 butir soal yaitu nomor: 18, 19, 23 dan 49. 2. Daya Pembeda soal ujian Qur’an Hadits yang memenuhi kriteria adalah sebanyak 11 butir soal yaitu soal nomor: 12, 13, 14, 16, 19, 24, 29, 31, 35, 41, dan 45. Daya pembeda soal ujian Akidah Akhlak yang memenuhi kriteria daya pembeda soal yang baik sebanyak 3 soal yaitu nomor: 23, 34, dan 36. Soal ujian Fiqih yang digunakan ujian akhir Madrasah Ibtidaiyah di Kota Palangka Raya tidak memiliki daya pembeda yang baik. Daya pembeda soal ujian Bahasa Arab hanya terdapat 1 butir soal yang memiliki daya pembeda baik yaitu soal nomor 1. Demikian pula dengan daya pembeda soal ujian SKI hanya terdapat 1 soal yang memiliki kriteria daya pembeda soal yang baik yaitu soal nomor 21. 3. Validitas butir soal ujian Qur’an Hadits dari 50 soal yang diujikan terdapat 47 butir soal yang valid dan 3 butir soal yang tidak valid. Soal ujian Akidah Akhlak dari 50 soal terdapat 29 butir soal yang valid dan 21 soal tidak valid. Validitas butir soal ujian Fiqih dari 50 soal yang diujikan terdapat 46 butir soal yang valid dan 4 soal tidak valid. Untuk soal ujian Bahasa Arab terdapat 47 butir soal yang valid dan 3 butir soal yang tidak valid. Sedangkan soal Sejarah Kebudayaan Islam ditemukan 45 butir soal yang valid dan 5 soal tidak valid. 4. Reliabilitas tes ujian akhir Madrasah Ibtidaiyah tahun pelajaran 2010/2011 di Kota Palangka Raya, untuk soal ujian Qur’an hadits diperoleh indeks korelasi sebesar 0,504 kategori reliabel. Soal ujian Akidah Akhlak diperoleh indeks korelasi sebesar -0,746 < dari rtabel=0,098 maka tidak reliabel. Soal ujian Fiqih diperoleh indeks korelasi sebesar 0,386 > rtabel = 0,098 kategori reliabel. Soal ujian Bahasa Arab diperoleh indeks korelasi sebesar 0,439 > 0,098 kategori reliabel. Soal ujian Sejarah Kebudayaan Islam diperoleh indeks korelasi sebesar 0,431 > 0,098 kategori reliabel
DAFTAR PUSTAKA Adi Suryanto, dkk, 2009, Evaluasi Pembelajaran di SD, Jakarta: Universitas Terbuka. Allen, M.J. and Yen, W. 1979, Introduction to Measurement Theory. Monterey: Brooks/Cole Publishing Company. Asmawi Zainul dan Noehi Nasution, 2001, Penilaian Hasil Belajar, Direktorat Jenderal Pendidikan Tinggi Departemen Pendidikan Nasional, Jakarta: PAU-PPAI-UT, Burhan Bungin, 2006, Metodologi Penelitian Kuantitatif Komunikasi, ekonomi, dan Kebijakan Publik Serta Ilmu-Ilmu Sosial Lainnya, Jakarta:Kencana Prenada Media Group. Cronbach, L.J, 1984, Essentials of Psychologycal Testing, New York: Harper & Row, Publisher. Icn. Djemari Mardapi, 2004, Tes Hasil Belajar, Universitas Negeri Yogyakarta. Robert L Ebel, Essentials of Educational Measurement Third Edition, New Jersey: PrenticeHall Inc, Englewood Cliffs, 1979 Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013
163
STAIN Palangka Raya
Gito Supriadi, 2007, Analisis Butir Soal Ujian Semester Mata Pelajaran SKI di MAN Yogyakarta. Ngalim Purwanto, 2000, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, PT. Remaja Rosdakarya, Bandung. Saifudin Azwar, 2005, Tes prestasi : Fungsi dan Pengembangan Pengukuran Prestasi Belajar. Yogyakarta: Pustaka Pelajar Offset. Suharsimi Arikunto, 1999, Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi), Bumi Aksara, Jakarta. Sumarna Surapranata, 2005, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, Bandung: Remaja Rosdakarya.
Jurnal Studi Agama dan Masyarakat
Volume 7, Nomor 2, Desember 2013