ANALISIS BUTIR SOAL UJIAN MATA PELAJARAN BAHASA INDONESIA SEKOLAH DASAR TAHUN PELAJARAN 20013/2014 DI KABUPATEN PURBALINGGA Dwi Haryanto Sekolah Dasar Negeri 1 Kutasari, Purbalingga, Jawa Tengah, Indonesia Sur-el:
[email protected] Abstrak: Ujian Sekolah Dasar sebagai salah satu penilaian yang berfungsi untuk (1) pemetaan mutu satuan pendidikan, (2) dasar seleksi masuk jenjang pendidikan berikutnya, (3) penentuan kelulusan peserta didik dari satuan pendidikan, dan (4) dasar pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upayanya meningkatkan mutu satuan pendidikan harus memenuhi kriteria sebagai instrumen penilaian (tes) yang bermutu. Tujuan penelitian ini adalah untuk mengetahui kualitas/ mutu butir soal ujian sekolah secara empiris ditinjau dari kesahihan/ validitas, ketepercayaan/ reliabilitas, tingkat kesulitan, daya pembeda dan efektifitas butir pengecoh (distraktor). Data penelitian dikumpulkan melalui teknik dokumentari, yaitu dengan menggunakan lembar jawab ujian yang telah ada. Analisis datanya dengan menggunakan statistik deskriptif dan persentase. Hasil penelitian menunjukkan bahwa butir yang memenuhi criteria validitas sebanyak 47%, tingkat kesulitan soal 38%, daya beda 42%, dan efektifitas butir pengecoh 94% serta tingkat reliabilitas memenuhi persyaratan. Dari penggabungan keseluruhan kriteria tersebut, diketahui ada 14 butir soal atau 28% memenuhi semua kriteria yang ditetapkan (layak) dan 36 butir soal atau 72% tidak memenuhi satu atau lebih kriteria sehingga dinyatakan tidak layak. Secara keseluruhan soal ujian sekolah tersebut kualitasnya masih rendah sehingga masih perlu diperbaiki untuk menjadi soal ujian. Kata kunci: analisis butir soal, ujian, Sekolah Dasar, bahasa Indonesia
ANALYSIS OF TEST ITEMS USED IN THE ELEMENTARY SCHOOL INDONESIAN LANGUAGE EXAM IN THE 20013/2014 ACADEMIC YEAR IN PURBALINGGA REGENCY Abstract: The elementary school exams as one of the assessments that serve as (1) the mapping of educational unit quality; (2) the basis for selection in a further education entry; (3) the measure of student study completion from the educational unit; and (4) the basis for the upgrading and grant provision to an aducational unit in an effort to improve its quality should meet the criteria of a good test instrument. This study was aimed at describing the quality of test items in the Elementary School Indonesian language exam empirically viewed from validity, reliability, item difficulty, discriminating index and effectiveness of distracter. Data were collected through documentary technique, i.e. by using the exam worksheets available. Data were analised using descriptive statistic and 123
Volume 1 No 2 April 2015
percentage. The results have shown that: 47% of the items fulfilled the requirement of item validity, 38% fulfilled the requirement of item difficulty, 42% fulfilled the requirement of descriminating index, 94% fulfilled the requirement of effectiveness of distracters, and the instrument was said to meet the requirement of test reliability. From all those requirements combined, it revealed that only 14 items (28%) fulfilled the criteria, and were considered ‘good’ items. Overall, the items used in the Elementary School Indonesian language exam were considered poor and, therefore, needed be improved for an exam. Key words: analysis of test items, exam, elementary school, the indonesia language pembinaan dan pemberian bantuan
PENDAHULUAN Penilaian
pendidikan
seba-
kepada
Satuan
Pendidikan
dalam
gaimana tercantum dalam Peraturan
upayanya untuk meningkatkan mutu
Menteri Pendidikan Nasional Nomor
pendidikan. Pada Bab IV pasal 5 butir
20
c. dinyatakan bahwa peserta didik
Tahun
2007
adalah
proses
pengumpulan dan pengolahan informa-
dinyatakan
si untuk menentukan pencapaian hasil
pendidikan setelah lulus ujian sekolah.
lulus
dari
satuan
hasil belajar peserta didik. Peraturan
Hasil ujian harus memberikan
Menteri Pendidikan dan Kebudayaan
informasi tentang peserta didik sesuai
Nomor 102 Tahun 2013 Bab II pasal 2
dengan
menyatakan bahwa Ujian Sekolah
sesungguhnya. Untuk keperluan itu,
merupakan
soal Ujian Sekolah harus memenuhi
kegiatan
pengukuran
keadaan
yang
mendekati
pencapaian kompetensi peserta didik
syarat
pada semua mata pelajaran dan muatan
Nurgiyantoro, 2013: 150) menyatakan,
lokal
sebuah alat tes (dalam hal ini soal
sesuai
Standar
Nasional.
“baik”.
Gronlund
(dalam
Selanjutnya pada pasal 3 ayat (1)
Ujian Sekolah)
dinyatakan bahwa Ujian Sekolah dapat
mempunyai kriteria validitas (validity),
digunakan
realibilitas
sebagai
salah
satu
yang baik, harus (reliability),
dan
pertimbangan untuk (a) pemetaan mutu
kebergunaan
Satuan Pendidikan, (b) dasar seleksi
menunjuk pada pengertian apabila
masuk jenjang pendidikan berikutnya,
instrumen itu dapat mengukur apa
(c) penentuan kelulusan peserta didik
yang hendak diukur (Widoyoko, 2012:
dari
128). Reliabilitas
Satuan
Pendidikan,
Volume 1 No 2 April 2015
dan
(d)
(usability).
Validitas
menunjuk pada 124
Selanjutnya
instrumen jika memberikan hasil yang tetap
(konsisten)
apabila
diteskan
Thorndike
dan
Hagen (dalam Purwanto, 1984: 118) menyatakan bahwa analisis terhadap
berkali-kali. Bertolak dari uraian di atas
soal-soal (items) tes yang telah dijawab
maka perlu diadakan analisis butir soal
oleh peserta didik mempunyai dua
Ujian Sekolah Dasar Mata Pelajaran
tujuan
Bahasa Indonesia Tahun Pelajaran
jawaban-jawaban soal itu merupakan
2013/2014 di Kabupaten Purbalingga
informasi diagnostik untuk meneliti
dengan
pembelajaran
dan
kriteria soal Ujian Sekolah yaitu valid,
perbaikan
(review)
reliabel, tingkat kesulitan, daya beda
didasarkan atas jawaban-jawaban itu
juga efektivitas butir pengecoh
merupakan basis bagi penyiapan tes-tes
setiap
tujuan
butir
untuk
soal.
mengetahui
dari
Penelitian
ini
dilaksanakan dengan tujuan untuk mengetahui: (1) tingkat kesahihan, (2)
yang
yang
penting.
lebih
baik
kedua
untuk
Pertama,
adalah soal-soal
waktu
berikutnya. Daryanto
(2010:
177-178)
tingkat keterpercayaan, (3) tingkat
menyatakan analisis soal adalah suatu
kesukaran, (4) daya pembeda, dan (5)
prosedur yang sistematis, yang akan
efektivitas distraktor (butir pengecoh)
memberikan informasi-informasi yang
setiap butir soal. Analisis
sangat khusus terhadap butir tes. butir
soal
adalah
identifikasi jawaban benar dan salah tiap butir soal yang diujikan kepada peserta didik (Nurgiyantoro, 2013: 190). Melalui kerja analisis ini akan diketahui butir-butir soal mana saja yang dijawab benar oleh peserta tes atau sebaliknya, yaitu butir-butir soal
Adapun faedah mengadakan analisis butir soal, yaitu: 1. Membantu
guru
dalam
mengidentifi-kasi butir-butir soal yang jelek. 2. Memperoleh informasi yang dapat digunakan untuk menyempurnakan
mana saja yang dijawab salah oleh
soal-soal untuk kepentingan selan-
peserta tes. Berdasarkan jawaban benar
jutnya.
dan
salah
itulah
akan
dihitung
validitas, reliabilitas, indeks tingkat kesulitan,
daya
beda
efektivitas butir pengecohnya. 125
maupun
3. Memperoleh
gambaran
keadaan
sebuah butir soal secara empiris. Dari penjelasan di atas, dapat diketahui bahwa analisis butir soal Volume 1 No 2 April 2015
bertujuan untuk mengidentifikasi soal-
tetap, ajeg, dan dapat dipercaya.
soal yang baik, kurang baik dan soal
Arikunto
yang jelek.
bahwa suatu tes dapat dikatakan baik
Ujian sekolah/madrasah adalah kegiatan
pengukuran
kompetensi dilakukan
pencapaian
peserta oleh
didik
satuan
yang
(2009:
57)
menyatakan
apabila memenuhi lima persyaratan, yaitu: validitas, reliabilitas, objektivitas, praktikabilitas, dan ekonomis.
pendidikan
Sahih (valid), artinya bahwa
untuk memperoleh pengakuan atas
alat tersebut (tes) hanya mengukur satu
prestasi belajar dan merupakan salah
dimensi/aspek saja, misal tes matema-
satu persyaratan kelulusan dari satuan
tika, hanya mengukur pengetahuan
pendidikan. Selain itu, ujian sekolah
matematika
juga digunakan sebagai pemetaan mutu
pengetahuan lain (Depdikbud, 1992:
satuan pendidikan, khususnya untuk
10). Sahih, berarti penilaian didasarkan
mata pelajaran
Bahasa Indonesia,
pada data yang mencerminkan kemam-
Matematika, dan IPA pada SD/ MI/
puan yang diukur (Depdiknas, 2007:
SDLB yang dilakukan oleh Kemen-
1). Selanjutnya Widoyoko (2009: 128)
terian (Permendikbud, 2013 pasal 3
mengemukakan bahwa instrumen (tes)
ayat 2).
dikatakan
saja,
valid
tidak
apabila
mengukur
instrumen
Tes (dalam hal ini, soal uji-
tersebut dapat dengan tepat mengukur
an sekolah) sebagai salah satu alat
apa yang hendak diukur atau ketepatan
ukur hasil peserta
alat ukur.
didik diharapkan
mampu memberikan informasi yang
Reliabel (andal), artinya bahwa
dapat dipertanggungjawabkan kebena-
alat
rannya. Artinya, soal ujian sekolah
memberikan hasil pengukuran yang
tersebut dapat memberikan informasi
tepat, cermat dan ajeg (kurang lebih
tentang peserta didik sesuai dengan
sama walaupun diberikan pada waktu
keadaan
sesungguhnya
yang berbeda) (Depdikbud, 1992: 11).
(Nurgiyantoro, 2013:149). Widoyoko
Nurkancana (1986: 131) menyatakan
(2009:127) menyatakan bahwa data
bahwa suatu tes dikatakan tes yang
penilaian yang baik adalah data yang
reliabilitas
sesuai
yang
menunjukkan hasil-hasil yang mantap.
sebenarnya dan data tersebut bersifat
Sedangkan Nurgiyantoro (2013:165)
yang
dengan
kenyataan
Volume 1 No 2 April 2015
tes
tersebut
apabila
harus
tes
dapat
tersebut
126
menyatakan reliabilitas tes adalah jika
merupakan kunci jawaban. Pengecoh
sebuah tes diujicobakan lebih dari satu
diadakan untuk menyesatkan peserta
kali kepada subjek yang sama dapat
didik
menghasilkan data yang kurang lebih
jawaban
sama. Alat tersebut dapat mengukur
Daryanto (2010: 192) menyatakan
secara konsisten, secara ajeg.
bahwa
Nurgiyantoro (2013:194) me-
agar tidak memilih kunci (Waridjan, sebuah
dikatakan
1984:
387).
pengecoh
berfungsi
dapat
dengan
baik
nyatakan, indeks tingkat kesulitan
apabila pengecoh mempunyai daya
(ITK) adalah indeks yang menun-
tarik
jukkan seberapa mudah atau sulit suatu
pengikut tes yang kurang memahami
butir soal bagi peserta tes yang diuji.
konsep atau kurang menguasai materi.
yang
besar
bagi
pengikut-
Selanjutnya Oller (dalam Nurgiyantoro, 2013:194) mengemukakan bahwa tingkat
kesulitan
(item
METODOLOGI PENELITIAN Penelitian ini mengambil lokasi
difficulty)
adalah pernyataan tentang seberapa
di
mudah atau sulit sebuah butir soal bagi
Kabupaten Purbalingga dan terfokus
siswa.
pada tes hasil belajar dalam ujian Daya pembeda (item discrimi-
nability) maksudnya adalah seberapa besar
suatu
butir
soal
dapat
membedakan antara siswa kelompok tinggi
dengan
kelompok
rendah.
Purwanto (2009: 120) menyatakan bahwa daya pembeda suatu soal tes ialah
kemampuan
membedakan
soal
siswa-siswa
termasuk kelompok dengan
group)
itu
pandai
siswa-siswa
untuk yang
di
wilayah
sekolah tingkat Sekolah Dasar Mata Pelajaran
Bahasa
Indonesia
yang
dilaksanakan pada tanggal 19 Mei 2014,
dengan
mengambil
objek
penelitian dan kegiatan analisis dari tanggal 1 sampai dengan 14 Desember 2014. Untuk penelitian ini diambil sampel 5% dari seluruh populasi yang berjumlah 470 sekolah atau 9.572
yang
siswa, sehingga sampelnya ada 24 sekolah atau 479 siswa. Metode yang digunakan dalam
group). Pengecoh (distracter) adalah 127
Dasar
(upper
termasuk kelompok kurang (lower
pilihan
Sekolah
jawaban
yang
bukan
penelitian
ini
adalah
penelitian
deskriptif. Penelitian deskriptif tidak Volume 1 No 2 April 2015
dimaksudkan untuk menguji hipotesis
Prosedur atau tahapan pene-
tertentu, tetapi hanya menggambarkan
litian dalam penelitian ini sebagai
“apa adanya” tentang suatu gejala atau
berikut: (1) menyusun instrumen atau
keadaan. Penelitian yang dilakukan
rambu-rambu pengukuran, (2) me-
diupayakan seobjektif mungkin ter-
ngumpulkan data, (3) mendeskripsikan
hadap hal-hal yang menjadi pusat
data, (4) menganalisis data, (5) meru-
perhatian dan mendukung penelitian.
muskan simpulan.
Peneliti bertugas untuk mengumpulkan data, mendeskripsikannya, menganali-
HASIL DAN PEMBAHASAN
sisnya, sampai akhirnya dapat membu-
Analisis uji validitas butir soal
at kesimpulan sebagai jawaban terha-
ini dilakukan dengan menggunakan
dap masalah penelitian yang diajukan-
korelasi point biserial dengan hasil
nya.
sebagai berikut. Analisis Validitas Butir Soal Ujian Sekolah Dasar Mata Pelajaran Bahasa Indonesia Tahun Pelajaran 2013/2014 di Kabupaten Purbalingga
No
Mp Mt SDt p Butir 1 40.340 40.094 5.116 0.908 2 41.257 40.094 5.116 0.658 3 40.639 40.094 5.116 0.307 4 5 6 7 8 9 10 11 12 13 14 15 16
40.454 40.981 41.874 40.671 41.593 40.733 40.652 41.273 40.964 40.554 40.347 40.411 40.199
40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094
Volume 1 No 2 April 2015
5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116
0.960 0.781 0.597 0.883 0.672 0.877 0.875 0.649 0.578 0.931 0.937 0.935 0.904
r InterQ rpbi tabel pretasi 5% 0.092 3.144 0.151 0.088 Valid 0.342 1.386 0.315 0.088 Valid 0.693 0.665 0.071 0.088 Tidak valid 0.040 4.92 0.347 0.088 Valid 0.219 1.887 0.327 0.088 Valid 0.403 1.217 0.424 0.088 Valid 0.117 2.748 0.310 0.088 Valid 0.328 1.432 0.420 0.088 Valid 0.123 2.668 0.333 0.088 Valid 0.125 2.643 0.288 0.088 Valid 0.351 1.361 0.314 0.088 Valid 0.422 1.171 0.199 0.088 Valid 0.069 3.676 0.330 0.088 Valid 0.063 3.869 0.192 0.088 Valid 0.065 3.802 0.235 0.088 Valid 0.096 3.068 0.063 0.088 Tidak valid √p q
128
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
40.935 40.825 41.332 45.082 40.978 41.092 41.210 40.502 41.326 40.628 40.641 40.817 40.457 40.417 41.020 40.560 40.538 40.392 40.817 40.606 41.494 41.467 40.462 40.315 40.779 40.581 40.842 40.524 41.805 41.289 40.456 41.010 40.201
Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Valid Tidak valid 50 40.209 40.094 5.116 0.927 0.073 3.562 0.080 0.088 Tidak valid Setelah
40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094 40.094
5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116 5.116
0.228 0.132 0.221 0.111 0.232 0.230 0.186 0.069 0.347 0.052 0.146 0.234 0.077 0.058 0.157 0.075 0.088 0.069 0.169 0.146 0.633 0.370 0.073 0.038 0.177 0.098 0.142 0.052 0.829 0.307 0.286 0.200 0.056
1.842 2.57 1.876 2.835 1.821 1.832 2.093 3.676 1.373 4.261 2.417 1.81 3.456 4.013 2.321 3.508 3.226 3.676 2.217 2.417 0.762 1.306 3.562 5.061 2.153 3.032 2.458 4.261 0.454 1.503 1.58 1.997 4.092
0.303 0.367 0.454 2.764 0.315 0.357 0.457 0.293 0.331 0.445 0.258 0.256 0.245 0.253 0.420 0.319 0.280 0.214 0.313 0.242 0.209 0.351 0.256 0.218 0.288 0.289 0.359 0.358 0.152 0.351 0.112 0.358 0.086
0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088 0.088
ke
Jika harga r hitung (rh) lebih kecil dari
tabel harga kritik r product moment
harga kritik dalam tabel (rt), maka
diketahui signifikan atau tidaknya
korelasi tersebut tidak signifikan atau
masing-masing butir soal tersebut.
tidak valid (invalid). Sebaliknya jika
129
dikonsultasikan
0.772 0.868 0.779 0.889 0.768 0.770 0.814 0.931 0.653 0.948 0.854 0.766 0.923 0.942 0.843 0.925 0.912 0.931 0.831 0.854 0.367 0.630 0.927 0.962 0.823 0.902 0.858 0.948 0.171 0.693 0.714 0.800 0.944
Volume 1 No 2 April 2015
harga r hitung (rh) lebih besar dari
yang memenuhi kriteria (signifikan/
harga kritik dalam tabel (rt), maka
valid) sebanyak 47 butir soal (94%)
korelasi butir soal tersebut siginfikan
sedangkan untuk butir soal yang tidak
atau valid.
memenuhi kriteria sebanyak 3 butir
Dari seluruh 50 butir soal,
soal atau 6%.
Porsi Butir Soal Valid 6%
Valid Tidak Valid
94%
soal
Penghitungan Penghit reliabilitas butir
memperoleh
keseluruhan, dilakukan di dengan
dihitung
teknik split it half h lalu dengan rumus korelasi
product
indeks
dengan
reliabilitas
rumus
Spearman
Brown, dengan hasil sebagai berikut.
Untuk
moment. moment
Reliabilitas Keseluruhan Soal Soal/Instrumen No
Jumlah Soal
rhitung
rtabel
Keterangan
1
50
0,795
0,279
reliabel
Untuk
rtabel
yang
diminta
Untuk
menghitung
indeks
dengan jumlah soal (N) sebanyak 50
kesulitan butir soal (ITK) dilaksanakan
butir adalah dengan taraf signifikansi
melalui beberapa tahapan, di antaranya
5% pada tabel
r product moment
menentukan kelompok rendah dan
adalah 0,279. Dari hasil penghitungan
tinggi dengan pedoman 27,5% da dari
di atas harga r hitung (rh) yaitu 0,795
seluruh sampel, maka jumlah subjek
ternyata lebih besar dari r tabel (rt) yaitu 0,279 yang dapat diartikan ada korelasi yang signifikan sehingga dapat disimpulkan bahwa soal reliabel. Volume 1 No 2 April 2015
untuk
masing masing-masing
sebanyak responden/
27,5%
x
subjek.
kelompok
479
=
132
Setelah
itu
dilakukan pengurutan skor perolehan siswa untuk menentukan responden 130
mana saja yang masuk kelompok
sampai dengan 0,80 sedangkan ITK
tersebut.
yang kurang 0,20 atau lebih dari 0,80
Untuk tingkat kesulitan yang memenuhi persyaratan (indeks yang
berarti soal tidak layak (Nurgiyantoro, 2013: 195).
dapat ditoleransi), berkisar antara 0,20 Indeks Tingkat Kesulitan (ITK) Butir Soal No. Soal
131
∑FKT
∑FKR
N
ITK
Keterangan
1 2 3 4 5 6 7 8 9 10 11
129 114 49 132 118 116 126 122 130 127 100
110 69 40 119 82 51 105 55 98 100 59
264 264 264 264 264 264 264 264 264 264 264
0.905 0.693 0.337 0.951 0.758 0.633 0.875 0.670 0.864 0.860 0.602
Tidak Layak Layak Layak Tidak Layak Layak Layak Tidak Layak Layak Tidak Layak Tidak Layak Layak
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
105 132 129 130 125 119 130 127 130 116 126 131 130 108 132 126 110 129 129 130 132
64 107 118 112 118 83 99 71 94 84 74 78 110 59 112 95 86 111 116 82 110
264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264
0.640 0.905 0.936 0.917 0.920 0.765 0.867 0.750 0.848 0.758 0.758 0.792 0.909 0.633 0.924 0.837 0.742 0.909 0.928 0.803 0.917
Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Layak Tidak Layak Layak Tidak Layak Layak Layak Layak Tidak Layak Layak Tidak Layak Tidak Layak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak
Volume 1 No 2 April 2015
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
126 125 127 127 70 119 127 132 126 130 124 130 32 111 104 126 128 128
108 114 87 102 33 55 116 120 93 108 95 114 11 64 84 80 119 117
264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264 264
0.886 0.905 0.811 0.867 0.390 0.659 0.920 0.955 0.830 0.902 0.830 0.924 0.163 0.663 0.712 0.780 0.936 0.928
Tidak Layak Tidak Layak Tidak Layak Tidak Layak Layak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Layak Layak Layak Tidak Layak Tidak Layak
Keterangan : ∑FKT = Jumlah skor kelompok tinggi ∑FKR = Jumlah skor kelompok rendah N = Jumlah siswa kelompok tinggi dan rendah ITK = Indeks tingkat kesulitan Dari
penghitungan
indeks
peserta didik yang masuk dalam
tingkat kesulitan maka didapat hasil
katagori peserta didik yang rendah
bahwa soal yang memenuhi kriteria
dan tinggi prestasinya. Nurgiyantoro
ada 19 butir soal atau 38%, kriteria
(2013: 198) menyatakan bahwa untuk
sedang 31 butir soal atau 62% adalah
indeks daya pembeda yang diper-
butir soal yang tidak memenuhi kriteria
syaratkan
(tidak layak).
sebuah butir soal tidak memenuhi
Analisis daya pembeda artinya mengkaji butir-butir soal tes dari segi
minimal
0,25.
Apabila
kriteria tersebut maka dikelompokkan dalam kriteria tidak layak.
kesanggupan tes tersebut membedakan Daya Pembeda Butir Soal No. Soal
∑FKT
1 2 Volume 1 No 2 April 2015
129 114
∑FKR 110 69
n 132 132
IDB
Keterangan
0.144 Tidak Layak 0.341 Layak 132
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 133
49 132 118 116 126 122 130 127 100 105 132 129 130 125 119 130 127 130 116 126 131 130 108 132 126 110 129 129 130 132 126 125 127 127 70 119 127 132 126 130 124
40 119 82 51 105 55 98 100 59 64 107 118 112 118 83 99 71 94 84 74 78 110 59 112 95 86 111 116 82 110 108 114 87 102 33 55 116 120 93 108 95
132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132 132
0.068 0.098 0.273 0.492 0.159 0.508 0.242 0.205 0.311 0.311 0.189 0.083 0.136 0.053 0.273 0.235 0.424 0.273 0.242 0.394 0.402 0.152 0.371 0.152 0.235 0.182 0.136 0.098 0.364 0.167 0.136 0.083 0.303 0.189 0.280 0.485 0.083 0.091 0.250 0.167 0.220
Tidak Layak Tidak Layak Layak Layak Tidak Layak Layak Layak Layak Layak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Layak Tidak Layak Layak Layak Tidak Layak Layak Layak Tidak Layak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Tidak Layak Layak Tidak Layak Tidak Layak Tidak Layak Layak Tidak Layak Layak Layak Tidak Layak Tidak Layak Layak Tidak Layak Tidak Layak
Volume 1 No 2 April 2015
44 45 46 47 48 49 50
130 32 111 104 126 128 128
114 11 64 84 80 119 117
132 132 132 132 132 132 132
0.121 0.159 0.356 0.152 0.348 0.068 0.083
Tidak Layak Tidak Layak Layak Tidak Layak Layak Tidak Layak Tidak Layak
Keterangan : ∑FKT = Jumlah skor kelompok tinggi ∑FKR = Jumlah skor kelompok rendah n = Jumlah siswa kelompok tinggi atau rendah IDB = Indeks daya beda Dari data tabel di atas dapat
butir
pengecoh
(distracter).
Dari
dilihat bahwa 21 butir soal memenuhi
kegiatan ini akan diketahui efektif
kriteria yang ditentukan atau sebanyak
tidaknya tiap alternatif pilihan jawaban
42%
disebut
layak.
Sedangkan
sebanyak 29 butir soal atau 58%
dan sebaran frekuensi jawaban. Berdasarkan data dari kegiatan analisis sebaran frekuensi jawaban
ternyata indeks daya bedanya tidak
peserta didik maka dapat diketahui
memenuhi kriteria yang ditentukan dan
efektivitas butir pengecoh sehingga
dikatakan tidak layak.
jika ada penyimpangan pada alternatif
Untuk mengetahui efektivitas
jawaban (option) perlu juga dilakukan
tiap alternatif jawaban (option) atau
revisi. Deskripsi dan analisis sebaran
sebaliknya,
frekuensi jawaban masing-masing butir
yaitu
penyimpangan
adanya
alternatif
jawaban,
soal dapat dilihat pada tabel berikut.
perlu dilakukan juga kegiatan analisis Sebaran Frekuensi Jawaban Siswa Terhadap Alternatif-alternatif Jawaban Kelompok Tinggi
Nomor Soal
A
B
1 2 3 4
0 9 49* 1
2 1 69 2
C
D
129* 1 8 114* 1 14 1 130*
Volume 1 No 2 April 2015
Opsi yang perlu C D direvisi 110* 14 28 69* 6 20 0 119* C
Kelompok Rendah A
B
3 33 40* 2
5 2 66 11
134
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 135
118* 6 0 1 130* 1 2 20 132* 1 1 125* 0 130* 3 0 0 126* 0 130* 20 132* 126* 0 1 2 130* 0 4 125* 0 0 0 3 5 132* 1 1 8 130* 5 111* 1 1
5 1 1 122* 1 127* 6 1 0 129* 1 2 119* 1 1 130* 116* 6 1 1 108* 0 0 110* 1 129* 0 0 126* 5 127* 3 132* 6 0 0 126* 1 0 1 95 1 1 3
6 9 126* 1 1 2 100* 6 0 1 130* 5 10 1 127* 0 5 0 131* 0 2 0 1 1 1 1 1 132* 2 1 5 127* 0 4 0 0 4 130* 124* 1 0 3 104* 2
5 116* 5 6 1 2 24 105* 0 1 0 0 3 1 1 2 1 0 0 1 2 0 5 21 129* 0 1 0 0 1 0 2 0 119* 127* 0 1 0 0 0 32* 7 26 126*
82* 17 5 4 98* 0 23 56 107* 7 14 118* 11 99* 28 13 14 74* 33 110* 22 112* 95* 16 17 13 82* 11 14 114* 7 8 33 31 3 120* 16 8 27 114* 11 64* 4 16
14 2 1 55* 20 100* 21 3 11 118* 4 6 83* 27 14 94* 84* 45 4 14 59* 8 6 86* 2 116* 17 12 108* 10 87* 5 33* 17 10 8 93* 6 8 7 93 16 11 20
8 28 62 51* 105* 21 6 67 9 5 8 24 59* 29 9 64* 5 9 2 5 2 112* 7 1 22 16 4 2 71* 19 15 10 32 2 11 2 78* 17 4 4 17 34 1 11 13 18 6 24 2 111* 1 2 17 16 110* 9 7 3 4 4 34 4 102* 17 19 47 29 55* 3 116* 2 2 22 1 108* 10 95* 2 10 1 17 11* 13 39 84* 33 16 80*
A A -
Volume 1 No 2 April 2015
49 128* 4 0 0 119* 10 1 2 50 3 1 0 128* 6 3 6 117* Keterangan : A, B, C, D = alternatif jawaban (option) yang disediakan * = kunci jawaban Dari data pada tabel tersebut di atas maka diketahui ada 47 butir soal
-
memenuhi sebanyak 3 butir soal atau 6%.
yang telah memenuhi kriteria atau
2. Tingkat reliabilitas terpenuhi karena
tidak perlu ada revisi pada alternatif
r hitung (rh) lebih besar dari r tabel
jawaban atau 94%, sedangkan butir
(rt), yaitu rh (0,795) > rt (0,279).
soal yang perlu direvisi optionnya sejumlah 3 butir soal atau hanya 6%. Selanjutnya
dari
beberapa
3. Tingkat kesukaran, ada 19 butir soal (38%) yang layak atau memenuhi kriteria yang dipersyaratkan, dan
penghi-tungan kriteria tersebut dapat
31
digabung ke dalam satu tabel, sehingga
tidak memenuhi kriteria atau tidak
sebuah butir soal dapat dikatakan layak (memenuhi semua kriteria) atau tidak layak (tidak memenuhi kriteria/ perlu revisi) berdasarkan kriteria yang telah ditetapkan.
Sebab
dimungkinkan
sebuah butir soal memenuhi satu atau dua kriteria yang telah ditetapkan, tetapi belum tentu memenuhi semua kriteria yang telah ditentukan.
butir
soal
(62%)
yang
layak. 4. Tingkat daya beda, ada 21 butir soal yang memenuhi kriteria atau layak dan ada 29 butir soal yang tidak memenuhi kriteria atau tidak layak. 5. Butir pengecoh, sebanyak 47 butir soal atau 94% butir pengecohnya berfungsi dengan baik dan ada 3 butir
soal
atau
6%
butir
pengecohnya perlu direvisi.
Secara keseluruhan berdasarkan
Dari
analisis
yang
telah
analisis butir soal yang telah dilakukan
dilakukan, maka secara keseluruhan
maka dapat dilihat bahwa:
dapat diketahui dari keseluruhan butir
1. Tingkat kesahihan butir soal pada
soal yang memenuhi semua kriteria
perangkat tes (soal ujian sekolah
(layak) ada 14 butir soal atau 28%, dan
dasar tersebut) sebanyak 47 butir
ada 36 atau 72 % butir soal yang tidak
(94%)
dari
memenuhi satu atau lebih kriteria yang
jumlah seluruh butir soal yaitu 50
ditentukan termasuk butir soal yang
butir soal. Sedangkan yang tidak
tidak layak.
memenuhi
kriteria
Volume 1 No 2 April 2015
136
soal perlu juga diujicobakan sehingga
PENUTUP Dari hasil kegiatan analisis
dapat dilakukan analisis secara empiris
butir soal yang telah dilakukan, maka
yang
selanjutnya
dapat
diketahui
dapat ditarik simpulan sebagai berikut:
tingkat validitas, reliabilitas, tingkat
(1) tingkat kesahihan sebanyak 47 butir
kesukaran, daya beda serta efektivitas
soal (94%) memenuhi kriteria (valid),
butir pengecohnya.
sedangkan 3 butir soal atau 6% tidak valid, (2) .tingkat reliabilitas, terpenuhi
DAFTAR PUSTAKA
karena r hitung (rh) lebih besar dari r
Arikunto, Suharsimi. 2009. Dasardasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
tabel (rt), yaitu rh = 0,795 sedangkan rt 0,279, (3) tingkat kesukaran, ada 19 atau 38% yang layak dan 31 butir soal atau 62% tidak layak, (4) tingkat daya beda, ada 21 (42%) butir soal layak dan ada 29 (58%) butir soal yang tidak layak, (5) butir pengecoh, sebanyak 47 butir soal atau 94% butir pengecohnya berfungsi dengan baik dan ada 3 butir soal atau 6% butir pengecohnya perlu direvisi. Dari penggabungan beberapa kriteria tersebut di atas, dapat diketahui bahwa butir soal yang memenuhi semua kriteria (layak) ada 14 butir soal atau 28% dan ada 36 butir soal atau 72 % yang tidak memenuhi satu atau lebih kriteria yang ditentukan termasuk butir soal yang tidak layak. Penyusun soal dalam menyusun soal
hendaknya
memperhatikan
kriteria-kriteria penyusunan soal yang ada baik dari segi materi, konstruksi,
Arikunto, Suharsimi. 2009. Manajemen Pendidikan. Jakarta: Rineka Cipta. Arikunto, Suharsimi. 2010. Prosedur Penelitian: Suatu Pendekatan Praktik. Jakarta: Rineka Cipta. Azwar, Saifudin. 1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar. Balibang Kemendikbud. 2014. Peraturan Ka. Balibang Kemendikbud Nomor 001/H/HK/2014 tentang POS Penyelenggaraan Ujian Sekolah/ Madrasah Tahun Pelajaran 2013/2014. Jakarta: Balitbang Kemendikbud. Daryanto. 2010. Evaluasi Pendidikan. Jakarta: Rineka Cipta. Depdikbud. 1994. Pedoman Penyusunan Perangkat Soal SD dan SMP. Jakarta: Proyek Peningkatan Mutu Pendidikan Dasar. Heryadi, Dedi. 2010. Metode Penelitian Pendidikan Bahasa. Bandung: Pustaka Billah.
maupun bahasa. Selain hal tersebut 137
Volume 1 No 2 April 2015
Heryadi, Dedi. 2014. Statistika Praktis untuk Penelitian Pendidikan. Tasikmalaya: Universitas Siliwangi. Nasution, Noehi dan Adi Suryanto. 2005. Evaluasi Pengajaran. Jakarta: Universitas Terbuka. Nurgiyantoro, Burhan. 2013. Penilaian dalam Pengajaran Bahasa Berbasis Kompetensi. Yogyakarta: BPFE. Nurkancana dan Sumartana. 1983. Evaluasi Pendidikan. Surabaya: Usaha Nasional. Kemendikbud. 2013. Permendikbud Nomor 102 Tahun 2013 tentang Penyelenggaran Ujian Sekolah Dasar/ Madrasah Ibtidaiyah, SDLB dan Program Paket A/ ULA. Jakarta: Kemendikbud. Mendiknas. 2007. Permendiknas Nomor 20 Tahun 2007 tentang Standar Penilaian di Sekolah. Jakarta: Kemendiknas. Purwanto. 2010. Metodologi Penelitian Kuantitatif. Yogyakarta: Pustaka Pelajar. Purwanto, M. Ngalim. 1984. Prinsipprinsip dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya.
Volume 1 No 2 April 2015
Sudijono, Anas. 2010. Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo Persada. Sudjana, Nana. 1984. Dasar-dasar Penilaian Hasil Belajar. Jakarta: CV Serajaya. Sugiyono. 2010. Penelitian. Serajaya.
Statistika Jakarta:
untuk CV
Sukardi. 2013. Metodologi Penelitian Pendidikan. Surabaya: PT Bina Ilmu. Sutomo. 1985. Teknik Penilaian Pendidikan. Surabaya: PT Bina Ilmu. Suwartono. 2014. Dasar-dasar Metodologi Penelitian. Yogyakarta: CV Andi Offset. Thoha, M. Chabib. 1994. Teknik Evaluasi Pendidikan. Jakarta: PT Raja Grafindo Persada. Waridjan. 1991. Tes Hasil Belajar Gaya Objektif. Semarang: IKIP Semarang Press. Widoyoko, Eko Putro. 2012. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar.
138