KUALITAS INSTRUMEN PENGUKURUAN DALAM PEMBELAJARAN
A. Validitas Validitas berasal dari kata validity yang berarti sejauh mana ketetpatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Djaali :2004). Zainal mengatakan (Zainal : 2010) Valid, artinya suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa yang hendak diukur secara tepat. Misalnya, alat ukur mata pelajaran Fisika, maka alat ukur tersebut harus betul-betul dan hanya mengukur kemampuan peserta didik dalam mempelajari Fisika, tidak boleh dicampuradukkan dengan materi pelajaran yang lain. Suatu alat ukur baik tes maupun non tes dikatakan memiliki validitas, apabila alat tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan apa yang dibutuhkan pada kegiatan pengukuran tersebut. Artinya, hasil ukur dari pengukuran tersebut mengindikasikan besaran dan satuan yang tepat dan sesuai dengan keadaan yang sesungguhnya. Nasution (1996) mengatakan Validitas adalah suatu ukuran yang menunjukan tingkat kesahihan suatu instrumen yang benar-benar dapat mengukur apa yang hendak diukur. “Suatu alat ukur dikatakan valid, jika alat itu mengukur apa yang seharusnya diukur oleh alat itu. Meter itu valid karena mengukur jarak. Demikian pula timbangan valid karena mengukur berat”. Berdasarkan uraian di atas, maka dapat disimpulkan bahwa validitas merupakan tingkat kesesuaian antara alat ukur dengan sesuatu yang akan diukurnya. Validitas dalam kaitannya dengan instrumen tes dan non tes dapat dibagi menjadi 3 macam, yaitu 1. Validitas Isi Validitas isi merupakan kesesuaian alat ukur dengan materi, standar kompetensi dan indikator yang akan diukurnya. Suatu instrumen dapat dikatakan valid secara isi, manakala butir – butir nya merujuk pada hal – hal tersebut di atas. Instrumen yang valid secara isi harus dapat mencerminkan isi yang proporsional dan menyeluruh dari keterwakilan indikator, materi maupun standar kompetensi yang akan diukur. 94
95
Proporsi yang tepat tidak harus merata, boleh jadi keterwakilannya hanya di satu atau dua butir saja di dalam seperangkat instrumen tersebut.
2. Validitas Konstruk Validitas konstruk merupakan kesesuaian butir – butir instrumen dengan konstruk, konsep khusus atau definisi konseptual yang telah ditetapkan pada suatu instrumen. Validitas konstruk umumnya digunakan pada instrumen – instrumen yang menggunakan konsep baik yang bersifat performance typical maupun performance maxmimum. Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelahaan teoretis terhadap suatu konsep dari variabel yang hendak diukur, mulai dari perumusan kontruk, penentuan dimensi dan indikator, sampai pada penjabaran dan penulisan butir –butir instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis dari konsep – konsep dasar tentang variabel tertentu yang hendak diukur melalui proses analisis dan komparasi yang logis. Dimensi dan indikator dijabarkan dari konstruk yang telah dirumuskan dengan memperhatikan hal – hal sebagai berikut : a. Seberapa jauh indikator tersebut merupakan indikator yang tepat dari konstruk yang telah dirumuskan. b. Indikator – indikator dari suatu konstruk harus homogen, konsisten dan konvergen untuk mengukur konstruk dari variabel yang hendak diukur. c. Indikator – indikator tersebut harus lengkap untuk mengukur suatu konstruk secara utuh. Berdasarkan uraian tersebut di atas, dapat disimpulkan bahwasanya validitas konstruk dapat dilakukan melalui penelaahan atau justifikasi pakar atau penilaian kelompok panel yang terdiri dari orang – orang yang menguasai substansi atau konsten dari variabel yang hendak diukur.
3. Validitas struktur
96
Sebuah instrumen tes dapat dikatakan valid jika strukturnya memenuhi syarat – syarat dalam struktur instrumen yang berlaku baik secara umum maupun secara khusus.Secara umum bahasa, penggunaan
4. Validitas Empirik Validitas empiris atau validitas kriteria merupakan validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu yang menjadi kriteria. Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan kriteria eksternal. a. Validitas internal Validitas internal termasuk kelompok validitas kriteria yang merupakan validiyas yang diukur dengan besaran yang menggunakan instrumen sebagai satu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu. Dengan begitu, validitas internal mengacu pada validitas butir. Validitas butir yang biasa juga disebut validitas internal diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur instrumen sebagai satu kesatuan. Oleh karena itu, validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total instrumen. Jika koefisien korelasi positif dan signifikan, maka butir tersebut dapat dianggap valid berdasarkan ukuran validitas internal. Apabila besaran koefisien korelasi antara skor butir dengan skor total bernilai positif, makin besar koefisien korelasi maka validitas butir juga makin tinggi. Koefisien korelasi yang tinggi antara skor butir dengan skor total mencerminkan tingginya konsistensi antara hasil ukur keseluruhan instrumen dengan hasil ukur butir instrumen. Untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari instrumen tersebut. Jika skor butir kontinum, maka untuk menghitung koefisien
97
korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi Product moment (r) sebagai berikut :
r=
n. XY X Y
n. x
2
X n. y 2 Y 2
2
Keterangan : r
= koefisien korelasi butir soal
X
= Skor pada butir ke-x
Y
= Skor total
Σ x2
= Jumlah kuadrat butir X
Σ y2
= Jumlah kuadrat skor total Jika skor butir dikotomi, maka untuk menghitung koefisien korelasi antara
skor butir dengan skor total instrumen digunakan koefisien korelasi biserial (rbis) sebagai berikut :
rpbi =
Xi X t St
pi qi
Keterangan: rbis
= koefisien korelasi butir
Xi
= Rata-rata butir ke-i
Xt
= Rata-rata total
pi
= Proporsi jawaban benar
qi
= Proporsi jawaban salah
St2
= varians skor total
b. Validitas eksternal Validitas eksternal merupakan validitas yang diukur berdasarkan kriteria eksternal. Kriteria eksternal dapat berupa hasil ukur instrumen baku atau instrumen yang dianggap baku atau dapat pula hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau variabel yang hendak
98
diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang merupakan hasil perhitungan statistika. Jika menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal dari instrumen yang telah dikembangkan didapat dengan jalan mengkorelasikan skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku yang dijadikan kriteria. Makin tinggi koefisien korelasi yang diapat, maka validitas instrumen yang dikembangkan juga makin baik. Kriteria yang digunakan untuk menguji validitas eksternal adalah nilai tabel r (rtabel product moment). Jika koefisien korelasi skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku lebih besar dari r tabel, maka instrumen yang dikembangkan dapat dianggap valid berdasarkan kriteria eksternal yang dipilih. Jadi keputusan uji validitas dalam hal ini adalah mengenai valid atau tidaknya instrumen sebagai satu kesatuan utuh, bukan valid atau tidaknya butir instrumen seperti pada validitas internal. Ditinjau dari kriteria eksternal yang dipilih, validitas eksternal dapat dibedakan atas dua macam, yaitu validitas prediktif dan validitas kongkruen. Validitas prediktif merupakan validitas yang lebih bersifat melihat hasil ukur saat ini dengan ukuran pembanding atau penampilan pembanding masa yang akan datang.
Sedangkan
validitas
kongkruen
merupakan
validitas
yang
membandingkan hasil ukur yang dilakukan secara bersamaan dari kedua alat ukur tersebut. Validitas prediktif umumnya digunakan guru ketika awal tahun akademik/ pelajaran dengan melihat nilai siswa secara keseluruhan. Nilai keseluruhan siswa merupakan dasar prediksi guru untuk mempersiapkan pembelajaran di kelas berikutnya dalam satu semester. Apabila nilai – nilai tersebut dikorelasikan dengan hasil ujian akhir semester dan menghasilkan korelasi yang positif dan signifikan, maka nilai siswa pada kelas sebelumnya dapat dikatakan valid berdasarkan validitas prediktif. Validitas kongkruen umumnya digunakan guru pada saat membandingkan atau mengkorelasikan antara nilai – nilai harian siswa dengan nilai ujian tengah
99
semester atau ujian akhir semester. Nilai harian merupakan penampilan (performance) pembanding yang dapat menjadi kriteria kemampuan siswa pada saat yang bersamaan dengan hasil ujian siswa. Apabila nilai – nilai tersebut dikorelasikan dan menghasilkan koefisien yang postif dan signifikan, maka dapat dikatakan valid berdasarkan validitas kongkruen.
B. Reliabilitas Reliabilitas berasal dari kata reliable, yang berarti dapat dipercaya. Menurut Nasution (1996) alat ukur yang reliabel adalah bila alat itu digunakan untuk mengukur suatu gejala yang berlainan senantiasa menunjukan hasil yang sama. Sedangkan Djaali mengatakan bahwa reliabilitas berarti sejauhmana hasil suatu pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek belum berubah. Zainal (2010) mengatakan reliabel, artinya suatu alat ukur dapat dikatakan reliabel atau handal jika ia mempunyai hasil yang taat asas. Misalnya, suatu alat ukur diberikan kepada sekelompok peserta didik saat ini, kemudian diberikan lagi kepada sekelompok peserta didik yang sama pada saat yang akan datang, dan ternyata hasilnya sama atau mendekati sama, maka dapat dikatakan alat ukur tersebut mempunyai tingkat reliabilitas yang tinggi. Berdasarkan uraian di atas, maka dapat disimpulkan reliabilitas adalah tingkat konsistensi hasil pengukuran dari sebuah alat ukur yang dikenakan pada suatu subyek/obyek yang dengan memperhatikan perubahan aspek dalam diri subyek/obyek ukur. Artinya, pengukuran akan menghasilkan skor yang relatif sama pada suatu subyek/obyek, selama tidak terjadi perubahan aspek ukur di dalam diri subyek/obyek tersebut. Konsep reliabilitas berkaitan erat dengan konsep error alat ukur dan hasil dari suatu pengukuran. Artinya, sejauh mana tingkat kosnsitensi dalam pengukuran jika dilakukan berulang – ulang terhadap satu subyek yang sama, atau sejauh mana tingkat konsistensi hasil pengukuran yang terkait dengan pengambilan sampel. Sama halnya dengan validitas, dalam perhitungan reliabilitas pada umumnya menggunakan bantuan statistika dalam perhitungannya disesuaikan dengan jenis skor butir
100
yang akan dihitung. Jika skor butir yang akan dihitung kontinum, maka untuk menghitung reliabilitas digunakan rumus koefisien alpha (alpha cronbach) sebagai berikut: k α= k 1
si 2 1 2 S t
Keterangan: α
= Koefisien reliabilitas
k
= Banyaknya butir
Si2
= varians skor butir
St2
= varians skor total
Namun, jika skor butir yang akan dihitung dikotomi, maka untuk menghitung reliabilitas digunakan rumus KR-20 (kurder richardson-20) sebagai berikut:
k rkk = k 1
pi qi 1 2 S t
Keterangan: rkk = Koefisien reliabilitas k = Banyaknya butir p = Proporsi jawaban benar q = Proporsi jawaban salah St2 = varians skor total
C. Daya Beda Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang berada pada kelompok atas atau berkemampuan tinggi dengan peserta didik yang berada pada kelompok bawah atau berkemampuan rendah. Gambarannya adalah peserta didik yang berada pada kelompok atas tentu akan lebih mampu menjawab butir tes (pada tingkat kesukaran mudah dan sedang) dibandingkan dengan peserta didik yang berada pada kelompok bawah.
101
Indeks daya pembeda biasanya dinyatakan dengan proporsi. Semakin tinggi proporsi itu, maka semakin baik soal tersebut membedakan antara siswa kelompok atas dengan siswa kelompok bawah. Untuk menguji daya pembeda (DP) ini, Anda perlu menempuh langkah-langkah sebagai berikut : 1. Menghitung jumlah skor total tiap peserta didik. 2. Mengurutkan skor total mulai dari skor terbesar sampai dengan skor terkecil. 3. Menetapkan kelompok atas dan kelompok bawah. Jika jumlah peserta didik banyak (di atas 30) dapat ditetapkan 27 %. Angka 27% merupakan angka diskriminan atau wilayah ektsrim dari sebaran populasi atau sampel. 4. Menghitung rata-rata skor untuk masing-masing kelompok (kelompok atas maupun kelompok bawah). 5. Menghitung daya pembeda soal dengan rumus :
Keterangan : DP = daya pembeda J = jumlah peserta JA = banyaknya peserta kelompok atas JB = banyaknya peserta kelompok bawah BA = banyaknya peserta kelompok atas yang menjawab suatu butir dengan benar BB = banyaknya peserta kelompok bawah yang menjawab suatu butir dengan benar PA = Proporsi kelompok atas menjawab benar PB = Proporsi kelompok bawah menjawab benar
6. Membandingkan daya pembeda dengan kriteria seperti berikut : 0.40 ke atas 0,30 - 0,39 0,20 - 0,29 0,19 ke bawah
= sangat baik = baik = cukup, soal perlu perbaikan = kurang baik, soal harus dibuang
102
D. Tingkat Kesukaran Tingkat kesukaran soal adalah proporsi atau peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasa dinyatakan dengan indeks. Indeks ini biasa dinyatakan dengan proporsi yang besarnya antara 0,00 sampai dengan 1,00. Semakin besar indeks tingkat kesukaran berarti soal tersebut semakin mudah. Soal yang baik adalah soal yang tidak terlalu sukar (sehingga tidak ada yang dapat menjawab dengan benar) atau tidak terlalu mudah (sehingga semua siswa dapat menjawab dengan benar). Soal yang terlalu sukar akan membuat siswa kehabisan waktu yang berujung pada “keputusasaan” dalam mencari jawaban benar dan begitu pun sebaliknya soal yang terlalu mudah akan membuat siswa tidak bergairah dalam mencari jawaban benar. Untuk menghitung tingkat kesukaran soal dapat dilakukan langkahlangkah sebagai berikut : 1. Menghitung rata-rata skor untuk tiap butir soal dengan rumus : ̅ Keterangan : ̅
= rata – rata = Jumlah skor total
n
= banyaknya butir
2. Menghitung tingkat kesukaran dengan rumus :
P = Indeks Kesukaran B = Banyaknya siswa yang menjawab soal tersebut dengan benar JS = jumlah seluruh siswa peserta tes 3. Membandingkan tingkat kesukaran dengan kriteria berikut : 0,00 - 0,30 = sukar 0,31 - 0,70 = sedang 0,71 - 1,00 = mudah
103
4. Membuat penafsiran tingkat kesukaran dengan cara membandingkan koefisien tingkat kesukaran (poin 2) dengan kriteria (poin 3)
E. Fungsi pengecoh (distraktor) Fungsi pengecoh atau distraktor adalah jawaban salah yang memiliki daya tarik tersendiri dalam mengalihkan jawaban. Pengecoh yang tidak dipilih sama sekali oleh testee berarti pengecoh tersebut kurang baik dan cenderung tidak homogen dengan jawaban lain. Sebaliknya, pengecoh yang baik apabila memiliki daya tarik bagi testee sehingga terjadi pengalihan jawaban terutama bagi siswa yang kurang memahami konsep, kurang menguasai bahan atau yang lupa dikarenakan suatu dan lain hal. Walaupun demikian, pengecoh yang baik memiliki batas toleransi pemilih minimal 5 % dan maksimal 40% terpilih 1 dari 3 atau 4 alternatif jawaban salah (jika memiliki alternatif jawaban 5, maka 1 jawaban benar 4 alternatif jawaban salah). Hal ini disebabkan jika pengecoh pada satu alternatif jawaban terlalu banyak dipilih oleh testee, dikhawatirkan kunci jawabannya lah yang salah atau mungkin saja jawaban tersebut merupakan nama lain atau bentuk lain dari jawaban yang benar. Selain pengecoh, dalam istilah dalam evaluasi pembelajaran yang dikenal dengan testee yang tidak memilih jawaban dari 3, 4 atau 5 alternatif jawaban yang diberikan. Testee yang seperti ini dinamakan Omit atau dengan kata lain memilih untuk tidak memilih. Kelompok omit ini tidak dapat diikutsertakan ke dalam perhitungan atau pertimbangan pengecoh, namun dibatasi jumlahnya maksimal 10 % dari peserta dalam satu butir tes. Suatu pengecoh, dapat diperlakukan dengan tiga cara, yaitu: 1. Diterima, karena sudah baik 2. Ditolak, karena tidak baik. 3. Ditulis kembali (direvisi), karena kurang baik Dalam penulisan soal, bisa jadi terjadi kesalahan pengetikan, atau kalimat yang tidak jelas terutama pada bagian pengecoh. Oleh karena itu, apabila masih dapat diperbaiki, sebaiknya diperbaiki atau tidak dibuang.
104
F. Contoh Perhitungan Kualitas Butir Instrumen 1. Validitas a. Skor kontinum Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen tes Fisika (essay) Nomor Butir
Nomor Resp.
Total
1 2 3 4 5 6 7 8 9 10
1
2
3
4
5
6
7
8
9
10
4
5
5
5
5
5
5
4
5
5
4
4
4
4
4
4
2
4
4
4
5
5
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
4
5
5
5
5
5
5
5
5
4
4
5
5
5
5
5
5
5
5
5
5
5
5
4
5
5
4
5
5
4
4
4
4
5
4
4
4
5
5
4
3
4
3
5
5
4
4
5
5
48 38 49 48 47 49 48 48 43 42
Hasil Uji Coba instrumen tes Fisika (essay) Nomor Resp.
1 2 3 4 5 6 7 8 9 10 VALIDITAS
Nomor Butir 1
2
3
4
5
6
7
8
9
10
4
5
5
5
5
5
5
4
5
5
4
4
4
4
4
4
2
4
4
4
5
5
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
4
5
5
5
5
5
5
5
5
4
4
5
5
5
5
5
5
5
5
5
5
5
5
4
5
5
4
5
5
4
4
4
4
5
4
4
4
5
5
4
3
4
3
5
5
4
4
5
5
Total Sebelum
Total Sesudah
48
43
38
34
49
44
48
44
47
42
49
45
48
44
48
43
43
39
42
39
105
44
43
47
46
46
48
45
43
49
49
r-hitung
0,580
0,532
0,930
0,813
0,174
0,781
0,955
0,434
0,757
0,757
r-tabel
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
Status
valid
valid
valid
valid
drop
valid
valid
valid
valid
valid
Kesimpulan Terdapat 9 butir yang valid, artinya butir tersebut layak digunakan untuk mengukur kemampuan Fisika siswa karena terbukti dapat mengukur sesuatu yang semestinya diukur.
b. Skor dikotomis Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen hasil belajar matematika
Nomor Butir
Nomor Resp.
1
2
3
4
5
6
7
8
9
10
A
1
1
1
1
1
1
1
1
1
1
B
0
0
1
1
1
0
0
0
1
0
C
0
0
0
0
1
0
0
0
1
0
D
0
1
1
1
0
1
0
1
0
1
E
1
1
1
1
1
1
1
1
1
1
F
0
1
1
1
1
0
0
0
1
0
Hasil Uji Coba instrumen hasil belajar matematika Nomor Resp.
Nomor Butir
Total Sebelum
Total Sesudah
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
1
1
1
1
1
1
10
7
2
0
0
1
1
1
0
0
0
1
0
4
1
3
0
0
0
0
1
0
0
0
1
0
2
0
4
0
1
1
1
0
1
0
1
0
1
6
5
5
1
1
1
1
1
1
1
1
1
1
10
7
6
0
1
1
1
1
0
0
0
1
0
5
2
VALIDITAS
106
2
4
5
5
5
3
2
3
5
3
r-hitung
0,913
0,755
0,628
0,628
0,025
0,842
0,913
0,842
0,025
0,842
r-tabel
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
Status
valid
valid
valid
valid
drop
valid
valid
valid
drop
valid
Kesimpulan Terdapat 8 butir yang valid, artinya butir tersebut layak digunakan untuk mengukur kemampuan matematika siswa karena terbukti dapat mengukur sesuatu yang semestinya diukur.
2. Reliabilitas a. Skor kontinum Hasil Uji Coba instrumen tes Fisika (essay)
T i
Nomor Resp.
n
1
g
2
k
3
a
4
t
5 6
k
7
o
8
n
9
s
10
i s t
Nomor Butir 1
2
3
4
5
6
7
8
9
10
4
5
5
5
5
5
5
4
5
5
4
4
4
4
4
4
2
4
4
4
5
5
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
5
5
4
5
5
5
4
5
5
4
5
5
5
4
5
5
5
5
5
5
5
5
4
4
5
5
5
5
5
5
5
5
5
5
5
5
4
5
5
4
5
5
4
4
4
4
5
4
4
4
5
5
4
3
4
3
5
5
4
4
5
5
0,456
0,233
0,489
0,267
0,178
0,944
0,233
0,100
0,100
RELIABILITAS k
10
Var. Total
11,567
e Var. Butir
n s
Var. Butir Alpha
3,000 0,823
Total Sebelum
Total Sesudah
48
43
38
34
49
44
48
44
47
42
49
45
48
44
48
43
43
39
42
39
107
Kesimpulan: Tingkat konsistensi dari tes tersebut cukup baik karena koefisien di atas 0,800. Artinya tes tersebut memiliki kemampuan dalam menghasilkan skor yang relatif sama, stabil atau konsisten dalam tiap pengukurannya.
b. Skor dikotomis Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen hasil belajar matematika
Nomor Butir
Nomor Resp.
1
2
3
4
5
6
7
8
9
10
A
1
1
1
1
1
1
1
1
1
1
B
0
0
1
1
1
0
0
0
1
0
C
0
0
0
0
1
0
0
0
1
0
D
0
1
1
1
0
1
0
1
0
1
E
1
1
1
1
1
1
1
1
1
1
F
0
1
1
1
1
0
0
0
1
0
Hasil Uji Coba instrumen hasil belajar Matematika Nomor Resp.
Nomor Butir
Total Sebelum
Total Sesudah
1
10
7
1
0
4
1
0
1
0
2
0
0
1
0
1
6
5
1
1
1
1
1
10
7
0
0
0
1
0
5
2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
1
1
1
1
1
2
0
0
1
1
1
0
0
0
3
0
0
0
0
1
0
0
4
0
1
1
1
0
1
5
1
1
1
1
1
6
0
1
1
1
1
RELIABILITAS k Var. Total
8 9,4667
108
Var. Butir
0,267
Var. Butir
2,0333
Alpha
0,897
0,267
0,167
0,167
0,300
0,267
0,300
0,300
Kesimpulan : Tingkat konsistensi dari tes tersebut cukup baik karena koefisien di atas 0,800. Artinya tes tersebut memiliki kemampuan dalam menghasilkan skor yang relatif sama, stabil atau konsisten dalam tiap pengukurannya.
3. Daya beda, Tingkat kesukaran dan Fungsi pengecoh Contoh perhitungan Daya beda, Tingkat kesukaran dan Fungsi pengecoh Pilihan
A
B
C*
D
E
O
Jumlah
3
5
17
3
2
0
30
7
8
4
6
2
3
30
10
13
21
9
4
3
60
jawaban Kelompok atas Kelompok bawah Jumlah
C = kunci jawaban *Daya beda D = PA - PB D=
=
D = 0,433 *Tingkat kesukaran P=
= 0,35
*Distraktor
109
Semua distraktor sudah berfungsi dengan baik karena sudah dipilih lebih dari 5% testee. Sedangkan dari segi Omit cukup baik, karena terdapat 5% testee yang omit dan tidak lebih dari 40%.