BAB IV KUALITAS INSTRUMEN PENGUKURUAN DALAM PEMBELAJARAN
A. Pendahuluan Suatu alat ukur selayaknya memiliki ketepatan, keakuratan dan konsistensi sesuai dengan apa yang akan diukurnya. Tidak terkecuali alat ukur bidang pendidikan yang banyak mengukur kemampuan, sikap dan keterampilan peserta didik. Alat ukur yang tepat, akurat dan cenderung konsisten merupakan ciri khas sekaligus menandakan kualitas dari suatu alat ukur, sehingga ketika dilakukan suatu pengukuran tidak ada keraguan baik dalam prosesnya maupun hasilnya. Kualitas suatu alat ukur dapat mengindikasikan bahwa alat tersebut memiliki keterandalan dalam mengukur. Seperti halnya tes dan non tes dalam bidang pendidikan kejuruan memiliki kriteria tersendiri sebagai ukuran kualitas dari alat ukur tersebut. Dengan demikian, kualitas alat ukur atau instrumen dalam pembelajaran merupakan hal yang penting agar pendidik dapat memberikan informasi tentang kegiatan pengukurannya dengan tingkat kepercayaan yang tinggi dari para stakeholdersnya. Oleh karena itu, setelah melaksanakan perkuliahan ini, anda diharapkan dapat: 1. Memahami tentang konsep validitas instrumen pembelajaran 2. Memahami tentang konsep reliabilitas instrumen pembelajaran 3. Memahami tentang konsep tingkat kesukaran tes 4. Memahami tentang konsep daya beda tes 5. Dapat menghitung validitas instrumen pembelajaran 6. Dapat menghitung reliabilitas instrumen pembelajaran 7. Dapat menghitung tingkat kesukaran tes 8. Dapat menghitung daya beda tes 9. Menarik kesimpulan tentang kualitas instrumen pembelajaran
B. Validitas Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Djaali :2004). Menurut Zainal (2010) valid, artinya suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa yang hendak diukur secara tepat. Misalnya, alat ukur mata pelajaran 86
87 Fisika, maka alat ukur tersebut harus betul-betul dan hanya mengukur kemampuan peserta didik dalam
mempelajari Fisika, tidak
boleh dicampuradukkan dengan
materi pelajaran yang lain. Suatu alat ukur baik tes maupun non tes dikatakan memiliki validitas, apabila alat tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan apa yang dibutuhkan pada kegiatan pengukuran tersebut. Artinya, hasil ukur dari pengukuran tersebut mengindikasikan besaran dan satuan yang tepat dan sesuai dengan keadaan yang sesungguhnya. Nasution (1996) mengatakan validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu instrumen yang benar-benar dapat mengukur apa yang hendak diukur. “Suatu alat ukur dikatakan valid, jika alat itu mengukur apa yang seharusnya diukur oleh alat itu. Meter itu valid karena mengukur jarak. Demikian pula timbangan valid karena mengukur berat”. Berdasarkan uraian di atas, maka dapat disimpulkan bahwa validitas merupakan tingkat kesesuaian antara alat ukur dengan sesuatu yang akan diukurnya. Validitas dalam kaitannya dengan instrumen tes dan non tes dapat dibagi menjadi 3 macam, yaitu 1. Validitas Isi Validitas isi merupakan kesesuaian alat ukur dengan materi, standar kompetensi dan indikator yang akan diukurnya. Suatu instrumen dapat dikatakan valid secara isi, manakala butir-butirnya merujuk pada hal-hal tersebut di atas. Instrumen yang valid secara isi harus dapat mencerminkan isi yang proporsional dan menyeluruh dari keterwakilan indikator, materi maupun standar kompetensi yang akan diukur. Proporsi yang tepat tidak harus merata, boleh jadi keterwakilannya hanya di satu atau dua butir saja di dalam seperangkat instrumen tersebut.
2. Validitas Konstruk Validitas konstruk merupakan kesesuaian butir-butir instrumen dengan konstruk, konsep khusus atau definisi konseptual yang telah ditetapkan pada suatu instrumen. Validitas konstruk umumnya digunakan pada instrumeninstrumen yang menggunakan konsep baik yang bersifat performance typical maupun performance maximum. Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelahaan teoretis terhadap suatu konsep dari variabel yang hendak diukur, mulai dari perumusan kontruk, penentuan dimensi dan indikator, sampai pada penjabaran dan penulisan butir-butir instrumen. Perumusan konstruk harus
88 dilakukan berdasarkan sintesis dari konsep-konsep dasar tentang variabel tertentu yang hendak diukur melalui proses analisis dan komparasi yang logis. Dimensi dan indikator dijabarkan dari konstruk yang telah dirumuskan dengan memperhatikan hal-hal sebagai berikut: a. Seberapa jauh indikator tersebut merupakan indikator yang tepat dari konstruk yang telah dirumuskan. b. Indikator-indikator dari suatu konstruk harus homogen, konsisten dan konvergen untuk mengukur konstruk dari variabel yang hendak diukur. c. Indikator-indikator tersebut harus lengkap untuk mengukur suatu konstruk secara utuh. Berdasarkan uraian tersebut di atas, dapat disimpulkan bahwasanya validitas konstruk dapat dilakukan melalui penelaahan atau justifikasi pakar atau penilaian kelompok panel yang terdiri dari orang-orang yang menguasai substansi atau konsten dari variabel yang hendak diukur.
3. Validitas struktur Sebuah instrumen tes dapat dikatakan valid jika strukturnya memenuhi syarat-syarat dalam struktur instrumen yang berlaku baik secara umum maupun secara khusus. Validitas struktur yang bersifat umum, pada dasarnya didasarkan adanya steam dan option pada tes jenis obyektif (pilihan ganda, menjodohkan, atau B-S) maupun pertanyaan dan jawaban pada soal isian, melengkapi, maupun essay. Sedangkan validitas struktur yang khusus pada dasarnya disesuaikan atau merujuk pada standarisasi yang dikeluarkan instansi maupun lembaga pendidikan yang terkait dengan pelaksanaan evaluasi pembelajaran. Oleh karena itu, kemungkinan terjadinya variasi dari berbagai lembaga baik secara format, struktur maupun tampilan sangat mungkin terjadi.
4. Validitas Empirik Validitas empiris atau validitas kriteria merupakan validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu yang menjadi kriteria. Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan kriteria eksternal.
89 a. Validitas internal Validitas internal termasuk kelompok validitas kriteria yang merupakan validitas yang diukur dengan besaran yang menggunakan instrumen sebagai satu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu. Dengan begitu, validitas internal mengacu pada validitas butir. Validitas butir yang biasa juga disebut validitas internal diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur instrumen sebagai satu kesatuan. Oleh karena itu, validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total instrumen. Jika koefisien korelasi positif dan signifikan, maka butir tersebut dapat dianggap valid berdasarkan ukuran validitas internal. Apabila besaran koefisien korelasi antara skor butir dengan skor total bernilai positif, makin besar koefisien korelasi maka validitas butir juga makin tinggi. Koefisien korelasi yang tinggi antara skor butir dengan skor total mencerminkan tingginya konsistensi antara hasil ukur keseluruhan instrumen dengan hasil ukur butir instrumen. Untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari instrumen tersebut. Jika skor butir kontinum, maka untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi Product moment (r) sebagai berikut :
r=
n.∑ XY − (∑ X )(∑ Y )
{n.∑ x
2
}{
− (∑ X ) n.∑ y 2 − (∑ Y ) 2
2
}
Keterangan : r
= koefisien korelasi butir soal
X
= Skor pada butir ke-x
Y
= Skor total
Σ x2
= Jumlah kuadrat butir X
Σ y2
= Jumlah kuadrat skor total Jika skor butir dikotomi, maka untuk menghitung koefisien korelasi
antara skor butir dengan skor total instrumen digunakan koefisien korelasi biserial (r bis ) sebagai berikut :
90
r pbi =
Xi − X t St
pi qi
Keterangan: r bis
= koefisien korelasi butir
Xi
= Rata-rata butir ke-i
Xt
= Rata-rata total
pi
= Proporsi jawaban benar
qi
= Proporsi jawaban salah
St2
= varians skor total
b. Validitas eksternal Validitas eksternal merupakan validitas yang diukur berdasarkan kriteria eksternal. Kriteria eksternal dapat berupa hasil ukur instrumen baku atau instrumen yang dianggap baku atau dapat pula hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau variabel yang hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang merupakan hasil perhitungan statistika. Jika menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal dari instrumen yang telah dikembangkan didapat dengan jalan mengkorelasikan skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku yang dijadikan kriteria. Makin tinggi koefisien korelasi yang diapat, maka validitas instrumen yang dikembangkan juga makin baik. Kriteria yang digunakan untuk menguji validitas eksternal adalah nilai tabel r (r tabel product moment). Jika koefisien korelasi skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku lebih besar dari r tabel, maka instrumen yang dikembangkan dapat dianggap valid berdasarkan kriteria eksternal yang dipilih. Jadi keputusan uji validitas dalam hal ini adalah mengenai valid atau tidaknya instrumen sebagai satu kesatuan utuh, bukan valid atau tidaknya butir instrumen seperti pada validitas internal. Ditinjau dari kriteria eksternal yang dipilih, validitas eksternal dapat dibedakan atas dua macam, yaitu validitas prediktif dan validitas kongkruen. Validitas prediktif merupakan validitas yang lebih bersifat melihat hasil ukur saat ini dengan ukuran pembanding atau penampilan pembanding masa
91 yang akan datang. Sedangkan validitas kongkruen merupakan validitas yang membandingkan hasil ukur yang dilakukan secara bersamaan dari kedua alat ukur tersebut. Validitas prediktif umumnya digunakan guru ketika awal tahun akademik/ pelajaran dengan melihat nilai siswa secara keseluruhan. Nilai keseluruhan siswa merupakan dasar prediksi guru untuk mempersiapkan pembelajaran di kelas berikutnya dalam satu semester. Apabila nilai-nilai tersebut dikorelasikan dengan hasil ujian akhir semester dan menghasilkan korelasi yang positif dan signifikan, maka nilai siswa pada kelas sebelumnya dapat dikatakan valid berdasarkan validitas prediktif. Validitas
kongkruen
umumnya
digunakan
guru
pada
saat
membandingkan atau mengkorelasikan antara nilai-nilai harian siswa dengan nilai ujian tengah semester atau ujian akhir semester. Nilai harian merupakan penampilan
(performance)
pembanding
yang
dapat
menjadi
kriteria
kemampuan siswa pada saat yang bersamaan dengan hasil ujian siswa. Apabila nilai-nilai tersebut dikorelasikan dan menghasilkan koefisien yang postif dan signifikan, maka dapat dikatakan valid berdasarkan validitas kongkruen. C. Reliabilitas Reliabilitas berasal dari kata reliable, yang berarti dapat dipercaya. Menurut Nasution (1996) alat ukur yang reliabel adalah bila alat itu digunakan untuk mengukur suatu gejala yang berlainan senantiasa menunjukan hasil yang sama. Sedangkan Djaali mengatakan bahwa reliabilitas berarti sejauhmana hasil suatu pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek belum berubah. Zainal (2010) mengatakan reliabel, artinya suatu alat ukur dapat dikatakan reliabel atau handal jika ia mempunyai hasil yang taat asas. Misalnya, suatu alat ukur diberikan kepada sekelompok peserta didik saat ini, kemudian diberikan lagi kepada sekelompok peserta didik yang sama pada saat yang akan datang, dan ternyata hasilnya sama atau mendekati sama, maka dapat dikatakan alat ukur tersebut mempunyai tingkat reliabilitas yang tinggi. Berdasarkan uraian di atas, maka dapat disimpulkan reliabilitas adalah tingkat konsistensi hasil pengukuran dari sebuah alat ukur yang dikenakan pada suatu subyek/obyek yang dengan memperhatikan perubahan aspek dalam diri subyek/obyek ukur. Artinya, pengukuran akan menghasilkan skor yang relatif sama pada suatu
92 subyek/obyek, selama tidak terjadi perubahan aspek ukur di dalam diri subyek/obyek tersebut. Konsep reliabilitas berkaitan erat dengan konsep error alat ukur dan hasil dari suatu pengukuran. Artinya, sejauh mana tingkat kosnsitensi dalam pengukuran jika dilakukan berulang-ulang terhadap satu subyek yang sama, atau sejauh mana tingkat konsistensi hasil pengukuran yang terkait dengan pengambilan sampel. Sama halnya dengan validitas, dalam perhitungan reliabilitas pada umumnya menggunakan bantuan statistika dalam perhitungannya disesuaikan dengan jenis skor butir yang akan dihitung. Jika skor butir yang akan dihitung kontinum, maka untuk menghitung reliabilitas digunakan rumus koefisien alpha (alpha cronbach) sebagai berikut:
k α= k −1
∑ si 2 1 − 2 S t
Keterangan: α
= Koefisien reliabilitas
k
= Banyaknya butir
Si
2
= varians skor butir
St
2
= varians skor total
Namun, jika skor butir yang akan dihitung dikotomi, maka untuk menghitung reliabilitas digunakan rumus KR-20 (kurder richardson-20) sebagai berikut:
k
r kk = 1 − k −1
∑pq i
St
2
i
Keterangan: r kk = Koefisien reliabilitas k = Banyaknya butir p = Proporsi jawaban benar q = Proporsi jawaban salah S t 2 = varians skor total D. Daya Beda Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang berada pada kelompok atas atau berkemampuan tinggi dengan peserta
93 didik
yang
berada
pada
kelompok
bawah
atau
berkemampuan
rendah.
Gambarannya adalah peserta didik yang berada pada kelompok atas tentu akan lebih mampu menjawab butir tes (pada tingkat kesukaran mudah dan sedang) dibandingkan dengan peserta didik yang berada pada kelompok bawah. Indeks daya pembeda biasanya dinyatakan dengan proporsi. Semakin tinggi proporsi itu, maka semakin baik soal tersebut membedakan antara siswa kelompok atas dengan siswa kelompok bawah. Untuk menguji daya pembeda (DP) ini, Anda perlu menempuh langkah-langkah sebagai berikut : 1. Menghitung jumlah skor total tiap peserta didik. 2. Mengurutkan skor total mulai dari skor terbesar sampai dengan skor terkecil. 3. Menetapkan kelompok atas dan kelompok bawah. Jika jumlah peserta didik banyak (di atas 30) dapat ditetapkan 27 %. Angka 27% merupakan angka diskriminan atau wilayah ektsrim dari sebaran populasi atau sampel. 4. Menghitung rata-rata skor untuk masing-masing kelompok (kelompok atas maupun kelompok bawah). 5. Menghitung daya pembeda soal dengan rumus :
Keterangan : DP = daya pembeda J
= jumlah peserta
J A = banyaknya peserta kelompok atas J B = banyaknya peserta kelompok bawah B A = banyaknya peserta kelompok atas yang menjawab suatu butir dengan benar B B = banyaknya peserta kelompok bawah yang menjawab suatu butir dengan benar P A = Proporsi kelompok atas menjawab benar P B = Proporsi kelompok bawah menjawab benar
94
6. Membandingkan daya pembeda dengan kriteria seperti berikut : 0.40 ke atas
= sangat baik
0,30 - 0,39
= baik
0,20 - 0,29
= cukup, soal perlu perbaikan
0,19 ke bawah
= kurang baik, soal harus dibuang
E. Tingkat Kesukaran Tingkat kesukaran soal adalah proporsi atau peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasa dinyatakan dengan indeks. Indeks ini biasa dinyatakan dengan proporsi yang besarnya antara 0,00 sampai dengan 1,00. Semakin besar indeks tingkat kesukaran berarti soal tersebut semakin mudah. Soal yang baik adalah soal yang tidak terlalu sukar (sehingga tidak ada yang dapat menjawab dengan benar) atau tidak terlalu mudah (sehingga semua siswa dapat menjawab dengan benar). Soal yang terlalu sukar akan membuat siswa kehabisan waktu yang berujung pada “keputusasaan” dalam mencari jawaban benar dan begitu pun sebaliknya soal yang terlalu mudah akan membuat siswa tidak bergairah dalam mencari jawaban benar. Untuk menghitung tingkat kesukaran soal dapat dilakukan langkah-langkah sebagai berikut : 1. Menghitung rata-rata skor untuk tiap butir soal dengan rumus :
Keterangan : = rata-rata = Jumlah skor total n
= banyaknya butir
2. Menghitung tingkat kesukaran dengan rumus :
P = Indeks Kesukaran B = Banyaknya siswa yang menjawab soal tersebut dengan benar JS = jumlah seluruh siswa peserta tes
95 3. Membandingkan tingkat kesukaran dengan kriteria berikut : 0,00 - 0,30 = sukar 0,31 - 0,70 = sedang 0,71 - 1,00 = mudah
4. Membuat penafsiran tingkat kesukaran dengan cara membandingkan koefisien tingkat kesukaran (poin 2) dengan kriteria (poin 3)
F. Fungsi pengecoh (distraktor) Fungsi pengecoh atau distraktor adalah jawaban salah yang memiliki daya tarik tersendiri dalam mengalihkan jawaban. Pengecoh yang tidak dipilih sama sekali oleh peserta tes berarti pengecoh tersebut kurang baik dan cenderung tidak homogen dengan jawaban lain. Sebaliknya, pengecoh yang baik apabila memiliki daya tarik bagi peserta tes sehingga terjadi pengalihan jawaban terutama bagi peserta tes yang kurang memahami konsep, kurang menguasai bahan atau yang lupa dikarenakan suatu dan lain hal. Walaupun demikian, pengecoh yang baik memiliki batas toleransi pemilih minimal 5 % dan maksimal 40% terpilih 1 dari 3 atau 4 alternatif jawaban salah (jika memiliki alternatif jawaban 5, maka 1 jawaban benar 4 alternatif jawaban salah). Hal ini disebabkan jika pengecoh pada satu alternatif jawaban terlalu banyak dipilih oleh peserta tes, dikhawatirkan kunci jawabannya lah yang salah atau mungkin saja jawaban tersebut merupakan nama lain atau bentuk lain dari jawaban yang benar. Selain pengecoh, dalam istilah evaluasi pembelajaran yang dikenal dengan testee yang tidak memilih jawaban dari 3, 4 atau 5 alternatif jawaban yang diberikan. Testee yang seperti ini dinamakan Omit atau dengan kata lain memilih untuk tidak memilih. Kelompok omit ini tidak dapat diikutsertakan ke dalam perhitungan atau pertimbangan pengecoh, namun dibatasi jumlahnya maksimal 10 % dari peserta dalam satu butir tes. Suatu pengecoh, dapat diperlakukan dengan tiga cara, yaitu: 1. Diterima, karena sudah baik 2. Ditolak, karena tidak baik. 3. Ditulis kembali (direvisi), karena kurang baik Dalam penulisan soal, bisa jadi terjadi kesalahan pengetikan, atau kalimat yang tidak jelas terutama pada bagian pengecoh. Oleh karena itu, apabila masih dapat diperbaiki, sebaiknya diperbaiki atau tidak dibuang.
96
G. Contoh Perhitungan Kualitas Butir Instrumen 1. Validitas a. Skor kontinum Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen tes mekanika (essay) Nomor Butir
Nomor
Total
Resp.
1
2
3
4
5
6
7
8
9
10
1
4
5
5
5
5
5
5
4
5
5
48
2
4
4
4
4
4
4
2
4
4
4
38
3
5
5
5
5
5
5
5
4
5
5
49
4
5
4
5
5
4
5
5
5
5
5
48
5
4
5
5
5
4
5
5
4
5
5
47
6
5
4
5
5
5
5
5
5
5
5
49
7
4
4
5
5
5
5
5
5
5
5
48
8
5
5
5
5
4
5
5
4
5
5
48
9
4
4
4
4
5
4
4
4
5
5
43
10
4
3
4
3
5
5
4
4
5
5
42
Hasil Uji Coba instrumen tes mekanika (essay) Nomor Butir
Nomor
Total
Total
Resp.
1
2
3
4
5
6
7
8
9
10
Sebelum
Sesudah
1
4
5
5
5
5
5
5
4
5
5
48
43
2
4
4
4
4
4
4
2
4
4
4
38
34
3
5
5
5
5
5
5
5
4
5
5
49
44
4
5
4
5
5
4
5
5
5
5
5
48
44
5
4
5
5
5
4
5
5
4
5
5
47
42
6
5
4
5
5
5
5
5
5
5
5
49
45
7
4
4
5
5
5
5
5
5
5
5
48
44
8
5
5
5
5
4
5
5
4
5
5
48
43
9
4
4
4
4
5
4
4
4
5
5
43
39
42
39
10
4
3
4
3
5
5
4
4
5
5
44
43
47
46
46
48
45
43
49
49
VALIDITAS
97 rhitung rtabel
0,580
0,532
0,930
0,813
0,174
0,781
0,955
0,434
0,757
0,757
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
0,361
valid
valid
valid
valid
drop
valid
valid
valid
valid
valid
Statu s
Kesimpulan Terdapat 9 butir yang valid, artinya butir tersebut layak digunakan untuk mengukur kemampuan mekanika siswa karena terbukti dapat mengukur sesuatu yang semestinya diukur. b. Skor dikotomis Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen hasil belajar dasar otomotif Nomor Butir
Nomor Resp.
1
2
3
4
5
6
7
8
9
10
A
1
1
1
1
1
1
1
1
1
1
B
0
0
1
1
1
0
0
0
1
0
C
0
0
0
0
1
0
0
0
1
0
D
0
1
1
1
0
1
0
1
0
1
E
1
1
1
1
1
1
1
1
1
1
F
0
1
1
1
1
0
0
0
1
0
Hasil Uji Coba instrumen hasil belajar dasar otomotif Nomor Butir
Total
Total
10
Sebelum
Sesudah
1
1
10
7
0
1
0
4
1
0
0
1
0
2
0
1
0
1
0
1
6
5
1
1
1
1
1
1
10
7
1
1
0
0
0
1
0
5
2
5
5
5
3
2
3
5
3
0,755
0,628
0,628
0,025
0,842
0,913
0,842
0,025
0,842
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
0,500
valid
valid
valid
valid
drop
valid
valid
valid
drop
valid
Nomor Resp.
1
2
3
4
5
6
7
8
9
1
1
1
1
1
1
1
1
1
2
0
0
1
1
1
0
0
3
0
0
0
0
1
0
4
0
1
1
1
0
5
1
1
1
1
6
0
1
1
2
4
r-hitung
0,913
r-tabel Status
VALIDITAS
98
Kesimpulan Terdapat 8 butir yang valid, artinya butir tersebut layak digunakan untuk mengukur kemampuan dasar-dasar otomotif siswa karena terbukti dapat mengukur sesuatu yang semestinya diukur.
2. Reliabilitas a. Skor kontinum Hasil Uji Coba instrumen tes gambar teknik (essay) Nomor Butir
Total
Total
10
Sebelum
Sesudah
5
5
48
43
4
4
4
38
34
5
4
5
5
49
44
5
5
5
5
5
48
44
4
5
5
4
5
5
47
42
5
5
5
5
5
5
5
49
45
5
5
5
5
5
5
5
5
48
44
5
5
5
4
5
5
4
5
5
48
43
4
4
4
4
5
4
4
4
5
5
43
39
4
3
4
3
5
5
4
4
5
5
42
39
0,456
0,233
0,489
0,267
0,178
0,944
0,233
0,100
0,100
Nomor Resp.
1
2
3
4
5
6
7
8
9
1
4
5
5
5
5
5
5
4
2
4
4
4
4
4
4
2
3
5
5
5
5
5
5
4
5
4
5
5
4
5
4
5
5
5
6
5
4
5
7
4
4
8
5
9 10
RELIABILITAS k Var. Total
10 11,567
Var. Butir V ar.
3,000
Butir Alpha
0,823
Kesimpulan: Tingkat konsistensi dari tes tersebut cukup baik karena koefisien di atas 0,800. Artinya tes tersebut memiliki kemampuan dalam menghasilkan skor yang relatif sama, stabil atau konsisten dalam tiap pengukurannya.
99
b. Skor dikotomis Hitunglah validitas dan reliabilitas dari data di bawah ini Hasil Uji Coba instrumen hasil belajar matematika Nomor Butir
Nomor Resp.
1
2
3
4
5
6
7
8
9
10
A
1
1
1
1
1
1
1
1
1
1
B
0
0
1
1
1
0
0
0
1
0
C
0
0
0
0
1
0
0
0
1
0
D
0
1
1
1
0
1
0
1
0
1
E
1
1
1
1
1
1
1
1
1
1
F
0
1
1
1
1
0
0
0
1
0
Hasil Uji Coba instrumen hasil belajar Matematika Nomor Butir
Nomor
Total
Total
Resp.
Sebel
Sesud
1
2
3
4
5
6
7
8
9
10
um
ah
1
1
1
1
1
1
1
1
1
1
1
10
7
2
0
0
1
1
1
0
0
0
1
0
4
1
3
0
0
0
0
1
0
0
0
1
0
2
0
4
0
1
1
1
0
1
0
1
0
1
6
5
5
1
1
1
1
1
1
1
1
1
1
10
7
6
0
1
1
1
1
0
0
0
1
0
5
2
0,267
0,167
0,167
0,300
0,267
0,300
RELIABILITAS k
8
Var. Total
9,4667
Var. Butir
0,267
Va r. Butir Alpha
0,300
2,0333 0,897
Kesimpulan : Tingkat konsistensi dari tes tersebut cukup baik karena koefisien di atas 0,800. Artinya tes tersebut memiliki kemampuan dalam menghasilkan skor yang relatif sama, stabil atau konsisten dalam tiap pengukurannya.
100
3. Daya beda, Tingkat kesukaran dan Fungsi pengecoh Contoh perhitungan Daya beda, Tingkat kesukaran dan Fungsi pengecoh Pilihan
A
B
C*
D
E
O
Jumlah
3
5
17
3
2
0
30
7
8
4
6
2
3
30
10
13
21
9
4
3
60
jawaban Kelompok atas Kelompok bawah Jumlah
C = kunci jawaban *Daya beda D = PA - PB
D=
=
D = 0,433 *Tingkat kesukaran
P=
= 0,35
*Distraktor Semua distraktor sudah berfungsi dengan baik karena sudah dipilih lebih dari 5% testee. Sedangkan dari segi Omit cukup baik, karena terdapat 5% testee yang omit dan tidak lebih dari 40 %.