Reliabilitas A. Pengertian Reliabilitas adalah sejauh mana hasil ujian siswa tetap atau konsisten dari prosedur penilaian (Nitko, 2007:66). Menurut Ellen, suatu tes dikatakan reliabel jika skor observasi nilai awal berhubungan dengan skor yang sebenarnya. Sedangkan menurut (Rbel, 1986:71) syarat-syarat yang digunakan untuk menggambarkan salah satu sifat yang paling signifikan dari satu nilai uji dengan cara yang konsisten. Jadi kesimpulannya reliabilitas itu adalah jika skor observasi atau nilai responden (siswa) konsisten (tetap). Reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.. reliabilitas menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan, hasil penilaian siswa sama jika: a.
Siswa menyelesaikan tugas yang sama pada waktu yang berbeda.
b.
Dua atau lebih guru menandai kenerja siswa pada tugas yang sama.
c.
Siswa menyelesaikan tugas yang berbeda pada waktu yang sama atau pada waktu yang berbeda.
B. Karakteristik Reliabilitas Suatu tes dikatakan reliabilitas jika: 1. Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu sendiri, artinya suatu tes dikatakan baik apabila dapat menghasilkan skor yang cukup akurat, apabila tes tersebut diberikan pada kelas tertentu, maka bisa juga menghasilkan skor yang cukup konsisten bila diberikan pada kelas yang berbeda atau ketika diberikan pada kelas yang sama pada waktu yang berbeda. 2. Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak waktu yang berbeda dan menunjukkan skor yang tidak jauh berbeda. 3. Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran independen yang diperoleh dari tes yang sama untuk setiap anggota kelompok.
C. Validitas batas Reliabilitas (Reliability Limit Validity) Reliabilitas yang tinggi tidak menjamin validitasannya tinggi, artinya suatu penilaian yang sangat reliabilitas tidak menjamin bahwa kita membuat interpretasi keputusan validitas yang tinggi.
Reliabilitas 1; diperlukan untuk validitas. Sebuah penilaian reliabilitas mempengaruhi keputusan untuk kualitas (validitas). Seperti contoh: Seorang konselor ingin tahu apakah kemampuan matematika siswa atau kemampuan verbal siswa yang lebih tinggi. Nilai test seorang siswa pada tes kemampuan matematika tidak mungkin identik dengan nilai-nya pada tes kemampuan verbal. Pertanyaan validitasnya adalah, "Apakah skor yang berbeda berarti bahwa siswa benar-benar berbeda dalam kedua kemampuan tersebut?". Untuk konselor yang mengatakan bahwa kemampuan siswa di dalam daerah melebihi untuk daerah lainnya, konselor perlu mengetahui cara banyak skor yang mungkin berbeda dari nilai kemampuan sejati karena hanya kesalahan pengukuran. Jika skor berfluktuasi secara luas, mereka tidak dapat direliabilitaskan. Jika skor tidak reliabel maka, konselor dapat memiliki sedikit keyakinan bahwa perbedaan dalam skor menunjukkan perbedaan dalam kemampuan verbal dan matematika. D. Pengujian Reliabilitas Instrumen a. Uji reliabilitas tes ulang (tes re-tes estimate reliabelity) Hal ini penting ketika kita menafsirkan coefisien tes-tes ulang untuk mengetahui: (a) jangka waktu antara kedua pengambilan penilaian, (b) stabilitas yang diharapkan dari kinerja yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang berulang, semakin rendah tingkat reliabilitasnya. Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi reliabilitas dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas (stability). Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada pemberian tes pertama dengan skor subyek pada pemberian tes kedua.
b. Membuat dua instrument yang ekuivalen Instrument yang ekuivalen adalah pertanyaan yang secara bahasa berbeda, tetapi maksudnya sama. Sebagai contoh (untuk satu butir saja); berapa tahun
pengalaman kerja Anda dilembaga ini?. Pertanyaan tersebut dapat ekuivalen dengan pertanyaan berikut. Tahun berapa Anda mulai bekerja di lembaga ini?. Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda. Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument yang satu dengan data instrument yang dijadikan equivalen. Bila korelasi positif dan signifikan, maka instrument dapat danyatakan reliable.
c. Gabungan (paralel form and alternative form reliability estamete) Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument yang ekuivalen itu beberapa kali, ke responden yang sama. Reliabilitas instrument dilakukan dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada pengujian kedua dan selanjutnya dikorelasikan silang. Jika dengan dua kali pengujian dalam waktu yang berbeda maka akan dapat dianalisis keenam koefesien reliabilitas. Bila keenam koefesien korelasi itu semuanya positif dan signifikan maka dapat dinyatakan bahwa instrument tersebut reliable. Gambar pengujian reliabilitas dengan teknik gabungan Instrument Equivalen Pengujian ke I Skor data instrument pertama
Pengujian ke II
Skor data instrument kedua
Skor data instrument pertama
Skor data instrument pertama
d. Internal Consistensi Pengujian reliabilitas dengan internal consistency, dilakukan dengan cara mencobakan instrument sekali saja, untuk menghindari adanya tes ulang kemudian yang diperoleh dianalisis dengan teknik tertentu (Allen, 1979:78). Hasil analisis dapat diperoleh digunakan untuk memprediksi reliabilitas instrument. Pengujian reliabilitas dapat dilakukan dengan teknik belah dua dari Spearman Brown (Split Half), KR 20, KR 21 dan Alfa Cronbach. Berikut diberikan rumus-rumus dan contoh perhitungannya. 1.
Rumus Spearman Brown:
ri
2rb 1 rb
Dimana: rb = korelasi product moment antara belahan pertama dan kedua (Nitko, 2007:73) Contoh:
2.
KR 20 (Kuder Richardson) 2 k st pi q i ri (k 1) st2
Dimana: K = jumlah item dalam instrument Pi = proporsi banyaknya subyek yang menjawab pada item 1 Qi = 1- pi St2 = varians total
3. KR 21 ri
N t2 N p(1 p ) ( N 1) t2
Dimana: N = jumlah item dalam insrumen
t2 = populasi variansi pada t p = rata-rata setiap item soal sulit
(Allen, 1979:84) Contoh: Apabila data pada table di atas akan diuji reliabilitasnya dengan KR21, maka kita tinggal menghitung rata – rata ri dapat dihitung; ̅=
∑
=
= 5,7
Setelah diperoleh harga ̅ dengan table analisis butir yang sudah ada harga ri
N t2 N p(1 p ) ( N 1) t2
=
1−
, (
, ) ( , )
= 0,357 Ternyata dari harga
(reliabilitas) dari perhitungan KR-21 lebih rendah dari
KR-20. Memang perhitungan reliabilitas dengan menggunakan Kr-20
harga
cenderung memberikan harga yang lebih tinggi, akan tetapi kelemahannya adalah peneliti harus mencari ∑
yang langkah – langkahnya lebih lama dan
membutuhkan ketelitian.
4. Alfa Cronbach Pengujian reliabilitas dengan teknik Alfa Cronbach dilakukan untuk jenis data interval/essay. Rumus koefesien reliabilitas Alfa Cronbach:
ri
2 k si 1 (k 1) s 2
Dimana: K = mean kuadrat antara subyek Si2 = mean kuadrat kesalahan S2 = variansi total (Rbel, 1986:78) Rumus untuk varians total dan varians item: = =
∑ JKi
− −
(∑
)
JKs
Dimana: JKi = jumlah kuadrat seluruh skor item JKs = jumlah kuadrat subjek
DAFTAR PUSTAKA
1. Nitko, Antony J. 2007. Educational assessment of student. 2. Allen. 1979. Introduction to Measurement Theory. California State Collega B. California. 3. Rbel. 1986. Essential ef Educational Measurement. University of lowa