VALIDITAS DAN RELIABILITAS TES YANG MEMUAT BUTIR DIKOTOMI DAN POLITOMI*) Baso Intang Sappaile**)
Abstract To measure a variable needed by valid instrument and reliabel. Result of measurement a variable very influenced by quality of instrument, measured subjek, and officer doing measurement. In this case becoming especial solution is things and instrument related to instrument. Instrument consist of test and non test, but which is phrased only test. Good test is valid test and reliability, in this case which is studied only internal validity, and item aliance reliability. Meant by item aliance is test loading dichotomy item and politomy. Item validity for the dichotomy of politomy and is successively used by biserial coefficient formula and moment product correlation, is for the reliability of test used by variance analysis or which is recognized with Hoyt formula. Kata Kunci: Validitas, Reliabilitas Tes, Butir Dikotomi, Politomi kan yang termasuk nontes misalnya pedoPENDAHULUAN man wawancara, angket atau kuesioner, Untuk mengukur suatu variabel diperpedoman observasi, daftar cocok (check lukan alat ukur yang biasa disebut instrulist), skala sikap, skala penilaian, dan sebamen. Misalnya, kita ingin mengukur berat gainya. badan, tinggi badan, suhu badan, suhu Weitzenhoffer (dalam Nur, 1987: 1) udara, kelembaban udara, tekanan darah, menyatakan bahwa menyatakan pengukurdenyut jantung, pH, golongan darah, hb, an sebagai suatu operasi yang dilakukan kinerja dokter, pelayanan bidan, kepuasan terhadap alam fisik oleh pengamat. Steven pasien, fasilitas rumah sakit, hasil belajar (dalam Nur, 1987: 1) menyatakan bahwa matematika, sikap seseorang dan lain sebapengukuran adalah pemberian angka atas gainya. objek atau kejadian sesuai dengan aturan. Djaali (2000: 9) menyatakan bahwa Dalam hal pengukuran, khususnya secara umum yang dimaksud dengan dalam ilmu kesehatan tentunya yang terinstrumen adalah suatu alat yang karena penting adalah informasi hasil ukur yang memenuhi persyaratan akademis maka benar. Sebab dengan hasil ukur yang tidak dapat dipergunakan sebagai alat untuk atau kurang tepat maka akan berdampak mengukur suatu obyek ukur atau mengumnegatif terhadap subjek (pasien) yang akan pulkan data mengenai suatu variabel. diberikan tindakan. Misalnya seorang Selanjutnya, dikatakan bahwa pada dasarpasien yang membutuhkan golongan darah nya instrumen dapat dibagi menjadi dua B, karena petugas Palang Merah salah macam, yakni tes dan non-tes. Yang termamengukur jenis darah pasien yang sesungsuk kelompok tes, misalnya tes prestasi guhnya, sehingga diberi darah dengan belajar, tes inteligensi, tes bakat; sedang*)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
1
golongan bukan golongan darah B, akibatnya berdampak negatif terhadap pasien tersebut. Hasil pengukuran dipengaruhi oleh (1) alat ukur (instrumen), (2) subjek yang diukur, dan (3) petugas yang melakukan pengukuran. Dengan menitikberatkan pada alat ukurnya, maka dalam pembahasan ini hanya pengukuran pada ranah kognitif, yaitu tes. Azwar (1987: 3) menyatakan bahwa tes adalah prosedur yang sistematis, maksudnya (a) butir-butir dalam tes disusun menurut cara dan aturan tertentu, (b) prosedur administrasi tes dan pemberian angka (scoring) terhadap hasilnya harus jelas dan dispesifikasi secara terperinci, dan (c) setiap orang yang mengambil tes itu harus mendapat butirbutir yang sama dalam kondisi yang sebanding. Relatif sama dengan pendapat Silvirius (1991: 5) yang menyatakan bahwa tes adalah suatu prosedur sisternatis untuk mengamati dan mencandrakan satu atau lebih karakteristik seseorang dengan menggunakan skala numerik atau sistem kategori. Pertanyaan apakah suatu alat ukur benar-benar mengukur apa yang hendak dan seharusnya diukur serta sejauh mana alat ukur tersebut dapat diandalkan dan berguna, sebenarnya menunjuk pada dua hal yang pokok, yaitu validitas dan reliabilitas (Arifin: 109). Nurkancana (1992: 141) menyatakan bahwa suatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. VALIDITAS Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan *)
kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Sudjana (2004: 149) menyatakan bahwa analisis validitas bertujuan mengkaji kesahihan alat ukur atau soal dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal tes sebagai alat ukur. Djaali (2000: 70) menyatakan bahwa konsep validitas tes dapat dibedakan atas tiga macam yaitu validitas isi, validitas konstruk, dan validitas empiris. Selanjutnya dinyatakan bahwa validitas empiris terbagi dua, yaitu validitas internal dan validitas eksternal.Dalam tulisan ini yang dibahas hanya validitas internal. Validitas Internal Djaali (2000: 76) menyatakan bahwa validitas internal termasuk kelompok validitas kriteria yang merupakan validitas yang diukur dengan besaran yang menggunakan tes sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria. Dengan demikian validitas internal mempermasalahkan validitas butir dengan menggunakan hasil ukur tes tersebut sebagai suatu kesatuan sebagai kriteria, sehingga biasa juga disebut validitas butir. Selanjutnya dinyatakan bahwa validitas butir (validitas internal) diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur tes secara keseluruhan. Oleh karena itu validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total tes. Jika koefisien
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
3
korelasi antara skor butir dengan skor total tes positif dan signifikan maka butir tersebut valid berdasarkan ukuran validitas internal. Untuk menentukan koefisien korelasi (skor butir dikotomi) antara skor butir dengan skor total tes digunakan koefisien korelasi biserial (rbis) dengan rumus:
rbis i
Xi
Xt st
pi (Djaali, 2000: qi
77) Keterangan: rbis i = koefisien korelasi biserial antara skor butir soal nomor i dengan skor total. X i = rata-rata skor total responden yang menjawab benar butir soal nomor i. X t = rata-rata skor total semua responden. st = standar deviasi skor total semua responden. pi = proporsi jawaban yang benar untuk butir soal nomor i. qi = proporsi jawaban yang salah untuk butir soal nomor i. Sedang untuk menentukan koefisien korelasi (skor butir kontinum) antara skor butir dengan skor total tes digunakan koefisien korelasi product moment (r) dengan rumus: xi x t (Djaali, 2000: 77) rit 2 2 xi xt Keterangan: rit = koefisien korelasi antara skor butir soal dengan skor total. 2 x i = jumlah kuadrat deviasi skor dari Xi. 2 x t = jumlah kuadrat deviasi skor dari Xt. *)
Koefisien korelasi yang didapat untuk masing-masing butir dibandingkan dengan koefisien korelasi yang ada pada tabel-r dengan alpha tertentu, misalnya = 0,05. Jika koefisien korelasi antara skor butir dengan skor total tes > rtabel maka butir tersebut valid berdasarkan ukuran validitas internal. RELIABILITAS Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut tentang seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau dengan tes yang ekivalen. Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam, yaitu reliabilitas konsistensi tanggapan, dan reliabilitas konsistensi gabungan item. Dalam tulisan ini yang dibahas hanya reliabilitas konsistensi gabungan item. Reliabilitas konsistensi gabungan item Djaali (2000: 81) menyatakan bahwa reliabilitas konsistensi gabungan item berkaitan dengan kemantapan antara itemitem suatu tes. Hal ini dapat diungkapkan dengan pertanyaan, apakah terhadap obyek ukur yang sama, item yang satu menunjukkan hasil ukur yang sama dengan item yang lainnya? Dengan kata lain bahwa terhadap bagian obyek ukur yang sama, apakah hasil ukur item yang satu tidak kontradiksi dengan hasil ukur item yang lain. Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
4
diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama. (Djaali, 2000: 86) menyatakan bahwa koefisien reliabilitas konsistensi gabungan item (butir diskor dikotomi dan sebagian butir diskor politomi) dapat dihitung dengan menggunakan rumus analisis varian. Selanjutnya Azwar (2003 :90-91) menyatakan bahwa salah satu teknik analisis varian yang sangat populer adalah reliabilitas Hoyt dengan rumus:
rxx1
MK ixs MK s
1
i2 MK
X2 k
ixs
CONTOH PERHITUNGAN VALIDITAS DAN RELIABILITAS TES YANG DISKOR DIKOTOMI DAN BUTIR LAINNYA DISKOR POLITOMI Data hasil uji coba 8 (delapan) butir soal dengan 5 (lima) butir pertama diskor dikotomi dan 3 (tiga) butir berikutnya diskor politomi kepada 10 (sepuluh) responden, disajikan pada tabel-1 berikut. Tabel 1. Data hasil uji coba Nomor Butir No. Resp 1 1
2 1
3 1
4 0
5 0
6 5
7 4
8 3
2
1
0
1
1
1
5
4
3
3
0
1
1
0
0
4
4
2
1
0
0
0
0
4
3
3
5
0
0
0
0
0
5
5
3
6
1
1
1
1
1
3
3
2
7
1
1
1
1
1
3
3
2
0
0
0
0
0
3
2
2
1
0
0
1
0
2
2
1
1
1
1
1
0
2
1
1
1
4
Y2
n n 1k 1
i2 nk
8 9 10
X2 MKs
k
n 1
2 i nk
Keterangan: rxx’ = Reliabilitas. i = Skor item. X = Jumlah skor subjek pada seluruh item. Y = Jumlah skor seluruh subjek pada satu item. k = Banyaknya item. n = Banyaknya subjek. MKixs = Mean kuadrat interaksi item x subjek MKs = Mean kuadrat antar subjek
1. PerhitunganValiditas Butir Dikotomi Tabel 2. Skor butir dikotomi No. Resp 1 2 3 4 5 6 7 8 9 10
1 1 1 0 1 0 1 1 0 1 1 7
Nomor Butir 3 1 1 1 0 0 1 1 0 0 1 6
2 1 0 1 0 0 1 1 0 0 1 5
4 0 1 0 0 0 1 1 0 1 1 5
5 0 1 0 0 0 1 1 0 0 0 3
Xi 3 4 2 1 0 5 5 0 2 4 26
Berdasarkan tabel-2 dan menggunakan rumus rbis i
Xi
Xt st
pi , qi
diperoleh: *)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
5
Xt =
26 10
Xi
st =
Berdasarkan tabel-3 dan menggunakan xi x t rumus rit (Djaali, 2000: 2 2 xi xt
2,6
X
2
n (3 2,6) 2
st =
32,4 10
st =
(4 2,6) 2 10
77), maka diperoleh: X t = 89
... (4 2,6)2
2
X t = 122 122 ... 4 2 = 875
= 1,9
xt =
Untuk butir-1, X1 =
p1 =
3
4 1 5 5 2 7
7 10
4
24 7
=
0,7
rbi s 1
X1
Xt st
2
x t = 875 – 792,1 = 82,9
pi qi
3,43 2,6 1,9
Untuk butir-2, Untuk butir-3, Untuk butir-4, Untuk butir-5,
n
89 2 10
2
x t = 875 -
q1 = 1 – p1 = 1 – 0,7 = 0,3. rbi s i
Xt -
3,43
2
Xt
2
2
Untuk butir-6.
0,7 = 0,70 0,3
X6
rbis 2
0,67
X6 Xt
rbis 3
0,84
rbis 4
0,78
rbis 5
0,75
X6
36
2
352 142
x6xt
X6
X6 Xt
n
2. PerhitunganValiditas Butir Politomi Tabel 3. Skor butir politomi Nomor Butir No. Resp.
Xt
X6Xt
x6xt X62
6 5
7 4
8 3
12
60
25
5
4
3
12
4 3
2 3
10 10
25 16
4
4 4
60 40 40
16
5
5
5
3
13
65
25
6
3
3
2
8
24
9
7
3
3
2
8
24
9
8
3
2
2
7
21
9
9
2
2
1
5
10
4
10
2
1
1
4
8
4
36
31
22
89
352
142
1 2 3
36x89 10
352
x6
2
x6
2
X6
31,6 2
n
36 2 10
12,4
x6xt
r6t x6 r6t
X6
2
142
Xt
2
31,6 12,4 82,9
xt
2
0,99
Hasil ini menunjukkan bahwa koefisien korelasi skor butir-6 dengan skor total *)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
6
tes sama dengan 0,99. Dengan jalan yang sama diperoleh koefisien korelasi butir-7: r7t 0,95 dan butir-8: r8t 0,94 . Rekapitulasi koefisien korelasi skor semua butir, dinyatakan pada tabel-4 berikut. Tabel 4. Rekapitulasi koefisien korelasi butir No. Butir 1. 2. 3. 4. 5. 6. 7. 8.
Koefisien Korelasi 0,70 0,67 0,84 0,78 0,75 0,99 0,95 0,94
Nilai Tabel 0,631 0,631 0,631 0,631 0,631 0,631 0,631 0,631
Y2
49
Untuk n = 10 dengan alpha 0,05 terdapat nilai tabel-r = 0,631. Dalam tabel4 menunjukkan semua butir (10 butir) mempunyai koefisien korelasi yang lebih besar dari 0,631, sehingga dapat dinyatakan bahwa semua butir valid. 4. Perhitungan Reliabilitas Konsistensi Gabungan Butir Tabel 5. Skor butir dikotomi dan politomi
36
25
9
1296
961
484
Berdasarkan tabel-5, maka diperoleh i = X = Y = 115 ( i2) = (115)2 = 13.225 i2 = (12 + 12 + 02 +...+ 22 + 12 + 12) = 331 2 X = (152+162+...+72+82) = 1.415 Y2 = (72 + 52 + ...+ 312 + 222) = 2.885
Status Valid Valid Valid Valid Valid Valid Valid Valid
25
i2 MK
k
ixs
331 MK
X2
ixs
1415 8
Y2
n n 1k 1
i2 nk
2885 13225 10 80 9x7
= 30,9375
63 = 0,4911 X2 MK s
MK s
k
i2 nk
n 1
1415 13225 8 80 9
= 11,5625 9 = 1,2847
Nomor Butir X
X2
3
15
225
4
3
16
256
4
2
12
144
4
3
3
11
121
5
5
3
13
169
1
3
3
2
13
169
1
3
3
2
13
169
0
0
3
2
2
7
49
No. Resp.
1
2
3
4
5
6
7
8
1
1
1
1
0
0
5
4
2
1
0
1
1
1
5
3
0
1
1
0
0
4
4
1
0
0
0
0
5
0
0
0
0
0
6
1
1
1
1
7
1
1
1
1
8
0
0
0
9
1
0
0
1
0
2
2
1
7
49
10
1
1
1
1
0
2
1
1
8
64
Y
7
5
6
5
3
36
31
22
115
1415
0,4911 r 1 xx' 1,2847
0,62
Koefisien reliabilitas = 0,98 dapat diartikan bahwa: (1) 98% varians skor teramati diakibatkan oleh varians skor sejati kelompok individu, (2) korelasi antara skor teramati dan skor sejati sama dengan 0,98 atau 0,99 (Nur, 1987: 61).
KESIMPULAN *)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 **) Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
7
Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang diukur sehingga betul-betul menilai apa yang seharusnya diukur. Validitas bertujuan mengkaji kesahihan alat ukur atau soal dalam menilai apa yang seharusnya diukur atau mengkaji ketepatan soal tes sebagai alat ukur. Validitas empiris yang berarti bahwa validitas ditentukan berdasarkan kriteria, dalam hal ini kriteria internal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria. Mekanisme untuk mengetahui validitas butir yang diskor dikotomi dilakukan dengan menggunakan koefisien biserial (r-bis), sedang mekanisme untuk mengetahui validitas butir yang diskor politomi dilakukan dengan menggunakan product moment (rxy) . Reliabilitas mempermasalahkan sejauh mana hasil suatu pengukuran dapat
dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama dan diperoleh hasil pengukuran yang relatif sama. Reliabilitas konsistensi gabungan butir berkaitan dengan kemantapan antara butir-butir suatu tes. Hal ini dapat diungkapkan bahwa dengan obyek ukur yang sama, butir yang satu menunjukkan hasil ukur yang sama dengan butir yang lainnya. Mekanisme untuk mengetahui reliabilitas konsistensi gabungan butir yang diskor dikotomi dan diskor politomi dilakukan dengan menggunakan tes itu sendiri sebagai kriteria dengan digunakan rumus Hoyt atau analisis varian.[*]
DAFTAR PUSTAKA Arifin, Zainal. (1991). Evaluasi Instruksional, Prinsip-Teknik-Prosedu., Bandung: Remaja Rosdakarya. Azwar, Saifudidin. (2003). Sikap Manusia Terori dan Pengukurannya. Yokyakarta: Pustaka Pelajar. -------. (2003). Penyusunan Skala Psikologi. Yokyakarta: Pustaka Pelajar. -------. (1996). Tes Prestasi. Yokyakarta: Pustaka Pelajar. Djaali., dkk. (2000). Pengukuran Dalam Pendidikan. Jakarta: Program Pascasarjana. Nur, Mohamad. (1987). Teori Tes. Surabaya: IKIP Surabaya. Silverius, Suke (1991). Evaluasi Hasil Belajar dan Umpan Balik. Jakarta: Gramedia Widiasarana Indonesia. Sudjana, Nana (2004). Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya. Suryabrata, Sumadi. (2004). Pengembangan Alat Ukur Psikologis. Yokyakarta: Andi. *)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
8
Nurkancana, Wayan., Sunartana. (1992). Evaluasi Hasil Belajar. Surabaya: Usaha Nasional.
*)
Jurnal Ilmu Pendidikan (Parameter), Nomor 24, Tahun XXII, Desember 2005 Baso Intang Sappaile, M.Pd., Dr., Dosen Matematika FMIPA UNM Makassar
**)
9