Analisis Kualitas Tes ‘Ulangan Akhir Semester Mata Pelajaran Bahasa Indonesia MTs/SMP Islam Kota Malang 1 Mukaromah2 Sri Wahyuni
ABSTRAK Agar tes dapat memberikan informasi yang dapat dipertanggungjawabkan, alat tes itu sendiri juga harus dapat dipertimbangkan sebagai alat penilaian yang baik, yang antara lain dapat dilihat dari validitas dan reliabilitas tes. Tujuan penelitian ini adalah untuk memperoleh deskripsi objektif tentang validitas dan reliabilitas tes Ulangan Akhir Semester mata pelajaran Bahasa Indonesia MTs/SMP Islam Kota Malang. Pendekatan yang digunakan dalam penelitian ini adalah kuantitatif, dengan rancangan penelitian deskriptif korelasional. Data berbentuk skor tes yang diperoleh dengan teknik dokumentasi. Pengolahan data dilakukan dengan teknik statistik deskriptif dan korelasional. Untuk menganalisis validitas tes, digunakan analisis validitas sejalan, sedangkan untuk menganalisis reliabilitas digunakan reliabillitas internal K-R 21. Hasil penelitian menunjukkan, (1) dilihat dari sisi validitas, tes yang memiliki validitas tinggi 25%, yang memiliki validitas cukup 50%, dan tidak valid 25%; (2) dilihat dari sisi reliabilitas tes, tes yang memiliki reliabilitas tinggi sebesar 37%, yang memiliki reliabilitas cukup 25%, yang memiliki validitas rendah 13%, dan yang tidak reliabel 25%. Kata-kata kunci: kualitas tes, UAS, bahasa Indonesia
1
Penelitian ini didanai Proyek I-MHIRE Unisma melalui program RESEARCH GRANT PDM
2
Dra. Mukaromah, M.Pd dan Dra. Sri Wahyuni M.Pd adalah dosen FKIP Unisma
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
30
PENDAHULUAN Tes merupakan salah satu alat dan kegiatan dalam evaluasi. Evaluasi dapat digambarkan sebagai pengumpulan informasi yang sistematis untuk kepentingan pembuatan keputusan (Bachman, 1990:22). Dari pengertian ini, evaluasi mengarah pada suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu. Termasuk dalam proses tersebut adalah kegiatan perencanaan mengenai apa yang akan dievaluasi, pengumpulan data, pengolahan data, dan berdasarkan informasi tersebut baru guru memberikan nilai dan arti terhadap sesuatu. Menurut Grounlund (1985: 5-6), evaluasi merupakan proses pengumpulan, penganalisisan, dan penafsiran informasi secara sistematik untuk menentukan sejauh mana siswa telah menguasai tujuan pembelajaran yang telah ditetapkan. Dari pengertian ini, dalam evaluasi mengandung dua aspek yang penting, yaitu: (1) dalam evaluasi terdapat implikasi suatu proses yang sistematik yang berarti mengabaikan observasi yang dilakukan dengan tak terkendali atau dilakukan dengan sepintas lalu saja, dan (2) evaluasi selalu berasumsi bahwa tujuan pembelajaran telah dibuat terlebih dahulu; tanpa tujuan pembelajaran sangatlah sukar untuk menilai seberapa jauh siswa telah belajar. Dalam hubungannya dengan pembelajaran Bahasa Indonesia, ‘evaluasi’ adalah suatu kegiatan terencana, sistematik, dan terarah berdasarkan atas tujuan yang jelas; untuk mengetahui keadaan dan hasil pembelajaran bahasa Indonesia; dengan menggunakan alat ukur dan hasilnya dibandingkan dengan tolak ukur/kriteria norma untuk memperoleh keputusan-keputusan/kesimpulankesimpulan. Menurut Bull (2000), data evaluasi harus dikumpulkan dari berbagai sumber untuk memperoleh gambaran yang berimbang tentang aktivitas. Evaluasi harus berkenaan dengan produk
(outcomes) dan proses. Data tersebut bisa dikumpulkan sebelum, selama, dan setelah kegiatan pembelajaran. Tes merupakan salah satu alat dan kegiatan dalam evaluasi. Carrol (dalam Bachman, 1990:20) mendefinisikan tes sebagai suatu prosedur yang dirancang untuk menimbulkan perilaku tertentu dari seseorang, yang dapat menyimpulkan tentang karakteristik tertentu dari individu. Tes adalah alat, prosedur, atau rangkaian kegiatan yang digunakan untuk memperoleh contoh tingkah laku seseorang yang memberikan gambaran tentang kemampuannya dalam suatu bidang ajaran tertentu. Tes Bahasa Indonesia meliputi tes kompetensi bahasa Indonesia dan tes keterampilan berbahasa Indonesia. Kompetensi berbahasa mengacu kepada kemampuan yang bersifat abstrak, berupa potensi yang dimiliki seorang pemakai bahasa. Keterampilan berbahasa mengacu pada penggunaan bahasa senyatanya dalam bentuk lisan yang dapat didengar atau dalam bentuk tertulis yang dapat dibaca. Tes sebagai alat pengukur hasil belajar siswa, diharapkan mampu memberikan informasi yang dapat dipertanggungjawabkan kebenarannya. Artinya, alat tes dapat memberi informasi tentang siswa sesuai dengan keadaan yang sesungguhnya. Hal itu penting karena informasi tersebut akan dipergunakan untuk mempertimbangkan dan kemudian memutuskan berbagai kebijaksanaan baik yang berkenaan dengan siswa maupun kegiatan pengajaran secara umum. Agar tes dapat memberikan informasi yang dapat dipertanggung jawabkan, alat tes itu sendiri juga harus dapat dipertimbangkan sebagai alat penilaian yang baik. Untuk keperluan itu, dibutuhkan informasi apakah alat tes yang telah disusun itu telah memenuhi kualitas tes yang baik. Kualitas alat ukur khususnya tes, dapat dilihat dari beberapa aspek, antara lain jenis dan bentuk tes yang digunakan, cara penyusunan butir tes, alat
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
31
tes tersebut harus dapat dipertanggungjawabkan dari segi kesahihan (validity), keterpercayaan (reliability), tidak terlalu mudah dan tidak terlalu sulit, memiliki daya pembeda, dan syarat-syarat lain. Berkaitan dengan hal tersebut, dalam penelitian ini akan ditelaah kualitas tes khususnya tes ulangan akhir semester yang disusun sekolah khususnya MTs/SMP Islam yang ada di kota Malang. Sejalan dengan latar belakang yang telah dipaparkan di atas, maka tujuan yang hendak dicapai penelitian ini adalah untuk memperoleh deskripsi objektif tentang kualitas tes ‘Ulangan Akhir Semester’ Matapelajaran Bahasa Indonesia di MTs/SMP Islam di Kota Malang semester genap Tahun Pelajaran 2006/2007. Sedangkan secara khusus, tujuan yang ingin dicapai melalui penelitian ini adalah: (1) mendeskripsikan validitas tes yang digunakan dalam ‘ulangan umum semester’ Matapelajaran Bahasa dan Sastra Indonesia di MTs/SMP Islam kota/Kabupaten Malang semester genap Tahun Pelajaran 2006/2007 dan (2) mendeskripsikan reliabilitas tes yang digunakan dalam ‘ulangan akhir semester’ Matapelajaran Bahasa Indonesia di MTs/SMP Islam di Kota Malang semester genap Tahun Pelajaran 2006/2007.
METODE Pendekatan yang digunakan dalam penelitian ini adalah kuantitatif, dengan rancangan penelitian deskriptif korelasional. Hal ini didasarkan data yang dikumpulkan diperoleh dengan menggunakan alat ukur. Hasil pengukuran diwujudkan dalam bentuk angka-angka atau skor. Analisis data dilakukan dengan menggunakan teknik statistik, baik yang bersifat satu variabel maupun dua variabel. Data penelitian ini berupa skor ulangan akhir semester genap 2006/2007 di tingkat MTs/SMP Islam Kota Malang. Sebagai sampel penelitian ini diambil
delapan skor ulangan akhir semester di sejumlah MTs/SMP Islam Kota Malang. Skor tes sebagai data penelitian diperoleh dengan metode dokumentasi yaitu dokumen guru berupa skor ulangan akhir semester mata pelajaran bahasa Indonesia di sejumlah MTs/SMP Islam di Kota Malang pada semester genap Tahun Pelajaran 2006/2007. Pengolahan data dilakukan dengan teknik statistik, terutama teknik statistik deskriptif korelasional. Untuk menganalisis validitas tes, digunakan analisis validitas sejalan untuk mencari hubungan, apakah tingkat kemampuan seorang pada suatu bidang yang diteskan mencerminkan atau sesuai dengan skor bidang yang lain yang mempunyai persamaan karakteristik. Dalam hal ini, skor tes akan dikorelasikan dengan skor rata-rata ulangan harian. Tinggi rendahnya koefisien korelasi yang diperoleh dari penghitungan tersebut akan menentukan tinggi rendahnya tingkat validitas sejalan tes yang diuji. Rumus untuk mencari validitas sejalan dengan korelasi Product Moment:
rXY
N XY ( X )(Y )
{N X 2 ( X ) 2 }{N Y 2 (Y ) 2 }
Untuk menganalisis reliabilitas tes, digunakan analisis reliabilitas rumus K-R 21. Rumus ini dilakukan cukup dengan mengetahui skor total dan varians dari skor total tersebut (SD2 dari skor total); jumlah butir soal dan mean skornya. Rumus K-R 21: k M (k M ) r11 1 kSDt2 k 1
r 11 = reliabilitas tes k = banyaknya butir pertanyaan (soal) M = mean skor (skor total dibagi N)
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
32
Sebagai dasar penentuan tingkat validitas dan reliabilitas, digunakan tabel berikut ini. r hitung
Interpretasi
0.00 r 0.20
Tidak ada korelasi (tidak valid/tidak reliable)
0.20 r 0.40
Ada korelasi yang lemah atau rendah (valid/reliabel pada tingkatan rendah)
0.40 r 0.70
Ada korelasi yang sedang atau cukup. (valid/reliabel pada tingkatan cukup)
0.70 r 0.90
Ada korelasi yang kuat atau tinggi (valid/reliabel pada tingkatan tinggi)
0.90 r 1.00
tinggi skor UAS akan semakin tinggi pula skor ulangan harian, demikian pula sebaliknya. Kesimpulan: tes UAS tersebut Valid (memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut memiliki korelasi sedang atau cukup dengan tes lain yang sama karakteristiknya (dalam hal ini digunakan tes ulangan harian).
Ada korelasi yang sangat kuat atau sangat tinggi (valid/reliabel pada tingkatan sangat tinggi).
PEMBAHASAN HASIL PENELITIAN Uji Validitas Tes Uji validitas yang dilakukan dalam penelitian ini adalah uji validitas sejalan (Concurrent Validity). Validitas sejalan atau validitas sama saat menunjuk pada pengertian apakah tingkat siswa dalam bidang yang diteskan mencerminkan atau sesuai dengan skor tes lain yang mempunyai persamaan karakteristik. Validitas sejalan diuji dengan mengorelasikan antara hasil tes yang diuji dengan hasil tes bidang lain yang sekarakteristik. Tinggi rendahnya koefisien korelasi yang diperoleh dari penghitungan tersebut akan menentukan tinggi rendahnya tingkat validitas sejalan tes yang diuji. Hasil uji validitas sejalan yang telah dilakukan pada kedelapan tes adalah sebagai berikut. Hasil Analisis Uji Validits Tes UAS 1 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS dengan skor ulangan harian r = 0.669 dengan taraf signifikansi = 0.000. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.669 > 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi sedang atau cukup dengan ulangan harian. Jadi, semakin
Hasil Analisis Uji Validits Tes UAS 2 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 2 dengan skor ulangan harian r = 0.703 dengan taraf signifikansi = 0.000. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS 2 dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.669 > 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi kuat dengan ulangan harian. Jadi, semakin tinggi skor UAS 2 akan semakin tinggi pula skor ulangan harian, demikian pula sebaliknya. Kesimpulan: tes UAS tersebut valid (memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut memiliki korelasi kuat dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 3 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 3 dengan skor ulangan harian r = 0.787 dengan taraf signifikansi = 0.000. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.787 > 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi kuat dengan ulangan harian. Jadi, semakin tinggi skor UAS 3 akan semakin tinggi pula skor ulangan harian, emikian pula sebaliknya. Kesimpulan: tes UAS tersebut Valid (memiliki validitas sejalan). Hal ini terjadi karena tes UAS tersebut memiliki korelasi kuat dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 4
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
33
Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 4 dengan skor ulangan harian r = 0.249 dengan taraf signifikansi = 0.156. Dengan demikian dapat disimpulkan, tidak terdapat korelasi antara skor UAS 4dengan skor ulangan harian karena p > 0.01. Dengan melihat besar korelasi r = 0.249 < 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi rendah (dan dianggap tidak berkorelasi) dengan ulangan harian. Kesimpulan: tes UAS tersebut tidak valid (tidak memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut tidak memiliki korelasi dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 5 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 5 dengan skor ulangan harian r = 0.096 dengan taraf signifikansi = 0.547. Dengan demikian dapat disimpulkan, tidak terdapat korelasi antara skor UAS 5 dengan skor ulangan harian karena p > 0.01. Dengan melihat besar korelasi r = 0.096 < 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester tidak berkorelasi dengan ulangan harian. Kesimpulan: tes UAS tersebut tidak valid (tidak memiliki validitas sejalan). Hal ini terjadi karena tes UAS tersebut tidak memiliki korelasi dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 6 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UA6 dengan skor ulangan harian r = 0.429 dengan taraf signifikansi = 0.003. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS 6 dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.429 > 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi sedang atau cukup dengan ulangan harian. Jadi, semakin tinggi skor UAS akan semakin tinggi pula skor ulangan harian, demikian pula sebaliknya. Kesimpulan: tes UAS tersebut
Valid (memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut memiliki korelasi sedang atau cukup dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 7 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 7 dengan skor ulangan harian r = 0.475 dengan taraf signifikansi = 0.000. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS 7 dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.475> 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi sedang atau cukup dengan ulangan harian. Jadi, semakin tinggi skor UAS akan semakin tinggi pula skor ulangan harian, demikian pula sebaliknya. Kesimpulan: tes UAS tersebut Valid (memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut memiliki korelasi sedang atau cukup dengan tes ulangan harian. Hasil Analisis Uji Validits Tes UAS 8 Berdasarkan hasil analisis diketahui, bahwa koefisien korelasi antara skor UAS 8 dengan skor ulangan harian r = 0.508 dengan taraf signifikansi = 0.000. Dengan demikian dapat disimpulkan, bahwa terdapat korelasi positif dan signifikan antara skor UAS 8 dengan skor ulangan harian karena p 0.01. Dengan melihat besar korelasi r = 0.508 > 0.5 maka dapat disimpulkan pula bahwa ulangan akhir semester berkorelasi sedang atau cukup dengan ulangan harian. Jadi, semakin tinggi skor UAS akan semakin tinggi pula skor ulangan harian, demikian pula sebaliknya. Kesimpulan: tes UAS tersebut Valid (memiliki validitas sejalan).Hal ini terjadi karena tes UAS tersebut memiliki korelasi sedang atau cukup dengan tes ulangan harian. Uji Reliabilitas Uji reliabilitas yang digunakan dalam penelitian ini adalah uji
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
34
homogenitas dengan rumus K-R 21. Rumus ini dilakukan cukup dengan mengetahui skor total dan varians dari skor total tersebut (SD2 dari skor total); jumlah butir soal dan mean skornya. Rumus K-R 21 yang digunakan adalah sebagai berikut: k M (k M ) r11 1 kSDt2 k 1
r 11 = reliabilitas tes k = banyaknya butir pertanyaan (soal) M = mean skor (skor total dibagi N) Hasil Uji Analisis Relibilitas Tes UAS 1 Dengan: k = 100, M = 75.70, dan SDt2 = 119.405; pada UAS 1 ini detemukan r statistik K-R 21 = 0.85. Karena harga r statistik = 0.85 > nilai r tabel = 0.344 maka terdapat hubungan yang signifikan dua variabel. Dengan demikian, tes UAS 1 memiliki reliabilitas internal yang tinggi. Hasil Uji Analisis Relibilitas Tes UAS 2 Dengan : k = 100, M = 72,34, dan SDt2 = 85,11; Pada UAS 2, r statistik yang ditemukan r statistik K-R 21 = 0.77. Karena harga r statistik = 0.77 > nilai r tabel = 0.355 maka terdapat hubungan yang signifikan dua variabel. Dengan demikian tes tersebut memiliki reliabilitas internal yang tinggi. Hasil Uji Analisis Relibilitas Tes UAS 3 Dengan k = 100, M = 70.40, dan SDt2 = 18.776; pada UAS 3 ini ditemukan r statistik K-R 21 = -0.1. Karena harga r statistik -0.1 < nilai r tabel = 0.334 maka tidak terdapat hubungan yang signifikan dua variabel. Dengan demikian tes tersebut tidak reliabel (tidak memiliki reliabilitas internal). Hasil Uji Analisis Relibilitas Tes UAS 4 Dengan k = 100, M = 63.06, dan SDt2 = 54.85, pada UAS 4 ini ditemukan r hitung K-R 21 = 0.58. Karena harga r statistik = 0.58 > nilai r tabel = 0.339 maka
tidak terdapat hubungan yang signifikan dua variabel. Dengan demikian, tes tersebut reliabel tetapi dalam tingkatan cukup. Hasil Uji Analisis Reliabilitas UAS 5 Dengan k = 100, M = 67.57, dan SDt2 = 43.031, pada UAS 5 ini ditemukan r hitung K-R 21 = 0.50. Karena harga r statistik = 0.50 > nilai r tabel = 0,304 maka terdapat hubungan yang signifikan antara dua variabel. Dengan demikian, tes tersebut reliabel tapi pada tingkatan cukup. Hasil Uji Analisis Reliabilitas Tes UAS 6 Dengan k = 100, M = 73.48, dan 2 SDt = 28.52, pada UAS 6 ini ditemuka r hitung 0.32. Karena harga r statistik = 0.32 > nilai r tabel Product Moment= 0.291 maka terdapat hubungan yang signifikan dua variabel. Dengan demikian, tes tersebut reliabel tapi pada tingkatan rendah. Hasil Uji Analisis Reliabilitas Tes UAS 7 Dengan k = 100, M = 66.90, dan SDt2 = 82.186; pada UAS 7 ini ditemukan r hitung K-R 21 = 0.74. Karena harga r statistik = 0,74 > nilai r tabel = 0,304 maka terdapat hubungan yang signifikan dua variabel. Dengan demikian, tes tersebut reliabel pada tingkatan tinggi. Hasil Uji Analisis Relibilitas Tes UAS 8 Dengan k = 100, M = 69.91, dan SDt2 = 2.949; pada UAS 8 ini deitemukan r hitung K-R 21 = -6.2. Karena harga r statistik = -6.2 < nilai r tabel = 0,288 maka tidak ada hubungan antara dua variabel. Dengan demikian, tes tersebut tidak reliabel. Tes sebagai alat pengukur hasil belajar siswa diharapkan mampu memberikan informasi yang dapat dipertanggungjawabkan kebenarannya. Artinya, alat tes dapat memberi informasi tentang siswa sesuai dengan keadaan yang sesungguhnya. Hal itu penting karena informasi tersebut akan dipergunakan untuk mempertimbang-
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
35
kan dan kemudian memutuskan berbagai kebijaksanaan baik yang berkenaan dengan siswa maupun kegiatan pengajaran secara umum. Tuntutan ini ternyata tidak sepenuhnya dapat dipenuhi dalam ulangan akhir semester MTs/SMP Islam yang merupakan sasaran penelitian ini. Agar dapat memberikan informasi yang dapat dipertanggungjawabkan, tes seharusnya merupakan alat ukur yang baik. Untuk keperluan itu, dibutuhkan informasi apakah tes yang disusun itu telah memenuhi syarat tes yang baik atau belum. Baik buruknya suatu alat ukur khususnya tes, di antaranya dapat dilihat dari kesahihan validitas dan reliabilitasnya. Validitas merupakan suatu keadaan apabila suatu instrumen evaluasi termasuk tes dapat mengukur apa yang sebenarnya harus diukur secara tepat. Suatu tes hasil belajar bahasa dan sastra Indonesia dikatakan valid apabila tes tersebut benarbenar mengukur hasil belajar bahasa dan sastra Indonesia. Tuntutan kevalidan ini khususnya dari sisi validitas sejalan, ternyata belum semuanya terpenuhi dalam tes Ulangan Akhir Semester Matapelajaran Bahasa Indonesia di MTs/SMP Islam di Kota Malang semester genap Tahun Pelajaran 2006/2007. Hal ini dapat dilihat dari rangkuman hasil melalui grafik berikut ini. HASIL UJI VALIDITAS TES
3 25%
1 25% 1 2 3
1 = TINGGI 2 = CUKUP 3 = TIDAK VALID
2 50%
Gambar 1: Rangkuman Hasil Uji Validitas tes
validitas sejalan. Validitas sejalan atau validitas sama saat menunjuk pada pengertian apakah tingkat kemampuan seorang pada suatu bidang yang diteskan mencerminkan atau sesuai dengan skor bidang yang lain yang mempunyai persamaan karakteristik. Meskipun validitas yang diuji masih pada satu jenis yaitu validitas sejalan, tentunya tes yang tidak valid ini akan merugikan siswa. Berkaitan dengan hasil tersebut, seharusnya guru atau sekolah harus berhati-hati dalam menyusun tes agar benar-benar menjadi tes yang valid/tepat. Hal ini sejalan dengan pendapat Grondlund (1985) yang mengatakan bahwa dari sisi Validitas, tes seharusnya memiliki ketepatan interpretasi hasil penggunaan suatu prosedur evaluasi sesuai dengan tujuan pengukurannya. Reliabilitas merupakan kriteria ukuran apakah suatu tes dapat mengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu. Dengan demikian, reliabilitas merujuk pada derajat keajegan (consistency) alat tersebut dalam mengukur apa saja yang diukurnya. Reliabilitas dipengaruhi oleh kesalahan acak, yaitu faktor-faktor yang akan menyebabkan perbedaan skor dalam penggunaan alat pengukur secara berulang-ulang. Kesalahan acak timbul dari beberapa sumber. Kesalahan itu mungkin melekat (inheren) dalam alat itu sendiri, atau mungkin melekat dalam pelaksanaan penggunaan alat ukur tersebut. Hasil penelitian tentang reliabilitas tes juga masih menunjukkan hasil yang kurang menggembirakan. Hal ini tampak dalam rangkuman hasil berikut ini. HASIL UJI RELIABILITAS TES
4 25% 1 37%
1 2
Hasil tersebut menunjukkan, bahwa tes yang memiliki validitas tinggi 25%, yang memiliki validitas cukup 50%, dan tidak valid 25%. Uji validitas ini dilihat dari
3
3 13%
4
1 = TINGGI 2 = CUKUP 3 = RENDAH 4 = TIDAK RELIABEL
2 25%
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
36
Gambar 2: Rangkuman Hasil Uji Reliabilitas tes Hasil penelitian menunjukkan, bahwa tes yang memiliki validitas tinggi sebesar 37%, yang memiliki reliabilitas cukup 25%, yang memiliki validitas rendah 13%, dan yang tidak reliabel 25%. Dengan hasil ini tentunya bukan hasil yang baik karena tes seharusnya memiliki keajegan dan kestabilan. Dalam penelitian ini, dibatasi pada kestabilan tes. Reliabilitas diartikan dengan stabilitas bilamana tes itu diujikan dan hasilnya diadakan analisis reliabilitas dengan menggunakan kriteria internal dalam tes tersebut. Cara untuk mengetahui koefisien stabilitas ini adalah dengan beberapa rumus yang salah satunya adalah K-R 21, yang seluruhnya cukup menggunakan satu tes dengan sekali diujikan kepada siswa. Menurut Djiwandono (1996), tes seharusnya reliabel, artinya tes harus memiliki kemampuan untuk menghasilkan pengukuran yang ajeg, tidak berubah-ubah seandainya digunakan secara berulangulang pada sasaran yang sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajegan atau stabilitas. Meskipun uji reliabilitas ini masih pada satu jenis yaitu reliabilitas internal, tetapi paling tidak sudah memberikan gambaran kualitas tes yang disusun oleh guru atau sekolah. Tes yang memiliki reliabilitas rendah atau bahkan tidak reliabel tentu akan merugikan siswa. Kemampuan siswa tidak akan terukur dengan yang sebenarnya karena adanya kesalahan pada alat atau pelaksanaan tes. Hasil uji validitas ternyata belum tentu sejala dengan reliabilitas. Hal ini tampak dalam penelitian ini. Tes yang valid belum tentu reliabel, dan sebaliknya tes yang reliabel belum tentu valid. Reliabilitas tes diperlukan tetapi bukan jaminan adanya validitas. Reliabilitas hanya memberikan jaminan adanya konsistensi saja.
PENUTUPAN Simpulan Dilihat dari sisi validitas, tes yang memiliki validitas tinggi 25%, yang memiliki validitas cukup 50%, dan tidak valid 25%. Dengan demikian, 75% tes Ulangan Akhir Semester tersebut valid. Sedangkan 25% lainnya tidak valid. Hasil penelitian ini menunjukkan, bahwa tidak semua tes akhir semester disusun dengan bagus. Dengan demikian, perlu kehatihatian dalam menyusun soal, sehingga tes tersebut valid. Dilihat dari sisi reliabilitas tes, tes yang memiliki validitas tinggi sebesar 37%, yang memiliki reliabilitas cukup 25%, yang memiliki validitas rendah 13%, dan yang tidak reliabel 25%. Dengan demikian, 62% tes sudah reliabel dan bagus, sedangkan 38% lagi masih belum reliabel dan belum bagus. Dengan demikian, perlu keajegan dan stabilitas yang baik dalam penyusunan dan proses pelaksanaan tes. Saran Penelitian ini masih mengambil sebagian data yang terbatas pada tes Ulangan Akhir Semester matapelajaran Bahasa dan Sastra Indonesia MTs/SMP Islam di kota Malang. Oleh karena itu, untuk calon peneliti yang ingin mengkaji topik yang sama atau hampir sama, dapat mengembangkan dengan data yang lebih banyak, sehingga dapat diperoleh fakta yang luas dan lebih representatif. Untuk para guru matapelajaran Bahasa Indonesia Indonesia MTs/SMP Islam khususnya di kota Malang, hendaknya selalu meningkatkan diri khususnya dalam hal penyusunan dan pelaksanaan tes sehingga pada akhirnya akan diperoleh tes-tes yang benar-benar berkualitas. Kemandirian yang diberikan pada guru atau sekolah, seharusnya dimanfaatkan betul untuk bekerja lebih kreatif dan variatif, sehingga ada perbedaan antara sebelum dan sesudah kemandirian diberikan.
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
37
DAFTAR RUJUKAN Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing. Oxford: Oxford University Press. Bull, K.S., Montgomery, D., and Kimball, S.L. 2000. Assessment, Evaluation, & Measurement. Oklahoma: Oklahoma State University. Djiwandono, M. Sunardi. 1996. Tes Bahasa dalam Pengajaran Bahasa. Bandung: Penerbit ITB. Grondlund, Norman E. 1995. Measurement and Evaluation in Teaching. New York: Macmillan Publishing Comp
Jurnal Penelitian Al-Buhuts Universitas Islam Malang
38