VALIDITAS A. Definisi Validitas Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrument pengukuran (tes) dalam melakukan fungsi ukurnya. Dalam bahasa Indonesia „valid‟ sering diwakili oleh istilah „sahih‟ (Suharsini A., 1999;65). Sahih sendiri berasal dari bahasa arab artinya tepat atau yang benar (Ahmad Warson Munawwir, 1997:764) Secara umum validitas merupakan kekuatan dari hasil interpretasi anda dan menggunakan hasil penilaian (asesmen). Hasil penilaian memiliki perbedaan tingkat validitas, yang bergantung pada bagaimana hasil di interpretasikan dan digunakan (Nitko & Brookhart, 1996:38).
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Validitas didefinisikan sebagai ukuran seberapa cermat suatu tes dilakukan fungsi ukurnya. Tes hanya dapat melakukan fungsinya dengan cermat kalau ada “sesuatu” yang diukurnya. Jadi, untuk dikatakan valid, tes harus mengukur sesuatu dan melakukannya dengan cermat. Validitas instrument tes adalah ketepatan mengukur apa yang seharusnya diukur melalui item tes (Allen & Yen, 1979:95). Instrumen tes dalam penelitian dinyatakan valid berdasarkan validitas fakta. Validitas fakta diperoleh melalui validitas isi, validitas kongruen dan validitas konstrak (Ebel & Frisbie, 1986:90). Untuk itu dilakukan telaah item tes, mencari korelasi (korelasi pearson) antara skor tiap item tes dengan skor total, dan mencari korelasi antara skor uji coba intrumen dengan skor matematika ulangan. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas
tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan. Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch. Masalah validitas berhubungan dengan sejauh mana suatu alat mampu mengukur apa yang dianggap orang seharusnya diukur oleh alat tersebut. Definisi yang paling lazim mengenai validitas tercerminkan dalam pertanyaan: Apakah kita benar-benar mengukur apa yang ingin kita ukur? Dalam pertanyaan ini yang ditekankan adalah apa yang sedang diukur. Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya. Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang
lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana? Lebih lanjut, pengertian validitas suatu tes tidaklah umum untuk semua tujuan ukur. Sebuah tes biasanya hanya menghasilkan ukuran yang valid untuk satu tujuan ukur tertentu. Karena itu predikat valid seperti dalam pernyataan “tes ini valid” tidaklah benar. Pernyataan valid harus diiringi oleh keterangan yang menunjuk kepada tujuan, yaitu valid untuk mengukur apa dan bagi siapa. Karena itu, suatu tes yang sangat valid guna pengambilan suatu keputusan dapat sangat tidak berguna dalam pengambilan keputusan lain. Berdasarkan hal di atas maka dapat disimpulkan bahwa validitas adalah suatu proses untuk mengukur dan menggambarkan objek atau keadaan suatu aspek sesuai dengan fakta. Dalam konsep validitas setidaknya terdapat dua makna yang terkandung di dalamnya, yaitu relevans” dan accuracy. Relevansi menunjuk pada kemampuan instrumen untuk memerankan fungsi untuk apa instrumen tersebut dimaksudkan (what it is intended to measure). Accuracy menunjuk ketepatan instrumen untuk mengidentifikasi aspek-aspek yang diukur secara tepat, yang berarti dapat menggambarkan keadaan yang sebenarnya. Kedudukan validitas sangat penting dalam suatu kegiatan termasuk dalam evaluasi pembelajaran karena menyangkut hasil pembelajaran dilandasi dan didukung oleh fakta-fakta yang representatif. apabila tidak ada validitas maka suatu proses maupun hasil pembelajaran tidak akan berjalan objektif melainkan subjektif hal ini tentu akan merugikan semua pihak terutama siswa.
B. Hakekat Umum Validitas Dalam pembahasan mengenai validitas beberapa konsep yang harus dipegang teguh antara lain: 1. Konsep
validitas
mengaplikasikan
bagaimana
kita
menginterpretasikan dan
menggunakan hasil asesment dan bukan prosedur asesment itu sendiri 2. Hasil asesment memiliki derajat yang berbeda untuk tujuan yang berbeda dan situasi yang berbeda. 3. Kita sebaiknya membuat keputusan tentang validitas dari interpretasi kita atau menggunakan hasil asesment setelah kita mempelajari dan mengkombinasikan beberapa tipe bukti validitas.
C. Empat Prinsip Validitas 1. Interpretasi (interpretation) yang kita berikan terhadap asesmen siswa hanya valid terhadap derajat yang kita arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya. 2. Kegunaan (use) yang bisa kita buat dari hasil asesment hanya valid terhadap derajat yang kita arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya. 3. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika nilai (values) yang dihasilkan sesuai. 4. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika konsekuensi (consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan. D. Kriteria untuk Meningkatkan Validitas dari Score Asesment Kelas untuk Menentukan Grade Siswa Kategori Representatif dan relevansi materi
Proses berpikir dan representasi skills
Konsitensi terhadap asesment kelas lain
Reliabilitas dan objetivitas
Keseragaman terhadap tipe-tipe
Kriteria yang harus dicapai 1. Menekankan pada apa yang diajarkan 2. Merempresentasikan materi kurikulum sekolah. 3. Merepresentasikan pemikiran teraktual terhadap materi 4. Memuat materi pembelajaran yang berkembang 5. Memerlukan siswa agar mengintegrasikan dan menggunakan beberapa teknik berpikir 6. Merepresentasikan proses berpikir dan skill yang terdapat pada kurikulum sekolah 7. Memuat tugas/masalah yang tak terselesaikan tanpa menggunakan proses berpikir yang serius 8. Memberikan waktu yang cukup bagi siswa untu menggunakan skill dan proses yang kompleks. 9. Biarkan keragaman hasil konsisten terhadap assesmen lain kita 10. Memuat tugas/masalah yang tak terlalu mudah dan tak terlalu sulit 11. Gunakan prosedur yang sistematik untuk setiap siswa dalam memberikan kualitas rating atau nilai. 12. Beri kesempatan pada setiap siswa untuk menunjukkan kompetensi mereka untuk setiap target pembelajaran yang dituju 13. Memuat tugas yang terinterpretasi sesuai
siswa yang berbeda
Keekonomisan, keefektifan, kemudahan, dan instruksi
Barbagai kegunaan asesment
dengan siswa yang memiliki latarbelakang berbeda-beda 14. Layani siswa yang mengalami kesulitan, jika memang itu diperlukan. 15. Tidak mempedulikan perbedaan SARA 16. Membutuhkan beberapa waktu untuk mengkonstruksikan dan mengadministrasikan 17. Merepresentasikan kegunaan dari waktu siswa didalam kelas 18. Merepresentasikan kegunaan dari waktu didalam kelas 19. Gunakan secara bersamaan dengan assessment yang lain untuk keputusankeputusan yang penting.
E. Tipe-tipe Umum Validasi Tipe-tipe umum validasi tergantung pada pendekatannya, validitas dapat terbagi menurut berbagai tipe. Berikut ini akan diikuti tipe-tipe validitas menurut yang ditetapkan oleh American Psycological Association, yaitu content validity, construct validity, dan criterionrelated validity. 1. Content Validity Dalam validasi ini, suatu tes harus menjawab pertanyaan “sejauh mana item tes itu mencakup keseluruhan situasi yang ingin diukur oleh tes tersebut”. Sejauh mana suatu tes memiliki content validity ditetapkan menurut analisis rasional terhadap isi tes, yang penilaiannya didasarkan atas pertimbangan subjektif individual. Prosedur validasinya tidak melibatkan statistik apapun. Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validasi ini adalah “sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur” atau “sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur”. Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur. Validitas isi/muatan adalah kerepresentatifan sampling yang terdapat dalam isi/muatan suatu instrumen pengukur. Sedangkan kata „muatan‟ itu menyiratkan pengertian, substansi, bahan, topik. Mengenai validasi muatan dapat dibimbing dengan pertanyaan : Apakah isi/muatan/substansi dari suatu alat ukur mewakili semua kemungkinan isi/muatan/substansi yang berupa sifat yang hendak diukur? Pertanyaan tersebut dapat dijawab dengan membahas satu demi satu butir pertanyaan dalam suatu alat ukur terhadap suatu isi/muatan/substansi dari apa yang hedak kita ukur. Pekerjaan ini jelas sangat sulit apabila dikerjakan oleh seorang diri. Diperlukan beberapa orang yang ahli dalam bidang-bidang yang bersangkutan untuk menilai, mempertimbangkan, dan memutuskan kerepresentatifan satu demi satu butir pertanyaan dalam suatu alat ukur tersebut. Dengan demikian pengujian validitas muatan pada dasarnya merupakan kerja menilai dan memutuskan suatu butir pertanyaan apakah valid secara isi/muatan/substansi ataukah tidak. Adalah seberapa besar derajat tes mengukur representasi isi yang dikehendaki untuk diukur. Validitas aitem berkaitan dengan apakah aitem mewakili pengukuran dalam area isi sasaran yang diukur, dan validitas sampling adalah seberapa baik sampel isi tes mewakili keseluruhan isi sasaran yang diukur. Biasanya dinilai dengan menggunakan pertimbangan pakar. Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai. Walaupun
isi
atau
kandungannya
komprehensif
tetapi
bila
suatu
alat
ukur
mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya. Walaupun
isi
atau
kandungannya
komprehensif
tetapi
bila
suatu
alat
ukur
mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.
Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai. Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logis). a. Face Validity Face validity tercapai apabila pemeriksaan terhadap item-item tes member kesimpulan bahwa tes tersebut mengukur aspek yang relevan. Dasar penyimpulannya lebih banyak diletakkan pada common sence atau akal sehat. Kesimpulan ini dapa diperoleh oleh siapa saja walaupun tentu tidak semua orang diharapkan setuju menyatakan bahwa misalnya tes A memiliki content validity yang baik. Akan tetapi, seorang yang ingin menggunakan tes tersebut harus punya keyakinan terlebuh dahulu bahwa dari segi content, tes itu adalah valid. Kalau tidak maka kuranglah alasan untuk tetap memakainya. Validitas tipe ini tentu tidak menjadi hal yang perlu dirisaukan apabila suatu tes telah terbukti valid lewat pengujian validitas tipe lain yang lebih dapat diandalkan. Dapatlah dikatakan bahwa face validity adalah tipe validitas yang paling rendah signifikannya. Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi. Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi. Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan validitasnya yang kuat.
b. Logical Validity Logical validity disebut juga sampling validity. Tipe validitas ini menuntut batasan yang seksama terhadap kawasan (domain) perilaku yang diukur dan suatu desain logis yang dapat mencakup bagian-bagian kawasan perilaku tersebut. Sejauh mana tipe validitas ini telah terpenuhi dapat dilihat dari cakupan item-ietm yang ada dalam tes. Apakah keseluruhan item tersebut telah merupakan sampel yang representative bagi seluruh item yang mungkin dibuat, ataukah item tersebut berisi hal-hal yagn kurang relevan dan meninggalkan hal-hal yang seharusnya menjadi isi tes. Dalam penyusunan tes prestasi, logical validity sangat penting artinya. Salah satu cara agar tuntutan validitas ini dapat terpenuhi adalah dengan menyusun suatu perencanaan isi tes menurut semacam blue print yang disandarkan pada rencana pelajaran atau program latihan yang akan diujikan. Blue print tes dapat membantu agar penulis item tidak meninggalkan hal yang penting yang harus ada dalam tes dan sekaligus menjaganya agar tetap berada dalam batas cakupan isi yang relavan. Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu tercapainya validitas logik. Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur. Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan. Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi. 2. Construct Validity
Construct validity menunjukkan pada sejauh mana suatu tes mengukur theoretical construct yang menjadi dasar penyusunan tes itu. Pengukuran Construct validity merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait (sifat) yang diukur. Namun, pada situasi-situasi tertentu adanya bukti construct validity mungkin diperlihatkan. Campbell dan Fiske (1959) mengembangkan satu pendekatan terhadap construct validity yang mereka sebut multitrait-multimethod validity. Validasi dengan multitrait-multimethod digunakan dengan mengenakan lebih dari satu macam metode untuk mengukur lebih dari satu macam trait. Dengan menggunakan matriks validitas, maka interkolasi antara trait dan antar metode dapat dilihat, dimana korelasi antara setiap variable dengan diri sendirinya tidak dituliskan sama dengan 1.00, tetapi diganti oleh koefisien reliabilitasnya. Secara ideal, koefisien reliabilitas yang ada pada diagonal matriks harus tinggi. Demikian pula koefisien korelasi antara dua metode berbeda yang mengukur trai yang sama, harus tinggi. Sedangkan korelasi antara metode yang mengukur dua macam trait yang berbeda, harus rendah. Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam Azwar 1986). Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal. Adalah seberapa besar derajat tes mengukur konstruk hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut. Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979). Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait
yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas. Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai melalui beberapa cara antara lain : Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus memiliki skor yang berbeda. Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan faktor kematangan. Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang mengukur aspek yang berbeda. Studi mengenai korelasi antaraitem atau antar belahan tes Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa tes mengukur satu variabel satuan (unitary variable). Dua diantara pendekatan yang banyak digunakan dalam pengujian validitas konstruk antara lain adalah pengujian multitrait-multimetod dan pendekatan faktor. a. Validitas Multitrait-Multimethod Pendekatan ini dapat digunakan bilamana terdapat dua trait atau lebih yang diukur oleh dua macam metode atau lebih. b. Validitas Faktor Analisis faktor merupakan kumpulan prosedur matematika yang kompleks guna menganalisis hubungan diantara variabel-variabel dan menjelaskan hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang disebut vaktor. Oleh karena itu, validitas yang ditegakkan melalui analisis vaktor disebut sebagai validitas vaktor. 3. Criterion-related Validity Prosedur guna mencapai criterion-related validity menghendaki adanya criteria eksternal yang dapat dihubungkan dengan skor tes yang diuji validitasnya. Kriteria adalah variable periliku yang akan diprediksi oleh skor tes. Koefisien korelasi antara skor tes (X) dengan criteria (Y) merupakan koefisien validitas yang disimbolkan oleh
. Koefisien ini dapat
diperoleh melalui dua prosedur yang berbeda dari segi waktu pengambilan data (skor) kriterianya, masing-masing akan menghasilkan predictive validity dan concurrent validity. Predictive validity diperoleh apabila pengambilan skor criteria tidak bersamaan dengan pengambilan skor tes. Setelah subjek dikenai tes yang akan dicari validitasnya, lalu diberikan tenggang waktu tertentu sebelum skor criteria diambil dari subyek yang sama. Prosedur predictive validity memerlukan waktu yang banyak dan mungkin pula biaya yang besar karena prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah sekali melakukan analisis, malainkan lebih merupakan kontinyuitas dalam mengembangkan tes sebagai predictor. Sebagaimana pada umumnya prosedur validitas yang lain, predictive validity harus diiringi oleh peningkatan kualitas item tes berupa modifikasi dan pengembangan item-item baru. Validitsa relasi-kruteria dikaji dengan cara membandingkan skor tes atau skala dengan atu atau lebih peubah ekstra (Variabel eksternal) atau kriteria yang diketahui (atau diyakini) merupakan pengukur atribut yang sedang dikaji. Yang lebih diperhatikan dalam validasi relasi-kriteria adalah bukan apa yang diukur oleh tes tersebut melainkan kemampuan test tersebut dalam membuat prediksi. Pengujian validitas relasi-kriteria dapat dilakukan dengan mengkorelasikan suatu alat ukur dengan kriteria lain yang dianggap (atau diyakini) merupakan pengukur atribut yang sedang dikaji. Semakin tinggi korelasinya, maka makin baiklah validitasnya. Kesulitan terbesar dalam hal validasi ini adalah bagaimana mendapatkan ktiteria yang digunakan sebagai pembanding. Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor tes dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu r xy, dimana X melambangkan skor tes dan Y melambangkan skor kriteria Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan, yaitu r xy, dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity). a. Validitas Prediktif Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya. Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan oleh atasannya. Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang. Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan bukan sekedar pengujian secara deskriptif saja. Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang. Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkap hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.
b. Validitas Konkuren Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale). Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren tidak cukup memuaskan dan validitas prediktif merupakan keharusan. Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan kriteria lain yang valid yang diperoleh pada saat yang sama. Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkruen. F. Aplikasi Validitas konstruk mencakup syarat-syarat empiris dan logis dari validitas isi dan validitas kriteria. Hal Ini berari bahwa validitas konstruk menggabungkan syarat-syarat yang terdapat dalam validitas isi dan validitas relasi kriteria (Anastasi, 1997). Validitas konstruk menghubungkan gagasan dan praktek pengukuran di satu pihak, dengan gagasan teoretik di pihak lain. Para penyusunan instrumen biasanya bertolak dengan bekal suatu konstruk, kemudian mengembangkan instrumen untuk mengukur konstruk tersebut. Selanjutnya, butirbutir instrumen yang telah dikembambangkan diujicobakan secara empiris. Validitas isi dan validitas konstruk berhubungan dengan kecocokan butir-butir instrumen dengan tujuan ukurnya. Kedua jenis validitas tersebut dapat ditentukan melalui pengkajian secara teoretis dan secara empiris, yang mencakup: (1) menjelaskan pokok bahasan dan sub pokok bahasan; (2) menetapkan pokok bahasan dan subpokok bahasan yang diukur oleh setiap butir instrumen; (3) mencocokkan butir-butir instrumen dengan pokok bahasan dan subpokok bahasan yang diukurnya. Secara teoretis validitas isi dan validitas konstruk dapat dikaji melalui penilaian panelis. Penilaian panelis dimaksudkan untuk menilai kesesuaian setiap butir instrumen dengan pokok bahasan dan subpokok bahasan yang diukurnya.
Prosedur yang digunakan adalah meminta para panelis untuk mencermati butir-butir instrumen. Kemudian menilai kesesuaian setiap butir instrumen dengan pokok bahasan dan subpokok bahasan yang diukurnya. Suatu contoh penilaian validitas isi dan validitas konstruk secara teoretis dapat dilakukan melalui penilaian panelis (pakar). Pengembangan prosedur penilaian panelis dapat dilakukan melalui beberapa langkah, yaitu: Pertama, menetapkan skala yang digunakan, yaitu: 1 = tidak relevan, 2 = kurang relevan, 3 = cukup relevan, 4 = relevan, dan 5 = sangat relevan. Kedua, menetapkan kriteria penilaian yang mencakup: (1) mengukur indikatornya; (2) hanya memiliki satu arti; (3) jelas dan mudah dipahami; (4) tidak bersifat faktual; dan (5) tidak tumpang tindih dengan butir-butir lainnya. Ketiga, menetapkan pilihan, yaitu: 1 (tidak relevan) jika hanya satu atau semua kriteria tidak terpenuhi; 2 (kurang relevan) jika hanya dua kriteria yang terpenuhi; 3 (cukup relevan) jika hanya tiga kriteria yang terpenuhi; 4 (relevan) jika hanya empat kriteria yang terpenuhi; dan 5 (sangat relevan) jika semua kriteria terpenuhi. Keempat, kualitas masing-masing butir instrumen didasarkan atas rerata hasil penilaian panelis, dengan kriteria sebagai berikut: Rerata Penilaian Keputusan 1,0 – 2,9 Tidak sesuai Direvisi 3,0 – 3,9 Cukup sesuai Diterima dengan revisi 4,0 – 5,0 SesuaiDiterima Penilaian validitas isi dan validitas konstruk secara empiris dilakukan dengan ujicoba instrumen kepada responden yang sesuai dengan karakteristik responden tempat pemberlakuan instrumen final. Penetapan jumlah sampel dapat diacuh dari pendapat Nunnaly (1970) bahwa untuk mengurangi resiko kehilangan butir-butir instrumen dan agar memungkinkan untuk mengeliminasi faktor-faktor yang tidak dikehendaki maka dalam analisis instrumen direkomendasikan untuk digunakan sampel 5–10 kali jumlah butir instrumen. Ujicoba secara empiris dimaksudkan untuk menganalisis validitas isi dan validitas konstruk instrumen secara empiris. Validitas isi biasanya digunakan untuk menyebut validitas instrumen tes, sedangkan validitas konstruk biasanya digunakan untuk menyebut validitas instrumen non tes. Secara empiris, kedua jenis validitas tersebut dianalisis dengan cara yang berbeda. Validitas isi. Secara empiris alat analisis validitas isi yang biasa digunakan (khusus untuk tes pilihan ganda) adalah Item and Test Analysis (ITEMAN). Alat analisis ini dimaksudkan untuk mendapatkan informasi tentang: indeks kesukaran butir tes, indeks daya beda butir, dan keberfungsian pengecoh. Disamping itu, juga untuk menentukan: korelasi biserial titik (point biserial correlation), dan keseimbangan isi atau keterwakilan materi yang hendak diukur. Secara empiris kelima informasi tersebut dibutuhkan karena saling berhubungan antara satu
dengan yang lainnya, dimana keberfungsian pilihan dapat meningkatkan indeks kesukaran butir tes, indeks kesukaran butir tes dapat menentukan daya beda butir, dan indeks kesukaran dan daya beda butir dapat mempengaruhi interkorelasi butir, dan secara keseluruhan kelima informasi tersebut merupakan penentu tingkat reliabilitas tes. Untuk jelasnya prosedur analisis butir dan penetapan kriteria untuk menerima, menolak atau merevisi butir-butir tes, secara berturut-turut sebagai berikut: a) Indeks kesukaran butir (p). Indeks kesukaran butir tes adalah proporsi peserta yang menjawab benar butir tes. Indeks kesukaran butir yang baik berkisar antara 0,3-0,7 paling baik pada 0,5; karena p=0,5 dapat memberikan kontribusi optimal terhadap korelasi biserial titik, daya pembeda butir, dan reliabilitas tes. Butir-butir tes yang memiliki indeks kesukaran di bawah atau di atas kriteria 0,3 - 0,7 dapat digunakan apabila ada pertimbangan keterwakilan pokok bahasan yang diukurnya. b) Daya pembeda butir (D). Daya pembeda butir adalah kemampuan butir tes untuk membedakan siswa mampu dan kurang mampu. Indeks daya beda butir mempunyai rentang nilai –1 ke +1, namun nilai negatif dan rendah menunjukkan kinerja butir yang rendah. Suatu butir tes dapat dipertahankan apabila memiliki nilai D ³ 2,0. Indeks daya beda butir dihitung dengan menggunakan rumus: D= pu - pi; dimana: pu = proporsi kelompok atas yang menjawab benar, pi = proporsi kelompok bawah yang menjawab benar. Pembagian kelompok responden didasarkan atas pendapat Kelly (1939) yang dikutip oleh Crocker dan Algina (1996) bahwa indeks daya beda butir yang lebih stabil dan sensitif dapat dicapai dengan menggunakan 27 persen kelompok atas dan 27 persen kelompok bawah. c) Korelasi biserial titik (rpbi). Korelasi biserial titik adalah korelasi antara skor butir tes dengan skor total. Korelasi biserial titik dapat disamakan dengan daya beda butir, namun rpbi itu sendiri perlu dihitung karena dapat menyediakan refleksi yang sebenarnya dari kontribusi setiap butir tes terhadap keberfungsian tes. Semakin tinggi rpbi suatu butir tes semakin tinggi kontribusinya dalam memprediksi kriteria. Suatu butir tes dapat dipertahankan apabila memiliki rpbi ³ 0,30. d) Keberfungsian pengecoh. Suatu pengecoh dapat dipertahankan apabila memenuhi syarat-syarat: (1) kunci jawaban (keyed answer) harus dipilih lebih banyak oleh kelompok atas daripada kelompok bawah; (2) setiap penggagal (foils) harus dipilih minimal 2 persen dari keseluruhan peserta tes dan dipilih minimal 5 persen kelompok bawah, (3) Indeks daya beda kunci jawaban harus positif dan indeks daya beda penggagal harus negatif.
Validitas konstruk. Sama halnya dengan prosedur ujicoba instrumen tes, instrumen non tes juga diujicobakan secara empiris kepada sejumlah responden (5-10 kali jumlah butir instrumen). Data hasil ujicoba secara empiris dari instrumen non tes biasanya dianalisis dengan menggunakan Analisis Faktor Konfirmasi (Confirmatory Factor Analysis) dengan menggunakan metode ekstraksi komponen utama (principle component extraction). Analisis tersebut bertujuan untuk menguji kebenaran konstruk teori yang dijadikan acuan dalam pengembangan instrumen, dengan cara menentukan struktur atau model faktor dari sejumlah butir instrumen berdasarkan muatan faktor (factor loading) jumlah varians (eigenvalue), dan proporsi varians (communality). Dalam analisis ini juga digunakan rotasi ortogonal dan varimax. Beberapa kriteria yang dijadikan acuan dalam analisis faktor adalah: a) Ukuran
kecukupan
pensampelan
(sampling
adequacy).
Ditentukan
dengan
menggunakan rumus Kaiser-Meyer-Olkin (KMO), yaitu dengan membandingkan nilai koefisien korelasi observasi dengan koefisien korelasi parsial (Norusis, 1996). Jika koefisien korelasi parsial kecil maka nilai KMO besar (mendekati satu) berarti dapat digunakan analisis faktor, sebaliknya jika nilai koefisien korelasi parsial besar maka nilai KMO kecil (mendekati nol) berarti tidak dapat digunakan analisis faktor. Jelasnya penafsiran nilai KMO diacuh dari ciri yang dikemukakan oleh Kaiser (1974) seperti dikutip oleh Norusis (1996) bahwa KMO 0,90 baik sekali (marvelous); 0,80 baik (meritorius); 0,70 sedang (middling); 0,60 kurang (mediocre); 0,50 sangat kurang (miserable); dan dibawah 0,50 tidak dapat diterima (unacceptable). b) Uji Bartlett tentang bentuk matriks korelasi (Bartlett‟s test of sphericity). Uji ini dimaksudkan untuk memastikan apakah matriks korelasi berasal dari matriks identitas atau bukan. Dalam uji ini digunakan pendekatan Chisquare dan dibutuhkan data yang berasal dari populasi normal multivariat. Dengan ketentuan bahwa bila matriks korelasi merupakan matriks identitas (makriks dengan diagonal 1 dan selain diagonal 0) maka tidak dapat digunakan analisis faktor, sebaliknya bila matriks korelasi bukan matriks identitas maka dapat digunakan analisis faktor. c) Banyaknya
faktor.
Banyaknya
faktor
ditetapkan
berdasarkan
aturan
yang
dikemukakan oleh Norusis (1996) bahwa jumlah faktor harus diekstraksi sama dengan jumlah faktor yang mempunyai varians (eigenvalue) lebih besar dari 1,0. d) Muatan faktor (factor loading). Muatan faktor diseleksi setelah melalui ekstraksi komponen utama (extracting principal component) dengan rotasi ortogonal untuk memaksimalkan varians (variance maximizing/ varimax) antara variabel utama. Muatan faktor yang tetap dipertahankan adalah di atas 0,3. Hal ini sesuai dengan
aturan yang dikemukakan oleh Crocker dan Algina (1996) bahwa muatan faktor yang lebih dari 0,3 cenderung siginifikan, sebaliknya muatan faktor yang kurang dari 0,3 tidak dapat memberikan kontribusi yang siginifikan terhadap suatu faktor tertentu. G. Konsep Pengukuran Validitas Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan. Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung. Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu. Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut. H. Koefisien Validitas dan Variasi Skor Murni Presiktor Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara tes dan kriteria itu adalah r xy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur. Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah
lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh rxy tersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang lain. Dalam pembahasan mengenai reliabilitas bahwa besarnya koefisien reliabiiltas tergantung antara lain pada variasi skor-murni. Sebagai pegangan praktis, dapat dikatakan bahwa validitas uji dengan cara menghitung kecocokan antara skor-tampak tes dan skor kriterianya. Akan tetapi dalam berbagai hal sering terjadi restriksi sebaran (restriction of range) baik pada distribusi skor tes sebagai predictor maupun pada distribusi skor criteria. Bila skor predictor adalah x dan skor criteria adalah y, maka korelasi x dan y adalah yang merupakan koefisien validitas prediktif tes x. hubungan antara
dan kesalahan
standar estimasi dirumuskan sebagai: √ Keterangan: = Kesalahan standad estimasi x terhadap y, yaitu deviasi standard distribusi y untuk harga x tertentu. = Deviasi standard skor criteria y (distribusi marginal). = Koefisien korelasi antara predictor x dan criteria y. Dengan asumsi homoscedasticity, maka harga
akan mengecil akibat restriksi
sistematis yang terjadi. Secara umum dapat dikatakan bahwa restriksi sebaran yang menjadikan variasi skor murni predictor mengecil akan menghasilkan underestimasi terhadap koefisien validitas yang sesungguhnya. I. Validitas dan Panjang Tes Bilamana panjang tes ditingkatkan dengan menambahkan sejumlah item baru yang isinya parallel dengan isi tes semula, maka reliabilitas tes akan meningkat.Tes yang reliabilitasnya meningkat akan bertambah pula tinggi validitasnya. Semakin besar proporsi varians skortampak yang merupakan varians skor murni (artinya, semakin reliable) maka semakin besar pula proporsi varians yang sama-sama dimiliki oleh tes dan kriterianya (artinya, semakin valid). Telah diketahui bahwa validitas maksimum tes yang mempunyai reliabilitas √
adalah
. Dengan bertambah panjangnya tes sebesar J kali panjang semula, maka validitas
maksimumnya dapat dilambangkan sebagai √
, sehingga rasio antara validitas
maksimum setelah penambahan dan sebelum penambahan item adalah:
√
Dimana: = validitas maksimum setelah memperpanjang tes menjadi J kali jumlah item semula. = validitas maksimum sebelum penambahan item. = reliabilitas setelah penambahan item. = reliabilitas sebelum penambahan item.
J. Pendekatan Internal Consistency dalam Validasi Item Pada tipe validitas dan concurrent yang dikategorikan sebagai criterion-related validity, criteria yang digunakan adalah skor tes atau skor pengukuran lain yang disebut criteria eksternal. Dalam prosedur seleksi item pada tes prestasi, berbagai skala sikap dan tes kemampuan lain, umumnya item-item dipilih menurut daya diskriminasinya. Daya diskriminasi ini diperlihatkan oleh indeks atau koefisien yang dihitung menurut formula tertentu. ̅
̅
√
Dimana:
̅
= Nilai t sebagai indeks diskriminasi item i. = Mean distribusi skor golongan “atas”, yang biasanya diambil dari 25% subyek
̅
yang mempunyai skor total tertinggi, untuk item i. = Mean skor subyek golongan “bawah” untuk item i. = Varians skor subjek golongan “atas” untuk item i.
= Varians skor subjek golongan “bawah” untuk item i. = Jumlah subjek golongan “atas”. = Jumlah subjek golongan “bawah”. K. Penyebab Invaliditas Ancaman utama terhadap validitas instrumen adalah: 1. Ketakterwakilan konstruk; menunjukkan bahwa tugas yang diukur dalam penilaian tidak mencakup dimensi penting dari konstruk. Oleh karena itu, hasil tes tersebut tidak mungkin untuk mengungkapkan kemampuan siswa sebenarnya dalam konstruk yang hendak diukur oleh instrumen; 2. Penyimpangan keragaman konstruk berarti bahwa instrumen tersebut mengukur terlalu banyak variabel, dan kebanyakan variabel tersebut tidak relevan terhadap isi konstruk. Jenis penyimpangan validitas seperti ini mencakup dua bentuk, yaitu penyimpangan kemudahan konstruk (Construct irrelevant easiness) dan penyimpangan kesukaran konstruk (Construct irrelevant difficulty). Penyimpangan kemudahan konstruk terjadi ketika faktor-faktor luar seperti kata-kata kunci atau bentuk instrumen memungkinkan seseorang untuk menjawab benar dengan cara yang tidak sesuai dengan konstruk yang diukur, dan penyimpangan kesukaran konstruk terjadi bila aspek-aspek luar dari tugas membuat tingkat kesukaran tugas tidak sejalan terhadap sebagian atau keseluruhan anggota kelompok. Sementara bila terjadi penyimpangan keragaman konstruk yang pertama menyebabkan seseorang memperoleh skor yang lebih tinggi dibanding dengan kemampuan yang sebenarnya, dan terjadinya penyimpangan keragaman konstruk yang kedua menyebabkan seseorang memperoleh skor yang lebih rendah dibanding dengan kemampuan yang sebenarnya.
Keterangan Validitas mengacu pada apakah kuesioner benar-benar dapat mengukur apa yang ingin diukur Sebagian besar validitas diukur secara logika (subyekif), hanya validitas konstruk yang dapat diukur secar matematika/statistika.
DAFTAR PUSTAKA Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. California: Brooks/Cole Publishing Company. Ebel, R. L., & Frisbie, D. A. (1986). Essential of educational measurement ( Jersey: Prentice-Hall, Inc.
ed). New
Djemari Mardapi, (2004). Penyusunan tes hasil belajar. Yogyakarta: Pascasarjana Univarsitas Negeri Yogyakarta.