PENGUKURAN TES PSIKOLOGI : TEKNIK DAN METODOLOGI RELIABILITAS DAN VALIDITAS
Kuliah 4 - 5
Tugas 1. Cari dan jelaskan reliabilitas dan validitas masingmasing tes psikologi berikut: a. Wechsler-Bellevue Intelligence Scale b. Edward’s Personal Preference Schedule c. RMIB d. Forer Sentence Completion Test 2. Jelaskan perbedaan kuesioner tes kepribadian dan kuesioner Asperger Syndrome dengan kuesioner no 2 3. Cari dan jelaskan perbedaannya dengan tes-tes psikologi dan kuesioner yang diberikan
Pengantar • Seperti diketahui, tes-tes psikologi sangat banyak • Pembuatan tes psikologi ??? • Apa benar bisa mengukur apa yg ingin diukur krn kaitannya dengan mental sso?? • Sejauh mana derajat kepercayaan tes tsb?
RELIABILITAS : KONSEP DASAR • Definisi : merujuk pada kekonsistenan nilai yang diperoleh oleh orang yang sama ketika diberikan tes yang sama namun pada waktu yang berbeda. • Konsep yg mendasari reliabilitas ialah: penghitungan eror pd st nilai ttt • Eror yang dimaksud disini adalah : perbedaan antara kemampuan yg sebenarnya yg dimiliki oleh sso dengan skor yg diperoleh melalui pengukuran yg mengukur kemamp tsb
• Pada tes psikologi, eror yg dimaksud bukan merupakan kesalahan test taker atau kesalahan yg disengaja ketika proses pengerjaan tes, • Namun merupakan ketidaktepatan dalam proses pembuatan alat tes, seperti faktor2 X yg tdk terukur atau tdk tdeteksi pd pembentukan tes yg mengukur st pl. • OKI, setelah membuat tes, kita harus mengukur erornya dan cari cara untuk meminimalkan eror tsb
• Bahasa statistiknya, bila mlkk reliabilitas tes maka akan didapatkan perkiraan total variance atau variasi total dari nilai tes, yg disebut error variance • Dengan memiliki tes yg minim eror maka tes tsb semakin reliabel. • Bila tesnya memiliki banyak eror maka tes tsb tidak relibel.
• Misal : kita ingin mengukur fluktuasi mood. Maka bila nilai skor tesnya turun naik = relibilitas = baik/buruk???? • Krn day-by-day changes in scores on a test would be relevant to the purpose of the test = mengukur mood, krn mood tdk sll sama setiap harinya.
• Jadi, kondisi apapun yg tdk relevan dgn tujuan tes dibuat dpt menyebabkan error variance • Sehingga, stp tester hrs mengusahakan kondisi tes yg seragam = lingkungannya, instruksi, time limit, rapport, atau faktor lainnya.
The Correlational Coefficient • Ialah : derajat kekonsistenan dari dua nilai yg independent • Simbol : r = relationship atau korelasi • Korelasi ada 3 : - Korelasi positif = kenaikan nilai di var X diikuti kenaikan var Y - Korelasi negatif = reversal scores from one var to the other. - Korelasi nol = bila tidak ada hub dari dua variabel yang ada
Pengukuran Korelasi •
Pearson Product-Moment Correlational Coefficient (PPMCC) • Hasil dari PPMCC adl : 1. Posisi indv dlm kelomp (SS = standarad score) 2. Jumlah penyimpangan indiv = apk diatas mean or dibawah mean kelp • Bila nilai indv jatuh di atas rata2 kelp maka kor + sdgk di bwh rata2 kelp maka kor -
• Statistical Significance • Korelasi yg dihasilkan signifikan atau tidak? • Untuk melihat itu digunakan level signifikansi = yi resiko kesalahan yang akan digunakan u/ menarik kesimpulan dari data yg ada • Ada bbrp level signifikasi = .01, .05, .09
• Bila kita menyebutkan bhw korelasi signifikan di level .05 maksudnya adl probabilitas kesalahannya adl 5 dari 100, begitu seterusnya • Dalam pengukuran tes, maka level signifikansi yg digunakan kebanyakan .01 dan .05
How reliable is reliable??? • Seberapa tinggi koefisien reliabilitas dikatakan memiliki reliabilitas yang tinggi? • Tergantung tes, namun biasanya bila koefisien mencapai .70 atau .80 maka tes tersebut dapat dikatakan reliabel
BERBAGAI TIPE RELIABILITAS 1. Metode Tes-retest • Ialah : metode yg digunakan u/ m’cari reliabilitas dgn cara mengulang tes yg sama pada dua kesempatan yg berbeda • Rtt yg diperoleh merupakan korelasi dari nilai tes individu yang diperoleh di waktu pengetesan yg berbeda
• Error variance yg diperoleh berasal dr fluktuasi performance indiv di sesi 1 dan 2 • Variasi ini krn situasi pengetesan yg tdk dpt dikontrol, spt suasana, cuaca, sudden noises, broken pencil, dll.
• Selain itu eror dpt disebabkan keadaan indv ketika melakukan tes, spt sakit, cemas, khawatir, dll • Evaluasi test-retest - Kelebihan : simpel dan straightforward - Kekurangan : interval pendek = recall their former responses, shg korelasinya akan tinggi. Hal ini menjadikan nature of the test itself may also change with repetition.
BERBAGAI TIPE RELIABILITAS 2. Alternate-Form Reliability • Salah satu metode mendapatkan reliabilitas tes dgn memberikan tes yg bentuknya setara pada kesempatan yg berbeda namun pada indv yang sama • Jadi harus diperhitungkan juga interval pemberian tesnya.
3. Split-Half Reliability • Internal consistency : apakah belahan 1 dan belahan 2 itemnya konsisten = content sampling • Yang dilihat adalah item-itemnya konsisten apa tdk • Antara belahan 1 dan 2 dikorelasikan, bila kor nya tinggi maka tes tsb reliable
4. Kuder-Richardson Reliability dan Coefficient Alpha • Single administration of single form • Yang ditekankan adalah inter item consistency = yi konsistensi jawaban terhadap item • Eror variance nya didpt dari : 1. Content sampling 2. Heterogeneity dari contoh tingkah laku
Sumber error dalam metode asesmen reliabilitas Sumber eror
Contoh
Metode
How assessed
Time sampling
Tes yg sama diberikan pada 2 wkt yg berbeda
Tes-retest
Korelasi ant 2 skor yg didapat pada 2 kesempatan tsb.
Item sampling
Item-item yg berbeda yg digunakan untuk mengukur 1 pl
Alternate forms or parallel forms
Korelasi antara bentuk tes yg mirip yg memiliki item2 yg berbeda
Internal consistency
Item2 yg konsisten pada tes yg sama
Split half, KR20, dan alpha cronbach
Observer differences
Catatan yg berbeda Kappa statistic dari msg2 observer
VALIDITAS : KONSEP DASAR • Ialah : apakah tes mengukur apa yang ingin diukur dan seberapa jauh dpt mengukur apa yg ingin diukur tsb • Jd jangan tll percaya dengan judul dari tes, biasanya hiperbola • So, kl ingin buat alat tes yang baik jg harus memberikan nama yg baik shg bila sso melihat nama tes tsb, lgs mengetahui apa yg diukur o/ tes tsb
• Lebih lanjut lagi, validitas tes tdk dpt dilaporkan sbg “tinggi” atau “rendah” tp apk isi tes tsb mengukur apa yg ingin diukur • Misal : tes informal “ingin mengetahui kemampuan berhitung anak usia 5 thn”. Isi tes = kebanyakan soal2 yg kaitannya dgn geometrik = TES TDK VALID • Tes yg valid bila isinya : contoh : sebutkan urutan angka 1 – 50, dll
• Fundamentally, all procedures for determining test validity are concerned with relationship between performance on the test and other independently observable facts about the behavior characteristics under consideration.
METODE MENDAPATKAN VALIDITAS TES 1. Content-Description Procedures • Melibatkan pemeriksaan sistematis terhadap isi tes u/ melihat apk tes tsb m’cover contoh perilaku yg akan diukur • Caranya : - Menggunakan subject-matter expert - Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes - Stlh itu ditentukan brp item yg dibutuhkan untuk mengukur hal2 yg sdh dispesifikkan sblmnya.
• Content-validity jangan disamakan dgn face validity • Krn face validity bukan fokus pd cara2 pengukuran tes tapi lebih pada apa2 saja yg muncul dipermukaan (superficially)
2. Construct-Identification Procedures • Construct-validity berfokus pd peran teori2 psikologi. Hal ini dilakukan untuk menyusun definisi operasional tingkah laku yg akan diukur dlm tes • Contoh konstrak adl aptitude, scholastic, verbal fluency, mechanical comprehension, dll
3. Criterion-Prediction Procedures • Prosedur ini mengindikasikan keefektifan tes dalam memprediksi kinerja individu di masa yad • Jd sering disebut : predictive validity • Item2nya tsb dpt memprediksi kinerja indv di masa yad
• Misal : tes bakat = apk tes tersebut dpt meramalkan performance kita di masa yad. • Contoh lain : tes yg diberikan u/ job applicants, students = selecting students for admission to professional school, dll.