BAHAN KULIAH ORIENTASI BARU DALAM PSIKOLOGI PENDIDIKAN OLEH: ASEP SUPENA Program Pascasarjana Universitas Negeri Jakarta 2010
EVALUASI DALAM PEMBELAJARAN
BEBERAPA ISTILAH • • • • •
ASESMEN (ASSESSMENT) PENGUKURAN(MEASURAMENT) TES (TEST) EVALUASI (EVALUATION) DIAGNOSTIK (DIAGNOSTIC)
ASESMEN • Refer to the gathering of relevant information to help in making decisions regarding appropriate goals and objectives, teaching strategies and program placement. (Taylor, 2000) • assessment is a broad term defined as a process for obtaining information that is used for making decisions about student, curricula and programs, and educational policy (Nitko, 2001)
TEST-MEASUREMENT-EVALUATION • Test is an instrument or systematic procedure for observing and describing one or more characteristic of a student using either a numerical scale or a classification scheme. Test is a concept narrower than assessment. (Nitko, 2001) • Measurament is defined as a procedure for assigning numbers (usually called scores) to a specified attribute or characteristic of a person in such a way that numbers describe the degree to which the person possessed the attribute. (Nitko, 2001)
• Evaluation is defined as the process of making a value judgment about the worth of student’s product or performance. (Nitko, 2001).
PENGUKURAN (MEASUREMENT) 1. Pemberian angka (kuantifikasi) kepada suatu objek atau peristiwa menurut suatu ukuran atau aturan tertentu. 2. Membandingkan sesuatu dengan susatu ukuran tertentu, secara kuantitatif.
Contoh Pengukuran 1. Seutas tali dinyatakan memiliki panjang 1,5 meter, setelah dilakukan pembanding dengan alat ukur meteran 2. Sebatang besi dinyatakan memiliki berat 3 kg setelah dilakukan pembandingan dengan alat penimbang berat 3. Seseorang dinyatakan mendapat skor 70 setelah mengikuti tes matematika 4. Seseorang dinyatakan memiliki IQ 110 setelah mengikuti tes kecerdasan
PENILAIAN/EVALUASI (EVALUATION) 1.Penetapan makna atau keputusan terhadap sesuatu berdasarkan data hasil pengukuran atau berdasarkan suatu aturan tertentu 2.Penilaian biasanya didahului oleh pengukuran, sehingga pengukuran sering dianggap bagian dari kegiatan penelitian
Contoh Kegiatan Penilaian Berdasarkan data dari hasil pengukuran seorang guru menetapkan bahwa : 1. 2. 3. 4. 5.
Si Budi adalah mahasiswa terpandai Si Tuti dinyatakan tidak lulus Si Rudi harus mengikuti remedial Si Beni boleh mengikuti program perkuliahan berikutnya Si Wida adalah mahasiswa yang ditunjuk mewakili lembaga untuk ikut lomba desain komputer 6. Si Polan berhak mendapatkan beasiswa
TES (TEST) 1.Merupakan salah satu cara atau alat dalam melakukan pengukuran. 2.Tes adalah suatu proses dimana seseorang diminta untuk menjawab sejumlah pertanyaan dalam suatu kondisi yang terstruktur
DIAGNOSIS (DIAGNOSIS) 1. Suatu istilah yang diambil dari profesi medis dan digunakan dalam konteks medik. 2. Pengertiannya menunjukan kepada “proses pengumpulan sejumlah informasi untuk mengetahui faktor penyebab dari suatu penyakit untuk keperluan penetapan tindakan penyembuhan (treatment) yang tepat 3. Assesment tidak mencoba untuk mengetahui faktor penyebab dari suatu gangguan
TUJUAN ASESMEN SCREENING : Untuk mengidentifikasi tentang kemungkinan seseorang mengalami gangguan/kelainan
DETERMINING ELIGIBITY : Untuk mengetahui dan menetapkan apakah seseorang masuk dalam kategori orang yang membutuhkan layanan khusus (ALB)
PROGRAM PLANNING : Asesmen untuk keperluan penyusunan/pengembangan program pembelajaran yang tepat MONITORING STUDENT PROGRESS : Untuk mengetahui tingkat kemajuan siswa selama dan setelah mengikuti program pendidikan tertentu EVALUATING PROGRAM : Untuk mengetahui keberhasilan suatu program yang telah dilaksanakan
PROSEDUR PENGUKURAN DAN EVALUASI APTITUDE TEST STANDARDIZED TEST
ACHIEVEMENT TEST
INFORMAL ASSESSMENT STRATEGIES
OBSERVATION TEACHER-DESIGNED MEASUREMENT. CHECKLIST. RATING SCALE. RUBRICS PERFORMANCE ASSESSMENT PORTFOLIO AUTHENTIC ASSESSMENT
ALTERNATIVE ASSESSMENT
STANDARDIZED TEST Perangkat tes yang memiliki prosedur yang baku (tersestandar atau seragam), baik dalam penggunaan maupun penilaiannya.
STANDARDIZED TEST • Dikembangkan melalui suatu tahapan/prosedur yang sistematik. • Prosedur pelaksanaan tes telah diatur secara baku (tertentu dan seragam). • Prosedur penilaian (skoring dan penafsiran) diatur secara baku (tertentu dan seragam). • Dilengkapi dengan manual test • Teruji validitas dan reliabilitasnya.
STANDARDIZED TEST Psychotest
APTITUDE TEST
ACHIEVEMENT TEST
Test yang dirancang untuk mengukur kemampuan atau kecakapan mental yang bersifat potensial, sehingga hasilnya dapat digunakan untuk memprediksi kesuksesan anak di masa mendatang, baik dalam mengikuti pendidikan, pekerjaan atau menguasai bidang kemampuan tertentu.
Tes yang dirancang untuk mengukur tingkat penguasaan anak terhadap suatu kemampuan yang telah dipelajarinya dalam kurun waktu tertentu.
Tes prestasi belajar
STANDARDIZED TEST INTELLIGENCE TEST
APTITUDE TEST
PERSONALITY TEST INTEREST INVENTORIES ATTITUDE MEASURE
SURVEY BATTERIES
ACHIEVEMENT TEST
TES UNTUK ABK TES DIAGNOSTIK
STEP IN STANDARDIZED TEST DESIGN • SPECIFYNG THE PURPOSE OF TEST (bidang kemampuan apa yg mau diukur dan populasi yg mana) • DETERMINING TEST FORMAT (bagaimana soal-soal tes disajikan dan bagaimana cara jawaban diberikan oleh tester). Tulis, oral, tindakan. B-S, pilihan ganda, isian dll. • DEVELOPING EXPERIMENTAL FORMS. • STANDARDIZING THE TEST • DVELOPING THE TEST MANUAL • VALIDITY AND RELIABILITY
TEACHER-DESIGNED STRATEGIES OF ASSESSMENT Alat dan cara Evaluasi yang dirancang oleh guru
TEACHER-DESIGNED STRATEGIES OF ASSESSMENT APTITUDE TEST
TES
NON-TES
ACHIEVEMENT TEST
OBSERVASI INTERVIEW CHECKLIST RATING SCALE RUBRIC PERFORMANCE SOSIOMETRI PORTOFOLIO
TULIS LISAN PERBUATAN
OBJEKTIF ESSAY
BENAR-SALAH PILIHAN GANDA MENJODOHKAN ISIAN
LANGKAH • • • • •
IDENTIFIKASI TUJUAN IDENTIFIKASI KOMPETENSI IDENTIFIKASI MATERI (indikator) KISI-KISI BUTIR SOAL
PENGEMBANGAN BUTIR SOAL
CONSTRUCT
DIMENSI
INDIKATO INDIKATOR INDIKATOR INDIKATOR INDIKATOR INDIKATOR INDIKATOR INDIKATOR INDIKATOR INDIKATOR
BUTIR
STANDAR KOMP.
CURRICULUM BASED ASSESSMENT
KOMP. DASAR
INDIKATOR
KEHANDALKAN (KUALITAS) SUATU INSTRUMEN EVALUASI
FAKTOR YANG MENENTUKAN KEHANDALAN SUATU ALAT TES • • • •
NORMA (NORM GROUP) VALIDITAS RELIABILITAS KEADILAN (FAIRNESS)
NORMA (NORM GROUP) • NORMA adalah gambaran tentang kondisi suatu group atau kelompok yang akan menjadi kriteria atau rujukan dalam membandingkan hasil pengukuran. • NORMA adalah gambaran dari kondisi atau karakteristik populasi yang dijadikan dasar dalam pengembangan instrumen dan target dimana evaluasi akan diberlakukan. • NORMA juga adalah kriteria dan lingkup group dimana hasil pengkuran dapat dibandingkan
MACAM-MACAM NORMA (NORM) NORMA NASIONAL
Jika suatu alat tes dikembangkan dengan menggunakan populasi yang merepresentasikan subjek (siswa) secara nasional (mewakili semua wilayah geografis, sosial ekonomi, suku, jenis kelamin, budaya, desa, kota dll.).
NORMA SPESIAL
Jika alat tes dikembangkan dengan menggunakan populasi yang merepresentasikan kelompok tertentu. misalnya alat tes khusus untuk murid perkotaan, pedesaan, osial ekonomi rendah dll.
NORMA LOKAL
Alat tes yang dikembangkan dengan menggunakan populasi yang merepresentasikan kelompok tertentu. misalnya untuk sekolah tertentu, atau daerah tertentu
VALIDITAS • Derajat kemampuan sebuah alat tes untuk mengukur apa sesungguhnya yang hendak diukur. • Suatu alat tes dianggap valid apabila alat tersebut dapat mengukur hal (kemampuan) yang ingin diukur.
VALIDITAS CONTENT VALIDITY CRITERIONRELATED VALIDITY
CONSTRUCT VALIDITY
Instrumen tes mampu mencakup semua isi atau aspek dari kemampuan yang mau diukur. Ada kesesuaian atau keselarasan hasil pengukuran dari sebuah alat dengan hasil dari pengukuran lain yang serupa. Kemampuan dari suatu alat tes untuk mengukur suatu konstruk tertentu yang dikehendaki.
VALIDITAS CONTENT VALIDITY CRITERIONRELATED VALIDITY
CONSTRUCT VALIDITY
Concurrant validity
Predictive validity
Adanya korelasi (kesesuaian) hasil dengan hasil dari pengukuran lain yang ada saat ini
Adanya korelasi (kesesuaian) hasil pengukuran dengan performance subjek di masa mendatang.
RELIABILITAS Reliabilitas adalah derajat kemampuan suatu alat ukur untuk memberikan hasil pengukuran yang konsisten/stabil.
CARA MENGETAHUI RELIABILITAS SUATU ALAT TES TEST-RETEST RELIABILITY
ALTERNATEFORM RELIABILITY
SPLIT-HALF RELIABILITY
Sejauhmana sebuah alat test dapat memberikan hasil yang sama ketika seseorang diukur oleh alat yang sama pada dua kesempatan yang berbeda.
Dua alat tes serupa tetapi dengan item soal berbeda diujikan pada murid yang sama dalam dua kesempatan yang berbeda. Mampu memberikan hasil yang relatif sama. Suatu alat test dibagi menjadi dua bagian (misal ganjil-genap). Hasil pengukuran dari kedua belah bagian menunjukkan hasil yang relatif sama atau konsisten.
KEADILAN (FAIRNESS) • Tes yang adil adalah tes yang tidak bias (unbiased) dan tidak diskriminatif. (McMillan, 2001). • Tes yang adil adalah alat tes yang mampu memberi kesempatan yang sama kepada semua subjek (testee) untuk menunjukkan performance –nya secara maksimal dari bidang kemampuan yang diujikan, tanpa dipenguruhi oleh faktor jenis kelamin, etnis, agama, budaya, kecacatan dan lain-lain. • Jika suatu alat tes lebih menguntungkan suatu kelompok dan merugikan kelompok yang lain, maka alat tersebut dikatakan tidak adil.
MEAN TENDENSI SENTRAL
MEDIAN MODE RANGE
VARIABILITAS STATISTIK DESKRIPTIF
STANDAR DEVIASI NILAI MENTAH PERCENTILE RANK DISTRIBUSI NORMAL
STANINE GRADE EQUIVALENT Z SCORE STANDARD SCORE T - SCORE