ISBN :978-602-73159-0-7 SEMINAR NASIONAL KIMIA DAN PENDIDIKAN KIMIA VII “Penguatan Profesi Bidang Kimia dan Pendidikan Kimia Melalui Riset dan Evaluasi” Program Studi Pendidikan Kimia Jurusan P.MIPA FKIP UNS Surakarta, 18 April 2015 ASSESSMENT PERBAIKAN PEMBELAJARAN
MAKALAH UTAMA
ISBN :978-602-73159-0-7
DIAGNOSTIC ASSESSMENTUNTUK PERBAIKAN PEMBELAJARAN Sri Yamtinah1,* 1Program
Studi Pendidikan Kimia,Jurusan P.MIPA, FKIP, UNS, Surakarta, Indonesia
email:
[email protected] ABSTRAK Salah satu fungsi penilaian dalam pembelajaran adalah menemukan kelemahan dankekurangan proses pembelajaran yang sedang berlangsung guna perbaikan proses pembelajaran berikutnya. Hasil belajar peserta didik merupakan salah satu tolok ukur keberhasilan proses pembelajaran. Dalam setiap proses penilaian semestinya menjadi bahan untuk diagnosis kelemahan dan kelebihan peserta didik. Pengujian diagnostik bertujuan untuk menemukan indikasi seberapa jauh perbedaan antara penampilan/kemampuan dan kemampuan yang diharapkan, atau pengujian yang digunakan untuk mengidentifikasi masalah-masalah spesifik yang mungkin dialami oleh peserta didik. Pengujian diagnostik berbeda dengan pengujian prestasi yang semata-mata hanya memperhatikan skor akhir yang dicapai oleh peserta didik. Pendidik menggunakan instrumen penilaian untuk mendiagnosis pemahaman peserta didik dan panduan pembelajaran. Pendidik dapat menggunakan respon terbuka peserta didik untuk mendapatkan informasi tentang pemahaman peserta didik mengenai isi materi pelajaran. Namun, tuntutan mengajar pada kelas besar menjadi hambatan untuk analisis mendalam tentang tanggapan peserta didik untuk butir tes uraian. Penggunaan butir tes objektif dianggap tidak memberikan informasi diagnostik tentang pemahaman peserta didik lebih cermat, karena skor pada tes objektif umumnya berupa skor dikotomi, yaitu benar dan salah. Sistem Penilaian BEAR (Berkeley Evaluation and Assessment Research) memiliki gagasan mendasar bahwa pemahaman peserta didik yang terbaik adalah apabila dikonseptualisasikan sebagai kontinum, bukan sebagai dikotomi. Kata
Kunci:
pengujian
diagnostik,
uraian,
objektif,
kontinum,
dikot
bahasan dirumuskan dalam setiap kurikulum
PENGANTAR Pendidikan merupakan sebuah proses,
pendidikan,. Pengalaman belajar dapat terjadi
yang di dalamnya paling tidak harus memuat
melalui proses belajar mengajar di kelas
tiga unsur pokok yang saling berkaitan, yaitu
maupun di luar kelas selama waktu yang telah
tujuan
dan
ditentukan.Sementara prosedur penilaian akan
pendidikan
menetapkan langkah-langkah sistematis untuk
belajar,
prosedur yang
pengalaman
penilaian.
dituangkan
belajar,
Kurikulum
dalam
falsafah
negara
menjadi acuan dari tujuan belajar. Tujuan setiap
mata
instruksional
pelajaran
secara
umum
serta setiap
mengetahui ketercapaian tujuan belajar. Penilaian
merupakan
hal
yang
tak
tujuan
terpisahkan dari pembelajaran. Dikatakan oleh
pokok
Popham
(1995:
7)
bahwa
alasan-alasan
ISBN :978-602-73159-0-7 pentingnya
pemahaman dan pelaksanaan
pada peserta didik.
penilaian diantaranya adalah: (1) merupakan alat
untuk
mendiagnosis
Guru menggunakan instrumen penilaian
dan
untuk mendiagnosis pemahaman peserta didik
proses
dan panduan pembelajaran. Guru mungkin
pembelajaran, (2) berguna untuk memonitor
mengharapkan informasi yang lebih kaya
kemajuan
membantu
tentang kinerja peserta didik dari membaca
didik,
(4)
respon lengkap pada butir tes uraian. Harapan
menentukan efektivitas pembelajaran yang
tersebut didasarkan pada anggapan bahwa
telah dirancang, (5) meningkatkan kualitas
skor dari butir tes uraian memiliki validitas
pembelajaran.
yang lebih besar daripada skor pada butir tes
kelemahan
peserta
didik
peserta
menentukan
kekuatan dalam
didik,
tingkatan
(3)
peserta
Sejalan dengan itu Pusat Kurikulum, Balitbang
Depdiknas
(2004)
objektif. Di
menyatakan
dalam
kelas,
guru
dapat
bahwa penilaian berbasis kelas memiliki fungsi
menggunakan respon terbuka peserta didik
sebagai berikut: (1) memberikan informasi
untuk
sejauh mana seorang peserta didik telah
pemahaman peserta didik mengenai isi materi
menguasai suatu kompetensi, (2) menilai hasil
pelajaran. Namun, tuntutan mengajar kelas
belajar peserta didik dalam rangka membantu
besar sering menghambat analisis mendalam
peserta didik memahami dirinya, membuat
tentang tanggapan peserta didik untuk butir
keputusan tentang langkah berikutnya, baik untuk
pemilihan
kepribadian
program,
maupun
(sebagai
penjurusan
(3)
menemukan
bimbingan),
informasi
tentang
uraian. Penggunaan butir tes objektif dianggap
pengembangan
untuk
mendapatkan
tidak memberikan informasi diagnostik tentang pemahaman
peserta
didik
lebih
cermat.
kesulitan belajar peserta didik dan sebagai
Dengan demikian sangat penting untuk dibuat
alat
guru
sebuah instrumen yang dapat mengadopsi
perlu
efektifitas butir tes jenis uraian namun dapat
(4)
juga memanfaatkan efisiensi butir tes objektif.
diagnosis
menentukan mengikuti
membantu
apakah
remedial
menemukan proses
yang
seseorang
atau
kelemahan
pengayaan, dan
pembelajaran
berlangsung
guna
tersebut
sejalan
sedang
dikemukakan
Sistem
proses
(Berkeley
kekurangan
yang perbaikan
Hal
dengan
apa
Penilaian
Evaluationand
yang BEAR
Assessment
pembelajaran berikutnya, (5) sebagai kontrol
Research) yang memiliki gagasan mendasar
bagi guru dan sekolah tentang kemajuan
bahwa pemahamanpeserta didik yang terbaik
perkembangan peserta didik.
adalah apabila dikonseptualisasikan sebagai
Keseluruhan disebutkan
di
fungsi
atas
penilaian
tersebut
tidak
yang lain
merupakan fungsi diagnostik. Guru sebagai pelaku dalam penilaian pendidikan harus memahami fungsi-fungsi penilaian dengan benar. Langthaler dalam Barke (2009: 5) menyatakan
bahwa
seorang
guru
yang
memiliki kemampuan dan alat diagnostik yang baik tidak akan menimbulkan banyak masalah
kontinum, bukan sebagai dikotomi.
TES OBJEKTIF OBJEKTIF
DAN
TES
NON
Alat ukur yang biasa digunakan dalam penilaian pendidikan terdiri atas tes dan nontes. Alat
ukur
berupa
tes
umumnya
memberikan informasi tentang karakteristik pengetahuan dan ketrampilan dari peserta tes.
ISBN :978-602-73159-0-7 Sementara alat ukur nontes yang dapat
menebak tetapi benar, maksudnya peserta
berupa angket, lembar observasi, maupun
yang termasuk memiliki kemampuan rendah
pedoman wawancara menghasilkan informasi
tetapi menjawab benar suatu butir soal yang
tentang karakteristik sikap dan ketrampilan
taraf
dari peserta.
kemampuannya. Selain itu pesertates objektif
Bentuk
tes
yang
digunakan
dapat
kesulitannya
lebih
tinggi
dari
umumnya cenderung kurangintensif dalam
dikategorikan menjadi dua, yaitu tes objektif
belajar karena tersedianyaalternatif
dan tes non-objektif. Objektif di sini dilihat dari
jawabanyang dapatdipilih sehingga memiliki
sistem penskorannya, yaitu siapa saja yang
peluang
memeriksa
akan
menghadapi butir soal yang tidak dikuasainya.
Bahkan
Bahkan dimungkinkan terjadi blind guessing,
pemberian skor pada tes bentuk ini dapat
yaitu memberikan respon pilihan jawaban
dilakukan oleh orang yang tidak mempunyai
tanpa membaca terlebih dahulu butir soalnya.
lembar
menghasilkan
latar
belakang
skor
jawaban yang
tes
sama.
Selain permasalahan guessing, hal lain
tentang bahan yang diujikan (Fernandes,
yang sering muncul pada butir soal objektif
1984: 22-23). Oleh karena siapa pun yang
adalah adanya kecenderungan penyusun soal
memeriksa akan memberikan skor yang sama,
untuk menempatkan kunci jawaban berada di
sehingga kesalahan karena penskoran dapat
tengah, misal b atau c bahkan tak jarang pula
menjadi kecil atau bahkan nol, apalagi bila
membuat kunci jawaban berpola. Hal tersebut
digunakan komputer dalam penskoran. Tes
jelas akan memberi peluang lebih pada
objektif pada pengukuran pendidikan banyak
peserta
didik
digunakan baik di dalam kelas maupun pada
bahkan
dengan
tes berskala besar, seperti tes TPA (Tes
tingginya tebakan, maka akibatnya adalah
Potensi Akademik), tes TOEFL (Testof English
daya beda butir soal menjadi rendah. Dengan
maupun
Language),
yang
untukmenebak jawaban pada saat
cukup
Foreign
pengetahuan
pilihan
UN
(Ujian
Nasional). yang baik relatif lebih sulit bila dibandingkan dengan bentuk uraian. Pada tes objektif harus option
yang
berfungsi
sebagai
pengecoh, dan fungsi pengecoh inilah yang menjadi
kesulitan
pada
penyusunannya.
Pengecoh yang baik tidak hanya semata-mata bukan merupakan kunci jawaban, namun harus mampu mengecoh peserta yang tidak menguasai materi dengan baik. Efek tidak berfungsinya pengecoh akan menyebabkan reliabilitas skor menjadi rendah. Pada bentuk tes objektif, khususnya pilihan
blind
melakukan
tebakan,
guessing.
Dengan
tebakan juga, maka variasi respon jawaban akan menjadi homogen dan hal tersebut akan
Namun demikian menyusun tes objektif
dibuat
untuk
ganda,
terdapat
hal
yang
perlu
diperhatikan oleh penyusunnya yaitu aspek
menyebabkan penurunan reliabilitas tes. Pada tes bentuk obyektif, yang umumnya hanya di skor dalam model dikotomi, yaitu benar dan salah atau sering dengan skor benar = 1 dan salah = 0 secara sepintas tidak menimbulkan permasalahan. Akan tetapi jika diperhatikan ada dua hal yang menarik, yaitu (1) proses kognitif yang telah dilakukan oleh peserta tes tidak dihargai sama sekali ketika respon
pilihan
jawabannya
pengecoh
bukan
(jawaban
salah),
pada padahal
adalah
kunci untuk
pada
jawaban dapat
memberikan jawaban tersebut pasti peserta sudah berusaha melalui proses berpikir, (2)
ISBN :978-602-73159-0-7 dengan hanyamemberikan skor dikotomi 1
bahwa tes uraian memberikan informasi lebih
untuk jawaban benar dan 0 untuk jawaban
tentang kemampuan peserta didik. Akan tetapi
salah, maka hal tersebut berlaku untuk seluruh
tes uraian memiliki kelemahan dalam proses
butir soal dengan tingkat kesulitan yang
pemeriksaan respon peserta dan pemberian
beragam mulai dari mudah, sedang bahkan
skor karena membutuhkan waktu yang lama
soal
dan menjadi sebuah kesulitan tersendiri pada
yang
sukar.
Butir-butir
soal
yang
mengukur tingkat kemampuan tinggi (tingkat
pendidik yang mengajar pada kelas besar.
kesulitan tinggi) memiliki skor yang sama
Memperhatikan
pentingnya
dengan butir-butir soal yang mengukur tingkat
melaksanakan diagnosis bagi peserta didik
kemampuan rendah (tingkat kesulitan rendah)
dan dengan melihat kelemahan-kelemahan
(Mardapi, 1999: 9).
yang ada pada tes objektif dan tes uraian,
Tes non-objektif yang juga sering disebut tes
uraian
adalah
tes
yang
sistem
maka
sangat
penting
untuk
mengkreasi
alternatif-alternatif bentuk tes lain. Bentuk tes
penskorannya dipengaruhi oleh pemberi skor
yang
atau dipengaruhi oleh subjektivitas pemberi
kelebihan
skor. Subyektifitas pemberi skor menyebabkan
efisiensipemeriksaan respon jawaban peserta
variasi skor yang tinggi sehingga reliabilitas
didik dan kelebihan tes uraian dalam hal
skor menjadi rendah. Alternatif yang dapat
efektifitas informasi yang dihasilkan.
dilakukan
untuk
mengurangi
dimaksud tes
dapat
menggabungkan
objektif
dalam
hal
subyektifitas
pemberian skor adalah dengan membuat rubrik
penskoran.
Dengan
rubrik
penskoran
maka
menggunakan acuan
dalam
memberikan skor terhadap respon uraian jawaban peserta didik sudah disiapkan.
DIAGNOSTIC ASSESSMENT Diagnosis diadopsi
dari
merupakan bidang
istilah
medis.
yang
Menurut
Bentuk tes uraian tidak menyediakan
Thorndike dan Hagen (Abin Syamsudin, 2002:
alternatif jawaban dan tidak terdapat peluang
307), diagnosis dapat diartikan sebagai : (a)
untuk menebak jawaban sehingga peserta tes
upaya atau proses menemukan kelemahan
harus mempunyai persiapan yang cukup
atau penyakit (weakness,disease) apa yang
intensif dalam menghadapi tes. Tes uraian
dialami seseorang dengan melalui pengujian
merupakan bentuk tes yang menuntut peserta
dan studi yangseksama mengenai gejala-
didik
gejalanya (symtoms); (b) studi yang seksama
untuk
mengorganisasikan
proses
berpikirnya ke dalam jawaban yang ditulisnya
terhadap
dan memberikan kebebasan kepada setiap
menemukan
peserta didik untuk mengekspresikan daya
kesalahan dan sebagainya yang esensial; (c)
nalarnya sehingga jawaban yang diberikan
keputusan yang dicapai setelah dilakukan
oleh
suatu studi yang saksama atas gejala-gejala
setiap
peserta
kemampuan
berpikir
akan secara
menunjukkan kompleks.
fakta
tentang
karakteristik
suatu atau
hal
untuk
kesalahan-
atau fakta-fakta tentang suatu hal.
uraian
Berdasakan ketiga pengertian di atas,
merupakan bentuk tes yang sangat baik untuk
dapat disimpulkan bahwa di dalam konsep
mengukur pemahaman peserta didik terhadap
diagnosis, secara implisit telah tercakup pula
materi yang dipelajarinya sehingga dikatakan
konsep
Dengan
demikian
bentuk
tes
prognosisnya.
Dengan
demikian
ISBN :978-602-73159-0-7 sekadar
(key concepts) pada topik tertentu, secara
mengidentifikasi jenis dan karakteristiknya,
khusus untuk konsep-konsep yang cenderung
serta latar belakang dari suatu kelemahan
dipahami secara salah. Berdasarkan pendapat
atau
ini,
proses
diagnosis
penyakit
bukan
hanya
tertentu,
melainkan
juga
upaya
untuk
diagnostik, yaitu topik terbatas dan spesifik,
meramalkan kemungkinan dan menyarankan
serta ditujukan untuk mengungkap kesulitan
tindakan pemecahannya.
belajar.
mengimplikasikan
Definisi
suatu
lain
dari
tes
diagnostik
dapat
diidentifikasi
Penilaian
ciri-ciri
diagnostik
pengujian
adalah
suatu
dikemukakan oleh Oriondo dan Dallo-Antonio
pendekatan
yang
diagnosis
dalam pengukuran. Dalam pengujian yang
merupakan identifikasi dan upaya mengetahui
lain, para peserta didik dapat memperoleh
letak
tertentu
skor yang sama untuk kesulitan belajar yang
diagnostik
berbeda tetapi di dalam pengujian diagnostik
menyatakan kelebihan
dalam
dan
kinerja.
didefinisikan
bahwa kekurangan
Pengujian
sebagai
sangat
menguntungkan
untuk
perbedaan-perbedaan ini dapat ditemukan
mengetahui ketidakmampuan dalam kinerja,
dan menjadi informasi bersama antar peserta
dan jika mungkin mengetahui penyebabnya
didik
(Oriondo
memberikan peluang melakukan suatu proses
&
pengujian
yang
Dallo-Antonio,
1994:
228).
dan
guru.
Penilaian
diagnostik
Pengujian diagnostik adalah pengujian untuk
pengujian
menemukan
tambahan selain tujuan-tujuan yang telah
indikasi
seberapa
jauh
untuk
melayani
satu
tindakan
perbedaan antara penampilan /kemampuan
ditetapkan,
dan
atau
mengintegrasikan proses pembelajaran dan
untuk
penilaian. Lebih lanjut pengujian diagnostik
spesifik
dapat menemukan bahan pelajaran yang
yang mungkin dialami oleh peserta didik
bermakna terhadap masing-masing peserta
(Weeden, et al, 2002: 20). Dari dua pendapat
didik (Mc Glohen, 2004: 33).
kemampuan
pengujian
yang
yang
mengidentifikasi
diharapkan,
digunakan
masalah-masalah
di atas dapat dikatakan bahwa pengujian
dan
dapat
Sementara
digunakan
Tatsuoka
untuk
menyoroti
diagnostik adalah pengujian yang bertujuan
keterbatasan model skor tradisional yang
untuk
dan
berfokus pada butir tes dan skor total pada
kekurangan peserta didik berkaitan dengan
analisis makrolevel, dan dia mendukung untuk
kemampuan yang dimiliki dan kemampuan
menyelidiki struktur pengetahuan peserta didik
yang diharapkan.
dari analisis mikrolevel. Untuk melakukan
mengidentifikasi
kelemahan
Pengujian diagnostik adalah bagian dari
analisis
mikrolevel
ini,
penting
untuk
pengujian prestasi (Mehren & Lehmann, 1984
menentukan
:410). Selanjutnya dikatakan bahwa pengujian
menjelaskan pemecahan masalah dengan
diagnostik
yang
mengidentifikasi
gambaran
akurat
dimiliki
oleh
baik
dapat
tentang
peserta
memberikan
kesulitan
didik
yang
berdasarkan
informasi kesalahan yang dibuatnya. Zeilik (1998)
menyatakan
pengujian
diagnostik
model
kognitif
komponen
yang proses
dapat yang
diperlukan untuk memecahkan masalah, untuk itu
perlu
dikembangkan
tes
diagnostik
(Tatsuoka dalam Gierl, 2007: 147). Salah satu tujuan pemberian pengujian
digunakan untuk menilai pemahaman konsep
diagnostik
peserta didik terhadap konsep-konsep kunci
gambaran pemahaman peserta didik terhadap
adalah
untuk
mengetahui
ISBN :978-602-73159-0-7 konsep yang telah dipelajarinya. Oleh karena
dengan
itu syarat utama pengembangan butir tes
informasi berharga tentang kesalahpahaman
untuk perangkat soal ini adalah butir tes harus
peserta didik dalam domain target. Gorin
mencerminkan cakupan konsep yang telah
dalam
dipelajari oleh peserta didik. Artinya pada
menyatakan bahwa pengujian diagnostik yang
memori jangka panjang setiap peserta didik
baik adalah yang dapat melakukan estimasi
telah
tentang
secara keseluruhan atas level kemampuan
konsep. Pemahaman ini dapat diidentifikasi
seseorang. Informasi yang spesifik harus
melalui jawaban yang diberikan peserta didik
dapat diperoleh dari respon peserta didik yang
berupa rangsangan soal-soal.
menunjukkan kelemahan atau inkonsistensi
terbentuk
Mehrens
suatupemahaman
&
Lehmann
(1984
:
410)
cermat,
diagnosis
Leighton
pengetahuan
&
dan
Gierl
memberikan
(2007:
177)
menunjukkan
potret
pengujian
kemampuan peserta didik. Dengan kata lain,
diagnostik diharapkan memenuhi dua asumsi,
informasi yang diperoleh dari respon peserta
yaitu
didik
menyatakan :
pengembangan
(1).
Uji
diagnostik
ini
mampu
menganalisis keterampilan atau pengetahuan untuk
dimasukkan
keterampilan, diagnostik
dan atau
ke
komponen
(2).
Butir
peserta didik memberikan respon demikian.
sub-
Penggunaan instrumen tes diagnostik
instrumen
dalam proses pembelajaran kimia di kelas
yang
sebagai
sub-
direncanakan juga akan memungkinkan guru
keterampilan tersebut. Hal ini menjelaskan
untuk mendiagnosis konsepsi peserta didik di
bahwa untuk mengembangkan instrumen tes
wilayah
kognitif
tertentu
diagnostik
langkah
pertama
sebagai
sarana
pemulihan
dilakukan
adalah
menetapkan
dikembangkan
tes
harus dapat menjelaskan mengapa
diagnostik
mampu
mengukur
yang
harus
sarana
penilaian
formatif
serta
yang
berfungsi
sebelum
ada
cakupan
penilaian sumatif (Treagust, 2006:123). Dalam
konsep sebagai dasar mengembangkan butir
belajar untuk pencapaian prestasi tertentu
tes.
akan
Penetapan
cakupan
ini
disesuaikan
menuntut
prestasi-prestasi
lainnya
di
sebagai prasyarat. Hal ini berarti, proses
diagnosa, agar butir tes yang dikembangkan
belajar akan berlangsung dengan cepat, bila
mengukur apa yang hendak diukur. Oleh
hasil yang dicapai terbatas dan prasyarat-
dengan
karena
keadaan
itu
merupakan
bukti hal
subjek
adanya sentral
yang
akan
kesahihan selama
isi
proses
pengembangan tes (AERA/APA/NCME dalam Hughes, 1997). Kesimpulan ini mendukung pendapat Mehren & Lehmann (1984: 418) yang
menyatakan
instrumen
tes
bahwa
pengembangan
diagnostik
sangat
Diagnosis merupakan bagian integral dari keputusan
sudah
terpenuhi.
Proses
akan
berlangsung lebih lama bila hasil yang dicapai bersifat kompleks dan prasyarat-prasyarat belum terpenuhi. Jika suatu materi yang dipelajari peserta didik memerlukan penguasaan materi lain sebagai prasyarat, maka peserta didik harus menguasai materi sebagai prasyarat tersebut
memperhatikan kesahihan isi.
pengambilan
prasyarat
pembelajaran.
Sebagai jembatan antara identifikasi peserta didik yang mungkin mengalami risiko gagal dan pemberian tambahan yang dirancang
sebelum peserta didik melanjutkan ke materi berikutnya.
Kenyataan
ini
memerlukan
informasi tambahan mengenai penguasaan terhadap
materi
memberikan
prasyarat
petunjuk
bagi
dan
sekaligus
guru
untuk
ISBN :978-602-73159-0-7 menuntaskan kesulitan belajar pada peserta
mengandung
didiknya. Mempelajari suatu materi
pemahaman peserta didik yang tidak dapat
yang
informasi
perkembangan
memerlukan penguasaan materi sebelumnya
diterapkan pada
sebagai prasyarat akan menunjukkan terdapat
tradisional, juga bahwa butir-butir OMC dapat
suatu rangkaian prestasi belajar yang tersusun
dikoreksi secara cepat dan reliabel tidak
secara hirarkis dan tes diagnostik yang juga
seperti butir-butir open ended tradisional. Kunci utama pada
dapat berperan sebagai tes formatif sangat butir
dibutuhkan.
butir-butir
OMC
adalah
pilihan ganda
pengembangan pada
construct
map.Istilah lain dari construct map adalah learning progression. Construct map adalah bentuk
pendekatan
perkembangan
untuk
INSTRUMEN-INSTRUMEN DIAGNOSTIC ASSESSMENT
mengukur
Order Multiple Choice (OMC)
uni dimensionalitas pada masing-masing level.
Briggs, et al (2006) mengembangkan Ordered
Multiple
Choice
(OMC)
sebagai
instrumen asesmen untuk fungsi diagnostik. OMC
dikembangkan
pemahaman
peserta
didik.
Construct map digunakan untuk menyatakan
Masing-masing level merefleksikan tingkatan hirarkis dari pemahaman materi (Briggs, et al, 2006: 56).
dengan
Briggs, et al (2006: 57) menyatakan
mengkombinasikan efisiensi pilihan ganda
bahwa terdapat dua kriteria untuk memilih
tradisional dengan kelebihan kualitatif dari
cakupan materi sebagai construct map yaitu
respon
Potensi
(1) adanya literatur yang menggambarkan
efisiensi berasal dari fakta bahwa OMC
cakupan materi yang sering menimbulkan
mengandung
kesulitan belajar peserta didik, (2) kekhususan
pertanyaan
open-ended.
seperangkat
option
respons
peserta didik yang dapat di skor secara
cakupan
objektif. Potensi secara kualitatif didasarkan
kompetensi.
materi
tersebut
dalam
standar
bahwa pada masing-masing respons OMC di
Proses penyusunan contruct map dapat
desain berhubungan dengan respon jawaban
dilakukan melalui forum FGD (FocusGroup
peserta didik atas pertanyaan open-ended,
Discussion) dan Delphi untuk menghasilkan
dan jawaban ini secara eksplisit berhubungan
atribut-atribut. Atribut adalahproses kognitif
dengan level dari learning progression.
atau keterampilan dasar yang dibutuhkan
Format butir OMC dapat digunakan pada
untuk memecahkan tes. Peserta didik yang
kelas besar di mana butir-butirnya tidak
diuji
semata-mata ditujukan untuk pilihan jawaban
menjawab butir tes dengan benar. Oleh
benar dari peserta didik tetapi lebih pada
karena itu, atribut
diagnosis tentang alasan dibalik pemilihan
sumber dari kompleksitas kognitif pada hasil
jawaban benar peserta didik. Masing-masing
tes..seperti
kemungkinan pilihan jawaban peserta didik
Stoikiometri kelas X:
dihubungkan dengan perkembangan level pemahaman peserta
peserta
didik
didik,
dan
respons
dapatdidiagnosis
secara
interpretatif. Dengan kata lain butir-butir OMC
harus
memiliki
berikut
atribut-atribut
untuk
dapat dilihat sebagai dalam
contoh
materi
a. Simbol atom b. Ar (Massa Atom Relatif) dan Mr (Massa Molekul Relatif) c. Reaksi kimia sederhana dan Penyetaraannya
ISBN :978-602-73159-0-7 d. Hukum dasar Lavoisier, Proust dan Dalton e. Mol (jumlah partikel, massa, volume gas: STP, non STP,) f. Rumus kimia: rumus empiris dan rumus molekul g. Hukum dasar: Hipotesa Avogadro, Gay Lussac dan penentuan volume yangditentukan pada keadaan gas lain) h. Pereaksi pembatas (Sri Yamtinah, 2014: 117)
Orderred
Multiple
Choice
(OMC)dikembangkan CognitiveDiagnostik
berdasarkan Model,
model
pengukuran
terbaru yang dihubungkan dengan modelkognitif. Dari construct map yang diperoleh, selanjutnya disusun
atribut-atribut
sesuai
dengan
konsep
Attribute Hierarchy Model (AHM). Attribute Hierarchy Method (AHM) adalah metode psikometri untukmengklasifikasikan respon jawaban butir dari peserta ujian menjadi satu set pola atribut terstruktur terkait dengan komponen yang berbeda dari model kognitif kinerja tugas.
(Sri Yamtinah, 2014: 118)
AHM ini didasarkan pada asumsi bahwa kinerja tes tergantung pada satu set kompetensi hierarkis berjenjang yang disebut atribut kognitif. Atribut membentuk
hirarki
keterampilan
kognitif
mendefinisikan urutan psikologis antara atribut yang
Berdasarkan atribut pada AHM tersebut dapat dibuat seluruhkemungkinan butiryang dapat dibuat dengan menyusun matriks Qr.
diperlukan untuk memecahkan butir tes. Hirarki atribut ini merupakan model kognitif kinerja atau tugas. Hirarki memainkan peran mendasar dalam AHM karena mengarahkan pengembangan tes dan panduan analisis sehingga skor tes psikometri memiliki nilai diagnostik (Gierl, 2007: 331; Gierl, Wang & Zhou, 2008). Berdasarkan atribut-atribut Stokiometri di atas disusun hirarki atribut sebagai
Salah satu contoh butir OMC adalah sebagai berikut : Gas hidrogen dalam laboratorium dapat dibuat dengan mereaksikan antara logam Aluminium (Ar=27) dengan larutan asam sulfat. Untuk membuat 6,72 liter gas hidrogen (0 oC, 1 atm), maka H.
berikut:
a. Perbandingan mol Al : H2SO4 : Al2(SO4)3 : H2 = 2 : 3 : 1 : 3 b. Persamaan reaksi : 2Al(s) + 3H2SO4(aq)
Al2(SO4)3(aq) + 3H2(g)
ISBN :978-602-73159-0-7 c. Massa Al yang dibutuhkan pada reaksi tersebut =5,4 gram
dengan mengalikan mol dan massa atom relatif
(Ar
Al).
Prinsip
penskoran
yang
digunakan adalah politomus, yaitu skor pada d. Jumlah mol H2 yang dihasilkan pada reaksi tersebut= 0,3 mol
masing-masing pilihan adalah option B (skor 1), option D (skor 2), option A (skor 3) dan
Pada butir OMC tersebut, masing-
option C (skor 4).Diagnosis dilakukan dengan
masing pilihan adalah jawaban benar yang
memperhatikan pilihan jawaban peserta didik.
berasal dari urutan langkah mengerjakan.
Pilihan
Langkah pertama untuk dapat menyelesaikan
kemampuan atau level yang dimiliki oleh
soal tersebut adalah apabila peserta didik
peserta didik.
jawaban
tersebut
menunjukkan
dapat menyelesaikan persamaan reaksi (opsi B), selanjutnya adalah mengubah volume gas
Dengan menambahkan profil individu
hidrogen menjadi mol (opsi D). Kemudian
peserta didik akan memberikan kemudahan
dengan membuat perbandingan mol (opsi A)
bagi pendidik untuk melakukan analisis. Profil
dan
massa
individu dibuat dengan melakukan bantuan
aluminium (opsi C). Tingkat kesulitan pada
excel yang menampilkan kemampuan peserta
langkah-langkah
didik. Profil individu dapat berfungsi sebagai
akhirnya
dapat
menghitung
tersebut
tidak
berurutan,
artinya option C yang menjadi level tertinggi
laporan
pada penyelesaian soal tersebut justru adalah
dihasilkaninformasi
langkah paling mudah, yaitu hanya dengan
yang telah dikuasai dan yang belum dikuasai
mengkonversikan mol yang diperoleh pada
oleh peserta didik.
level 3 (opsi A) ke dalam massa aluminium
yang
informatif tentang
karena
konsep-konsep
ISBN :978-602-73159-0-7
(Sri Yamtinah, 2014 : 196)
ISBN :978-602-73159-0-7 Testlet No
Skor
Sebuah butir soal yang kompleks tak jarang membutuhkan beberapa langkah dalam menyelesaikannya yang bersifat hirarkis dan setiap langkah tersebut merupakan suatu konsep.
Terdapat
jenis
tes
yang
dapat
digunakan untuk merunut potensi kemampuan pemahaman peserta didik dalam mengerjakan butir soal tersebut. Dimana setiap konsep menjadi sebuah butir soal tersendiri, maka sebuah soal utama akan didampingi beberapa soal pendukung yang merupakan langkahlangkah mengerjakan soal utama. Sehingga
Aspek Penilaian 1 Siswa tidak dapat menyelesaikan soal pendukung no 1 dengan benar Siswa dapat menyelesaikan soal 2 pendukung no 1 dengan benar , tetapi tidak dapat menyelesaikan soal pendukung no 2
tes
yang
dimaksud
adalah
testlet
yang
berdasar definisinya diartikan sebagai tes kecil (Wainer & Lewis, 1990: 1).
Prosedur
sebuah soal utama diikuti dengan beberapa soal pendukung. Soal-soal pendukung ini dependen
konsep-konsepnya
karena
memang
sifat
yang
hirarkis.
Soal
pendukung no 1 merupakan konsep dasar sehingga berperan menjadi dasar bagi soalsoal pendukung berikutnya. Apabila soal pendukung no 1 dijawab salah oleh peserta didik, maka peserta didik tersebut memperoleh skor terendah meskipun mungkin menjawab benar pada soal pendukung 2 dan seterusnya karena logikanya jika tidak dapat menjawab benar soal pendukung 1 maka tidak akan bisa menjawab
benar
dapat
penskoran
digunakan
untuk
tersebut
2
3
akan
mendiagnosis
kelemahan dan kelebihan siswa. Selain itu akan dapat di deteksi letak kelemahan siswa.Salah satu contoh butir soal model testlet adalah sebagai berikut:
Sebuah soal jenis testlet ini terdiri dari
bersifat
1
Siswa dapat menyelesaikan soal 3 pendukung no 1 dan 2 dengan benar, tetapi tidak dapat menyelesaikan soal pendukung no 3 Siswa dapat menyelesaikan keseluruhan 4 soal pendukung dengan Benar
sebuah butir soal terdiri dari beberapa butir soal yang merupakan satu kelompok. Jenis
0
soal-soal
pendukung
berikutnya. Hal tersebut akan berpengaruh terhadap skor yang diperoleh siswa, proses pemberian skor akan menggunakan metode Graded Respon Model (GRM) sebagai berikut:
Soal utama: Sebanyak 5,4 gram aluminium larut dalam asam klorida membentuk aluminium klorida dan gas hidrogen. Gas hydrogen yang terjadi diukur pada saat 11 gram CO2 mempunyai volume 6 liter. Soal-soal pendukung: Reaksi setara antara aluminium dan asam 1. klorida membentuk aluminium klorida dan gas hidrogen adalahH. a. Al(s) + HCl (aq) AlCl3(aq) + H2 (g) b. 2Al(s) + 2HCl (aq) 2AlCl(aq) + H2 (g) c. Al(s) + 2HCl (aq) AlCl2(aq) + H2 (g) d. 2Al(s) + 6HCl (aq) 2AlCl3(aq) + 3H2 (g) 2. Perbandingan mol senyawa-senyawa dalam reaksi tersebut adalah .... a. 1 : 1 : 1 : 1 b. 2 : 2 : 2 : 1 c. 1 : 2 : 1 : 1 d. 2 : 6 : 2 : 3 3. Volume hidrogen yang terbentuk adalahH. a. 4,8 liter c. 12 liter b. 7,2 liter d.24 liter
ISBN :978-602-73159-0-7
Layout program analisis data kesulitan belajar kimia dengan model testlet
ISBN :978-602-73159-0-7 penambahan profil individu pada tes jenis testlet
bagi
mulai sheet 2 dan seterusnya guru akan dapat
kemampuan
memperoleh informasi berupa laporan profil
peserta didik karena memuat konsep yang
individu peserta didik, yang berisi kemampuan
dikuasai
yang
pendidik
ini
memberikan untuk dan
kemudahan
melihat skor total pada sheet yang sama, dan
menganalisis tidak
dikuasai.
Dengan
sudah
dikuasai
dan
yang
belum
melalukan entry data respon jawaban peserta
dikuasai. Contoh laporan individu peserta didik
didik pada sheet 1, maka guru akan dapat
adalah
sebagai
berikut
Layout profil belajar peserta didik Two Tier Test
Respon jawaban peserta
Tes jenis two tier ini merupakan tes dua tingkat yang dikembangkan untuk keperluan
3 Soal pertama benar, alasan benar
mendiagnosis kesulitan belajar peserta didik. Pertama kali dikembangkan oleh Treagust
Skor
2 Soal pertama benar, alasan salah
(2006) berupa dua butir soal objektif di mana butir soal pertama merupakan soal utama
1 Soal pertama salah, alasan benar
dan butir soal kedua merupakan alasan atas 0
jawaban dari butir soal pertama. Tes two tier yang dikembangkan oleh Treagust menerapkan penskoran bahwa skor akan diberikan atau dianggap benar apabila peserta memilih jawaban benar pada butir soal pertama dan memilih alasan yang juga benar. Namun system penskoran dapat juga dikembangkan dengan jalan sebagai berikut:
Soal pertama salah, alasan salah
ISBN :978-602-73159-0-7 Salah tieradalah:
satu
contoh
butir
soal
two
Sebanyak 75,6 gram dinitrogen pentaoksida (P2O5) dipanaskan dalam ruang 5 liter sehingga terurai membentuk NO2 dan O2. Jika pada 10 detik pertama terbentuk 0,1mol Oksigen, laju peruraian N2O5 adalah ...... A.
0,04 M/detik
D. 0,004 M/detik
B.
0,014 M/detik
E. 0,002 M/detik
C.
0,01 M/detik
Alasanmemilih jawaban tersebut adalah H
Respon jawaban peserta
Skor
Soal pertama benar, alasan benar
3
Soal pertama benar, alasan salah
2
Soal pertama salah, alasan benar
1
Soal pertama salah, alasan salah
0
Salah tieradalah:
satu
contoh
butir
soal
Sebanyak 75,6 gram dinitrogen pentaoksida (P2O5) dipanaskan dalam ruang 5 liter sehingga terurai membentuk NO2 dan O2. Jika pada 10 detik pertama terbentuk 0,1mol Oksigen, laju peruraian N2O5 adalah ......
A.
Persamaan reaksi yang terjadi adalah 2N2O54NO2 + O2
B.
Jumlah mol dinitrogen pentaoksida yang tersisa adalah 0,2 mol
C.
Jumlah mol dinitrogen pentaoksida yang terurai adalah 0,5 mol
A.
0,04 M/detik
D. 0,004 M/detik
B.
0,014 M/detik
E. 0,002 M/detik
Bentuk soal two tier dapat juga dikembangkan dengan menggunakan alasan bukan sebagai butir soal pilihan ganda, tetapi alasan terbuka sehingga peserta harus menuliskan sendiri alasan pemilihan jawaban pada butir soal pertama. Sekarang ini telah juga dikembangkan butir soal three tier, dimana butir soal terdiri dari tiga bagian. Bagian pertama adalah soal utama, butir kedua adalah alasan pemilihan jawaban pada soal pertama, butir ketiga adalah alasan pemilihan jawaban pada butir kedua.
D.
0,01 M/detik
Two Tier Test Tes jenis two tier ini merupakan tes dua
two
Alasanmemilih jawaban tersebut adalah H B.
Persamaan reaksi yang terjadi adalah 2N2O54NO2 + O2
D.
Jumlah mol dinitrogen pentaoksida yang tersisa adalah 0,2 mol
E.
Jumlah mol dinitrogen pentaoksida yang terurai adalah 0,5 mol Bentuk
soal
two
tier
dapat
juga
dikembangkan dengan menggunakan alasan bukan sebagai butir soal pilihan ganda, tetapi alasan
terbuka
sehingga
peserta
harus
tingkat yang dikembangkan untuk keperluan
menuliskan sendiri alasan pemilihan jawaban
mendiagnosis kesulitan belajar peserta didik.
pada butir soal pertama. Sekarang ini telah
Pertama kali dikembangkan oleh Treagust
juga dikembangkan butir soal three tier,
(2006) berupa dua butir soal objektif di mana
dimana butir soal terdiri dari tiga bagian.
butir soal pertama merupakan soal utama
Bagian pertama adalah soal utama, butir
dan butir soal kedua merupakan alasan atas
kedua adalah alasan pemilihan jawaban pada
jawaban dari butir soal pertama.
soal pertama, butir ketiga adalah alasan
Tes two tier yang dikembangkan oleh Treagust menerapkan penskoran bahwa skor akan diberikan atau dianggap benar apabila
pemilihan jawaban pada butir kedua.
PENUTUP Pengujian diagnostik adalah pengujian
peserta memilih jawaban benar pada butir soal pertama dan memilih alasan yang juga
yang
bertujuan
untuk
mengidentifikasi
benar. Namun system penskoran dapat juga
kelemahan dan kekurangan peserta didik
dikembangkan dengan jalan sebagai berikut:
berkaitan dengan kemampuan yang dimiliki
ISBN :978-602-73159-0-7 dan kemampuan yang diharapkan. Pada
[3] Briggs, D.C., Alonzo, A.C., Schwab,
konsep-konsep yang bersifat hirarkis, menjadi
C., & Wilson, M. (2006). Diagnostik
hal
Assessment With Ordered Multiple-
yang
penting
melakukan
bagi
pendidik
untuk
pengujiandiagnostik
agar
diketahui benar kemampuan peserta didik pada materi-materi prasyarat yang diperlukan untuk mempelajari materi-materi lanjut.
Choice
Items.
Assessment, 11(1), 33-63 [4] Fernandes, H.J.X.(1984). Testing and measurement.
Pengujian diagnostik bukan sekedar mengetahui skor akhir atau prestasi peserta
Educational
Jakarta:
National
Education Planning, Evaluation and Curriculum Development.
didik, namun harus dapat menemukan letak
[5] Gierl, M.J (2007). Making Diagnostic
kelemahan peserta didik sehingga pendidik
Inferences About Cognitive Attributes
dapat
tersebut
Using the Rule-Space Model and
sebelum memasuki materi lanjut. Pengujian
Attribute Hierarchy Method. Journal of
dengan
EducationalMeasurement
memperbaiki
kelemahan
menggunakan
tes
uraian
membutuhkan waktu yang relatif lama dalam
Winter
2007, Vol. 44, No. 4, pp. 325–340
pemeriksaan respon jawaban peserta didik, namun tes objektif dengan model skor
[6] Gierl, M.J., Wang, C., & Zhou, J.
dikotomi tidak memberikan informasi yang
(2008). Using the Attribute Hierarchy
cukup untuk sebuah tujuan diagnostik.
Method toMake Diagnostic Inferences
Bentuk-bentuk tes alternatif yang dapat
about Examinees the SAT©. Journal
menggabungkan kelebihan tes objektif dalam
of
hal efisiensi pemeriksaan respon jawaban
Assessment, 6(6). Retrieved
peserta didik dan kelebihan tes uraian dalam
Technology,
Learning,
and
[7] [date] from http://www.jtla.org
hal efektifitas informasi yang dihasilkan perlu dipertimbangkan
oleh
pendidik
untuk
diterapkan dalam pengujian diagnostik. Yang juga
perlu
dipertimbangkan
adalah
penggunaan model penskoran yang politomus agar analisis diagnostik yang dilakukan oleh guru menjadi lebih bermakna.
[8] Leighton, J.P & Gierl, M.J (2007). Cognitive theory
Pendidikan: Pengajaran
University Press [9] Mardapi,
Djemari
(1999).
disampaikan
PenataranEvaluasi (2002)
Psikologi
Perangkat
Sistem
Modul.Bandung:
PT
Remaja Rosdakarya [2] Barke,H.D, Al Hazari & Yitbarek,S (2009). Misconceptions in Chemistry, AddressingPerceptions in Chemical Education. German: Springer-Verlag BerlinHeidelberg.
Cambridge
andapplications.
Makalah Syamsudin.
Assessment:
Pengukuran, penilaian dan evaluasi.
DAFTAR PUSTAKA [1] Abin
Diagnostik
Matematika
pada
Pembelajaran
untuk
Guru
Inti
Matematika. tanggal 8 –23 Nopember 1999
di
PPPG
Matematika
Yogyakarta. [10] Mc
Glohen,M.K.
(2004).
The
application of a cognitive diagnosis model via an analysis of a large-scale assessment
and
a
computerized
ISBN :978-602-73159-0-7 adaptive
testing
administration.
Disertasi. The university of Texas at Austin. Diakses tanggal 10 Juli 2010, dari scholer.google.com [11] Mehren, W.A & Lehmann, I.J (1984). Measurement
and
Evaluation
in
Education andPsychology. New York, NY: Rinehart and Winston [12] Oriondo, L.L., & Dallo-Antonio, E.M. (1984).
Evaluating
outcomes
(tesis,measurement
evaluation).
Manila:
educational
REX
and
Printing
Company, INC. [13] Popham,
W
(1995).
Classroom
Assessment. What Teacher Need to Know. Boston: Simon & Schuster Company [14] Sri Yamtinah, Haryono, Martini SK (2014). Profil Individu Peserta Didik Pada
Tes
Fungsi
Jenis
Sebagai
Testlet
Diagnostik.
Jurnal
Profesi
Pendidik. Vol 1 No 1November 2014. ISSN: 2442-6350 hal 1-10. [15] Sri Yamtinah (2014). Pengembangan Instrumen Diagnosis Kesulitan Belajar PadaPembelajaran Kimia Di SMA. Disertasi
tidak
dipublikasikan.
Yogyakarta: UNY [16] Treagust
D.F.
(2006),
Diagnostic
assessment in science as a means to improving retention.
teaching,
learning
UniServe
and
Science–
Symposium Proceedings:Assessment in science teaching and learning, Uniserve Science, Sydney,Australia
[17]Weeden, P., Winter, J., & Broadfoot, P. (2002).
Assessment
what’s
London: Routledge Falme
in
fo