ISBN 978·602~96343·1·0
r~!l PROSIDINGKONFERENSlllMIAH NASIONAl
J'
I ·1' .HIMPUNAN EVAlUASI PE.NOIOIKAN INI)ONESIA (HEPI) ·t ~j
.}
5~~~~f,::~1i.;\ff.:t!~r'lfU~~~.i.;':...::
20-21 SEPTEMBER 2013 01 MANAOO .
Artikel-artikel dalam prosiding Inite/ah dipresentasikan pada Seminar Nasianal daJam rangka Konferensi Ilmiah Nasional' Himpunan Evaluasi Pendidikan ',/ndones(a (HEPI) pada tanggal 20-21 September 2013 di Manado Provinsi'Sulawesi Utara
TIM P'ENYU'NTING ARTIKEL:
1 2. 3. 4. 5. ',6,. a
Prof. Dr.' Ph.E.A. Tuerah,M.SL, DEA. Prof. 'Dr. Cosmas Poluakan,M~Si Prof. Dr. Maria J. Wantah, M.Pd Dr. AswinH. Mondplang, M.Pd Dr. Hetty H. Langkudi,' M.Pd. 'Dr. Robby J. Wenas, M.S.
'I)..~
'Himpu'nan Evaluosi PendidiJ:?on Indonesia
MANADO,"'2013 ,< ';:'"
-
1
,t'
KATA PE'NGANTAR Puji dan Syukurke-Hadirat Tuhan Yang Maha Esa atas segalaKarunia" _. ..
-
Tuntunan dan Rahmat-Nya sehingga prosiding ini dapat diselesaikan. Prosidi~g in; merupakan kumpulan makalah hasil penelitian dari para peneliti pendidikan yang berasaldari berbagai daerah di Indonesia. Makalah yang dimuat dalam Prosidingterdiri dari hasil-hasil penelitian yang berkaitan dengan Kurikulum dan Sistem Penilaian dan telah dipresentasikan dalam forum seminar dalam rangka Konferensi Ilmiah Nasional Himpunan Evaluasi Pendidikan Indonesia (HEPI) tahun 2013 yang bertema: "Evaluasi Implementasi Kurikulum 2013 dan S.istem Penilaian". Pada kesempatanini, panitia penyelenggara Konferensi Ilmiah Nasional HimpunanEvaluasi Pendidikan Indonesia (HEPI) yang dipercayakan kepada HEPI Unit Koordinasi Daerah (UKD) Manado
ya~g
bekerjasama dengan
Universitas Negeri Manado (Unima), mengucapkan teri·makasih kepada semua pihak yang telah membantu dan mendukung penyelenggaraan Konferensi IImiah .ini, serta kepada seluruh pe.serta dan pemakalah atas partisipasinya. Semoga prosiding ini membawa manfaat bagi peningkatan kualitas pendidikan Indonesia.
ii
--
.•
..
.1.
DAFTAR 151 halaman
HALAMAN JUDUL .. ~
~!.~
.
KATA PENGANTAR
ii
:.............................
iii
DAFTAR lSI... ... ... ... ... ... ... .... ... ... ... ... ... ... ... ... ... .... ... ... ... ... ... ... ... ...
A. Sistem Penilaian 1. Estimasi Reliabilitas Multidimensi Menggunakan AnalisisFaktor
Konfirmatori (Gaguk Margono)·
:..
1
2. Penentuan Kriteria Ketuntasan Minimal (KKM) Keterampilan Produktif Jurusan Bangunan di SMK
16
(Djemari Mardapi, Sudji Munadi, Samsul Hadi, Heri Retnawati) 3. Implementasi Metode NedelskyUntuk Penetapan Standar Kelulusan
Ujian Nasionaldi Sekolah Dasar (Sri Rejeki)
~...
=
32
4. Validitas dan Reliabilitas Instrumen Penilaian Seleksi Ujian Masuk
Keterampilan Khusus Calon Mahasiswa Jurusan Pendidikan Seni Rupa FBS UNY
45
(Trie Hartiti Retnowati,Bambang Prihadi, Mardiyatmo)
5. Pengembanganlnstrumen Penilaian Kinerja Guru Praktikum Fisika
SMA di Provinsi D. I. Yogyakarta. (Nurul Fitriyah Sulaeman, Badrun Kartowagiran)
'~'
59
6. Abilitas Komposit Dalam Tes Potensi
(Saifuddin Azwar dan Ali Ri~~o)
~.
.
74
7. Pengembangan Model Asesmen Autentik Dalam Pembelajaran IPA
Kurikulum 2013 Sekolah Menengah Pertama (Ulldang Rosidin)
96
iii
... i..
8. Kualitas In'strumen Penilaian Hasil Belajar Fisika Oi SMAN 1 dp,p,~~2 ..
Tondano (Aswin H. Monci·~lang)
"~;' ~.' j
'..
109
'>.
9. Perbandingan Validitas Kriteria Test Of English Proficiency Terhadap
:JtR:- Toefl (Estiniasi ~ .."i
"?....
Men'ggunakan Korelasi Biasa Dengan Korelasi
<Jo ....'.:.
•
"
\.,
j,
•
•
Kanonis) (Heri Retnawati)
'\~.:....
.,
,
11'8
.
10.Analisis Validasi Soal Penilaian Hasil~Belajar Pada Program .
.
~ ~'
\
i
'"
"",,
~_
,
'!
.
Pembelajaran di Jurusan Pendidikan IP.S~FKIP Universitas Lampung l'\
f:
~
(Edy Purnomo)
132.
.
11. Karakteristik Penyetaraan Skor (Equatin~):Untuk Data Polytomus ';'.~' .. ".' .. ".""'.""""""""
(Risky Setiawan)
146
12. Lembar Kegiatan Pembelajaran Berbasis Masalah Dalam Asesmen
'Alternatif Pada Mata Kuliah Pendidikan Konsumen Untuk Melatih .dan Menilai Kemampuan Berpikir Kritis Mahasiswa
(Sri Wening)
.
'
13. Meningkatkan Kuafitas Kegiatan
~
Praktikum' Fisika Dasar Dengan
Menggunakan Model Evaluasi Pada Mahasiswa FMIPA Unima r ~ •• ••••••••••••••••••••••••••••••
(Arlneke Tienneke Rondonuwu)
1·81
14. Differential Item Functioning Patensi Akademik Pada Kelompok SMAMA
,.(Ali Ridho)
.
192
.
205
.
221
.
234
15.Pengembangan Scal PisaMatematika Pada Kompetensi Proses Koneksi dan Refleksi ~(-~evel..O.
Mangelep)
16. Evaluasi Penyelenggaraan Ujian Nasional Tahun 2013 (Bambang Suryadi)
~
17. Evaluasi Program implementasi Standar PAUD Studi Evaluatif di TK
Negeri Pembina Kabupaten Ende Tahun Ajaran 2012/2013 (Maria Goreti V. Anamara, Myrnawati, C.H, Wardani Rahayu iv
.
167
.
18. Pengaruhft:JdiVitas Lesson Study Dan PeniJaian Kinerja terhadap
Peningkatan Hasil Belajar Fisika Dasar I Dengan Mengontrol Inteligensi' Mahasiswa (Eksperimen Pada Mahasiswa Jurusan Fisika FMIPA Unima)
2'5'0
(Ferdy Dungus) 19. Model Remedial Teaching (RT) Menggunakan pembelajaran Realistik
Untuk Meningkatkan Kemampuan Siswa Menyelesaikan Tes Berbasis Kelas Sebagai Prediksi· KeberhasiTari"'UJian f'Jasional (UN) di SMP (Nonoh Siti Aminah; Jamzuri; Dya?h::'Fitriana Masitoh; Dewanto Kamas Utomo)
0
•••••
0
•••••••••••••
0
•••••••••••••••••••••••••••••••••••••
0"
•••••••••••••••••••
~:
.••
275
20. Pengaruh Penggunaan Tes 'Uraiandan Tes Obje,ktif Pada
Pembelajaran Kooperatif Terhadap HasH Belajar Kalkulus I Di Jurus:an.: .. <·/··.Matemat~ka
FMIPA Unima
.' "':(Mathilda Lasut)
287
0...........................................................
21. Kualitas Tes HasH Belajar IPA Fisika di SMP Negeri 8 Manado Dikaji Dengan Pendekatan Metode SPSS
'/·:':.:(Alfrits Komansilan)
306
22. Dampak Kemampuan Guru Melakukan Penilaian Terhadap Kinerja Guru Dalam Pembelajaran Matem"atika (Anetha Lf. Tilaar)
315'
23. Generation Paket Soal Dalam Penilaian Adaptif
(Rukli)
'.'
326
24. Authenticity Of Assessment Practice In Eft Context An Implication For
,-
"~
Indonesian Competency Based Curriculum (Anak Agung Istri Ngurah Marhaeni, Nyoman Dantes)
; t""
j,:, \
l
C' ~.j "
13'37
Sa Kurikulum 25. Kesiapan Guru Dalam Mengimplementasikan Pembelajaran Berdasarkan Kurikulum 2013 di SMK (Nanik Estidarsan·i). ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
355
v
--
.•
..
i..
. 26. Perseps.i Guru. Terb.ad.ap..Kuri.kulum 2013 (Survey Terh.adap . G~.~G.u.ru . .
Di Bogar Jawa Barat)
):.
(Rais Hidayat, Yuyun Elizabeth Patras Waroka)
364
27 ..Pengaruh Pendekatan Pembelajaran dan Kecerdasan Personal Terhadap Hasil Belajar Teknik Digital Dengan Mengontrol Pengetahuan ~.
Awal di SMKN 2 Manado
.~
,
.,..1
" •
r~
(Luckie .Sojow)
382
28. Trend Sikap Siswa Terhadap Matematika Dari Berbagai Jenjang
Pendidikan (Anggit Prabowo)
403
29. Profil Kemampuan Penguasaan Materi Pelajaran Guru S'MA IPA di 01
Yogyakarta dan Jawa Tengah
(Endang Mulyatiningsih, Amat Jaedun, Heri Retnawati)
410
30. pengaruh Pengetahuan Awal, Persepsi Siswa Pada Kemampuan Guru
dan Kebiasaan Be'lajar Siswa Terhadap Hasil Belajar Biologi Siswa SMA Negeri di Kota Manado
(Masje Wurarah)
434
31. Efektivitas Strategi Problem Posing Dalam Pembelajaran Fisika Pokok Bahasan Energi dan Daya Listrik diSMPN 3 Tondano (Marianus)
453
32. Efektivitas PembelajaranBerbasis Software Mindjet Mindmanager DalamMeningkatkan Hasil Belajar Siswa Kelas X SMAN 2 Tand.ana (Djeli Tulandi)
465
33.Pengaruh Model Pembelajaran Think, Pair And Share (TPS) Terhadap Hasil Belajar Reaksi Redaks Ditinjau Dari Kemampuan Berpikir Kritis Siswa
(Hetty Horte.ntie Langkudi)
475
vi
34. Pengembangan Model Pembelajaran Ipa Biologi Melalui Kegiatan' Praktikum' Pokok Bahasan Ciri-Ciri Mahluk",H~dup (Evie Palenewen, Twi Mai Mentari) ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 35. Pengaruh Model Pembelajaran Make
A ,Match Dan
488·
Take And Give
Terhadap Hasil Belajar EntomologiPokok Bahasan Anatomi Eksternal Serangga Mahasiswa Semester VJJ Pendidikan BioJogi FKJP UNMU·L Samarinda
(Sonja V.T Lumowa, Sri Purwati)
.
5-03
36. Perbedaan Hasil Belajar Ipa Biologi Siswa Kelas Viii Menggunakaff'·.
Model Pembelajaran Word Square Dan Course Review Horay Pokok Bahasan Fotosintesis (Vandalita M'aria 'Magdalena Rambitan, Listra Timau)
vii
~.
" :
'.4' ••••••••••••
515
,;
;
I'
'j
1
.'\'
'{)f-l··.:)(j;':':
:,\f\\'
:J-. I
ESTIMASI RELIABILITAS MULTIDIMENSI' MENGGUNAKAN ANALISISFAKTOR KONFIR~ATO,RI" Gaguk Margono Universitas Negeri Jakarta, JI. Rawamangun Muka, Rawamangun, Jakarta 13220
[email protected]
ABSTRAK TuJuan .makalah, ini adalah untuk menggambarkan penggunaan Analisis Faktor Konfirmatori (Confimiatory Fa'ctar Analysis (CFA» pad a Model' Persamaan Stru,ktural (Structural Equation Modeling (SEM» dalam mengestimasi reliabititas. R~'iabilitas adalah konsistensi setiap instrumen dalam ,penelitian., Peng~kuran ' reliabifitas multidimensi jarang digunakan dalam bidang peneHtian. Pe'nguk;uran , dan' perhitungan yang dijelaskan dala·m artikel. ini menggunakan instrumer;l' pengukur mitos,matematika. Mitos matematika merupaka'n suatu,keyakin~n yang belum tentu benar, bahkan sebagian besar terbukti salah, namun amat diyakini masyarakat. Metode'survei yang digunakan dalam: penelitiali, 'in'i" 'dan.!:.<,s~mpling yang d,igunakan, simple random sampling. I,nstruman in; taJah diujico'bakan kepada 178 mahasiswa. Dari hasil perhitungan disimpulkan' bahwa instrumen pengukur mitos terhadap matematika dengan menggunakan koefisien refiabilitas
multidimensi merililiki akurasi lebih tinggi bila dibandingkan, dengan, koefisien reliabilitas unidimensi. Diharapkan dafam penelitian lanjutan digunakan rumus reliabilitas multidimensi yang lain, termasuk jika menggunakan SEM~
Kata
kunci:
analisis
faktor
konfirmatori,
reliabilitas
multidimensi, ,,;,[1:i~os
matematika
" ABSTRACT' The purpose of this paper is to describe the use of Confirmatory Factor Analysis (CFA) on the Structural Equation Model (SEM) in" estimating reliability. Reliability is the consistency of eachinsfrument in the study. Multfdime,nsional measurement reliability is rarely used in the field of research. Measurements and calculations, are described in this article using measuring instruments myth to mathematics. Myth to' matfJematics 1s a belief that is not necessarily true, even f!1ost proven wrong, bill m,ost believf?d'society. Survey method ,used in this study and sampling used simple random sampling. This instrument·has been tested on 178 students. The result 'of th'e··calculation, is'concluded that the measuring instr~ment,myttl to mathematics by using multidimensio,nal reliability coefficient. has' higher accuracy when compared :with' a unidimensional reliability coefficient. Expected il} advanced research us~d another formula multidimensional ' reliability, inclufJing when usin~ SEM.
Keywords:
confirmatory
factor
analysis,
mathematics 1
multidimensional c. reliability,
myth
to
PENDAHULUAN "
Oi bidang pendidikan' dan psikdlogi m,emerlukan pengukuran ,yang dapat dia~dalkan
atau dipercaya. Men~rut Naga (1992) untuk pengukuran pendidikan
dan psikologi men
:'tak·J<elihatan yang ada pad a responden. ,Kedua, untuk mengukur ciri terpendam ters'ebut ~esponden diberi stimulus bertJP;aikuesioner atau alat ukur yang tepat. Ketiga,
stimulus
direspons
o'leh
responden
dengan
harapan
respons
mencerminkan dengan benar, ciri.terpendam yang ingin diukur.· Keempat,
respons diskor dan dapat ditafsirkan .,secara memadai. Kemudian, perlu dipe'rtanyakan sejauh manakah skor yang diperoleh dapat mence'rminkan secara tepat ciri terpendam yang. hendak diukur? Apakah· in,struman yang dipakai sebagai stimulus itu mampu mengung'kap secara benar ciri terpendam yang tak tampak itu?Kedua" p~rtanyaan ters~but ·berkenaan denga~ yaliditas. Se~~ng yang berkaitan d~ngan reliabilitas, apakah: tanggapan 'yang diber~~an oleh para peserta sudah dapat dipercayauntuk digunakan sebagai bahan penskoran bagi. atributpsikologis itu? . Selanjutnya instrumen yang baik dan cara pengujiannya ditunjukk,an"ole~ skema pada Gambar 1. ~J1enurut Wiersma (1986), reliabilitas ialah ~onsistensi suatu
instrumen
menguk-ur
sesuatuyang
hendak
diukur..· Reliabilitas
menunjukkansejauh mana hasil pen,gukuran dengan alat tersebut dapat dipercaya. Dleh karena itu reHabilitas merupakan indeks yang menunjukkan· sejauh mana suatu alat pengukur dapat dipercaya atau dapat ·d~andalkan. Bila
suatu instrumen dipakai berulang-ulang lintuk mengukur gejala ,yang sarna ,dan b~si:t.riyang diperoleh' relatif stabil atau konsisten, maka instrumen tersebut
terpercaya. i~~F 1Lt(lMakin tinggi koefisien reliabilitas,
makin dekat nilai skor amatan dengan
skor yang sesungguhnya, sehingga nilai skor amatan dapat diguna,kan seb~gai ".'.
pengganti komponen skor yan.9 sesungguhnya. Ukuran tinggi atau rendahnya koefisien reliabilitas tidak hanya ditentukan oleh nilai koefisien. Tafsiran tinggi rendahnya nilai koefisien diperoleh melal'ui' perhitungan, ditentukan Juga oleh 2
-"·1
standar pada cabang ilmu yang terlibat di dalam pengukuran itu,. Makin tinggi ., koefisien reliabilitas suatu instrumen, maka' kemungkinan kesala'han' ya'ng' terjadi
akan makin'kecil kalau orang membuat keputusan" be:-dasarkan skor.'yang diperoleh dalam instrumen tersebut. Pada umumnya pengukuran karakteristik afektif memberikan koefisieh reliabilitas yan'g lebih ren'dah daripada pen'gukuran ran'a-h' kogn"itif, .'kare·n'a' karakteristik kognitif cenderunglebih sfabil daripada karakteristik afektif. Menurut Gable (1986) koefisien reliabilitas insttumen ranah kognitif biasanya kira-kira 0,90 atau lebih, sedangkan koefisien reliabilitas instrumen ranah afektif kurang dari 0,70. Koefisien reliabilitas pada taraf 0,70 atau lebih biasanya dapat diterima' sebagai reliabilitas yang baik (Litwin, 199.5). Sedangkan menurut Naga (1992) koefisien reliabilitas yang memad,ai-sebaiknya terletak di atas 0,75. Pada. setiap penelitian yang' .menggunakan' pengukuran psikologis selalu menerapkan penguji~n validitas dan reliabilitas. Namun dalam perj-alanannya di bidang psikometri, par~ ahU belum ada kesepakatan tentang koefisien reliabilitas atau
~umus
yang mana untuk reliabilitas antar peneliti. Pertama, masih banyak
'peneliti ya~g dinilai cukup k.ompeten masih banyak yang kurang tepat dalam ~tnelaporkan reliabilitashasil
pengukuran mereka (Thompson, 1994).
Kedua, masalah yang mUl1cul adalah penggunaan koefisien reliabilitas oleh parapeneliti secara moncton tanpa mempertiinban'gari' asumsi yang mendasari koefisien tersebut. Para peneliti tanpa' sadar menggunakan koefisien alpha yang juga dengan tanpa sadar bahwa untuk koefisien in,j mem·erluka·n asumsi yang 5ulit dipenuhi. Jika asumsi tidak dipenuhi maka koefisien alpha
yangdihasilkan adalah nilai di batas estimasi. terendah. Banyak pe~eliti':,,~hanya terpaku padapenggunaan koefisien ?llpha dalam meng~stimas.i. re:ligb'i~~asl Popularitas koefisien alpha Cronbach ini lahir karena faktor: 1) teknik ko'mputasi relatif mudah, karena hanya memerlukan informasi berupa vari'ans skor total, d.al1 2) distribusi sampling sUd~h diketahui sehingga penentuan interyal kepercayaan padapopulasi sangat dimungkinkan (Feld dan kawan-k~wan, 19~7)..
3
un vALIDITAS
VALIDITAS KONSTRUK Disusun berdasark~teori
h~ .Anal ~~tasi ahIi isis faktor .
vALibitAs isi
flJi vAtibitAs
.Disttsun berdasarkan
Dengan
yang relevan
, VALID mengukur apa yanghendak , diukur (ketepatan)
.
memban4ingkan program yang ada Konsultasi ahli
rancanganl . progra,m yang
~
tel8h ada .
1l,~~'~
UJI VALIDITAS
. berdasarimn· fakta· empirik yang telah
terbukti
otbandingkan - .
¢:J
dengan standar yang telah terjadi
.
REtiABEL' Digunakan untuk mengukur:: '..'
-res U1ang
. ~eto~~~'
~ibn-kali
mengbasilkan data yang sarna' (konsisten)
,
wciktu 6eitXifi
_. __.--- _ _----_ . Tes- Beda---'---' tempi ekuivalen.
Dianalisis· dengan korelasi .. setelah diuji coba
Dicobakan dalam waktu yang sarna
Diuji dengan Sp/ithaIj; K.R20, KR21, Anova
-,
Ho~a,
e,Q
,Ga-mbar 1. Skern~, tentang Instrumen dan Cara-cara Pengujian Validitas dan Reliabllitas
~~f!I~~~~ ~~9~Y?~?~ ~~~~~ ?~~~!~~!~? ~r!~'!'~ P~r~!!~!~~~ ~~~~~~S~ ~y A~f~~~~~~ L:JE;':,
~etigat permasalahan yang berhubungan dengan asumsi yang menjadi
syarat dalam mengestimasi reliabilitas.Pada ranah empiris selain persyaratan ~-
t;.fJ12<:;
"
. '
adanya sifat paralel, persyaratan tau-equivalent merupakan tantangan yang ~~~kup berat bag't p'enefttt d·afa-m menyusu'n instrumen pengukuran.
Hal ini
(2003) -yang menemukan bahwa
didukung oleh Kamata dan kawan-kawan ',-
asumsi
kesetaraan,
d'aya
diskriminasi
antar
komponen
tes
dan
unidimensionalitas penguKur~nm'erupakan hal relatif sulit dica·pai. Jika asumsi essentially
ta'u-equvalent
trdak
d·apat 4.
............•
"'-£.."
dipe'nu-h,t
maka
koefi-si'e-n
atpha
menghasilkan' nila'; reliabilitas yang sangat kecil, sehingga koefisien tersebut di
bawah estimasL
Keempat,
wacana
pengukuran
adalah
masalah
unidimensionalitas
pengukuran. Unidimensionalitas adalah aspek panting dalam meng~stimasi reliabilitas. Hasilpen'gukuran psikologis yang bersifat unidimen~i sangat sulit
dicapai, teruta'ma: 'dalam konteks
d9;m~'in
kepribadian ya:ng', keb'an'yakan memuat .
area varians-varians traits yang luas. Socan (2000) menulis bahwa,analisisfaktor yang dilakukan dan beberapa penelitian banyak kasus multidimensi.dibanding dengan· unidimensL;.
Masalah :asumsi bukan menjadi masalah utama· dalam··men·yusu·n mode·l· konsistensi internal;' namun masal.ah ini m,enjadi bahan kajian. banyak peneliti
dalam
pengkajian ,reJiabilitas. 'Seperti
penelitian
Vehkahlati· (2000)
yang
menyimpulkan'" bahwa asumsi y~ng ·tidak cukup, realistis' pada' teori·, skor mumi
klasik adalah asumsi
unidi~ensionalitas
skor mumi' yang secara
prakti~. sulit
dibuktikan. Jadi' kajian multidimensionalitas pengukuran.··muncul ke permukaan karena
banya~
kasus ditemui bahwa juga adanya korelasi antar butir di dalam
dimensi tersebut kadang-kadang lebih tinggi dibanding dengan korelasi antar butir dalam tes.
..
Pada' pengembangan instrumen pengukuran, dalam bidang pendidikan banyak mengasumsikan' penggunaan pengukuran yang bersifat unidimensi· y~ng secara konseptual dirumuskan bahwa hanya ada satu. je.nis faktor kemampuan,
kepribadian, sifat,maupun sikapyang diukur oleh satu instrumen pengukuran.. T~tapi, banyak penelitian menunjukkanbahwaasumsi unidimensi tersebutsulit
dipenuhi dengan ditemukannya beberapa faktor baru yang.ikut diukur dalam satu . '. , ;~:::~ . ~ ;:~: v·:.:; instrumen4'Oengankata lain, instrumen ·yang bersifat' psikologis yang serihg
dipakai ,peneliti cenderung bersifat multidimensi.
Beberapa alasan· pentingnya pengukuran reliabllitasyang, bersifat multidimensi seperti dikemukan oleh Widhiarso (2009) dengan uraian sebagai berikut: pertama, karakteristik konstruk psikologis yang umumnya bersifat
"1ultidimensLKedua,adanya pelibatan aspe·k-aspe'k. dal'am penyusunan 5 -.... l
I
instrumen psikologis biasa·nya diawali·:·;
d~ngan"
penurunan butir-butir dari
beberapa aspe-k teoretis dan kecenderungannya bersifat mul·tidtmensi. Ketiga, jurn~ah butir di dalam instrumen. Jumlah butir· yang terlalu banyak dapat rrl~oambah
potensi
penambahan
varians .error
dalam
butir
sehingga
:mefOunculkan dimensi baru dari .dimens.i yang ditetapkan semula. Jumlah butir qan juga·.bentuk skala k~mudjan
mempengaruht··.·~jkap
responden terhada'p butir. yang
mempengaruhi tanggapan ·.mereka terhadap instrumen. Keempat,
teknik penulisan butir. Spector. dan· kawan-=kawan (1997) menemukanbahwa teknik penulisan butir yang memiliki arah yang terbalik antara positif (favorable) dan negatif (unfavorable) dapat membentuk dimensf ukur baru padahat datam ·pengambilan .data 'banyak' skala: pS'ikologi m'enggunakan teknik penulisan:::'butir
yang berbeda arah. 'Keiima~ satua.n pengukuran. yang berbeda.. Pengukuran bidangpsikolog.is cenderung . memiliki satuaOlukuryang berbeda antara·butir satu de~nga-n
butir tainnya memtJikrka'pabitita's yang'· berbeda sebag'ai
indik~or
konstruk .ukur. Kondisi ini akan menyebab·kan hasil pengukuran cenderung bersifat muttidimensi.· . DengaJ' demikian dapat· disimpulkan ba'hwa pengukuran psikologis,' bail< meng'ukur kO'nstruk
kognitif maupun n'onkognitif sangat re'ntan terhadap
kemajemukan atribut ·yang diukur (multidimensi). Selanjutnya' dengan .memahami
kecenderungan
pengukuran
psik910gis
lebih
pada. mode'J
pengu~uran
multidimensi dibandingkan dengan model unidime.nsi, 'maka diharapkan proses p~ngu~uran
psrkometris juga meJibatkan teknik anaJisis. ya'ng menggunakan
'~;QEJ~I multidimensi.
Menurut Latan (2012), model pesamaan' struktural atau ·lAfl·Q~t~gl1 Modeling 9!?iO~~·si kedua s.~hingga
Structural
(SEM)' merupakan suatu teknik analisis multivariate
ya'n'g m'enggabungkan antara' anaHsis' fa'ktor dan anaHsis jalur
memungkinkan peneliti untuk menguji dan mengestimasi secara
simultan hubungan antara multiple exogenous dan endogenous variabel dengan banyak indikator.Hasil penelitian Joreskog pada tahun 1970an -1"\1
.
membawa teori sta·tistika pa'da a'naHsis: strukturaJ' linear. ya'ng' lebih diken;a~: 6
- . 1
:,;-.
1
d'engan sebutanmodel persamaan struktural atau SEM. Sumber panting yang digunakan' dalam mengana·lisis adalah· struktur kovarian' sehingga terkadang pendekatan ini dinamakan dengan covariant structure model.(CSM)I. Model':yang disu'sun memuat variabel tak terukur yang' dinamakan dengan konstruk"~'laten yang dibangun oleh serangkaian variabel terukur yang dinamakan dehgan konstruk
terukur.
Error pengukuran' yang
merefle'ksikan
reliabilitas
skor
pengukuran dilihatsebagai konstruk :unik dan menjadi bagian" yang panting dalam· analisisSEM, error pengukuran'1yang: dilibatkan dalam analisis SEM inilah yang kemudian menjadi kelebihan SEM'dibanding dengan teknik analisis·lain'nya
(Capraro, et al., 2001.). SEM. dapat' merigestimasi varians error sk6r· hasil ' pengukuran secara.. aldual meng.estimasi reliabilitas. Men~rut Gefen et a/., (2001), SEM sebagai teknik statistik ~multivariat yang mengkombinasikan. antara regresi b~rganda yang mengidentifikasikan hubungan an~ra konstruk dan analisis faktor yang mengiden~~fikasi konsep tak te'rukur" melalui beberapa indikator manifest yang keduanya dipakai secara simultan_
SEM memiliki
b~berapa
kelebihan dibanding dengan teknik ,analisi.s
lainnya. Dalam menguji hubungan antara variabel, 'SEM secara otomatis mereduksi efek error pengukuran. Capraro et ·al., (2001) mengatakan bahwa pengaruh variabel independen tethadap variabel dependen dipengaruhi oleh efek atenu~si. Nilai efek in; tidak dapat· m~lebihi batas koefisien reliabilitas skor tas yang digunakan. Pendekatan pertama adalah koreksi korelasi atenuasi yang disebabkan. oleh errorpengukuran d~n pendekatan kedua ad~lah model persamaan strukturaJ dalam konteks analisis faktor konfirmatori. Lee dan SOllg~
(2001)
mengatakanbahwa SEM adalah.. salah
satu
pendekatan
untuk
menegaskan model pengukuran. Pada model pengukuran SEM menghu.bOngK§F¥ antara konstruk laten dengan dengan kO'nstruk empirik. Ko·nstruk~·emplrnc .
dinyatakan oleh kombinasi konstruk laten. Dj samping
I
dapat dan mampu':
menangani generalizability theory dan item response theory, SEM mampu' membandingkan model pengukuran dan memfasilita~i investigasi ketepatan fi,r't
model. 7
..
..-.-. " t .
· SEM· mempunyai .dua .komponen dasar. Pertama, model pengukuran
didefinisikan s.e-bagai hubungan 'antara variabel laten. dan sekelompok·::.variabeJ 'penjelas yartQ dapat diukur langsung.. Kedua, mooel 'struktural didefinisikan sebagai hubungan antara' variabel laten yang tidak' dapat diukur secara
,Iangisung. Variabel-variabel tersebut juga' dibedakan. sebagai variabel· bebas dan variab·eI- tidak
adalah sub
bebas~
mod~1
Gefen et al. . .(2001) mengatakan bahwa mod·et pengukuran
di' ". dalam SEM'yangmengidentifikasikan' konstrak ·Iaten
dengan' indikator-indikatomya yan.g.da·pat dipakai untuk mengetahui .reliabiltas setiap konstruk yang dilib.atkan dalam, mOdel. SEM juga dapat mengrdentifikasi retrabititas konstruk yang tertihat metalui
nUai butir .loading yang. 'dihasilkan~ Berdasarkan perspektif SEM reliaqilitas konstruk dapat dihitung me.lalui pers'amaan sebagai berikut:
CR=
rtA,J _ (tA,r +(toJ
Keterangan:'
Ai
=f~~~~~jlit~~ ~~n·~tnrk: .. =fa"ctoT loading terstand.arrsasi. indikator ke-i
o
=.error standar peng'ukuran
c~
McDonald
(1981)' merumuskan
sebuah
koefisien
reiiabilitas
yang
:kemudian d.iberi nama koefisien relia.biUtas skor komposit McDonald yang juga .dioamakan :koefisien omega (co). Koe'fisien reliabilitas ini berbasis pada analisis ;laldor konfirmatori' :yang : merupakan' .bagian dan menu pemodelan SEM.
Reliabilitas skor komposit McDonald ini menjelaskan' besamya proporsi indikator 'iY~m~ menjelaskan konstruk ukur. Adapun formufauntuk mendapa·tkan koefisi'en
~~i:abi-litas' konstruk adalah sebagai berikut:
8 .•
i.
;Keterangan: Ai
=factor loading terstand'arisasi indikator ke-i
. Sila dibund~ngkan antara reli~bilitas konstruk dengan reliabilitas skor kOIlJPosit
McDonald akan memberikan hasil yang sarna karena 6 = 1- l2 . Koefisien reliabilitas rn~ltidimensi berikut merupakan koefisien reliab.ilitas dik~m,Qangkan.
konstruk yang
oleh
Hanco'ck dan
Mueller
(2000), ,yang ,
menunjukan seberap~ jauh i.ndikatorinstrumen mampu merefleksikan konstruk yang hendak diukur. Ko~fisien ini .,merupakan modifikasi dari koefisien reliabilitas konstruk McDonald, yang tidak: ,ma~pu :mengakomodasi babot yang ,berbeda antardimensi. Hasil modifikasi dinamakan koefisien reliabilitas ko'nstruk berbobot . sebagai
b~rikut:, P
Q = __ w,
L 1=1
[2 .j
2
(1-1; )
~
.l~
;=i
(1-1; )
: 1+2..,
1
2
,
Keteranga'n: ' I;
=: koefisien dimensi ke-i tersta,ndar
Koefisien reliabilitas ini dapat diartikan sebagai'
dimensi
dengan
skor komposit tinier optimal,
korel~sikuadrat
sehingga
antara
beberapa
ahli
menamakannya dengan reliabilitas maksimal (maximal reliability).
Pada:penelitian Widhiarso dan Mardapi(2010), model multid,imensi untuk koefisien reliabUitas memiliki ketepatan pengukuran yang tinggi bila dibandingk~n
dengan reliabilitas unidimensi. Oleh karena itudalam penelitian ini, pene,titi hanya difokuskan pada koefiesien konsistensi internal seperi
a
untuk relia'biUtas
unidimensi dan m ,eR dan Ow.
)i
Berdasarkan uraian di atas maka untuk organisasi pendidikarf'; seperti Universitas Negeri Jakarta (UNJ) dimunculkan berbagai pertanyaan ~epEi~1 Bagaimanakah reliabilitas internal konsistensi multidimensi dari instrumen mitos matematika? Bagaimanakah komparasi. antara reliabilitas multidimesi dan unidifDensi? Manakah yang lebih akurat sebagai'pengukur reHabH,'rtas?
9 ~
... ,-,
i..
10 ..
~
itu 'sendiri (butir nornor 1 sampai dengan 5), dan (2) mitos matematika dipandang dari .manusia sebagai 5ubjek yang mempunyai mitos tersebut (butir no'mar 6 sampai d'engan 10).
'j.i,
Sesuai dengan karakteristik jenis respon, maka format alat ukur'~yang dipilih untuk menyajikan butir-butir instrumen adalah format pilihan te,matas. Untuk tiap-tiap butir m'emiliki 2 pili'h'q,n' jawaban den'gan' rentang n'ilai 1 dan ':0. '
Jumlah semuabutir ada 10. Waktu, untuk mengerjakan sekitar 5-1 0' men it.
dua kutub kecenderungan, yaitu
Kualitas atau status instrumen ini, me'rniliki .
.
.
.
setuju ,. dan' tidak setuju terhadap 'pemyataan instrumen pengukur mitos .
,"
.
.
" ' .
"
matematika. Jawaban para responden terhadap suatu pemyataan merupakan' . .
.,
.
. .
.
.
tingkat kesetujuan atau ketidaksetujuan mereka terhadap pemyataan tersebut.
HASIL PENELITIAN DAN PEMBAHASAN
(Jntuk;' reliabilitas konsistensi internal ~Ipha Cro'nb'ach diperoleh langsung menggunakan program SPSS sebesar 0,758, i~i sebagaireliabilitas unidimensi.
Untuk reliabilitas
multidimensi pertama-tarna reliabilitas 's.kor komposit McDonald,
,
'
denganlllenggonakan program L1SREL'S.7 dan Excel didapat: ±-\=6,300 dan
tl-~2=5,913;
;=1
;=1
jadi
(6,30(W
0)=
(6,300)2 +(5,913)
=0870 ,
Reliabilitas multidimensi yang kedua yakni reliabilitaskonstruk diperoleh hasil yang sarna sebagai berikut:
I.
";
;=1
i=1
L l; = 6,300 dan L t5 =5,9.1 0 ; jadi
eR =' (6,300)2 = 0 870 , (6,300)2 +(5,910) ;
Berikut untuk reliabilitas multidimensi yang ketiga reliabilitas berbdttdt::atati reliabilitas maksimal, dengan' me'nggunakan dengan menggunakan prb~j'ratri
LIS, REL 6.7 d,,a,n ,Excel
d,iperol~h:
{- (1-/]) =4,0-87, tt --,. 1;2 2
sabagai berikut:
n = ,w
(4,087)2 =0,803 1+(4,087) 11 ;:..-:.,
1
sehingga dapat , , ' ,dihitung
Dari hasil uijWaian di atas dapat dirangkum dalam bentuk·.Tabel sebagai
b'erikut: Tabel 1. Rangkuman Hasil
Reliabilitas Mitos terhadap Matematika
~
CR=OJ
a Q,7S~8
O,~70
O,6Q3
Perhitungan untuk instrumen diperoleh koefisien relia~mtas multidimensi tin~gi
relatif lebih
atau lebih .tepat dibandingkan dengan
unidimensi. Hal ini .
.
katan'g'~n
penetitr
b~lum . i'·.
~o~fisien
reliabilitas
ada kesepakatan antar ahli psikometri. Namun di . . • . ....
'
.
.
. . . . .
.
.
.
~ fndon~ta se~tkl)YCl. setelah mengetahui. atat yang pa~ing
•
..:
•
,.0.'
:
.
.
.
.
.
tepat sebaiknya mulai memakai/menggunakan 'alat tersebut secara benar dan . . .' .' .
.
~
:
~.
'.
' . ,.
.
'
'.
.,
memadai.
<;ii..ka.langan dosen Memang sebagian besar peneHtJ ;" 3,' ;.\:' '. '" . ::,' . ". .: .
,ma:upun . . : . ":,. .
mah~s:iswa .'
.:
82 ~a,upun·.33 beiu'm m~n~etahui- formuta..untuk J)1-enghitung ~oefi.si~ reJiabiHtas
konstruk, omega ataupu? reliabilitas maksimal tersebut. Jadi kaliini saatnya untl'.k mengenalkan dan juga menggunakan formula tersebut. Dengan alasap sudah tahu rum.usnya· dan kebanyakan, konstruk
psikologi~,
kepribac;tian,
p-e-ndidikan, dan sosiaf adalah multidimen'si, sehingga seJuruh peneHtt bark mahasiswa maupun dosen be~kembang dan 'makin berkembahg untuk menggali lebih dalam lagi tentang koefisien reHabilitas yang lainnya. .Pengukuran
bidang, pendidikan ·.merupakan .sesuatu yang' cukup rumit.
Berba'gai tufisandi 'dalam jumal' pengukuran pendidikan' berkisar pada ca-ra rA~ngukuran
yang diharapkan memberikan hasiJ yang valid, reliabel, dan akurat.
Usaha para pakar tidaklah mudah karena' para pakar tersebut makin lama m'embawa peng~kuran pendidikan. itu jauh ke dalam kawa~an matematika.
_ .. T a-npa menguasaf dengan b'aik ma·tematika yang tinggi da'n rumit, kita' tidak dapat memahami berbagai jumal pengukuran pendidikan. Sejauh ini, kita sangat tertinggal di bidang pengukuran pendidikan. Sangat sedikit pakar ilmu pendidikan yang mampu memahami isi jurnal. pengukuran
pe-nd'idikan yang' ·bertaburkan- mate-mati'ka
ti'~gkat
trnggr. OJeh karena itu perl'u
diusahakan peningkatan para pakar ilmu pendidikan di bidang pengukuran 12 - .. 1
"pe.ndidikan. Usaha itu dapat dimulai den'gan mengubah persepsi kita selama ini t
yang sejak lama, para pendidik dikalang'an, kita memiliki anggapan
bahv,,~
ilmu
\ ~.
pendidikan . dan PSiKOI~i. tidak memerlukan matematika.
Matematika adalah
garapan MIPA dan Teknik'dan bukan garapan ilmu pendidikan~ Kini, berhad'ap~n dengan pengukuran pendidikan para pendidik dikalangan kita perlu mengubah persepsi mereka terh~dap matematika. f>ar~ pendidik perlu menyadari bahwa .
ada bagian ilmu pendidikan yang hampir tidak menggunakan matematika', tetapi . ada juga bagianilmu pendidikan yang sangat memerlukan niatem~tika, seperti contoh di atas statistika multivariat yang memerlukan kemampuan matematika ·t~nggi.
KESIMPULAN DAN SARAN Koefisien reli~bilit~s konsisten~i. i~~emal denga·n meflgg.unaka~ rum.us reliabilitas multidimensi lebih tinggi bil~ dib'andingkan dengan koefisien reliabilitas unidiemnsi. - Dengan kat~ lain ~id.apat $usunan koefisien reliabilitas sebagai 'berikut
a <. Ow < (0 == CR) untuk· iristrumen pengukur mites terhadap
Matematika..
Beberapa saran dapat diajukan di' sini: (1) Makin dipopulerkannya penggunaan koefisien reliabilitas multidimensi dalam penelitian pe'ndidikan khususnya dan penelitian yang bersifat kuantitatif p'ada' pada, bidang lainnya, (2)
Pengembangan instrumen ini perlu diuJi lebih lanjut dengan menggunakan skala lain,misalnya skala diferensial semantik, dan (3) Instrumen ini perlu diujidengan meng~unakan sampel
yang leb.ih besar dengan. populasi dan setting yang lebih
luas.
',.J ,l,)t1',
i--,
. DAFTAR PUSTAKA
Capraro, M. M., R. M. Capraro, and R. K. Herson. "Measurement Error of Score' on the Mathematics Anxiety Rating Scale Across Sudies.~; t=ducatlonaJ and Psychological Measurement; Vol. 61; 2001 = 373-386; Feld, I. 5., D. J. Woodruff, and F. A. Salih. "Statistical Inference for Coefficient
Aipha." Appiied psychoiogicai Measurement, VoL ii, ·1987: 93 -103. 13 '''-- .. 1.
Gabl~-,. R.. ~.__ ~!n~t~!.rJ1fjJ1Jt.
pevelfJpfJ1ent in the ,Affecti,ve .Domain. Amsterdam:
Kluwer Nijhoff' Publishing, 1986. Geffen, D., D. W. Straub, dan M. D. Boudreau. "Structural,l;quation Modeling "and Regression: 8uidellnes for 'Research Praciice." Communications of Ais, . Vol. 4: Article' 7, 2001 . .Ha,n'CQck, G·. R., dan R.. o. MueUer. "Rethinking Construct' Reliability within latent Variable ·Systems." In.Stuetural Equation 'Modeling: Present and Futuffl, R;. G~~~~, .~. H. C. QUTpij, :~n~ O... F. ~:QrbQm (J:~~~), Chi~99: Scientific SOftWare International, 2000.
Kamata, A., A. Turhan, and E. D.arandari. "Estimating Reliability for Mu'ltidimensionai eomposlte.,Scaies Scores.~ Paper presented In Annuai Meeting of American Educational Research Association at Chicago, April 2003. Latan, Hengky. structural Equation Modeling Konsep dan Aplikasi Menggunakan Prpgmm -!-~ ~.~(J•. 'a~n~LJng: Alfab~.ta, g012. ' .
.
Lee, S. Y., and X. Y. Song. "Hyphotesis Testing and Model Comparison in Twolevel StructUral EqUati'on.. Model.~ Milltivariate BenaVi6rai Researcn, Vol. 3'6,'~ January 2001: 639-655. .
Litwin,M. S.. How to Measure SurveY.Refiabity and Validity. London: Sage 'pu'bficatlons, '1.995.
McDC?':1a.1d, R.. P. "The.
Dim~nsionality
of . Test. and Items.", British Journal of
Mathematica./ and ~ta.tistical Psychoiogy, VoL 34, 1981: 100 -117.
Naga, D. S. Teori:Sekor. Jakarta: .Gunadarma Press, 1992.
Socan, G. "Assessment of Reliability' when Test Items are not Essentially tEqUivalent." Oi dalam Development in Survey Methodology, Anuska Feligoj and Andrej Mrvar (Eds.), Ljubijana: FDV, 200·0. :. . . .'" Spec~.or~. P.,
p.
B~~nnic~,
dan_. P. Chery .. ~Wh~n T~o F~ctors_ D.~n't ~e~ect Twq Constructs: How Item Characteristics Can Produce Artifictual Factors." Journal of Management, Vol. 23, 1997: 659 - 668.
Thompson, B. "Guidelines' for Author." Measurement, Vol. 54,1994: 837 - 847.
14
Educational
and
Psychologioal
Vehkalahti,'.K. "Reliability"of Measurement Scales Tarkkonnents General Method Supersedes eronbach~s Aipha." Academlq Dissertation, Unlverslfy of Helsinki, 200'0'.' :"' '
Widhiarso i Wahyu 'dan Djemari MardapL "Komparasi, Ketepatan Estirnasi Koefisien Reliabilitas Teori skor Murni Klasik." Jumal Penelitian dan E'{~lyct~P~qfQ!kf#1, YQI. 14, ~Q1Q: 1-1~. Widhiarso, Wahyu. ~Koefjsien 'Reliabilitas pada Pengukuran Kepribadian yang 6etsifat' MUltio'imensi. "PsikoDuah,a, Vo1. 1, 2009: 39 ~,48. Wiersma, W. Research 'Methods in Education: An Introduction.' London: Allyn
and Bacon:, inc.,' .'1986.
.....~.
15
-... ,.
t..
'PENENTUAN KRITERIA KETUNTASAN MINIMAL (KKM) '
,
KETERAM'PILAN PRODUKTIF JU'RUSAN BANGUNAN Df SMK Djemari Mardapi, Sudji Munadi, ,Samsul Hadi" Heri Retnawati ABSTRAK"
Penelitian, ,nl bertujuan untuk menentukan, kriteria ketuntas~n minimal (KKM) mata peJajaran keterampilan, ptoduktif di: ··SMK kabupaten ,Sleman, khususnya jurusan Sangunan.. Pada penelitianini-, KKM ditentukan dengan metgde ·AngQff
(YalTidaf<) ~. 'd'erlg·a'n· "soar da'n .paneiis "d'aii-I(a-bupaten' ·sternan. ··O"iskusl
kelompok
terokus dilaksanakan bulan November 2012 di LPPM Universitas" Negeri
Y·o"gyakarta. HasU p-enelitian m-enunjukkan bahwa (1) batas kelul"usan daTi mata pefajaran teknik bangunansebesar 65,4; (2) kemampuan lulusan matapelajaran Teknik bangunan yang banyak disebut panelis adalah: a) menggambar P. Amerlka, b) menggambar pondasl batu kall, c) mengh'itung tu'iangan pada ko~lom BS, d) mengidentifikasi jenis bahan kontruksi, e) menggambar 3D, dan 1) mengidentifikasi alat-alat gambar.
LATAR BELAKANG Oat.am pendidikan, evaluasi memegang peranan yang penting. Melalui evaluasi,kualitas pendidikan dan perkembangannya dapat dievaluasi dari waktu ke waktu (Jahja Umar, et ai, 1998 : dilakukan
diantaranya
1.~
Je'mari M'ard'apr, 2001). Pe-nil'a'ian dapat
melalui kegiatan
pengukuran.
Dalam
pengukuran,
diperlukan alat (instrumen). Alat yang digunakan untuk melakukan pengukuran, salah satunya adalah tes. Sebagai contoh, tes prestasi belajar siswadigunakan untuk mengetahui pencapaian hasil belajar siswa. Hal ini menunjukkan bahwa n~ualitas tes yang digunakan akan mempengaruhi hasil pengukuran, dan kualitas ,¥~.~~il
~ ,f:
,»
• ""
pengukuran mempengaruhi hasil evaluasi dalam pendidikan.
• ' .. " .
f~
Saat ini, kurikulum yang digunakan pemerintah yakni kurikulum tingkat
t,~:~at4an J }-
~~,.,
fT-':
.' '_~'
pendidikan (KTSP) yangmerupakan kurikulum berbasis kompetensL ".
,Pada kurikulum ini, siswa dikatakan berhasil jika telah menguasai kompetensi tertentu yang telah ditetapkan dalam kurikulum. Indikator bahwa siswa tatah menguasaikurikulum yakni kemampuan hasil belajar yang diukur talah mencapai kriteriaketuntasan
minim'at (KKM) yang te'lah
ditetap'kan,
16
........... ,. i..
bahkan ka·la·u·
sebaiknya
melampa~i KKM.
Dengan KKM ini, siswa yang telah berhasil dapat
melanjutkan belajar untuk dapat menguasai ko'm'petensi se'lanJutn'ya', dan yang' belum menguasai dapat mempe!{daI3m yang, b~lum dikuasai melalui remidi. Hal
'ini menunjukkan pentingnya KKM dalam m'enentukan keberlanjutan belajar peserta didik., Saia-ma' int, kriteria ketuntasan. minrma!. atau dalam istHah pengukuran ' sering disebut dengan batas lulus (cut df'score) UAN·ditentukan menggunakan
kebijakan. Sebagai contoh misalnya' pada ujian n'asional (UN). Pada ,tahun 2005, batas lulus, yang ditentukan 4,01. Untuk tahun 2006 dan 2007, batas lulus selanjutnya ditingkatkan 'menjadi 4,26" yang .kemudian di· tahun 2009 ditingkatkan . lagi. menjadi 5·~26. Nilai 4,01~, 4,26 maupun 5,26 merupakan batas yang relatif
rendah dibandingkan batas lulus negara-negara lainnya, namun. demikian masyarakat meresponnya dengan' penuh kecemasan dan 'keresahan, dan batas ., ini' dianggap terlatu tinggi. ' Di sisi lain, sekolah rrienentukan KKM, yang cukup tinggi ketuntasan
ulangan harian atau untuk kelulsan ujian sekolah,;
misalnya 7 ,~. Nilai in'i
ditetapkan oleh musyawarah guru berdasarkan intake, kompleksitas, dan daya
dUkung yang dimiHki sekolah. Se-bagai akibatnya', KKM di suatu sekoJahberbeda dibanding'kan dengan sekolah lain. Sebagai akibatnyaKKM untuk suatu daerah misalnya daerah kabup'atenlkota, belum dapat ditentukan karena sekolahsekolah yang terdapat di suatu kabupaten memiliki KKM yang berbeda-beda, sehingga st~nd'arkelulusan daerah satu dengan yang lain sulit dibandingkan. Penentuan . kriteria .ketuntasan minimal tidak hanya dapat ditentukan .' .
".
"
,,'''~
melalui kebijakan pemerintah seperti kriteriakelulusan dengan ujian nasional ataup'un denganmemperhatikan intake, kompleksitas, dan daya dukung seperti yang difakukan di sekotah. Penentuan batas lulus yang lain, dapat diteriH.tJ(§n dengan berbasis peserta tes dan yang berbasis alat ukur atau perangkat tesnya. Penentuan kriteriaketuntasan minimal de~.gan basis peserta didik dan alat ukumya selama inimasih belum dilakukan, padahal menjamin KKM yang valfd'
17
........... ,. i...
dan dan dapat digunakan untuk menentuk.arl KKM· tingkat daerah;· misalnya
kecamatan atau kab·upate·n/kota.. Oi Sekolah Mene:lgah Kejuruan, batas lulus juga perlu· menjadi ·perhatian.
.Terlebih lagi untuk mata. pelajaran Keterampilan Produktif, yang berbeda-beda jenisnya tiap jurusan.KKM untuk mata pelajaran ini ditetapkan oleh·sekolah dan p~erintah, namun k~mampuan siswa
betum dievafuasi dandiJihatkembaH- kesesuaiannya dengan
yang sebenarnya.
Terkait dengan hal tersebut, diperlukan suatu .penelitian.., tentang' model
penentuan kriteria k.etuntasanm·inimal berbasis perangkat tas yang digunakan datam ujian nasionat sehingga dapat .menentukan· kriteria' .ketuntssan minimat yang tepat untuk menentukan keberhasilan pembelajaran yang· dicapC\li ·peserta
didik·. Pada penelitian ini akan· ditentukankriteria' ketuntasa minimal berbasis peserta didik dan .perangkat
tes~
yang mend.ukung pelaksanaan evaluasi yang
dilakukan ote-h pendfdfk atau sekotah m-engetahui' ke'berhasifan pendi·d-ikan. Penelitian inibertujuan untuk menentukan kriteria·. ketuntasan 'minimal (KKM) mata pelajaran keterampifan produktif· di SMK, kabupaten Sleman, khususnya jurusanBangunan.
KAJIAN TEORI Unsang-undang nomor 20 tahun 2003 t~ntang . S istem .Pen.didikan N·asional
pasal 11 ayat 1 mengamanatkan kepada pemerintahdal1 pemerintahdaerah untuk menjamin terselenggaranya. pendidikan . yang bermutu.. Oagi. setiap warga
ne,gara. •.;-~
.~
';l
Terwujud~ya .
pendidikan yang bermutuJTIemb~tuhkan up~ya y~ng terus
~~~~rus untuk setatu meningkatkan kualitas pendidikan. Peningkatan kuatitas
pe~~!di~an memer/ukan upaya peningkatan kualitas pembelajaran r 'i
r-)
~
.:
J
dari ~.,."
.. : t,'·
karena muara
. .
~'f ..~"
.
..
berbagai "
program, pendidikan .
adalah
pada
t.erlaksan~nya
program
.
p~mbelajaran yang berkualitas. Oleh karena itu peningkatan kualitas pendidikan tidak a"kan terca"p'ar tanpa adanya peningkatan kU'atit~s pem~etam-ran. Peningkatan
kualitas
pemoelajaran
mem~rlukan
upaya
peningkatan
kualitas program pembelajaran secara keseluruhan karena pada hakekatnya; 18
- .. 1
kualitas
pembelajaran
me{lJpakan
kualitas
implementas,i .. ' dari
program
pembelajaran yang tel,ah' dirancang sebelumnya. Upaya peningkatan kuatitas program pembelajaran memerlukan '. informasi hasil evaluasi . . terh~dap ku~l-itas program pembelajaran sebelumnya. Dengan demikian, untuk. dapat melakukan' pembaharuan' program pendidikan,: termasuk di dalaninya adalah, program pembelajaran kegiatan· evaluasi terhadap,.program yang 'sed,ang maupun
teJah .
berjalan sebelumnya perlu· dilakukan dengan· ·baik.· Untuk dapat mehyu:sun program yanglebih baik, diperlukan··.hasil evaluasi program ·sebelumnya 'sebagai acuan.
Ada tiga istiJah yang sering digunakan dalam evaluasi·
J ... ·
pengukuran,
dan ·penilaian· (test;· .
measurement~
yaitu. tes, .
. 'dan .assessment). . Tes
merupakan salah satu cara untuk menaksir' besamya ,·kemampuan seseorang' secara tidak langsung, yaitu" :melalui respons se.seorang terhadap' stimulus 'atau
pertanyaan (DJemari
'M~rdapi;
2008). Tes merupakan .salah· satu .. stat untuk
melakukan pengukuran, yaitu alat untuk mengumpulkan informasi karakteristik suatu objek. Objek ini bisa berupa ·kemampuan maupun
motivasi.
Responspeserta
menggambarkan kemamp'uandalam
tes
b'ida~g
peserta
terhadap
~idikJ
sejumlah
sikap,
min~t,
pertanyaan
tertentu. Tas' merupakan bagian
tersempit dari evaluasi. Pengukuran dapat didefinisikan sebagai the process by which information
and differentiated about the attributes or characteristics of thing are detenninied· . .
(Oriondo' & Antonio: 1998)'. Guilford mendefinisi pe'ngukuran dengan assigning
.: ;.. ;~ <.'., :~"'~'j
numbers to, or quantifying, things according to a set of rules (Griffin & Nix: 1·991). Pengukuran dinyatakan sebagal proses penetapan angka terhadap individu ~ta~T: ':"', : ' ..1; ~) :"1 ::.:.:i('t karakteristiknya menurut· aturan tertentu (Ebel & Frisbie:: 1986).' Allen &. Yen !'tt..,.
(2002) me~definisikan pengukuran' sebagai penetap'an angka dengan ,cara
yanQ
sistematik untuk menyatakan kead'aan individu. Dengan demikian, esensi dari pengukuran.,adalah kuantifikasi .atau penetapan angka. tentang karakteristik ~tau keadaan indiVidu menurutaturanaturan tertentu. Keadaan·in·dividu inibisa berupa kemampuan kognitif, afektif dan 19
psikomotor. Pengukuran memiliki konsep yang, lebih ".Juas dari pada tes. Kita dapat mengukurkarakateristik suatu objek tanpa menggunakan tes, misalnya d~lJgan
pengam'atan, skala rating atau cara lain· untuk ,memperoleh informasi.
dalam bentuk:kuantitatif. "
Penilaian memiliki makna yang berbeda dengan. evaluasi. Pop,ham (1'995)
m~definisjkan
asesmen dalam
konteks' pendidtkan sebagai- sebuah usaha
secara formal' untuk menentukan status
kepentingan'
p,endidikan~
siswa berkenaan dengan berbagai
Boyer & EweI ,mendefinisikan 'ase.smen·
proses yang menyediakan
sebagai
inforrnasi tentang individu siswa, kurikulum
program, institusr atau segata. sesuatu'yang
berk~itan
dengan srstem
atau
institu~i,
yaitu:processes. that provide information about· individual students~· lflbout curricula or programs, about institutions, or about entire systems, of institutions (Stark & Thomas:· 1994.). Berdasarkan berbagai uraian: di atas"dapat disimpulkan
bahwa a'ssessment atau penUaian dapat diartikan, sebagai kegiatan menafsirkan
data hasil pengukuran. Evaluasi memilikima'kna .yang . berbeda dengan penilaian, pengukuran
,nau,pun' tes. Menurut Stufflebeam dan' Shinkfield," evaluation is the process ,of delineating, obtaining, and, providing descriptive 'and judgmental information about the worth and merit of some object's goals, design, implementation, and impact in order to guide decision" making, serve needs. for accountability, and promote understanding of the involved phenomena (Stark & Thomas: 1994).
Evaluasi m"erupakan suatu 'proses menyediakan informast yang dapat Idlj~:<;I,kan sebagai pertimbangan untuk. menentukan harga.dan jasa (the worth
fMletlperit) m:<~@r~:antu
dari tujuan yang dicapai, desain, implementasi "dan dampak untuk
membuat
keputusan,
membantu
pertanggung
jawaban
dan
men'ingkatkan pema'haman terh~dap fenomen·a. M~urut rumusan tersebut, inti dan evaluasi adalah penyediaan informasi yang dapat dijadikan sebagai' bahan pertimbangan dalam mengambil keputusan. 'Kamita Studi Nasional tentang Evaluasi (National' Study' Committee on
Evaluation) . dari UCLA menyatakan '. bahwa: evaluation is the process of 20
- '.. 1
\.!".!.
ascertaining the decision 'of· concem., sele'cling appropriate information, and co"/Iecting and analyzing information in order to 'report ,summary l;1ata usefuJ. to decision makers in, selecting "among altenrativ9s, (Oriondo .& Antonio: ·1998). Evaluasi merupakan' suatu proses atau kegiatan 'pemilihan, pengumpulah,
analisis ·dan penyajian informasi yang sesuai untuk .mengetahui sejauh. mana suatu tujuan' pro'gra'm, prosedur,
pro~duk
atau· strate-gr" yang dijalankan tetah '
tercapai. ·Karena itu evaluasi bermanfaat bagi pengambilan keputusan serta
dapat menentukan beberapa' altematif keputusan. :untuk progra'm. ,selanjutnya. Berdasarkan
pendap.at .'. di
atas dapat,', disimp,ulkan bahwa
evaluasi
merupakan pro'ses yan'g sistematis dan . berketanjutan··.. untuk mengumpulkan, ' mendeskripsikan, mengintepretasikan" da'n menyajikan., .informasi untuk dapat digunakan sebagai dasarmembuat keputusan 'dan "atau, menyusun kebijakan. Adapun' tujuan ·evaluasi adalah untuk "memperoleh' informasi yang akurat dan
objektif
te:~ta'ng
suatu program Informasi. tersebut dapat berupa proses
pelaksanaan program, dampaklhasil, yang dicapai, efisiensi serta pemanfaatan
hasil evaluasi ya'ng difokuskan mengambil
keputus~n
untuk program
,·,itu sendiri, yaitu untuk
apakah" dilanjutkan, diperbaiki atau dihentikan. Selain itu,
juga" dipergunakan untuk kepe"ntingan p'enyusunan" program berikutnya maupun penyusunan kebijakan yang terkait dengan··program. Dalam kaitannya dengan .pendidikan, UU nornor 20 tahun 2003 tentang
Sisdiknaspasal 1 ayat 21 menyatakanbahwaevaluasi pendidikan adalah kegiatan pengendalian,. penjaminan, dan penetapan mutu pendidikan terhadap berbagai k~mponen :pendidikan pada setiap jal~r, jenjang, dan jenis pendidikan sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan. Kegiatan;\irti tentu memerlukan pengukuran atau penilaian terhadap berbagai
komp6n(;1'\
p'endidikan b'aik mer:tggunakan afat b-erupa tes atau bukan tes. Dilihat dari fungsinya evaluasi' dalam bidan'g pendidikan dibedakan menjadi, lima janis evaluasi. Kelima evaluasi tersebut yaitu evaluasi formatif, .';. sumatif, diagnostik, selektif, dan, penempatan (Depdiknas, 2008). Evaluasi formatif adalah' evaluasi yan'g dilaksan"akanpadasaat bertangsungnya proses 21
-
..
..
i.
pembelajaran untuk melihat tingkat keberhasilan proses belajar-mengajar itu sendiri~ Denga'n dem'ikian,evaluasi formatif berorientasi kepada proses beJajar-
mengajar untuk memperbaiki' ptogrampengajaran dan strategi pelaksanaannya. ,Evaluasi sumatifadalah evaluasi yang dilaksanakan pada akhir unit program, ,y~kni akhir caturwulan, akhir semester, 'dan akhir tahun. Tujuannya adalah"untuk
metihat hasil yang dicapai oteh-. para siswa, yakni seberapa jauh kompetens~ siswa dan kompetensi mata' ,pelajaran 'dikuasai oleh para, siswa. Evaluasi' ini berori~ntasi kepada
produk:, bukan kepada proses.
Evaluasi diagnostik adalah .evaluasi . yang,. bertujuan . untLik··, melihat kel'em~han-'
ke-temahan" siswa·
serta faktor '. penyebabnya.
Evatuasi, ..:: inr
,dilaksanakanuntuk' keperluan.bimbingan belajar,·:pengajaran. remedial (remedial
teaching),
menemukan 'kasu.s-kasus, .dan
lain-lain.
Soal-.soalnya' '...disusun
sedem'ikian rupa agar:.dapat ditemukan jenis.kesulitan. belajar"yang·dihada.pi oleh 'para siswa. Evaluasi sefektif adalah 'evaluasi yang bertujuan' untuk ,keperluan ·::seleksi, misalnya tas atauujian 'saringan "masuk ke sekolah tertentu.' Sedangkan, evaluasi
penempatan adalah evaluasi yang ditujukan' untuk mengetahui keteratrlpilan prasyarat yang dipe-rtukan ba'gt suatu·prograln 'befajar dan penguasaan, belcijar
seperti yang diprogramkan sebelum',memulai kegiatan' belajar'untuk program'itu. Dengan perkataan, lain, evaluasi ini ·berori,entasi kepada kesiapan siswa untuk menghadapi program baru dan, kecocokan program belajar deng.ankemampuan
si,swa.. . .Dari segi alatnya', evaluasi"':hasiJ belajar dapat dibedakan :menjadi (a) tes ~~fl':~(b)
bukan tes (nontes).,
~~~{a:lisan)~
T~s bisa' terdiri
atas t.es lisan (menuntut jawaban
tes tulisan (menuntut· jawaban secara. tulisan), dan tes tindakan
{menuntut jawab'an daJam bentuk,·perbuatan).SoaJ-soaJ tes. ad'a yang disusun
dalam', bentuk (a)' objektif, ada juga yang disusun' dalam bentuk (b) 'esai atau uraian~ Sedangkan'bukan; tes sebagai alat penilaian mencakup' observasi,
kuesioner, wa'wancara, skala penilaian:, sosiometri, studi kasus, ~an lain-lain.
22
'Tes hasil belajar ada yang sudah dibakuk.an (standardized test), ada 'pula'
yang dibuat guru, yakni tes yang tidak baku. Pada umumnya pen'ilaian' ha,sil· belajar di sekolah menggunakan tas buatsn guru untuksemua bidang ,studi/mata pelajaran. Tes baku, sekalipun lebih baik dan pada tes 'buatan g.uru; masih' sangat langka sebab membu'at tes baku .memerlukan beberapa kali percobaan dan anaJisis dari segi refiabUitas dan validitasnya. 'Tes sebagai,. alat' 'penilaiah hasil belajar ada yang mengutamakan kecepatan (speed test)· dan ada ·pula'yang mengutamakan kekuatan (power test). "Tes.objektif pads umumnya "termasuk speed tes sebab jumlah "pertanyaan cukupbanyak' waktunya relatif·~terbatas, sedangkan te's esar termasuk power test sebab jumtah pertanyaan' sedikit . waktunya relatif lama. Dilihat~dari' objek yang dinilai atau penyajian tas ada'yang bars,ifat individual, dan ada' tas yang bersifat kelompok. Dengan menggunaka r~spons peserta, tes: dapat dilihat' kualitasnya berdasarkan teon tes,
"yang
melip'uti te'ori te's klasik dan te'on respons butir. Kriteria ketuntasan minimal (KKM) disebut pula dengan:· batas ,Iulus atau
standard setting. Standard dapat diartikan sebagai ukuran atau' patokan yang disepakati. Standard'setting adalah proses menentukan cut score ·terhadap
instrumen' pendidikan atau psikotogi"' untuk menjawab pertanyaan "seberapa
bagus yang disebut cukupbagus" (George Engelhard, J.r: dan StepJJen ,E. Cramer, 1995 dalam Wilson, dkk; 1997). Komponen esensialdari, standard setting ,melalui jUdgment seperti yang
dikemukakanoleh Angoff (1971), Ebel (1972)', Jae'ger (1982), and Nedelsky (1954) adalah panel~s atau penilai ahli·.. (Plake,Melican,. & Mills, 1991). Jaeger
(1991)mengidentifikasidelapan kualifikasi ahlibidang studi (Subject Matte~ Expert, SME) yakni (1) terbaik dalam bidang spesialisasinya; (2) memnlki-'~ wawasan ya'ng lua~ dalan1'" bidang keahliannya; (3) memiJiki kemampuan} menyelesai'kan masala'h dengan cepat sesuai bidangnya; (4) mampu mengkaji secara mendala'm level konseptual dalam bidangnya dibandingkan 'oraggbaru; (5) menganalisisproblem-problem dalam bidangnya secara kualitatif; (6) menilai J'
,~ ";i)
.
23
--,. 1.
problem secara lebih akurat dibandingkan orang :baru; dan (8) mempunyai daya
rngat semantik ,yang lebik komplek. Standard setting adalah proses' yang digunakan.· untuk menentukan atau memilih suatu .passing score pada suatu ujian. Dart semua. langkah-Iangkah di .dalam proses' pengembangan tes, standard' setting' merupakan tahapan yang
lebih· dekat pada. 'sent daripada sains (ifmu pengetahuan); sedang metode-
statistik yang saling'digunakan di dalam pelaksanaan suatu: standard .setting, juga lebih banyak melalui pertimbangan dan atau kebijakan·. H'attie & Brown (2003) menyatakan bahwa setting.perfonnance standard merupakan.suatu'proses meminta pertimbangan rasionaf dari,·para. ahti'yang (a) memiliki pengetahuan tentang .kebutuhan akan' les dan ·asesmen..·.' yang ingin
ditetapkan standamya; . (b)' 'memahami makna skor pada "':Ievel .yang bervariasi
.pada, skala' yang digunakan' untuk. menyimp'ulkan perforrnansi ·peserta tes; .dan (c} memahami sepenunya batasan tentang prestasi yang berhubungan dengan
standar· performansi yang' dimintakan kepada mereka iJntuk. ditetapkan~ . Terdapat lebih dan· 30 metoda standard setting:·.yang berbeda dan ·telah diuraikan di d·alam berbag·ai ·Jiteratur pengukuran (Glass, 1978; Hambleton, 1980; Ja'eg'er, 1979). Namun daJam' p~rleHtian ini hanya dibahas metoda yang berbasis
perangkat tes,' perangkat tes dan peserta tes (campuran), dan berbasis peserta tes saja. Pada metode Angoff ·kJasik (1971), panelis diminta· untukberpikir ·tentang
suatu ketompok 'peserta' tas.dan mengestimasi' proporsi .dan mereka yang akan d~p~t
menjawab' ·item dengan
tepat. Kemungkinan ini kemudian dijumlahkan .
untuk semua item untuk memperoleh passing score minimum. Rerata cut-off
scoremerupakan cutting' score final untuk sebuah tas. Dengan kata fain bahwa,
kO'nsensus dan s.emua penHaian ahfi'menjadi passing score minimum. Keunggulan metod~.Angoff dibanding 'dengan prosedur yang. lain (Impara,
2000:2 dan' Goodwin, 1996:253) ada'lah .prosedumya sederhana dan mudah' dilciksanakan', karenanya reliabilitas asesmen intra dan"inter judgement menjadi
24
"..:..
· .
tinggi. Metoda ini menggunakan statistik sederhana yang mudah dihitung dan dipahami.
Metode Angoff dapat dilaksanakan sebagai berikut:V-i; a. Panelis melihat butir'soal pertama dan menilai tingkat kesulitannya.
b. Setiap panelis secara· individu· mengestimasi persentase sekelompok peserta tes: yang dapat m'enjawa.b butir soal den'gan benar. c.
Panelis mendiskusikan hasil estimasi mereka~
d. Setiap hasil estimasi ditabulasikan dan dihitung rata;ratanya. e. Urutan di atas diulang untuk semua. butir·soal.·
f.
Rata-rata hasil estim'asi setiap b'utir dijumfah dan' dirata~ratakan kembali ' untuk memperoleh' cutpoint. Metoda yang merupakan" perbaikan dan'metoda Angoff disebut dengan
metoda extended Angoff. Untuk:menyederhana'kan proses ·pada, metoda Nlgoff, Impara dan Plake' (1 ~7) mengusufkan 'agar panetrs memutuskan apakah
peserta ujian secara individual mampu atau' tidak
~ampu
menjawab butir soal
dengan benar (Stahl, 2008). Cara ini dinamakan prosedur YAITIDAK~ Jawaban diskor 1bila ya ,dan d·iskor 0 jika tidak. Skor diperoleh' dari' tiapbutirsoal kemudian dijumlah dan hasilnya dinamakan sebagai Kriteria Ketutusan Minimal
(KKM) atau Minimum Passing Le.vel (MPL) dari panelis. Rata-rata KKM dari sekelompok panelis merupakan batas kelulusan final.
Rasionaldari modifikasi ini adalah akan lebih mudah bagi panelis memperkirakankem'ampuan
satu
peserta
ujian
dart
pada kemampuan
sekumpulan peserta' ujian,' sel,ain itu menjawab YAITIDAK lebih mudah dilakukan" daripada menghitung persentase (Ricker, 2009). METODE PENELITIAN
TUjua'n pe-nelitian ini adalah' untuk menetap'kan' b'ata's skor tutus m"ata
pelajaran produktif SMK.
Selanjutnya, inforrnasi ini digunakan sebagai bahan
pertimbangan dalam menyusun kebijak.an tentang pelaksanaan UN SMK di . masa yang akan datang.
'. Sesuai dengan tujuannya maka' metode yang 25
- .. 1
digunakan dalam penelitian ini adalah' 'survei. Kegiatan ini dilakukan di Universitas Negeri Yogya'karta (UN'V) dengan sampet peserta dan beberapa SMK di Sleman Yogyakarta.
Subjek penelitian ini adalah panelis. Panelis kegiatan ini adalah guru mata pelajaran keterampilan 'produktif di SMK: yang mengajar dalam bidang studi yang ditetitr mintmum 10 tahun dan mengajar ketas 12 pada mata pefajaran tersebut .minimal salama 5 tahun. Jumlah guru setiap mata pelajaran adalah 12 orang. Dalam kesempatan ini ketua ~elompok' adalah' dosen UNY yang minimal, berijazah 52, pengalaman 'minimal 5, tahun, dan berasal dari program.studi· yang
sahla dengan program studi panetrs yang. dipimpinnya. Metode yang di'gunakan untuk mengumpulkan' data. dalam penelitian ini adalah
dokumentasi,
wawancara,
dan' survei.'· Selaras ,dengan, metoda
pengumpulan: datanya, instrumen' yan'g',digunakan adalah daftar dokumentasi,
pedom'a'n ·.wawancara, dan kuesioner. '. Teknik analisis data, yang digunakan dalam', penelitian ini adalah prosedur Ango'ffpada mata', pelajaran produktif di SMK, khususnya jurusan bangunan.
Pada metoda Angoff,' teknik analisisdata yang digunakan adalan mengh'itung rata-rata j.u'mlah butir yang" diasumsikan dapat oJeh panetis dikerjakan oie'h peserta tes. Selain itu jugamenghitung persentase' jumlah' dari butir yang diperkirakan dapat dikerjakan oleh peserta tes.: HASIL PENELITIAN m~nggunakan metode Penentuan batas kelutusan atau KKM dengan '. . .
~
.
i~·Angoff dilakukan terhadap mata pelajar~n SMK keterampilan Te.~nik Bangun~n.
iJ?§~elis yang terlibat merupakan guru bidang studi yang telah berpengalaman : mengajar sesuai dengan bidangnya. Banyaknya panelis, untl:lk' masing-masing mata' p'etajaran' tidak sama~ Batas kel'ufusan ditentukan dengan, 2 ,putaran, dan
hasil yan'g digunakan h~nyalah putaran 2. HasH putaran kedua metoda Angoff 'dari 7 panelis terhadap 40 butir 50al mata pelajaran Teknik 'Bangunan, diperoleh rata-rata ·.:KKM ,atau rata~rata 26
banyaknya soal yang diperkirakan bisa dijawab dengan benar ol'eh siswa yaitu sebesar 26,14. Dalam skala 0 sampai dengan 100, dip'eroleh rata-rata KKM
sebesar 65,4. Tabel 4.3. menunjukkan ringkasan hasil standar setting' metode Angoff pads mats pelajaran Teknik Bangunan.
label
~.
Hasil Slandar Setting Melode Angoff pada Mala Pelajaran Tekriik Ban unan 40
7
26,14
65,4
Hasil diskusi kelompok pada. 'putaran kedua metode Angoff teridentifikasi deskriptor KKM se'bagaimana ditunjukkarl,'pada': table 4.4. T~bet ini' menunju~k~n banyaknya panelis dan 7 panelis yang., menyatakan "Va" atau siswa dapat mengerjakan soal dengan deskriptor 'sesuai' ':deng'an :yang tertera pada kolom deskriptor.
Tabel2. Deskriptor KKM Mata PeJajaran Teknik Bangunan Hasil Metode Angoff Putaran Kedua
...:.; .....
1
3
2
7
3 4 5
0
4
Menggunakan menu. tik
2
6 7
7 5
Dapat menghitung resultan gaya Dapat menggambar pondasi bt kali Dapat mengidentifikasi koordinat dimensi
8
1
9
6
10
5
11
3
12
3
1·3
5
14
a
15
6
Menentukan tegangan tali Dapat mengga,mbarP. Amerika Dapat menulis, n'otasr gambar penulangan
-dapat men-e-rttukanbe-sar huruf untuk jlJdljl gam bar dcrn' keterangan skala sesuai.standar Dapat menggambar dengan sistem koordinat kartesius,
polar, relative
'
Dapat menggambar ~,Iemen kuqa-kuda kayu Dapat menyusun dan m:eriguraikan gaya . Dapat menggambar 3D .·Dapat menY~,b~tkan janis bahan dan bentuk atap . Dapat menghitung tulangan pada betan bertulang' 27
5
16 17 18 19
7
20
6
21
6
22
6
~Pat rneny~but~an j~nis bahan d~n b~nt~~ I~ngi~-Iangit
23
1
Dapa1 menggambar den-gan srstem koordinat kartesius, polar, relative
Dapat mengenali sistem operasi perintah sederhana Dapat menggambar proyeksi orthogonal Dapat menghitung volume setiap pekerjaan dapat menghitung tulangan, paQ,a kolomDapat mengi,dentifikasi alat-alat gambar Dapat mengidentifikasi koordinat 3D untuk menggambar '
5, 6
as
:,objek
24
Oapat menggambc,tr 3,0
25 26
, aapat merencanakan pola
4 "'0
'Dapat'menggambar objek'3D Dapat.~enggambartangga ,betor.J, , Capat menghitung vQlume setiap pekerjaan Dapat mengetahui macam-macam pondasi Dapat menggunakan menu tile "
28 29 30
31
6 5.
32
2
33 35 36
7 7 5 6
Dapat mengidentifikasi jenis bahan kontruksi dapat menggambar 3D Dapat mencreate folder/file dapat menentukan spesifikasi bahan atas
38
5
oapst menghitung tufangan pada kolom BS
39
4
40
1
Dapat menuliskan keterangan dalam format daftar gambar Oapa! men,gidentifikasi alal-alat gambar
34
PENUTUP f
),)1 i,'
~~~:,~~~simpulan
Batas kelulusan dari mata pelajaran Teknik bangunan, dengan berdasarkan Metode Angoffsebesar 65,4; dan kemampuan lulusan mata p~lajar~n' Teknik bangunan yang banyak diseb,ut panelis adalah: a) menggambat· P. Amerika, b) me'nggambar pondas; batu kaH, c) me'nghitun'gtulangan pada kolo'm BB, d) mengidentifikasi
Jenls
bahan"
kontruksi,'
f)mengidentifikasi, alat-alat gambar~ 28
e)
,menggambar
3D,
'dan
2. Saran
Terkait dengan hasil p'enelitian ini,. p'erlu adariya' penentt!Jan. b·atas kelulusan untuk berbagai 'mata pelajaran dan perlu adanya pelatihan ,kepada guru-guru untuk' menentukan batas lulus dengan beberapa metode dan
penyusunan tas dengan variasi tingkat kesulitan' soal-soal yang diujikan bagi
siswa. DAFTAR PUSTAKA, ,
,
Angott, W. H. (1971). Scale, norms, and equivalent .scores. in.R" L. Thorndike (Ed.),. EdyqationFj!/ m~a~urefJJent (2nd ed., pp. 508-600)~ W~shington~ DC: American 60uncU' on Education. ' , -, '.
Anonim.
Standard Setting. Diambil dari an,drews.ac.ukl pada tanggal.16 Septe'mber 2009. 2009.
http://byte-induction.st'
Depdikbud. (1998). Laporan HasH EvaJuasi ·PeJaksanaan Program . . Direktorat Jenderal Pendidikan Dasar. dan Mengengah tahun 199411995 s.d. 1997/1998. Jakarta: D~pdikbud. .. . Djemari MarcJapi dkk. (1999). Survei Kegiatan Gurudalam MeJakukan Penilaian dj Kelas. Laporan Pene/ji/an. Yogyakarta: Pusbangsisfian Le,mllt IKIP Yogyakarta dan ·Pusisji~n balitbang Depdikbud.
Djemari Mardapi, dkk,.. (2001). Sistem, ujt~n akhir dafarn otonomi daerah. Laporan penelitian. Yogyakarta: Universitas Negeri YogY,akarta. Ebel, Robert L. (1972). Essentials of 'educational measurement.' Englewood
CUffs: Prentice-Hail., GlaSt C.A.W~ et al.(1997).AStep Model to Analyze Partial Credit. In Hambleton, K.R & vander Linden W.J'.' (eds~'1997), Handbuok -of, Mo-dem Item Response Theory. Ne~ York: ,Springer.
Goodwi,n, L. D. (1999). Relations between observed item difficulty levelsanq Angoff mln'imum passing ieve"'s for a group of bordernneexam·in'ee~. Applied Measurement in Education, 12, 13-28. Hambteton, K.R. at a1. (1991). Fundamentats of Item Response- Theory. ~ew, York: Sage Publica~ions. .
Hatli'e, J.A., & Brown, G. T. L. (2003, August).' Standard s~tting: for asTTle reading: A comparison of methods. as~le l"echn-ical Report #21, ,University of Auckland/Ministry of Education~,' '
lrY.'para James C. & Plake Barbara S. (2,000). A C'omparison of Cut Sc·ores usin-g Multiple Standard Setti'ng Methods. Paper presented at the Large S'cale 29
.,'Asse·ssment: Conference. 'Snowbird, UT June, 2000. at http://www.uni.edui"BiAcOicoopiisaciaeramiHardsimpfina"l.pdtdiam·bfl tangg~.127Nqvember2005
..',
Impara, J.e., & Plake, B.R (1997).
Standard~setting:
Analtemative approach.
Journal of EdUcational MeasUrement, 34, 35~366. . lnipara, J:·C., Barbara" S Plake. 1998. Teachets' 'Ability to Estimate Item ,,pifflcuity: ."A .::Test ~; the. Assumptions In the A,?goft Standard. .Sett!ng Method. . University of Nebraska-Lincoln. Journal of Educational Me~su~em~~t. Spring,
Impara, J.C.,
Bart)~ra
1998. Vo1.35, No. 1
S Plake. 2000. A
comparison of Cut SCOres Using MUlliple
StafJdard :·S.Efffing . Methods, Universitas Nebraska- ,Lincoln, Paper Pf~sent~~ ~t "the Large Sea"le Assessment ConferefJce. Snowbird,
June~::
2090.:
.
.'
,
"
Jaege~ ~. ~. (1~89):'Certificatio~ Of st~dent c~!1:!~t~r!~ .. ln ~~
L: Li.nri
ur, .
(~d')J
Education~1 measurement (3rd ed., pp. -485-514). New 'York: American
'Cou·ncil on
~ducationlMacrriillan·. .
Jaeger,_ R. ~~ (1.~9~). Select~D.-1J
' ,
Of,
judgf}~_. for _st~,!dard-settjfJg.. Educational -Measurement: Issues and Pr~ctiCe, 10(2),,3-6, 10." .
.....
.
.
.
Lin, J. (tth). The' Bookmark' Standard Setting. Procedure: . Strengths and Weakn'esses. Alberta: The Centre for Res'earch 'in Applied M-easurement and Evaluation, .The University of Alberta'. Diambil·· pada' tanggal' 30 Oktober' 2009 dari http:// www.education.uafberta.caiedudpsyc"hicrameifiiesistandard_setting.pdf
Lin, Jie. The Book 'Standard Setting Proced(Jre: '-Strengths and Weaknesses. http://www.education. u·alberta.cafedu.clpsy.chf . crame/files/standard_setting.pdf diamoil25 AgUstUs 2005. , Mard~pi (1.99~). Estim~s~ "~esC!l~h~nP"en-9"~kl:Jra!1 dala.m" Bida!19 PE!ndidik~~ ~~~
Implikasinya pada Ujian Nasional. -. Pidato; Pengukuhan Guru Besar 'di ·UNY
Yogyakarta tanggal 11 September 1999.
Mitzel, H. C., Lewis, D. M., Patz, R.J.·, '& .Green, D. R.' (20.01). The Bookmark Procedure: Psychological. Perspectives. In G.J. Cizek' (Ed.), S'etling Performance Standards~Mahwah, NJ. Nedels'ky, L. (1954). Absolute grading standards for 'objective test. Educational and Psychological Measurement, 14,3-19.
PlakeB. S., Impara, j. C., & irwin, P. (2000). Consistency- of Angoff-based predictions of item performance: Evidence of techn.ical· quality of results from the Angoff standard setting method. Journal of Educational Measurement,"37(4), 347-3S5. .
.30
-- .. 1
Plake:: B. S., Melican, G. J., & Mills, C. N. (1991). Factors influencing intrajudge consistency during standard-setting. Educational measurement: Issues and Practice, 10(2), 15-16, 22, 25. _,I,;
Ricker, K. L. 2009. Setting Cut Scores: Critical Review of Angoff and ModifiedAngoff Methods. Edmonton (Alberta, Canada): Centre for Research ,in Applied Measurement and Evaluation University of Alberta. Stahl, J. A. 2008. Standard Setting Methodologies: Strengths and Weaknesses. Illinois: Pearson VUE. Oiambil pada tanggal 28 September 2009 dari www. iaea2008.ca mbridg ea ssessment. org. u k1ca/dig italAssets/180502_ Sta hl.pdf Undang-undang No.20 tahun 2003 tentang Sistem Pendidikan Nasional.
31-
IMPLEMENTASI METODE NEDELSKY UNTUK PENETAPAN STANDAR KELULUSAN UJIAN NASIONAL 01 SEKOLAH DASAR Sri Rejeki Universitas PGRI Yogyakarta JI. PGRII No. 117 Sonosewu Yogyakarta
[email protected] ,
[email protected]
ABSTRAK Penelitian ini bertujuan untuk: 1) mengetahui karakteristik hasil Cut Score Ujian Nasional (UN) di SD berdasarkan implementasi metode Nedelsky, 2) mengetahui keyakinan/kepercayaan panelis terhadap implementasi metod.e Nedelsky untuk menetapkan Cut Score; 3) mengetahui akurasi implementasi metode Ned·elsky berdasarkan standar deviasi. Proses. penetapan stand~r menggunakan soal UASBN SO di DIY tahun ajaran 2008/2009. Penelitian ini melibatkan guru SO di DIY, sebagai paneHs adalah sejumlah 10 guru p'ada putaran 1 dan 16 g'uru pada putaran 2. Penelitian ini .dilakukan mengikuti prosedur dan analisis data dalam metode Nedelsky. Analisis item menggunakan program ITEMAN. Berdasarkan hasH anaJisis disimpuJkan Rerata Cut Score berdas·arkan metode Nedelsky untukmata pelajaran Bahasa Indonesia sebesar 28,44; Matematika 23,47; IPA 27; 2). Keyakinan/kepercayaan panelis dalam implementa·si metode Nedelsky 43,750/0; 3)standar devia.s.i untuk" masing~masing mata pelajaran berdasarkan implementasi metode Nedelsky ,Bahasa Indonesia 12,45, Matematika 9,136 dan IPA 18,97. Kata kunci : metode Nedelsky, uJian nasional PENDAHU·LUAN
Oalam rangka pengendalian rTlutu pendidikan secara nasional seharusnya difl~kukan
evaluasi sebagai bentuk akuntabilitas penyelenggara pendidikan
f
kepada piha-pihak yang
,! ;~ .\:' , ~\
berkepentingan.
Ujian Nasional
pada
sejarah
. perkymbangan dan implementasinya terdapat beberapa permasalahan yang muncul seperti masalah administrasi, persepsi stakeholders, penetapan batas kelulusan, .dan masalah geografis, pemahaman terhadap Kurikulum Tingkat Satuan Penqidikan dan adanya otonomi daerah yang berdampak pada otonom'j pendidikan di Indonesia. Oi sisilain dalam penetapan standarkelulusan di Indonesia belum memanfaatkan metode standard setting yang berkembang dalam sistem 32
.......... .•
l.
pengujian' dan,. penilaian yang ',' .latah·
fle"netapan, standard
kel,ulusa,n~,
~i.terapkan
oleh·, ,beberapa;' n·.eg·ara·.
b.erdasarkan hasil implem'entasi m'eto'd'e:
standard setting akan memberikan manfaat dan kepastian..Adanya· kebijakati
l :
rnenjadi
terhadap penetapan kelulusan karena
ada
dua
$i~i
dilema
pada
ke,bijakan
nasional,
.yang berbeda, di satu sisi penetapan kelulusan oleh
masing-m'asi'ng: sekotah.' berd'ampak pada sifat· penetap'an yang b'ersifat b'anyak (majemuk) dan di sisi lain bersifat tunggal yaitu bersifat nasianal. Petbedaan
ini rnenimbulkan dampak pada implementasi KTSP sebagai perluasan otonomi
pendidikari dibidang kurikulum. Apabila pemahaman KTSp·· sebagaikurikulum
yang; diteta'pkan" sec'ara n'asionat tetapi : p'e'ngembangannya diserahkan', kepada tingkat satuan· pendidikan atau, setidak-tidaknya di tingkat kabupate"!k0ta maka .:'. penetapan '. standar" ': keluluscln .semestinya' mengikuti' kebijakan :tersebut. .
.
. ;
.:pleh. karena .itu penelitj~n' in.i mengangkat permasalahan "bagaimana. iinplem~n~si .; ::1';.
·:dipenukan· m'etode Nedetsky sebagar·, salah' :satu,)
standar,'
sett~ng
.: ·dal,am
menetapkan cut. score Ujian 'Nasional'di SO?". Tujuan dan manfaat peneliti,an ini ','!adalah deng~n
adanya·· metode
yang, standard
'·penetapan
,:maka .... 'hasil
.,kelulusan akanvaliddan kredibel, dengan penetapan batas kelulusan yan~ valid dan kredibel dapat dijadikan,sebagai' salah satu ·in·di'kator peningkatan. k.uaUtas
pendidikan,·di Indonesia. Implementasi Metode Standard Setting dalam Ujian Nasional di Sekolah Dasar
Penetapankriteria pe'nilaian memerluk'a'n standar terte'ritu yang
, disebut
dengan standard setting (setting performance standard). Penentuan standar
pendidikan
adalah penentuannilai
batas/standar kelulusan
stdrl3j. nilai b~t~~
(cut
Seseorang dikatakan sudah. lulus/kompeten bila telah melewati
tsrsebut berup'a n'ila'i boats's a-ritara", p"e'serta didik yang s'udah menguasar kompetensi tertentu dengan pesertadidik yang belum menglJasai kompetensi
tertentu. Sila itu terjadi pad a ujian nasional atau 'sekolah' maka nilai batas .
.
'
berfung$i untuk memisahkan :antara peserta",didik yang lulus dan tidaklulus .".
".
.
. . '
'.
diseb'ut batas kelulusan. Kegiatan pen'entuan b'atas,,'kelulusan,diseb'ut standard 33
setting. Dalam konteks . penilaian yang
digun~kan
di· lingkungan pendidikan,
pembeda·an haru·s d·HakiJ·kan antara standar isi dan standar prestasi', karena ketidakjelasan: mengena.i perbedaan antara kedua konsep 'ini sering\l.lkaU ~uncul' di
·kalangan
pengambil' kebijakan,
pendidik,
dan
masyarakat.
Standar
isi
tercerminkan dalam kurikulu·m dan menetapkan apa yang semestinya diketahui dan bisa dikerjakan olehpeserta· ujian: sedangkan standar presta.si dipandang· sebagai operasionalisasi standar isi bagi tes atau penilaian yang' talah disusun
untuk mengukur standar is-i.·
J .
Secara 'umum metode standard setting diklasifikasikan dalam 3 kelompok
(Cizek. &. Bunch,' 2007:9) yakni examine centered versus· test centered; .ho/istio
models: versus analityc models; norm referenced versus oriterion referenced.
Menurut Jaeger· (Cizek- & Bunch,2007: 9). ,metode penentuan: standar bisa diklasifikasikan· me·njadi dua kategori· yaitu. metode yang, terpu~at pada: peserta
ujian dan metoda yang terpu·sat.. pad·Cl. ujran·. Kane (Cfzek & Buo'ctl,2007: 9)talah
·mengemukakan
cara·
untuk . mengklasifikasikan metode penentuan
standat. la men·gemukakan· bahwa metoda bisadiklasifikasiKan ssoagai model holistik ·"yang. berasumsi bahwa prestasi' danketerampilan sangat terintegrasi"
ata·u model: analitls· "yan-g berasu:msi bahwa prestasi bisa: diuRur menggunakan sam pel
kinerja".
Macam-macam
Hambleton~K. Ronald. (f;3renar',
standarsd
setting
(Pitoniak,J ,Mary
.
200.e:.p.433-470):
Metode Nedelsky
.Metoda- ini di·kemukaka·n oleh· Nedelskypada tahun .1854, bi·sa. digunakan pada ujian pilihan
gand~t
Metode ini mensyaratkan penilaian tentang· setiap
ja\vaban yangmungkin salah. Tugas penilai adalah melihat pada pertanyaan dan irtiengidentitikasi jawaban-jawaban keliru yang dapat dikenali oleh peserta ujian.
Set;iang peniJai-
d,apat ··mengambU·
batas tertentu· u·ntuk meng'urangi jawaban-
jawaban yang keliru. Metode Nede.lsky merupakan metode yang berdasar pada acuan kriteria untuk menentukan digunakan
cut
score.
fv1etode
Nedelsky·, masih
karena metode inL adalah salah satu. dari metode pertama .yang
menggeser fokus dari ki·nerJg· yang·· berdasar pad~ acu·a·n n·orm·a, karen·a·· acu·an· 34
--
.•.
.
i;.
norma dian.ggap tidak· terbuka dan akan memunculkan rna'salah ·validitas yang
se-riLis(Cizek;
2007:69~ 70).
.Salah satu dari K:i3terbatasan prosedur Nedelsky adalah"b.ahwa prosedur
inimensyaratkan sem'ua penila'i untuk membuat penilaian-penilaian mereKa pada saat dan tempat yang sarna. Keterbatasan lain adalah bahwa, bahkan dengan jalan p'intas ini, prose'dur Nedelsky masih b'erjalan larnb'at(meskipun' tidak selambat usaha untuk menca.pai konsensus kelompok pada s.etiap pertanyaan). Keterbatasan metode Nedelsky- yang' lain adalah penHai dapat pada- saat harus menjawab pertanyaan akan m-erasa seperti _di uji," padahal mereka sebenarnya diminta -.menjawab dalam-' rangka
untuk bisa me'ndapatkcin cut-: seo're, d'j
samping·itu, proses penilaian akan butuh waktu yang"lebih -Iama:"jika- para. pen'ilai itu :harus melakukan langkah ekstra untuk- menunjukkan. jawaban yang benar untuk -setiap pertanyaan.. Metode Nedelsky· didasarkan.. ·pada gagasan
bahwa penilai akanmenjawab pertanyaan pilihan'ganda den'gan'pertama~tama "
mengurangijawaban yang·ia kenali sebagai
s~lah',dan me~ebak secara
acak
dari Jawaban-jawaban selebihnya.
Kemudahan
d~lammetode
Nedelsky 'dalam menemukan skor' antara
lain, dalam metoda Nedelsky,.- perkiraan skor peserta ujianditentukan dengan cara menganalisis pertanyaan dibagi oleh jumlah jawaban yang harus ditebak
oleh peserta tes. Menemukan perkiraan
skor
peserta
ujian"
secBra
keseluruhan, danmenambahkan perkiraan skor peserta - ujian untuk semua pertanyaan.
METODE PENElITIAN. Penelitianini
..
menggunak~n pendekatan
deskriptif kuantitatif, bertujuan
untuk mengetahui standar kelulusan (cut score) UASB.N- di SO. Teknik
pengumpulan data menggunakan wawancara,angket terb~uka, dan rubrik
standard setting metode Nedelsky. Subyek penelitian meliputi soal UASBN 2009, lembar jawaban siswa, dan guru sebagai panelis. Soal UASBN meliputi mata pelajaran Bahasa Indonesia (50 item), Matematika (40 item), dan .lImu 35
..-- _.
.
~
'. Pengetahuan· Alam . (40 item). Data le'mbar jawaban siswa d.iambil ·dari
popu.Ja·si· perserta· UASBN tahun pelaj-aran ·2008/2009 di DIY d.en9:.a.n, teknik multy sta~e nampling.· Dan data itu' diambil sa'mpel 1650, terdiri atas 330 dari
tiap' kabupaten dan kota di DIY.· Pertiti1bangannya didasarkan .pada peringkat
sekolahdan' daya serap siswa' kategori tinggi, sedang, dan rendah. Guru
sebagsi:·. paneliS· d·ismbil. datig:uru ·.kefSS VI--: yang· SUd·ah memiUkl' sertifikssi pendidik di Dly'dengan jumlah' ··10 guru,·· pada putaran pertama dan· 16 guru pada . . .·putaran kedua." Pelaksanaan . peneliti~n pada putaran pertama diawali
dengan'· memberikan orientasi' ·kepcida. :para panelis·. tentang metode' stal)dard
SEJtting malalui-. Foous: .Group-. Discussion -(FG:D);: panens dUatih tata· tara :·meng·iSi .format metode Nedelsky.: Setelah 'panelis memahami maka di berikan soal UASBN
.tahun 2009 .dan. .Iambar .isian· metode Nedelsky. Peneliti· menjelaskan .bahwa jumlaJ'l .soalyang aka·n'dicermati sesuai dengan hasil···.analisis terhadap: kualitas·· tes yangd·ianalisis dsngan·ptogram.I.TEMAN-tm versi 3.0.. Panelismencermati soal' dan memberikan perkiraan apakah siswa peserta ujian mafTlpu mengerja.kan soal tersebut dengan' benar. tugas panslis adalah
mengidentifikasikan jawaban.. yang .mungkin. salah· yang dapat dikenali oleh
peserta uji·an. Skornya 1. dibagl jumlah· jawaban yang dimungk:inka·n· salah. HASIL PE~ELITIAN DAN PEMBAHASAN Karaktf;!ri$tik Soal l).N 2009' Berdasarkan analisis item dengan menggunakan Program ITEMAN (tm)
Versi· 3,,00. Koefisien relia·bilitas soal
Bah~·sa Indonesia
dalam koefi·sien Alpha (a)-
sebesar 0.874. Item-item soal Bahasa Indonesia mempunyai kategori tingkat
k~SOlitgl1
item (butit). sagl mudgh. SEM (Standard Error of Measurement)
seb·esar 2.384 dan meanP 0.779. Ada 92% (46 item)berfungsi. dengan baik
(d·ap·at digu·t1·g·kah) d·an 8°Aj {4} item: tidak d·apat dapat
d·igunaKah:~.
UntuK. mata
pelajaran Matematika reliabilitas dalam' koefisienAlpha (0) sebesar·O.936. Itemitem soaIMatamatikamernpunya.i. kategori tingkat kesulitan butir sedang. SEM :f:';\
.
(StandaroEnur of Measurement) sebesar 2.378 dan Mean P O.694~ ··Ada 97~5 .% 36
(39, item) dapatb'erfungsi' dengan baik (dapat digunakan)
dan 2.5%. (1 item)
tidak dapat digunakan. Kualiatas IPA untuk 'koefisien reHabifitas d·alam koeftS'ien Alpha (a) sebesar 0.884. Soailimu Pengetahuan Alam mempunyai kal~oribl)tir dengan tin'gkat kesuliatan sedang~' SEM (Standard Error of Measurement) sebesar 2.278 dan Mean p' O~750. Ada 97~5% (39 item) dapat berfurigsi dengan baik (dapat·digunak·an) dan 2.5% (1 item).tidak dapat digunakan.
Cut Score (Bata's' Kelul'tJsan)" 1) 'MataPelaj~ran Bahasa Indonesia Putaranpertama rata-rata KKM (Final Cut Score) sebesar 30 dengan persentase butir benar 65.2%. Berdasarkan perkiraan panelis maka persentase,
kelulusan 60%.
(990 dari 1650 peserta UASBN) dinyatakan lulus 40% (660)
dinyatakan tidak tulus. Apabila memperhatikan nilai yang diperoleh oleh
examine
maka yang lulus dari 1650 examine sebanyak 88.12% (1454 siwa) dan yang
tidak lulus 11.88%
(196 siswa). Adapun hasH KKM dari putaran pertama
berdasarkan anaHsis panelis dapat dilihat dalam Gambar 1 berikut. I----l=~~~a;fI~'~n~i{~~;;;kkM-ril~l----
I __ I
I I
! I
J '
~~~----J
50 45 40 3S
4y
45
I i
I
I
!
!
30
I
2S 20
15 10
i
5 '0
{ I
i
~ -s:-!Z,~ ~ ~ ~ ~ ~ ~ ~.~
_~fU
~
~
-~e
~
-~e;
-~e
~
~
-~e. -~fU
~
~
.
,,~fU'
~
.,.~e
~
-~
~
III Putaran 1
, :.
4f?
-1
._ _._._ _.
•
._.
•__.
-;---.
-
I III!
I
...I
Gambar 1. Rangkuman Hasil KKM (Cut Score) Bahasa Indonesia MetQ.q~
N'edefsky Putaran' 1 Berdasarkan hasil putaran pertama, dilaksanakan putaran kedu8, sebelum para panelis melanjutkan menganalisis item test, p:en'el'iti menyampaikan hasil pada p.utaranpertama. Berdasarkan hasil diskusi awal, panelis melanjutkan untuk bekerja secara individual. Panelis pada putaran kedua sejumlah 16 orang. Hasil pada putaran ked~a untuk UASBN mata. Pel.ajaran bahasa Indonesia ~7
--
,.
..
f..
diperoleh rata-rata KKM .(Final Cut Score) sebesar 26.875 dengan :persentase butir benar 57 .2%~ Berd·asaFkan p~.Fkira:an: paneli~ 'makcl perse·nta·se kelu.(u·sa·n· 43.8% (723 dan 1650 peserta UASBN) din.yat~kan lulus dan 56.2% (927)
~.l'
dinyatakan tidaklulus.Apabiia memperhatikan nUai yang diperoleh oleh examine
maka yan'g lutus dari .1650 examine Sebanyak 92.48% (1.526 siwa) dan yang
Adapu.ti.liasil KKM dali~ putaraft kedu·a.. berdasarkan analisis p~nelisdapat dilihat dalam Gamt?ar 2. beri:kut..
tidak lu·l·us 7.52%.
(12~:,$iSwa)..
[~i.~~~~~·;~~~(~·t;~il~~=:J· , .
~:6.A'~
4p.
I
I
Gambar 2. Rangkuman HasiJ KKM (Cut Score) Bahasa
Indonesia
M.eto.de N.edels.ky Putaran 2 Rerata cut score mata pelajaran B'ahasa Indonesia sebesar 28.4375' (28,44) artinya siswa dilJyata.kan lulus jika nilai minimal yang dicapai dalam
UASBN dalam mata pelajaran Bahasa Indonesia sebesar 6, 18. Apabila ~~impl~mentasikanpada I
frO
yang menjadi sampelpenelitian (1650
peserta ujian
"
.
p~~~rta)
:~:':~. J.. ~~ r'~::;" (, '
maka yang dinyatakan lulus sebanyak 89.64% (1479 peserta).
2) Mata PelaJaran Matematika
Ha.si.l p.l:lt.aran. p.ertama rat.a-rata K~M· (F!!1~! fi~t $gqr~) s~~~~~r 24;~ dengan persentase butir benar 62.5%~ Berdasarkan perkiraan pane·lis mak'a
persentase kelulusan 50%. 50% (825 arnyalaRan
(825 dari 1650 peserta UASBN) dinyatakan lu·lus
tioal< h.ilus. :Apaoila
(Ii
implemenlasikan paca nilaj·ydng:·
diperoleh oleh' examine 'maka 'maka yang 'Iultis dar; 1650 examine .. sebanyak 38
.......... .• t..
f\
63.88% (1'054 siwa) dan yang' tidak lulus 36.12% (596 siswa). Adapun hasil KKM
dari"putaran pertama pada' Ga'mbar 3.
r
!~lltlar.J:n ~1IMa.tematika
} I
t ~~
l 3:;; :----.---.--- --.---..------- -----..-- --..-~ t :~
.
I! ~ i1~_~-u=--~==_=~~ ...
~ ~-=--_. -==~=====-=
tl\} L...:..._.- '-.:..--.----.....:.:..---...:--.--.-.----- --.--.-.- - -.---.--.-.-------.-
Gambar~. Ra~gk~~an Hasil
Berdasarkan hasil p~ra
puta~~.n .
KKM (Cut Score) Putaran 1.
pertama, d'ilaksanakan putaran Kedua',' sebelum ~
.:
panelis melanjutkan. menganalisis item test, peneliti m~nyampaikan. nasil
pada putaran pertama. Berdasarkan. hasil diskusi awal, .panelis melanjutkan lJntuk bekerjasecara individual. Panelis pada putaran kedua sejumlah 16 orang. Hasil pada putaran 'kedua untuk UASBN mataPelajaran Matematika' diperoleh rata-rata KKM .(Final Cut Score) sebesar 22,438 denganpersentasebutir benar 57.35 %. Berdasarkan. perkiraan panelis maka persentase kelulusan ·37~5 % (sekitar619 dari 1650 peserta UASBN) dinyatakan lulus 'dan 62.5% (1031 dihyatakan tidak lulus). Apabila diimplementasikan pada nilai yang diperoleh oleh
examinemaka yang lutus 'dati 1650 examine sebanyak 69.1% (1140 siwa) dan yang tidak lulus 30.9% (510 siswa). Adapun hasil KKM dariputaran kedua
Gambar4.
39
pad~
Gambar- 4.' Rangkuman HasH KKM (C'ut Score) M'atematika Metode Nedelsky' P4~ar~n 2
Rerata cut score mata pelajaran
(60.256 %) UASBN
arti~ya
dala'm
Matematika sebesar 23.5 (23.4El9)
siswa dinyatakan lulus jika nilai minimal yang dicapai dalam pelajaran
mata
Matematika
diimplementasikan pada, peserta uji-an· ya·ng·
sebesar' 6.026.
Apabila
·rTlenjad.j sampel' penelitian (1650·
peserta) maka yang dinyatakari tutus sebanyak 67% (1110' 'peserta) dan yang .
...
tid~k,lul~s,berd~sa(k~n rer~t~ cutscoreM~temati.ka seb~~yak ~40 siswa (33
°AJ).
3) Mata Pelajaran ·IPA
MasH p·utaran· pertarna:,rata-rata KKM (Bnal Cut Scare)'sebesar 29· dengan persentase butir benar 74.4%. Berdasarkan perkiraan. panelis, maka persentase ,kelulusan '50% .(82,5 'dan 1650 p~~~rta U.A$Bf'J)· d'inyata,t
dinyatakan tidak lulus. Apabila di implementasikan pada nilai yang diperoleh oleh
exs'mine· maka maka,·yang· Iu·lu·s d,ari, 1'650 'examine sebanya,k 61.58% (1·016 siwa) dan yang tidaklulus
38~.42%
(634.siswa).
40
........
"
.,
i..;
.a__
W)~·el~~.~) lfP~.'~~is:.g;
~a~~iiiis·."
lPa:~f..et~JS.~.
_..
•
---------PT.
lJ>~~1fe·{ts..lJZ"!
~
"mm~_
"...:
1.-7 37
•
~
__
~n
g
•
~~~~~s
3>~
~
I
~
!~1f\~Hi~iJJ Pa:m\e1iig;~
I
n
~>~fl€:t~~<2
t.
iP~~i~s.j.m
_
L._ . _..~. __.. . _.~. __ . . _.~
_._._ , .
~~
~_. ~~_~~_
_. : __.
~ti I ....._....--.1
Gambar,5. Rangkuman .Hasil KKM (eL/t. Score) IPA Putara' 1 Berdasarkan disklisi hasil putaran pertama, panelis melanjutkan putaran kedua. :Pane1is pada putaran kedua selumlah' 16: ~oran~g. HasU pa'da puta.ran
'kedua untukUASBN mata Pelajaran 'IPA diperoleh rata-rata KKM (Final Cut
Scorej
sebesar' 25 clengan persentase butir benar- 64.15·%.Berda~arkan
perkira'an panelis maka persentase kefulusan 37.5 % (sekitar 619 dari 1650 'peserta UASBN) diriyatakan lulusdan 62.5% (1031 dinyatakan tidak· lulus). Apabila di implementasikan pada nilai ·yang 'diperoleh oleh examine maka yang lulus dari 1650examii1e sebanyak69.9-7% (1270 siswa) dan yang tidak lulus
30.03% (380
siswa)~
KKM dari putaran kedua berdasarkan dapat dilih'at dalam
Gambar6. r~"·"'·'·"
Ib
lP1J1~Jat~ll ~~~
l
-""I
I
....----:--_~"""'!j
I 1
.~~
I( ! 1 , - '_ _
!
I
! ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
~
-:,~"
~
)
~
~
~
~
~
~
~
@
~
~ ~ ~ ~ ~ ~ ~
~
~
~
WOI
I.:iolo
>.:ib
~
~
l JJJ JJI ~t I I .j ~ J~ '-
Ga.mbar 6. Rangkumafl Hasil KKM (Cut Score) IPA
41
Metode Nedelsky Putaran "2
Rerata·· cut $core mata. pelajara·n·
I·~A
se·be·sar 27 (69.23·%)- a·Ftin·ya· si·swa
dinyatakan lulus jika nitai minimal yang dicapai dalam UASBNdalammata··· p~laj~ran .I.PA s~b~s~r.6.~?
.Apa.bila .oi,irrJ.pl~~e~t~sikaJ:1 pada .peserta ujian yang
menjadi sampet penelitian (1650 peserta) maka yang dinyatakan lulus sebanyak
6$·.70·%· (11·5·0· peserta) da·n yang· tidal< I·ulu·s berdasa·rkan· rerata· cut score·
I~A
sebanyak 500 siswa. (30.30 %)..
Dalam .rnenemp,kan
dila.l
.d~Skript~r
UASBN berkaitan dengan SKL dan indikatomya. Deskriptor 'dia'mbil berdasarkan jumlah
panel·j·g ya'fig menyatakat1 .bahwa· Su·atu· soal dlpetki·rakan ma·mpu: .diJa·w·ab
benar oleh siswa minimallebih dari ~paroh (112) dari jumlah panelis (p;>5) untuk
.putaran 1:dan .(P~6) .untuk. putaran 2... ~ri.Kqt .ird dibeti:kao. salah $~tu. hasil atlalisis deskriptor antar panelisdiperole.h hampir, semua indikator dalam SKL mata
pelajaran· UPA marnpu·
dijawa~·
oleh siswa·, indikator .Kornpetensi· yang· dimiUki·· oleh·
siswa berdasar StandarKompeten~i Lulusan untuk mata pelajaran IPA yang tidak ~dapat _dijawa·.boleh ~~rt~. uji~n . rn~nlJ.rqt. paneUs adal~n. m~flj~I~~:ka~
penggunaanbahan rnengidentifik~:sika·n
tertentu,.
menje!askanf~ngsi
organ
bentuk energi,menjelaskan· cara
pada
a.kibat da.ri tumbuhan,
penghematan
energi·,
menJelaskan dampak pemanasan global, terjadinya gerhana bulan/matahari. a~rd~sad
.h~$U
~ng~~~t
.k~pada
.para
.p~nelis
bahwa
keyakinanlkepercayaan panelis dalam implementasi standard setting metode
Nedel·sky (43.75%).
~enetapan·
bata·s kelulusan (cut soore). akan· lebih··· baik
Idilaksanakan dengan metoda standard setting karena dengananggapan bahwa
Ide-ngan
.m~t~e $t~ndqrd ,.setting~k~O~ef1t?mu.k~ncut
s~r~
yang baik da.n
kredibel, meskipun pada akhimya akan ditetapkan dengan kebijakan namun h~n'daknya
berda·sarka·n· p·ad·a· ha·sil cut score dengan· metode sta·ndard setting·.
Para panelis percaya bahwa dengan metode standard setting penetapan standard .k·eh.J.lu.s~n .tid~k ~.k~n .m~ngurangi p~O .ko.~tra rnasal~f:1 ~.N.
Berdasarkan
puta~.n·
pertama dan kedua serta uji coba' teroatas metode Ned~\lsky dirasa sulit oleh pan~li$
k(l.rena· h·aru·smenganali-si·s sa-tu-pe·satu· item· sehingga· meraka· para· pa·ne.Ji·s .42
-
.•
...i . .
,merasa seperti diuji. KESIMPULAN DAN REKOMENDASI.
•
1.1'•.1
a. Kesimpulan Berdasarkan hasil analisis disimpulkan Rerata Cut ScOre berdasarkan
metoda Nedelsky u'ntQK mata pelajaran Bahasa Indonesia sebe'sar28,44; Matematika 23,47; IPA 27. Keyakinanlkepercayaan panelis dalam implementasi metoda Nedelsky4.3,75%. Standar deviasi ;"untuk 'masin:~'~ma5i'ng ·rnata. 'pelajaran beidasarkanimplementasi
met~~e .. ··Ned~.lsky
,. B~h~~ In'donesia 12,45,
··Matematika 9,136 dan IPA t8:;~97..··Nilai· mi'nimal yang. dapat digunakan .untuk· menetapkan batas kelulusan..(cut scpre)
~e.lu.lusan examine dalam
mata pelajaran
Bahasa Indonesia berdasarkan: hasil:'::, rerata. d'alam .metoda Nedelsky .sebesar 6.183, Mati pelajanln Matematika· metode Nedelsky sebesar 6.02,· dan
Mata
Pelajaran IPA urituk metode Nerdelsky 6.923.
b. Rekomendasi/saran 1. Implementasi metode standard setting dapat dilakukan .seCara bersamaan
dalam menetapkan cut score (standarlbatas kelulusan) 2. Metode· Nedelsky dapat digunakan juga untuk menetapkan KKM mata pelajaran.
3. Perlu adanya s~sialisasi" dan pelatihan kepada pihak-pihak berk~pentingan tentang metoda standard setting.
DAFTAR PUSTAKA Angoff,W.H.(1971·). Scales, norms, and equivalent scores. Thorndike (Ed), Educational Meauserment (~ed). Washington, DC: America,n Council on Education.
Badan Standar Nasional Pendidikan.(2007). Peraturan Menteri Pendidikan
Naslonai Nomar 20 Tahun 2007 fentang Sfandar PenNa/an Pendrdikan. Jakarta: BSNP . Brenan, Robert L. Education.
. Educational meauserrnent
43
- ... 1.
(4th. eel) •
American. Cou·ncil of
Cizek, J Gregory (ed).(2001). Setting performance standard, concept, methods, and perspectlves.New jersey: Lawrence Erfbaum Associates pubilsher.
Cizek, J Gregory, Bunch Mictiael B.
(2007).'
GUide to Estiabishing and. Evaiuating Tests: London: Sage Publi~tions. Gren.ba.Gh. j.. b;. J;.(197Q);.. ·Esseotia.l .Publisher. '~Raw
Dinas .Pendidi.kan,
,.P~muda
~f
Standard
Performance
Setting:
standards
A on
psyeh. '...... --' .-.el.eg.i.aal. '_.- --. - -" testio§;.· -- - _. -.-,.. New ,-" - "- Yerk.;.· - - .. '. ·H_a.r~er . ._.. -..-. ana. -"'-'
dan, Olah .Raga .OIY.(2009).· .LsfX)rSl'
.Ko1J1Pu:t~risa_si
Ujian Akhir Berst~ndar Nasional (UASBN).: 801M/. Propinsi Oaerah TstftYlewa Vogyakafta Tahiin PeTajaran 200BlZ009.' 'Yogyakai1a: Pemeniitati
t5j'Y, flinas Pendtd'kan, ,pemuda dan 0iah,..R~ga~· .. ,
Djemari niardapi,dkk.(20Q9). Stan~ard, Sett~n.g·. /-fas!( Peneiitfari. . Yogyakarta: Program,' Pascas8riana. ,Universitas .:Negen . 'Yogyakarta beke~asari1a dengan Pusat Penilalan Pe.ndidikan dan ~alitpC,Jng Kementrian Pendidikan· Nasional.'
. '
:
,.' ' .
.
., Pitoniak, J Mary' . Hambleton, K.Ronald.(2006). Setting Performance ~tano'~rd ~9b~rt L. Bren~n . Ed~~tion'al 'm~aus~rm~nt (4th 00), • A~ericati C,dlJ·ncil Of Educatioil.(p.433-470).
44
-
.•
.
'f.
VALIDITAS DAN RELIABILITAS INSTRUMEN PENILAIAN Si~EKSI UJIAN· MA~.UK KETERAMPILAN· KHU$.OS CA~ON MAHA~ISWA JURUSA~. PENDI.DIKAN
SENi RUpA FBS UNY iVlardiyatmo
Trie Hartiti Retnowati, 'Bambang 'Prihadi, ·I~.m·~ .. ·n61~~nI- U, II A\tell I l g I.. '""~JgTC1f~
n~in .. 1~ "'"'VI ~nn~nnn ~'!1~ur CIa.nr.lG.n "'-leu \.AUQ' I v 'UV, I~ '-'UI; r, ""r"'l I .Qr •
Y"·og' ,1.9ll.g .... ~· 1 ccgon.ca·I" ..
.e-m~il: .,[email protected]:
ABSTRAK TUJuan peneilti~J1 Inl adaiah untuk mengetahulkaraktenstlk Instruman penlialan yang digu'nakan ujian' se'leksi' ketrampilan khusus,"masuk ·Jurusan Pendidikan yang meliputi validitas dan ·reliabilitas.. Peng~mpulan data dalam ,peneJitian .inidtJaku.ka.ndenga.n teknik dQku.mentasi yaitu beNpa, tes yang' Seni Rupa . FBS.··..U NY
digunakali salama tahun 2007 sid 201'0' dan hasil tes' 'praktik pes'erta tes. Dilanjutkan .deng~n.· t~knik FGI)Pen~jiti~an ini mengg~nElkan . dua pend~katqn
d'alam' melakukan' ana'Ii'sis'
terha"dap, kara·kteristik tes' i<eterampiian' ktlusus' 'ya'ita
secara 'deskriptif dan verifikasi
konstruk dan dengani", tekliik' . korelasi untuk
men<:ati ,reliabilitas '~fltereter. anmt
p~liilai. f.;t~l"si1 p'ene1itj~n
mentJ)1jUkkan oahWa:
1) validitas i~i instrumen penilaian seleksi keterampilan. khusus secara umum 5udah 'mengganibarkan domain "prilaku yang diukur; 3) b'erdasar'hasil SNMPTN menunjukkan bahw~ reiiabflitas tertinggi Jnstrurnen: penfta.ian pra'ktfk dipero"'e'h pada tahun 2007 (0,778) sedangkan terendah' diperoleh pada tahun 2009 (0,398). Berdasar hasil seleksi mandiri men'unjukkan: ba'hwareliabilitas ter1inggi .instru.men penllaian pra~ik t~rtinggj diperoJ~h ;pada· .tahu.n. 201.0 . (OJ566) sedangkan terendah diperoleh pada tahun 2007 (0,417).
V"I;-d;"'''s' K'ata 'kunc·.· , a IlCl, .. I ,..,1;,."".. :4-"", ~.
. '
Im-""'''' "C;".
....
cupa
II'!'
:""''''......U IICI.", I,,~"'''''''''mpil,... khus' C~"",i. Clil IIClII. I U~ vC;t u' n
~lIalJlIl"a~t 1I1~L1
PENDAHULUAN ·Lata·r 'Belaka'ng: Masa·lah Peningkatan mutu Sumber Daya Manusia merupakan 1"'v.'\~"",.e.l"""'1 .[,~~ 11IC"1 ICI ,tUI'\ClI1
b~"'; Cl~1
k.a~~il '."",,,,,,, CIIIClJUGlII
d~"'" all
("~~~I.,"'"'ura·n I (\'~IIIc:n\.11I
su~tu a
f~ktor
ba'ngsa
. . •
yang sangat Merupakan . "
indikator utama terjadinya peningkatan mutu SOM yaitu luaran pendidikan yang
bermutu
d~n
diakui di tin'gkat regi'onal, nasional, dan internasional. Upaya
perbaikan dan ~peningkatan. mutu tesebut salah satunya melalui perbaikan m'utu
' - ' .•
...t...
~.
1
pengujian, termasuk penilaian tes khusus I'llasukke suatu jenjang pendidikan
yang- lebi'h- ti"t;ggl yang mempunyai'" kekhususa'h' ters'endiri. Beberapa program studi di . . pergurua~ .tinggi tertentu
mempunyai
kekhususan yang tidak dipunyai' oleh jurusan/program studi lain. Dengan demikian diperlukan instrum~n penil~ian ,khusus yang"dapat menjaring calon
rnahasiswa yang memilih
jurusan/pr~~am
,studi tersebut sesuai dengan
. kekhususannya. Demikian juga Universitas NegeriYogyakarta (UNY) seba'gai
salah
satu
Lembaga
menyelenggarakan
ter~ebut,
jurusan/program
antara lain- yang·
Tenaga
Pendidikan
ad~
di
studi
yang
Kependidikan mempunya~
(LPTK)
kekhususan
Fakulta~Bah~sa dan- S~nqFBS) y~itu juru~n
Pendidikan Seni Rupa, Pendidikan SeniTari dan Pendidikan Seni Musik.' .• •
MerupakarJ pekerjaan yang, tida,k
m~dah
~
•.•=
dan liie'merluk~tt waldu, . t~~ak
sedikit untuk mempersiapkan 'il1stf1Jmen· pen"ilaiari tesmasuk' khusus ketranipilan .
'
:
suatlJ jurosanlprogram studi- . guna. menjaring· mahasiswa yangdiharapkan~ Senyampang dengan profesi guru yang' tampaknya sek~lrang ini me'rijadi salah .
'.
"
.
,satu profesi yang paling diminati pencari kerja, maka Kementrian Pendidikan Nasional memiritaLPTK; memperketat, seleksi calon g~ru de'ng~n mengiriginkan ..
:
.a garada
pro~edur yang
jet,as
~~a men~ri.
calon .,rnaha~·iswa
(~alal:, 201'~',
13),
termasuk di dalamnya' 'adalah tes khusus ketrampilan masu~' ke: jurusan yang mempunyai kekhususan tersendiri. .
Undang-undang guru' yang' tatah ditetapkan 'bertujuan mendudukan guru
menjadr profest' yang terhormat dan profesi yang mulia. Tugas profesional ~~orang guru adalah bagaimanabisa meneruskan atau mentransmisi" ilmu
pe:,n,getahuan ketrampilan,dan nilai-nilai kepada anakdidi'k~ 'Dengan 'demikian seorang guru harus mengembangkan keprofesionalannya seca'raberkelanjutan, s'ebagat saJa:h· satu upa,ya" n1enyi'apkan generasim'uda~
yang unggul" dan
berkuaJitas.
Mangin'gat tugas berat yang di'a'ma:natkari pada seorang,:,gUtlJ, dan permintaan dari' Keri1endikna's· pad~l: LPTK, maka jurUsan pendidikan" senirupa
da'fam' menj-artng mahasiswa yang mendaftar ke jurusan tersebut dipercaya
46 . i
.~ ~.
tnembuat tes untuk seleksi mahasiswa. Sesuai dengan petunjuk teknis peraturan
seleksi penerimaan mahasiswa, ',baru disebut ":dengan :tes kelra·mpila·h· 'khusus. Berdasar hasil pene,litian yang dilakukan dengan" "mencari ~"~licitas,' prediktif (Tri Hartiti, 1996) ternyata tas khtJs'u's tersebut validitas prediktifnyan
tergol'on'g
belum memenuhi syarat dan sudah dilakukan ,'perubahan-perubahan. Perjalanan waktuyang sakisn tahun
perlu dilakuka'n penelitia,n, untuk meUh,at
apakah'
instrumen yang digunakan memenuhi persyaratan tes yang baik' dalam. 'ha'i. ini
rnemenuhi validitas dan' reliabiUtas .instrumen. Rqmusan Masalah
Ma'salah' yang dirum'uskan dalam penelitian' ini adalah': B·ag·aimai1'akah validitas dan reliabilitas instflJmen penilaian k~trampilan
ya~g
digu,nakan
khusus masuk Jurusan Pe:ndiqikall Seni Rupa yanQ
~Jia,n .s~I,eksi
melip~ti?,
fOjuan Penelitian" Tujuan penelitian ini adalatf untuR" men"getah'ui' valid'ita'S d~fn"reliab'ilita's
instrumen penilaian
yang digunakan· ujian seleksi ketrampilan khusus masuk
Jurusan'Pe'h'didikan' Seni Rupa yang meliputL Manfaat Penelitian Ha'sH-pen'elitian akan memberi sumbangan te'ori' pads' pengembarigan perangkat
tes ujian masuk ketrampilan khusus jurusanpendidikan seni rupa
yang' maliputi vaUditas dan 'rellabilitas, 'seni'n'gga dapat' menjaringcalon Jrlahasiswa yang berpotensi danberkompetensi dalam bidang seni rupa. Secara'
prakti's'-ha'siI" pen'elitian" diharapkan akan menJadi acuan penye·mpumaan~; perangkat tes yang digunakan ujian seleksiketrampilan khusus masuk Jurusan,
Pe'n'didikail
47
-... ,.
f,.
:.,-:.,
1
KAJIAN TEORI·
TUj"UCfIl Tes' Seteksi .Ketrampilan, Khusus Mahasiswa ".
Pengembangan .Fakultas Bahasa dan' \Sen;
4 (em'pat) tahun ke .depan
berdasarkan visi fakultas; yaitiJ: pada tahun 2014 menjadi. fakultas·. yang un'ggut dalam Tri Darina Perguruan· Tinggi yang memiliki jati diri kependidikan dan
mampu'
menghasilkan tenag'a'akademik:'" da'n' prafes':ional", ,yang" ~uraini,
cendekia ,dan, mandirL Visi' fakultas mengacu· pada visi, Uniyersitas: Negeri Yogyakarta,
yaitu:p'a:da tahut1
202~ menjadi
u·hive·rsitas. kepe'ndidikan ke'las
dunia berJandaskan ketaqwaan, kemandirian, dan kecendekiaan . .
Se'suat dengan" visi' tersebut',
,'-
.
.
"isi- jurusan' pendidikan serif ttrpa' "sebagai'
berikut:
1. Menyiapkati mahasiswa rnenjadirnanusia Indonesia ssullihnya· (b'emutaiNi, cendekia, dan mahdiri) sesuai dengan tujuan Pendidikan· Nasiohal yarig secarakhuSus memifikt kernampuan akademik dan pr()fessii~l. dalam pendidikan seni rupa.. 2. Mengemba'ngka-rl, da~. mE!nyebarluaskan" ilmu. pengetahuan d~.n t~~n"ologi
dalam bidang Seni Rupa dan menrngkatkan
~engupayakan
p~ngguna.annya
~ntuk
tarat hidUp' masyarakat dan m"emperkaya. kebudayaan
nasional. 3. fv1'em'persiapkan dan
~meningkatkan'
keahlian tenaga ahli" kependidikan,
mengembangkan ilm'u dan Seni Rupa, mengamalkan serta 'menyebarl~askan kepada-' masyarakat sesuai dengan kebijakan pemerintah. berdasarkan
ketentuan/peraturan yang berlaku. . 4., Menyelengarakan, tnembina, dan megembangkan pendidikan akade'mik dan professional
dalam
bidang
seni
rupa
dan
penelitian
dalam
rang~a
p'emefthara'a'n, penerapan, dan-, pengembangan ilmu. 5. Menyelenggarakann,
membina,
dan
mengembangkan
pengabdian
ma'syarakat dalam rangka meingkatka'tl kehidupan manusia pada umu'mnya dan bangsa Indonesia khususnya dalam seni rupa.
48 --.. 1.
Berkaitan dengan visi tersebUt di atas, dalam rangka menyiapkan calon
te-n-ag-g ah-n- k'e-p'en'didikarr S&ni- Rupa,. ma'ka"jurus'sn pendidikan'·, senr"·nJJ>a·"'diberi:' kapercayaan untuk menyelenggarakan tes seleksi secara mandiri,' dengan m'embuat ihstrumen b'erupa'tes' yan'g selanjutnya dise'but te's ketramp'ilan" khusus.
TuJuan tes ketrampilan' khusus tersebut
untuk menjaring calon mahasiswa
jurusan pendidikan' sen'i rupa,'yalig: me'mpunyai' 'komp~tensi,sebag'a:i ':tenaga ahli' ' kependidikan seni rupa.Tentunya tesnya mengacu pad,a, substansi, seni rupa itu'
,setidiri. Seperti diketahui Seni R·upa a'dalah' bagian dari Seni ,Budaya merupakan
taba-ng- setli" ya;ng- m-em'bentu'k karya se:ni
'~engan'
med-ia- yang-
bls'a~
ditatlgkap
dengan mata dan dirasakan dengan rabaan. Seni rupa dibagi menjadi dua, seni
ftlumi dan setli terap'an' ,Seni' mum. merupaRan penciptaan Rarya sen'i yang bertujuan mendapatkan kebebasan berekspresi dan 'kreativitas yang s,angat
pti"ba-dL Contoh s'enf mom-i:, IlJkisa'h';
patung~
graffiti- da'n '-kalig'raft, S'ed'angka'n' S'eni
terapan disebut juga s-eni pakaimerupakan karya, seni ya'ng bertujuan, untuk memeriuhi ke'b-U'tuhan
s~'hari
h'ari'. Contoh:
dissin gratis, disain',
~
arsitektur,
desain, pakaian, desain ptoduk, kria kayu, kriya -kulit; dsb
K'ompetensi" yangdikemba'n'gka'n' di"jurus'an' pendidikan seni' rupa dibag,i penjadi' dua
yaitu:
~ompetansi,
.apresias,i dan kreasi." Kompetensi
berkenaa'n dengan pengetahuan" yang b'etsifat teori,
apresiasi
sedang'kan ko'mpetal1si
kreasi berkenaan pencitaan/pembuatankarya seni rupa·. Hal, ini sesuai dengan
mata"pelajaran Seni' BlJdaya'ya'ng' dilaksanakan di"sekolahDengan demikian tes
yang dikembangkan pada
tes ketrampilankhusus : mengacu pada dua
kompetensi tersebut.
Persyaratan
Pe~yusunan InstrumenPeniiaian
P-etttblfatan- instru'me"n"
penll~fian-
yang baik
berupa- te"s ya-ng-
ba'ik~
membutu'hkarf
persyaratan yang harus dipenuhi agar hasil tes sesuai dengan tujuannya.
O'etnikian' Juga tes sele'ksi ketramp'ilan kh"usus,sebagai alat ukur harus memenuhi persyarata~-persyaratan
tersebut, antara lain:
49 '
....... ,.
t..
Pembuatan tes yang baik tentunya ada pedoman yang .harus diikuti~ berikut
tnt ~lin'Sfp::prmsip- pEmilaian mengacu pacla Peraturan MenteriNo 20 tahun-2007,
yaitu: sahih, objektif, adil, terpadu, terbuka;. rnenyeluruh, sistematis, beracuan criteria, dan' akuntabel. Dengan demikian pembuatan tes seleksi sebagai alat ukur ketrampilan khusus tentunya harus mengactJ pacta prinsip-prinsip tersebut.d'i atas. Penelitian ini membatasi pada validitas dan reliabilitas pada apresiasi dan. penciptaanl pembuatan karya ata'u tes praktek pembuatan karya. Va'liditas datl reliabilitas merupakan hal utama yang harusdipenuhi untuk menentukan kualitas suatu
instrumen ·pe·nitaiail. Validitas Validitas instturilen dapat dimakn'ai sebagai' ketepatan d:alam 'memberikan' interpretasi terhadap hasil pengukurannya. Sesungguhnyalah persoalan validitas
ifistrumen berh'ubungan deng'an
pert~nyaanJ
apakah suatu instrumen
rnampu
o'
menggambarkan ciri-ciri, sif~t-s·ifat, atau. aspek apa saja yang ·akan diukur, s·esua·j dengan keadaan yang sebe-namya. Relevans dan
acctJtaOcy,
cid'a'lah' dua
makna yang terkandung dalam· konsep vanditas. Relevans ·menunju.k .pada kemetmp.uan· instrumen dimaksudkan.
untuk
memerankan fungsi
Sedangkan· accuracy menunjuk pada
untuk a-pa ". rnstrumen ketepatan
instrumen
m:engidentifikasi aspek-aspek yang akan diukurse.cara· tepat, mehggambarkan keadaanyang
s.ebenarny~.
Dengan demikian' menjadimasalah poko.k yangberkaitan' dengan validitas o
I
rnstrumen adalah· apakah instrumen tersebut menghasilkan 'informasi yang diih.ginkan secara tepat sesuai tujuan yang diperlukan.
~uatuinstrun,en
dikatakan valid untuk tujuan tertentu, tidak berlaku untuk tujuan yang lai·n juga untuk kond'isi yang berbeda. Secara umum terdapat tiga macam validitas, yaitu validitas konstruk
(construct validity), validitas isi (content validity), dan validitas criteria (criterion-
". :~.
related validity). (Kerlinger, 2000: 686; Babbie, :>.OO~: 144-145). Validitas
konstruk menunjuk pada sejauh mana instrumen yang' disusun mampu
50 -- .• 1..
menghasilkan butir~butir pertanyaan yang dila"rldasi .oleh konsep teoritik .tertentu.
Valldttas,· kon-struk
dtsu~s'uh"
berdas'arks'n' p:ad'a':" kon:sep teori' yang suds'h, ma:pan'"
dan pertimbangan-pertimbangan yang rasional.
Untuk mematltapkan\J'I'valfditas
konstru:k dibutuhka'n ,expert judgment ysitu ,ma's'ukan, pertim'bangan, dan kritik dari para ahli, terkait. Prosedur· 'yang ditempuh untuk memperoleh
validitas
konstruk' yang-· d'iharapkan', diperlukan pendekatan' "Iog'is"> dan"" e·mpirik. Menurut ' Kerlinger (2000: 687) analisis faktor merupakan metoda; yang tidak,· terelakkan
untu'k· m'e'tle'litivaliditas konstruk. Dengan dem'il
diguna'kan
untuk mencari: bentuk validitas konstruk. Validitas konstruk" sendiri digunakan tfntlJK'
men~letahui-
fatdor-faktor ya"ng-' dapat m'enjelaskan- va-ria:n"s' pad'a'" ,f1asil -
.pengukuran.
berhUbungand~ngan kemampuan
Validitas .isi
instrumen .untuk
menggambarkan' secara tepat domain prila,ku yang; :·'d·iukur~ Ada:- dua" makna
da1a-m val'id-ita's isi" yaitlr, valid-its's" berhubungan
dengan
pertanyaan
t?'~tir
d-an- validitas·' sampling'. Valld-its's· isl
seberapa /jauh
butir~butir
instrumen
mencerminkan keseluruhan isi dart aspek 'yang h"endak' diukur. Validitas
sampling berh'ubung'an dengan pertanyaan seberapa jauh butir-butir instrumen merupakan' sam'pel" yang representatif dari ··"keset'lJruha'n aspek- yang, diukur. Dimulai dengan' dengan menyusun daftar kesel'uruhan isi materi atau domain
yang dimaksud.Langkah selanjutnya pada vafiditas isi 'sdalah menjabarkan dalani aspek yang terperinci selanjutnya didiskripsikan indikator':'indilkatornya.
Selanjutnya dlmintakan' .pertirnbangan' kolega···· atau ahli: yang- berkompeten r
melalui forum dis~usi antar ahli (focus group discasion), untuk memperolet;l
maSUkah,... sara-n', kritik, dan' evaluasi gun'a rneny'e'm'pumakan instrumen yan;g d'isusun. Pada validitas kriteria: d'iteliti deng·an membandingkan suatu ,kriterium ekstemal, dimana kriterium yang ditetapkan harus sudah teruji'secara empiris di
I'a'pangan dan me'mpunya'i konsiste'nsi yan'g cukup tinggi. Dua
krit~ria
yang
digunakan"'pada validitas ktiteria adalah kriteria konkufen dan kriteria prediktif. 1'1'
-
'Validitas' .kritetia'· nlehj~Wab' pe-rta'nyaa'n''': sej"aLJh' m-aha
sU'atu" tes
51 - .. 1.
da-pat
-52
kemampuan seseorang kemudian hasil· pengukuran tersebut dikorelasikan. Hasil
ko-re'lasi' m-enunjukkan tingkat're'liablitas" suat[J.te·s·~ Kualitas Alai Ukur i
Tes seleksi keterampilan' khusus·mahasiswa jurusan pendidikan ·sen·i· ru'pa sebagai' alat ukur, tentunya harus memenuhi kualitas alat ..ukur yang baik.
Kua·litas alat ukur yang beru·p~··tes· tentunya·.. ·h:arus memenuhi.·tes"·ya·ng baik. Hal . ini dapat dilihat dari perangkatnyauntuk menunjukkan karakteristik tes· :'sebagai instrumen alat ukur ya'ng bai'k, yaitu konstruknya dan bukti em·pi·rik."· Kon'str~k alat ukur dilihat dari teari yang digunakan,: yang pada prinsipnya' meligukur satu dimensi.· AIat ukur
ya-ng" balk h·arus·. 'M'emiliki' blJkti'" kesahih·atf,.
.
ke:a'nd'alan~',
komparabel, dan feasible. Bukti kesahihan·dapat dilihat dari konstrak'. toori yang digun'akah~ analisis
yart~ eksploratori
faRtar bait<
maupun yang konfirmatoti.
Bukti kehandalan ·dilihat dari besamya. indeks keandalan atau· ·reliabilitas atau
keandalan' hasil pengukuran (Djetnari, 2007:: .18)~ Keandalan alat ukur dapat dikategiorikan menjadi tiga, yaitu konsistensi internal, stabilitas· dan antar··penilai. Padg Kon'sitensi interna·l,. alat ukur digunakan
sekali kemudiandj~~ung besamya indeks keandalannya. Ada banyak ·formula
yang dapat diglfnakan untuk mancari besam·ya·indeks· kea.ndalah.· Perbedaan formula disebabkan asumsi yang digunakan .berbeda. Oleh' karena itu· sebelum
alat ukur digunakan harus 'diteliti' dulu asumsi yang di'g'unakan~ Rerielitia'n in; melihat keandalan alat ukur dengan mengkorelasikan hasil tes antar penilai.
Karakteristik Pend'idikan Seni"Rupa Pendidikan seni rup~ adalah bagian dan pendidikan sani'budaya yang '
.
.
metnpelajari seni secara visual. Seni secara visual adalah se'ni yang tampak atau
:seni yang dilihat melalui indera penglihatan. Pendidikan seni' di'berikan disekolah karena keunikan, kebermaknaari,
dan' kebermanfaatan· terhad'ap' pefkembangan
peserta didik , yang terletak pada pemberian pengalaman ~egiatan berekspresi, b~rkreasi (BSN'P, 2006: 225).
es~etik ..d~~am
bentuk
Deng.an de'rnikian tujua.r·
pe.ndidi,kan seni adalah mengembangkal1 kedewasaan diri secara utuh d.an
seimbang' dengan' cara··m·emberikan perlakuan yang da'pat merang.sang
53
--
.•
.
i.
kepekaan' estetik dankreativitas peserta didik. Demikian juga' pada
pendidikar~
seni nips peserta' di9tk" d'iajarkanuntuk mengolah 'estettk, kepekaan ra'sa,
"'kreativitas , dan unsur-unsur seni rupa menjadi sebuah karya seni. Dengan
d'em'ikian o'ntiJ:R dapat memberikan pembelajaran yang tepat s'esuai deng'an tujuan pendidkan seni rupa sendiri dibutuhkan tenaga pendidik lulusan LPTK
d'afam hal ini .fulusan dart pendidikan ,sen-i rupa. Sej-alan dengan hal tersebut di atas, jurusan pendidikan seni rupa
m'enyiapkan pend'idi'k seni rtlpa' yail'g berkual itas, mampu' m'e'ngajat. dan' mendid'ik peserta didiknya sesuai dengan kompetensi, pen'didikan seni rupa untuk meffcapar~ fujuan'·'pendidikan' seni" itu sandin. Mahasiswa' tidak'hanya diajarkan'
mendalami seni· rupa secara keseluruhan tetapi juga· mendalami 'kompetensi dasat-dasat seni rupa dan kom'p'etensi .praktek berka'rya seni rup:a. Demgan
demkian 'calon . mahasiswa . pendidika'n se.ni-. rupa terlebih .dahulu dilihat kornpetensinya
mefalui
tes
waWancara
u,ntuk' mengetahui' seajuhma'na'
pengetahuan apresiasipeserta tes, dan praktek membuat karya (berkreasi) . diharapkan dapat .me·nJaring caion pendidik senl rupa yang berkualitas. '
Tes praktek meliputimembuat ga·mbar dan menciptakarena menggambar da'l'amhaJ in; menggambar bentukmerupakan dasar dalam'betajar sen·i rupa"dan
mencipta untuk melihat kompetensi peserta tes dalam mengolah' kepekaan estetis, kreativitets, men'golah' media yang terlihat pada hasil 'karyanya.
METODE PENELITIAN Jenis Penefitian Penelitianini merupakan penelitian deskriptif den,gan' Jenls
peneliti~n
kasus, karena, mendiskripsikan karakteristik tes seleksi .KetrampHan khusus jurusanpendidikan seni rupa. FBS UNY dan tidak
digenerali~a'sikan.
Populasi dan sampel: S~mpel :di
ambil dari seluruh' hasil uJi keterampilan tahun 2007 samp.ai
2010 baik untuk" program regular mau'pun no'nregufer, kecuafi untuk tahun 2008
nonreguler . 54
Pengumpulan Data
Pengunipulan data
penelitian ini dilakuka'n denga'n- teknik dokumentasi
yaitu 'berupa tas yang digunakan salama tahun' 2007 sId 2010 dan hasil tt;!s
praktik peserta te·s. Dilanjutkan dengan FGD pada tanggal 3'1 Jufi 2012 d'engan mengundang pendidik seni, pakar pendidikan seni ,·dan pakar pengukuran untuk
mencari ma'sukan tentang konstruk tes·, dan telaah validitas' isiinstrumen tes keterampilan khusus tersebut.
Teknik Analisis Data
Penelitian ini menggunakan dua pendekatan dalam melakukan analisis terhad'a-p vatidltas
d~ln"
rel"iabUitas
te~s ketera~mpila'n"
kh U'S u's, tersebut~ Pertama'
secara deskriptif mendiskripsikan karakteristiknya. Kedua, memverikasi konstruk tes ketrampilan khusus seleksi masuk jurusan pendidikan senl rupa dan dengan teknik korelasi untuk mencari reliabilitas intereter antar penilai. Penjelasannya
sebagaj" berikut: 1.
Analisi~
data validitas isi Jnstrumen dilakukan dengan expert judment.
2. Analsis data reliabilitas instrumen uji keterampilan dilakukan dengan uji
korelasi produk moment. HASIL PENEllTIAN DAN PEMBAHASAN Karak~eristikInstrumen
Penilaian SeleksiKetrampilanKhus'u's
Instrumen. peri'ilaian seleksi uji
ketrampilan khusus Jurusali Pendidikan
Seni Rup-a berupa tes, terdirr dari d'ua jehis tes.. Pertama~ tes wawancara den"gan' pertanyaan yangbersifat teoritik ter~iri' terdiri dari lembar pengamatan" pedoman
wawanCclra ,petlilai ti'nggal me'm"bUbuh'kari tahdtl checK (-\f) pada kdlorn skala dengan asumsi 1. sangat kurang, 2. kurang, 3. cukup, 4. baik,5. sangat baik. Kedua tes praktik menggambar dan me"ncipta" dengan spesifikasi' instrumen berupa soal menggambar bentuk dan mencipta/ekspresi.
1. Validitas Telaah
validitas
ketetatl,-pll~ttr (pra'kti"k).
dilakukan
dengan
mendiskusikan
materi
soal
uji
Serda"sarkan' telaah" d"alam' FGD hasilnya sebagai berikut: . 55
.J.!
a. Maten soal menggambar bentuk telah sesuai dengan kemampuan awal calon
,mahas'iswa- tutusan SMA ma~pun, SMK. b. Konstruksi soal menggambar bentuk talah mencakup
'perintah,~;'\
ketentuan,
dan kriteria ,penilaian. Tabel 1. Tahun dan Materi Ujian TahunUjtafl
Materi Ujian Praktik I
2007
Meng'gamb'ar Bentuk
Materi Ujtan Praktik II (Pilihan) Seni Lukis, Diskomvis,
lIustasi 2008
Menggambar Sentuk
200"9"
Meng'gambar Bentuk
Seni Lukis, Diskomvis,
.
lIustasi, Mendesain (untuk Seni Kerajinaii) ,
2010
,
Men,ggambar Bentuk
Seni Lukis, Ilustasl
Diskomvis,
Seni lukis, Diskomvl's, IIustasi, Mendesain (untuk"
Se"ill Ke"f.2&jiil8A) 2. Reliabiltas
Reliabi"lita's l'tlstninlen uJi 'keterampilan' Jurusan Pendidikan' Se'hi Rupa adcUah sebagai berikut:
Tabef 2. Rang'kuma'n Relia,bHta,s'f,nstrumen No
A
B
SNMPTN
Kate.gori,
Reliabilitas
Reguler
".
2007
0,778
Tinggi
2008
0,571-
sedSng .
2009 2010
0,398 0,525
Rendah
Sedan'g
0,721 0,673 0,639
Tinggi Tinggi Tinggi
Nonreguler
2007 2009 '20010
Berdasarkan tabel tersebut, dapat diketahui bahwa korel'a'si antarG} nilai
praktik menggambar (Praktik I) bentuk dan penciptaan seni rupa (Praktik II)
men'unjukkan nHat korefasi sed'ang sampai tinggi, k'ec'uali untu·k'tahun 2009 yang menunjukkan nilai korelasi rendah_
56
KESIMPULAN DAN SARAN
Ke'simp-01a'n Berdasar hasil'p,enelitian -(;jan pembahasan dapat disimpulkan bahwa:
1. fnstru-m-en" penilaian seleksi ketrampilan khus'us J'u'rusan Pendidikan Seni Rupa berupa tes, terdiri atas tes wawancara dan tas praktik menggambar dan
men'cipta. Insttu'men ya:n'g d'igunakaH b"erupa hlstrumen,.penilaian seleksi teari dan instrumen penilaian seleksi praktik.
2. Validitas'isi instrumen penilaian' sel·ek~i k,eterampilan khus'us secara·
umum'
sudah menggambarkan domain prilaku yang diukur.
3. Berdasar hasil SNMPTN m'enu'njukRCln bahwa reliab'ilita's tertitl'g'gi instt\imen' penilaian praktik diperoleh pada tahun 2007 (0,778) sedangkan terendah
diperoleh
pada
tahun
2009'
(O'~39'8)~
Berd'asar hasil' Seleksi'
ma'n'diri"
menunjukkan bahwa reliabilitas tertinggi instrumen penilaian praktik tertinggi diparoleh pcfda tahun 2010 (0,566) sedangkan terendah diperoleh' pada tahun
2007 (0,417). Saran Berdasar hasH pen.elitian' d·an kesimpulan d.i· atas, maka· saran yang,
diajukan sebagai berikut:. 1.. Pada Jurusan Pendidikan Seni Rupa hendaknya membentuk tin1khusus u'n'ti.Jk
menyempumakaninstrumen tes seleksi ketrampilan khususmasuk Jurusan Pendidikan Seni Rupa..
2.
Hendaknya
sebel~m
digunakan
instrumen
untuk
menyeleksi
calon
mahasiswa, diadakan p'elatihan' bagipenilaikhususnya mengenai cara menskor hasil tes. DAFTAR PUSTAKA
BSNP. (2006). Standar nasional Pendidikan. "Jakarta:
BSNP~
Djernari M~r~api-" (2°97)., Teknik Penyusunan Instrumen Tes dan Nantes, Mitra cendikia: Yogyakarta.
57
Fernandes, H.J.X. (1984).
Testing
and measurement.
Jakarta:
National
Education P"lanning,"Evaiuatlon, and cUricuium Seveiopment. Fas'i, .Jalal ,,(2011). Minat Jadi Guru Melonjak, LPTK Diminta Perketat $eleksi. , MajalahAsah Asuh Edisi 1rrh II, 16 Maret 2011. Ke'me'ndikbud: Jakarta.
Kerlinger F. N. and Lee H. B. (2000). Foundations of behavioral research. Toronto: Nelson Thomson Learning. P~eraturan Fj"emerinfah RI', (2007). Peraturan pemerintah Nomar 20, tahun 2007, terltang prinsip-prinsip penilaian pendidikan. I
Tri Hartiti, R. (1996). Validitas Prediktif Tes Khusus Masuk Jurusan Pendidikan Sen;'Rupa FBS IKIP Yogyakarta. Penelitian.
58
PENGEMBANGAN INSTRUMEN PENILAIAN KINERJA GURU
pRAKTI'KU'M FI~IKA SMA 01 P'RO'VINSI' D. I. YOGYAKARTA. Nurul Fitriyah Sulaeman Badrun Kartowagiran
ABSTRAK Pe'netitran inr be'rtuJuan: (1) me'n'gu'ng'kap ko'mponen yang ,membentuk instrumen penifaian kinerja guru praktikum fisika SMA, (2) mengungkap karakteristik ihstrurn'en penilaian kinef~la' gUrU praKtiKUm flsika SMA ,(ilen ternan 'seJaWat, (3) mengungkap karakteristik instrumen peniiaian kinerja guru' praktikum fisika SMA oleh siswa,(4) mengungk~p kemungkinan instrum.en penilaian kinerja 'guru prakffkum ,fislkasMA oi~h siswa menggantikan peran Instrumen pentia"ian ki,nerja guru praktikum Fisika SMA oleh ternan sejawat. 'Penelitian ini merupakan penelitian pengembangan yakni pengembangan instrumen peraUaian kin,erja guru praktikum fisika SMA "oleh' ternan sejawat dan siswa. Langkah pengsmbartgan instrumen terdiri dari' menyusun spesifikasi instrumen, menulis' instrumen, menentukan skala instrumen, menentukan' sistem penskoran d~n norm~, me'netaa'ti instrumen oteh ahtf, metakukan uj; coba, meOg~rnati~is 'instrum'en, merakit in~trumen dan mengkorelasi antara skor hasil penilaian menggunakan
irfStrumen teW.ali,sejawat can ha'sil 'pe'nilaian menggUnakaninstrumen angket siswa. Subjek uji coba adalah 30 guru fisika SMA, yang diniiai oleh seorang ternan sejawat menggunakan lembar observasi dan oleh 450 orang siswa menggunakan ang'ket siswa. Va-lid-itas 'instrumen dlesfimas~i mengguna"kan e;xperl judgment dan analisis faldor sedangkan estimasi reliabilitas menggunakan koefisien' Cronbach Alpha. HasH peneliti~n menunjukkan .bahwa: (1) komponen yang membentuk instrumen penilaian kinerja guru' praktikum fisika SMA adalah perencanaan pembelajaran praktikum, persiapan pembelajaran praktikum, peja~san~an pemq~I~Jar~n pr~lqi~um, peng~~mini~tr~~i~n ~~r~n~· d~n h~~iI
"praktikum; (2) vatidasi lnstrumenpen'ftaran oteh ternan sejawat menggunakan expert judgement dan anafisis faktor dengan loading factor yang berkisar antara 0,438 ·s'ampai '0,9'0'0 dengan ,reUabintas '0,887; (3) Vatiaasi il1strumen penila'iah oieh siswa menggunakan expert judgem.ent dan ,analisis faktQr dengan loading factor yang berkisar antara 0,384 sampai 0,746 dengan reliabilitas ,0,935; (4) terdapat "kemung"k'inan 'instrumenpenHa'ian oie'h siswa meng,ganffkan peran instrumen penilaian oleh ternan sejawat karena koefisien 'korelasiskor, total penilaian ternan sejawat dan siswa adalah 0,935; antara skor persiapan slswa dan ternan sejawat adalah Ot709; korelasi skor pelaksanaan adalah Oj919 dan korelasi skor pengadministrasian adalah 0,732.
Kata kunci: pengem'bang'a'n ·in'strum'e'n, ktn'erja. J
59
DEVeLOPING AN INSTRUMENT FOR ASSESS!NG THE PERFORMANCE OF HIGH SCHOOL PHYSICS TEACH~RS IN YOGYAKARTA. PROVlNC~!
Nurul Fitriyah Sulaeman Sad",n Kartowagiran ABSTRACT
Tfie alms thiS research ate to reveal: (1) the components of instrument, (2) the characteristics of the instrument seen by' colleagues, (3) the characteristics oflhe fnstorrrent s~n by :students, (4) tire protrabitity to change the irfswment for eva,/uating high school physics teachers"" petformance by colleagues and studen(s. TfJi~:'ls a' ~se~rcfJ B,!d d~velqpmf?nt w~ich develops ~(1strument for: assessing hfgh school physics: teachers~ performance by cOlieagues and students~ The steps of instrument development are: alTanging the Instrument spesification, .writing the instrument, detennining the instrument scale, determining' the .scOring and norm system, reanalysing the instrument' by experts, trying out the' instrument, analysing (he instrument, 'organizing the in'stn:tment, ~relating the ·score of collegue instrument a'nd ·student questionnaire. The subjects of the trial were 30 'high school physics teachers assessed by a colleague using observation sheet and 450 students using a que,sli6hnaire. The ;iistrumenl ValioEilion·· Waseslfmalea' lnrougn expert judgement and facior anaiysis,whiie the 'reiiabijiiy estimation used Cronbach Alpha coefficient. The result shows that: (1)' the components' that form the . Instrnment inciude iab work ieaming pian, iab work ieaming preparatIon, iab work learning implementation, todls administration and lab' work result; (2) the instrument by' colleagues 'using expert judgment and factor validation of the analysis, the loading factor is 0:432 0:900 and Ih'fJ reali6ilit}f i50.887; (3) the validation of the instrument by students Lising expert judgment and ·factor an~/ysis, the 'oading fa~tor is 0.384 - (J.746 and 'th~ ~/ibHity is O.·~3~; (4) it is possible to change colleague assessment instrument with student assessment instnJment because the correlation coeficient of the total score of the assessment by colleagues aha stuaehts is 0.935, tne stUDents' aha colleagues' sCOre preparation ISO. 769, score coreiiation 01 Jmpiementaiion is 0.919 and administration score corellation is o. 732~
an
=
Ke~vords
: development, instrument, performance
~,ENDAHULUAN
Penjaminan mutu pendidikan merupakan kebutuhan mendesak semua Ff '
.
pinaK yang teflioat oalam aUnia pendiaU
~,
1
siswa, orang tua siswa hingga masyarakat pada umumnnya karena pada dasamya pendidikan adatah mittk' kita semua dan kebutuhan kita semua. Berbagai upaya dalam meningkatka\J~·il mutu' pendidikan terus diupayakan oleh b'erbagai pihak, namun pada kenyataannya upaya-upaya ini belum mencapai hasil yang maksimal.
Seiling-" d'e'n9an" p'erhatia'n- semua piha'k
pada peningkata'n"
mutu'
pendidikan, scrotan dan perhatian terhadap guru sebagai faktor yang' cukup dominan peranannya dalam membangun dunia pen'didlkan . menjadi semakh, tinggi. Menurut Clotfelter (Darling-Hammond, 2010), guru sangat mempengaruhi
kebefhasilan .betajar siswa, sepertt. drnyatakan datam: nasit penetitian skatabesar . di Carolina. Utara bahwa perbedaan pencapaian keberhasilan siswa yang· diajar oleh' guru yang' memiliki kema'mpuan baik dibandingkan dengan· guru yang'
memHiki kemampuan rendah lebih besar .pengaruhnya daripada gabungan pe-~~arutrbimbjngan
menunjukkan
d'an ti'ngkat pen'didikan orang tua. Hasit penetitian tersebut
bahwa
guru
mempeng~ruhi rendahnya
yang
memiHki,
kemampuan
rendah
dapat
keberhasi"la-n 'belajat si"s",,-~.
Peningkatan perhatian ini juga sejalan dengan peningkatan tuntutan ·pada ke-mampuan yang hams dimiH'ki seora'n'g guru. Guru'dituntut bekerjasecara' utuh dan profesional. Dalam melaksanakan tugasnya, guru harus. memiliki keahlian,
kemahiran khusus yang memenuhi standar mutu atau noima tertentu yang diperolehnya
melalui
pendidikan
profesi.
Guru
sebagai pekerjaan
yang
profe·sionat hams tarus meningkatkan kemampuan-kemampuannya dalam mengelola kegiatan belajar mengajar~ Dalam kultur masyarakat Indonesia, umumnya pekerjaan gurumasih kurang terbuka. Bahkan atasan guru seperti kepala sekolah dan pengawas seka·ff pun tidak mudah untuk mend'a;patkan data dan. ·meng~m·ati.. 'reaHtas
keseharian kinerja guru di hadapan siswa. Memang program kunjungan kelas oleh kepala .sekolah ataupengawas, tidak mungkin ditolak oleh guru. Akan tetapi tidak jarang te~adi guru berusaha menampakkan kinerja terbaiknya baik pada
61 ~.
'1
aspek perencanaan maupun,'-' pel.a·ksan"a'an 'pembelajaran hanya pada saat dikUnjUfigi. Sentuk penilain \l"kincrja dapat pula
peruoanan Kinefja K8
a~an
digunakan
sebagai .pendorong
yang leoil1 oaili(. Hal ini sejalan aengan peneJapat
Resnick & Resnick (Johnson et ai, 2009) yang mengatakan bahwa "performance assessment has also been used to drive reform. You get what you assess. You do: not get what you' do not assess. Build assessment toward which you
edUcators to teach".
H~I
want
in;· perarti·.penila~an dapat dioangun seafan Clangsn apa
yang'ingin diajarkan,' karena kita' akan 'mendapatkan 'yang kita n'ilaL
Fisika merupa.kan· salan '. satu pelajarari yang diajar1
pelajaranilmu pengetafluan alam·,(IPA), seCiangk8flpaaa fiiigKat SMA,
fisika· .diajarkan. secara terpisah. Fisika m~rupakan salah satu' ilm:u .yangmenjadi
landasan·
pert<emoangan' fekn616gi.·
Pelajaran' fisika I
pendidikan menengah atas,' diharapkan mampu mengenalkan siswa dengan
1<6n$ep-k6f1sep .fisikayang memoanlU sisWa memanami
gejala
slam' dan
'perkembangan teknologi menjadi bagian dalam kehidupan m·anusia sehari-hari.
KaraKtefisfik peifiDelajaran. fisiKa 'dikemoangKan menUJU KaraKtenstiR keilmuan fisika sandiri. Menurut Mundilarto (2010), mata pelajaran· fisika
ClifUjUKanUnfUk mendidik Clan melafi" pesefta ciaiR .aga.r aapaf
mengemEJangkan
kompetensi' observasi, eksperimentasi. serta berfikir dan bersikap ilmiah.
Kompefensi ooseNasi etan eJ(sperimenfasi ini feoi" difel
KefiidUpan pesetfa dicit<. Hasil penelitian HUssain, AZeem & Sfiakoor (2011), menujukkan bahwa penggunaan metode eksperimen dalam pembelajaran fisika
oerpengarun sangat signifikan dioanaingkan dengan cara pe·moe·lajaran konvensional.
Penek~nan
kegiatan eksperimenmenjadi sangat.penting dalam
pelajaran .fi$ika Karana nlsrupakan bagian oari karakteristik Fisika itu senaifi. Dari kegaiatan pra' survei awal di bebera'pa sekolah menengah atas, 'para iPf\
.
guru fisika ai proVins; D.I Yogyakafta aaa yang telan teroiasa meJakukan 62
melakukan praktikum secara periodik sebagai bagian dari pelajaran fisika namun ada puta yang tidak meiakukan praktikum karena berbagai sebab. Penilatart: terhadap kinerja' guru praktikum fisika masih jarang dilakukan. Instrumen yang sesuai untuk menilai· kinerja·..g·uru praktikum fisika juga belum tersedia, maka perlu dikembangkan· instrumen penilaian kine~a guru praktikum fisika yang
sudah·te-ruji se-cara empirik- d;an mud'ah" 'digunakan~ Menurut Jonathan Crowther (1995) kinerja guru adalah hasil yang dicapai
.oleh "'guru dalam 'melaksan'akan tugas yan'g dibebankan kepadanya dan menjadi tanggung jawab guru. Amstrong (2000) .menjelaskan kinerja ,adalah' catatan sese~6rang
datam' menyetesaikan' pekerjannya~' Jones'~ Jenkin· & . Lord: .(2,006)' .
menjelaskan bahwa kinerja merupakan gabungan' prilaku dan hasil dari prilaku terseb'ut~
Sementara°itu· 'Oepdikria's '(2008) 'menjelaskan bahwa.· kinerjadalam
kontek'sprofesi guru adalah kegiatan yang meliputi perencanaan, pelaksanaan pem-betajaranl KBM, dS'n mefakukan pe'nHaia'rr'" 'hasH betajar~"" Kiner~. gu'ru °
dipengaruhi
oleh
~~teramp.ilan yang
jabatan
fungsional
guru·
sebagai
motivasi
guru
dan
<;iikuasainya'atau, abilitas guru.
Sejalan dengan pengertian kinerja guru, indikator kine~a guru memberikan
arahankongkret· dalam" 'penifaian"':""kiherja .guru. Indikator penilaia·n-,o·:terhadap· . kinerja guru menurut Depdiknas(2008) meliputi kegiatan: (1) Perencanaan Prog,ramKegiatan P·embelajaran,. (2) . .·Pelaksanaan Kegiatan Pembelajaran, dan
(3) EvaluasilPenilaian Pembelajaran. Peren'canaan-
dalam· kegiatan
pembelajaran' . ··adalah·"·:·· ,. tahap:' ... yang
berhubungan dengan kemampuan· guru menguasai bahan ajar. Kem~mpuan
guru dapat dilihat dan eara· atau prosespenyusunan program kegiatan pembelajaran yang dilakukan oleh guru, yaitu mengembangkan silabus dan
renca'na- pelaksanaanpembeJajara'n (RPP) yang meHputi: identitas RPP, stand·aT . kompetensi (SK), kompetensi dasar (KD), indikator, tujuan· pembelajaran, materi
pembelajaran,
metoda
p~mbelajaran,
penilaian.
pembelajaran,
63
_... .-
i..
langkah-langkah
kegiatan,. sumber
Kegiatan 'pembelajaran .di
kelas merupakan
kegiatan
utama
yang
ClilsJ(Ukan olen gUfU. Kegiatan ini meliputi: Kegiafan pengelolaan Kalas, penggunaan media dan sumber belajar, dan penggunaan metode serta strategi'
pembelajaran. Sementara itu, penilaian hasil celajar aaalah merupakan cara mengetahiJi tercapai atau. tidaknya tujuan: .. pembelajaran dan juga proses
pemoelajaran yang lalan aiiaRUkan. ·Paaa taMa·p·. ini seorang guru dituntut memiliki kemampuan' dalam menentukan pendekatan dan cara-cara evaluasi, p8nyu~unan alat;alat·8vaIUasi,.pengo.lahan,
dan penggunaan ·hasil,. evaluasL
Menurut Hinchey (2010), terdapat. beberapa altematif ,bentuk penilaian
yang dapat ·digunakari urituk meriilaikirielja. diaritaranya:· (1J ooservas; kalas, {2} penilaian· kepala seko.lah, .(3)penilaian perangkat· pembelajaran; (4) portofolio, (5) penilaiafJ difi "sendifi, (6) penilaian .SiSWcl, dan (7) pefJilaian pefliflgKalan
prestasi' siswa: .
Obsef.Vas;· kelas. adalat1 pen.ilaian ini
dig~n'aKan
UnfUK . mengefanUi proses
pembelajaran di kelas yang dapat diobservasi langsung·. Penilaian ini meliputi
k·egiatan gUrU di (fiJlam Kalas (islam mengajar. dan oerinferaKSi dengan sisWa. P·enilaian kepal~ sekolah pada dasarnya sarna dengan observasi ·kelas tetapi
aiiakUKan" seoaga.ioagiafl' dari eValUas; oar; Kspala seKolan. Sering. digUnaKan dalam. keperluan sumatif atau dalam penentuan pE;!nerimaan:: guru. Penilaiari
pefangJ
penilaian oan pemoerian 81(0r (jagi sisWa. . Portofolio digunakan sebagai bentuk dokumentasi dari. kegiatan.. mengajar
oan tanggUng jaWao gUrU ternaaap pfofesinya oalam jangJ
Penilaian diri senain jug'a
aapat digUnaKan UntUJ( manilai ki,te-rja gUru. GUrU .
.
melaporkan sendiri apa yang telah dilakukan di dalam pembelajaran. Penilaian
ini a.apat memoer-iRan pre.sepsi yang osrsifat unik. Penilaian ini leoil,. muaan digunakan dan dapat menghemat biaya namun reliabilitas dan validitasnya
sangat oergantung pacta
J<sjuJuran guru aalam manilai dirinya senairi. 64
Penilaian
siswa
merupakan
diba'ndingkan dengan penilaiarl
yang
penilaian
yang
dHaktikaft- olen- dirt
relatif, obyektif
gttfli ieftdtn',
bila
tefufama
yang terkait dengan pembelajaran,. spa, yaF~'g 'rjirasakan, disaksi'kan, dan
atKsrjaRan olan siSWa oafam 'pemDefajaran.PenitaH' kfnefja guru jugaaapat dilakukan melalui peningkatan prestasi siswa, sejauhmana kontribusi guru
tefnaaap' peffingKatan prestas+ oelajar' yang· CfUaRtJRan" o-Jett stsvJa. Kelemanan' dari penilaian ini adalah prestasibelajar sisa banyak dipengaruhi oleh faktor-
tafctOf fain. ,Ketujuh altematif penilaian di atas memiliki kelebihan dan kekurangannya 'ma'sing--masing~ Dafam penstitian irii', tida'k'
aka,,'. dihem'ba'rTgkan, mstrumeri' yari'g"
dapat digunakan oleh ketujuh janis penilai, namun ,hanya akan' dikembangkan
instfJmen penilaian kinefja gUru praktiktim fisika yang diflilai olen am sandin, ternan seja,wat, kepala sekolah, dan siswa.
METODEPENGEMBANGAN ••- •
·int
-- - - -_. - -- - J,;. - --
merupal\.an
-- - -- - I ~~ - .-
penStiuan
Development), yaitu pengembangan instrumen penilaian guru
praktik~m
fisika
instrumen penilaian kinerja guru praktikum Fisika SMA, yaitu (1) menyusun
spesifikasi instfJmen, (2) menUlis in-struman, (3) menenrJkan SKala instfumen, (4) menentukan :sistem penskoran, (5)menelaah instrumen, (6) melakukan uji COBa, (7)
m:engaftafisiS ;nsfFJrrlen~ {BJ meraRit- instftjmen'~ (9) J(orelasi- sKot.
Penyusunan spesifikasi instrumen mencakuppenentuan tujuan dan kisi-
langkah selanjutnya adalah menyusun kisi-kisiinstrumen. Pada dasamya.kisi-kisi
Definisi konseptual, dijabarkan menjadi definisi operasional kemudian dijabarkan
lagi ",menJadi beberapa indikator. Indikator-indikator inilah yang akan menjadi acuan penulisan butir-butir pada instrumen.
65
"Berdasarkan kisi-kisi yang telah dibuat, selanjutnya disusun butir-butir dan
pilifia-ri FiasU peneefmafan yang- sesttat defigan ooor.
PentitiSafi
msffilmen fi~
mempertimbangkan aspek -maten, Kbnstruksi dan bahasa yang digunakan- ·agar
penilaian.
PenUIiS3n" msftt.tmert.. penitatan· kinerja gtJ-rti ptaktiktim' ftSiKa-
o·ten
ternan·
sejawat meliputi pengantar bagi observer untuk melakukan observasi, peturijuk dan contoh
dafam r.engisian instrJmen, butir-Dutir instrumen Deftkut piHnan nasU
pencermatan. Instrumen penilaian- kinerja guru praktikumfisika oleh siswa atau
aJigket"presepsi- 'siS~13tertia-qap kitlerja guru praktikufn fiSika ·mefiputt pengantat bagi siswa untuk melakukan mengisi, petunjuk dan contohdalam pengisian
mstfumen, oiaiit-oUtir instnimen oenKuf pilinan nasi! pencetnit:Ian. SKala instrumen yang digunakan dalam pengembangan instrumen ini' adal,ah skala
'Kemtinttilan pifinan nasif- pen·cefmafa.n-
yang oertipa skala ,. s·ampat· oe'ngan
4.
Skor total guru merupakan jumlah keseluruhan skor masing-masing butir yang di5efikan olen 65ser~r dan siswa. Ktifefia ~*ang
g·uru
mengguna~r1
digunakan UntUk menifai lcinefja
acuan dari BSNP (2012) yang menentukan pencapaian
dianggap oaik- jika' mencaj5flt
oalas tecio etan sama dengan 70% aan-"
sKot-··
maksimum.
SeJanjutnya, felaan insfrUmen sangat perlU
dilakUkan UntUJ(
mengefanUi
validitas isi instrumen. Telaah dilakukan -oleh para ahli psikometri -dan ahli yang
'atau isi yaitu' pengajar di program studi Pendidikan Fisika dengan bidang
masukan mengenai ketercakupan dimensi kinerja guru praktikum fisika ke dalam
5Ufif-otitir in'sfftlmen'
}iang' telan etistisUn". An It oiOang' pengUJ(-Ur-a'n- dan-
pengembangan instrumen pendidikan mencermati dan memberi masukan
mengenal rancangan Instruma", jumlah butir, efaktivltas kaHmat dan layout instrumen.
66 .......... .• L
(~'
Setelah instrumen direvisi berdasarkan masukan para ahli, sel,anjutnya
diisKUKan UJi CODa KslompoK Kecil stati 10 s;sWa SMA yang telan mengiRutt .prakti,kum Fis,ika untuk menguji keterbacaan instrumen. Hasil uji coba terbatas Menjadi mssukan untuR petbaikan instfUmefl sebelum Cfigunakan dalam Uji cObs
la'pangan, Uji CODa lapa'Ftgan dilakukan untu'k irtstrumen· ak~,ndjgu,n,aka.n
uta'rna- atau instrum,e:rt ya'ng-
untu.k observas,i oJeh te.m.an ,seJawat ya.ng .te_lah dU,atih
d~n
, instrume'n pe'ngganti atau instnitnen yang 'digunakan oleh siswa. SUbjek uji cObs adalah guru praktikum fisika SMA di provinsi D. L Yog,yakarta, sedangkan
perillainya ~dcilafi seorafig ternan sejawat' yang tt~lah dilafifi ocin siswa -yang . mengikuti kegiatan pembelajaran praktikum.
Ma'sU Ujicotla I~j'pan§an' oiana'Usi"s Ufltul< mengeslimasi Valii1ila§ aah reliabilit instrumen. Validitas instrumen dilakukan dengan menggunakan dua .
'
janis Valiaifas, yakni
Validifas
.
tampail:g yang"
,
diUiKURan'
ole'n' a'flU afaU expeif
judgement dan validitas konstruk yang diestimasi menggunakan analisis faktor.
Sernerltara estimasi reliaoilitas ins{fUmen ClilaklHean Clengan menggunal(an Cronbach Alpha.'
Masil aftalisis Uji C6f)a diipaf m§ffia~fi< petUnjuk oUtir yang sUdan- Dail<; oUfir' yang perlu direvisi, dan butir yang harus dibuang. Setelah butir instr~men direvisi
RemUefian airakitkem5ali menjadi suatu oenfUk inslrUmen yang UfUn. Instrumen inilah yang akan menjadi produk akhir dari penelitian pengembangan ini. Produk
ii1sfrume'R' iili jUga t.Jile'ngl(api dengan ears ~'enguna'an dsn
petunjuk
penskorannya. Instrumen ini siap digunakan untuk melakukan penilaian kinerja ~uru
praktikum fi'siks. Untuk mengetahui kemungkinan instrumen penila.ian oleh siswa dapat
ffl'eflggsntikaM instrume'n p'enilaian oleh tem'an sejawat maka dilakukan'lah'
korelasi kedua data hasil pengukuran dari kedua instrumen tersebut. Korelasi
dilakukan
unt~k
skor persiapan, pelaksanaan dan pengadministrasian sarana,
dan hasil pr~ktikum, serta skor total ketiga faktor tersebut.
67 ,~, "
HASIL PENELITIAN ~eliaDififas
iflsffiii11efl
yang- diKemoang'J(sn dalam peneJifiafl iili diesfi'masr
menggunakari reliabilitas Cronbach Alpha (0). Instrumen utama yang terdiri atas
pefliJaian perentc1naan dengan ii dan total dengan a
= 0,802,
Jemoar 60seNasi oengan a = 0,945,
=0,887. Sementara itu, instrumen pengganti atau instrumen
yang digUnsKafi' sisYia' ya'ng fJanya efisi'I)Utif~oU~'oBs'eNaSi' memiliki' a =- 0,93'5'. Instrumen dikembangkan dalam penelitian ini divaJidasi menggunakan \t~fiaitastampang
dan, validitas
~onstrUJ<.
Valioitas konsfruJ(oiesfimasi aangan
men,ggunakan analisis faktor, ya~g mensyaratkan, jumlah data~inimal. Dal~m
penelitian inf" inSfftiifiefi Ufaffia aa~, pengga~fi' rerctiil',aan: 27 oUtir'.oersa,ma, ,oUflrbutir iniJah yang akan dianalisis menggunakan analisis faktor. Jumlah subjek m~leDini
penelifan telah
jUmlalj ,putir
dimana ,sUl5jeJ(
j5eneliti~n,
feroin
dati
30
lembar obse~si oleh ternan sejawat dan 450 lemb~r ang~et siswa. Bagian
peni-lataft perefiCan'a8n pada iftsfrumen Ufama- aap-at araman mefafUi-
pen~l-aiafi
dO,kumentasi perencanaan guru sebelum mengajar sehingga tid~_k membutuhkan
ooseFVasi langsung. Butir-outir pada bagian perencanaan dapaf diamati dengan jelas sehingga bagian ini tidak dimasukan dalam perhitungan menggunakan
aftafiSis- faktOr~ Tahap awat pada, analisis' faktor adalah menguji variabel mana saja yang
dianggap
lay~k
untuk
dilakukan
denga~, menyertakan
djma~ukkan
a~lam
analisis
s~la~jutnya.
Pengujian ii1i
semua butir bersama dalam instrumen utama
dan i-nsfrumen- penggantt~ Buttr· yang- memUiki keeendrungan' mengefOmpok danmembentuk sebuah faktor maka variabel tersebut akan mempunyai korelasi
Instrumen utama hasil analisis menunjukkan
seoesar' 0,441
~
0,5
b~hwa
senrngga' flHai· Krv10-tv1S.A. oettin;
a~p·at
harga KMO-MSA
ditenma.
Sete'fan
dicermati, temyata butir 87 memiliki~oefisen anti image sebesar 0,120 yang
menUnjUkJ(an kofelasi
yafl~
renaan. Hal inl
meny~baokan
outif 87 dikeJU·atKan
atau tidak diikutsertakan dalam pengujian selanjutnya. Butir-butir yang lain tetap
tfHKUfKaft oafam p'eng-Ujian sefanjUfnya '<-arena memiHJ<-t Koensen anti image- >- 0,3. 68 .~
...... ,. i..
'" Setelah butir B7 dikeluarkan,. dilakukan analisis kembali dan harga KMO-MSA menjadi
0,649·~
0',5 yang berarti analisis faktor dap'at dilanj'utkan. Instrumen'
pengganti (instrumen yang digunakan oleh siswa) ·harga K~~10~MSA sebesar 0,942 2= 0,5 yang berarti analisis faktor dapat dilanjutkan.
Jumlah faktor yang terbentuk dapat ditentukan dengan melihat output atiSIiSis faktbt pada bagillN tabel varia.. .f total yang dijel·a·skan· tlai11un' tetap harus mempertimbangkan faktor yang' ditentukan: pada swal pengembangan· instrumen.
"asil faktorii1g' instrumen utama menunjukkan bahwa 3 faktot utama yang terbentuk. Komponen 1 merupakan faktor dominan karena memiliki "eigenvalue tetbesat yaitu 11 ,261. Korn·ponen· 2· memiUki eigenvalue· 4,0'42 d·an· komponen 3
sebesar 1,'637.: Dapat disimpulkan bahwa dari 26 item diekstrak menjadi 3 faktor dominan dan ketig'a komp'onen ini m'ampu menjelaskan varians total sebesat 64,066%. Sementaraitu, hasil faktoring instrumen pengganti menunjukkan
Kompanen 1 merupakan
f~~tor
dominan karena memiHki eigenva1ue terbesar
yaitu 10,543, komponen 2 memiliki eigenvalue ·1,694, dan komponen 3 sebesar 1,487. Dapat disimpulkan bahwa dari 27 item. diakstrak menjadi 3 komponetl"
dominan dan
ketig~
komponen ini mampu menjelaskan varians total· sebesar
50.,832%.
vaninax, menunjukkan loading factor i.nstrumen utama berkisar antara 0,438 sampai 0,900. Nilai fni Hasil rotasi' komponen menggunakan metode
menunjukkan semua butir pada instrumen utama valid. Pada instrument
pengganti' buti'r 87 ti'dak berkorelasi kuat dengan ketiga faktor. Nilai factor loading butir ini. kurang dari 0,3
sehingga butir 87 tidak valid. Loading factor pada
berkisar antara 0,384 sampai 0,746 yang menunjukkan semua' butir valid kecuali
butir B7. Pengeluaran butir 87 pada instrumen pengganti sejalan dengan pengeluaran butir 87 di a:~val analisis untuk instrume'n utamasehinggab'utir ini tidak valid pada instrumen utama dan penggantL Korelasi dilakukan padaskor rata-rata angket siswa dengan skor penilaian oleh ternan sejawat. HasHperhitungan koefisien korelasf antara skorpersiapan
siswa dan te'm'an' sejawat adalah 0,785; koretas-r skor pe-r'aksa'naan adatah 0,952; 69 ...-- .. 1
korelasi skor pengadmir'listrasian adalah 0,-935 dan -korelasi skor total adalah
O,§31. Ke-empaf Koefisie-n- k-ore-Iasi' rn·t feimaStlK Kstegon' fln9g;' a'mnya- SKo-r-penilaian siswa dan ternan sejawat memiliki hU&:Jun~an' yang kuat. Hal ini juga
manUnjUkkan baf1wa penHatan slswa dapat 'mewakin -pennatan ternan sej-avJaf atau dengan kata lain instrumen angket presepsi siswa memiliki kemungkinan
mamptt menjaOi' pengantt fnstrtimen- fembar, ·-Qbse-rvasi· teman" seja\'vat. Hasit· tntsejalan dengan hasil penelitian Faridl Muyasad (2012) yang salah satu
sejawat dengan,
kiriefja"
siswa~
Penilaian kinerja guru dapat dilakukan dengan asumsi
gttfu )tilriy'; dirrilai' a-Cia-tali- -kiri'erja--guflfSrv1A dimaria' sisYVa SrvtA dia-rigQap
mampu memahami instrumen penilaian dan mampu. memberikan penilaian
setara tepat. KESIMPULAN
SMA dapat disimpulkan sebagai berikut.
SMA adalah perencanaan pembelajaran praktikum, persiapan pembelajaran
dan hasil praktikum.
judgement dan analisis faktor,. loading factor berkisar antara 0,438 sampai
0,900 deftgaft" rei iaoiltfas' s'eDesar' 0,887'. 3. Validasi instrumen penilaian oleh siswa mengg-unakan expert judgement dan
anafis;s faktOf, lOading factor oorkisar anfara 0,384 sampai 0,746 cten'gan reliabilitas sebesar-O,935.
instrumen lembar observasi oleh ternan sejawat karena koefisien korelasi skbr total' penilai~n teman seja\~t dan siswa adatah -0,935; antara sko:
10 - .. 1
pers'i.apan siswa dan ternan sejawat adalah 0,709;, korelasi skor pelaksanaan adalah 0',9'19 dan korelasi skor pengadministrasian, adaI'sh 0,732. DAFTAR PUSTAKA Andrejko, L., (1998). The case for the teacher par/polio: Evaluation tool carries a wealth of professional infonnation. Diambil pada tangg,al 28 Pebruari 2010
dari !l1tp:/~ .
g§99:Q[Qai~blicationsljsd/andreiko194.cfm. ,
.
Aritin, I. (2000).profesionalisme guru: Ana/isis wacana reformasi pendidikan
dalam era globalisa,si: SimpQsium Nasional Pendidikan diUniversitas Muhantmadiyah Malan'g, 25-26:Juli 2001 ..
Berk, R.A. (19Sei).
'Performance assessment:, methods & appiications. The Johns' Hopkins University Press.
London:
Dharma, Surya. (2009). Bahasa inggris 600 guru Rlrit)san Sekoiah Berstandar Intemasiona/(RSBI) SMP, SMK,SMK di' Seluruh lildonesia.Diambila pads tanggal ~ J~ni 2009 dan http://edukasi.kompas.comlreasl xml/ 2009/
lJ6/24/1:741455/waduh. bahasa.inggris. SOO: guru. rsbi Djemari Mardapi. (2008). Teknik penyusunan nontes.Yogyakarta: Mitra Cendekia Press.
. instrumen
tes
dan
Ebel,R.L & Ebel, A.,D (1991). Essentials of:education measurement. New Jersy: Printise Hall Englewood Cliffs.
(2009). Pengaruh evaliJasi diri dan pengembangan protes; ferhadap kompetensi 'pedagogik guru di Kabupaten Sukabumi, Bandung Barat dan Majalengka, Tesis Magister,UPI, Bandung
E.ndah Yanuarti
Fernandes, H.J.X. (1984). Tesfinfj and measurf!3ment. Jakarta: National Education Planning, Evaluation and Curriculum Development~ ..... - . ... . Gronlund, N.E. & Robert L.l. (.1990-). Measurement and evaluation in teaching. New York: Macmillan Publishing Company. .......
-.:-
-l-nrl, H.e.,
Kap·itu·la,K., & (jmiand,k. (2011). A vaildity argument approach to evaluate teacher value-added score. American Educational Research
joyce,
B &Weii, M. (1'996). Mode) of teaching. Boston: Allyn &Bacon
Keaten, J.A., Riohardson & Elizabeth, M. (1993). A field insvestigation of peer assessment as part of the student group grading process. -EORS EO 361-
735.
Lang, H.R., & David,'N.E. (2006). Models, strategies, and methods for effective 71 .•
5..
teaching. Boston: Stephen D:·Oragin.
Lund K, ~Jlicf;-ael S., &pea-ersen. -(200t). fW1at" is good- Jantruage Jeamiftg7 Diambil pada tangg~1 2 November 2010.http://inet.dpb.dpu.dk/infodokl SQ[oofQwml Esor19Il..ungMSE';pdi
Madaus, G.F., Scriven, M.S. & Staffebeam, D.L. (1986). Evaluation Mode/s, viewpoints on ~ducatiQnal and human selVice evaluation. Boston: KluwerNijhoff Publishing; -
..
-
.-"
..
-
-
-'---_
_-
.......
..
~
......
-
....
Martin;R.E, Wood; & Stevens; E..W. (1988). An Introduction. to teaching. Bo~tom: Allyn & Bacon Inc~ -
.
-
-
.
- - -_.
. -
.
..
Peraturan Menteri Pendidikan Nasional RI No. 18 Tahun 2007. tentang .sertifikasi bagi guru daJam jabatan.. ~akarta: Me~terj Pendjdikan Nasional.
Peraturan
No. 1~ .. f~hun 2007 ·tentang standar
Pendidikan Naslonal Ri
~ualifikasi
akademik d~n
Peraturan pemerintah kerja guru .
kompeten~i guru
Nomor ·j4 no 39 Tahun 200~-. tentang pemenuh~n
Reigeluth Charles (1'983). The elaboration theory of instruction.. their current status. Isdale NJ: Erlnbaum.
-be'ban
An overview
of
Richards, J.C & Renandya,W.A. (2002). Methodology in language' teaching. An Anthology of Curren PraGtiGe;_ Gam.b.ridge~. Gabridfje. University Press. . Richards, J.C & Schmidt, R., (2002). Dictionary of language teaching and applied linfjuistics,id ed. London~L()ngman Roger, E.,W.,B., Olsen, & Kagan. (1992). Cooperative language learning. New Jersey; Prentice Hall.ilne. Suh·ertian,·P.A. & Suhertian, I.A. (1992). Supervisi pendidikan da/am rangka .program inservice education. Jakarta:Rineka Cipta.
Samana. (1994). Profesionalisme guru. Y6kyakarta: Kanisius ~~nia--'1-:a" )
' J Q ! !J
\1\/ Y ¥
s
("OO~). \&.. v, s
Dx lYi k
...... /Bid.rt:1n
,---r:::;ll tiJ(::;l~-.JYl Y.f I
d.ts/-o·rn \AHA, I !
imp·,"'~nt· :~t:'/~ N" I v Yv
II
. kun·';uJu~ \ 1\1" II
be:-l...k. ·cs.~.'_:s n:.;u ....
kompeterisi. Jakarta: Prenada Media.
Fransisco: Jossey-Bass Publisher. Soeprijanto- - (2010). Tursina.
PenglJKUran· kinerja- gU''''J praktf;Jk kejuruan:
Jakarta~
ev.
SoJimun (2002). Structural eqLl2J.tion modeling (SEM) Li-sre/. dan Amo-s. Malang: Fakultas MIPA Universitas Brawijaya. 7') '.
--
..,
..a..
Stufflebeam, D.l-:- (1969). Evaluation' and enlightment for decision making.
Columbus: Ohio State University? Evaluation Center. Stark,S.J., & Thomas A. (1994). Assessment and program evaluation.·J,··hAshe
.Reader Series: Simon
&Schutster custom Publishing.
Strange, J.H.,Gareis., C.R., & Little, C.A. (2006). Teacher pay & teacher quality.
California: Corwin Press. SUdj~~a, ~., & I~~rahi~ .. (2001). Penelitiandan penelitian pendidikan. Bandung:
Sinar Baru Aigesindo. Suhuri. (2008). Model evaluasi pembelajaran bahasa Inggris. SMA. l;>isertasi Doktor, tidak dlteri:>itkan, Unlveresltas Negeri Yogyakarta, Yokyakarta. Teaching Knowledge Test (TKT). (2099). diambil pada tanggal 28· Desember 2810, dan http:)cambrldgeesol.orgiexamsiteachlng~awardshkt.htmi .
Usman, M.U.·· (2007). Menjadi guru .professional. Rosdakarya Offset.
Bandung:
PT 'Remaja
.Watts, B. (1987)~ Teacher for the twenty...first century. Dalam Th9mson, N.D.W.G & Keenan R.M.T.. (editor)~ Assessment for teacher development. Scothland: The Falmer Press. Wilkerson, J.R. & Lang, W.S. (2007). Assessing teacher·compete.ncy.Califomia: Corwin Press. Weeden, P., Winter, J., & Broadfood,P. (2002). Assessment: What's in it for school? London: RousledQe Falmer. Webb,T.K.(2009).
Framework
for·
evaluation
&
professional
.growth
comprehensive .assessment. Diambil pada tanggal 23 Desember 2010, dari http://tn.gov/ education/framevall doc! comprehensive assessment.pdf
Woolffolk, A.E, &Nicolich, L.M·~ (1984).
Educational psychology ;or teacher. Eng.lewQod Cliffs,N.J.,:Prentice-Hall, Inc. Arcaro J.S., (2006) Pendidikan berbas-is m'utu: prinsip:prinsip perumusan tata fangkah penerapan. (te~emahan Yosal friantara) GaHfeo:St.Lucie Press.(Buku asH di'terbitkan tahun 1995).
73
'-
.•
..
i..
ABILI.TAS KOM'POSI'T DALAM- TES paTEN·SI·· Saifuddin Azwar dan Al.i Ridho [email protected] [email protected]
ABSTRA'CT When a unidimensionality assumption has been actually ;vio/ated., ·,interpretation of test scores might be jeopardized. It couldn't be overemphasized in case of hjgh·~akQ such'~'as' PAPs UGM (academic' potentiality test for UGM graduate student candidates) which'was supposed to 'reflect composite ability. Thf~ -~fu:dy aim~d at r~~aHng l~em characteristiqs Qf PAPs ~~ 1 ~~sbasea po UJRT and MIR-T and disCQ'f9ring dimensionality of threfl: ~U:bteSts ,of,lhe test. . Scores of subject (n == 2035) on the three subtest wem analyZed and the result
exams
a
snoWea ffial 27 ileiiis (:10 01 Vernal,'
8 01 Kuafllitalif;' ana ,9 01 PenaliJran),Were of less than 0.25 and 6 others itel1Js from ha.ving abnormally
hag for having 'bis I]igh- .p·seudd-guess!ny·'· .PCJrame~e~~· p~1J1e!1.siqn~/ity· .aTJfJ/YZ~~~·· ...~OiJn~·.··, o'uf' .tht~t . Penalaransubtest local dependent while Verbal and' Kuantita.tif ~subtests both were focal-independent /n addition, MIRT analyzes' fail to 'fully des~ribe item characteristics of the test due to effect of interaction among probabilities of correct re:sponse of the three subt9s/s. .=. ' Keyword~··
PAPs- UGM; dimension'alify; UJR'T, MIRT
PENDAHULUAN BerbagaJ pola respons para peserta· da·lam suatu teSt dituangkan oleh item resp'onse theory' (IRTl dalam"suatu' m'~del' pe'n'g'u'kuran"~ Salah" satu" asum'si-' utama'
yaAg· mendaSarr- tRT adalan-' un~dtmensionantas, yang· berartt- hanya terdapat-: sawatribut laten y~.ng mendasari kemampu,an atau abilitas para peserta tas dalam menjawai)· aitern (HambletGR, Swamin'atnan
J
.&, RGgefS,
1991~
Lard, 1980).
Sekumpulan" aitem-aitem'" d'alam te's' dapat dis'ebut unid'imensional' bila" kinerja"
paa'a
p'es-eP~
tes:
da~t-
dtjeJaska:n- oteh- soouah-- atribut- laten- (H·ambteron- &
Ravine";, 1986). Lebih jauh, probabiJitas menjawab benar pada sebuah aitem hanya dipengCiruhi Glen parameter aitem, sebuah at-ribut lateR 9, dan bukan yaA§ lain. Inilah yang disebut- dengan prinsip' independensi'lokal (/oca/"independence~
LI) (Lar-a-, 1-980J.BiJ.a-,s~~h: atfiJ~ut-laten: belu'm- cukup- m'8m-pu- menjelaskan,
74 - '.. 1.
dengan sendirinya indeperldensi lokal tidak terpenuhi (Stout, 1984, 1989, 2002).
AKiD'at asuhisi UntaimefisiOfialitasttoak' eJapat dipeifaharika~n', im'pJikasi le'b'ih lanjut adalah bahwa s!~kumpulan aitem disebut bersifat multidimensional.
Asumsi unidimensional kadang juga bersifat problematik, yaitu keti'ka aitem-aitem tes didesain untuk mengukur satu atribut laten tertentu namun ternyata p'ara peserta memerlukan lebih dari satu atribut Isten dalam menjawab benar sebuah aitem. Apabila data respons yang bersifat seperti itu ,kertludian
dipertakukan sebagai data unidimensi maka berarti telah me'nyim'pang dari asumsi unidimensionalitas dalam UIRT dan juga aspek struktural dari konstrak
yang diukur (Messick, 1995). Sotusf terhadap permas"atahan tersebut Icemudian memunculkan model multidimensional item response therory (MIRT) (Reckase,
1985,; Re'ckas'e' &',.Ackerman, 1986). MIRT a'da'iah 'se'ma'ca'm p'en'g'emban'gan
unidimensional item response theory (UIRT) yang memungkinkan analisis terhadap- aitem-aitem, "yang'; 'direspons b'enar oJeh para peserta tes berdasarkan
pada atribut laten lebih dar; satu. IRT yang pada mulanya didasarkan pada asumsi unidimensi tentu mell§alami kenclalaaalam m'elakuk-an peAskeraA" pacla
tes-tes yang bersifatmultidimensi (misalnya Ackerman, 1989; Cheng, Wang, &
He, 2009·;- DeMars, 2000;- Dinr- & Si,ooaif, 1-996;- Osffima & MitteG 1-9'90-;- Reise,
Moore, & Haviland, 2010; Yao, 2011)a Dengan kata lain, tes yangbersifat multiaimeRsi akan mengalami ketidaktepatan bila diskGF bemasar-kan paradi§ma unidimensi.
Gun&
men:yaring- mahasiswa-
ya,ng~
hendak-
mengikuti:· pendidikan-
pascasarjana, Universitas Gadjah Mada (UGM) Yogyakarta menggunakan skor
tes p'gtensi sebagai salah satu kr:iteria, penerimaana Tes ini, dikembangkan alet-l
Tim
Fakultas Psikologi UGM dan diberi, nama Tas Patensi Akademik
PaSGa~arjana-,(PAPs). SkGr~~ pe,serta~ pad,a~
mala uj-r- iAi,; ikut- menentuk,an- d'iten-ma-
atau tidaknya dia pada program studi yang menjadi pilihannya. Mengacu pada
ter-miAQlegi yang dikemukakaR 'stell ThGmas (20gS), Liu, Harris,aSR SchmiEft
(2007), dan Togut (2011), PAPs dapat disebut sebagai high-stakes testing kareRa~
konsekuellsl yaRfr a,karl d:iterima:"
pe,serta~
teso" eerimpllkasi-
75 ........... '. 'f..
pad,a~
rna-·s'a,
depa'n' mereka. Oleh' sebab itu~ sebagai····sebuah tes yang' berisiko,ting'gi;' sudah semestinya mengandtJng·
kekenrua~
sekec-t~·
mttngktn- dart· suoot- paRdartg·
ren~ukuran.
Tes yang mengukur: potensi akademik dirancanQ untuk men§UR€1kap kemampuan
individu
dalam
menghadapi'
problem
kognitif
yang
perlu
umumnya tes
diselesaika'n dengan strategis dan cepat. PAPs, se"bagaimana
patensi pada terdiri dari tiga subtes yang masing'-masing mengukur abilitas
verbal, kuantitatif, daR penaJaraR (A7JNaf,. 2008). Ketiga subtes tefsebut diasumsikan bers'ifat unidimensional dan· membentuk struktur potensi yang diukuf. P'erso'atannyaadatah pada cfimensf atribut taten yang' mendasari peserta yang menjawab, apakah juga bersifat ··unidimensional atau multidimensional. Isu
dimensidatam tes in; penting untuk ditetiti karena hat tersebut mempengaruhi
penskoran, analisis data dan laporan. hasilnya (Abedi, 1997;· Kahraman &
Thompson·, 20-1-1-}.
~su-
interpretasi terhadap
psrkometrik- Jain: yang- .·pertukombinasi skor dari
menginterpretasikan.nya (Ackerman,
1994~
d'i~ertratik:an:
adatah aafa
subtes,
bagaimana
beberapa
Reckase & McKinley, 1991).
HasH penelitian ini akan berusaha menjawab pertanyaan-pertanyaan me'ng-snai- a} k·araktensti-k-- aitem-aitem: Slletes- Verbal;
Ktlantitatif~~
dan.. Penalarart..
dalam PAPs berdasarkan unidimensional·item· response theory; b) dimensi
aitem-aitem dalam Tes PAPs; dan c) karakter-istik aitem-aitem Tes PAPs berdasarkan multidimensional item response theory.
Dim'ensionaHta5: Tea Nunnally (1981), seorang pionir psikometrika, menegaskan bahwa sebuah tes ideafnya ber-isikan aitem-aitem yang bersifat homogeniatau- paHng tiaak tiap
klaster berisikan aitem-aitem homogen. Hal ini sejalan denganasumsi penting
ya·ng·
me-ndasari~
Ul·RT yaittl- hldependeost- tGk:a~-
dapat~
terperttlhr- terkait dengan-
sebuah atribut laten 'atau unidimensional.
Pentingnya memastikan unidimensiQnalitas dima'na hanya sebuah
a~fil3ut
laten dapat menjelaskan keselu~han· matriks re'spons peserta tes sudah lama eJisa-ra·nka-n· oleh~ Lord'- (1··9aO)~ ~.formast·- m.en:ge.nat.. dj-m·ensionaUtas:._ te.s.~ tni~ j-uga-
76 - .. 1.
akan memberikan bukti struktural t~rkait konsistensi antara struktur intemal tes
san- strukttJr-c kGAStrak- (Fiske-,
2002~).
le13ih· Jat;J·~, iAfor-mast ffiengeAai 'struktur7
7
dimensi ini dapat dijadikan fondasi'dalam melaporkan skor atau subskor. Multidimensignalitas akan terjadimanakalates didesain meRgukuF atFieut
latenyang kompleks (Camilli,
Wa~g,
& Fesq,1995). Bila sebuah tes didesain
untuk m'e'ngukur atribut taten yang kompleks, 5utitkiranya· mengktarm konstrak: yang diukur bersifat unidimensional mumi. Apalagi, bila memang sejak awal sebuah tes didesain dengan domain isi yang bersifat multidimensi. . Pengondisian agar skor bersifat komparabel a~tar kelompok atau waktu seharusnya menjacfi perhatian serius karena menyangkut vandit~s,~' utam·a·n·ya aspek genera.lisasi (Messick, 1995). Perbedaan struktur antar kelompok atau
waktu dapat ditelusuri berdasarkan dimensionalitasnya (Tate, 2002, 2003). Sementara dalam kenyataan analisis data, banyak peneliti yang menemukan' bahwa dalam: data
respoll~··tes
iiit7 tidak-:' da'pc$ drmodelkan:. secara- bcrik '.
menggunakan UIRT (Ackerman, 1989; 'Way, Ansley, & Forsyth, 1988). Dengan demikian diperlukan suatu mO'del yang lebih mampu m'enjelaskan 'dat~ matriks
respons peserta tes.
Seeara
format~
6imensionalrtas
res
dapat didefinistkan sebag-at jumlah
dimensi minimum yang dapat menjelaskan data dan model sehingga bersifat
independen secara takal dan monatan (mon()tone locally Independent MLI) (Stout, 1989, 2002). Dimensionalitas dalam pengukuran dapat pula dimaknai sebag·a~
bcwryaknya atribu·t: lateA: yaAg· mendasaft- peserta <.iatam- mer-espoRS-
aitem-ai~em
tes (Chou & Wang, 2010). Dalam konteks tes kemampuan,
'Elimensianalitas disebut seba§ai aanyaknya kemamf3UaR yan§ EJiukufaleh tes ataukumpulan aitem.
BHa ffik-ai~an de'ngarr m:a-tert- t-es, oimenStaflati-tasclapat- dipaRdang-.sebagataspek-aspek pengukuran yang didesain untuk diukur oleh tes (Mislevy, Almond,
& Lukas, 2003), atau bisa f)ula aiflandan€j seoa§ai
aA~lisis
temaEJaf) data
respons pada sekumpulan aitem (Hattie, Krakowski, Rogers, & Swaminathan, 1996; Nandakumar, Yu, & lhang, 2-011-; Reckase, 2009; 'Zhang, · 2008).
77
_... .•
l..
Penelitian ini akan mengacu pada kedua sudut"-pandang inL 'Di satu sisi, seb,uah ta's d·idesaWi aengan: tujuan:' 'ukur: pada: domain: atatJNamun demikian, pada kenyataannya,
p~rlu
d1mensi-dtmensi~-
diselidiki interaksi
tertentu;
pa~ !!'!pe~erta
d'engan aitem;:.aitem tes yang ter:eer-min dafam, data re-spGAS yaR§aaa. Meskipun pengertian dimensionalitas dapat dilihat dari sudut pandang
yaAg- berbeda:j""eksptorast- ataupun- kor-tfirmasi· strtlkr-Jr:·dimenst~ merupakan: bagtandari proses validasi' yang bersifat komprehensif (Jang & Roussos, 2007). Oleh
sebab itu, dalam konteks sebuah tes yang terdiri dan beberapa subtes,aitemaitem dalam tiap pasang subtes perlu diuji
unidimensionalitasnya~
SUa terbukti
un'idimensfonat-, maka dua subtes: tersebut sebaiknya dipertakukan sebagar saw kesatua'n sehingga tidak perlu melaporkan subskor secara terpisah (Tate, 2000, p.205). Multidimens.i·onal Item Respo'nse Theory (MIRT) Untulx merijawab benar-- sebaah- .aitem,
serifig~
kalr- peserta- las: memerlukan
lebih dari' satu atribut faten (Ackerman, 1994) sehingga disebut multidimenSi. sebab. it-u
Oleh
dibutuhkan
model
yang
multidimensional. Dalam kondisi seperti inilah, (199'7)1
~y1lRT
sanga~
mampu
mengakoffiodir' data
berdasar~an
pendapat Reckas'e
berguTta tintuk--memahami-- stru-kr-uF- atribut- taten:- yang·.
diperJukan untuk merespons benar aitem~aitem~ Dafam beberapa. tahun terakhir, tetah banyak peneHtra'n bena'ndaskan sudut pandang teon MIRT. Reckase (1997)' menulis tentang·
ringka~an
sAteseaen:· rvttR': dengan- anatisf.s- faktor-- dan- UIR-T sebagar- asa~- muasa-tn-ya. Dis:-
meneruskan
·upaya beberapa ahfi sebelumnya seperti Spearman,. Thurstone,
Lord dan NGviGK, serta Samejima. Lebih jauh, Abkerman, Gier-t, d-afl Walker· (2003) melihat dimungkinkannya aplikasi MIRT sekaHgus mendiskusikannya eta~am·
konteks- me·ngevatuast- pengtlKuran- data~ pendi-d{kan. Asumsin-ya- adatah~
bahwa tes secara aJamiah bersifat multidimensional, lebih sering mengukur lebih
dan satu' kQnstrak. KGnstrak
yan~
valid iafah sesuai dengan tujuan
telah dideskripsikan oleh pengembang
UkUF
yaRQ
tes~
-78 ~
.. t
Aitem-aitem dalam tas sering kali rnengukur abilitas· komposit. dimana
ken·y-ata·an- tersebut sebenafnya adak,. tRfjtA- ditlktiF~ aten. J38R~
tes- datam.,
blueprint. Sila sebuah aiterrfitidok cukup sensitif untuk mengukur lebih dan satu atr~l;)ut lateR atau
peserta tes bervariasi dalam atnDut laten yang' sarna, maka
interaksi antara aitem dan peserta akan bersifat unidimensional (Ackerman, 1992-, t994-}. Dhnensl
AltBm
Dirnensi
Alteln
Mu'tidirnens'l (antar-altern)
Unidknensl
Dlmenal
Altern
Multldlrnensl (dalarn-attern)
<3ambar 1~ Reptesentasi Gratis MOdel Unidimensi, Multidimensi antat'· aitem, dan Multidimensi dalam aitem [diadaptasi dan Cheng dkk.. (2009)] Kensepsr; MlRT dapaFdip·anda·ng: s'ebagai: ka'sus khusus .darf aflati-sis fatctor:·
atau model persamaan struktural, atau pengembangan dari UIRT (Reckas'e, 1997). Beberapa medel yan'g mungkin terjaclis'ehin'gga mampu menjelaskall interaksi antarapeserta dan aitem dapat direpresentasikan dalam Gambar 1
(Che'ng: dkk-., 2-00·9)-.
D~tam.:-
bagian in!: akarr dikemtlkakafl
MtR~
ditinjau- seoagai:
pengembangan dan UIRT.
Sebagai pengembangan dar1 UIRT, MIRT terbagi menjaai dua jenis; maclel kompensasi (compensatory) dan model nonkompensasi (noncompensatory)
(Re'ckase:, 2:009). Model kompensas·;: d'ida5~ark-an, pada hu:bungan kombinasi: Hn·ie·rkoordinat vektor atribut laten, 8. Sedangkan model nonkompensasi memisahkan atribut...atr-ibut lateR aalam merespaAS aitem serta meng§uAakan madel UIRT untuk tiap atribut laten. Dalam penelitian ini hanya dibahas model kompensasL
8atu· d·i~ anta·ra:· falda:· data·m:· tes.. dengan::.bentuk-· piHhall g'anda: adatah: b·ahwa~ peserta akan menjawab aitem dengan benar melalui tebakan sehingga 79
--... '.
i..
probabilitas. menjawab benar/ melibatkan komponen tambahan, yaitu 'parameter
tabaka-ft. M~del yang::-coco-K- dengan: komponen=- ini: adatah: tv1tR-T 3Pl (ReGk3Se1 1985~
2009): ,. P(Uis
= 119s ,aj,cj,dj )=ci + (l-c;)
dimana Vektor ai
e8'6~+di
(1 )
;(+4 ·
1+e&i
-
menunjukkan vektor 1 x m parameter days beda.
Parameter d adalah intercept yang bersesuaian dengan garis sehing~a menghasilkan P(81 ,.82 ) = 0,5. Embretsan dan Reise (2000} menyebut d sebagai
easiness intercept. Makin tinggi harga d ·maka akan makin rendah tingkat k-esukarafinya. Sebu·ah---·a:item qengan parametera1 = 0,5,82 = 1,5, d·.= -0,7, da-n c
=0 dapat diketahui karakteristiknya secara lebih jelas sebagaimana Gambar 2.
·4··· ·4 ..;l!
.:z
·.;f lft'
.~
.'Ii
.1
;#"
I:~
.Gambar 2. Plot Permukaan dan Kontur Aitem,
81
=0,5,82 =1,5, d = -0,7,
dan·-c=-·O·
METODOLOGI PENELITIAN
Data penelitian ini adalah skor Tes "PAp·s "Seri 'A1 -d"ari 2035 ~orang ··calon mahasiswa pascasarjana UGM. Dengan demikian, variabel dalam' penelitian l Kuan·~·f"at·,f """'·rup"'"" "i"~»"'V" a;4-~m ,...las,..""", CJ.Jh~es \v Jerha danI 'Pen·al·aran· PAPs. bCI a G1ILCII.Hel. u .a"1 ""UUL U I, " IL L , I I I Masing-m~sing
Subtes terdiri dari 40 aitem sehingga keseluruha.n aitem
.}?erj-y·m"lah 120.
80
Data respons peserta Tes PAPs pada tiga Subtes (Verbal, Kuantitatif, dan
P-eRalaran)':. dtperlakukan- seb'agat~ Derikut
Untuk
mengetahui
karakteristik
aitem
tiap
Subtes
berdasarkan
unidimensional item f-espQI1Se theory' (UIRT), dilakukar-l kalibr-asi parameter aitem pada tiap subtes dengan metode marginal maximum likelihood (MML) hingga diperaleh: kecocokan: data baik- pada- level Clitem:- matlJ)Un-
tes-.
Presedur~
iAt-
dilakukan dengan bantuan BILOG-MG (Zimowski,' Muraki, Mislevy, &' Bock,
2003). Analisis dimensi dalam penelitian inl mengacu pada saran Jang dan Rousses (2001) yaitu den'gan' menerapkan teknrK eksptorafuri dan konnrmatori . pada struktur dimensi PAPs, dibantu software HCAI CCPROX (Roussos, Stout,
& Ma'rden, 1998), DETECT (Zhan'g & Stout, 1999), dan DIMTEST (Sto'ut & Nandakumar,
2006).
Untuk mengetahui
karakteristik
aitem
berdasarkan
multidimen-sional·· item: respanse theory- (MtR~}J dilaktl'kan:· katif?rasi: parameter~ sec~ra
aitem
keseluruhan dengan memperhatikan struktur subtes dengan
metade bayesian MIRT mefalui bantuan BMIRT (Yae & Beughten, 2007). HASIL PENELITIAN DAN PEMBAHASAN
Analisis UIRl" Analisis UIRT dilakukan pada aitem-aitem yang memenuhi persyaratan. Aitem~aitem tiaf) Subtes PAPs diseleksi deRQ8n kr-iteria fbls ~ 0,25 sel1iA§ga
.diperoleh total 93 aitem dengan rincian: 30 aitem verbal; 32 aitem kuantitatif; dan 31- aitem,pe-naotaran.P·ada tia'p subtes, parameter dikatibrasr berdasarkan modet
logistik 3 parameter (3PL) denganmetodemarginal maximum likelihood (MML). Hasilnya s8bagai aefikut,
Tabel 1. Parameter Aitem berdasarkan UIRTpada 30 Aitem Subtes Verbal ,8·
NO.
I
0/0 8- . a·
1
VOO1
67,8
0,497
-0,786
0,096
2
VOO2
71,2
0,548
-0,999
3
V003
86,6
0,476
4
V012
~
%8- - a·,
16
V024
50,3
0,533
0,168
0,060
0,065
17
V025
90,4
1,623
-1,515
0,-064
-2,210
0,210
18
V026
83,9
1,142
-1,247
0,040
36. 6. .0,,421. ,1.,228.
.0,,0.79.
.1.9.
0.,5.9.2 , -1.,40.6.
,0'10.6.9.
f
-N·O.
·c
81
-
. VO.27 .78'14
·b
e-
I
%8
a
B
c
NO.
I
%8
a
,5
V013
64,9
0,669
.~,379
0,136'
.20
V028
80,7.
1., 11=;7 'vl .
6
V014
88,9
1,571
-1,417
0,048
21
V029
75,4
0,698
7
V015
51;5
0;586
·0;·070
0;,048
·22
8
V016
87,7
1,065
-1,571
0,046
23
V031
70,9
0,481
-0,818
0,176
9
V017 .80,9 .0,921
-1 ,199 . "0 ,050
24
V032
52,3
0,486
0,162
0,094
NO.
c
b
'.
. ii"1,043'
0,.047
-0,991
0,108
. V030 . ·68;5 . ·OJ~05 . -0;558
. ·0,-099
'10
V018
62,1
0,626
-0,362
0,086
25
V033
83,9
1,275
-0,481
0,500
11
V019
53,2
0,607
0,094
0,089
26
V034
54,9
0,772
0,136
'0,141
12
V020
44,4
0,541
0,445
0,047
27
V035
71,6
0,784
-0,808
0,046
13
VQ21
52,Q
0,438
Q,232
9,105
28
VQ36
71,7
9,717
-0,878
Q,043
14
V022
42,5
0,646
0,500
0,050
29
V038
27,5
0,476
1,771
0,073
15 . V023
77,'0
'0,538
-1,~98
0;07'8
3'0
V039
"9~O,7
1,~79
-1,§~90
O,U64
_.
Keterangan:.1 '= nama aitem; %8 = persentase peserta menjawab benar, a =
~~y~ ~~~; l') =~~~l.I~c:lr'3.rl; 9.'3.rl E: =t~~'3.~'3.rl
•
Hasil kalibras; aitem-aitem Subtes Verbal dituangkan dalam Tahel 1.
Mendasarkan pada parameter
·d~y~
bega la),
h~rg~ rata-rat~ny~ ~d·~I.~.h
Parameter daya beda tertinggi ~imiliki aitem nomor 25 dengan sementara tersndah dimHiki oleh aite'm nomor 12 den'ga'n kesukaran rata-rata pada 5ubtes ini 38 dengan b 38
=1,771
sebe~ar
812
825
0,172.
= 1,623,
= 0,421.
Tingkat
-0,562; terting9i... ·pada aitem nomor
dan terendah aitem nomor 3 dengan' b 3 =- -2,2'1- 0·.. ~'~d~
parameter tebakan semu, ditemukan rata-rata sebesar 0,095.; aitem nomor 33· den'gan' C33
t~rtinggi
pada
= 0~ 5· dan' terend·a·h· pa'da n'omor 26 dengan C26 =
0,04. Tabel2. Param.eter Aitem berdasarkan UIRT pad~ 32 Aitem Subtes Kuaf}titatif NO.
I
%B
a
1
K041
VI,V
~7
Q
2
K042
3
K043
I
%8
a
b
c
. 17
KnJ:;sl 'VvV
4'lv,v~
1 ,)OA. ',,,",",v
n .AAJ:;. v,-r-rv
0,108
0,065
18
K059
53,3
0,464
0,179
0,120
0·,361
19
K060
4.1.';9.
O,78J
0,956 Oi1f)4
b
c
,!, 7~Q v,",
=0,658'
n f\A"J V,VV,,"
77,0
1,070
-0,947
54,,4
0,,892
0,867
V,I
NO.
K044 78,3 0,403 -1,515 0,225 4 20 K061 50,2 1,066 0,313 0,151 ····0-·_····__··- --1<04-5'-- "-55-;1-- --1";667--' ····0-;777..--·_·- -0-;39'3'--- ._-- "-2,.--- ~-KO·6·2- -'52';0-' -t~OO8- '-'O~t80- -O~1L46
K047
76,9
1,107
-0,528
0,327
22
K063
26,3
0,990
1,721
7
K048
68.,1
0.,751
-0.. 066
0.,334
23
K066
45,5
1.,19'(;
1.,202 'O!332
8
K049
81,3
1,196
-1,087
0,090
24
K067
61,7
0,737
0,032 ·0,240
82
0,167
%8 a
NO.
I
9
10
KOSO 53,0 0,9·73 . -0,012 K051 62,1 0,993 -0,327
11
K052
11,,1
1·,129
1,936.
12
K053
43,8
1,128
0,361
13
KQ~4
~.e_,7
'14
K055
65,8
1,189
15
K056 KOS7
40,3
64,3
16
c
b
NO.
0,049
%8
t
c
b
8 ..
. K06·g-, '·34·,2. . f,731 ·0·,888, :0:,1:5El
·25 26
KOlO
50,2
1,116
O,4~5
0,195
0,Q39
27
K071
49,7
0,513
0,687
0,1·95
0,068'
28
K072
50,1
2,242
0,506
0,255
.Q.t1_~
~~.
. ~9.1~.
. ~4_t~ . 1. 9h-9-. : 1. 9M
' Q."-1.~&~
0,001
0,308
30
K077
50,4
0,980
0,375
0,174
1,090
0,668
O~129
31
K078
53!3
0,776
O!597
0,271
1,757
-0,148
0,192
32
K079
53,1
0,612
0,627
0,253
0,068
.1,,1.5_0. . Qt~~~-~
= =
~
•• I
t
t
=
Keterangan: I nama aitem; %B persentase peserta menjawab benar~ a daya beda; b. kesukaran; dan c tebakan
=
=
Untuk Subtes Kuantitatif yang disajikan pada Tabel 2, dapat dideskripsikan rata-rata daya beda Subtes Verbal adalah 1,072, minimum 844 '= '0,403 dan
=- 2,,242-. Tingkat- kesttkaJaR- rata-rata berharga 0',341, cJengan:
maksi,mtlm~ 072
harga minimum adalah b 44
=-1',51S'dan' maksimum b52 = 1,936. Sementara itu,
parameter teeakan memiliki har-ga rata-rata sebesar- 0,187 dengan miAimum
eS2
=0,039 dan maksimum C45 =0,393. Ta·beJ 3. P-a-rameter:Aitem: berdasarkart UJRT pada:·3-1'· Aitem· Subtes Penalaran NO.
I
Ok B
1
P081
86,2 '··1,005
~1,494
2
P082
74,0
3
POS3 S5 f O
c
NO.
I
%8
a
b
c
0;064
17
P100
32,7
0,923
1,054
0,118
0,488
-1,274 0,081
18
P101
71,3
0,969 ·-0,650
O~J~
-CtSS3 .Qt.1Q~ .
1~...
.P1Q~.
.Q~;,3,
.O-t.g4_~.:~ . "Q;5·1·.9. '. O~~O-~
20
P103
60,9
0,877
a
b
.'
.....t . . . . . .
4 P084 51,4 0,775 0,129 0,079 -5--'- '·-P'q~~- ... '-030- --q:~~1--'-g.~7~_~--
1-
. P. ••••••
~T'- '--P1'Q~- '-7q;?- '~'7q~-
=0,152
0,093
0,135
-..:1-0·Og-Q;t~~-,1. •..•••
6
POB6
59;5
0;838
-0,222
0,°72
22
P105
75,8
1,133
-0;842. 0,055
7
P087
70,4
0,560
-0,728
0,167
23
P108
23~7
0,480
2~358
0,101
8
P088
79,8
1,012
-1,025
0,112
24
P109
51,6
0,608
0,279
Q,129
9
POgO 12,6 1,497 1,986 0,084
25
P113
90,2 0,621
-2,139 0,254
10
P091
33,7
0,501
1,129
O,O~O
26
P114
69,2
0,577
-0,869
0,058
11
·P·0·93
2'6,8
'0;674
1,48'0
'0,084
27
P115
'9"0,7
'0,73'6
-1,7"91
'0,353
12
P094
53,6
0,860
1,080
0,386
·28
P116
38,7
0,367
1,255
0,089
13
P095
.0,827
(),223
29
P117
84,8
1;-441
::1,155
O,O~4
P119
68,7
0,614
-0,793
0,064
.
-'''-''----.
14
.... ... ~.
P096
5.0,0 ..
_.
--
~.
49,4
0,833
0,563
0,094 .
-
.
- ... _.-
0,206
.
30
83
%8 a
I
NO.
15
, P097
16
I
P099
c
53,,9··' 0,940
0,589
o
0,929
-f.\,291
0,066
.61,4
Keterangan: %8 kesukaran; dan c
P120
31
'')Q')
,LQL
= persentase =tebakan
%·8
-NO. - I
b
a
64;7 ,0,840
b
c
oiO,459'
0,062
t
peserta menjawab" bery~r, -a -=, ·.daya '·beda; ,b ~ .
Desktips; katakfetistik aitem-aitem pada
Suotes
Penafaran
disajikan daiam
Tabel 3. Tampak bahwa rata-rata daya beda adafah 0,816 dengan harga
= 1,497. Tingkat kesukaran"m'em'iliki rata-rata -0,082 dengan minimum b = -2,139 dan maksim'um b = 2,358. filara'meter tebakan' m'e'mUrki h'arga rata-rata = 0,141' d'e'n'g'a'n 'm'inimum pa'da' = O~05 dan maksimum pada C102 =0,420. minimum
883
= 0,322 dan
maksimum
890
108
113
C91
Anal·isis Dimension.alitas
Analisis
dimensionalitas
untuk
melihat
ap~kah
~item-aitem
bersifat
unidimensional dilakukan dengan' proses eksploratort dan' ko·nfirmatori. Proses
eksploratori
dilakukan
dengan
prosedur
DIMTEST,
HCAlCCPROX,
DETECT. Sementara itu proseskonfirmator! dilakukan dengan
dan
prC?~~ur
D!MTEST dan DETECT.
Eksplorasi nlel'atu'f prosed'ur DI~y1TEST mengh~snkan dua ktaster dinlana aitem-aitem Subtes Verbal dan Penafaran menjadi satu sebagai partitioned test (PT), seda·ngkan klaster ke dua berisikan aitem-aitem Subtes Kuantitatif sebagai assessment test (AT). Ha·sil ini disajikan pada Tabel4.
Ta"b..e.r·l. A..
c;.
K f
I I
ur DI~,ATEC.T Illtil ""
u,..~a s::.l,~4n:I.""".r~"""'n·d..e..ng·~n or:~se'd' a FI U
- C:I ..... I la~1I L.1\.~fJIVI aLva
I
Jumlah
Nomor Aitem
PT' 1,2) 3, 12, 13, 15, 16, 17, 18, 1'9,20,21,22,23,24,2-5,26,27,' ·6·0
28,29,30,31,32,33,34,35,38, 39,60, 81,82,83,84,85,86, .
a7~,a8; 90,
91; 93,:.94,. 9,5 f 96,.
97~' 99:
100, 101, 102, 103, 104;
105,108,109,113,114,115,116,117,119,120 AT
14, 36~ 41,42,43,44, 45, 4~, 48,49, 50, 5'1,.52,53,54,55,56,
33
57,58,59,61,62,63,66,67,69) 70,71,72,73,77,78,79 TOTAL
93
:
Keterangan:AT = assessment test; PT = partitioned test; K = klaster;
84
T '6,~81
p ' '0;00
IK
I
1
Jumlah
NomorAitem
1,2,3, 12, 13, 14, 16, 17, 18, 19,21,22,23,24,,25,26,27, 41
Det = 0,195;
28,29,30,31,32,35,36,38,39,81, 84
IDN = 0,616;
8~84, 8~ 8~ 8~
rmax =0_, 3JJ·~_
llB~ 90-1:- ~1J: !!:.~ £!~~ ~~ %~ ,(~l!-~
2
Indeks
41,42,43,44,45,47,48,49,50,51,52,53,54,55,56,57, 29 58!, 59! 61! 62! 53! 56! 69! 70! 71! 72! 73! 77! 78
3
1~ 2~ 3~
34,
6~ 6~
79, 97, 99, 100, 101, 102, 103, 104, 23
105,109,113,114,115,116,111,119,120 TOTAL
93
..
Keterangan: Aitem-aitem yang lercetak miring oan leoal liCJaR sesuai ete-ngan .
....
'"
..
yang diharapkan. Tampak bahwa sebagian aitem-aitem Subtes Penalaran dan hampir seluruh aitem
Subt~ Verbal
m·engerucat: pacta
kfaster~
to.
dalam menjawab benar aitem-aitem penalaran,
Hqt, ini~ mer-rgrndrkasikan: aahwa dip~rlukan
pula kemampuan
verbal. Pada kfaster 2 seluruh isinya adafah aitem-ait-em Subtes Ku·a·ntitatif. Hal
yang menarik adalah terdap.at beberapa aitem Subtes Verbal (15, 20, 33, dan
85
34) serta aitem Subtes Kuantitatif (60, 67, dan 79) yang bersama-sama dengan
sebagian aitem-aitem SU'btes Penalaral1 mengelompo'k menjadi ktaster 3. Partisi aitem sebagaimana pada Tabel 5 merupakan partisi terbaik yang
dapat dilakukan sehingga data respons pada' tiap klaster bersifat homagen.. Pengelompokan aitem-aitem menjadi klaster-klaster ters,ebut menunjukkan A~1"")-~I~ IYO a. yeu
I)"W"\-ul4-idim·An~io""alf·+-~s.-4~n~~r~· II 11.1 I ' n,~. 01 II I I.Cl Ulal aLa Q a§·fte~~··ft~ III-a v i i I .
IndAKI> DETCI"T ~~~~r II g I .... V I 'oe1JeOa Q
.
n-~ LlCL.
=0, 193 (niendekati 0) berarti menunjukkan multidimensional yang sangat kecil ~(rlJ1onahl!fi, StUlf'Ij),
·Finch,. & ·Harnbteton,.l007; Rou'ssos & Ozb~'k,
20:06)~
Bila dilakukan· analisis eksploratori menggunakan prosedur HCAlCCPROX
'dfsajikan' daia'm Tabat 6; tampai\ :bahwa aite-m-aitem Subtes Verbat·. dan Kuantitatif mengerucut pada' klaster yang diharapkan sekalipun masih terdapat
-bebera·pa·a·item 'ya'n'g peri'u 'me'nda'patk:an "perhatia'n 'pada k'laster '1, "yaita ·aitem nomor 59 (Kuantitatif). Selain itu, aitem-aitem nornor 81, 82, 83, 84, 85, 86, 87,
ikut mengeru'cut bersama-sama dengan aitem-aitem Subtes Verbalpada klaster
'1: HaiinVtneriguatRan iridikclsi'sebeiumnya>bahwa"daiam; menjaWab'benar aitemaitempena'laran, diperlukanpula kemampuan verbal.
K
NomorAitem .~
·1
~.~
.A~
.A~
I,L,J, IL, I"',
Jumlah
AS A6 An An 1 , ' 1 , I ,.ll·,TO,·IVt·L.U~L.I,.
'~4
A~
~n
~A
ns ng 30 L, . . L..:J,L.~;L ,.£O,Ll,LO,·~ , " , ,··54,'
2~
~~
~A
n~
~~
~n
31,32,33,34,35,36,38,39,59, 81, 82, 83, 84, 85, 86,81, 88, 90, 91, 93, 94,
i
~~ ~~. ~1t 9~r 1()Q( 1Of,. 1()2,.. 10~t
104r 10~T 11-6-
2 (41,42,43,44,45,47,48,49,59,51,52,53,54,55,56,57,58, 60, 61, 62,63,
~6~6~6~7Q7t7~7~7~7~79 3
105,
10~
31
.
113, 114,115,117, 119,120
8
TOTAL
93
I
i
i
Keterangan: Aitem-aitem yang tercetak miring dan tebal tidak sesuai denga'n yang dih·arap~an.
Klaster 2'pada Tabel 6 bersifat konsisten bila dibandingkan dengan
Se!·urutr· anggotar-rya me·rclj)·ak-an·" a·item
86 ;r..
1
~·~tem·
Subtes Kuantitatif. Pada klaster 3, anggotanya adalah aitem-aitem bagian akhir',.
di 8uble's Peflalara~ Dari hasil eksploratori yang dilakukan ,melalui prosedur HCAlCCPROX, DETECT, dan DIMTEST, disimpulkar-t bahwa r-espORS peserta pacta aitem;;;aite,m Subtes 'Penalaran menghasilkan data dengan kovarians kondisional yang terbagi den'gan' Subtes Verbat-. Hat, itu tidak terjadr pacta aitem-aitem Subtes Kuantitatif Kenyataan ini diperkuat oleh hasil konfirmatori berupa uji independensi lokal tiap 5ubtes yang disajikan pada Tabel 7, yang menunjukkan bahwa artem-aitem SUbtes Penalaran bersifat independen secara lokal dengali aitem-aitem Subtes Verbat Dengan kate' tatn, secara umum, a item-aitem' da'lam: g,ubtes Verba-}; dan· Penalaran berbagi varians satu sarna lain. - Tabel7. HasilKonfirmatori Aitem-aitem antar Subtes den'gan Prosedur DIMTESf Pasangan
TL
,Verbal- 'Kuant.itetif
Verbal- Penalaran
TGbar
p
T
Independensi Lokal Aitem
,14,45-1- . 10-,5-1-& 03,91..5- . <0,,01- -Tidak
8,437
7,645
Kuantitatif -:::: Penalaran 14.109 91271
0,788 0,215
4.814
~
0.01
.~.
Ya Tidak
=
Keterangan: TL statistik T yang diperoleh dan data respons; TGbar = statistik T yang diperoie'h dari rata-rata data simuiasi. 0-
Aitem-aitem Subtes Penalaran dan Subtes Verbal yang be~sifatindependen
seeara takal mengisyaratkan adanya Gua kemungkinaR., P:ertama, kedua kelompok aitem mengukur sebuah dimensi secara bersama-sama. Ke dua,bila
terd-apat: dua- dimensr- (verbal:·
dan~
pe~alaraR)J.
kedua...
keJomp~ook.-
ajtem~
mengandung babot yang hampir sarna dalam mengungkap dua, dimensi tersebut. Dengan demikian,untuk dapat menjawab 'benar aitem-aftem Sul3tes Penalaran, diperlu,kan dua kemampuan laten, yaitu kemampuan penalaran dan
kemampuan- verbat'; Konfirmatori ke dua dilakukan dengan prosedur DETECT' untuk mengetahui
sejauh mana tingkat dan kompleksitas dimension'alitasnya bifa aitem-aitem dikelompo.kkan sesuai dengan dimensi mashlg-masing, yaitu Verbal (81),
Kuanttlatifi\(82), d-an' Penataran {83}.
87
Ta'beI' 8. Hasil Konfirmatori 3 Dirne'n'si den'g'an' Pro'sedur D:ETECT }K [ t~offiOf Altern '1 '1,2, 3,·12,·13,·t4,·1··5;1·6;1'7,-1·8,
19,~?O,21,
22, 23,24, '25,26,' 30
·?7 i -28..29.'.·3n . ·31·····32 33.. .3S·· 39 ,,":,.! i _.J 34·· ..J.J 35··.36·· ,.,.,'
.'~"
.~.J. -
~.J :'.-.~.J
.-._.j; _.
_.J
-:._.,. _ ..~.) . _._.
.'max' =0,439
2 41,42,43,44,45,47,48,49,50,51,52,53,54,55,56,57,58, 32
. ~~:. ~.Q,: ~~ ': ~~,~ ~~,:. ~~';"~"?': ~.~":: ~Q,; ~1.,. Z~~ Z~:. ~~:, ~~:. "?~. 81-,' 82j · 831 84j'85;::86~:'-81,' BB~.-90, .9.1, . 93, .94, .95, .96, .97, .99, .1.00, :.31'
3
1101, 102, 103, 104, 105,108, 109, 113, 114, 115, 116,111, 119,
I
1120".
hfoTAL "
""
I
"" " 9 3
1
I ;
;
Sebagaimana dimuat pada Tabel·8, klaster 1,2, dan 3 ~ecara"'be~utut-turut "mengacu pada mrrlens"j Verbal" (81), Kuantita,tjf(~),daR"Pei1alar-aA(93),il1seks DETECT.Det = O,17~ mengindikasikan multidimensionalitas dengan ting~at yang ren·dall. hlCJekS tDt~ ==. 0, 631 dan' 'max =. 0,439- nlet1g'in"d'ikasrkan berttu'k
mU'ltidim'ensi 'yan'g' bersifat"kompfeks.· Penjefasan" lebih 'detil tentang indeks "Oet, iDt~,
dan
lmax
dapat
dHih~
daiam Zhang dan Stout (1999) dan tv1onahan, d"kk.
(2007).
dideskripsikan sebelurnnya membawa pada .kesimpulan bahwa dimensi yang mengukur aitem~aitem Te$ PAPs adafah dhnensi Verbal (ei), Kuantitatif·'(e2), 'daft Penalaran (03). Hal ini bermakna bahwa terdapat tiga sU'mbu ortogonal dimana
m'as';-ng'-ma'sing' sumbu'
J',
·,cncermrnka·n
fna's'ing-mas~ing
dimensj-~
Berdasa-rk'an
sudut ·pandang model MIRT, interaksi antara peserta tes. dan aitem-aitem ak~n
"me'flghas iikan" ka-raKtetistik ~aitem"berupa' vektot"aHem" yahgda~jafdiproY~k$ikan pada ketiga sumbu tersebut. Aitem-aitemSubtes \/erbal dan Penalaran dapat
dapat diproyeksikan pada satu sumbu yaitu slJmbu ()2.
D'a'iam .be'ntu'k ."ilu'stras'i ·.·grafi·s, . . d ragramjaiur .:, struktur h~bungannya
dengan aitem-aitem Tes PAPs disajikan dalam
88 ........... .• i..
.:.r-:. '1
····urmens-r
"b.e·serta
Gambar 3. Bagian kin (A) merupaka'n struktur teoritik sebagaimana didesain J3e'Rg'embang~: sementara:
bagia:n=- kanan- (B)-
adala~
s·truktur- yang. ffiertURjukkan:
interaksi pe$erta tes dengan aitern-altern secara empirik.
(6)
(A) -
_.
_.
. .. -
----
Gambar 3. Struktur Dimensi PAPs: (A) Teoritik: (8) Empirik Keterangan: (}1 Verbal; 62 = Kuantitatif; 83 . ='Penalaran; angka-angka dalam kotak adaJah nomor aitem.
=
Analisis MIRT Hasil analisis dimen'sionalitas yang telah dijelaskan diatas
peRU e·Hakuka·n anaUsts
~v1lRT
me~jadi
alasan
t-erkait· deng:an· 5twktur- KGftstrak- PAPs. Seoara~
teoritik struktur konstrak mengikut
GambaF' 3A, namUR data empirik jawaban dari 2035 peserta tes menunjukkan bahwa
Gambar- 3-B tebiR· dapat:: meitGefminkan- stmkt-u~ data- respons- yang·· diperoleh. Dengan struktur seperti
Gambar-
38,
dapatdikatakan
bahwa
aitem-aitem
PAPs . ' ber-sifat
multidimensi dalam-aitem. Justifikasi ini didasarkan pada kenyataan terdap'atnya aitern-attern: yarag·· mengu-kur-dtla- drmensi··· (Verbal-·dan_F?enalaran}-·
89 ;;--:.
1
Berbeda dan kerangkaanalisis UIRT yang dilakukan secara terpisah untuk tiap Subtes PAPs, daiartl anaii815 MiRT kaiibrasi' diiakuk~n SeCCif8 ututl deilgan mempertimbangkan struktur konstrak sebagaimana disajikan dalam
konteks ini, djmensi yang dimaksud disesuaikan dengan konstrak PAPs, yaitu
Berdasarkan ketiga dimensi yang telah teridentifikasi sebelumnya dengan
stru'ktur 'seb'ag'aimana 'da'iam Gambar 38, dalam Tabel 9 disajikan ringkasan hasil estimasi parameter daya' beda' bag;" setiap' d;imensi" (m'a's;'ng-m'a's';ng' a1', a2, dan a3J~ param'eter
tingkat kemudahan (d), dan parameter pefuang tebakan (c). Dapat disimpulkan beberapa'karakierititi'k "FAFs 'sari A1 sl~'baga'i 'berikut: a) 'uim'ensi 'Verba'i memiiiki
daya beda yang sedang, b) Dimensi Kuantitatif memiliki daya beda yang tinggi,
c) Dimensi ~enalaratr rriemilfki daya- b~da yangseasrtg; d) Tirlg'kat
kemuttc1h'aii
b,erada pada tarat sedang, dan e) Pef,uang tebakan berada pada tarat sedang .
Maksimum
Parameter'
Minimum
~aya
a2« =0,589 a272 = 3,024
Beda Dimensi Kuantitatif (a2)
Rata-rata
1,452
,Daya'8,eda-Dimensj·,Penalaran·(a3)
a3:J3 =·0;3,90· a3n = 1;~20 . O;a92
Kemudahan (d)
b 25 =-2,543
b S2
=2,368
0,030
,. c~= 0;122 I C1~= 0,227 I 0,168 Kenyataan bahwa secara empirik PAPs seri A 1 tersusun sebagaimana
'Garnbar ·3'0, ada "beberapa 'irnpHka:sL 'P'ertarrra, -abHitas 'potertsi -ak-aderflik peserta tes perlu dilaporkan dalam bentuk atribut laten yang bersifat komposit.
gabungan dimensi verbal - penalaran; dan (b) skor laten dimensi kuantitatif.
Mengacu:·pada Ye'n -dan '''''Biker '(2007), 'abiiitas ·kornpos'it ,·PAPs' 'dapat--dif~lkukan 'dengan cara merata-rata skor verbal - penalaran dan kuantitatif melalui UIRT
90 '~
.•
..
L
,r'
atau secara langsung dengan mengestimasi 'kombinasi linier antara verbal penalaran dan kuantitatif melalui MIRT. -,j.1
KESfMPU'LAN DAN REKOMENDASI Kesimpulan yang dapat diambil dalam penelitian ini adalah:
1. Sebanyak 27 aitem tidakdi1kutkan d'atam kafi"brasr .U-r-RT karena
fbis
terlalu
rendah «0,25), yaitu aitem-aitem nomor 4 - 11, 37 dan 40 (Verbal); 46, 64, 65,68, 74, 75, 76, dan 80 (Kuantitatif); 89, 92, 98, 106, 107, 110 - 112, dan 118 (Penalaran). Hasil kalibrasi UIRT memperoleh hasil parameter tebakan terlalu tinggi (>0,35) terdapat pada6 aitem, yaitu aitem-aitem nornor 33' (Verbal); 43 dan 45 (Kuantitatif); 94, 102, dan 115 (Penalaran). 2. Berdasarkan rata~rata parameter aitem dalam,·kerangka UIRT, a. Subtes Verbal memiliki daya beda baik, tingkat kesukaran yang agak' mudah, dan peluang tebakan yang rendah. b. Subtes Kuantitatif memiliki daya beda baik, tingkat kesukaran yang agak
sulit,· dan peluang tebakan yang rendah. c. Subtes Penalaran memiliki daya beda baik, tingkat kesukaran yang sedang,
dan peluang tebakan yang rendah. 3. Hasil analisis dimensionalitas menunjukkan bahwa aiteni-aitem dalam Tes PAPs bersifat multidimensional. Secara lebih rinci, aitem-aitem Verbal -
Kuantitatif tidak bersifat inde,pendenlokal,Verbal -
Perialaran bersifat
independen lokal~ dan Kuantitatif - Penalaran bersifat tidak independen lokal. Dengan kata lain, aitern-aitem PAPs bersifat multidimensi dalam-aitem. 4. Karakteristik aitem-aitem PAPs berdasarkan MIRT adalah sebagai berikut.
a.
Dimens~
Verbal m'emiliki daya beda yan~ sedan~.
b. Dimensi' Kuantitatif memiliki dayabeda yang tinggi. c. Dimensi Penalaran memiliki daya beda yang sedang. d. Tingkat 'kemudahan berada pada taraf sedang. e. Tebakan beradapada taraf sedang. Rekomendasi yang diberikan berdasarkan hasil stud·i iniadalah:
91
1. Bahwasanya terdapat aitem-aite-m' "yang mengukurlebih dari satu dimensi, maka direkomendasikan bagi pengembang Tes PAPs untuk., mempelajari karakter dan penyebab terjadinya hal, tersebut'J dengan analisis isi (content
analysis). 2. Berdasarkan kenyataanbahwa aitem-aitem Subtes Verbal dan Penalaran bersifat
independen
secara
lokal,
pengembang
Tes
PAPs
dapat
memperla,kukan kedua subtes sebagai satu kesatuan subtes yang mengukur pe~alaran verbal.
DAFTAR PUSTAKA, Abedi, J.·(1997). Dime'ns;onaJity of"NAEP SubscaJe Scores in Mathematics CSE Technical Report 428. Los Angeles, CA: Center for Research on Evaluation, Standards,and Student Testing (CRESST) University of California.
Ackerman, T. A. (1989). Unidimensional IRT Calibration of'Compensatory and Noncompensatory Multidi-mensional Items. Applied Psychological Measurement, 13(2), 11~-127. Ackerman, T. A. (1992). Assessing Construct Validity Using Multidimensional Item Re·sponse Theory. 'Paper dipresentasikan pada Annual Meeting of the American Educational Research Assocfation, San Francisco, CA. Ackerman, T. A. (1994). Using Multidimensional Item Response Theory to Understand Wh'at Items and Tests Are Measuring. Applied Mea$urement in Education, 7(4),255-278. Ackerman,T. A., G·ierl, M. J., '& Walker, C. M. (2003). Using Multidimensional Item Response Theory to Evaluate Educational and Psychological Tests. Educational and Psychological Measurement, 22(3), 37-51. Azwar, S~ (2008). Kualitas Tes Potensi Akademik Versi 07A. Jumal Penelitian dan Evaluasi Pendidikan, 12(2),232-250. Camilli, G., Wang, M.-m., & Fesq, J.(1995). The Effects of Dimensionality on Equating the Law School Admission Test. Journal of Educational Measurement, 32(1), 79-96. Cheng, Y.-Y., Wang, W.-C., & Ho, Y.-H. (2009). Multidimensional Rasch Analysis of a Psychological Test With Multiple Subtests: A Statistical Solution for the Bandwidth--Fidelity Dilemma. Educational and Psychological Measurement, 69(3), 369-388. Chou, Y.-T., & Wang, W.-C. (2010). Checking Dimensionality in Item Response Models With .,Principal Component Analysis on Standardized Residuals. Educational a~d Psychological Measurement, 70(5),717-731. DeMars, C. E. (2006). Scoring Sub!1rpales Using Multidimensionalltem Response Theory Models. Paper dipresentasikan pada Annual Meeting of the American Psychological Association, Washington, DC. 92
Dirir, M. A., & Sin·ctair,N. (1'996). On-RepoTting'/R'T Ability'Scores-When:,the" Te'stis Not :Vnldlmens/onai. Paper dtpresentaslkan pada Annua"1 Meeting of the National Council on Measurement in Education,'New York. -t=mbr~tson, 5. E." & Reise, S. P. (2000)., Item Response Theory for Psychologist.
NJ: Lawrence Erlbaum Associates InG;
."
Fiske, D. W. (2002).. Validity for what? Dalam H. I. Braun, D. N. Jackson & D. 'E. Wi~ey (Ed~.), Tn~ rofe ~ ~~tff:!~s in psychqlQgf~aI ,~ f¥Jf!P:ati~al me'asuremenF-(Edisr- ke-1-, hll. 1-69-1-78}. Mah,wan, NJ:-lawreAoe Ertbauffi. Hambleton, R. K., & Ravine"i, R. J. (1986). Assessing the Dimensionality of a Set of Test Items. App1iea "PsychologIcal Measurement, 1U(3), 287-3'02. Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response- Theory. CA: Sage' Pubticatio'n' tn'c: "Hattie, j., Krakows"kl, K. Rogers, H.' j., & Swamlnathan, H~ (1996). An Assessment of "Stout's' Index of Essential UnidimensionalitY. Applied' t
Psychological Measurement, 20(1), 1-14. Jang,E. E., &-Roussos, L. A. (2007), An Investigation into the Dimensionality of TOEFL Using Conditional Covariance-Based Nonparametric Approach. "4~alQf~qat~alM~~!-t~~t,44(1),1-21· Kahraman:, N~, & Tho~, T. (2G1-1-}. RetatrAg:Un·idimeASiGRat~.IRT Pafameters to, a Multidi'rriensional Response Spaoe: A Review of Two Alternative
Projectlon IRT Moaels for Sooting SUbs'cales.Journal of' ECluoa'tional Measurement, 48(2), 1'46-1S4·. Liu,
J~,'Harris'J
D'. J'., & Schmtdt, A. (2007). StatisticalProcedure's-U'se-d"in'CoUeg'eAdmlss'ions =Fesfing~ Daiam G. R. 'Rao & S. Sln"haray (Eds.), Handbook of Statistics 26: Psychometrics (Edisik~1, h'h. 105-7":1091)". Amsterdam: Eisevelr. Lord, F.M, (1980). Application of Item Response Theory to Practical Testing Problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates Publishers. '¥essick, t). ~. (1~~5). Vali~ity ~fp~y~h~l9Qi~( a~~~s~m~nt: Vali~'ati9n qf inferences from persons'-· respon,ses an'd: performaAGes as sc-reAtifiG fAquiJ:yinto score meaning. American Psychologist, 50(9), 741-749. Mi~sleVYJR. J., Almon'o, R. 'G., & LUKas, J. F. (2003). A Stief lnttoaU·ction to Evidence Cenfered Oesign. Research Report RR-03~16.' Princeton: Education'al Testing' Se'rvices·'. Mona"han, P. G. Stump, =F. E., Finch, H., & Hambieton, R.K., (2007). S-ias of Exploratory· and Cross-Vaiidated 'DETECT Index Under Unldimensionality. t
Applied
Psych oiogJcai
Measurement,
31(6),
483-503.
dOl:
10~1177/01466216062g221e
Nandakumar, R., Yu, F., .,& Zhang, Y. (201'1). A Comparison of Bias Correction Adjustment~ for th~ DETECT, Procedur~. Applied Psy~h~ogical Me'asurememj 36(2), 1-27-1-44-. Nunnally, J. C. (1981). Psychometric Theory. New Delhi: McGraw-Hili Camp,any Limited. .
93 '.-- ,-
.
t..
Oshima, T~ C~" &Miller,:M~ D. (t990)~ Multidimensionality and IRT-Based .Item invanance "indexes: l~he Effect 'of Between-Group \iar"iat"ion In =Frail Correlation. Journal of Educational Measurement~ 27(3), 273-283. Reckase,. M. D. (1985). The Difficulty of Test Items That Measure More Than ()nt:l Linn/ion 4D1...d1"" "",'v ,Ahilihy 1J9''''S 'J'ii'J9'''V''f&tJ rD~'/"'''''nlnrJi,..~JIAO£)~llromonf" -si;Wlvl!vU#"'1if' ,/F'~99s:tf\7 .9ft'Sj 9(4)," .,... ~ ,~, Reckase, M. D. (1997). The Past and Future of Multidimensional Item Response 'j
,
Th~9fY~ f\pplf~~P~ycfJqfqgical~as~~nt, 21(1), 2q-~~. Reckase,··.·M·~ D.... (zOOS). Muitidimensionaf: item . Responsf?.' Th'eory.. New York: Springe~
.
"
Re'cJ(a5e, M. D., & Ackerman·; T. A'. (1988). BuiTding a
Test
USing
Items That
R.equire More than One Skill to Defennine a Correct Answer. f>aper dipresentasikan pada The Annual, Meeting' of' the American Educational Research As's.oc"iatlon,ISan Franc'sco. GA. Reckase, M·. D., &. McKinley~: ROIL.' (1991). The Discriminating Power of Items. That Measure More Than One Dimension. Applied Psychological
.A1ea$lIrement 15(4.),361-373.
.
j
"
Reise~S. P. s · Moore,T. M.,.& ,Haviland, M. G. (2010)'... Bifactor Models' and RQ~~ti~ns: E~pf~ring' th~ ~~nt t~. \lVhic.h· M~ftiq~rn~n~'i~n'a( Q-ata Yi~f~
Univocal :Sca:ie ,·Score·s~ Jouf71al·.of·PetSOtlSiity· AsseSSrtrellt '92(8), 544-559. Roussos, L. A., &. Ozbek, O. Y. (2006). Formulafion'''of the· DETECT Population p'arameter an'a Evaluation of' DETECT Estimator l~ias~ Journal of Educational Measurement, 43(3), 215-~43. Roussos, L. A., Stout, W. F., & Marden, J.. 1. (1998). Using New· 'Proximity "Measures w'it"h Hierarc'hlca"1 ,tiuster AnaJys"is to Detect Mu"ltidlmens·iona-fity. Journal of Educational- Measurement 35(1), '1-30. Stout, W. F. (1984). A Statistical Procedure for Assessing Test Dimensionality. "AI:3~~/tromQnf _C:orio~
f~'Yti/'l.'WYii'J'W"fYf't:
~y",.,,.,
RA._? w··, ...
\A/~~h;nrrtnn
n
~
· J=~I~ ~IO!lrjn' (]hOI_IC:~Q, ,tJ" ......
"",""""f'~.'W"J "j~U
..
,'W'~,
'~'J~~W'W~
Stout,W. F.. (1989). ·ANew Item Response Theory Modeling Approach with Appficatiqns to, ~niqim~n~i9nafity As~es~m~nt an~ Ability E~timati~n. Cognitive' Science':": Program-. Cha-mpa"ign, IL:: Department of StatisticsUniv. of Illinois. StoUt,' W. F.. (20'02). Psychometrics: From PYa'dice to Theory anti Sa'ok (1'5 Years of NonparametrlcMultidimensional IRT, OIFlTest~quity, and SkHis Diagnostic Assessment). Psychometrika, 67(4), 485-518. Stout. W~ F.~ & 'Nanda"kumar~ R. (2006). fJiMrEsT 2.1 ttomputer Software]. Missoula: Assessment System Corporation.. Tate, R. (2000}.Performance of a Proposed Method for the Linking of Mixed'
,Format Te-sts '!lith Con·structed Re·sponse
·~·nd
-f\4,u.J.tip!e
ChQj~
Items;
Journal of Educational Measurement, 37(4),329-346. c& T.M. Hafadyn~ (E~·s.), Large-Sca/e' Assessment Program' for Ail Students:' Validity, Tecfr;ricaJ Adequacy, and Implementation (Edisi ke-1, hh. 181-2.11). Mahwah, NJ:
Ta~e, R. (2092). Test Dimensionality. Dalam G~ Tindal
LaWren'ce Etlba'Um.
.
94 - .. 1
Tate, ~. (20'0'3). A Com'pa-rison' of Selected' Emp'irical" Methods' for Ass'essing,th'eStructure of Responses to lest items. Appjied Psychoiogicai Measurement, 27(3), 159-203. . .. ,,,' -. Thomas, R. M. (2005). High-Stakes Testing: Coping with Collateral Damdge~
New Jersey; Lawrence- Erlbaumi
.
Togut, T. D. (2011). High-Stakes Testing: Educational Barometer for Success, 'or False Prognosticator for Failure. Retrieved 15 Agustus 2011, from http://www.harborhouselaw.com/articles/highstakes.togut.htm#1 Way, W. D.. , Alisley, T.,N.,& Forsyth', R. A. (1988). The Oomparative Effects of' Compensatory and Noncompensatory Two-Dimensional Data on UnidimensionBJ lRT Estimates. Applied EsycnoJogica/. Measurement; 1.2{3)., ~~~
,
Yao, L. (2011). Multidimens'ional Linking for Domain Scores 'and Overall S'cores for' 'NOnetluiva'lent (3'rOup$. APPI/lJd PSYChOlogical MSa$Umm~l1t, 35(1), 48- '
66. , Yao., L~, & aoughton, K. A. (2001). A Multid'imensionalltem Response Modeiing Ap'proach for Improving Subscale Proficiency Estimation and Classificatiori Applied PsychologicatMeasurement, 31(2),83-105. Y~n, ~.
J., &
W~U~~r,
l-. (2007).
M«'t{qim~n$iQnal
IRT Mqqe/s for Composite
Scores.. Paper 'dipresentasikan pada' Annual Meeting of the N'ational Council fJf Measurement in Edueatien; Ghieags; Ib.: ZhaFl9~ '8.- (2-O08}.- Ap~tfoo-of-URidimimsiGRa~ J-tem Respon8& MSGel,s; tQ Tests~ With Items Sensitive' to Seconda'ry' Dimensioi1s~ Journal of Experimental 'Edacation, 77(2), 1:47. Zhang, J. & Stout, W. F. (1999j. The theoretical'·DETECT index of dimensionality ~~~ ~~ ~application' to' approximate" simple'" structure: Psychometrika, 64(2),' t
231-249. Zimowski, M.F., Muraki, E., Mislevy, R. J., & Bock, R. D. (2003)~' BILOG-MG (Version 3). Lincolnwood, IL~ SCientific Software International.
95 ..
i.
~ENGEMBANGAN
MODEL ASES~EN AUTENTJK
SEKOLAH MENENGAH PERTAMA Undang Rosidin
JL. Pvrn.awirawa.n: 7 NQ..
1'~
G.Y.n.lJ.n.9. T~(gJJ.g.
e.~f\.g.~f L~mp.4.ng . ~~.15~_
[email protected] atau [email protected] HP~ OS1~79244eo7 atau Q2154011'210
ABSTRAK penellt,an In, bertuJuan untUK menghas'ikan suatu prOOUK ,oerupa moae, ases~n autentik untuk mengases kompetensi siswa dalam pembelajaran IPA di sekoiah m~nengah pert~l;T1a (SMJ5), khususnya untuk mengha~nkan: (~) seperangkat kom'petensida~rdan indik~tor yan-g s~~ra integratff dapat diukur inelalul asesmen a.utentik,(b} deskripsi p~ragembangan rubrik model asesmen @\.Jten1~·k: Qal@m
mengit$e$ kQmpe1en$i IPA terpaou
$i$wa·~
(c) de$krip$i meng:enai:
keefektifan.impJementasi model a~~men.. autentikyang.. pikembangkan. Penelitian ini merupakan peneHtian p~.ng~mllangan (Research and 'D~velop ifJehl), yaflg"o'ilaktik:an' dafa01 -fj'ua:- tai1ap~ .yailu:· (1) Iaflap pengem6anga.A oaA validasi model; dan· (2) tahap, uji keefektifan··dan· keterlaksanaan.model·. Tahap.
pertaiita mehgguhakah model penelitiaii pengembangan dan tah-ap kedlia m.e:nggunakan ·moaeldesain· eksperim.en pretes/-posHest . control group .non- " random design. SU'bjek ujicoba model ·asesmen autentik adalah guru IPA materi 'i=ls,ka dan siswa SMPnegen d~i Kota 'Bandar Lampung. HasH peneiltlan 'berupa produk mod~l. asesmenautentik yang dikembangkan unt~k· mengaseskompetens; IPA terpad'lJ s;swa SMP secara :menyeluruh· Ko~petens; ~ersebut diases
dart p~rangkat tn$1rymen lembar Tuga$-. Siswa (LTS) {j·an Lembar ObsefYa$i (LO) yang telah diuji coba dan divaJidasi. Model rubrik asesmen autentik yang ~iJ<em~angJ
fenfang"
triemberi asesmeii tethadap kesestfaian
ahtara kompoheh yahg dihilai pada LIS dan LO. iJemikian Juga dalam menllai kesesuaian antara Jndikator dan tugas
c;falam LTS dan LO serta dafa~ memberi asesmen terhadap struktur dalam LTS.. Seianjutnya, hasd uJi keefekfifan dan keterla'ksanaanmodei menunju"kkan, bahwa implementasi model asesmen autentik dalam pembelajaran IPA di SMP cukup efektif.·
Kata Kunci: Asesmen autentik, Pembelajaran JPA, KurikuJum 2013,
96
-
..
..
~
PENDAHULUAN Dilaksanakannya pengembangan kurikulum 2013 atas dasar prlnslpprinsip utama antara· lain semua mata. pelajaran harus berkontribusi terhadap J
pembentukan sikap (afektif), keterampilan (psikomotor), dan pengetahua.n (kog.nitif) siswa; semua mata pelajaran diikat oleh kompetensi inti; dan harus· ada
keselarasan antara tuntutan· kompetensi lulusan, isi, proses pembelajaran, dan asesmen. Implementasi yang mantaati prin~ip-prinsip tersebut akan m'enjadi sangat penting dalam mewujudkan keberhasilan pelaksanaan kurikulum 2013.. Asesmen merupakan proses ,.yang' sistematik untuk menentukan sejauh mana tujuan-tujuan pemb.elaj:aranyang·, telah ditetapkan dapat dicapai -oleh siswa. Asesmen tidak. h'anya ditujukan" pada peng'uasaan siswa pada satu aspek saja,
melainkan
meliputi
seluruh ·.as'pek
baik
kognitif,
afektif,
maupun
psikomotorik. Dengan demikian keberhasilan guru dalam proses· pembelajaran
ditandai·oleh perubahan yang' terjadi pada' ketiga aspek tersebut secara komprehensif. Asesmen yangbaik adalah' asesmen yang dilaksanakan secara
kompreh.ensif dan berkesinambungan.
Tuga~
yang diberikan dalam asesmen
harusdapat memberikan informasi kepada siswa, janis pengetahuan dan kemampuan" yangmemberikan nilai tambah bagi siswa. Kecenderungan asesmen yang berorientasi pada aspek kognitif' saja dapatmenuntun guru kepada pembelajaran yang juga hanya berorientasi pada aspek kognitif. Menurut Hinduan (1998: 20),pembelajaran IPA harus diberikan berdasarkan pada tingkat pendidikan. dengan mengikuti porsi yang digambarkan sebagai berikut. .
----~~---~~-------~------~---~---~--- -------~-----~------- -~--------~-----
Kognitif --~---------~~-~--~~--~---~~ ---~--------------~----~
Psikomotori
-----
SMAIMA ----~--~~--~~--~----~ -----, SMP/M.Ts
Afektif
80/MI
Gambar 1. Porsi aspek kognitif, afektif, dan psikomotorik pada jenjang pendidikan Gambar 1 menunjukkan bahwa tahapan pembelajaran IPA, pada jenjang
SOIM.1 meliputi pengamatan lingkungan alam/buatan dengan porsipenekanan
97
pada aspek afektif d'an p·sikomotorik-··-daripada·······aspek kognitif. Berdasarkan kenyataan tersebut maka penggunaan polapembelajaran tematik pada tingkat SD/MI t&rutama kelas rendah, hasilnya akan lebih baik. Pada jenjang SMP/M.Ts meliputi peogetahuan dasar keilmuan dengan penekanan pada aspek kognitif, psikomotorik, dan afektif yang seimbang. Adapun pads jenjang' SMA/MA meliputi pemahaman konsep, d(9ngan penekanan pada kawasan kognitif yang lebih luas. Secara utuh IPA terdiri dari 3 dimensi m'eliputi IPA sebagai produk (fakta, konsep, prin.sip, teori dan hukum),.prosesltara. kerja ilmiah (scientific approach),
dan'sikap (sikap yang mendasari cara berproses)'. Ketiga dimensi itu sarna pentingnya dan sebagai kebulatan yang utuh dalam. pembelajaran· IRA.
Oleh
karena itu, hasil belajar IPA sebagai akibat proses pembelajaran,-' harus dinilai secara autentik dan menyeluruh dengan meliputi dimensi produk, proses, dan
si,kap IPA sebagai suatu kesatuan. Berdasarkan latar belakang tersebut, maka perlu dikembangkan model
asesmen yang
dilaksanakan selama dan sesudah proses pembelajaran
berlangsung secara terintegrasi; serta dapat digunakan untuk
umpan balik.
Sti'ggins L (1994: 55)menyatakan bahwa pembelajaranyang efektif, efisien, dan produktif perlu didukung dengan model asesmen yang baik. Secara luas' telah diyakini. bahwa
asesmen
haruslah merupakan. bag ian .
integral
dalam.
pembelajaran,sehingga bukan sajadigunakan untuk mengumplilkan data tetapi
juga untuk mempengaruhi pembelajaran (Pandey, 1990: 2). Masalah dalam penelitian ini adalah: (1) Kompetensi dasar dan indikator apa saja yang dapat diukur secara terpadu dalam model asesmen autentik?; (2) Bagaimana
pengembangan
model
asesmen
autentik yang
valid
dalam
pembelajaran IPA?; (3) Bagaimana efektivitas model asesmen autentik yang dlkembangkan? Adapun penelitian ini bertujuan untuk memperoleh: (a) seperangkat kompetensi dasar dan indikator yang secara integratif dapat diukur melalui a~esmen autentik, (b) deskripsi pengembangan rubrik model asesmen autentik dalam ,'.1
mengases kompetensi IPA secara terpadu, (c) deskrip~.,i mengenai keefektifan'
implementasi model asesmen autentik yang dikembangkan.
98 ........... 1
"-..:..
T
METO.DE PENELITIAN Penelitian inimenggunakan janis penelitian pengembangan' (Research
and De·velQpmen·t) yang terbagi ·ke dalam dua ta·hap··t ya·itu·: (1)' ·~ahap
·pengem~
bangan dan validasi model; dan (2) tahap uJi keefektifan danketerlaksanaan
·modeL Pada tahappertama menggunakan jenis pe·ne,Utian pengembangan dan tahap kedua menggunakan penelitian kuasi eksperimen dan deskriptif kuantitatif. QQj~k p~n~~tt·~n ·~n·i ~~~hp~g~m9~ng~n m9g~ .~.§.~~~. ~tAtE;nti~' Y~r~g
meliputi seluruh materi. pelajaran IPA SMP kelas VIII.
Ketepatan isi
(substansi)~
keterbacaan,
kemenarikan LTS, serta terpenuhinya
UJl'TAHA~l
Asesmen AbU (Ilmu fisika dan Evalu.8sil
. ·ktiteria
·~bagai
·herikut:
k1:8.e$.uaian·
antara komponen yang dinilai,. kesesuaian antara indikator dan tugas," serta struktur tugas daiam LTS. .
Terpenuhinya kriteria keterbacaan,
.pJITAHAPZ ·As.~S.mell Guru daQ
SisW8
-'----IRevisi-3 j.-
keses~ian s~bstansi, stroktur tugas,
dan lt~inbar observasi, seria tingkat
kesulitaii daft tiiigkat kepraktisaii dalam penggunaan model.
UnTAHAP3 Uji kelayakan Uji lapangap.
UJI VALIDASI Kelas Perlakuan Kelas kontrol
Tercapaianya tingkat penerimaan dan pemahaman guru- dan sis~ terhadap model yang dikembangkan
Terpenuhinya kriteria keefek-
tifan dan keierIaksanaan model yang dikembangkan
Gambar 2. Diagram alur uji model
-
".
..
£.
Sebagai subjek dasar, indikator
penelitiat'~
unluk memperoleh data mengenai kompetensi
dan materi-materi IPA yang diperlukan dalam penyusunan
lembar tugas siswa, yaitu peer group Bidang Pendidikan IPA sebanyak 6 6'rang dan Guru ·IPA yang tergabung dalam Instruktur MGMP IPA Subrayon I, II, IV dan XI SMPN Kota Bandar Lampung sebanyak 9.orang.
Untuk memperoleh data tentang' asesmen IPA yang telah dilakukan guru subjeknya adalah guru IPA SMPN di Subrayon I 'sampai' XII
wilayah Kota
Bandar Lampung. Adapun untuk me'mperoleh data mengenai perangkat instrumen dalam model asesmen autentik selama tahap uji coba, subjeknya, yaitu siswa kelas VIII dan guru IPA SMP di Banda;- Lampung. Untuk tahap uji coba ini dipilih SMPN 1, SMPN 12, dan SMPN 18. Bandar Lampung, jumlah 3 .
e..
ke'las dengan jumlah siswa 'sebanyak 116.. Untuk.memperoleh data mengenai
efe·ktivitas model asesmen autentik, digunakan subjek penelitian siswa kelas VIII di dua SMP .di Kota Bandar Lampung. Tekriik pemilihan sekolah untuk uji coba ditentukansecara purposif. Pengumpulan data profil pelaksanaan asesmen pembelajaran IPA yang
dUakukan di SMP selama ini dilakukan dengan teknik wa·wancara dengan siswa dan guru IPA SMP.Data 'indikator pencapaian.kompetensi dan materi'~materi IPA
yang perlu ditugaskan dan dinilai, teknik pengumpulan d.atanya menggunakan angket skala penting. Data validasi model,
pengu~pula~
datanya menggunakan
teknik rating kepada tiga orang rater berbeda dan independen satu sarna lain. Data uji efektivita's model dengan melihat efe'kpenerapan model dikumpulkan
dengan teknik angket dan tes. Data profit pelaksanaan asesmen hasil pembelajaranlPA sebagai hasil
wawancara dianalisis secara tematis sehingga menghasilkan gambaranmengenai profil' asesmen pembelajaran IPA di SMP. Data indikator pencapaian
kompetensi yang perlu diases dengan tugas yang harus dikerjakan siswa berdasarkan asesmen para pakar pendidikan fisika da·.n guru senior IPA diana-
lisis dengan kuantitatif deskriptif.$,uatu butir indikator dinyatakan merupakan suatu kebutuhan dan memiliki tingkat keteramatan. tinggi apabila lebih dari 2/3
100 - .. 1
(e6~7%)
reSpQ·n.gen menyatakan
CUKU·p
penting· sampat sangat pe·nting, Analisis
dilanjutkan dengan menilai materi yang sesuai' dengan indikatorpencapaian
KQmpetensl
ya~og
aJ
m_a.tef~.
dikatakan relevan atau sesuai dengan kompetensi yang' ingin diases; apabila ra.ta.~rata SkQf
seti.ap a.spek. a.sesm.e·o. m.em.perQleh.
m.in-im.aJ tiga... Oa.ta. ya.ng
diperoleh s'elama uji coba tahap kesatu, tahap kedua, dan tahap ketiga yang ~~f~~ ~t~ K~t!t~tif~~n~~i~i~ ~~nQ~n p~n<;f~k~~@n K~~tit~tif g~~~fiptif ~~h~n8Q~
diperoleh gambaran mengenai komponen model yang perlu direvisi atau dimo~ifil<~~t
a~~~ y~ns ~ip~rql~h ~~l~m~ t~h~p ~ji" v~U<;t~$.i m~~t· ~~~~mE;n y~nQ
berupa data kualitatif dianalisis dengan pendekatan· deskriptif kualitatif sehingga diperQleh gambaran. ffiengenai karakteristik· mQd.el as-asmen autentik yang dikembangkan. Data hasil pretest dan p9sttest yang diperoleh dalam uji efektivitasmQael dianalisis dengan statistik inferensiat.. HASIL PENELITIAN DAN PEMBAHASAN Guru IPA SMP di Kota Bandar Lampung s;elama ini dalam menil~i has~1 bel_aia~~ IPA- slswa. dJtu.nju.l<~k_~ln. ~eba.n.ya.k~ ..
56% respQn.d.en.
ql.en.ya.ta_k~a_n_
h.a_o.ya. m.e-
liputi asp~k kognitif, 42% s~dah mulai m~lakukan asesmen afektif dan psikomotQftk~._ Na.ffiu.tl demJk.la.n~ ie~a.n.y~.~ ..69o/Q fe~,pQn.d_e~. m.en_ya_ta~k.a.{1_ ti.d.a~k~
sepen.d.G.pat
apabila asesmen hasil bel.ajar IPA hanya. meliputi asesmen dalam aspek kognitif. ~~!~m lJ~ {~j~~n ~~k@t?h} m~t~ ~tp.~~j~r~n
IPAi
~~O/~ rfP-~Qng~n m~ny~t~~~n
belum melalkukan asesmen dalam aspek afektif,
dan 420/0 belum melakukan
~-~~~m~n ~~l~m ~·~p~k p:~ik9m~~~rikr
Berdasarkan hasil as·esmen para ahli dan guru ada enam kompetensi se-
~~g~i r~pr~~~n~~~i r~n~h k9Qni~ift ~f~lqift g~n p~ik~mQ~9r y~ng ·~
metQGQtQgiJ: sika'ldt dan nilal.. Untuk menGa·,aai ·kQmpetensi dt
atas, harus dipenuhi sejumlah indikator yang merefleksikan kompetensi tersebut
melalui penyajian angket -skala penttng yang diberikan kepada seju.mlah responden. Hasil angket skala· penting yang dianalis.is dengan menghitung per-
·s.entase jawaban re·pQoden terhadap pernyataan yang disajtkan..Kriteria yang 1.01. . .'. '-.. 1
digunakan adalah 66,7%, yaitu persentasekumulatif dari skala sangat panting (5), panting (4), dan cukup panting (3) pada suatu butir tertentu. Sesuai'dengan kriteria yang telaIl di·~etapkan, maka sejumlah indikator yang ditetapkan' sebagai indikator pencapaian kompetensi yang digunakan dalam lembar observasi. (LO). Secara keseluruhan persetujuan responden terhadap indikator yang diajukan cukup tinggi dan terdapat beberapa indikator yang memperoleh persetujuan
100% dari responden antara lain pada pencapaian kompetensi nilai ada 3 indikator dan pencapaian kompetensi metodologi ada 2 indikator. ·Hasil .angket skala pantingini juga menunjukkan adanya beberapa masukan dari responden untuk perbaikan rumu'san indikator.
Di bawahini disaJikan pengembangan dan' penerapan asesmen autentik bentuk tugas dengan langkah sebagai berikut.
1) Penyusunan. tugas: (a) mengidentifikasi dimensi' prod·uk, keterampilan proses, dan sikap IPA; (b) merancang tugas-tugas dan disusun dalam format lembar
tugas siswa (LTS); (c) menetapkan kriteria keberhasilan 2) Pe'nyus'unan rubrik (kriteria asesmen); (a) menetapkan dimensi diukur; (b)
definisi dan contoh yang merupakan penj-elasan mengenai setiap dimensi; (c) menetapkan
skala .yang
akan
digunakan
untuk
meniiai
dimensi;
(d)
menetapkan standar untuk setiap skala (deskripsi gradasi). Secara 'sederhana langkah-Ia'ngkah tertulis di atasdapat divisualisasikan dalam diagram alur seperti tercantum dalam Gam'bar 3.
IPA
Gambar 3. Diagram alur pengembangan asesmen autentik bentuk tugas
102 - .. 1.
L.TS seGara kQnte~~stuall yaitu dimutai de·ngan fe·oQ·mena yang bersentuhan langsung dengan permasalahan dan kehidupan sehari-hari seperti pembentukan
baY8.o.giJ.n s8.mpai. ke aJat-a.tal Qpt~k. sepet1i ka.ca.mata d.a.n. terQpQng.. M.a.terl-m.ateri . dalam LTS yang bersentuhan langsung dengan permasalahan 'dan kebutuhan
-hld.u.p seh.ari.-h.aJi. m.em.perQ·I.eh.pQfsi. yang leblh bs.o.ya.k.e.
PrQd.u~k_
ya.n.9
dJh.a.sU.k.a~n.
dalam penelitian pengembangan ini, yaitu model asesme·n autentik untuk
p~~~~~r~n lPA 4~ ~MP~
Pr~gY:k y~ng ~~~~~t~~n m~n~~t4P kT~ ~~n kQ~
Pads tahap pengembangan
tugas~tugas
siswa dirancang dan disusun· dalam
f~rm~~ LT~t y~nQ ~i~w~li ~~ng~n m~ngi~~ntifik~~i k9mpt;t~n~ IPA ~i~w~ c;!~n menetapkan kriteria keberhasilan dalam menyelesaikan tugas. . Pada masing-masing bTSl diawati dengan penyajian masatah atau persoalan, yang hasil akhir dari pemecahan masalah "atau parsoalan tersebut dapat didekati dengan ·pQla pemeGahan rasiQnal. dan bisa pula· didekati .dengan J)Qla pemecahan empiris. Untuk d'apat menyelesaikan secara rasion~1 "diperlukan kQmpetensi metQdQlQgi d.an aplikasi serta kQmpetensi- pemahaman kQnsep dan konseptualisasi. Demikianpula untuk. dapat menyelesaikan secara empiris dJ,aerlukan kQffipetensi metoQQIQgi dan a.plikasi serta kQmpetensi pemahaman konsep dan konseptualisasi. Selanjutnya hasil penyelesaian m~.salah atau ·~ersQatan
balk. seca.ra rasiQoal dan empiris dlpertemukan (dlbandingkan)
sehingga akhirnya diperoleh simpulan jawaban terhadap perniasalahan tersebut
yan.9 secara. tentatif merupakan pcaduk·IPA baru:.. Sesuai dengan langkah-Iangkah dalam melaksanakan penelitian dan ·~engemban.gan.
m.Qdel peo.eJ.i.ti.an ~esu.ai Gam.ba.c 3 ya.og d.iad.apta.si. d.aIl- ~a.U. a.n.d.
Borg (1979), uji coba dalam penelitian ini terdiri dari uji coba' model awal, uji coba
m.Qd.eJ.u.ta.m.a.;. d.a.n. uji cQba.m.Qd.el. Qpera.slQn.aJ.•. Uji. cQba. perta.m.a.
d.Ua.k.sa_n.a_k_a~n.
pada '. model awal oleh peer group (bidang pendidikan fisika dan evaluasi). ~~f~~~~fk~n ·h~~lt ~jl t~h~@ p~$Jn~i gH~·k~n~k~n r~¥t~-~ ~~n m~~tfH~~~~~
Perbaikan yang telah dilaksanakan pada uji tah..ap pertama, yaitu pada tujuan ·m~t~ p~t~j~r~n
tPA re1! $MPl
KQmpt;tE;n~~f y~ng h~rY~ g~~D~!i Jn~t~ri t~g~~ Y·~ng
perlu diberikan, dan LTS. Perbaikan-perbaikan yang· telah dilaksanakan pada.
1.Q3
- .. .•
i...
LTS diantaranya adalah: mempe~elas kor1teks; membuat· permasalahan menjadi lebih menantang untuk dikerjakan; prosedur dibuat lebih ringkas, jelas dan disusun sedem.ikian rupa sehingga berorientasi· pada menemukan· dan permasalahan bisa dijawab dari hasil melaksanakan prosedur kerja; penjelasan dilengkapi dengan gambar. Perbaikan pada setiap tahap uji coba secara rincidisajikan pada lampiran. Uji coba tahap kedua dilaksanakan terhadap model awat yang telah direvisi. Berdasarkan hasil waWancara, LTS dan LO dimodifikasi dan dikembangkan lebih lanjut. Hal-hal yang diperbaiki pada uji coba tahap dua antara lain sebagai berikut: perbaikan alat yang digunakan;· memperjelaslmenambahl mengurangi prosedurkerja;· memperjelas keterangan' garnbar; menyesuaikan waktu pengerjaan LTS, menggabungkanLTS yang topik utamanya sarna. Uji coba
tahap tiga, siswa dibagike dalam delapan kelompok.·· Setiap kelompok terdiri dari empat sampai lima orang. Selama penyelesaian..tugas berlangsung dilaku-
kan observasi pada aktivitas siswa meliputi tualisasi,apfikasi, metodologi,
pemahaman konsep, konsep-
sikap, dan nilai. Untuk
asesme~' autentik
siswa
.,'. o.e_ I h_d_ua orang guru, U·· k se Iama' '-k ,nt, dO _.lnl.al JI co.-b a d·,-I a·ksana..an ,rna _aI·1pe rtemu°
•
an.~
Setiap selesai satu pertemuan, siswa ditanya meng·ena·i hal-hal·· yang tidak
dipahami pada LT$.
Kepada siswa juga diminta ·saran-saran untuk perbaikan
LTS. Setelah menyelesaikan' lima buah .LTS dibagikan angket:: 'mengenai
tanggapan siswa terhadap implementasi asesmen autentik. Validitas yang tinggi dicapai apabifa ada· 'kesesuaian antara indikator dan komponen' yang dinilai, kesesuaian antara indikator dan tugas, dan struktur tugas. Indeks validitas dicari melalui korelasi antar rater (penilai), skor penilai 1
dikorelasikan denganskor dari penilai 2. Semakin tinggi nilai korelasi berarti semakin baik hasil asesmen. Estimasi reliabilitas
dilakukan melalui rating
(interater reliability), estimasi terhadap reliabilitas hasil rating dilakukan dengan memberikan rating ulang oleh seorang rater dan menghitung korelas i·. . . antara keduapemberi .rating tersebut. Dalam hal in'; febih ditekankan pada konsistensi r~
antar rater.
i·c
Tingginya koefisien reliabilitas rating' dapat diartikan bahwa
104
-... .•
f..
1.Q5
-
.
"'1..
memuat kolom-kolom untuk memberi kode atau tanda ce·ntang sesuai perilaku yang ditunjukkan siswa. Adapun rubrik (pedoman penskoran) merupakan lembaran skala penskoran ya.19 digunakan guru untuk menilai kompetensi siswa pada penerapan indikator-indikator dari serangkaian tugas. Secara garis 'besar, tugas yang harus dikerjakan adalah: (1) Tahap persiapan, (2) Merangkai alat, (3) Pengambilan data, (4) Kegiatan Akhir, dan (5) Laporan. Pada penerapan asesmen autentik, asesmen difokuskan pada kegiatan siswa dalam melakukan berbagai kegiatan dan penyelesaian tugas. yang tercantum dalam LTS. Pada saat seluruh siswa melakukan kegiatan, 'guru melakukan
pengamatan
terhadap
aktivitas
siswa
dengan
menggunakan
pedoman Lembar Observasi (LO). Dangan menggunakan' LO guru mengamati aktivitas siswa berdasarkan deskriptor-deskriptor yang nampak sebagaimana
ketentuan yang tercantum dalam LO. Tuntutan alat/bahan pad,a' LTS diupayakan yang mudah diperoleh dan terdapat di lin'gkung'an. siswa sehari-hari. Asesmen yang dilakukan pada saat berlangsungnyapenyelesaian tugas ternyata: dapat memacu siswa untuk bekerja lebih sungguh-sungguh, hal in·i terkait dengan pola penyampaiankrite~ia
asesmen sebelum penyampaian LTS'
kepada siswa.
Dalam merespon seb.uah masalah dalam.LTS siswa membuat jawabannya sendiri berdasarkan pengetahuan yang telah dipelajari dan yang dimiliki, dan bisa jugaberasal dari pengetahuan baru yang dimilikinya. Karena' tidak terdapat
jawaban yang disediakanuntuk masalah yang. diketengahkan tersebut, maka para siswa selalu dituntut untuk mampu mengeksplorasi semua kemampuan dan pengetahuan yang dimilikinya untuk menyelesaikan masalah tersebut. Hasil asesmenautentik dapat dinyatakan dengan grafik atau peta kompetensi (PK). Sepertidi bawah ini.
106 ,......... 1
Nama Siswa: AG
3SO+--------::;;lI~~----_...,~-
- + - Pemahaman Konsep
-'~.
1 ' S O + - - - - - - - - - - - -_ _
Aplikasi
1.00+--------------#-
"M€16Bqtagi
__tlE_Nilai Q.OO
------,-----,-------r-----..---
.f--0
LTS1
LlS2
LTS3
LlS5
Berdasarkan gambar tersebut dapat dijelaskan aspek-aspek kompetensi siswa secara individual pada masing-masing LTSdan kecenderungannya. . KE~IMPlJLAN QAN REKQMENtlA~
Berdasarkan
hasil
penelitian
dan
pembahasan,
Qt?-~~r~fl~ kE;~impl:lI~n p~n~liti~nt -~~~~g~i ~~rik4:lt~
dapat
dirumuskan
(1) m~~~ ~~~~~n ~~~~n~ik
yang dikembangkan dapat mengases kompete.8si siswa di dalam pembelajaran IPA see-ara °terpad.iJ meliputi aspek kQgnitif terdirt ata-s ~Qmpetensi pamahaman
konsep, konseptualisasi, dan aplikasi; aspek psikomotor terdiri atas kompetensi
metQQQIQgiiQan aspek afektif terdtri dart okQmpetens.i sikap dan ·nilaii (2.) PrQQllk model asesmen autentik yang dikembangkan terdiriatas perangkat Lembar Tugas Siswa (lTS}.l I-embar Qbservas.i (L..Q}t dan PedQman PeskQran (PP) valid untuk mengases kompetensi IPA siswa; (3) Pemberian tugas yang kontekstual dan dikemas dalam I-TS yang baik dan ·menarik dapat memaGU siswa belajar lebih sungguh-sungguh. . Serdasarkan kesimpulan t
dirumuskan rekQmendasi sebagai berikut (1)
dalam mengembangkan dan menerapkan model asesmen hasil belajar harus
benar-benar mamJJu mengukur secara terpadu terhadap okQmpetensi-kQffifJete.nsi yang dapat merepresentasikan keberhasilan
1.Q7
pembelajaran IPA; (2) untuk
--
o.
...i..
penerapan model asesmen autentik hendaknya guru harus terus be'flatih dalam kecermatan melakukan pengamatan; (3) perlu dilakukan penelitian lebih lanjut tentang model asesmen autentik ini terksit dengan penyempumaan perangkat instrumen asesmen dan penyempurnaan . melaksanakannya.
DAFTAR PUSTAKA Hinduan, Achmad. (Maret 1998). Kecenderungan pembelajaran fisika di SL TP dan SMU. Makalah disajikan dalam penataran PGSM di Ditjen Dikti Jakarta. Kementerian Pendidikan dan Kebudayaan. (2013). Materi PeJatihan Guru Implementasi Kurikulum 2013 SMPIMTs-IPA. Jakarta: Ke'mendikbud . Pandey, T. (1990). Authentic mathematics assessment. Practical Assessment, 2004 from Research & Evaluation, 2(1) Retrieval April 6, http://PAREonline.net/getvn.asp? Stiggins, L. (1994). Student centered classroom assessment. New"York: Maxwell Macmillan International . Rosidin, U~dang' (2011 ). Asesmen Otentik da/am Pembelajaran Sain$. Bandar Lampung: CV. ~ura Printing . Rosidin, Undang. (2007). "M'odel-Penilaian Otentik dalam Pembelajaran IPA Materi Fisika Sekolah Menengah Pertama." Disettasi. Yogyakarta: PPS UN\'
108
KUALITAS INSTRUMEN· PENILAIAN HASIL BELAJAR FISIKA 01 SMAN 1 DAN 2 TONDANO \j;j
Aswin H! MQndQlang Fakultas Matematika dan IImu Pengetahuan Alam, Universitas Negeri Manado di Tondano [email protected]
ABSTRAK Tujuan peneJitian ini adalah untuk mengetahui kualitas ins~rumen. penilaian hasil belajar fisika SMA. Obyek penelitian adalah soal-soal buatan guru bidang studi . fisika SMA Negeri 1 dan 2 Tondano. pada kelas X semester genap tahun ajatan 2012/2013. Metodologi penelitian. meliputi analisis kualitatif terhadap.. :konstruksi, materi, dan bahasa, s~rta' dati analisis kuantitatif terhadap validitas, .dan reliabilitas butir soal. Hasil penelitian menunjukkan' bahwa butir soal semester genap bidang studi Fisika Kelas X semes~er genap pada SMA Neg.~ri1. dan. 2 Tondano. dari segi koristuksi, materi dan bahasa dapat dikategorikan bail<. Pada SMA Negeri 1, dari sagi validitas terdapat 35% butir soal yang'valid dan sisanya tidak valid, dan dari segi reliabilitas tergolong. rendah deng~n koefisien reJiabilitas Cl,37. Untuk SMA Negeri 2 rondano, dar; segl validitas terdapat 23,3'3% butir soal yang va'lid dan sisanya tidak valid, dan darisegi reliabilitas tergolong sedang dengan koefisi~n reliabilitas 0,56. Kata kunci: kualitas instrumen, penilaian hasil belaja'f,. fisika·"SMA.
PENDAHULUAN Keterlaksanaan. Kurikulum. experinsial sangat tergantung .pada kompetensi
tenaga kependidikan. yait~ guru, diantaranya kompetensi profesional dan pedagogik. Salah satu tug as yang berkaitan dengan kompetensi profesional dan pedagogik adalah tugas menyeleng.garakan penilaian dan evaluasi proses dan hasil belajaryang terdiri dari: (1) memahami prin.sip~prinsip pen.ilaian
dan
evaluasi proses dan hasil bela~ar sesuai dengan karakteristik mata pelajaran yang diampu, (2) menentukan aspek-aspek proses dan hasil belajar yang
penting untuk dinilai dan dievaluasi sesuai dengan karakteristik mata
pelaj~ran
yang diampu, (3) menentukan ,prosedurpenilaian dan evaluasi proses dan hasil
belajar, (4) mengembangkan instrumen penilaian dan evaluasi proses dan hasil
109
...
..-- ....
f..
belajar.. (5). mengadministrasikan penilaian prq~es dan hasil oelajar se6ara berkesinambungan dengan menggunakan berbagai ·instrumen, (6) menganalisis hasil penelitian proses dan .hasil be·~aja·~ untuk berbagai tujuan, dan (7) melakukan evaluasi proses dan hasil belajar (Permen Diknas Nomor 16 tahun.
2007).. Berdasarkan apa yang dikemukakan di atas maka sistem penilaian proses dan h~~iI b~lajar siswa merupakan salah s~t~ komponen pentin.9 dalam upaya pencapaian standar penilaian pendidikan karena informasi yang didapat dari pr9~e~' p~nilaian
tidak ~aj~ p~nting.· ~n~uk m~ng.~~ahui pen~~p~i~n ~uj.~~n
pembelajaran dan hasil belajar siswa, tetapi juga untuk mengukur. efektifitas kegiatan pembelajaran. Hal tersebut lebih mempertegas. apa yang dimaksudkan dalam PP 19 tahun 2005 pasal 63 ayat 1 dan .pasal 64 ·ayat 1 dan ayat 2 yang
pads
i~tinya
menyatakan bahwa penilaian digunakan untuk menilai pencapaian
kompetensi peserta didik, bahan penyusunan I'sporan kemajuan hasil belajar, dan .m~mp£?ri;)~iki pr9~es Pt?mbelaj~r~n. K~~~I~han d~l~m m~ngembangk~n d~n menggunakan instrumen penilaian akan berakibat pada kesalahan dalam meng.inform~sikar,
komp~~ensi
p~s~~~
c;tidik;.
kesal~han
<;f~lam
menginformasikan kemajuan hasil belajar siswa, dan kesalahan dalam usaha memperbaiki proses pembelajaran. Oleh seba.b itu dalam mengembangkan dan nienggunakan instrumen penilaian hasil belajar siswa merupakan salah satu
tug.as guru yang. sang.at strateg.is dalam upaya paning.katan mutu pendidikan. Kegiatan menganalisis butir soal merupakan suatu kegiatan yang"harus dilakukan guru untuk meningkatkan m'utu soal.yang telah ditulis. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang. setiap penilaian (Nitko;.. 1996: 308). Tujuan penelaahan adalah untuk mengkaji dan rrienelaah setiap butir soal agar diperoleh soal yang oermutu s'ebelum soal digunakan. Oi samping itu~ tujuan analisis butir 50al juga untuk membantu meningkatkan kualitas tes melalui revisi atau membuang soal yang tidak efektifl serta untuk mengetahyi informasi
110
oiagnostik
apakah mereka $udah/belum hlemahami materi: yang
p~d~ siswa
telah diajarkan (Aiken, 1994: 63).
. Soal ya'ng bermutu adalah $oal yang dapat memberikan infQrma$i 'setepattepatnya sesuai dengan tujuannya diantaranya dapat menentukan peserta didik mana yang $udah
atau belum menguasai materi yang diajarkan' guru,. Dalam
melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara
kualitatif, dalam kaitandengan isi dan bentuknya, dan kuantitatif dalam' kaitan dengan ciri-ciri statistiknya (Anastasi dan Urb'ina,1997: 172) atau prosedur peningkatan secara jl)(jgm~nt' dan prQ$edur peningkatan secara empirik (Popha'm, 1995: 195). Analisis kualitatif mencakup· pertimbangan. validitas isi dan konstruk,
sedangkan
analisis
kuantitatif
mencakup
validitas
soal
dan
reliabilitasnya (BNSP, 2010).. Suatu
kenyataan
di
lapangan
khususnya
pada
guru-guru
yang
mengajarka'ri' mata pelajaran' fisika, baik di tingkat SMP maupun SMA, sering
mendapat
'h~mb~tan
pada penyusunan
~tau' pengembangan
instrumen
penilaian. Umumnya para guru tersebut 'cenderung hanya mengunakan soal-soal y~ng terdap~t
pada buku-buku
pelajar~n
yang berum tentu sesuai dengan
karakteristik siswa di sekolahnya. Juga' dari hasil pengamatan menunjukkan bahwa para guru tidak pernah melakukan analisis terhadap soal-soal yang digunakan, bahkan soal-soal tersebut sering digunakan berulang-ulang sehingga dapat dikatakan bahwa para guru sering mengabaikan prinsip-prinsip penilaian (Mondolang, 2011: 4). Oleh karena itu maka sangatlah perlu dilaksanakan penelitian mengenai instrumen penilaianhasil belajar siswa dengan tujuan untuk mengetahui kualitas instrumen penilaian hasil belajar fisika yang digunakan di SMA. Berdasarkan uraian di atas, maka' yang menjadi perma·salahan adalah bagaimanakah kualitas instrumen penilaian hasil belajar siswa yang dibuat oleh guru mata pelajaran fisika di SMA.
111 ..
I
METODOLOGI PENELIT'IAN' Metoda yang akan digunakan dalam penelitian ini adalah metode d.eskriptif Q~y~k
dalam pen~lit.ian ini ~d~lc,ih ~~m~a b~tir soal l)ji~n S~m~~t~r genap
bidang studi Fisika Kelas X SMA Negeri 1 dan 2 Tondano. Faktor-faktor yang dit~li~i
meliputi Anali~is K~alit~tif y~it.~ t.~I~~h in~trum~n y~ng: difqk~~k~n P~9~
aspek materi, kontruksi, dan bahasa, inst.rum·~n Yc,!ng m~lip~ti v~lidi~a~
dan
dan Analisis Kuantitatif
yaitu telaah
r~liabili~as.
Sumber data adalah Perangkat Soal Ulangan Semester Genap tahun aj~ran
2Q12/2Q13 y~ng. qig.~n~k~n di k~I~~ X $MA Neg.~ri 1 q~n2 Tqn~~nQ;·. Q~n
Skor Jawaban siswa dalam ulangan semester genap tahun ajaran 2012/2013.
HA$IL PENELITIAN Deskripsi
Has~IPene.litian
HasH penelitian menunJukkan bahwa da,lam
meng.embang.~an
penulisan diperolehdata sebagaimana pada Tabel 1 dan Grafik 1 berikut: Tabal 1. Jumlah butir soal berdasarkan kisi-kisi
No
Kompetens i. Da·sar
1
I II III IV V VI VII VIII IX . X
2 3 4
5 6 7
8 9 10
Dlfuar s'K1Ko Jumlah
p~nulisan ..
Jumlah Butir Soal SMA N· 1- Tonda·no:·, SMAN 2 Ton·da·no· 0 1
5 4 0
2
4
'2
0 3
1 4
5
0
4'
2 1
0 5
0 0 20
(;
30
Grafik 1. Kisi-kisi penulisan butir soaL
112
kisi-kisi
KD I
KD II
KD III
KD IV
KD V
KD VI KD VII KD VIII KD IX
KD X
Keterangan KDI KD II KD III KDIV KDV KDVI KD VII KD VIII KDIX KDX
: Menganalisi alat-alat optik secara kualitatifdan kuantitatif. : Menerapkan- alat-alat ,optik dalam kehidupan sehari-hari. : Menganalisis pengaruh kalor terhadap suatu zat. : Menerapkan asas bla:6k dalam pemecahan masalah. : Menganalisis cara perpindahan kalor. : Menggunakan alat ukur listrik. : Memformulasikan besaran-besaran listri-k-rangkain tertutu-p. : Mengidentifikasi pen~rapan listrik AC dan DC dalam kehidupan sehari-harL . . . : Mendeskripsikan spektrum gelombang elektromagnetik. : Menjelaskan aplikasi gelombang elektromagnetik pada-- kehidupan sehari-hari.
Berdasarkan Tabel 1 dan Grafik 1,diketahui bahwa soal~soal Ujian Akhir
Semester Genap pada SMAN 1, Tondano terdapat -2 KD yang tidak terwakili
dalam perangkat soal, yaitu KD- IV dan X, dan tidak terdistribusi secara proporsional. Sedangkan pada SMAN- 2 Tondano, terdapat 4 KD yang tidak terwakili dalam perangkat soal, yaitu KD I, IV, VI dan IX. Bahkan ditemukan 6 butir soal (20%) yang tidak be~asal dari KD yang seharusnya diuji.
Hasil Analisis Kualitatif Berdasarkan Analisis terhadap konstruksi, -materi dan- bahasa diperoleh
hasil sebagai berikut: . 1. Konstruksi
Darj- ~egi konstruksi, butir soal pada SMA Negeri 1 dan 2 Tondano sudah sesuai
dengan
kaidah
penulisan
50al
yang
baik
karena
batasan
perny~t~~n/j~w~t?~n ~~c;I~h j.elas;, k~limat ~Qal/p~rny~t~~n
m~ng.g.~n~k~n
kat~
perintah.
2. Materi Dari segi materi, butir soal pada SMA Negeri 1 Tondano sudah sesuai deng,an SKlKD yang. terdapat daJam kurikulum yang. berlaku. Pada SMA Neg,sri 2 Tondano ditemukan :20 % soal yang diluar SKlKD ka(ena menggunakan materi dari semester sebelumnya. 3. Bahasa Darj seg.i bahasa•. butir soal pada SMA Neg.eri. 1 dan 2 Tondano sudah sesuai dengan kaidah bahasa Indonesia yang bai'k karena menggunakan bahasa Ygng kQmYnik~tif
tid~k m~nggYngkgn
b~h~$~
y@ng berlakY
$~tem~at!tabYi
pilihan jawaban tidak mengulang kata/kelompok kata yang sarna, kecuali
merupakan satu kesatuan peng.ertian. Hasil Analisis Kuantitatif
1. Validitas . V~UQit~~
QtJtir
~Q~' p~d~ $MAN~g.eri
1
d,~n
$MA
N~g.eri
2
TQnq~nQ
ditunJukka·n pada Tabel 2 dan Ta.bel 3 berikut: T.~be' 2.V~Ugit~$
Qytir $Q~'
p~g~
SMA Neg~r, 1 T9nd~nQ Ttabel
Keterangan·
1',694
Valld'
1,694
Valid
Oj3e
1,694
Tidak Valid
0,76 -0,52 1,47 2,31 0,88 0,18
1,694
Tidak Valid Tidak Valid Tidak VaJid~~( Valid' '. Tidak Valid Tidak Valid Tid·a·k Va·lid· Valid Tidak Valid
No Item
Koefisien Korelasi
Thitung
l' 2 3 4
0',40' 0,36
2',42 2,12
o;oe 0,14 -0,09 0,26 0,38 0,16 0,03 0·,05 0,41 0,09
5
6 7
8 9 10· 11
12
0,,27 2,47 0,53
114
1,694 1,694 1,694 1,694 1,694 1·,694 1,~94
1,694
No Item
Koefisien Korelasi
1.3
. 0,02 0,18 0,36 0,09 0,40
. 14.. . 15 16 17 18 19 20
0',19 0,14 0,48 Jumlah Valid
Thitung
Ttabel
Keterangan
0,12 1,01 2,16 0,53 2,47 1,09 0,76 3,01
1,694 1,694 1',694
Tidak Va·lid Tidak Valid Valid Tidak Valid Valid Tidak Valid Tidak Valid Valid
1,694 1,694 1,694 1',694
1",694
7
TabeI3,'Validitas butir soal pada SMA Negeri 2 Tondano No
Item
1 2
3 4
5 6 7 8
9
thitung
ttabel
".
1,07 1,77 2,04 1,54 -0,24
1740 174.0 1740. 1740 1740' 1740·
Tiaak Valid Valid Valid Tidak Valid Tidak Valid Tidak Valid :
1,55
1740
2,57
1740
0,22
1740 .
Tidak Valid Valid Tidak Valid , Tidak Valid TidiJk Valid .
0,25
0,39 0,44 0,35 0,04 -0,06' . 0;35 0,53 0,05 0,00
0,15
-0,37
17
0,16
18 19
0,39,
-0,02 -0,41 1,18 -1,62 1,27 1,55 1,55 0,67 1,77
0,35
1,54
20
0,00
21
0,16 0,36 '
-0,02 0,65 1,61 ..
1740
O?49
2,31
1740
-0,10 0,28 0,29 0,35 0,35
115 ·f'
1740 1740 . '1740:
10 11 12 13 14 15 16
22 23
Keterangan
Koefisien Korelasi
1740 1740 1740
Tidak Valid' Tidak Valid
TidakValid Tidak Valid
1740
TidakValid
1740
Tidak Valid Valid Tidak Valid
1740 " 1740 1740 1740
Tidak Valid Tidak Valid Tidak Valid Valid
'.
No Item
Koefisien Korelasi
24
0,29
1,27"
174O
'25
0,35
1,55
1740
-
1',77
1740 1'740
4,23 1,70 0,72
1740 1740 1740
"
26
27
thitung
0,39 0,72 0,38 0,17 Jumlah Valid
28 29 30
ttabel
Keterangan Tidak Valid Tidak Valid Tidak Valid
VaHd' Valid Tidak Valid Tidak Valid
7
Pada SMA Negeri 1 T9ndano, butir soal yang valid sebanyak 35%
seda,ngkan pada SMA Negeri 2 Tondano sebanyak 43,33%. ~~ R~'~~~J,'l~~,
Suatu alat ukur yang baik apabila mempunyai tingkat reliabilitas yang baik jik~ ko~fi$i~n rt?li~bili~~~nya~nt.ara 0,70 - Ol~~ (0,70 <
r11
< O,~~).
Dari' hasii anaHsis, diperoleh koefisien realiabilitas sebagai· berikut: pada
SMA
N~gef.~,
1 Tqnq~no
~~p~~~r 01~7 (t~rg,9IQng 'r~nq,~,h.}i' d~n p~,q~
$MA· N~g.~f.',
2 sebesar 0,56 (tergolong sedang). ' KESIMPULAN 'DAN SARAN
Kesimpulan: 1. Se~~ra ~m~m ku~lita~ ~~~ h~~iI t;>~I~j.~r fisik~ bua~~n g.~r~ y~ng. <;Jig.un~k~n dalam ujian semester genap Kelas X pada SMA Negeri 1 dan SMA Negeri 2 Ton<;f~n9 K~l;>yp~ten
Minahasa masih rendah.
2. Dari analisis kualitatif; kontruksi, materi, dan bahasa, butir-butir soal pada SMA Neg,eri 1 Tondano tidak terdistribusi secara proposional sesuai deng,an
ruang lingkup SKlKD, sedangkan pada SMA Negeri 2 Tondano dariaspek materi! ditemukan butir soal yang diluar SKlKD.
', 3. Dari analisis kuantitatif, Koefi~ien reliabilitas untuk SMA Negeri 1 Tondano dikateg.orikah rendah dan untuk SMA Neg,er[.f 2 Tondano dikateg.orikan 1
sedang. 116 ..--.
'.
.
i..
.;,:..
1
S~r~n:
1. S~tiap
guru
yang
melaksanakan
penilaian
hasil
belajar
hendaknya
memperhatikan SKlKD pada semester, yang bersangkutan, agar $eluruft(~: SKlKD terwakili dalam perangkat soal. 2.
Setiap penyusun instrumen penilaian hasil belajar agar
$en~ntia$a
mengadakan analisis kualitatif dan kuantitatif agar diketahui kualitas butir-butir
$Oal. 3. Agar butir soal ujian tetap terandal dari semester ke semester, maka guru
bidang studi fisika perlu secara terU$ menerus menganalisis butir soal sehingga guru-guru fisika dapat memiliki bank .soal,fisika yang standar untuk setiap semester. 4. Kepada instansi yang juga bertanggung . jawab terhadap masalah evaluasi
pendidi'kan
disarankan
untuk
lebih'
memperhatikan
masalah-masalah
kompetensi profesional dan pedagogik g.uru, khususnya guru-guru bidang
,studi fisik~
d~lam mengkQntruksi
alat pengukuran ,dan penilaian pengajaran.
DAFTAR PU$TAKA Aiken, Lewis R. 1994. Psychological Testing and Assessment. Boston: Allyn and Bacon.
Anastasi, Anne dan Susan Urbina.1997. Psychological Testing. New Jersey: Prentice-Hall, Inc C,ompany.
BSNP,
2010,
Mater; Bimbingan
Teknis
KTSP Dan
80al Terstandar
20 10, Panduan Analisis Butir Soal. Jakarta: BNSP Peraturan Menteri Pendidikan Nasional Nomor 16 tahun 2007 Popham, W. James. 1995. Educational Evaluation. New York: MacMillan.
MQndolang, Aswin! H! 2011! Pembakuan Instrumen Penilaian Hasil Belajar Fisika SMA. Laporan Penelitian. Tondano: Lembaga Penelitian Unima.
Nitko, Anthony,'1996, Educational Assessment of Students, New Jersey: .Prentice-Hall, Inc Company.
117
PERBANDINGAN VALIDITAS KRITERIA TEST OF ENGLISH
,PROFICIENCY TERHADAP ITP-TOEFL (Estimasi Menggunakan Korelasi Biasa dengan "Korelas'i Kanonis) Heri Retnawati Pendidfkan M~atematika F'Mn:)"A 'Universitas Negeri" Yogyakarfa (retnawati [email protected])
ABSTRAK Salah s.ptu kriteria. pengembangan tes standar adalah validitas tas, baik berdasarkan isi, konstrak, maupun·kriteria. Untuk mengetahui validitas kriteria·:· dari suatu tes, skor tes peserta yang' telah menempuh tesini dikorelasikan ~engan skor tes peserta ketika menempuh tes yang lebih standar. Biasanya korelasi yang digun'a'kan ya'itu korelasi' biasa', yang mengorelasikan' sko-r tes yang dikembang~an· .dengan skor tes.. yang lebih standar. Alternatif metod~ an~lisis yang dapat digunakan yaitu metoda korelasi kanonis untuk mengetahui validitas kriteria subtes-suhtes yang dH<embangkan dengan subtes-subtes kriteria. Pad a . tulisan ini akan disajikan perbandingan korelasi biasa (bivariat) dan korelasi kanoni$ untuk mengetahui validitas kriteria Test of English Proficiency (TOEP) buatan Indonesia terhadap ITP-TOEFL. Pada korelasi bivariat, dikorelasi'kan skor TOEP dengan skor TOEFL, sedangkan pada korelasi multivariat, dikorelasikan skor Listening dan skorReading dari TOEP dengan skor Listening dan skor Reading dari TOEFL. Hasil analisis menunjukkan bahwa validitas kriteria ya,ng diestimasidengal) korelasi bivariat dan korelasi multivariat tidak menu'njukkan hasil dengan pola tertentu, namun keduanya cenderung' h'ampir sarna hasiln'ya, demikian pula kontribusinya.
Kata kunci: validitas kriteria, .korelasi bivariat, korelasi kanonis, TOEP, ·TOEFL
PENDAHULUAN Validitas merupakan hal' yang penting dalam menentukan kualitas tes. Ada berbagai pendapat mengenai validitas. Menurut American Educational Research
Association, American Psychological Association, and National Council on Measurement in Education (AERA, APA, and NCME) dalam Standards for Educational and Psychological Testing, validitas merujuk pada derajat dari fakta dan teori yang mendukung interpretasi skor tes, dan merlrpakan pertimbangan paling penting dalam pengembangan tes (1999). Ahli lain mengemukakan bahwa
118 -.-.... .•
..t..
validitas suatu alat ukur adalah sejauhmana alat ukur itu mampu mengukur apa yang seharusnya diukur (Nunnally, 1978, Allen & Yen, 1979: 97; Kerlinger, 1.986;
Syaifudin Azwar, 200\0: 45). Sementara itu, Linn·& Gronlund (1995) menjelaskan validitas mengacu pada kecukupan dan kelayakan interpretasi yang dibuat dari penilaian, berkenaan dengan penggunaan khusus. Pendapat ini diperkuat oleh Messick (1989) bahwa validitas merupakan kebijakan evaluatif yang terintegrasi tentang sejauhmana fakta empiris dan alasan teoretis mendukung kecu'kupan dan kesesuaian inferensi dan tindakan berdasarkan skortes. Berdasarkan beberapa
pendapat
tersebut,
dapat
disimpulkan
bahwa
validitas' ·akan
menunjukkan duku'ngan fakta empiris dan alasan teoretis" terhadap· terhadap interpretasi skor tes, dan terkait dengan kecermatanpengukuran. Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1) validitas kriteria (criterion-relatecl) , (2)validitas isi, dan (3) validitas" konstruk (Nunnally,. 1978, AHen &. Yen, 1979, Fernandes, 1984, Woolfolk & McCane, 1984, Kerlinger, 1986', dan Lawrence,
1994). Validitas ini' dapat diketahui
me·lalu·i.· fakta
keberadaaan vaJiditas. Sumber fakta validitas ·dapat dikelompokkan. menjadi isi tes, proses respons, struktur internal, hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan ta's (AERA, APA, and NCME, 1999; Cizek, et aI., 2008). Keberadaan validitas dari suatu perangkat tes i.ni dapat diketahui melalui analisis isi tas dan' anaJisis empiris dari skor tes data :respons butir (Lissitz & Samuelsen, 2007). Validitas isi
suatu
instrumen
adalah
sejauhmana
butir-butir dalam
instrumen itu mewakili komponen-komponen dalam keseluruhan k~wasan isi objek yanghendak diukur dan sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978; Fernandes, 1984). Sementara itu Lawrence (1994) menjelaskan bahwa validitas isi itu keterwakilan pertanyaa"n terhadap kemampuan khusus yang harus diukur. Berdasarkan. hal ini, dapat disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap domain yanghendak
diukur Lintuk
mengetahui
kemampuan yang hendak diukur.
119 ..
~
keterwakilan
instrumen
dengan
Validitas
konstruk adalah
validitas yang· menunjukkan
sejauhmana
instrumen mengungkap suatu kemampuan atau 'konstruk teoretis tertentu yang. hendek diukurn.ya (Nl.Innally, 1978, Fernandes, 1984). Prosedur validasi konstruk diawali dari suatu identifikasi
dan batasan mengenai variabel yang hendak
diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai variabel tersebut. Dari teari ini ditarik suatu konskuensi praktis mengenai hasil pengukuran pada kondisi tertentu, dan ko·nskuensi inilah yang akan diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu dianggap memiliki validitas konstruk':yang baik~' ,Pada ·tes prestasi belajar dan tes. kompetensi,. validitas merupakan syarat yang sangat di.perlukan dalam pengembanga'n tes. Menurut pe'ndapat Sireci yang didukung Lissitz & Samuelsen (2007), validasi tes yang dipergunakan dalam dU'nia pendidikan sebaiknya melibatkan analisis isi tas dan analisis empiris dari skor· tas dan data respons butir. Analisis isi· tes terkait dengall validitas isi yang selanjutnya diperlukan juga analisis empiris untuk nlengetahui validitas
konstruk. Kedua ·analisis ini dimaksudkan agar tes di dunia perldidikan nlemenuhi syarat tas yang standar. Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas prediktif dan validitas konkuren.
Fernandes (1984) mengatakan validitas
berdasarkan kriteria dimaksudkan untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang (predictive validity) atau mengestimasi kemamp'uan dengan alat ukur'lain dengan tenggang waktu yang hampir bersamaan (concurrent validity). Halsenada juga disampaikan . oleh Lawrence (1994) yang mengatakan bahwa tes dikatakan memiliki validitas prediktif bila tes itu mampu memprediksikan kemampuan yang akan datang. Dalam analisis validitas prediktif, performansi yang hendak diprediksikan disebut dengan kriteria. Sesar kecilnya harga estimasi validitas prediktif suatu instrumen digambarkan de.ngan koefisien korelasi antara prediktor d~ngan kriteria tersebut. Validitas kriteria diketahui dengan mengestimasi korelasi skor tas pe~erta .
'1'1\
dengarl skor kriteria. Korelasi ini dise.but dengan koefisien validitas (Linn &
120 ...-- .•
..t..
Gronlund, 1995), yang menyatakan derajat hubungan antara prediktor dengan kriteria. Korelasi antara prediktor dengan kriteri.~ dapat dinyatakan dengan dua jenis korelasi. Jika prediktor dan kriteriamerupakan variabel univariat,' maka digunakan korelasi bivariate Jika prediktor dan kriterianya merupakan vektor, yang tersusun dari variabelmultivariat, maka koefisien korelasi ditentukan dengan korelasi kanonis. Pada korelasi bivariat, untuk x variabel bebas atau variebel prediktor dan y variabel. terikat atau kriteria, dan keduanya merupakan nilai dalam skala interval at~u
rasio, maka koefisien korelasi p dapat dicari dengan mengestimasinya,
menggunakan formula A
_
Px,y -
NLXY- LXLY ~ln L x 2 - (L X) nn===L:::::::::::::y2=~(L=y=)
1
Kuadrat nilai korelasi ini diinterpretasikan sebagai sumbangan variabel X terhadap variabel Y atau yang sering disebut sebag'ai koefisien korelasi determinasi. Korelasi
kanonis' merupakan
korelasi
antara
dua
variable
yang
multidimensi (Weenink, 2003). Pada analisis korelasikanonis, dicari hubungan sepasang
transformasi
linear
dari
setiap
himpunan
variable
yang
memaksimumkan korelasi (Johnson & Wicern, 2002; Weenink, 2003; Hardon, Szedmak & Taylor, 2003). Misalkan vector acak multivariate dinyatakan dalam b·entuk (x,y). Diberikan sampel S=«X1,Y1), (X2,Y2), ... , (xn,Yn», dan digunakan Sx. untuk menyatakan (X1,X2, ... ,Xn) dan Sy untuk menyatakan (Y1,Y2, ... ,Yn). Dengan didefi~isikansuatu kC?ordinatbaru
dari x dengan memilih arah
Wx
dan
memroyeksikan x pada arah tersebut, dinyakan dengan
x ~ <wx,x). Demikian pula y dengan memilih
wy sehingga diperoleh sampal dengan
koordinat baru.Untuk x diperoleh Sx,w x
=« Wx,X1),( Wx,X2),.··,( wx,x n»
dan untuk y diperoleh
121 :r-:. 1
Sy,W
y
= ( Wy ,Y1),( Wy,.y2), .... ~(Wy'yn»)
Tahap awal dari korelasi kanonis· yakni memilih
Wx
dan
wy
sehingga
memaksimumkan korela'si antara kedua vector tersebut, yang dituHskan dengan-
Jika digunakan 18: [f(x 1 y)J untuk menyatakan ekspektasi empiris dari futlgsi f(x,y), maka
Korelasi kanonis dapat dinyatakan dengan 11"l<:1,X Vvx,'V
y
III<1..X 'Va;
,;,v
y
.
IE[("\V.:r~ x).("\V.y' , y)J.. . .
ViE[(-w
x,
x)2]IE[ (w;r, x)2]
1E[W~~xY/W.y.J
VJE[vv:rXX/Wx]E[ w~yy/wy] .
yang juga ekivalen dengan
P ===
Illc:tX vo,'x ,V'v'
y
W~)E[xy/]"Vy
viw~JE[xx/lw;r w~)E [yy/] w
--;:=========================:::::::::============ y
Matriks varians kovarians dinyatakan dengan C yang dituliskan dengan
122 .:..r:-.
1
Korelasi kanonis dituliskan'dengan I fY
W X CJ'X),T -vv y
rIl<:1.X wx~W'y
yang merupakan maksimum dari korelasi antara Wx dan Tantangan
dunia global yang
wyo
sarat dengan
muatan
persaingan
mengisyaratkan bahwaseseoran~ yang ingin berhasil dalam mengarungi dunia nyata perlu memiliki kemahiran yang diakui oleh dunia global. Terkait dengan hal ini, prestasi seseorang juga mesti diukur dengan cara dan hasil yang dapat diakui oleh dunia global. Mengikuti alur berpikir ini, kemahiran berbahasa Inggris siswa SMA juga p~rJu diukur dengancara dan hasil yang diakui tidak hanya di Indonesia
tetapi
di
mancanegara juga
.
sehingga
mereka
akan
memiliki
'
kesempatan untuk melanjutkan studidan/atau mencari kerja tidak hanya di .'negeri sendiri tetapi juga di mancanegara juga. Selama ini alat ukur yang digunakan untuk mendapatkan informasi tentang kemahiran berbahasa Inggris adalah tes bahasa Inggris yang dibuat oleh lembaga asing, misalnya TOEFL, TOEle, dan IELTS. Biaya untuk mengikuti tes :..
"
ini cukup mahal, tetapi memang 'hasilnya jelas diakui di semua Negara karena memang tes-tes tsb bersifat s~andar,' yang telah dikembangkan melalui serentetan kegiatan yang ditujukan untuk menjaga agar tes yang dihasilkan memenuhi kriteria tas yang baik. Jika setiap siswadi Indonesia' diharapkan mengikuti tes,
sebagian besar
dari mereka tidak akan mampu untuk
membiayainya. Jika Negara yang dibebani biaya tes tsb, jara,s kurang pas karena pada dasarnyaNegara bukan penanggung biaya k~giat~n seperti itu. Maka satu hal yang merupakan kekuarangan/kelemahan yang menjadi kendala untuk me,minta siswa mengikuti tes bahasa Inggris standar internasional adalah masalah kekurangan biaya. Kelemahan lain adafah ketergantun'gan dunia pendidika'h pada pihak asing. Hal in; befdampak buruk pada pembentukan 'keFiribadian Indonesia yang kokoh.
123
Untuk
mengatasi
kedua
kelemahan
tersebut:· di
atas,
Oit
PSMA
memandang perlu untuk segera mengembangkan tes profisiensi bahasa Inggris
(Test
of English
Proficiency
TOEP),
atau
yang'
mengukur
kemahiran
menggunakan bahasa Inggris dalam dunia nyata para lulusan SMA. Pada tahun 2007
tatah
dimulai
pengembangan
seperangkat
instrumen
pengukuran
kemahiran menggunakan bahasa Inggris tersebut, yang diianJutkan tahun 2008 dan 2009. Selama 3 tahun (2007-2009) telah dikembangkan 7 perangkat TOEP yang diberi nama TOEP 1, 2A, 28, 3A, 38, 4, dan 5 yang saling paralel. Tes Kemahiran Bahasa .Inggris (Test of English Proficiency, TOEp) yang merupakan tes· standar untuk mengukur kemahiran berbahasa Inggris siswa :.
:.
Sekolah Menengah Atas (SMA).
"
TOEP yang dikembangkan merupakan. tas
tertulis (paper and pencil test) pada tahun 2007 dan· 2008, dan selanjutnya dirintis tes untuk mengukur kemampuan Speaking dan Reading di tahun 2009 dan 2010. Penskoran tiapbutir dilakl.kan dengan sistem dikotomi, benar diberi s'kor 1 dan jika salah diberi skor .
.
o.
Tas ini khusus mengukur kemahiran siswa .
SMA dalam menggunakan bahasa Inggris, khususnya Reading dan Listening. Tes terdiri dari 100 butir soal, dengan rincian 50 butir tes Reading dan 50 butir tas Listening. Terkait dengan tes yang dikembangkan merupakan tes. standar .
. .
.
internasional, pada kegiatan ini juga dihasilkan petunjuk pelaksanaan TOEP. Hal . .
ini dima'ksudkan agar setiapTOEP yang dilaksanakan benar-benar merupakan tes yang terstandar. TOEP
dikembangkan
melalui
proses
menjabarkan
tuJuan
menjad~
indikator-indikator, .yang kemudian dikembangkan menjadi butir.. Ini berarti TOEP memenuhi
syarat tes
yang
baik ditinjau
dari' vaJiditas
isinya.
Validitas
kenampakan (face validity) untuk menjadi tes yang baik juga terpenuhi, mengingat pengembangan tes ini mulai dari menyusun butir sampai dengan perakitan tas melibatkan ahli yang terkait, baik dari perguruan tinggi maupun dari praktisi di lapangan (guru).Vafidit~.s lain yang digunakan yakni validitas criterion-
related evidence of validity jenis konkuren, yakni mengaitkan skor TOEP dengan skor TOEFL Institusional perolehan siswa.
. ··124.. ..........•
..
l..
Terka'it dengan adanya validitas criterion-related evidence of validity jenis konkuren yang dimiliki TOEP, skor perolehan siswa SMA yang menempuh TOEP dapat dikonversikan ke skor tes lain, misalnya TOEFL. Hasil konversi ini dapat ' dimanfaatkan siswa untuk keperluan pendaftaran/seleksi masuk ke perguruan tinggi dalam negeri atau ke dunia kerja. Mengingat TOEP ini bersertifikasi internasional, sertifikat yang, diperoleh siswa juga akan sangat bermanfaat bagi peserta didik bila akan melanjutkan ke Perguruan Tinggi atau memasuki'dunia kerja yang memerJukan kemahiran berbahas,a Inggris di luar negeri. Sehubungan dengan adanya dua janis korelasi yang dapat digunakan untuk mengetahui validitas kriteria, yaitu korelasi biasa dan korelasi kanonis, maka pada tulisan iniakan dibandingkan hasil kedua janis analisis ini untuk
mengetahui, validitas kriteria kemampuan bahasa In,ggris siswa SMA terhadap TOEFL. Pada korelasi biasa dikorelasikan skor TOEP terhadap skor TOEFL, dan
pada korelasi kanoni~ dikorelas~kan skor Listening dan Reading dari TOEP untuk dikorelasikan dengan skor Listening dan Reading dari TOEFL.
Tujuan Pada tulisan ini dibahas
perbanding~n
hasil korelasi biasa (bivariat) dan
korelasi kanonis untuk mengetahui validitas kriteria tes kemampuan bahasa Inggris siswa SMA (TOEP) de'ngan kriteria ITP-TOEFL., METODE
Untuk mengetahui validitas kriteria TOEP dengan kriteria TOEFL, dilakukan dengan pendekatan kuantitatif. Data yang digunakan merupakan data dokumetasi s'kor TOEP dan skor TOEFL pada 833 siswa SMA di Indonesia yang menempuh kedua tes tersebut. Distribusi peserta disajikan pada Tabel 1. Tes TOEFL dilakukan tidak terlalu jauh Jarak waktu pelaksanaannya dengan tes TOEP. Setelah keduanya diskor, kemudian dibuat diagram pencar untuk memprediksi adanya korelasi skor TOEP dengan skor TOEFL dan keberadaa;,q hubungan linear antara keduanya. Selanjutnya diestimasi korelasi biasa antara skor TOEP dengan skor TOEFL, dan korelasi kanonis antara skor
125 -,.1.
Listening dan skor Reading TOEP--d·engan:.skorListening dan skor Re.ading pada skorTOEFL. Tabel 1. Distribusi Peserta untuk Benchmarking TOEP dengan TOEFL
yogyak~~~,.
.Jawa
Feb 2008
1
'98·
Timur,
Desember
.2A
145
28
150
3A
115 .'
Sumate.ra ~arat, Riau Kepulauan, Jawa . Barat, Jawa Tengah, :.: Ka;limantan ·Timur, Papua .. B~n~~nt L~mpun, Yogyakarta, Jawa
38"
l' 39 .
"Timur, Bali, Sulawesi Utara S·umafera Barat,' ··Riau Kepufauan, .
Barat, OKI Jakarta Banten, Lampung, Yogyakarta, . Jaws Timur,. Bali,. Sulawesi Utara
.2008
.Jawa E3,arat, Jawa. Kalimantan Timur, Papua November 2009
4 5
Jawa
Tengah,'
Riau, 'S't,'awesi Tengah .BangkaBeJitung,. OK'
78 108
Jakarta,
Kalim·anta·n Sel·atan·
HASIL· Untuk mengetahui keberadaan hubungan linear
antara variabel prediktor
dengan variabel kriteria, dibuat diagram pencar (Scatter'Plol) terlebih dahulu. Pada model regresi tunggal, variabel prediktornya merupakan skor TOEP dan variabel kriterianya merupakan skor TOEFL. HasH menunjukkan bahwa terdapat
hubunga·n linear antara skor TOEPdengan.· skor TOEFL, tanpa melalui transforma·si tertentu. Demikian pula hubungan antara skor TOEP Listening dan s~or
TOEFL Listening dan 'hubungan antara skor TOEP Reading dan skor
"TOEFL Reading, yang menunjukkan adanya hubungan linear. Estimasi koreJasi dilakukan dengan bantuan SPSS, baik pada korelasi bivariat maupun korelasi .multivariat. Hasil':: estirnasi korelasi ·antara skor TO.EP dengan skor, TOEFL pada korelasi bivariat disajikan pada TabeJ 2.
126 ---., 1
;.r..
1
'. ~'. !
Tabel 2. HasilEstimasi Koefisien ,Korelasi Bivariat dan Kontribusinya Perangkat TOEP ,
p2
p
O,7S)43 0,7801 0,8349 0,7687
0,6309 0,6085 0,6970 28 0,5908 3A 0,7132 0,8445 38 0,6257 0,7910 4 0,6030 0,7765 5 Keterangan : Y skor TOEFL prediksi, X skor TOEP (regresi tunggal)
1.-
2A
Mencermati hasil estimasi bivariat tersebut, nampak bahwa pada ketujuh perangkat TOEP, korelasi bivariatnya dengan TOEF'L paling tinggi pada . perangkat 38, s.ebesar O.8~45" dengan koefisien determinasi 0,7132. Adapun yang terendah pada perangkat 3A, sebesar 0,7687 dengaq koefisien determinasi 0,5908. Dengan koefisien determinasi lebih dari 50%, dapat dikatakan bahwa perangkat TOEP memiliki lebih kemampuan 50% lebih dalam memrediksi variasi skorTOEFL. Hasil estimasi pada. koefisien korelasi kanonis disajikan pada Tabel 3 berikut. Tabel3. Hasil Estimasi KoefisienKanonis dan Kontribusinya Perangkat TOEP 1 2A
28 3A
38 4
5
p
0,789 0,797 . 0,819 0,778 0,861 0,785 0,730
p2 0,623 0,635 0,671 0,605 0,741 0,616 0,533
Hasil yang hampir sarna terjadi pada koefisien korelasi multivariat. Berdasarkan hasil estimasi korelasi kanonis tersebut, nampak bahwa pada ketujuh perangkat TOEP, korelasi skor Listening dan skor Reading dari TOEP dengan korelasi skor Listening dan skor Reading dari TOEFL paling tinggi pada perangkat 38, sebesar 0.8445, dengan koefisien determinasi 0,7132. Adapun
127
yang terendah pada perangkat 3A, s·ebesar 0,7687 dengan koefisien determinasi 0,5908. Dengan koefisien determinasi lebih dari 50%, dapat dikatakan bahwa perangkat TOEP memiliki lebih '~emampuan 50% lebih dalam memrediksi variasi skorTOEFL.
Kor. Kanonis II Kor. Bivariat
.t:,.,;;:,~:j=::::::=:~~::!,:~:~,,::::'
!
I
L 1
I
. . . . . ._
r<)'·'·i';"",~J=-~_._
0,5
0,6
0.8
0,7
Gambar 1. Korelasi TOEP dengan TOEFL
I
J
Jika dibandingkan hasH estimasi kedua korelasi tersebut menunjukkan ba·hwa hasil estimasi kedua jenis korelasi hampir sarna, qengan pola tidak tertentu.
Pada perangkat TOEP 1, 28, 38, 4 dan. 5, hasil dengan korelasi
bivariat Jebih tinggi dibandingkandengan korelasi kanonis, sedangkan pada perangkat TOEP 2A dan 3A, korelasi. kanonis lebih tinggi dibandingkan dengan korelasi bivariate Hasil perbandingan ini disajikan pada Gambar 1. Demikian pula. koefisien korelasi determinasi (,-2) yang. hasilnya disajJkan pada Gambar 2.
128
--.
.•
..
l.
Multivariat
II Bivariat
0,2
0,8
Gambar 2. Koefisien Determinasi TOEP terhadap TOEFL dengan Korela'si Bivariat. dan KorelasiKanonis KESIMPULAN DAN DISKUSI Berdasarkan hasil estimasi korelasi, pada korelasi bivariat dengan korelasi kanonis hasilnya hampir sarna. Hal ini menunjukkatl bahwa kOr)tribusi TOEP dalam menjelaska,n variasi TOE,FL, hasilnya tidak terlalu berbeda. Hal ini menunjukkan bahwaestimasi validitaskriteria 'dengan menggunakan korelasi bivariat maupun korelasi kanonis pada perangkat TOEP dengan kriteria TOEFL, hasilnya tidak terlalu berbeda. Hal terseblit dapat dipahami,' karena pada korelasi kanonis, ada prosedur pembobotan tertentu untuk memaksimumkan koefisien korelasi hasil estimasi. Pembobotan ini tentunya tidak sepenuhnya sesuai dengan model pembobotan pada skor TOEP dan skorTOEFL, sehingga hasilnya sedikit berbeda. Penelitian. lanjutan tentang penggunaan koefisien korelasikanonis lebih mendalam perlu di,lakukan, termasuk bagaimana pembobotan tiap subtesnya yang
didukung
dengan
dukungan
teori.
Penelitian
simulasi
dengan
memanfaatkan model data tertentu dengan mempertimbangkan variabel panjang tes, banyaknya variabel prediktor, muatandimensi data, dan pembobotan tiap subtes dapat dilakukan untuk menambah pengetahu~n te,ntanQ hal-hal yang mempengaruhi hasH estimasi validitas kriteria suatu perangkat tes.
129 --'.. 1
DAFTAR PUSTAKA Allen, M. J. & Yen, W. M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company. American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. (1999). Standards for educational and psychological testing. Washington, DC: American Psychological Association. Cizek, G.J., Rosenberg, S.L. & Koons, H.H. (2008). Source of validity evidence for educational and psychological test. Educational and Psychological Measurement, Vol. 6'8', pp'. 39'74,12'. Direktorat PSMA. 2007. Laporan Pengembangan Test of Englis Proficiency 2007'. Dit PSMA M·a·ndikd~fs·emen. Tidakdip·ubUka·si'kan-. Direktorat PSMA. 2008. Laporan Pengembangan Test of Englis Proficiency 2008'~ Dit PSMA· Mandikdasemen. Tldak dipublikasikan. Direktorat PSMA. 2009. Lapora',n Pengembangan Test 9f. Englis Proficiency 2009. Dit PSMA Mandikdasemen. Tidak dip'ublikasikan. Fernandes, H. J. X. (1984). Evaluation of educational program. Jakarta: N·ational Education Planning, Evaluating and Curriculum Development.
Hardoon, D.R., Szedmak, S. & Taylor, J.S. (2003). Canonical correlation ana.lysis; An overview with application' to learning nlethods. Technical report. Royal Holloway University of Lon.don. Johnson, R.A. & Wicern, D.W. (2002). Applied Multivariate ,Statistical Analysis. ' New Jersey: Prentice-Hallintemationalinc. Kerlinger,. F.N. (1986). Asas-asas penelitian ~ehavioral (T.erjemahan L.R. Simatupang). Yogyakarta: Gajahmada University Press. Kleinbau'm·; D.G dkk. (1998). Applied Regression Analysis and Other Multivariate Methods. Pacific Groove: Duxbury Press.
Lawrence, 'M.R. (1994). Question to ask when evaluating test. Eric Digest. Artike/~Diambiidari: http://www.ericfacilit.l.net!ericdigest/ed.385607.html tanggal 6 Januari 2007. Linn, R.L. & Gron,lu,nd, N.E. (1995). Measurement and assessment in teaching (ih ed.). EngJewoodCliffs, NJ: Prentice-Hall. .
Lissitz, W. & Samuelsen, K. (2007). Further ,clarificat,on~legarding-validity and education. Educational Researcher, Vol. 36, No.8, pp. 482-484.
130
-,
.•
..
i..
Messick, S. (198.9). Va,Hdity. Dalam R. L. ·Linn (Ed.), 'Educational measurement (3rd ed~, pp~ .13-1.03). New Yqrk: Macmillan,. Nunally, J. (1978). Psychometric theory (~ ed.) .. New yc,::-k: McGraw Hill.
Pedhazur, E.J. (1973). Multiple Regression in Behavioral Research. New York:. Holt, Rinehart and Winston. Syaifudin Azwar. (2000). Reliabilitas dan validitas (Edisi 4). Yogyakarta:' Pustaka. Pelajar. Walpole, R.E. dkk. (2002). Probability and Statistics for Engineers and Scientists. Upper Saddle River: Prentice-Hall. Weenink, D. (2003)., Canonical correlation analysis. IFA Proceedings University of Amstedam 25 (2003). 81-99. .. Woolfolk, A. ·E. & McCune, L. N.(1984). Educationarpsychology for teachers. : Englewood CUffs, NJ.: Prentice Hall, In·.~
....'
131 -. •• ...i...
ANALISIS VALIDASI SOAl PENILAIAt~ HASIL BELAJAR PADA.. PROGRAM PEMBELAJARAN 01 JURUSAN PENDIDIKAN IPS FKIP UNIVERSITAS LAMPUNG Edy Purnomo Jurusan Pendidikan IPS· FKIP UNILA (e-mail: [email protected].) Alamat: JI. Nangka Gg. Jahri Lk I Bandar Lampung HP 081369756640
ABSTRAK Kemampuan dosen membuat tes dalam proses pembelajaran .m~njadi sesuatu yang pentingdan menjadi suatu kompetensi yang harus dimiliki oleh dosen. Penelitia·nini bertujuah untuk mengungkap proses validasi soal. ujian' akhir semester yang dilakukan oleh dosen Jurusan Pendidikan IPS', FKIP UNILA dan menganalisis secara teoritis (kualitatif) kualitas soal ujian tersebut. Penelitian ini dengan melibatkan populasi sebanyak 44 orang dosen yang meng~jar bidang studi pada semester gasal 2012/2013. Data dikumpulkan menggunakan- tekni·k dokumen'fasi dan kuesioner, data yang terkumpul dianalisis secara deskriptif kuantitatif. Hasil penelitian menunjukka.n bahwa Data penelitian menunjukkan bahwa soal hasil belajar yang dibuat dosen 45,45% berbentuk soal uraian, 22,73% berbentuk pilihan jarnak, dan 31,82 kombinasi uraian dan pilihan jamak. Data penelitian jugamenunjukkan bahwa 47,73% dosen membuat kisi-kisi dan 53,27% tidak membuat, dan tidak jelas karena tidak rne·nunjukkan bukti 25%. Dalam hal kemutakhiran dalam pembuatan soal, 47,73% dosen membu.at soal baru untuk mengukur hasil belajar, 27,27% menggunakan soal lama, dan 25% menggunakan campuran soal baru dan lama. Teknik penilaianyang digunakan selain tes tertulis adalah: unjuk kerja sebesar 47,73%, tugas mandiri100%, tugas kelompok 40,91%, dan. penilaian produk sebesar 18,18%. Sebagian besar (84,09%) dosen tidak memperhitungkan tingkat berpikir (taksonomi Bloom) dalam penyusunan soal dan hanya 14,91% saja yang memperhitungkan tingkat berpikir dalam penyusunan soal. Lebih separuh (59,09°A» dosen melakukan telaah ulang pada soal-soal yang dibuat, selebihnya 40,91 % tidak melakukan telaah ulang.Telaah terhadap 50al hal yang penting karena merupakan validasi soaf agar soar yang dibuat memifiki kualitas yang baik.
Kata kunci: Tes Hasil Belajar, validasi, dan Kualitas Soal.
PENDAHULUAN Sering kali kita me(~dengar k'eluhan atau informasi dari pengguna tenaga kerja yang mengatakan bahwa banyak dijumpai lulusan perguruan tinggi yang
132
-.
"
..
£.
memiliki nitai atau indek presta..si· tinggi tetapi tidak sesuai dengan kemampuan atau kompetensi yang dimilikinya. Sebaliknya juga dijumpai keluhan dari para "'Iull:san perguruan tinggi tertentu yang menyatakan bahwa sangat sulit memperol~h
indeks prestasi tinggi, sehingga tidak dapat memenuhi syarat untuk meng-
ikuti seleksi penerimaan karyawan. Padahal menurut mereka kemampuan yang dimiliki tidak kalah atau bahkan lebih· unggul dibandingkan. denga~ lulusan perguruan tinggi lainnya. Mengapa fenomena tersebut dapat terjadi? Sehingga seolah-olah
tidak
ada
standarpenilaian
yang
dapat
digunakan
untuk
memberikan gambaran obyektif tentang kompetensi para lulusan perguruan tinggi. Banyak faktor yang berperan terhadap terjadinya fenomena tersebut. Salah satu faktor yang dapat dipastikan berperan dominan terjaqinya fenomena . tersebut adalah terksi.t denganmasalah penilaian hasH belajar mahasiswa, sehingga nilai yang diberikan mahasiswa tidak mencerminkan kompetensi yang sebenarnya. Indeks prestasi merupakan nilaiakhir yang menggambarkan tingkat.· kualitas hasil belajar mahasiswa. Nilai tersebut diperoleh berdasarkan hasil pengukuran. Untuk menentukan' nilai akhir yang mampu menunjukkan kriteria hasil belajar yang mendekati kondisi yang sesungguhnya diperlukan progam penilaian yang baik. Penilaian (asesmen)·didefinisikan sebagai proses pengumpulan informasi tentang kinerja peserta didik untuk digunakan sebagai dasar dalam membuat keputusan (Weeden,. At all, 2002). Untuk dapat melakukan ase~men
hasilbelajar m·ahasiswa
$ecara tepat diperlukan
seperangkat
instrumen tes hasil belajar yang berkualitas. Dengan instrumen yang berkualitas, maka dapat disajikan informasihasil pengukuran dengan tingkat
kesalahan
yang sekeci,l' mungkin sehingga .keputusan yang diambil bisa tepat (Djemari Mardapi, 2008: 5). Untuk membuat instrumen (soal) yang berku~litas memang tidaklah mudah karena banyak faktor yang ·mempengaruhinya, faktor utamanya adalah kemampuan dosen itu sendiri di samping fasilitas pendukung.
133 .•
f..
Menurut
Suryabrata (2005: 74), diperlukan sejumlah kemampuari.. yang harus dimiliki oleh dosen agar dapat membuat soal 'tes hasil belajar, yang baik,' antara lain: (1) penguasaan akan mata pengetahuan yang dites, (2) kesadaran akan tata nilai yang mendasari pendidikan, (3) pemahaman akan individu-individu yang dites,
(4) kemampuan membehasakan gagasan, (5) penguasaan akan teknik penulisan soal, dan (6) kesadaran akan kekuatan dan kelemahan dalam·. menulissoal. Kegiatan penilaian hasH belajar didahului dengan pengukuruan. Pengukuran pada ~asarnya merupakan kegiatan penentuan angka bagi suatu obyek secara
sistematik.
Penentuan
angka
inr
merupakan
usaha
untuk
menggambarkan karakteristik suatu obyek. Dalam menentukan karakteristik individu, pengu,kuran yang dilakukan .harus sedapat',
~ungkin
mengandung
kesalahan yang kecil (Mardapi, 2008). Untuk melakukan penilaian hasil belajar dapat ,dilakukan dengan berbagai cara atau teknik. Dalam Peraturan Menteri Pendiidikan Nasional nornor 20 tahun 2007 disebutkan bahwa teknik penilaian hasil belajar dapat berupa, tes, observasi, penuga.san, dan bentuk lain sesuai dengan' karakteristik kompetensi dan perkembangan' peserta didik~ Dalam kegiatan· pengu.kuran pada ranah kognitif dan psikomotor, alat yang digunakan yang biasa ·disebut dengan istilah
tas. Pengembangan tas hasil belajar dapat dilakukan "dengan langkahlangkah sebagai berikut: (1) pengembangan spesifikasi tes, (2) penulisan soal, (3) penelaahan soal, (4)perakitan soal (untuk uji coba), (5) uji coba tes, (6) anaJisis butir soal, (7) seleksi danperakitan soal. (8) pencetakaan soal, (9) administrasi tes bentuk akhir, dan (10) penyusunan skala, dan
norma.
(Suryabrata: 2005: 68).. Langkah selajutnya dalam proses pengukuran dan penilaian adalah penulisan soal tes hasil balajar.
Bentuk soal tes hasil belajar dapat berbentuk
uraian dan objektif. Agar soal tes memiliki kuaJitas perlu diperhatikan kaidah~ kaidah dalam penuli~a.n soal.Megurut Depdiknas (199'9), penulisan soal tes hasil
134
belajar perlu memperhatikan kaidah-kaldah yang menyangkut masalah materi, konstruksi, dan bahasa. Langkah panting selajutnya yang harus dilakukan adalah anai'~!$i~' kualitas perangkat soal teshasil belajar yang dapat dilakukan dengan dua cara yaitu analisis secara teoritik (kualitatif) dan analisis secara empiris (kuantitatif). Analisis secara teoritis adalah telaah soal yang difokuskan pada aspek materi, konstruksi, dan bahasa. Aspek materi berkaitan dengan substansi keilmuan yang ditanyakan serta ·tingkat berpikir yang terlibat, aspek konstruksi berkaitan dengan teknik
soal,
penulisan"
keko~unikatifan/k~jelasanhal
dan
aspek
bahasa
berkaitan
dengan
yang ditanyakan (Djemari Mardapi, 2004: 128 dan
Bahrul Hayat, 1995:5-6). Berdasarkan
urcdan-uraian
pada
kajian
pustaka . di
muka
dapat
dikemuka.kan bahwa untuk. qflpat membuat soal tas hasil belajar yang berkualitas
perlu memperhatikan kaidah-kaid~.h soal yang berkualitas, baik pad~ proses perencanaan maupun pada proses pengembangan dan penulisannya. . Berdasarkan uraian di atas, permasalahan yang akan dikaji dalam penelitian ini (1) bagaimanakah bentuk tes hasil belajar mahasisWa yang dibuat
oleh dosen Jurusan Pendidikan IPS FKIP UNILA?, (2) langkah-Iangkah apakah yang dilakukan oleh dosen Jurusan Pendidikan IPS FKIP UNILA dalam menyusun soal tes hasil belajarmahasiswa?, (3) bagaimanakah langkahlangkah yang dilakukan oleh dosen Jurusan Pendidikan IPS FKIP UNILA dalam proses validasi soal tes hasil belajar?, dan (4) bagaimanakah tingkat kualitas tas hasil belajar. buatan dosen Jurusan Pendidikan. IPS FKIP UNILA ditinjau dari
telaah teoritis (kualitatif)? METODE PENELITIAN PeneHtian ini dilaksanakan di Jurusan Pendidikan IPS FKIP UNILA dengan menggunakan teknik 5urvei terhadap objek dan subjek penelitian. Objek penelitian adalah kualitas 50al tes hasil belajar semester genap 2011/2012 untuk mata kuliah bidang studi. Populasi penelitian adalah para d05en Jurusan Pend.idikan IPS FKIP Uila yang mengajar pada semester genap 2011/2012 untuk
135
--
.•
..
t.
mata kuliah bidang studi sebanyak 44 orang'~ Pengumpulan data- menggunakan teknik
dokumentasi
dan
kuesioner.
Dokumentasi
digunakan
untuk
mengumpulkan naskah-naskah soal yang terdokumGn, '3edangkan kuesioner digunakan untuk menjaring data tentang langkah-Iangkah dalam pembuatan soal tes hasil belajar dan langkah-Iangkah dalam proses validasi soal yang akan diujikan. Data yang terkumpul dianalis'is secara deskriptif. AnaHsis difokuskan.pada pendeskripsian
dalam
bentuk
prosentase
tentang
langkah-Iangkah
yang
dilakukan oleh dosen pada proses perencanaan dan pengembangan soal·serta hasil telaah soal sec~ra teoretis (kualitatif). HASIL PENELITIAN DAN PEMBAHASAN Analisis data dilakukan secara desktip~if d~.ngan menggu~akan ~abel-tabel untuk penyajian data penelitian, teknik analisis. deskriptif ini digunakan untuk ..
menjel~skan
.
tentangbentuk soal yang dibuat, langkah-Iangkah dalam penyu.sun-
an soal, langkah-Iangkah dalam memvalidasi soal, dan kualitas soal berd~sarkan
tinjauan teoritis. Deskripsi terhadap hasil analisis tersebut adalah seperti berikut.
1. Sentuk 80al Bentuk 50al hasil belajar yang dikembangkan oleh dosen Jurusan Pendidikan IPS FKIP UNILA dapat dilihat pada tabel 1 berikut.
Tabel 1. Distribusi Frekuensi Bentuk Seal No
Jumlah
Bentuk Soal
Prosentase
20
45,45
' . 10
22,73
Kombinasi
14
31,82'
Jumlah
44
100
1
Uraian
2
Pilihan Jarnak
3
136
Untuk lebih jelasnya dapat d~gambarkan dalam gr~fik beikut. _. -.-.---------.------------------ -.--------------.--.------.----- -..- - -..-.. _. "'-'J
roo
~ Bentuk Soal
.1 I
~.
1
50 .00 ,
j
40.00
;
I I
_
45.4
1.---
30.00
I
-ri .,...-....----'
. . . /.
.~-,--"
-~ !! 20.00 r------_ I ...__/.. .- /
I
f
/ 10.00 Ij 0.00
f ...........-.----~
-t~----.....-------r--------t"
Uraian
j
IL_.
.
I
l~'
Pilihan Jarnak
Kombinasi
I
J
•
Gambar 1. Prosentase Sentuk soal yang dikembangkan
.2. Pemb'uatan Kisi-kisi dalam Persiapan Penyusunan 50al Pembuatan kisi-kisi sebelum me·mbuat soal adalah suatu hal yang panting dilakukan agar butir-butir soal yang dibuatsesuai dengan indikator-indikator.
kompetensi. Kesesuaian tersebut akan menjadikan 'soal yang dib,uat memiliki., , validitas yang baik. Berdasarkan ha.sil
p~nel.itian
menunjukkan bahwa tidak
semua dosen membuat kisi-kisi sebelum menyusun soal. Data tf?rsebut dapat dilin~tpada tabel
2 berikut.
Tabel2. Distribusi Frekuens.i Persiapan Penyusunan Soal No
Persiapan Penyusunan Soal
Jumlah
Prosentase
1
Membuat Kisi-kisi
21
47,73
2
Tidak membuat kisi-kisi
12
27,27
3
Tidak menanggapi (tidak ada bukti)
11
25,00
Jumlah
44
100,00
..-.- .•
..
L
Persiapan Penyusunan Soal
I::·~-- ~~.~
! I!
J
20.00 - ----.----
0.00 - t - = - - - r -
Membuat
I
Kisi-kis~
I
l
I
TIdak membuat
TIdak jelas
kisi-kisi ._.
. .
.__.
.......
. .__.
_
Gambar 2. Prosentase Pembuatan Kisi-kisi 3. Kemutakhiran dalam 'Pembuatan 80al Kemutakhiran dalam membuat soal ,penting dilakukan agar supaya mahasiswa
tidak
terfokus' pada
materi
yang. dlujikan' . pada
ujian-ujian .
"
sebelumnya. Kemutakhiran dalam pembuatan soa" untuk mengukur hasil belajar mahasiswa dapat dilihat des.kripsinya pada tabel 3 berikut. Taber 3. Distribusi Frekuensi Kemutakhiran Pembuatan Soal
No
Kemutakhiran Pembuatan Soal
Jumlah
Prosentase
1
Membuat soal baru
21
47,73
2
Menggunakan soal sebelumnya
12
27,27
3
Kombinasi soal baru dan lama
11
25,00
Jumlah
44
100,00
.0. r.
r·..· · · · · . _· __·· ·. · · · --_..·._· . ---·-· _·_·.-.-- --- --.--.--..-- - -.-.- - - --.-.-.-.--..--.-.----..-- --·-·-. . :.· · ·--··----·--..
I
·····-·---·-------·---·-·1
I
Kemutakhiran Pembuatan 50al
I
I
I
I
;
j
I
j
I 1~.36
I
Membuat Menggunakan soal baru . soal sebelumnya
'
I
. ,.__.....
l..._.~
_\o_ _••_ .
• _ _ .... _ ... _ .... _ _ ,....
....._
••_
....
..
Kombinasi baru dan lama ._ _...._
..........._
...
I I
Tidak menanggapi
J
. ... _ . , _ .. _ ..._
...._. _ _ ••
.. _ _ ......
...
..,
, _.. ,
Gambar 3. Prosentase Kemutakhiran dalam Pembuatan 80al
4. Teknik Penilaian yang Digunakan
Berbagai macam teknik penilaian dapat dilakukan secara·. komplementer (saling melengkapi) sesuai dengan komp~tensi yang diriilai, misalnya:
It'.j-
tes;
observasi, penugasan, proyek, produk, penilaian diri, dan penUaian antarteman
yang sesuai dengan karakteristik kompetensi dan tingkat perkembangan p'eserta didik. Teknik penilaian yang biasanya digunakan oleh dosen Jurusan IPS FKIP UNILA selain tes tertulis adalah dapat dilihat pada tabel4 berikut..
Tabel4. Teknik Penilaian yang Digunakan .':.....
Ju:h1Ja:h ':~~r$'~n'tase:. "
T~kn:ik 'P'enilaian
No
1 .,
2· 3
'.
Unjuk Kerja Penugasan mandiri Penugasan Kelompok Hasil kerja/produk
24
54,55
.44 18 8
100,00 40,91 18,18
f·--··-·-·---··--···-------
Teknik Penilaian
J
!
I J
I
!
I.. . I !
I! . i
~---_.---:100;00-----_._---100.00 -r ~//---80.00 J.//~
60.00./...40 00 · /' 20.00 - ///' . 0.00 ~----r------;-' Unjuk Kerja Penugasan Penugasan
~~ __ ~
-'18:1-8--~ ~ ----r'1
Hasil
~.~~~i~_~~k ~~~Prod~~.
Gambar 4. TeknikPeniiaian yang Digunakan
5. Memperhitungkan Tingkatan.Berpikir dalam Membuat Soal. Perilakukognitif adalah bentuk perilaku yang perlu .dimiliki siswa dalam mengenal dan memahami
ma~eri
atau bahan pelajaran. Jenis perilaku ini meliputi
enam tingkatan kemampuan berpikir, mulai yang paling rendah sampai tertinggi yaitu
kemampuan
mengingat,
memahami,
menerapkan,
menganalisis,
mensintesis, dana mengev.aluasi. Dleh kerena itu dalam pembuatan butir-butir soal, hendaknyamemperhatikan tingkatan tersebut sesuai dengan indikator tujuanpembelajaran.
~
.• 1...
Berdasarkan hasil penelitian---menunjukkan sabagian .besar dosen tidak memperhitungkan tingkatan berpikir dalam penyu8unan 80al yang ,dibuat yang dapat dilihat pada tab'el 5 berikut. . .Tabel 5. Memperhitungkan Tingkat Berpikir dalam Membuat Soal
::,t'ld :'~:';
'Memperh'itungkan Tingkaf Berpiklr'"
1
Memperhitungkan tingkatan berpikir
2
'.
, 'jlJ"mlah'
Persentas'e' .
7
15,91
Tidak mem,perhitungkan ti'ngkatan berpikir
37
84,09
Jumlah
44
100,00
r-c---·_---~~~;~;~;~-~;~~~--~~~~k~-;~~;~~~;--~---------1 I
~
I
100.00 -(.,/// I
t f
84.09-
,../',../'
i
_-:~~'.-:..
I /~/~
I
I
,
50.00
I
~
__,.__._.
II
---,-
Memperhitungkan
I
l_.. . .
f'
,l
I
r--/// ,
0.00 +;c_::.
I
I
. . . .__._. .
I
I
Tidak Memperhitungkan
_
I 2
Gambar 5. Memperhitungkan tingkat berpikir dalam membuat soal.
6. Validasi Teoritis Hasil penelitian tentang telaah soal yang dilakukan dosen sebagai bentuk
daJam melakukan vaJisasi dapat ditunjukkan pada tabel 6 berikut.
Tabel 6. Distribusi Frekuensi Validasi atau telaah Soal No
VafidasirTelaah 80al
Prosentase
1
Melakukan telaah soal
26
59,09
2
Tidak melakukan telaah soal
18
40,91
44
1'00,00
:
. Jutnlah ',.'1
'1
Jumlah
f-------··--·- -- .-. -- --. -----. -.....-.------.------.-.--------.--.. ----.--------.----- -"-"'1
I
I
I
60.00 T/ .//.,--' 40.00 ----.:~~.-.20.00 ,./"/'~
+.. . -.././.
j I
+// .
I
~~~;~ka~-'-
0.00
I
telaah soal
IL_.
..
.
.__.__...
_.~~
I
Tidak melakukan telaah soal
.__
I'
_
..
...
.__-1
Gambar 6. Validasi soal hasil belajar.
6.8 Aspek yang ditelaah pada·soal obyektif Aspek yang ditelaah ulang
Jumlah
Prosentase
42
95,45
38
86,36
18
40,91
4 Kejelasan' pokok soal
36
81,82
5 Kejelasan pilihan jawaban
34
77,27
6 Semua pilihan jawaban homagen
28
63,64
7 Ketidaktergantungan antar butir soal
16
36,36
12
27,27
No
Kesesuaian
butir
soal
dengan
1 kompetensi Ketepatan
alternatif
jawaban
yang
2 benar
3
Keterkaitan
pengecch
(distractor)
dengan pokok seal
satu deng~n lainnya
8 Keberfungsian gambar/grafik
. . .-_
-._._.~_
_---._._..__-._.__..-------_.._._ ---.------ ------..-.---- --.--
_.--- --_.__..-.. _.- _-.-._ -·.._·__..-· __ · . --·--1
I
Aspek yang Ditelaah 50al Obyektif
Keberfungsian gambar/grafik . Ketergantungan antarsoaf Homogin piJihan jawaban
!
Kejelasan pilihan jawaban
I I
Kejelasan pokok soal
I
Pengecoh Ketepatan Pilihan Jawaban
95.45
Kesesuaian Kompetensi L
.__.
,,
.--------.....---------.1
~--_.-_-
"
Gambar 6.a. Validasi Soal Obyektif
6.b Aspek yang Ditelaah Pada 50al Uraian No
Aspek yang ditelaah ulang
Jumlah
Prosentase
1 Kesesuaian butir dengan kompetensi
44
100,00
2 Kejelasan pertanyaan
38
86,36
3 Kejelasan petunjuk pengerjaan soal
14
. 31,82
4 Kejelasan pedoman penskoran
12
27,27
5 Kejelasan g.rafikltabel/gambarlpeta
8
18,18
6 Keterbacaan soal
12
27,27
!--------------.---.... ------- . . j f
I
I
---.--.-.-------~---------------------------~-------·------l
I
II
I I
Kejelasan pedoman penskoran
j
I
Kejelasan petunjuk pengerjaan soal
'
II'
Kejelasan pertanyaan
I
Keterbacaan soal Kejelasan grafik/tabeljgambarjpeta
f\
I 100.00 I
I
I
I
. but.r . dengan kompetensl. f Kesesualan , . !
I
I
Aspek yang Dltelaah 50al Uralan
L.._,_._.,__,__,_. _ . _~_. ._.__,_. .~ .
~\
~
r
. .
Gambar 6. Validasi Soal Uraian.
._.
I J
PEMBAHASAN HASIL P'ENELITIAN Berdasarkan deskripsi data tersebut di atas, maka pemb'ahasan untuk menjawab dan menjelaskan permasalahan dalam penelitian ini seperti berikut.' Data penelitian menunjukkan bahwa soal hasil belajar yang dibuat dosen 45,45% berbentuk soal uraian, 22,73% berbentuk pilihan jarnak, dan 31,82 kombinasi uraian dan pilihan Jarnak. Ini berarti penggunaan soal uraian lebih banyak digunakan untuk mengukur dan menilai ha5i1 belajar. Bentuk soal' uraian memiliki keterbatasan banyaknya jumlah butir soal yang dapat diujikan sehi.ngga '. validitasnya lebih rendah dibandingkan bentuk pilihan Jarnak. Demikian pula jika tidak dibuat pembobotan. dan rubrik yang jelas akan mengurangi obyektivitas hasil penilaian. '. .
'Dat~
penelitian ju.ga~. menunjukkan bahwa 47,73% dosen membuat kisi-kisi
dan 53,27% tidak membuat, dan tidak jelas karena tidak menunjukkan. bukti 25%. Pembuatan kisi-kisi sebelum membuat soal adalah sl),atu hal yang penting
dilakukan agar butir-butir soal yang dibuat sesuai dengan indikator-indikator kompetensi. Kesesuaian tersebut akan menjadikan soal yang dibuat memiliki validitas yang baik. Sehingga Jika kurang dari separuh dosen tidak membuat kisikisi, maka validitas soal yang dibuat masih diragukan, Dalam hal kemutakhiran dalam pembuatan soal, 47,73% dosen membuat soal baru untuk merigukur hasil belajar, 27,27% menggunakan 50al lama,dan 25% menggunakan campuran soal baru dan lama. Teknik penilaian yang digunakan selain tes tertulis adalah: unjuk kerja sebesar 47,73%, tugasmandiri 100%, tugas k~lompok 40,91%, dan penilaian produksebesar 18,18%. Penilaian selain tes tertulis sering disebut sebagai penilaian alternatif (alternative assessment), yaitu penilaian yang tidak saja didasarkan pada pengukuran pada salah satu kemampuan individu melainkan mengukur banyak aspek kemampuan individu. Dengan demikian, semakiri banyak dosen melakukan penilaian alternatif akan semakin banyak dan lengkap aspek kemampuan mahasiswa yang dinilai, s~hir].gga penilaiannya ,bersifat komperhensip.
143 .:"":',
'1
Sebagian basar (84,09%) d'osen tidak memperhitungkan tingkat berpikir (taksono~i
Bloom) dalam penyusunan soal dan hanya 14,91 % saja yang
memperhitungkan tingkat berpiKir dalam penyusunan soal. Perilaku kognit'lf adalah bentuk perilaku yang perlu dimiliki mahasiswadalam mengenal dan' memahami materi atau bahan pelajaran. Jenis perilaku ini meliputi enam tingkatan kemampuan berpikir, mulai yang paling rendah sampai tertinggi yaitu kemampuan mengingat, memahami, menerapkan, menganalisis, mensintesis,
mengevaluasi. Oleh kerena itu dalam pembuatanbutir-butir soal,
dana
,hendaknya ,memperhatikan tingkatan tersebut sesuai dengan kompetensi, yang akan dicapai., Lebih separuh (59,09%) dosen melakukan telaah ulang pada soal-,soal yang o'ibuat, selebihnya 40,91% tidak melakukan telaah ulang.Telaah terhadap soal hal yang pent'ing karena merupakan validasi soa,l agar soal yang dibuat memiliki kualitas yang baik. SIMPULAN DAN REKOMENDASI Simpulan penelitian ini: (1) alat ukur yang dibuat dosenuntuk menentukan penilaian hasil belajar p'aling, banyak dalam bentuk soal uraian, kemudian bentuk campura~ antara
bentuk uraian dan piJihan jarnak, dan piHhan jamak. (2) Dalam
mempersiapkan penyusunan soal lebih dari separuh dosen tidak. membuat kisikisi' (3) Sebagian besar dosen membuat soal baru untuk mengukur hasil belajar, selebihnya menggunakan soaL lama dan kombinasi soal baru dan lama. (4) Dasen melakukan penilaian alternatif di samping tas tertulis, bentuk p~nilaian alternatif terbanyak adalah tugas mandiri, penilaian unjuk kerja, tugas kelompok, dan hasil kerja. (5) Sabagian besar dosen tidak memperhitungkan tingkat berpikir dalam pembuatan soal sesuai dengan taksonomi Bloom. (6)lebih dar; separuh dosen melakukan telaatl soal sebelum digunakan, dan, yang terbanyak adalah telaah tentang kesesuaian antara butir soal dengan kompetensi yang akan diukur.
Berdasarkan simpulan hasil penelitian ini, maka direkomendasikan hal-hal berikut: J1) Perlu dilakukan workshop tentang penilaian hasil belajar secara 144 ~
... 1.
tuntas.; (2) Perlu diberlakukan standar dalam pembuatan soal sebagai alat ukur untuk menentukan nilai hasil belajar yang daJam bentuk indek prestasi. dan (3) 'Perlu disosialisasikan standar perHlaic:n sebagai salah satu standar pendidikan nasional agar para dosen mampu melakukan penilaian berbasis kompetensi.
DAFTAR PUSTAKA Bahrul Hayat, dkk. (1995). Petunjuk pelaksanaan pengembangan bank soal I wi/ayah. Jakarta: Pusat Pehelitian dan Pengembangan Sistem Pengujian Depdikbud. Djemari Mardapi. (20q8). Teknik penyusunan instromen tes dan non' lese YQgyakarla: Mitra Cendikia Press. Sumadi Suryabrata, A/at Ukur Psik%gis, Yogyakarta,
ev. ANDI OFFSET
Weeden, P.,Winter, J., & Broadfoot, P. (2002). Assessment: what's in it for . school? London and New York: Routledge Falmer. Peraturan Menter;· Pendidikan Nasional Republik Indonesia Nomor 20 Tahun . 2007, tentang Standar Penilaian Pendidikan. Jakarta: Dire,ktorat·Jenderal ManajemenPendidikan Dasar dan Menengah.
145
KARAKTERISTIK' RENYETARAAN SKOR (EQ.UA TING.) 'UNTUK DATA POLYTOM~S Risky Setiawan
ABSTRAK PenUa.ian merupakan komponen p~nting dalam sistem pendidikan, sebab hasil penilaian mencerminkan perkembangan atau kemajuan hasil pendidikan yang dapat dibandingkan dari waktu ke waktu, antara satu sekolahdengansekolah lainnya atau antarawilayah dengan wilayah lainnya. Proses penyamaan tingkat pe~capaian hasil pendidikan aritara sekolah ata·u antara wilayah dalam teari pengukuran disebut equating atau pe~y~taraan. Ditinjau dari cakupannya, p~.nH~i~n t~rq(r~ ~t~~ p~nH~i~n y~ng p~r~if~t m~krQ q~n p~nH~l~n y~ng. R~r~if~t mikro. Penilaian yang bersifat makro cenderurJQ menggunakan sampel untuk menelaah suatu program dan dampciknya, program yang dimaksud yaitu progra·rrJ pendidikan. Rrogram pendid.ikan adalah program. yang direncanaka.n. untuk memperbaiki kualitas dalam bidang pend.idikan. Penilaian yang bersifat mikro digunakan di tingkat kelas, yang bertujuan untuk mengetahui capaian hasil belajar, khususnya untuk mengetahui capaian hasil belajar si·swa. Sasarannya yaitu program' pembelajaran di ·kefas denganpenanggungjawab .pengajar. ~Aetode' penelitian partisipatoris den'gan menggunakan data" Kuesioner tentang p.elaksariaan Ujian Nasional. Responden terdiri dari dua kelompok yaitu Kelompok A dengan jumlah 449 respon.den dan kelompok B dengan jumlah 502 r~~RQnq~n. a~rH~~t
fni
~q~f~h pqPPf1.r R~g'~im~n~ m~ny~t~r~k~n p~tir p~r~~m~
dengan metode jangkar (anchor) seperangkat instrumen berupa Kuesioner dengan 35 butir soal dan 6 butir bersama. Kemudian dengan menggunakan pJogram E?ABSCALE akan diestimasi asing-masing kemampuan peserta serta karakteristik butir, setelah itu baru butir bersama di equ~tingkan dengan menggunakan program IRTEQ. Hasil penelitian yang didapatkan yaitu terdapat perbedaan antara pe'nggunaan metode Linking tas dengan Metode Haebara (0,592) menghasilkan Value Mean-Sigma yang lebih besar daripada yang menggunakan metoda Stockirlg & Lord (0,00213). Dengan demikian Equating dan Linking lebih efektif dan optimum apabila menggunakan metode Haebara. Hasil yang diperoleh bahwa butir tes bersama akan meningkatkan daya beda p~?~rt~ ~~rt~ ~k~n m~n~m,p~h tingk~t k~~~Ht~n (p~r~m~t~r Q). ~~h~ngg~ ~q~nY~ butir bersama akan cO'cok dan baik untuk menyetarakan 2 buah tes yang berbeda pada kemampuan theta yang berbeda pula. Kata'>Kunci : equating, po.lyto.mus, gra.de.d data, kuesio.ner
-,
. ".
146, ..
L
"T'
CHARACTERISTICS SCORE EQUATING
FOR OATA POLYTOMUS
By: Risky Setiawan ABSTRACT Assessment is an important component in the education system, because· the assessment results reflect the development or progress of educational outcqmes that cah b.e compared over time, from one school to another school or between regions with other regions. Equalization process level educational achievement between 'schools or betwe~n region·s within the measurement theory called equating or equivalency. In terms of scope, assessment consists of a macro assessment and appraisal 'micro programs. Assessment macro tends to use.the samples to examine the program and its impact, the program is the educational program. Education program is a planned program to improve quality in education. .Microeconomic assessment used at the class level, which aims to. determine the achievement of learning outcomes, espe9ially to determine the achievement of student learning outcomes. The goal of learning programs 1ri the classroom with the teacher in. charge. Particip'atory research methods .t~y using data .about the implementation of the National Examination Questionnaire. Respondents consisted of two groups: group A with group B 449 respondents and the numper of 502 respondf:3nts. Here is how to balance the grain Papper along with methods of anchor (anchor) set of instruments in the form of questionnaire with 35 items and 6 eggs together. Then by using the program will be estimated PARSCALEforeign participants as well as their ability grain characteristics, after which the new item. together in equatingkan using IRTEQ program. The results obtained that' there is a difference between the use of the method by method Haebara Linking test (0.592) produces Mean-Sigma Value greaterthan that using the Stocking and Lorq (0.00213). Equating and thus more effective and optimum Linking an Haebara method. The results obtained with the test items that will enhance .the participants vary and will increase the level of difficulty (b parameter). So the item will fit together well to equalize and 2 pieces of different t~sts on the ability of different theta.
Keywords: equating} polytomus, graded the data, the questionnaire
PENDAHULUAN Penilaian merupakan komponen penting dalam sistem pendidikan, sebab hasH penilaian mencerminkan perkembangan atau kemajuan hasil pendidikan
yang!';' dapat dlbandingkan dari waktu ke waktu antara satu sekolah dengan J
sekolah
lainnya
atau' antara
wHayah
147
dengan
wilayah
lainnya.
Proses
penyamaan tingkat penca.paian hasil p.endidikan antara ·se.ko.lah atau antara wilayah. dalam teori pengukuran disebut equating atau penyetqraan. Ditinjau dari cakupannya, penilaian terdiri atas penilaian yang bersifat makro dan penilaian yang bersifat mikro. Penilaian yang bersifat makro cenderung
menggunakan
samp.el
untuk
menelaah
suatu
pro.gram
dan
dampaknya, program yang dimaksud yaitu program pendidikan. Program pe.ndidikan adalah program yang direncanakan untuk memperb.aiki kualitas dalam bidang pendidikan. Penilaian yang bersifat mikro digunakan .di tingkat kelas, yang bert~juan u.ntuk mengetahui ca.paian hasil be·lajar, khususnya untuk mengetahui
capaian' hasil
belajar
siswa.
Sasarannya
yaitu
program
p.embelajaran di kelas dengan penanggungjawab pengajar. Berikut ini adalah Paper bagaimana menyetarakan butir
bers.~ma
dengan
metode jangkar s~perangkat alat las berupa Kues'ioner dengan 35 butir soal dan 6 butir bersama. Kemudian dengan menggunakan pro.gram 'PARSCALE akan diestimasi a~ing-rnasi.ng kemampuan peserta serta karakteristik butir, setelah itu
baru butirbersama di equatingkan dengan menggunakan program IRTEQ.
METO.DE eEN.YETARAAN TES (TEST EQUATING). Naga (1992: 24) men.yatakan bahwa sekor tes sebagai hasilokoreksi dari setiap butir yang dikerjakan pe.serta tes yang menamp.ilkan jawaban benar atau
salah dan membedakan menjadi dua, yaitu: 1) sekor tu·nggal·yaitu sakor satu butir seb.agai jawaban dari. satu peserta tes; dan 2). se.kor ko.mposit yaitu. gabungan dari sakor tunggal. Barnard (1996: 16) menyatakan bahwa tidak ada definisi penyetaraan tes yang dapat diterima secara universal. eenyetaraan ole.h Peterson, Kolen dan Hover (1989: 221) didefinisikan sebagai proses yang
digunakan
untuk
me.mastikan
saker-saker
yang
dihasilkan
dari
pengadministrasian tes-tes dapat digunakan secara bergantian dan Crocker dan Aigina (1986: 457), penyetaraan didefinisikan sebagai suatu proses untuk 0
,.'
menetapkan sekor-sekor equivalen pada dua instrumen. Penyetaraan sekor adalah suatu prosedur empiris yang diperlukan
- .. o.
i..
148.
untu·k mentran·sformasi se·kor
suatu perangkat tes ke sekor perangkat tes yang lain. Karena merupakan prosedur empiris maka penyetaraan sekor didasarkan pada data sekor teSt Membuat 80al yang setara dal.am dua ·J~ua." paket atau lebih, tentunya tidak· mudah atau bahkan tidak mungkin, karena pasti ada perbedaannya. Hal tersebut disebabkan karena hampir tidak mungkin menyusun multi paket tes yang benar-benar paralel (Petersen, Kalen,
& Hoover, 1989). Meskipun
penyusun tes menggunakan spesifikasi tes yang sarna dalam menulis itemitemnya dan hanya merubahangka, tidak ada jaminan bahwa· tingkat kesukaran item-item tersebut akan sarna. Apalagi kalau yang berbeda_adalah kata' kunci
dan isi dari pilihan jawaban. Menurut Angoff (1971) dan Kolen (1988) seperti yang dikutip dalam Hambleton (1991), metoda penyetaraan dibagi menjadi 2 kategori, yaitu: 1) .penyetaraan ekipersentil, dan 2) penyetaraan linear (linear
., ,
equating).
ITEM
CATEGORIES
ITEM
-,
1
·2
3
4
24 4.8
'·125 24.9
324 64.5
FREQUENT PERCENTAGE
29 5.8
147 29.3
84
16.7
213 42.4
58 11.6
PERCENTAGE
81 16.1
70
196 13.9 . 39
155 30.9
54 10.8
76 15.1
308 61.'4
64 12.7
0025
FREQUENT PERCENTAGE
25
95
5.6
21.3
306· 68.5-
21 4.7
FREQUENT PERCENTAGE
124· 27.7.
87 19.5
185 41.4
51 11.4
FREQUENT
PERCENTAGE
61 13.6
96
154
21.5
34.5
136 30.4
FREQUENT PERCENTAGE
49
73
244
81
11
16.3
54.6
18.1
52
88
237
70
11.6
19.7
53
15.7
73
61
253
60
16.3
13.6
56.6
.. 13.4
0005
55
58
338
51
11
11.6
67.3
10.2
FREQUENT PERCENTAGE 0006
0033
FREQUENT PERCENTAGE
4
0004
0023
FREQUENT PERCENTAGE
3 '.'-
0003
0013 FREQUENT
2
0002
0010
FREQUENT' PERCENTAGE
1
0001
0003
FREQUENT PE;RCENTAGE
CATEGORIES
78
93
296
35
15.5
18.5
59
7
FREQUENT PERCENTAGE
Frekuensi dan persentase pemilihan altematifjawaban butir bersama.
149
· Diatas adalah rekap' dari fre.ku.e.nsi.· se.rta p.ersentase. p.e,milihan
d.ata
Graded pada 2 tas yang berbeda tetapi memiliki 6 butir bersama.
Kate.gari pertama ini merupdkan penyempurnaan sakor dengan melakukan perbandin.g·an anta~a. sekor tes X dan Y menjadi ekuivalen apabila urutan persen rang king masing-masing grou·p a·dalah sa·m·a. Selanjutnya untuk penyetara·an
skor .dalam 2 tas yang berbeda, maka kedua tas tesebut harus diberikan pada kelompok examine yang sarna. Selanjutnya pada kategori kedua, diasumsikan
bahwa sakor x pada test X dan sekor y pada test Y mempunyai hubungan yang searahlsegaris (linearly related).. Menu·rut Tumilisar (20·06), metoda· penyetaraa·n
adalah cara-cara mencari hubungan penyetaraan dua sakor tes .dari dua in·stru.menpenelitian yang berbeda
de~gan menggunakan
statistik tertentu, dan
pengumpuland'atanya dilakukan dengan desain pengumpulan data tertentu.
Meto.de penyetaraa.n: ekipersentU dibag.i. du.a, yaitu: Metode penyetara'an ekipersentil berantai adalah cara mencari ekivalensi
ekipersentil dua sekor tes dari dua instrumen penelitian yang pengumpulan
datan~'a
berbeda,
dilakukan dengan desain. nonekivalen tes jangkar dan tes
jangkarnya merupakan tes jangkar internal dengan menggunakan statistik tertentu. Ekivalensi ekipersentil dihitung'dengan metode penyetaraan ekipersentil
langs·ung secara terpisah pada 'sakor tes ke.dua instrumen, masing-masing terhadap tes jangkarnya, tanpa menggunakan populasi sintetik. M·etode p.enyetaraa.n e.kipersentil estimasi fre·kuensi, adalah cara me·ncari. ekivalensi persentil dua sekor tes dari dua instrumen penelitian yang berbeda
dengan. menggunakan statistik tertentu, dan pengumpulan datanya dilakukan dengan desainnonekivalen tes jangkar dan tes jangkarnya merupakan tes jangkar internal.Ekivale~si ekipersentil dihitung dengan mengestimasi. distribusi ku~ulatif dua
sekor tes masing-masing terhadap tes jangkarnya, dengan
menggunakan populasi sintetik. Proses penyetaraan dari beberapa perangkat tes (equating) dapat dilakukan
dengan
dua
cara,
yaitu
penyetaraan
s~ca.r~
horizQ.ntal dan
penyetaraan secara vertikal. Proses penyetaraan yang diperoleh dari dua
150 --.. 1
perang.kat tes yang berbeda tetapi meng~kur hal yang sarna dinamakan penyetaraan horizonta·L Adapun proses pen·yetaraan d~ri dua kelompok peserta tes yang berbeda dalam jenjang/tingkat pendidikannya, namun diberi perangkat soal'yang sarna dinamakan penyetaraan vertikal (9rocker & Algina, 1986). Pada dasarnya penyetaraan (equating) bertujuan untuk menyetarakan sekor dengan cara membandingkan sakor yang diperoleh dari 'mengerjakan perangkat tas yang satu dengan. sakor yang diperoleh dari mengerjakan perangkat tes lainnya yang dilakukan melaluiproses penyetaraan sekor pada kedua perangkat tas tersebut (Hambleton & Swaminthan, 1991). MenurutZhu (1998), sakor-sekor pada tes A dan tes 8 ·dapat· di'setarakan jika memenuhi empat syarat, yaitu: 1) mengukur kemampuan atau karakteristik, yang sarna. Sehingga tes-tes yang disusun dari kisi-kisi yang berbeda' tidak dapat disetarakan;.. 2)' setelah pe'nyetaraan, distribusi frekuensi' se.kor . pada tes A harus ·sama seperti .distribusi frekuensi sekor pada te5:'8, .seh.ingga sakor padates A dan tes B dapat saling dipertukarkan setelah penyetaraan; 3) penyetaraan tes harus bebas dari data atau pekerjaan peserta tes dalam proses penyetaraan" dan konversi yang berasal dari penyetaraan harus berlaku bagi semua situasi yang serupa; dan 4) transformasinya harus sarna tanpa memperhatikan tes mana yang digunakan sebagai dasar atau referensi konversi, artinya interpretasi seker harus sarna baik penyetaraan dari tes A ke tes B atau dari tes B ke tes A. Lord (1980) mengemukakan gagasan atau ide penyetaraan dalam beberapa implikasi, yaitu: 1) penguku'ran tes dengan sifat yang berbeda tidak dapat disetarakan; 2) saker mentah pada tes yang konsisten tidak sarna, tidak dapat dilakukan. proses penyetaraan; 3) sekor mentah pada tes dengan kesukaran yang: bervariasi tidak dapat disetarakan karena·
tes tjdak akan
konsisten sarna pada tingkat kesukaran yang sarna; 4) kekeliruan atau kesalahan sakor pada tes atau paket A dan B tidakdapat disetarakan kecuali jika kedua t~s tersebut benar-benar paralel; dan 5) tes yang sempurna reliabilitasnya dapat dilakukan peQ,yetaraan~
151 .......... 1
,
f?e~nye.taraa.n
dilakukan d.engan. cara·-m.s·ngkonversi.kan. satu paket ke. paket
yang lain, dari paket yang mengukur kemampuan yang sarna. Penyetaraan.. perangkat tas merupakan. pembuatan sejumlah keputusan dari sakor yang diperoleh dari sebuah paket untuk disesuaikan ke bentuk yang berbeda' tingkat
?<
kesukarannya. J.ika a.da. paket
lebih. su,kar dari paket Y, m.aka p.e.nyetaraan
paket X ke Y menghasilkan nilai paket X lebih tinggi atau. berharga jika disetarakan ke paket Y (Crocker dan Aigina, 1986). Ada tiga dasar dalarn merancang data untuk diambil atau dianalisis dalam' melakukan penyetaraan tes (I(olen & Bren.nan, 20·04), yaitu.: 1)' desain data yang· dikumpu.l.ka.n· dari dua· kelompok yang dites pada .paket berbeda dengan kisi~kisi sarna, dimana pembagian kedua paket tersebut'secara aeak atau random;
2) untuk proses
penyetaraan, salah satu kelompok tas diberikan paket A setelah itu dite~ .kembali dengan paket B, dan satu. kelompok lagi. dibari.kan du·l.u...paket B kemudian mengerjakan kembali paket A; dan 3)- perbedaan instrumen tas yang diberika·n kepada peserta ujian yang berbeda pula. Namun dalam kedua paket tersebut terdapat tes jangkar (anchor; test) yangdiberikankepada seluruh peserta tes~ Tes jangkar itulah. yangd.ijadikan pato.kan untuk melakukan. penyetaraan. Peserta tes dal'am hal ini tidak perlu dibagi secara acak atau random walaupun
pembagian dengan randomjuga tidak akan mempe.ngaruhi mo.del ini. Ar~.'.KA~I, T~.QRI.RI;~PQN~I.
eVTIR PA.QA. P~N,Y~T AM.AN Te,§
Aplikasi teori responsi butir dalam kegiatan penyetaraan tes harus memenuhi dua asumsi dasar yaitu unidimensi dan independensi lokal (Kallen dan
Bren'nan,
2004).
Sedangkan
langkah-Iangkah
melakukankegiatan
penyetaraan tes menurut teori responsi butir adalah: 1) me·lakukan estimasi parameter butir dan parameter kemampuan; 2) mengestimasi skala teari responsi butir dengan menggunakan transformasi linear; dan 3) menyamakan
sekor, jika menggunakan sekor jawaban yang benar maka dilakukan konversi ke ".:!.
skala jawaban benar dan ke·mudian ke skala sekor. Oleh karena kegiatan penyetaraan tes memiliki prosedur yang empiris, maka kegiatan ini memerlukan rancangan tertentu yang harusdiperhatikan.
'., 1P4 - .. 1
Ada tiga jenis rancarigan penyetara'an tes yang dapat digunakan, yaitu
rancangankelompok tunggal (single group· design), ranca,ngan kelompok ekuivalen (equivalent 'group design), dan rancangan 'deng!i.in' butir tas j'angkar. Dalam rancangan kel9mpo~ tunggal digunakan satu kelompok peserta yang' merespons dua peran'gkat -tas (X dan V). Parameter butir dari kedua perangkat tes diestimasi secara terpisah dengan mengkalibrasi parameter kemampuan tesatau
peserta
parameter butir.
Berdasarkan
rancangan
ini,
dengan
mengkalibrasi parameter kemampuan peserta, maka parameter butir dari perangkat tes X dan,Y sudah berada pada skala yang sarna. Idealnya untuk menyetatakan sekor dari beberapa perangkat tes, maka perangkat tes- perangkat tes tersebut diberikan pada responden yang sarna. Den'gan membandingkan kemampuan peserta tes dari dua/lebih perangkat tes maka penyetaraan d'ua perangkat tes dapat dilakukan. Kenyataan di lapangan, ,
'
rancangan ini s~lit dlla~~kan 'karen,a adanya faktor kelelahan, belajar, dan adanya faktor latihan untuk tes kedua atau berikutnya. Selain 'itu, akan terdapat kesulitan dalam hal merencanakan wa~tu ya'ng cukup bagi responden untuk' megikuti tes lebih dari satu kali (Miyatun dan Mardapi, 2000).
'abc~Iots"
.
/
I · ('I
'"
I-
;
I I
-3
-2
a-par.
~,b-par.
:J
~ c-pa~. :,'.I: Label Item Numbers
I Close I
..'/
-====================================:::1--
;.~;
a-par.
b-par.
,c-par.
~}J label Item Numbers r,..Cl9~e',,1
Grafik abc- plot pada output /RTEQ
-
••
153 .
'f.:.
SBLOCK1
CATEGORIES Pearson SO Polyserial mean'l Corr.
Slope
Location ".
0003
FREQU':ENT
2.713·1
01344 1.~O54
O.284~
PERCENTAGE~ O.645{ O.326~
"
0010
SBLOCK2
CATEGORIES Pearson Polyser.ial SO mean Corr.
0001 2.723 . FREQ'UENT . PERC.·ENTAG:E 0.637
Slope
Location
0.143 0.168
0.17
-2.812
0.138 0.15
0.152
3.901
0.143 -6.436
0.147 -5.96
'.i,.,.-
·0002
FREQU~ENT
PERCENTAGE.~
.2.363i 0.21 1.024· 0.23
Q}236 5i217
0013
2.365 FREQUENT PERC'ENTAG:E 1.007 0003
FREQU'EN1~
2.847' O.257~ PERCENTAGE:; 1.034· 0.282.c
O.A294 -0.573
0023 FREQU·ENT· PERCENTAGE.~
2.761 0.199: 0.807" O.224~
0025 FREQUENT
2.767' 0.3 PERCENTAGE.; 0.775:; 0.349:: 0033 FREQUENT 2.574· O.144·~ PERCENTAGE.; 0.834- ·O.163~
0:23
-0.279
0. 373 0$963 4
0:'165
3i2
FREQUENT
2.817
PERC'E~JTAG:E
1.015
0.131 0.142
.0004 FREQ'UENT
2.799
0.132
PERCENTAG:E 0.862
0.145
0005 FREQ.UENT 2.727 PERC·E·NTAG~E 0.863
0.226 0.246
0.254 -2.332
0006 FREQUENT
0.033
0.037
. 2.671 PERCENTAG:E 0.903
0.037
Hasil ana/isis balir yang disetarakan 2PL yakni tingkat kesulitan "dan daya bada butir
154
10.532
',11I
Pada rancangan kelompok ekuivalen .dig.unakan dua kelompok peserta ekuivalen (Kt dan K2) dan dua perangkat tes (X dan V). Kelompok peserta K1 n'.'i'engerjakari' perang.kat tes X dan kelompok· peserta K2 mengerjakan perangkat tes Y. Mengingat kelompok K1 dan K2 adalah ekuivalen, maka kedua kelompok dianggap tunggaL Penentuan konstanta konversi berikutnya seperti rancangan kelompok tunggal. Keuntungan rancangan ini dapat menghindari efek negatif yang
disebabkan karena ,Iatihan dan ,kelelahan .peserta, tes,
sedarigkan
kekurangannya: ada kemungkinan bias yang disebabkan karena tidak mudah untuk membu'at· dist~ibusi kemampuan dua kelompok peserta tes yang benarbenar ekuivalen (Sukirno,·2007: 310). Pada rancangan tes Jangkar (anchor test design) biasanya digunakan jika masalah
keamanan
tes
menjadi
salah· satupertimbangan
panting· dan
memungkinkan untuk'menyelenggarakan beberapa tes dalam s.atu. waktu. Pada desain" ini masing-masing perangkat tes mempunyai beberapa .butir yang sarna (common item) dan masing-masing kelompok mengerjakan perangkat·tes yang berbeda. Pada desain ini' terdapat·dua variasi, yaitu (Chong dan ·Osborn·, 2005):
1) jika common item diperhitu.ngkan dalam pemberianskor disebut internal common item;dan 2) jika common item ·tidak diperhitungkan dalam pemberian skor disebut external cO'mmon ·item. Tes jangkar menurut Petersen, Kolen dan Hoover (1989) terdiri dari sejumlah butir, yang merupakan miniatur dari kedua tes yang disetarakan (memilikikeserupa'an sedekat mungkin, baik koriten maupLJn kedalaman materi dengan k~dua tes yang disetarakan). Menurut Livingston, Dorans dan Wright (1990: 75) bahwa metoda yang menggunakan skor tes jangkar adalah untuk menyesuaikan perbedaan kemampuan antara sampel-sampal' tes baru dan .lama. Serdasarkan pengalaman dalam praktek (rule of' thumb), Kalen dan ,
'
Brennan (1995: 248) menyatakan bahwa jumlah butir bersama paling tidak 20% dari panjang seluruh tes yang berisi 40 butir soal atau lebih dan meskipun tes sangat panjang, pad a kasI,Js iQ.i30 butir.soal bersama sudah:cukup.
155
eada rancangan tes jan.gkar di.gunakan dua p.erangkat tes (X d·an Y).d.an. dua kelompok peserta. (K1 dan K2).:.Masing-masing perangkat tas ditambahkan butir~butir tes jangkar
Z, se.hingga kedua perangkat te.s menjadi (X+Z) dan (Y+Z). mengerjakan perangkat tes (X+Z) sedangka~
Kelompok peserta tes K1
ke.lo.mpok peserta tes K2 men.gerJakan. p.eran.gkat tes (Y+Z), sehin.g,ga
b.u.tir~b.u.tir
tas jangkar Z dike~akan oleh kedua kelompok peserta tes. Penyamaan skala penyetaraan dilakukan dengankalibrasi parameter kema·rnp·uan atau ,param~ter butir tes jangkar (C.amilli·· dan Shepard, 1994). Apabila pada rancangan tas
jangkar dengan kal.ibrasi parameter buti.r, ma·ka param.eter kemam.pu·an. peserta kedua kelompok sudah berada pad a skala yang sarna. Salama penaksiran barjalan, parameter butir untuk butir-butir tes jangkar dipertahankan menjadi identik untuk kedua kelompok, tetapi parameter untuk butir yang. dievaluasi berbeda. Skala untuk dua set para,meter butir yang dievaluasi adalah sarna karena mereka terjalin melalui persarnaan p·a~.a parameter butir-butir tes jangkar (Susongko, 2005). Dengan demikian, secara formalpenyetaraan diselesaikan dengan men1anipulasi model teari. responsi butir
daripada prosedur khusus terpisah. Setiap
~aU
penyetaraan. diperlukan sa.tu butir
tes yang 'akan dievaluasi dan'" butir-butir lainnya merupakan butir-butir tes jangkar. Artinya, setiap butir secara individual dinyatakan sebagai butir dievaluasi pada analisis kalibrasi terpisah.
METODE RENYETARAAN M.ENURU·T TEORI RESPONS 8UTIR Metode
penyetaraan
m~nurut
teari
butir beri~ngsi untuk
responsi
menentukan konstanta konversi. ~~I ini menginga~ bahwa penyetaraan antara dua perangkat tes atau lebih dapat dilakukan jika konstanta konversi talah dike.~ah~i.
Nilai
konversi
yang
dihasilkan
kemudian
di
substitusi
dalam
persamaan skala pada rancan~an penyetaraan yang digunakan. Ada beberapa metoda
penyetaraan
tes
yang
dapat digunakan
dan
faktor-faktor yang
mempengaruhi keakuratan metode penyetaraan tes. Dalam teori responsi butir" terdapat empat metode penyetaraan tes, yaitu: regresi, rerata sigma, rerata dan
sigm,a tegar, dan kurva karakteristik (Angoff, 1982).
156 _ .... 1.
·r·
Metode penyetaraan tes yang' pertama adalah metode regresi. Penentuan konstanta konversi a dan b menggunakan metode regresi dilakukan dengan memperhatikan respons peserta tes pada kedua perangkat tes,X dan Y.~l·Estfmasi· parameter butir dan parameter kemampuan peserta memenuhi persamaan regresi linier sebagai berikut:
y = ax + b + e
dengan a = rxy Sy/~x d~n b = 9- ax
Keterangan:
y
: estimasi kemampuan atau estimasi parameter butir pada perangkat tes Y
x
: estimasi kemampuan atau estim~si parameter butir pada perangkat tes
X
rxy , : koefisien korelasi antara X dan Y
y,x
: rerata dari y dan x
Sy, Sx: simpangan baku' dari
e
x dan y
: kesalah~n dalam
penaksir~n galat
regresi·
Penggunaan metode ini bersifat tidak thnbal batik (asimetris) sehingga kurang memadai untuk penentuan konstanta konversi apalagi mengingat bahwa penyetaraan dua perangkat tes atau lebih sangat memerlukan syarat invariansi dan timbal balik dari perangkaftes yang disetarakan. Metode penyetaraan tas yang kedua adalah metode rerata sigma. Pada metode ini, penentuan konstanta konversi a dan
J3 menurut metode rerata dan
sigma dilakukan dengan memperhatikan nilai estimasi parameter tingkat kesukaranbutir tes pada kedua perangkat tes yaitu bxdan by. Menurut Hambleton & Swaminathan (1985: 26), hubungan antara estimasi parameter butir tes atau parameter kemampuan peserta pada kedua perangkat tes yang akan disetarakan dan penentuan konstanta konversinya memenuhi pers~maan sebagai berikut:
y = ax + b dengan a
=Sy/Sx
dan.,b = 9- ax
157 ............ 1.
Metode rerata dan sigma ··ini bersifat timbal. baUk s8.h.i.n.g.g:a. d.e.ngan cara yang sarna hubungan dari y ke x dapat ditentukan. Namun demikian, menurut Hambleton
& Swaminathan(1991: 26)'- mengenlJkakan
~.ahwa
meta.de
penyetaraan rerata dan sigma in; tidak mempertimbangkan variasi standar error e.stimasi param.eter butir. Metode penyetaraan tes yang ketiga disebut dengan metode rerata dan sigma tegar. ~ambleton dan Swaminathan (19.91: 20), menyatakan bahwa 'dalam metoda penyetaraan .rerata dan sigma tidak mempertimbagkan variasi estimasi
parameter butir. Metode penyetaraan rerata dan sig.ma teg·ar mempertimbangkan adanya variasi standard error estimasi parameter butir.Langkah-langkah dalam penentuan konstanta konversi guna penyetaraan tas dengan menggunakan metode ini adalah sebagai berikut (Sukirno, 2007: 312):' Renentuan bobot parameter butir (wi). pada seti·ap pasan·gan (bxi dan byi)., yaitu: wi=[maks{v(xi),v(yi)}]-1
di mana: i
= 1,2,3,4.... k,
v(xi) dan v(yi) adalah
varian estimasi parameter tingkat kesulitan tes X dan Y. Penentuan penskalaan bobot skala wi. dengan menggtJnakan rumus: wi'= . k =. jumlah butir jangkar pada perangkat tss X dan Y. Penghitungan estimasi berbobot tas X dan Y, .dengan menggunakan rumus: xi'=wi'xi danyi'=wi'xi Penentuan rerata dan simpangan baku dari estimasi berbobot tes X dan Y,
yaitu. x, y, Sx " Sy'. Penentuan konstanta konversi a dan
J3
dengan menggunakan reratadan
simpangan baku estimasi berbob.ot dilakukan dengan me.nsubstitusikan rerata dan simpangan bakubobotestimasi pada persamaan penyamaan skala. Menurut Stocking dan Lord (Hambleton, 19.85) dalam metode penyetaraan
rerata dan sigma, proses penentuan konstanta konversi tidak memperhatikan kemungkinan sekor kefompok ekstrim, sedangkan meta.de penyetaraan rerata dan sigma tegar dapat diperbaiki dengan jalan memperhatikan sekor kelompok
ekstrim.
15.8 ......... .,
i..
t-:·
-.
Sedangkan metode keempat yang dapat digunakan ,dalam penyetaraan tes adalah metoda kurya karakteristik. Penentuan konstant~ konversi a dan J3 dengan metJde kurva karakteristik, dilakukan dengan memperhatik'an nilai estimasi parameter butir tas kedua perangkat soal yaitu x dan y. Metode penyetaraan rerata dan sigma serta metoda rerata dan sigma tegar dalam penentuan konstanta kbhversi hanya memperhitungkan' hubungan yang ada antara parameter-parameterkesukaran butir pada pera'ngkat tes, yang satu terhadap perangkat tes yang lain. Hubungan antara param'eter-parameter daya .
.
'
..
.
beda pada kedua perangkat fes belum'dipertimbari'g'kah. Rahayu
(2008)~
menyatakan
bahwa
metode
kurva
karakteristik
mempertimbangkan informas'i dari parameter daya" beda butir dan tingkat kesukaran butir dalam penentuan konstanta konversi. Oleh karena itu, dalam metode
penyetaraan
kurva
karakteristik
diperhatikan
hubungan
antara
parameter-parameter kesukaran 'daya bedadan hubungan aritara parameter kesukaran butir tes yang akan "disetarakan. Selain itu juga dalam metode kurva ,
'
karakteristik diperhatikan sekor asli (true score) peserta tes pada kedua
perangkat tes. True Score (txa) daripeserta tes dengankemampuan ,8a yang m,e,respon k item dalam perangkat X dan Y ~dalah: xa =(8a, bxi, , exi)
ya =(8a, byi, ayi, cyi)
dan
Setiap item pad a perangkat tes X dan Y memenuhi persamaan:
=
by; abxi + (3 abxi
ayi = atau
a=
cyi = exi
f3
=by;-
Konstanta a dan ~ dipilih sedemikian sehingga fungsi F seperti tertera di bawah ini mencapai nilai minimal.
F
= xa -
yi )
Keterang,an : " , : , ' F :.fungsi dari a dan ~ yang menunjukan ketidaksesuaian antara xa dan ya I
159 ........... 1
: jumlah pe.se.rta te.s : true score pes'erta tes pada kemampuan a pada perangkat tas X : true score peserta tes pada kemampuan a pada .perangkat tas Y
N xa ya
Chong dan O'sborn (2005) m'engemukakan - bahwa, ada empat a'spek kesetaraan yang harus diperhatikan dal.am .penyetara.an tes, yaitu: 1. Interfe·rensi. Seberapa jauh sakor dari k~dua tes dapat digunakan untuk mengukur tujuan
yang sarna.
Misal~ya
mengukur prestasi akuntansi, mengukur kemampuan
berhitung. 2. Konstruk. Seberapa jauh kedua paket tes mengukur konstruk yang sarna. 3. Ropulasi. Seberapa ja.uh popu,la$i ya.ng. dig.unakan adalah ho.mogen atau sarna. Selain itu faktor-faktor kualitas: . dan kuantitas yang berhubungan dengan sistem pembe~ajaran yang harus. disetara~an. Artinya sek~lah yang memiliki siswa dengan latar belakang. sosial ekonomi jauh di bawah, fasilitas sarana prasarana. se.kolah serba kekurangan, dan. g·uru· yang seadanya ti.d.ak . .
tepat bila dibandingka·n dengan keadaan yang, tidak setara. 4. Kara~eristik atau kondisi pen.gukuran. Seberap'a jauh kesamaan kondisi f.lengukuran dilaklJkan untuk ked~a pakettes, baik dari sisi panjang .tes t bentuk tes, administrasi tes,
waktu. tes, tipe scal, dan prosedur tes·. METODE ANCHOR (JANGKAR) _
_
_
_
_
::...~
--.J
.....
__
~
_ _•
.
.-_
....
.:..~
_
<;.I":"
_
looOo
•
Gronlund (1985: 180) menyarankan beberapa hal dalam pengkonstruksian tes, diantaranya: 1) stem item tersebut sebalknya memaknai butir itu sendiri dan menampilkanmasalah
tertentu;
2)
stem
bLitir tes
melibatkan
banyak
kemungkinan jawaban dan bebas dari materi yang tidak rele'Jan; 3) gunakan pernyataan stem butir yang bersifat negatif hanya ketika hasil belajar yang dikehendaki cukup bera.rti (signifikan); 4) Semua alternatif jawaban secara
gramatikal konsisten deflgan stem butir tersebut; 5) sebuah butir secara jelas hanya mengandung satu jawaban benar terbaik; 6) butir-butir tes digunakan untuk mengukur pemahaman yang mengandung beberapa hal baru, tetapi harus berhati-hati; 7) semua pengecohan harus masuk akal; 8) assosiasi.. . verbal antara stem dan jawaban yang benar harus dihindarkan; 9) secara relatif, panjang pilihan jawaban tidak menunjukkan suatu petunjuk untuk jawaban terseb.ut; 10)
160 ...--
••
.
So..
jawaban benar -sebaiknya '" muncul pada' masing-masing posisi pilihan' atas .beb'erapa kesamaan pendekatan, tetapi' d'alam urutan random; 11) gunakan d'engan hemat pilihan-pilihan khusus seperti tidak satu pun jawaban, d'i etas.
benaratau semua jawaban di atas benar;.: dan '12) jangan gunakan ·butir-butir pilihan berganda ketika butir yang lainnya lebih tepat. Suatu tes harus mengukur hasi'l belajar dal~m 'skala yang sarna dan pendekatan. yang mungkin dilakukan antars 'lain: 1) pemakaian butir soal penjangkar .(common items) untuk bebera·pa set ,tes; 2) pemakaian butir. soal yang telah terkalibrasi (butir soal yang,"diketahui karakteristiknya,pada satu skala umum); dan 3) kombinasi kedua pendekatan itu yakni: soal penjangkar dipilih dari butir yang terkalibrasi (Kumaidi, 2000: 105). Dalam ·hal ini peranan IRT cukup bergunauntuk menyamakan skala tersebut. Setelah soal-soal berkualitas terpilih berdasarkan professional adjustment dari para ahli bidang studi dan ahli pengukuran (measurement spe'cialist) dan juga qidukung data empirik hasil uji coba soal, maka kegiatan berikutnya adala.h membuat skala dan menentukan di mana setiap soal terletak dalam skala tersebut (Setiadi, 19'98: 10). Menurut Naga (1992:.394) dari waktu ke waktu bank butir terus mengalami pengembangan dengan pemasukan' butir-butir baru 'serta pe~iadaan butir-butir usang. Dalampenelitian digunakan teorisekor modern. Unt~k membentuk. perangkat soal yang baik dibutuhkan banyak hal, terutama dari aspek esensial yang membutuhkan pengkajian lebih mendasar danmendetail baik ditinjau dari kacamata
pengukuran
klasik
maupun
pengukuran
.modern
sehingga
pemanfaatan tas dapat menghasilka.n fungsi informasi butir tas maupun fungsi informasi ujian yang cukup tinggi. Karenanya tidak ada satu tes yang sempurna, salama berbagai persyaratan yang telah diuraikan di atas belum seluruhnya dipenuhi~..
HASIL ANALISIS PENYETARAAN BUTIR Tes yang disetarakan adalah butir Polytomus ''''yaitu Graded Partial Credit
Model yakni data dengan sistem bertingkat tetapi tetap dalam satu' ikatan deng?n jumlah butir kuesioner sebanyak 35 b~tir dan peserta tes A = 502 d~n
161
-
.•
.
L
',j.!
se.lanj~.tnya
te.s 8 = 449.. Data
dia.nalisis de.ngan ··pro.g.ram· eARSCALE" untuk
melihat estimasi tes 'masing-masing perangkat kemud,ian:' baru di..s etarakan menggunakan _ program
IRTEQ.
ya~~_
Analisis
.
diQ':I,n&;~~~
,adalah
membandingkan dua metode rerata sigma yaitu Metod'e Haebara dan Metod,e
Stocking and Lord.
Hasil yang diperoleh bahwa butir tes bersama akan· meningkatkan daya beda peserta serta akan menambah tingkat kesulitan (parameter b). Sehingga adanya butir bersama akan cocok dan baik untuk menyeta-rakan, 2buah tes yang berbeda dengan· kemampuan·theta yang berbeda.pu.la. Statistik Deskriptif Estimasi Parameter Item Pra dan Post Penyetaraa'n Tes Adan.',B Parameter Item
Basaran Mean
Slope (a)
SO N Mean SD
Threshold (b)
N
TasA
Tes B
Hasil Penyetaraan .
0.358 3.568 35 -1.076 . 818,98 35
0.391 4.259 35 -O.S46 866.59 35
0.866 3.931 0.763 6.314
Chi-
RMSD Square
0.00213
Selanj'utnya akan dilihat mean sigma asing-masing nerangkattes dan hasH anafisi-s Tee asing-"1asing metode yaitu AkurasiEstimasiParameter Item Equating Menggunakan Metode Tee Tes A dan B '.
•
~~
••
~~-.".
_',
•....,._
-.:-.
'10
_~
-1 __
~
•
"fee
__
~
Haebara
A Mean-Mean .
'Mea·n'~S
_'8
igma .'.
'.
",
O~5·5
.:: ".:. ~ ·6'~~62:·
,:Value'
:
0,.68 .. :..... 2.4 0.592
.
"
_ ..,;",o.r_
"....
..
"..
....:.-.......
~
""""",-, ..
~
,,
.~"-w:;..._ ~
~,:.....
:.
_~_ .....:.
..
Stocking & Lord
0.61 ..: 2.49 0.00213
,,;:::,,::.. ....:~ :..;.:.
..............
B 0.62
Mean-Mean Mean-Sigma Value
D.ari re.kap.itulasi
3.2
Tee
0.68 2.4 0.592
0.61 2.49 0.00213
dengan dua metode diatas dapat di~impul.kan bahwa
penggunaan metode Li~king tes dengan Metode Haebara menghasilkan Value Mean-Sigma yang lebih besar da'I-ipada yang menggunakan metode Stocking &
, 16.2
Lord. O'engan demikian Eq'uating dan, Linking le'bih efektif dan opti.mum ,apabila menggunakan metode Haebara. Grafik TCC' (Test Characteristic Curve) .antara item yang di Linking dengan keseluruhanbutir dapat dilihat pada grafik di bawah ini: , Test Charaetenstk' Curve {Tee) Linldn
15.
Iterns
13.
__---------------------------------------
9.0
_.-.-:::;:::::;::::;::::--
_~.:.;.J-=--:=..~~~------- .. -.---;::.----
::.
_••----.---------------••----.-----------------:: -
·so.~ ;-,;::;;:;,
-
~••"t.;.~---
7.5
.f.2•.tI
::::::-~=~---.
5.0
:Sl
7S_S.
::::
4.5
.:~
33.S
.1~
2,'.2
Te.5a LmlkJiroliJ
3.0 1.5
8.4
0.0
-+--......----r---r-__r___--r---r---r-------.---r---.---..---..,.--r--...--..---......--.......---.-__+_ 0.0
-s
-1
~::l} All Items (Linking Item.s Included)
. . .5
:2
[.i,J Equated Test by
[.;zJ Unking Items
..... : V;.:.~I.9.~?.
Mean/Mean
Grafik Test Characteristic Curve SIMPULAN
Teari responsi butir atau item response theory merupakan ait~rnatif pilihan yang bertujuan melepaskan diri dari
keterg~ntungan
tes yang diberikan dengan
sampal peserta tes. Dalam hal ini walaupun soal-soal tersebut dikerjakan oleh siswa yang pandai atau siswa yang kurang pandai, indikasi tingkat kesukaran suatu soal tetap tidak berubah. Selain itu penerapan teori responsi penyetaraan
tes
independ~nsi
lokal. Langkah-Iangkah
mengharu.skan
dipenuhinya· r:nela~iJkan
berdasarkan teari responsi 'butir, yaitu:
asumsi
b~tir
·unidimensi
dalam dan
kegiatan penyetaraan tes
1) mengestimasi parameter, 2) linea~,
mengestimasi skala teori responsi butir dengan transfarmasi
dan 3)
menyamakan sek9t. Sedangkan rancangan penyetaraan tes yang digunakan menurut teari responsi butir ada tiga, yaitu: 1) rancangan kelompok tunggal, 2)
rancangan kelompok equivalen, dan 3) rancangan tes
jangk~r.
Metode-metode
yangsaat. ini dikembangkan untuk melakukan penyetaraan tes menurut teari .responsi butir adalah: 1)· metode regresi, 2) metode rerata'dan sigma (mean
163 ....... ., ~.
....i:.
a.nd sigma method), 3) meta.de tegar reratadan ·sig.ma (robiJ.st m,e.a,n, a.n.d sigma, method), dan 4) metoda kurva karakteristik.
DAJ;TAR RUSTAKA An~n,
M.J. & Y~n,W.M. (1. 97a). 'n(rqqqqtion CA: Brooksl Cole Publishing Company.
ta
m~qsJ.lr~m~nt
tnf),Qry. M.. Qnte.r~y,
A vi. (2007). An NCME instructional module on quality control procedures in the scoring, equating, and reporting of test scores. Educational Measurement,
Vol 26, Edisi 1, pp.36 - 43. Brennan, R.L. (2006), Educational measurem,en.t. Iowa City: U,nited State of . America: American Council on Education and p'raeger Publisher. ' Brennan, R.L.& Kalen, M.J. (2004)., Test equating, scaling, and linking. Iowa City: Un'ited State of America: American' Council o'n Education a'rid Springer Publisher. Crocker & Aigina. (19.86), Introduction. to classical an.d modem, test theory. New York: United State of America: CBS College Publishing.
Djemari Mardapi. (2004). Penyusunan tes hasil be/ajar. Yogyakarta: Program -. Pascasarjana Universitas' Negeri Yogyakarta. ~ . --. Djemari Mardapi.· (2008.). Teknik penyusunan instrumen les dan non lese Yogyakarta: Mitra Cendikia Press.
Dikdasm'en Dikbud (1999). Pengelolaan pengujian bagi guru mata .pelajaran. Jakarta: De'partemen Rendidikan dan Kebudayaan. Direktorat Jenderal Pendidikan Dasar d.an Menengah Direktorat Pendidikan Menengah Umum. Embretson & Reise. (2000), Item response theory ·for psychologists. London : .. . Lawrence Erlbaum associates publishers. . Ebel' R.L & Friesbie. D.A (1986), Essentials of educational measurement. New Jersey: Prentice- Hall. Inc Ekohariadi. (2009). Perkembangan kemampuan sains siswa Indonesia berusia 15 tah.un berdasarkan data studi PISA. Makarah Seminar mutu Pendidikan Dasar dan Menengah Hasil Penelitian Puspendik. Jakarta. Badan Penelitian dan Pengeniba.ngan Departemen Pendidikan Nasional. Freund's, J.. E. (2004). Mathematical statistics with applications, Canada: Pearson Education.lnc. Gary,
s. (2005). Acuracy of random groups equating with very small samples. Jo.urna./ Education Mea.surement. Vol 42 numbe~ 4 winter 2005. p. 309. 330.Hambleton, R.K., Swamfnathan, HI, & Rogers., H.J. (1991).
0.'
164
-
.•
..
i..
Fundamental of item response Publication. New Inc.'
theot}'.
Newbury Park, CA,: Sage
Hambleton, R.K. & Swaminathan, H. (1985). Item response theory principles and applications,.- Boston; MA: Kluwer Inc.Kolen·, M.J. & ,Branan, R.L. (1995). Test equating. Iowa City: Springer. Kolen, M.J. & Brenan,R.L. (2004.). Test equiting, scaling, and linking.. Iowa City: Springer.
Kalen,
M.J. (2004). Linking assessment : concept and history. Psychological Measurement, Vol. 28, No' 4, PP . 219 - 226.
Applied
Kolen" Michael J., dan Roberl L. Brennan. 1995. Test Eq,u~ting. New York: Springer Verlag. Kum aidi. 2000. Standardisasi Butir'" Soal. Jurnal Pendidikan dan Kebudayaan. V(5): 132,-143.,
Livingstone, :5. A. t O'oran, N. J. dan Wright, N. K. 1990. 'What Combination of Sampling and Equating Methods Work Best? Applied Measurement in Education. III (2):. 73-95. Lord, Frederick, M.1990. Aplications of Item Response' Theory" to Practical Testing .Problems. New Jersey: Lawrence'ErlbaumAss.oci~tes, Publishers. Mary J.Alleri and Wendy M Ya:n, 1989, Introduction to :Measurement Theory, California: Broke. McDonald, Roderick P. 1991. Test .Theory:' A Unified Treatment. New Jersey: Lawrence Erlbaum'Associatiates ,Publisher.Naga, Dati, 'S. 1992. Pengantar Teori Sekor Pada Pengukuran Pendidikan. Jakarta: Besbats. Nitka, Anthony." J'. 1992. Criterion Reference Testing Workshop: Handouts and Reading Material Tidak dipublikasikan). Cipayung, Bogor: Examination Development Unit (Puslitbang Sisjian). Miyatun, Erna., dan Djemari Marda'pi. 2000. KomparasrMetode Penyet~raa'n Tes Menurut Teori Responsi Butir. Jurnal Penelitian dan Evaluasi. II (3): 124132. Peraturan Pemerintah No. 19 Th 2005 Tentang: Standar Nasional Pendidikan (SNP). Bandung: Citra Umbara.
Peterson, N.S., Kqlen, M.J., dan Hoover, H.D. 1989., Scaling, Norming, and Equating. In R.L. Linn (Ed), Educational Measurement. New York: Macmillan. Rahayu, Wardani. 2008. Pengaruh Metode Linking Terhadap Banyak Butir False Positive pada Pend~teksian DIF Berdasarkan Teori Responsi Butir. Disertasi. Jakarta: Universitas Negeri Jakarta~
Ridho, Ali. 2007. Karakteristik Psikometrik Tes Berdasarkan Pendekatan Teori Tes Klasik dan Teori Respon Aitem. Jurnal Insan Media. II (2): 1-2.8. Setiadi, Hari. 1998. Bank 80al yang Dikalibrasi dengqn Konsep IRT Memecahkan Permasalahan Ujian-ujian Sistematik yang Diadakan pada Periode-periode Tertentu, Jurnal Kajian Dikbud IV (13). 165
--
.-
.
i..
Setiadi, Hari. 2009. ~e.rmasata·h·an, dan· Solusin.ya dal.am. 8e.l,aksanaan Uji.an Nasional di Masa Mendatang, Matahari: Jurnal Penelitian "dan Pendidikan. X (1):.66-74.
Susongko, PUIWO. 2005. Penyetaraan Parameter Butir Secara Konkuren untu'k Menguji Secara Stati~tik Keberadaan Item Function (OIF). Makalah: Disamp.aikan pada Seminar Nasi.o.nal Hasil Penelitian. tentang Evalu.as.i Hasil Belajar serta Pengelolaannya. Pascasarjana UNY Didukung oleh Direktorat P2TK & KPT dan HEPI, Yogyakarta, 14-15 Mei 2005.
Sukimo, D. S. 2007.Penyetaraan Tas UAN: Mengapa dan Bagaimana. Jurnal Cakrawala Pendidikan. XXVI (3): 305-321. Syarifah. 2007. I?ersyaratan Analisislnstrumen Se.bagai erasyarat Ketepatan Hasil Analisis Dalam Penelitian Pendidikan. Cakrawala Pendidikan. XXVI (2): 15-27. .Swediati, Nanny. 1997. Metode untuk Penyetaraan (Equating) Sekor Tes Secara Klasik. Pusat Pengujian Balitbang Dikbud: Jakarta. Wibowo, Mungin Eddy. ·2011. Ko.ndisi esiko.logi"s Siswa dalam Men.ghadap.i Ujian Nasion·al,Buletin BNSP: Media Komunikasi dan Dialog Standar Pendidikan. VI (1): 7-11. Widhiarso, Wahyu. 2011. Aplikas'i Teari Respon Butir untuk Me'ngujilnvariansi Pengukuran Psikologis Guna Keperluan Survei dan SeJeksi Pekerjaan. Jurnal PS.i.kobuana. III (2): 104..:1.17.
Tumilisar, I~.V.J. 2006. Akurasi Relatif Penyetaraan Sakor Tes .untuk Sampal Berukuran 300 Oitinjau dari Metoda Penyetaraan dan Teknik ·Peng.halusan. Jurnal Pendidikan Penabur. V (6): 1-19.Zhu, W. 1998. Test Equating: What, Why,. How? Research Quarterly for Exercises a·nd Sport. Wayne
State
UniY~r~ity.
.
16.6.
LEMBAR KEGIATAN PEMB·ELAJARAN BERBASI·S
MASALAH~
DALAM:
ASESMEN ALTERNATIF PADA ·MATA KULIAH PENDIDIKAN. KONSUMEN.UNTU.K MELATIH DAN MENILAI KEMAMPUAN BERPIKIR KRITIS MAHASISWA Sri Wening Fakultas Teknik Universitas Negeri Yogyakarta
e-mail [email protected]
ABSTRAK Telah dilakukan penelitian evaluatif tentang kebermanfaatan penggunaan lembar kegiatan pembelajaran berbasis masalah (LKPBM) pada perkuliahan pendidikan konsumen dengan pendekatan pemecahan masalah- sosial, untuk pencapaian kemampuan berpikir kritis mahasiswa.· Pad a "pembelajaran ini, perangkat pembelajaran LKPBM digunakan· pada sesi pengenalan dan menggali serta mencari solusi terhadap berbagai permasalahan. yang terjadi pada konsumen ketika melakukan konsumsi barang dan jasa. Materi pelaJaran yang dibahas adalah permasalahankonsumen (peraturan jual belit gugatan ganti rugi, iklan~ spesifikasi dan mutu barang (kemasan dan label, ukuran. dan takaran, standarisasi produk). Penelitian ini dilakukan terhadap mahasiswa Program Studi Pendidikan Teknik Susana yang sedang menempuh Mata Kuliah Pendidikan Konsumen semester gasal di .Fakul~_as Teknik UNY dengan me~ggunakan instrumen penelitian yang digunakan adalah alatukur prates dan pastes, LKPBM dan rubrik penilaian, lembar pengamatan diskusi, lembar pengamatan presentasi lisan, lembar pengamatan ~ktivitas mahasi.swa, dan pandua.n penilaian unjuk kerja hasil makalah/artikel. Oata penelitian dianalisis dengan' metode deskriptif kualitatif dan kuantitatif pendekatan evaluatif. Dari hasil pembelajaran berbasis masalah dalam mata kuliah pendidikan konsumen menunjukkan pencapaian kemampuan ·berp·ikir kritis mahasiswa sebesar 1OO%berada diatas skor 75 (8), LKPBM bermanfaat melatih Kemampuan berpikir kritis mahasiswa .94 % (di atas 800/0) mencapai skor di atas 75 pada penilaian proses, LKPBM memiliki manfaat untuk melatih kemampuan berpikir kritis mahasiswa dengan pencapaian skor nilai akhir (NA) sebesar 940/0 skor mahasiswadi atas 75.
Katakunci: lembar kegiatan, asesmen alternatif, pendidikan konsumen, berpikir kritis
167 .-.. ...
..
L
PENDAHULUAN Perubahan yang:, mendasar untuk meningkafkan mutu pendidikan yaitu melalui penyempurnaEl'n kurikulum,_ dan.si~tem evaluasinya. Demikian halnya I
perubahan sistem evaluasi yang akan dikembangkan menekankan pada proses dan hasil belajar yang diakhiri dengan ujian nasional. Struktur kurikulum dirancang untuk menyesuaikan dengan tuntutan, tantangan, dan kondisi sekolah. Kurikulum yang di'kembangkan
saat ini menuntut pembelajaran yang lebih
banyak melibatkan peserta didik untuk aktif dan kreatif, seria pembelajaran lebih menekankan pada proses dengan menggunakan penilaian berbasis kelas. Dengan demikian diperlukan adanya asesmen yang lebih menekankan pada proses 'dari pada hasil. Sejalan menurut Fuchs (Zainul, 2008) salah satu asesmen berba'sis kelas yang dapat m'emperbaiki proses pembelajaran' mahasiswa adalah asesmen alternatif karena
membantu
pendidikldosen
dalam membuat keputusan-
keputusan sel,ama proses pembelajaran. Menurut Stig,gins (1994) asesmen alternatif memiliki beberapa alasan untuk digunakan pendidikldosen antaralain kemampuan peserta· didik yang tidak dapat. dideteksi dengan cara tertulis yaitu keterampilan dan kreativitas, dan memberi peluang yang lebih luas, kepada pendidik untukmenganalisis kemampuan peserta didik secara total, serta dapat melihatkema,mp'uan peserta didik pada saat pro,ses pembelajaran tanpa mengganguproses akhir. Permasalahan yang dihadapi dunia pendidikan pada proses pembelajaran saatini, adalah sebagian besar waktu pembelajarandidominasi oleh pendidik dan peserta didik menjadi pasif menunggu ,instruksi pendidik tentang apa-apa yang harus dipelajari, apa yang harus dilakukan (Kurniati, 2001). Senada dengan .
.
pendapat di atas, disebutkan pula bahwa kesiapan belajar .diperguruan tin99i (termasuk keman,dirian), dan motivasi belajar yang ditunjukkan dalam gaya belajar dengan sikap menunggu perintah dar; dosen, sikap menunggu ditegur lebih dahulu, dan sikap tidak acuh atau seenaknya masih mewarnai kehidupan mahasiswa
(Depdiknas,
2004).
Demikian
168
halnya,
secara
umum
tiga
permasalahan yang dihadapi pendidikldosen adalah: a) 'dosen ·,yang belum siap menghadapi berbagai perubahan, b) keterbatasan akses' pada materi' mutakhir, dan c) keterbatasan wawasandan keterampilan pembel.ajara,n. Indikator kualitas· pembelajaran dapat dilihat dari perilaku pembelajaran oleh pendidik atau gUtu (teacher educators behavior), peril,akudan dampak bel~jar
peserta
didik,
iklim
pembelajaran,
materi
pembelajaran,
media
pembelajaran, dan sistem pembelajaran termasuk asesmen· yang diguriakan. Berdasarkan hasH observasi dan, wawancara dengan beberapa orang' pengajar di perguruan tinggi khususnya Program Studi Pendidikan'Teknik Susana bahwa lembar kegiata~pembelajaran berbasis masalah(LKPBM) sebagai asesmen alternatif dalsm pengajaran belum pernah digunakan. Menurut'mereka perangkat pebelajaran
tersebut'membutuhkan
waktu
yang
lama· dalam'
persiapan
pembuatan dan penerapannya di kalas, disamping proses ·penilaian·yang·terlalu merepotkan dan menambah beban pengajar. Mata kuliah pendidikan konsumen merupakan salah satu mata kuUah dalam kurikulum program studi di stas, wajib ditempuholeh mahasiswa termasuk pada khasanah. pengetahuan sosial yang berkaitan dengan perilaku konsumen. Pada proses pembelajarannya, dapat dimanfaatkan sebagai sarana untuk niengembangkan berpikir kritis dan kreatif' mahasiswa melalui keterampilan pemecahan masalah sosial. Dalam '. materi pembelajarannya·: banyak sekali' terkandung masalah-masalah kehidupan bermasyarakat dan'nilai-nilai kehidupan yang berkaitan denganperilaku berkonsumsi dan perlindungan masyarakat konsumen. Pada permasalahan ters~but sangat memungkinkan untuk melatih peserta didik berpikir kritis dan kre.atif.Pembelajaran dua arah dengan melibatkan peserta didik untuk aktif menyebabkan pembelajaran ini menjadi
sangat
menarik
individu/mahasiswa
bagi
peserta
merupakan
didik.' Dalam aktor
social
kehidupan
(social
actor).
bermasyarakat Salah
satu
kemampuan yang d,ituntut untuk menjadi seorang ,aktor sosial yang, baik adalah mengambil keRutusan secara nalar .atauwell' informed and· reasoned decision
making (Banks, 1978). Kemampuan tersebut akan tercermin rnelalui proses
169
pembelajaran yang memurigkinkan individu/mahasiswa terlibat dalam berbagai
bentuk ~egiatan pemecahan masalah sosial baik secara individual maupun kolektif. Pembelajaran berbasis masalah sosial sudah seharusnya mendapatkan . asesmen yang menyeluruh, tidak hanya produk yang dihasilkan tetapi proses
yan'g terjadi dalam kegiatan pemecahan masalah harus dinilai. Menurut National Research C9uncill NRC (1996) standar asesmen pembelajaran sa·in·g harus mengalami perge.seran penekanan dari. "yang mudah dinilai" menjadi " yang penting untuk dinilai".' Sejalan menurutFuchs (Zain.ul, 2008) salah satu asesmen berbasis kelas yang.dapat memperbaiki proses pembelajaran·mahasiswa adalah
asesmen
alternatif. karena
keputusan~keputusan
dafam
membantu· pendidikldosen
membuat
selama proses pembelajaran. Menurut Stiggins (1994)
asesmen altematif memiliki beberapa alasan untuk digunakan pendidikldosen antara lain kemampuan peserta didik. yang tida'k dapat d~qeteksi dengan cara tertuli.s .yaitu keterampHan dan kreativitas, dan me·mberi peluang yang lebih luas kepada pendidik untuk menga':lalisis kemampuan peserta didik secara' total,
seria dapat melihat kemampuan.peserta didik' pada saat proses pembelaJaran. tanpa menggangu proses akhir. Berdasarkan pada uraia.n dan. perm~salahan di atas, maka artikel ini memaparkan tentang: 1) bagaimanakah pencapaian ke.mampuan b'erpikir kritis ma.hasiswa pada pembelajaran
p~ndidikankonsumen
dengan meng.9unakan lembar kegiatan""pembelajaran berbasis masalah dalam asesmen.
alternatif,
2)
bagaimanakah
kemanfaatan
lembar
kegiatan
pembelajaran berbasis masalah .datan, asesmen alternatif untuk m'engukur .hasil penilaian proses kemampuan berpikir kritismahasiswa, 3)
bagaimanakah
kemanfaatan lembar kegiatan pembelajaran berbasis masalah dalam asesmen alternatif untuk
mengukur hasH (NUai Akhir)
kemampuan
berpikir kritis
mahasiswa. Melalui
kegiatan
penelitian
ini akan
memberikan
manfaat kepada
mahasiswa sebagai" calon pendidik untuk: 1) memperoleh pengalaman belajar tentang cara meningkatkan keterampilan berpikir kritis dengan menggunakan
170
pembelajaran keterampilan pemecahan masalah social dan asesmenn'ya, 2) mampu melatihkan model pembelajaran keterampilan pemecahan masalah .sosial dan implementasi asesmennya ·dalam lit.gkup pembelajaran IPS yang. terkandung di dalamnya adalah pendidikan konsumen disekolah (SO, SMP, SMAlSMK,
3)
pendidikldosen
memperoleh
perangkat
keterampilan
pemecahan
mata
asesmen
kuliah
pendidikan
alternative
masalah
social
dan
yang
konsumen
model
dapat
akan
pembelajaran
digunakan' untuk
mengembangkan kemampuan berpikir kritis mahasiswa.
METODE. PENELITIAN Metode yang digunakan dalam penelitian ini adalah pendekatan evaJuasi yang dideskriptifkan dengan tujuan
melakukan penilai hasH pembelajaran.
Subyek penelitian ini adalah mahasiswa Program Studi Pendidikan Teknik Susana semester 1. Teknik sampling yang digunakan adalah purposive sampling yaitu satu kelas mahasiswa baru yang sedang menempuh mata kuliah Pendidikan Konsumen di Program Studi Pendidikan Teknik Susana kelas Reguler (Jenjang 81) di Jurusan PTBB FT UNY tahun perkufiahan 2012/2013, yang berjumlah 51 orang. Perangkat asesmen alternatif menggunakan instrumen, yakni 1) tas untuk pre test dan post test (kemam.puan kognitif) dengan tipe essay bentuk carita kasus/masalah yang dialami konsumen dan dilengkapi dengan pertanyaan terbuka menggunakan jenjang kognitif analisis, sintesis,dan evaluasi, 2) lembar penilaiankinerja LKPBM
(kemampu~n.
psikomotor). ·yang dilengkapi rubrik
penilaian lembar kegiatan pembelajaran .berbasis masalah untuk penentuan skala
pengukuran,
3)
(embar penilaian
pengamatan/observasi
portofolio/makalah (kemampuan kognitif dan psikom<;>tor), pengamatan
aktivitas
diskusi
(kemampuan
afektif),
presentasi
4) lembar penilaian 5)
lembar
penilaian
dengan
lembar
kegiatan
pengamatan aktivitas ternan sejawat (kemampuan afektif). Pengukuran -r
pembelajaran
kemanfaatan
berba'sis
masalah
pembelajaran (LKPBM) .pada
mata 'kuliah
pendidikan
konsumen dikaitkan dengan pencapaian tujuan pembelajaran. Indeks keefektifan
171
pembelajaran akan diungkap melalui dua hal pokok yaitu 1) tingkat persentase mahasiswa yang mencapaitingkat penguasaan tujuan, dan 2) persentase ratarata penguasaan tujuan oleh serr··~·Jamahasiswa.
Penelitian ini menggunakan
jenis penelitian deskriptif. Menurut pendapat Kemp (1985 : 230) tingkat kecermatan yang bisa ditoleransi sebagai ukuran kefektivan pencapaian tujuan apabila 80% mahasiswa .mencapai skor 75 dari kriteria minimum pencapaian tujuan yang ditetapkan. Penelitian ini menggunakan teknik analisis deskriptif kuantitatif dan kualitatif. Kriteria penilaian untuk proses pembelajaran yang terdiri kegiatan diskusi, presentasi
lisan,
maupun
aktivitas
kegiatan
penyusunan
makalah
yarlQ
digunakan adalah:
Tabel 1. Kri~~ria Penilaian No' 1
Rentang skor .
Kategori
4
95 -100 85-94 75-84 62-74
5
< 62
SangatBaik (S8) Baik (B) Sedang (5) Kurang (K)· Sangat Kurang (SK)
2
3
HASIL PENELITIAN DAN PEMBAHASAN
Hasil penelitian 1.. Pencapaian Kemampuan Berp·ikir Kritis Ma·hasiswa Berdasarkan hasil analisis data yang diperoleh penelitimenunJukkan bahwa hasil pencapaian kemampuan berpikir mahasiswa adalah sebagai berikut.
Tabel.2. Hasil Pencapaian Kemampuan Berpikir Kritis No
Indikator Kemampuan Berpikir Kritis'
1.
Merumuskan topik berdasarkan sumberdan identifikasi 78,69 masalah Menyusun Jatar belakang masaJah berdasarkan harapan 75,38 dan fakta yang terjadi Merumuskan masalah yang sesuai dengan hasil analisis 77,12 penyebab dan tindakan untuk solusi pemecahan Menjawab pertanyaan dari permasalahan berdasarkan data, fakta, hasil perigamatan dan pengalaman, meliputi: a. Merumus~an sudut pandang penyebab m~salah dan tindakan dari sisi konsumen dan.produsen 82,79
2
3 4
172 .•
'i..
Mahasi~wa
Re'rata Skor
.
..
5 6
7 8
b. Memberikan penafsiran solusi pemecahan dan manfaat menerapkan salusi sesuai dengan wacana makalah Menggunakan batlasan logls, runtut dan benar Menerapkan prinsip-prinsip hak dan kewajiban untuk perlindungan konsumen berdasarkan pustakalreferensi yang dirujuk Memberikan kesimpufan sesuai dengan permasalahan yang dibuat Membuatimplikasi dan saran
81 83,7 78,68
82,32 85,26
Berdasarkan hasil tabel di atas diperoleh skor rata-rata pencapaian kemampuan berpikir kritis ditunjukkan pada setiap indikator yang diwujudkan dalam pembuatan makalah/artikel tert)adap kasus p~rmasalahan konsumen yang tidak memiliki kesadaran untuk menerapkanhak-hak dan tanggung jawab konsumen serta perlindungan konsumen pada saat berkonsumsi. Ditinjau dari tiap indikator kemampuan berpikir kritis hasil lembar kegiatan pembelajaran berbasis masalah, indikator 'membuat implikasi dan saran yang sesuai agar tidak mengalami kesalah berulang' mempunyai rata-rata' skor tertinggiyaitu 85,26, dan indikator 'menyusun latar belakang mesalah berdasarkan harapan dan fakta yang terjadi' mempunyai rata-rata skor terendah yaitu 75,38. Biladitinjau darihasil capaian kegiatan pembelajaran berbasis masalah (LKPBM) yang diwujudkan dalam bentuk makalah/artikel, menunjukkan tingkat berplkir kritis mahasiswa. telah mencapai 100% dengan rerata skor nitai di atas 75 yang ini merupakan batas kompetensi minimal bila ditinjau dari konversi nilai
di perguruan tinggi mencapai skor B (71 - 75),nampak bahwa kegiatan pembelajaran berbasis masalah dalam asesmen alternativebermanfaat untuk
melatih kemampuan berpikir kritis niahasiswa.
2. Kemanfaatan LembarKegiatan Pembelajaran Berbasis Masalah pada Mata KuJiah Pendidikan Konsumen untuk Menguku~'Hasil Belajar Proses Pencapaian Kemampuan Berpikir Kritis Berdasarkan informasi yang diperoleh peneliti dari hasil analisis data menunjukkan bahwa 'ha~il p.~mbelajaranyang menggunakan lembar kegiatan pembelajaran berbasis masalah skor rerata pada penilaian proses pembelajaran
173
adalah sebagai berikut, pada kegiatan diskusi (84,7), prese,ntasi lisan (80,5), dan penilaian ternan sejawat (82,78). Dari ketiga aspek ,~ersebut diperoleh skor rerata ~
adalah 82,4. Berikut ini h'asil perolehan data secara rinci: Tabel. 3. Hasil,Peniiaian Proses Pembelajaran Menggunakan LKPBM No
Hasil Penilaian Proses PL TS 82 86 82 79 73 92
2
D 86 88
3 4,
90 ,86
5, 6, ' 7
'90 71
79
8
83
82
9
85
10
82 61
,1
X
84 83 88
81
85,
84
86 78
84
87
86 85
69 72
79
83 83
83
83
81
79
60
89 86
86 85
94 " 82
82 66 90
85 91
80
85
81
86 75
79
79 83 74
76'
87
89 89
87
73
~,
11 12' "
13 14 15 16 17 18
19
20 21 22
90
:. 88
86 90
93
90 87 83
"l..
86
82
86'
85
86 83
84
84 85
84' 76
79
68
87
83
24
84 91
61
76
25 26 27
77
94
87
77
72
66
87
89
80
71 85
28
77
77
29
88
82
30 31 32 33 34
84 86
79 76
92
84
77 88 86 87 93
93
86
92
90
83
73
79
35
83
88
84,
78 85
36
93
90
84 85
86 84
93
37
84
79
85
77
79
77
84 83 77
174 ..
84
88
23
38 39
..--
84 83
.1_:..
T
77 86 83 83
89
87
73
80
40 41 42 43 44 45 46
85·
82
86
84
81
74
78
77
83 79 89 78
86
81
63
47
86
·75 85
48·
87
70
49
85
50 51 X
80
1
82
77
79
62
76 79
87
84 85
79 84 85 79 79 '85
82 85
88
8~
93
88
84,7
80,5
82,78
82,4
.,
85 78
Keterangan: 0 = Diskusi; PL = Presentasi Lisan; TS
=Ternan Sejawat;
X= skor rerata
Apabila dik?iji lebih
rinci,
bila
ditinJau dari
hasil penilaian
proses.
p~mbelajaran yang mengfiunakan lembar kegiatan pembelajaran berbasis
masalah menunjukkan 94
%
mahasiswa telah mencapai rerata skor nilai di atas
75 sebagai bata~ kompetensi minimal bila ditinjau dari.konversi nilai di perguruan tinggi mencapaj skor B (71 - 75). Hasil sko·r rerata ini merupakan
peng~abungan
skor rerata dari kegiatandiskusi, presentasi lisan makalah dan penilaian keaktifan oleh ternan sebaya. Halini menunjukkan bahwa lebi~ dari 80 % mahasiswa telah ·mencapai kompetensi kemampuan berpikir kritis, oleh karena itu dapat disimpulkan bahwa penggunaan lembar kegiatan pembelajaran berbasis masalah memiliki manfaat yang baik.
3. Kemanfaatan Lembar Kegiatan Pembelajaran BerbasisMasalah pada Mata Kuliah Pendidikan Konsumen untuk Mengukur Hasil Belajar Kemampuan Berpikir Kritis Ditinjau dari perolehan skor akhir yang dicapai mahasiswa, pembelajaran dengan menggunakan LKPBM dalam asesmen alternative bermanfaat untuk melatih pembuatan makalah berbasis kasus, hasil pencapaian berpikir kritis mahasiswa baik dengan skor r~rat~ sebesar" 80,9. SUa ditinjau secara rinci perbandingan perolehan skor rerata pretes sebesar 50,6 dan perolehan skor
175
rerata
postest
sebesar
81,7
menunjukkanbahwa
pembelajaran
yang
menggunakan LKPBM dalam asesmen alternative memiliki kemanfaatan dalam pencapaian kemampuanberpikir kritis mahasis'wa., Kalau digabungkan perolehan skor untuk 'mengetahui hasil nilai akhir setelah pembelajaran yang menggunakan LKPBM dalam asesmen alternative, pencapaian rerata skor nilai akhir (NA) dari kegiatan proses dan produk, juga menunjukkan 94% mahasiswa telah mencapai skor di atas 75, maka dapat disimpulkan pula bahwa penggunaan LKPBM dalam asesmen alternative· bermanfaat .dalam pencapaian kompetensi berpikir kritis mahasiswa.
PEM'BAHASAN Tujuan dari pembelajaran yang menerapkan asesmen alternative akan membantu mahasiswa dalam ·mengembangkan kemampuan berpikir kritis dan keniampuan. laninnya (me·mpresentasikan, berdiskusi, aktivitas) mahasiswa dapat mengajukan
pertanyaan-p~rtanyaan
sehingga
kritis yang dipecahkan
saat pembuatan makalah dan presentasi makalah ketika berdiskusi. Dalam
pembelajaran dengan mengimplementasikan asesmen alternative berbasis masalah pada mata kuliah pendidikan konsumen, membuktik 'mahasiswa dHibatka,n secara fisik maupun psikis dalam menyelesaikan rumusan masalah yang mereka aju~an seperti pada tugas yang tertuang dalam Lembar Kegiatan 'Pembelajaran BerbasisMasalah kasus k'onsumen tentang kesadaran hak-hak dan
tanggung
jawab' konsumendan
perlindungan
konsumen.
Melalui
kemampuan berpikir kritis, mahasiswa dapat me"nggali dan menemukan sendiri .
"
.
jawaban atas pert~nyaannya sesuai dengan berbagai permasalahan konsum(3n yang riel terjadi di masyarakat. LKPBM dalam sesmen alternative dapat meningkatkan kinerja maupun kemampuan berpikir mahasiswa. Hal ini terlihat pada signifikansi per.bedaan secara deskriptif dari masing aspek indikator berpikir kritis antara skor rata-rata pretes dan post,es.Nampak bahwa hasil rerata terendah dalam penilaian pretes 'flfl
"
kemampuan mahasiswa dalam 'membuat .implikasi saran tindakan untuk
176 -,. 1
memberikan solusi yang sesuai dengan' permasalahan' skornya 40,37 apabila dibandingkan dengan aspek yang lainnya. ~etelah pembelajaran berlangsung di
addka~l pastes yang hasilnya dapat'meningkat m'enjadi 87,26. Secara signifikan dapat terlihat bahwa terdapat peningkatan positif pada setiap aspek penilaia,n berpikir kritis mahasiswa antara hasil. penilaian prates dan pastes 'selama penelitian.
Hal
ini
disebabkan
bahwa
proses
pembelajaran
merupakan
penggabungan pembelajaran meliputi: 1) ranah psikomotor terdiridari,; kinerja siswa berupa LKPBM"2) ranah afektif teridiri dari diskusi, presentasi lisan, dan
aktivitas mahasiswa melalui ternan sebaya,. 3) ranah: kognitif berupa pemberian tas.
Hasil penilaian prete's, terjadi peningkatan karena· adanya ketertarikan mahasiswa mencoba, hal-hal yang baru berkaitan sebagai pengaplikasian konsep yang ada, mencari masalah ,.dan mengolah, informasi, sehingga pengetahuan yang mereka miliki lebih' bermakna dapat mendarong minat dan motivasi mahasiswa dalam' pembelajaran., Hal: ini berkaitan dengan pendapat yang dikemukakan ol.eh"Sanks (1978) yang menyatakan bahwa bentuk kegiatan pemecahan masalah social. secara individu maupun kolektif merupakan tuntutan kemampuan
oleh seorang
aktor sosial
yang
baik dalam
kehidupannya
bermasyarakat. Tuntutan tersebut adalah menga,mbil keputusan secara nalar atau well informed' and reasoned decision making. Kemam'puan pemecahan masalah diperlukanoleh peserta didiklmahasiswa karena manusia' sebagai homo sapiens, kecerdasan terbentuk' dalam diriindividu dan', konteks social budaya, curiousity sebagai proses kecerdasan, dan pemecahan
m~salah
merupakan wahana berpikir kritis-reflektif. Peningkatan rata-rata tersebut dimungkinkan mahasiswa telah terlatih bagaimana mereka berpikir sehingga menjadi lebih kritis dalam memecahkan" masalah yang' ada dalam pembelajaranberbasis masalah. Hal inisejalan dengan pendapat Beyer dalam Costa (.1985) menyatakan bahwa dalam melatihkan kemampuan berpikir' kritis perlu diberikan saran dan perbaikan pada
hasil berpikir siswa.
177
Periggunaan·:.. asesmen alternative dengan LKPBM pada pembelajaran pendidikan konsumen bermanfa·at untuk meningkatkan pencapaian ~emampuan berpikir kritis mahasiswa, hasil postes' menunjukkan 94% mahasiswa memiliki skor 75 yang setara dengan nilai B. Implementasi asesmen alternative dengan LKPBM pada pembelajaran pendidikan konsumen mempunyai potensi yang baik untuk meningkatkan
kemampuan
berpikir
kritis :mahasiswa
pada
pokok
bahahasan' kesadaran ha'k-hak konsumen dan tanggung jawab konsumen yang tertuang dalam··perlindungan konsurnen. Peningkatan pada' kemampuan berpikir kritis ini didasarkan hasil Nitai Akhir yang merupakan penggabungan antara nitai proses dan produk pembelajaran seria hasil tes yang telah dicapai oleh mahasiswa. H~sil juga menunjukkan94%nilai . akhir .yang· dicapai mahasiswa dengan skor di atas 75~· Hal .ini berkaitan dengan pendapat Paul dan Elder dalam Inch·et a.l. (2006) yang menyatakan bahwa 'gagasan'kritis memuat implika·siyang merupakan akibat dari bernalar dan berpikir. Berpikir kritis :bukan suatu itentitas tunggal melainkan proses untuk meng·hasilkan sesuatu.· LKPBM yang tetah dilaksanakan dapat. mempermudah mahasiswa daJam
memaham.i materi pembelajaran danmereka menJadi terlatih d·alam mengkritisi m'asalah sQcial dan berani melaku~an komunikasi seria bekerjasama dengan ternan padasa·at diskus.i maupun presentasi laporan kasus konsumen di masyarakat, data diperoleh. berdasarkan hasil angket mahasiswa. Sebanyak 25% mahasiswa menanggapi sangat. setuju dan 75% mahasiswa setuju mengimplementasikan
asesmen
alternative
pada
pembelajaran
berbasis
masalah. Situasi belajar yang'.: menyenangkan, mendorong minat· dan motivasi belajar mahasiswa (Roth dalam Wulan, 2003). Dapat dikatakan bahwa penggunaan asesmen alternative dengan LKPBM daJam pembefajaran pendidikan konsumen berbasis masalah dapat melatih kemampuan berpikir kritis mahasiswa. Temuan ini mendukung pendapat Rustaman, et al (2005) yang mengatakan nahwa proses' belajar mengajar .dengan
melakukan kinerja mening'katkan
--... .•
i.
178
keberhasilan
mahas'iswa dalam
..
pembelajaran. LKPB'M merupakan bentuk tugas yang harus dikerjakan oleh para mahasiswa dalam mene'laah permasalahan konsumen. -.Id,
KESIMPULAN 1. Kemampuan berpikir kritis mahasiswa secara keseluruhan dari 8 aspek yang
diukur, menunjukkan telah mencapai 100% dengan rerata skor nilai di atas 75 yang ini merupakan batas kompetensi minimal bila 'ditinjau dari konversi nilai di perguruan tinggi mencapai skor B (71 - 75). Untuk membuat implikasi dan saran dalam pembuatan makalah kasus permasalahan konsumen pada
mata kuliah pendidikan konsumen mencapai rata-rata skor tertinggi yaitu 85,26, dan indikator 'menyusun latar belakangmasalah berdasarkan harapan dan fakta yang terjadi' mempunyai rata-rata skor terendah yaitu 75,38.
2. Lemba'r kegiatan pembelajaran berbasis masalah dalam asesmen alternatif memiUki kemanfaatan yang baik untuk mengukur hasil penilaian proses kemampuan berpikir kritis mahasiswa sebesar 94%, Hal ini menunjukkan bahwa lebih dari 80% mahasiswa telahmencapai kompetensi kemampuan
berpikir kritis. bagaimanakah kemanfaatan lembar kegiatan pembelaJaran berbasis
masalah
dalam
asesmen
alternatif
untuk
mengukur
hasH.
kemampuan berpi'kir kritis mahasiswa. 3. Memiliki kemanfaatan yang baik lembar kegiatan pembelajaran berbasis masalah dalam asesmen alternatif untuk melatihkan kemampuan berpikir kritis mahasiswa sebesar 940/0 mahasiswa telah mencapai skor di atas 75.
DAFTAR PUSTAKA Inch,
E.S. Warnick, B, dan Endres, D. (2006). Critical Thinking and Communication: The Use of Reason in Argument. 5 Ed. Boston: Pearson Education. Inc
Johns:on. E.B. (2000). Contextual Teaching and Learning. California: Corwin Press. Inc
-
,.
179 ..
i..
Kurniati, T. (2001). Pembelajaran 'Pendekatan' Keterampilan Proses Sains untuk Meningkatkan Keterampilan Berpikir Kritis Ma.hasiswa.Tesis pada SPS Upi. Tidak diterbitkan ", Martinis yamin. (2009). Strategi PembeJajaran Berbasis Kompetensi. Jakarta: Gaung Persada Press Pophan,W.J (1995). Classroom Asessment: What Teacher Need to Know. Basta:
Allyn and Sac,?n Stiggins, RJ. (1994). Student Centered Classroom Assessment. New York: Maxwell Macmillan International Simon & Schuster Company
180 .-..... 1.
MENI'N'GKATKAN KUALITAS KEGIATAN PRAKTIKUM FISI·KA DASAR DENGAN MENGGUNAKAN MODEL EVALUASI PADA MAHASISWA FMIPA Anneke Tienneke Rondonuwu Staf pengajar pada FPMIPA UNIMA
ABSTRAK Tujuan Penelitian ini adalah mendapatkan data tentang keefektifan penggunaan model evaluasi sebagai instrumen penilaian hasil belajar pada kegiatan praktikum Fisika Dasar. Meningkatkan kualitas pelaksanaan keg·iatan praktikum melalui ModeJ Evaluasi. Yang menjadi subjek dafam penelitian in; mahasiswa FMIPA mengikuti mata kuliah Fisika Dasar kelas B semester I sebanyak 38 orang. Metoda yang digunakan dalam p~nelitian ini adalah penelitian tindakan kelas. Teknik analisis data menggunakan data kualitatif dan kuantitatif. Mengalami kenaikan pada siklus II yaitu pada tahap persiapan sebesar 70,5 %, indicator melip"uti : persiapan Jawaban siswa atas pertanyaan yang berkaitan dengan rumusan masaJah, menyebutkan tujuan praktikum, jawaban berkaitan dengan teori dasar, menulis tabal data yang dibutuhkan,. tahap pelaksanaan 70,2 %, m"eliputi: manipulasi alat praktikum, pemiHhan alat praktikum, penyusunan alat.Pengamatan Ipengambilan data : pembacaan skala alat ukur dasar, pengulangan amatan. Sikap, tanggung jawab, keterlibatan meJakukan pra'ktikum, kerja sarna dalam keJompok, keaktifan., disiplin ~aktu dan pemiJihan alat praktikum~ Kolaborasi : Inisiatif, kerjasama, kepemimpinan, keterlibatan dalam kelompok. Tahap Pelaporan sebesar 75,8 %meliputi: sajian tabel pengamatan, ketepatan data, penggunaan sistem satuan, pengukuran berulang. Analisis data hasil pengamatan : penggunaan rumus,' sistemsatuan, prosedur/langkah menghitung ketepatan hasil hitungan, melakukanpengukuran berulang dan kesimpulan ketepatan membuat grafik, interprestasi, menyebutkan keterbatasan hasU kesimpulan, Kata kunci : Model Evaluasi, praktikum, Hasil belajar
PENDAHUUAN Fisika adalah
bangunan pengetahuan yang
mengambarkan
usaha,
temuan, wawqsan dan kearifan yang bersifat kolektif dari umat manusia. Disamping itu Fisika merupakan aktivitas manusia yrang, bertujuan rnenemukan
keteraturan alammelalui pengamatan, p·engukuran, dan eksperimen. Sebagai
-
,.
181
..
i;.
bangun pengetahuan fisika tersusun .atas konsep, fakta,prinsip, hukum teori. Sebagai aktivitasFisika. merupakan· cara berpikir yang sifatnya dinamis dalam
'i'angkah menemukan suatu ilmu. Praktikum Fisika dikembangkan dengan mengacu pada pengembangan Fisika yang ditujukan untuk mendidik siswa agar mampu mengembangkan observasi dan eksperimen sarta berpikir taat azas. Karena tujuan Fisika adalah mengamati,
memahami
dan
memanfaatkan
gejalah-gejalah
alam
yang
meJibatkan Zat(materi) dan energi. Kemampuan observasi dan eksperimen ditekankan pada melatihkemampuan berpikir danbernalar eksperimental yang mencakup tata laksana percobaan dengan mengenal peralatanyang digunakan dalampengukuran ·baik di dalam laboratorium maupun dialam sekitar. Fungsi eksperimen sebagai' proses 'verifikasi hipotesis yang diharapkan membentuk sikap ilmiah yang..kuat, sehingga untu~ pengetahuan yang bersifat fisis tanpa verifikasi observa'si empiris 'suatu
hipotesis
perlu diragukan' k~be.Darannya.
Selain itu melaluiverifikasi hipotesis dapat diperoleh dukungan terhadap kebenaran teori merupakan suatu aspek metode ilmiah. Fung·si. pelajaran fisika dalam kurikulum pendid~ika·n . qasar dan menengah adalah melatih mahasiswa ulituk membentuk kemampuan '!len'y~lesaikan masalah (problem solving) m'enyelesaikan secara kuantitatif deduktif menggunakan berbagai konsep dan prinsip fisika, melatih ma'hasiswa terhadap metode 'ilmiah melalui observasi eksperimen sebagai .kajian ilmiah dalam ra'ngkah mene·ntukan kebenaran teari atau kebenarai1 suatu pernyataan. Selain itu observasi gejalahfisika menyangkut peng.9unaan berbagai alat ukur besaran fisika secara benar, pengolahan data, dan
bagaimana
melakukan
interprestasi
data
menjadi
inform~si
dan
pengetahuan. Tugas seorang guru mengevaluasi atau menyiapkan sebuah perangkat evaluasi untuk menilai hasil belajar siswa misalnya dalam melakukan kegiatan eksperimen pada matakuliah Fisika Da~.~r. Fakta di lapangan, selama peneliti .menga·suh kegiatan praktikum:· Fisika· dasar belum memiliki format baku untuk penilaian kegiatan praktikum. Proses
182 '.' --.. 1
·..pengevaluasian hasil praktikum siswa di laboratoriumhanya mengarah pada kinerja siswa (ranah psikomotor) tanpa memperhatikan dua ranah afektif dan kognitif sesuai dengan ranah
yang dikemukakan Bloom. Masalah yang' lain
adalah tidak adanya format standart penilaian yang sesuai dengan jalannya praktikum yang digunakan dosen untuk menilai proses pelaksanaan praktikum. Demikian pula tidak. dapat mengidentifikasi dengan benar mahasiswa yang dapat melakukan praktikum dengan baik. Faktor inipun berimbas pada penilaian hasil praktikum mahasiswa sebagai praktikan yang mempunyai tingkat kemampuan yang berbeda 'hasilnya sering tidak sesuai dengan apa 'yang diharapkan. Evaluasi merupakan bagian yang sangat penting dan· strategis dalam proses belajar mengajar. Dengan adanya evaluasi dalam kegiatan pembelajaran, maka akan diperoleh masukan. untuk memperbaiki kegiatan belajar tersebut. Oi samping itu akan diketahui kekurangan dan kelebihan dari berbagai komponen dalamproses belajar termasuk di dalamnya kegi~tan praktikum. Definisi yang dikembangkan oleh 'Ralph Tiler mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan
~ejauh
mana tujuan pendidikan
dicapai. Jika belum apa yang menyebab·kannya.Definisi yan.g lebih luas dikemukakan dua orang ahU lain, yakfli Crombach dan Stufflebeam adalah proses evaluasi bukanlah sekedar mengukur sejauh mana tujuan tercapai, tetapi digunakan untuk membu~t keputusan (Suharsini, 2003;3). Menurut Irawan (1997) dalam Trianto (2007) ada tiga manfaat evaluasi, yaitu
pertama,
untuk
memahami
sesuatu,
membuat
keputusan,
dan
meningkatkan kualitas pembelajaran, kedua evaluasi adalah untuk mengambil keputusan,
ketiga
untuk
meningkatkan
kualitas
pembelajaran.
Sebelum
melakukan kegiatan praktikum seorang dosen sebaiknya tatah memiliki format sekaligu5 memahatni indikator-indikator .yang menjadi fokus penilaian. Model 'evaluasi yang digunakan dalam penelitian ini diharapkan dapat menjadi acuan untuk menilai kegiatan ,praktikum. Pentingnya alat evaluasi ini adalah sebagai acuan bagi dosen untuk menilai tingkat keberhasilan: ma~r~siswa
. dalam
merencanakan, melakukan dan menyimpulkan hasil praktek di laboratorium.
183
Adapunlandasan atau ha'·I-hal yan'g haru's diperhatikan dalam men·yusun sebuah perangkat evaluasi sebaiknya indikator yang digunakan mengacu pada tiga ranah . yang menjadi tujuan dari pembelajaran· yakni kO'gniti~ efekti~ dan
psikomotor. Model evaluasi sangat cocok digunakan untuk meningkatkan kualitas
kegiatan
praktikum
Fisika
Dasar,
sekalig.us
menguji
efektifitas·
penggunaannya dalam kegiatanpraktikum fisika'dasar d·; jurusan Biologi. Rumusan menggunakan
masalah,-
dalam
peneJitian
ini
a'dalah
model evaluasi dapat meningkatkan
apakah. d'engan
kualitas
pelaksanaan
kegiatan 'praktikum ? Tujuan penelitian in'; adala'h .·men:dapalk·an data. tenta·ng keefektifan, penggunaan
model ·evaluasi pada:kegiatan
prakti·kum
untuk
diguna'kan sebagai rn:strum'en penilaia'n h·asil belajar pada kegiatan praktikum Fisika Dasar.
Meningkatkan kuafitas pelaksanaan kegiatan praktikum melalui
Model· Evaluasi" . didasarkan pad·a.
indikator-indikator ya;ng· mel:ip'uti' : ta.h·a·p
persiapan, tahap pelaksanaan. dan ..tahap
pel~poran
pada mahasi.swa FMIPA
Jurusan B.iologi angkatan 2010/2011 mata· kuliah Flsika Da.sar I. Manfaat pen·elitian ini adalah ·secara konsepsional peneliti.an ini dapat menjadi .acuan penifaian'
-. kegiatan' pra·ktikum karena terse·dianya format penll'aian'
dilengkapi dengan
indikator-ind.ikator
yang.
yangdievalua:s·j dan adanya, acuan
penila·ian. kegiata·n ·pra·ktikum Fis·ika Dasar ·di I.aboratori.um·..Daripeneliti·an i'ni' diperofeh acuan bentuk kegiatan praktik·um mel.alui model evalu'asi, mendorong
produktivita.s dosen da·Jam m·ela.ku:kan· kegiata'n' pra.ktik·u·m pada· nlata kuliah·. Fisika dasar.Penelitian ini juga membangunk.erja samadan m'embangkitkan tnoti~,,rasi.antai
deflgan·
tim pengajar 'Fi:sika Dasar untuk ·mengatas·i m'asal'ahberkaitan
kesufitan-kesufita'n
·rnelak·ukan
penilaian
kegiatan
praktikum.
Berda'sarkan uraian p·a.da Jatar b'elakan'g di atas mak.a pe·neHti terdorong tJntuk mengadakan pene·litian tentang meni.n·gkatkan ku·aHtas, pelaksan·aan kegiata'o pra·kti:ku·m· Fistka a·asar de.ng,an· :m·engg·unakan Mod.ef Evafuasi pa.da ma.hasi'swa: FMIPA.~
........... .. .
~
METODQLOGI PENELITIAN Penelitian ini dilaksanakan 'di FMIPA Jurusan Biologi.pada mahasiswa semester I Tahun ajarafi~ 201-0/2011.
Subjek dalam penelitian ini : adalah'
mahasiswa yang mengontrak. Fisika Dasar ' I pada, Program studi Pendidikan 8iologi Semester I Angkatan 2010/2011. Seluruh mahasiswa yang terlibat dalarn penelitian ini berjumlah 38 mahasiswa. Metode yang 'digunakan' dalam penelitian ini adalah peneJitian tindakan kelas.
Model Evaluasi, adalah 'seperangkat,instrumen penUaian nantes yang digunakan untuk penilaian' kegiatan praktiku.m: meliputi:, Persiapan yaitu: jawaban siswa· ata's' pertanyaan' yang berkaitan: dengan '. rumusan masalah, menyebutkan tujuan praktikum, jawaban berkaitan dengan te.ori ·dasar, menulis tabel yang dibutu.hkan. Pelaksanaan manipulasialat- praktikum: ·pemilihan alat praktikum
yang
penyusunan··
digunakan,
alat '.
praktikum.
Pengamatan/pengambilafl ,data: pembacaan s'kala alat ukur dasar,- pengulangan amatan. Sikap : tanggung jawab, disiplin waktu dan fasilitas. Kolaborasi : insiatif, kerjasama, kepemimpinan, keterlibatan dalam kelompqk. Tahap' Pelaporan
sajian ta.beldan pengamatan;" ketepatan penyajian data, penggunaan· sistem satuan, pengukuran rumus yang tepat,
digunakan,
sistem satuan yang
prosedur/langkah menghitung ketepatan hasilhitungan, melakukan pengukuran berulang, kesimpulan: ketepatan interpretasi, menyebutkan keterbatasan hasH kesimpulan, faktor-faktor penyebab keterbatasan hasil kesimpulan.
Aplikasi
konsep: ketepatan hubungan antara penyelesaian tugas dengan konsep, sistimatika, ketep~tan prosedur perhitungan, hasil penyelesaian tugas. Instrumen yang digunakan adalah lembar penelitian 'hasil belajar meliputi: soal ulangan harian dan lembar kerja peserta didik (LKP'D) (ranah kognitif».
Lembar penelitian
proses
belajar meliputi:
lembar penilaian
afektif dan
psikomotor.Teknik analisis data yang digunakan adalah analisis data kualitatif.
Tahap-tahap kegiatan
analisis~ata
(Miles & Huberman, 1992) adalah 1),
Mereduksi data, 2).· Menyajikan data, 3). Menarik kesimpulan d~n':{erifikasi.. Setelah datadireduksi, maka langkah selanjutnya adalah mendisplaykan. data.
--
1.85 .•
.
'j.
HASIL PE·NEUTIAN DAN' PEMBAHASAN,
A. Hasil. Penelitian .
Penel~Jan·
ini dilaksanakan pada mahasiswa' jurusan biologi FMIPA tahun
201012011 semester I denganjumlah mahasiswa sebanyak 38 QraIlQ. Materi . pada siklus pertama. mempelajari: topic deng.an: judUl praktikum ·koefisien gesekan
dan Viscositas Zat. cair Kental-.. Dinilai dengao: menggunakan.
yang tetah dikembangkan pada penelitian' ~
model evaluasi
sebelumnya dengan· jJdUI
Pengeml>angan. Model Evaluasi ..dalam· Meningkalkan Kualitas Pembelajaran
Keg'iatan' Praktikurn' (Sumaljono··. dkk. .1.999~ .Rondonuwu~.Daya Saden· 20Q9}.. J
Lembar Kegiatan; Peser1a·. Didilc ·(LKPD}.~irancang::berdasarkan· model, evakla$ij.
nlembuat.lembar 'observasi: :·untuk;:·mahasiswa·dan ·dosen~. Model Evaluasi rincian:..kegiatan adalah. sebagai berikut : 1. 'Kegiatan a~: persiapan··praktilwm, dimana' siswa. =dibekati· dengan. teori"dasac ......... .
sebelum· pelaksanaan praktikum.. agar mereka·: dapat menernukan· masalah . a.pa yang ditem'ui' didafamnya, hubungSn" antara. ~riabf.e dalam" perhitungan
matematisnya atauapfikasinya. dalam kehidupan sehati-ttari~ Demikian halnya dengan peraturanlprosedur
~ng
hams. dilakukan: Je"aktikan selamaproses
praktikum..
2. Pe;laksanaan· praktikumadalah ·kegiatan dimana siswa·. diaf:3hkan untuk memanipulasi 'alat praktikum,. peng.amatan· dan .peng8mbilan data" sikap dan:
kebiasaan· kerja dan kerjasama·· dalam· 'keIompok~ . 3~ Kegiatan akhir : ~bimbing peserta didik membuat Iaporan praktikum berisi
hasif. percobaanlpraktikum yang mencakup .penyajian: data., analisis" penarikan· kesimpulan~ aplikasi konsep
dankomunikasi sesuai deng'an model evaluasi..
Pada. akhif' siklus, pertama'
dan
hasil·. pengamatan disimpufkan-t perlu
dilanjutkan,.pcida. siklus II, pada' siklus pertama ditemukan : a. Persiapan cenderung belum mencapai ketuntasan belajar karena perolehan
rata-rata kesefuruhan· indiCator hanya mencapai 57·, %. Jawaban pertanyaan:. yang· berkaitan: d'engan:· rumusan· l11as.alah rata'-rata hanya' [,·f·
.
mas. 15·.5~
Menyebutkan .dan menutiskan rumusan· tujuan praktikum rata:-rata· hanya 13t4
186~ ..-- .•
..
i..
%. Jawaban ata.spertanyaan yang berkaitan dengan teari dasar rata-rata 13,6 0/0. 'Menuliskan table data yang dibutuhkan dalam praktikum rata-rata' hanya '14,5%. b. Tahap pelaksanaan cenderung belum mencapai ketuntasan belajar karena perolehan rata-rata keseluruhan indicator hanya mencapai 5'5,5 %. Indikatorindikator yang diamati: pemilihan alat praktikum yang akan digunakan ratarata 5, penyusunan alat praktikum 5,5,
pengambilan data 5, aktif 'dalam
kegiatan kelompok 7 dan kerja sarna dalam kegiatan
kelompok 6. Tahap
pelaporan indicator-indikator pada tahap hii meliputi sajian table pengamatan memperoleh nilai rata':'rata 4,5, perhitungan data pengamatan' sesuaidengan persamaan yang ada rata~rata sebesar 6,5, membuat hubungan antar besaran perolehan nilai rata-rata a·dalah 8,5, membuat interprestasi rata-rata 7,5 .
Pengamatan pada siklus II Karena tidak mencapai nilai ketuntasan maka dilanjutkan pada siklus berikutnya,
dengan memilih judul percobaan Kalorimeter, sed.angkan cara
pengamatan dan actor tindakan sarna dengan siklus I. Tahap Persiapan. Hasil pengamatan menunjukkan bahwa keseluru"han indicator pada tah'ap persiapan ketuntasan belajar mencapai 70,5 % berarti mengalami kenaikan. Indicator indikator yang meliputi jawaban· mahasiswa atas pertanyaan yang berkaitan dengan rumusan masalah rata-rata 16.6. Menyebutkan dan menuliskan rumusan tujuan praktikum rata-rata 18.5. Sedangkan
jawaban atas pertanyaan yang'
berkaitan dengan teori dasar rata-rata
17.5. Membuat tabel data yang
dibutuhkan
17.5.
·dalam
praktikum
rata-rata
Tahap
pelaksanaan
HasH
pengamatan pada tahap pelaksanaan mencapai ketuntasan sebesar 70,2 0/0. ,Masing-masing indicator adal'ah sebagai berikut : pemilihan alat praktikum yang akan digunakan rata-rata dan penyusunan alat praktikum rata-rata 17,3 pengam'bilan data rata-rata 16,5 a·ktif dal~m kegiatan kelompok rata-rata 18,8, sedangkaJ)
penga.mbilan
data
rata-rata
17,6.
Tahap
Pelaporan
hasil
pengamatan pada tahappelaporan keseluruha·n indicator mengal:ami ketuntasan
--. ..
..
~
sebesar 75,8 %. Ma'si'ng'~masing in·d·icator-· adatahca·pa:ia'n,nya·: a'd:ala:tl- sebag:ai berikut
:sajian tabel d·ata· pengamatan rata-rsta.. 1:4..4, perhitu·n.g.an data
pengamatan sesua·j dengan persamaan yang ada· rata-rata· sebe.sar· ·14'.8, "
membuat hubunga'n .antar besaran rata-rata 15.5, m'embuat interpretasi ratarata 14.5 sed·a·ngka·n. untu.k penyefesaian tugas' rata-ra.ta·1:6;.6. B. Pembaha:san Model evaluasi adalah
seperangkat instru'men p.en·Uaian· nantes yang;
digunakan olehdosen· untuk me·ngadakan peni:~aian terhad~p:" keseluruh·an
kegiatan
prak:tj-k·u:~.
indicator-in.dikator
berda.sa.rk~n
(Suma-ryono, 19:99).. p'enilalan, yang dUaku,kan·
.y~ng
telah. ditetapkan.
Ke~ng'ul~n-keu'ngul~n'
dari· model
Evaluasi' adalah model evar.uasi yang dig.unakan daJam kegiatan praktikum yang terdlri dari tiga tahap
yaitu. tahap persiapan,. ta'h'ap peta.ksa;na-an: dan tahap
perlaporan denga:n indicator yang tel·a.h ditetapkan; ternyata' dap:at membuat s'iswa aktif,
kr~atif dan
m.emiliki sikap ilmiah.
Model Evaluasi meliputi· indicator-indikator sebag'ai;
b.~.rikut;
m:ahasiswa
dapat manjawab pertan'yaan ·yang berkaitan dengan.. rumusanma:sala'h, dapat menyebutkan· dan menuJiska.n rumusan tujuan prakti~umt dapa.~ m.enja.wab
pertanyaa·n yang berkaitan '<;fangan teoridasardan da'pat membuat tabel data: yang dibutuhkan. da.lam praktikum. Tahap
:memilih alat
pra~ik·u.m· yang
peJaksan~ant
mahasiswa terlatih u'ntuk
akan diguna;kan,.d·apatme.nyusu~ atat.praktikum,
mengambil data dan aldif dalam kegiata:n kelompok. -Taha'p pelaporan' mel'atui
. kegiatan pengamatan, perhitungan data pengamatan sesuai dengan persamaan
yang. ada, mahasiswa· dapat membuat hubungan antar besaran,
membuat
interpreta.si, da;n' dapat menyelesaikan tugas. Pro.sedur i1miah inHah yang harus diJakukan oleh seorang . fisikawan digu.nakan untukpem'ecahan rna·salah. Hal ini
merupa'kan a·spek p.enting dafa·m belajar fisika. M'ahasiswa lebihmema,hami materi pelaj.aran ya'ng diaj-arkan melalui suatu ·prosedur, terl.atih mengg'unakancara berpik.ir Hm,iah d'an dap'at mengenera·lisa·si melalui kegiatan percobaan sehing'ga kon.sep-konsep yang. diperoleh siswa lebi.h
Jef'as ka~ena didu.kun:g· ofeh pengalaman nyata d.eng·an meng.gu:nakan tahapan-
.~
... 1..
'J.>
.
tahapan sesuai dengan panduan yang ada pac;ta, format penHaian,' Model Evaluasi. Hasil
yang diperoleh melalui kegiatan p'engamatan :Iebih teliti, hasil
dapat dicatat lebih sistimatis. . Pada siklus II tahap persiapan sebesar 70,5 %, tahap pelaksanaan 70,2
OJ'<>
dan tahap pelaporan sebesar 7'5,8 %. Hasil in'i m-enunjukkan model 'evalua'si sangat efektif digunakan dalam kegiatan praktikum. Keberhasilan da'lam'pe·nggun·aan modeleva'lua'si ·tergambar bahwa ·format yang digunakan sesuai dengan kebutuhan penilaian kegiatan praktikum dengan mengacu pad'a' Taxonomi SI'oom ya:n·g·: meliputi ra:nah'kognitif, ran'ah afektif' d'an psikomotor. Aspek-aspek ini umumriya' berkemb'ang' d~lam diri mahasiswa
wala.u·pun- pad·a' sik1.us I :hasUnya relatif rendah hanya 5:9,5 % namun setelah kegiatan pada siklus II menunjukkan kenaikan rata-rata 70 % berarti sudah
mencapai' ketunta·san· wal'aiupun' mq,sih ma-suk pada· k·ateg.ori
seda·ng:~ .
.. Sedangkan aspek afektif mengalamipeningkata.n: sepe.rti kerja- sarna· d~lam
'keJompok,' kepedulian ada ide.-ide yang dikembangkan, keaktifa'n dalam
kegiatan praktikum. Dan muncul ide-ide cemerlang, inovatif, mandiri .dan 'menyenangkan
d·al:a·m
pel.aksanaa·n.
pra,kti·kum..
Slkap-sika-p-< inllah· . periu
dimunculkan dalam dunia sains seperti fisika. Dengan demi'kia'n disimpulkan pula·
bahwa model eval:uasi :sangat efe·ktifdi,g·u.naka·n- dalam pel·a·ksa·naan kegiatan pra,ktikum Fisika Das'ar I dengan jUdul pra·kti.kum ko.efisien gesekan,viscositas
zat cair kenta·J da·n· ka·l-ori,met'er. ·S·IMPULAN DA'NREKOM.E·NDASI A.·Simpulan
1. P'enggunaa'n Mod'el Eva-lu'asi da'lam, kegiatanpraktikum: ,Ffsika: Da'sar mah?lsiswa
jurusan
Pendidikan
Biologi
dapat
mening'katan
r pa·da
kU'alitas
pelaksan'a:an kegiatan ··pra·ktikum· pada' perco·b.aan Kalorimeter, v'iscositas. zat cair kental dan koefisien gesekan. Ha" ini d'iket~hui dari perolehan nilai hasiJ beJ.ajar m.engal·ami kenaikan pada· pad:a ta:ha·p· p:ersiapa.n sebesar ·7~O,.5 %-'1";;
ta,ha,p pe·laksanaa·n 70,2 %t' dan tah'ap pelap.ora.n seb·esar 75,8. %-
189 --.....
..
i...
2. Penilaian deng.an mengg.un·akan pada Model:' '. Evalu8.s1 pa'd'a:: ·mah·a:$iswa. FMIPA Jurusan Biol.ogi pada. tiga, Ju.d·ul praktikum tersebut .diatas -dinyata,.k·a:n: efektif digun·akan daiam kegiatan pra:ktikum Fisika .Da·sar. Hal inl dis·ebabka·n.
m'ahasiswa
terlibat langsung tahap' ·demi -tahap ses,.u·aideng·an. indicator-
·indikator dal-am ·kegiatan praktikum. B. Re·komendasi
1," M·ode.IEvaluasi dapat digunakan ·do·sen· sebagai acua.n pe·nif.aia:n kegJatan:
praktiku.m F.isika Dasar I di faboratori.um· . 2. Penggunaan Model Evalua:si dalam; pela:ksanaan:' ·kegiatan pra.ktikum·· b.ag·i mahasiswa sangat efektif dalam ·m:em·bangkitkan kreatifitas, aktif dan membangk'itkan belajar mandiri ·karena indicator-in.dikator penilaia'n' da·n. tahapan-tahapan yang d'ilakukan· .:sa·n·ga.t jelas~ 3,. Perlu . dilakukan: ·penelitia.n lanJuta·n. tentan·g· keefe;ktifan pengg'unaan model: eva·luasiini .pada ju.dul pra·kti·kum yang' lain.
DAFTAR P·USTAKA· Arikunto, S. Prosedur Penelitian ·Suatu Pendekata·n ·Praktek. Jakarta·: Rineka Cipta.1998
Ah.mad Abu Ham·id·. Penelitian Tind~·kan, Penelitian Kalas dan Penel/lian Tindakan Kelas.P2lS FMIPA UNY. 2009. Daya Saden, Penggunaan Model E.valuasi Pada Pelaksanaan Praktikum F/sika Dasar. Unima (tidak dipublikas.ikan).
EUiot, J., Action Research for Educational Change:, MiJton Keynes : Ope·n U.niversity ·Press. 1991 J.B. 'Moningka. Petunjuk Praktikum Fisika Dasar I·. Jurusan· Fisika, ·FMIPA;
UNI·MA (tida'k dipubHkasik~n) 20'09' Kem'mis', Ste.phen and Robin McTaggart, The Action Research· ·Planner, Third Edition:Deakin University. (1992)
Kuna·nda.r. Penelifian TindakanKelas. Raja· WaH Pers. J.akarta·. 2008. !i!1
.
190'
- .. •
f..
Suharsimi Ari-kunto. Dasar-Dasar E.valuasi Pendidikan. Jakarta: Bumi Aksara. 2003
Supri.yadi..
Kajian
Penilaian
Pencapaian
Be/ajar
Fisika.
Uni'vers'itas
Yogyakarta'2003 Suma~ono
dkk.. Pengembangan Model Evaluasi Kegiatan Praktikum Fisika Oasar, FMIPA IKIP Malang. Lem'baga PeneHtia-n' IKIP Mala·ng . 1999
Trianto,. S.Pd.,M.Pd. Model
Pemb~.lajaran
Terpadu' Da/am Teori dan pra·ktek.
J.akarta: Prestasi Pustaka Pu·.b·Usher. 2007. _ _ _ _ . Petunjuk- Teknik Pengemban,gan.'Silabus: dan ContohlMooel Silabus~
J.akarta: Bad'an Sta-·nd·ar NasJon:aJ :Pendidi:kan.: 2:0.06~
191 ..--. .•
.
i..
DIFFERENTIAL ITEM FUNCTIONING POTENSI AKADEMIK PADA KELOMPOK SMA - MA1 Ali Ridho 2 ABSTRACT Evidence of fairness indicated by item equality functioning between groups compared. Items unfairness showed by differential item functioning (DIF). This study aimed at identify items of Potensi Akademik (PA) SeleksiPenerimaan Mahasiswa Baru - Perguruan Tinggi Agama Islam Nageri (SPMB-PTAIN) that contained differential item functioning .(OIF) based on graduated school (Madrasah Aliyah Negeri - Sekolah Menengah Atas Negeri, MAN - SMAN, MS). Analyzing to data response (n = 1DODO" 5000 from MAN and 5000 from SMAN) by likelihood ratio test- (LRT), the result showed that: (1) 12 items of analogy, logic, arithmetic and comparison components were significantly contained OfF favored SMAN; (2) 3 items of analogy and arithmetic components containedDIF favored MAN.
Keyword: item response theory (IRT), differential item functioning (OIF), potens; akademik, SPMB-PTAIN
PENDAHULUAN Melengkapi kebutuhan
seleksi mahasiswa baru,
sebagai pehgelola
Perguruan Tinggi Negeri (PTN) dengan karakteristik yang khas, Direktorat Pendidikan
Tinggi
Islam
(Diktis)
Kementerian
Agama
berinisiatif
untuk
mengembangkan sistem seleksi secara bersama bagi seluruh Perguruan Tinggi Agama Islam Negeri (PTAIN). Tahun 2009 hingga sekarang terealisir sistem Seleksi ,Penerimaan Mahasiswa', Baru Perguruan Tinggi Agama Islam Negeri (SPMB-PTAIN). 'Sistem ini banyak mengadaptasi Seleksi Nasional Masuk
Perguruan Tinggi Negeri (SNMPTN) yang sudah m·endahului. Ujian masuk perguruan tinggi "(PT) adalah peristiwa yang krusiaJ. Implikasinya begitu besar, berpengaruh terhadap masa depan para peserta ujian. Sebagai high stakes testing, alat ukur yang digunakan dalam ujian masuk Tulisan ini adalah bagian dari Laporan Hibah Penelitian Fakultas Psikologi UIN Maliki Malang Tahun 2013, dipresentasikan pada Konferensi IImiah Himpunan Evaluasi Pendidikan (HEPI) di Manado, 20-21 September 2013. 2 Dasen P~ikametri di Fakultas Psikologi UIN Maliki Malang. Email: [email protected] 1
192 .~
... 1
PT seharusnya memiliki karakteristik psikometrik yang baik, daJam arti valid, reliabel, dan adit. Menurut Messick (1998), selain sebuah tes': seharusnya didukung oleh bukti-bukti validitas dan reliabilitas, 'J-seb'Jah tes seharusnya,juga didukung olehbukti-bukti bahwa -tas bersifat adil. Keadilan ya'ng dimaksud oleh Messick mengacu pada kesetaraan interpretasi makna skor antar individu, kelompok, dan latar bela'kang peserta tas. Keadilan semacam ini dibu:ktikan dengan. berfungsinya aitem-aitem tes secara setara antara kelompok-kelompok yang mengikuti tes~ Apabila terjadi, ketidaksetaraan fungsi aitem pada kelompok- . kelompok yang berbeda, artinya aitem-aitem tersebut ba·lum· dapat disebut memiliki sifat adit Ketidaksetaraan fungsi aitem seperti: ini· lazim. disebut
differential item functioning (DIF). Peserta SPMB-PTAIN tidak: hanya' 'berasal dari lulusan Madrasah .AHyah (MA), namun terbuka juga .bagi peserta lulusan Sekolah Menengah-Atas. (SMA), Sekolah Menengah Kejuruan (SMK), serta sekolah-sekolah lain yang sederajat.
Mengingat bervariasinya asal sekolah peserta SPMB-PTAIN, agar dapat dikatakan bahwa keadilan telah .tercapai, diperlukan bukti' bahWa aitem-aitem tes PA talah berfungsi setara antar peserta yang barasal dari janis sekolah yang berbeda. Bukti-buktikesetaraan ini tercapai manakala aitem~aitemdalam PA terbebas dari OIF. Dalam penelitian ini akan diungkap bukti kesetaraan tersebut b·erdasarkan pada pengelompokan peserta lulusan Madrasah Aliyah Negeri Sekolah Meneng~h Atas' Negeri (MAN- SMAN,MS). Pada u'mu'mnya tes patensi akademik (PA) dirancang u'ntuk mengungkap
kemampuan kog~itif potensial, disusun berdasar kqrisep kemampuan dasar, memiliki kaitan minim·af dengan kurikulutn (Azwar, 2008). Pada SPMB-PTAIN
2'012, PA dirancang terdiri 'dari enam komponen; yaitu (1) analogis, (2) logis, (3) analitis, (4) aritmetika, (5) 'komparasi, dan (6) geometri. Komponen-komponen yang .hendak diungkap ini tidak dapat dilepaskan secara penuh dengan
silabus/kurikulum· yang ada di sekolah. Materi komponen-kompon~n tersebut dipelajari di sekolah sehingga wajar apabila potensi akademik berkorelasi dengan prestasi akademik (Fraser, Walberg, Welch, & Hattie, 1987). Bahkan,
193
-
• 4'
..
i..
Mehrens dan Le'hmann (1991, p. 244) mengklaim bahwa"tes poten'si-':'akademik mengukur dt;veloped' ability, bukan innate ability, sehingga pada derajat tertentu kemampuan akademik yang ia mil'H
pengembangan PA SPMB-PTAIN. Penelitian ini berupaya mengidentifikasi aitem-aitem.. PA SPMB-PTAIN yang mengandung OIF berdasarkan padapengelomp.okan peserta lulusan Madrasah Aliyah Negeri - Sekolah Menengah Atas Negeri (MAN - SMAN" MS). Tujuannya
adalah
diperoleh
informasi aitem-aitem
PA mana
saja: yang
mengandung OIF untuk selanjutnya dapat dilakukan ·:perbaikan-perbaikan yang relevan ·.dengan pencetus terjadinya DIF pada k.elompok MS'~
Differential Item Functioning 8~rdasarkan
pada Standards for Educational and'·Psychological Testing
tahun 1999, keadilan c;jalam tes dapat dimaknai sebagai be·bas bias pada level aitem ataupun tes (Penfield & Camilli, 2007). Evaluasi terhadap adil tidaknya.,
Service
dala.m
mengernbangkan produk-produknya (ETS, 2002). ETS . ~enyebutkan
bahwa
aitem
ini
juga, menjadi.
standar
Educational
Testing
secara empirik, prosedur mengevaluasi keadilan ini dilaku.kan d~ngan studi OIF. Beberap~
ahU memberikan batasan DIF, diantaranya Camini (1992)
menyebutkan bahwa sepuah aitem disebut berfungsi secara berbeda apabila probabilitas menjawab benar dipengaruhi oleh keanggotaan peserta pada kelompok. Angoff (1993) menyatakan bahwa istilah
OfF mengacu pada
perbedaan sifat-sifat statistik sebuah aitem antar kelompok dalam kemampuan yang sarna. Dalam bahasa yang lain Hambleton dkk. (1991). menjelaskan bahwa
sebuah aitem mengafldung OIF jika individu-individu deng~n kemampuan yang sam~t te~api beras~1 dari kelompok yang berb~dat tidakmemiliki probabilit~s
menjawab benar yang sarna pada aitem tersebut. Penjelasan lain diberikan oleh Embret~on
dan Reise (2000) yang mengatakan bahwa OIF dikatakan terjadi saat 1·94
sebuah aitem tas tidak memiliki hubungan yang sarna dengan sebuah variabel laten,e, antar dua atau lebih kelompok peserta tes. Penfield dan Ca.milli (2007) mengemukakan bahwa OIF t~rjadi saat individu-individu dengan atribut laten yang besarnya sarna namun berbeda kelompok, memiliki distribusi respons ,yang berbeda. Pad,a kasus aitem dikotomi, kelompok referensi dan fokal yang memiliki lev,el B ~ama. akan memiliki probabilitas menjawab baMar yang berbeda. Dengan demikian aitem berfungsi secara berbeda pada dua,kelompok. Dalam bentuk persamaan, aitem yang tidak mengandung DIF akan mengikuti:
!(YI B,G=R)= !(YI (J,G=F)
(1 )
dimana:
G adalah
v~riabel kelompok;
R mengacu pada kelompok referensi
F mengacy pada kelompok fakal Yadalah probabilitas menjawab benar pada aitem
e adalah atri~ut laten yang diukur oleh tes Beberapa, p~ndapat di atas mengarahkan pada pengertian bahwa sebuah aitern dikatakan teridentifikasi OIF jika terjadi probabilitas yang tidak sarna dalam menjawab benar sebuah aitem pada dua kelompok peserta tes dengan kemampuan sarna, setelah berada pada kontinum kemampuan yang sarna.
METODOLOGI PENELITIAN Penelitian ini menggunakan pendekatan kuantitatif berdasarkan data sekunder. Data ini qiperoleh dari' panitia SPMB-PTAIN tahun 2012. Total data peserta yang mengikuti SPMB-PTAIN pada tahun tersebut adalah 51570. Sebanyak 25744 mengerjakan pada paket 1" sementara sisany~ mengerjak~n •
paket 2. Data yang dipergunakan dalam penelitian ini adalah data respons
peserta pada paket 1.
195
Informasi banyaknya peserta yang. mengerjakan soal paket 1 berdasarkaA asal sekolah disajikan pada Tabel 1. Dengan pertimbangan jumlah peserta pada tiap sekolah asar da.nkesetaraan status sekolah, peneliti merandom seba·nyak
5000 peserta yang berasal dari MAN dan 5000 peserta dari SMAN. Tabel1. Rekapitulasi Peserta SPM-S-PTAIN berdasarkan Asal Sekolah
Kategori MAN MAS PESA SMEA SMKN SMKS SMAN SMUS LAIN KO$ong Total
Jumlah Peserta Jumlah Peserta (%) 5376 20,90 5308 502
20,60 1,90 1,00 6,20
248 1584
938
3,60
9148 1869
35,50
7,30
617
2,40
154
0,60 _
25744
100,00
Teknik analisis data yang digunakan dalam mengi~entifikas.i DIF dalam penelitian ini adafah likelihood ratio test (LRT) atau secara lengkap disebut item
response theory likelihood ratio test (IRT-LRT). Pemilihan metoda ini didasqrkan pada pertimbangan: 1) Metode ini berbasiskan model, melibatkan parameter-p~rameter aitem
secara langsung. 2) Metoda ini paling sensitif bila dibandingkan dengan metoda Lord Chi-Square dan Signed and Unsign Area dalam kerangka UIRT (Wagiran, 2005; Woods, 2009). 3) Kalibrasi dilakukan secara simultan terhadap parameter aitem pada kedua kelompok ~ehingga tidak perlu ada transformasi dari satu metrik kemetrik yang lain. 4) Kemudahan
analisis
sudah
didukung
dikembangkan oleh Thissen (2001).
196
oleh
software
IRTLRDIF
yang
HASIL PENELITIAN DAN PEMBAHASAN
Aitem yang
dianali~is
dipilih berdasarkan korelasi biserial (rbis) dengan
kriteria skor total. Sampel berdasarkan kelompok· asal sekolah terdiri dari
Madrasah Aliyah Negeri dan Sekolah Menengah Atas Negeri (MS) denga.n ukuran 10000 peserta (5000 lulusan M dan 5000 lulusan S). Analisis berdasarkan kelompok ini memiliki hasil yaitu; 17 aitem selanjutnya tidak diikutkan dalam analisis karena memiliki
rbis
< 0,25, yaitu aitem-aitem dengan
nornor urut: 3, 6, 7, 8, 10, 14, 16, 19, 22, 28, 46, 50, 64, 65, 66, 67, dan 68. Dengan demikian, analisis dilakukan terh.adap.58 aitem. Berdasarkan 58 aitem yang diikutkan dalam analisis, pemilihan model didasarkan pada kecocokan data dengan model yang digunakan. Informasi
kecocokan yang disaJikan pada Tabel 2 menunjukkan bahwa model 3PL lebih cocok dalam menjelaskandata respons para peserta tes, baik pada kelompok PL ataupun MS. Untukitu an~,lisisselanjutriya'didasarkan' pada model 3PL. Tabel2. Kecocokan banyaknya Parameter dal~m Model Model
-2 Loglikelihood
G2
df
P
Keterangan
1PL
845621,96
-
-
-
-
2PL
831521,14
14100,8182
58
0,000
Model 2PL. lebih informatif
3PL
784430,06
47091,0767
58
0,000
Model 3PL lebih informatif
Keterangan: 1PL = modellogistik 1 parameter; 2PL = modellogistik 2 parameter; 3PL model logistik 3 parameter; G~ = statistik G 2 (perbedaan likelihood); df = derajat kebebasan; p = probabilitas yang bersesuaian.
=
Analisis terhadap 58 aitem-aitem PA SPMB-PTAIN menunjukkan hasil dimana terdapat 15 aitem yang secara signifikan .mengandung DIF. Sebagai
ilustrasi, berikut ini ditampilkan beberapa item' characteristic curves (ICC) aitem DIF yang menguntungkan lulusan SMAN (Gambar 1 dan Gambar 2) dan yang menguntungkan lulusan MAN (Gambar 3).
197
1-·~:~-:-----------_·_~~~~----··-·---·--l .
I·:
Q
S 0.81 U
I
I
I ~ 0.6
I
i
~
II i=- 0.4 ~I I ~ 01 i
I
0.0
-2.0
-1.0
1
!L
"
--- MAN
~~~---c-,~-:::::~c-r-c~
-3.0
1
.......,/
,~
I
.
._.
0.0
Them
1.0
2.0
II
-SMAN I
I I·
3.0
I
.
.
.
.iI
Gambar 1. ICC ANLG09 (menguntungkan lulusan SMAN) Gambar 1 menyajikan ICC aitem ANLG09. Pada gambar tersebut nam.pak jelas bahwa pada sepanjang skala kemampuan peserta lulusan SMAN memiliki probabilitas menjawab ~en~r yang. lebih tinggi dibanding peserta lulusanMAN. Berarti dapat. dikatakan bahwa aitem in~ menguntungkan kelompok peserta
lulusan SMAN'. Redaksi aitem ANLG09 adalah sebagai berikut. ABSOLUT (A) Liberal
(B)Abstrak (C)
Nisbi
(D)
Babas
(E)Labil Untuk dapat menjawab kedekatan kata absolut pada aitem ANLG09, peserta tes perfu memahami makna kata absolut. Absolut memiHki makna tak terbatas, tak terkekang sehingga bebas berbuat apa saja. Dengan. demikian jawaban yang tepat adalah (0) Sebas. Pola hubungan kedekatan makna kata dapat diselesaikan melalui pemetaan hubungan antar·kata dengan. Memori yang bekerja pada saat menyelesaikan aitem ini adalah working memory (WM) Halpern (2004).
198
r I
I j
··-·----·---·----------~~~;----
1
j
1.0 0.8
IICJ
0.6 1
CJ
!
I ~ 0.4 1 I S0.2 i.... I 0.0 L~-ro-n---,.--,.-'TT--,-Y-T.......,....,....." -3.0
f
!f
-2.0
-1.0
0.0
1.0
---
MAN
-SMAN ...
1·1
- l' - I
2.0
3.0
Theta
_
Gambar 2. ICC LOGI20 (menguntungkan lulusan SMAN)
ICC LOGI20 yang disajikan' pada Gambar 2 menunjukkan bahwa pada 'selutuh rentang
e keiompok'iulusan SMAN memiliki probabilitas menjawab benar
y.ang lebih tinggi dib'andingkan peserta lulusan MAN. Oleh sebab itu' dapat dikatakan bahwa lulusan SMAN diuntungkan pada aitem ,ini. ' , Redaksi aitem LOGI20 adalah sebagai berikut. Semua' Harimau adalah pemakan daging. Sebagian binatang adalah' Harimau. Jadi: (A)Semua pemakan daging adalah Harimau (B)Sebagian Harimau adalah pemakan daging (C)
Sebagian binatang pemaka'n daging
(0)
a, b,
C
bukan jawaban yang benar
(E)Tidak semua binatan'g pemakan daging Guna menyelesaikan dengan benar aitem LOGI20, working memory ('!'1M) sebagai bagian dari fluid reasoning (FR) memegangperanan penting. FR terkait dengan proses kognitif abstraksi penalaran yang melibatkan WM (Chuderski & Ngcka, 2012). Pada sisi lain, penyelesaian aitem tersebut bisa pula disandarkan pada pokok bahasan silogism,e dalampelajaran maJematika.. Berdasarkan pada kenyataan ini, dapat dikatakan bahwa ada kontribusi pembelajaran di sekolah
199 ~,
1
yang menyebabkan kelompok lulusan SMAN memiliki probabilitas menjawab benar yang lebih tinggi dibandingkan lulu~an MAN. . . ·-·.··---·-..·----1
r--~---·-··-"--·"···--··-··-·-·----·--·-"------------'---··-·-·-·--
~TR52
.i i. ' I:.:
i 1::
i
i I I f
J
I I
1 ,;.:
l.0·:,; Qj I ~ 0.8 -!
J
cJi "'0
0.6 I
~
0.41
e.-
i
~ 02
~.
---MAN
i
-SMAN
j
I
0.0 -f..-r-, -3.0 -2.0 I
•
I
I
!
I
I
I
I
I
-1.0
I
1.0
Them
1 L
!
I I
.,...,."T>-r....... 2.0 3.0
I I .-r--"'-". I .-r.
0.0
!
I I
---.JI
·
Gambar 3. ICC METK52 (menguntungkan lulusan MAN) m~njawab
Probabilitas
benar' aitem
METK52
pada
Gambar
3
m·enunjukkan. 'bahwa pada kemampuan rendah s'ampai sedang (-1,8 S (J S 1,4)-
aitem ini menguntungkan peserta lulusan SMAN.
Sementar~
itu pada skala
kemampuan tin'ggi peserta lulusan MAN lebih diuntungkan. Mes'kipun secara akumuJatif aitef!l ·ini menguntungkan MAN, namun melihat rentang skala kemampuan 'kelompok SMAN diuntungkan pada skala kemampuan y'ang lebih lebar. Oleh sebab itu dapat dikatakanb.ahwa ait~m ini hanya menguntungkan peserta lulusan MAN yang memiliki kemampuan tinggi. Redaksi aitem METK52 adalah sebagai berikut. Jika x adalah sisi persegi yang luasnya 25 cm 2 dan y adalah sisi panjang sebuah empat persegi. panjang yang luasnya 50 cm 2 dengan sisi pendeknya 5 em, berapakah xy? (F)
25
(G) 50 (H)
20
(I)
75
. (J)
55
200 .. l.
:,;I
.
Untuk dapat menyelesaikan aitem METK52 dibutuhkan kemampuan dasar '" 'persamaan luas persegi empat dan persegi panjang. Berdasarkan kemampuari tersebut peserta akan dapat mengidentifikasi x
=5 dan y = to. Dengan den\'i!ikia~
jawabanyang benar adalah (8) 50. Untuk menjawab benar aitem METK52 dengan cepat, strategi yang digunakan adalah strategi perhitungan umum yang diajarkan di sekolah melalui konsep luas persegi empat dan persegi panjang'.Perhitungannya tidak' dapat dilakukan melalui metoda perkiraan secara cepat. Oleh sebab itu Gallagher, ,Levin, dan Cahalan (2002) menyebut aitem-aitem dengan strategi penyelesaian seperti ini sebagai aitem~aitem konvensional. Pembahasan terhadap aitem-aitem yang terdeteksi DIF tidak dapat dituangkan secara keseluruhan dalam' penelitian ini dikare'nakan oleh" batasan banyaknya halaman dalam tulisan ini. Oleh sebab' itu, guna mempermu.dah uraian terhadap hasil analisis DIF dalam..penelitian ini~ berikut ini adalah rekap ringkasan OIF aitem-aitem PA SPMB-PTAIN tahun 2012 berdasarkan kelompok MS. Tabel 3. Rekap DIF berdasarkan Kelompok MS Aitem
'" UIRT
No 1
ANLG02 +
No 2·
3
ANLG09 +
4
5 6
LOGI17 LOGI18 LOGI20 METK39
Aitem
UIRT ANLGO • 5 ANLG1 -
3
7'
8
+ + + +
12 .
·METK5 •
2
9 10
11 13 14
15
METK40 METK41 METK45 KOMP55 KOMP56 KOMP61
+ + + + + +
S
+
12 3
Jumlah
15
M
201
, Berdasarkan informasi menemuksn
'sebagia'n
yang,
b.esar
disajikan pada Tabel 3, penelitian ini
aitem-aitem
yang
terdeteksi
DIF
terlihat
menguntungkan kelompok' peserta lulusan SMAN. Diantara 11,"15 aitem OIF, 1·2, diantaranya
menguntungkan
peserta
lulusan' SMAN,
2, aitem
sisanya
menguntungkan pesertalulusan MAN. '. Pads korriponen an'alogis, 4 aitem DIF tersebar merata dengan 2 aitem menguntungkan lulusan'SMAN dan 2 aitem menguntungkan lulusan MAN. Untuk komponen logis, 3 aitem menguntungkan' lulusan SMAN. Pada komponen aritm~tika,
4 aitem menguntungkan lulusan SMAN dan' 1 aitem menguntungkan
siswa lulusan MAN. Sementara itu pada komponen komparasi,', 3' aitem menguntungkan siswa.. I'ulusan SMAN~ Untuk komponen ,Iogis dan 'geometris, aitem-aitem tidak mengandung, OfF berdasarkan kelompok MS. Hasil ini menunjukkan bahwa secara ',. umum .kelompok SMAN diuntungkan', oleh aitemaitem tas PA SPMB-P,TAIN.
KESIMPULAN DAN REKOMENDASI Kesimpulan yang dapat ditarik dalam penelitian ini adalah sebagai berikut. .
.
'
.
1) ada 12 a'item menguntungk'an siswa 1~lusan SMAN padakomponen analogi, logis, aritmetika, dan komparasi;
2) ada 3 aitem menguntungkan siswa lulusan MAN pada komponen analogi dan aritmetika; Rekomendasi yang dapat diberikan adalah sebagai berikut.
1) Untuk tim pengembang dan penulis tas PA SPMB-PTAIN, perlu melakukan analisis isi secara lebih mendalam terhadap aitem-aitem yang terdeteksi OIF sehingga dapat difakukan perbaikan-perbaikan pada pengembangan tes PA SPMB-PTAIN di masa mendatang agar meningkatkan validitas konstrak tes PA SPMB-PTAIN, juga menjamin kesetaraan dan keadilan bagi peserta lulusan MAN - SMAN;
202 .~
.... .. i.
r~'
DAFTAR PUSTAKA Angoff, W. H. (1993). Perspectives on Differential Item Functioning Meth·odology.. .Da.lam W.J7. Angoff (Ed.), ,Differential Item Functioning (Edisi ke-1, hh. 324). New Jersey: Lawrence Erlbaum Associates. Azwar, S. (2008). Kualitas Tes Potensi Akademik Versi 07A. Jumal Penelitian dan Evaluasi Pendidikan, 12(2),232-250. Camilli, G. (1992). A Conceptual Analysis of Differential Item Function.ing in Terms of a Multidimensional Item Response Model. Applied Psychological Measurement, 16(2), 129-147. Chuderski, A.,& Ngcka, E. (2012). The Contribution of Working Memory to Fluid Reasoning: Capacity, Control, or Both? Journal of Experimental Psychology. Learning, Memory & Cognition, 38(6),1689-1710. doi: 10.l037/a0028465 Embretson, S. E., & Reise, S. P. (2000). Item Response Theory for Psychologist. NJ: Lawrence Erlbaum Associates Inc.
ETS. (2002). ETS Standards for Quality and Fairness. Princeton, NJ: Educational Testing Service. Fraser, B. J., Walberg, H. J., Welch, W. W., & Hattie, J. A. (1987). Syntheses of educational productivity research. International Journal of Educational Research, 11(2),147-252. Gallagher, A. M., Levin, J., & Cahalan, C. (2002). Cognitive Patterns of Gender Differences on Mathematics Admissions Tests. GRE Board Report No. 9617P. Princeton, NJ: Educational Testing Services. Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. CA: Sage Publication Inc. Mehrens, W. A., & Lehmann, I. J. (1991). Measurement and Evaluation in Education and Psychology. Belmont, CA: WadsworthlTho~sonLearning. Messick, S. J. (1998). Consequences of Test Interpretation and Use: The Fusion of Validity and Values in Psychological Assessment. Research Reporl No. 98-48. Princeton, NJ: Educational Testing Service. Penfield, R. D., & Camilli, G. (2007). Differential Item Functioning and Item Bias. Dalam C. R.Rao & S. Sinharay (Eds.), Handbook of Statistics 26: Psychometrics (Edisi ke-1 hh. 125-167). Amsterdam: Eiseveir. J
I
Thissen, D. (2001). IRTLRDIF v.2.0b: Software for the·computation. of the statistics
involved
in
item
response theory likelihood-ratio tests for
203
differential item functioning [Computer. softwa're]. Chapel Hill: L.
L.
Thurstone Psychometric Laboratory, University of North Carolina.
Wdgir3n, B. K. (2005). Perbandingan Berbagai Metode Lintuk Mendeteksi Bias Butir. Yogyakarta: Program Pascasarjana UGM. Disertasi. Tidak diterbitkan. Woods, C. 'M. (2009). Empirical Selection of Anchors for Tests of Differential Item Functioning. Applied Psychological Measurement, 33(1), 42-57.
204
PENGEMBANGAN SOAL PISA·MATEMATIKA PADA KOMPETENSI PROSES KONEKSI DAN REFLEKSI Navel O. Mangelep Jurusan Matematika UNIMA [email protected] ABSTRACT This study aims to develop a valid and practical mathematics problem on the connection 'and reflection cluster. competence in PISA, and. to determine the potential effects of such tasks to the students' mathematics skills. The method used- is development research comprised preliminary stages (analysis' and design). 'and prototyping (form.ative evaluation). The' subjects were students of grade IX $MP Xaverius 1 Palembang. Data collection techniques include walk· through, documentation, interviews~ questionnaires, and tests. Based on the development results,· it-· generates- valid and practical prototype of·reflection and connection clu$ters tasks. The tasks consjs~ of 8 problems (4 problems for connection cluster·'competence and .4 .problems for reflection cluster competence). Validity was ·.fulfilled by the qualitative and quantitative 'validation. Prt;1cticality is fL!lfilled by state of experts and practitioners that the developed taks can applied to junior highschool students. In· addition, appropriate with' the implementation' of .one-la-one and small group, it appears that all students can use the prototype of tasks properly. Students' responses show that the. prototype tasks have a potential effect to explore the potency of students grade IX in SMP Xaverius 1 Palembang. Students' can use optimally their mathematics ability to solve mathematical problems related to daily lif~ in that prototype of tasks. Moreove~ from the results of a questionnaire conducted at the field test stagel. most students said that the given mathematics problems on the connection and reflection cluster competence are interesting. They also said that those may spur
be
enthusiasm in "earning mathematics due to the given problem related to the problems of everyday life. It also shows that there are' 78.6%··of students. master the connection cluster competence and 17.9% of students master the retlection cluster competence. This means that students have the potential to 'develop their own knowledge.
Keywords: 90nnection and reflection cluster competences,
development·,
research, PISA task, math problems.
PENDAHULUAN Pencapaian hasil belajar siswa-siswa Indonesia dalam stl:Jdi inter~~sional PISA
(Programme
for
International
205 .......... ,.l.
Student
Assesment)
sangatlah
mengecewakan. Pada keikutsertaan yang pertama kali di tahun 2000, Indonesia hanya berada pada peringkat ke-39 dari 43 'negara peserta (DECO, 2003). Pada tahun 2003, peringkat Indonesia ada pada posisi 38 dari 41' negaro pcserta (OEeD, 2004). Sedangkan pada PISA tahun 2006, Indonesia hanya mampu menduduki peringkat 50 dari 57 negara peserta (OECD, 2007). Hasil terbaru yakni PISA tahun 2009 Indonesia berada pada peringkat 61 dan 65 neg'ara peserta (OEeD, 2010). Pencapaian, prestasi yang rendah daiamPISA tersebut didukung pula oleh hasil 'penelitian Rita (2012) yangmengembangkan soal pemecahan masalah . .
'..
. ;
:
niatematj'ka mod'eI, P-JSA level moderate d'an most- difficult:, d';mana siswa-siswa ,
"
;.
yang, menjadi sUbjek dalam peneltian tersebut hanya berada pada kategori cukup dalam menyelesaikan soal~soal' pemecahan masalah' model PISA. Senada
dengan
hal
itu; ,'Kamaliyah
(2012)-
pada
penelitiannya
yang
mengembangankan soal matematik~.model PISA level '4, 5, da'n 6 menunjukkan b'ahwa kurang dari 50% siswa mampu menyelesaikan ,soal matematika"model '
,
,
,
,
PISA level 4, 5, & 6, serta semakin tinggi level soal yang diberikan ma~a presentasi keberhasilan siswa dalam mengerjakan soal pada level tersebut akan semakin keeil. Salah satu upaya dalam, mengatasi persoalandiatasadalah dengan mengembangkan soal-soal yang dap~t membuat siswa aktif dan ~reatif. ,
,
Pengembangan soal PISA bisa dUadikan alternatif penyelesaia"n karena soal
PISA menggunak'an pendekatan literasi yang inovatif d'an' berorientasi kemasa depan (OECD 2010). Selain itu, berdasarkan penelitian-penelitian sebelumnya
tentang PISA seperti Annisah (2011 ) yang telah mengembangkan soal PISA untuk mengukur kemampuanpenalaran matematis siswa SMP, dan Eka (2'012) yang
mengembangkan soal matematika model PISA untuk mengetahui
argumentasi siswa SMP, ' menyatakan bahwa soal matematika model PISA memilikiefek pot~nsial (efektif) dalam meningkatkan prestasi matematika SiS\Na. Pada
P',SAi'i'
pengetahuan
dan
keterampilan
matematika
di'ukur
berdasarkan tiga dimensi yang berkenaan dengan (1) isi atau konten, (2) proses,
206 -,.1..
dan (3) situasi atau konteks (GEeD, 2004). Pencapaian kompetensi siswa dalam dimensi proses diklasifikasikan ke dalam tiga tingkatan yakni; (1) kompetensi reproduksi, (2) kompetensi kcnersi, dan (3) kompetensi refleksi (OECD, 2004). Dari ketiga kompetensi proses PISA matematika diatas, kompetensi koneksi dan refleksi merupakan kompetensi yang masih sulit dikuasai oleh siswa-siswa Indonesia. Hal ini terbukti kerena hanya 23,20/0 siswa Indonesia yang mampu menjawab soal pada kompetensi koneksi dan hanya 0, 1o~ siswa yang dapat· menjawab soal pada . : kompetensi refleksi (Stacey 201 0). Hal ini J
menandakan bahwa siswa .masih kesulitan dalam menjawab soal-soal pada kompetensi koneksi dan refleksi. Berdasarkan deskripsi diatas, maka perlu dikembangkan soal PISA matematika pads kom·petensi .proses . koneksi dan refleksi
serta
melihat
bagaimana .efek potensial soal-soal· yang dikembangkan tersebut terhadap kemampuan matematika siswa sekolah menegah pertama.
Mesalah delam
penelitian ini adalah (1) bagaimana mengembangkan soal matematika pada kompetensi .proses koneksi ~an refleksi yang valid dan praktis? ; (2) bagaimana efek potensial soal matematika tersebut terhadap kemampuan matematika siswa SMP Xaverius 1 Palemb~ng.
METODOLOGI PENELITIAN Penelitian dilaksanakan pade semester satu tahun pelaj.aran 2012/2013.
dengan subjek penelitian yakni siswa kelas IX SMP Xaverius 1 Palembang. Penelitian· ini merupakan penelitian pengembangan (development research)~ dimana penelitian ini merigembangkan soal PISA matematika pada kompetensi proses koneksi dan refleksi yang valid dan praktis. Penelitian ini terdiri dari dua
tahap yakni preliminary dan tahap prototiping (fannative evaluation) yang meliputi self evaluation, expert reviews dan one-to-one dan small group serta
field·: test (Tessmer
1993,
Zulkardi
2010).
pengembangan soal dalam bentuk diagram alur:
207 -- .. 1.
Berikut
ini
langkah-Iangkah
'.
.
" ~
Expert Reviews
-
.l~
I
.:Revise
t
I
Revise
I
0 ••
Preliminary
--+
Self
--I
Evaluation.
Revise
Small
I
Group
.....
Field Test
" I....-
One-to-one t--
..
Gambar 1. Diagram Alir Pengembangan,Soal,(Zulkardi, 2010)
HASll DAN PEMBAHASAN 1)' Tahap Prelimi"ary' Tahap preliminary'terdiri dari' 2 tahapan yakni persiapan dan' pendesainan sebagaimana di j'elaskan!,sebagai ,b'erikut :
a.. Persiapan
Pa'da ,ta'hap ini, peneliti mela"kukan persiapan untuk p,elaksan'aan pens'litian diantaranya menghubun'gi kepala sekolah dan guru mata peiajaran matematika serta men'entukan, prosedur kerja ~ama selama, penelitian berlangsung·. Selain
itu, peneliti melakukan analisis siswa, analisis kurikulum, dan analisis soal PISA. sebagai das'ar u'ntuk m'engembangkan soal matematika pada kompete'n'si 'proses koneksi dan refleksi PISA sebagaimana diuraikan berikut ,ini : • Analisis Siswa Analisis ,siswa bertujuan untuk mengetahui lev~1 kemampuan siswa yang menjadi s'ubjekpenelitian yakni siswa kelas IX SMP Xaverius 1 Palembang. Peneliti ~enganalisis kemampuan siswa berdasarkan data dari guru matematika disekolah tersebut ~ntuk menentukan siswa mana yang akan menjadi subjek pada penefitian ,ini. Berdasarkan analisis sis\;va diperoleh 3 orang siswa untuk tahap one-fa-one, 6 orang siswa pada tahap small group, dan 28 orang siswa . pada tahap field test.
'"
, 208
'-,
.•
.
i..
• Analisis ·KurikUlum· Analisis kurikulum bertujuan untuk mengidentifikasi rrJateripembelajaran ,v·
matematika SMP sebagai acuan dalam pengembangan soal PISA n·antinya. Adapun Stander lsi pem'belajaran matematika SMP meliputi Aljabar Geometri J
J
Bilangan, dan Pengolahan Data.
• Analisis Soal P'ISA Analisis Soal PISA bertujuan untuk mengidentifikasi karakteristik soal-soal PISA matematiks' khususnya pede kompentensi proses koneksi dan refleksi, yaitu mengenai konten, konteks, dan 'Ievel kemampuan matematika dalam ·PISA.
Berdasarkan hasil analisis soal PI·SA,. peneliti mendapatkan informasi yang terperinci 'fnengenai karakteristik maup'un kesesuaian soal-soal PISA dengan kurikulum matematika SMP di Indonesia. b. Pendesainan .
Pada tahap desain", peneliti melakukan pendesainan soal matematika pada kompentesi proses koneksi dan refleksi PISA berdasarkan informasi dan pengetahuan yang diperoleh pada tahap analisis. Disini diperoleh perangkat instrumen antata lain:
1. Kisi-kisi 8.oal matematika pada kompetensi proses kone·ksi d·a·n re·fleksi. PJSA
berdasarkan analisis peneliti. 2. Soal matematika pada kompetensi prose·s kone.ksi dan refleksi ~ISA
se'b'anyak 8' soal. 3. Ka,rtu Soal 4. Rubrik penilaian soal matematika pada kompetensi proses koneksi dan
refleksj PJSA.
2) Tahap Formative Evaluation B·.
Self ~valuation
Pada tahap iri peneliti melakukan penilaian terhadap soal yang dikembangkan. Re·neHti: meng·ece·k kemba·Ji· kesesuaia·n hasH (j·e·sain dengan framework PJSAl.
209 .......... .• L
y"
kisi-kisi,
da..n
rubrik penilaian-' yang"'lelah dikembangkan. Hasil penilaian oleh
peneliti inilah yang kemudian di validasi:ole.h para pakar pada tahap selanjutnya.
b. ExpertReview Pada tahap ini dilakukan validasi prototipe 1 secara kualitatif oleh tim validasi yaitu Prof. Dr. Zulkardi, M.I.Kemp, M.Sc dan Dr. Yusuf Hartono, M·.Sc. Validas; disini berkenaan tentang
konteh, konstruk, dan bahasa dari prototipe
yang telah dikembangkan. Selain itu peneliti meminta pendapat· dari beberapa 'pakar dan -ternan sejawat tJn'tu'k ·mamvaltdasi prototi'pe 1 tersebut. Adapun validater tersebut antara~ lain: .' 1. Dr. Ross T.urner, PenelitiUtama di Australian. CO'uncil for Ed~cational
Research, (ACER) dan merupakan ketua tim ahli dalam PISA Matematika. Dalam PISA, Ross Turne'rmengelola proses pe:nge'm'b~lngan·,'·item tes. :ma1ematika ds·fI bertanggung· jawab untuk pengembangan metodologi yang cocok untuk· menilai prestas~ siswa, dan berkontribusi t~rhadap aspek~.aspek lain da'lam PISA
2. Prof. Dr. J.. H" Lolombulan,. MS, guru besar/dosen di jurusan matematika
program studi pendidikan matematika Universitas Negeri M~nado (UNIMA), yang meninjau kesesuaian
konsep matematika,
konteks dan tatabahasa yang
digunakan pada soal·matematika kom·pete·nsi proses koneksi dan refJeksi PISA
yang dikembangkan. 3. Prof. Dr. Mashadi, M.Si, guru besar/dosen di jurusan matematika Universitas Riau (UNRI), yang meninjau konsep matematika yang digunakan pada soal matematika yang dikembangkan. 4. Mach. Lutfianto, S.Pd, pelatih olimpiade matematika, guru matematika, dosen STKIP Sidoardjo dan mahasiswa program studi magister ..pendidikan matematika FKJP UNSRI yang meninjau kesesuaian soal yang dikembangkan dengan level siswa kelas IX SMP dan kurikulum KTSP
c.
One-fa-one
Pada one-fa-one, desain. soal mater:natika (Prototipe 1) yang dikembangkan, diuji kep~da. 3 orang siswa kelas IX yang berkemampuan tinggi, sedang,
210 ......... .• i..
:.r--:. 1
dan
rendah
secara ind·ividu.· Tahap one-fo-one ini dilaksanakan pada tanggal 23 Oktober
20,12. Pelaksanaan tahap one-fa-one ini difuku~kan pads kejelasan, kemudahan pengguna·an, kepraktisan prototipe yan·g dikembangk~n, dan ketertarikan siswa terhadap 50al yang diberikan.. Oleh karenaitu 5~telah siswa mengerjakan soal f)F0lotfpe 1. peRenti memjnta siswa memberjkafl pendapat, komentar. dan· saran mereka terhadap soal-soal yang diberikan.
d. Small Group Small Group dila·ksanakan pada tanggal 19 November 2012 di SMPK Frater Xaverisus 1 Palembang. Tahap. ini diikuti oleh. 6. oI~ng siswa yang ~emiliki kemampuan b.eraga.m berkemampu~n tinggi,
yakni 2 orang
2 or~ng b~rkemampuan sedang, 2 orang
b.erkemamp.uan rendah. Pada tahap ini siswa akan menjawab soal prototipe 2 yang ada selama 60
menit, d·a·n ke·mudia·n di m·m.ta untuk me·mbe-rikan· komentar d·an saran terhadap prototip~ 2 yang ada. Hasil pekerjaan, komentar, dan saran siswa pada tahap ini .
.
kemudian di analisis u.ntuk melihat bagaimana implementasi dari prototipe 2 yang adalah hasil r.evisi dari prototipe 1 pada tahap. sebelumnya. Disini akan
.. dHtnat apakah has.J revisr ya·ng dHakukan memberikan peng·aruh kepa·d·a ti·ngkat pemahaman
mem·berikan
si·swa
terhadap. soal
penga~uh
yang
ada,
ataukah
hasil
revisi tidak
apa-apa atau justru membuat siswa semakin sufit untuk
memahami masksud dari soal yang diberikan. Sebe~um
meJaksanakan field test peneUt. l
me~akuka·n ujicoba d1
RSBI2 SMP Xaverius 1 untuk kepentingan analisis
v~liditas
kal·a·s I·X
dan reliabilitas soal.
Analisis dilakukan berdasarkan hasil jawaban 40 orang siswa yang menjad·t subjek uji'coba. Perhitungan vaJiditas dan reliabilitas soal dihitung menggunakan program SP-SS-16. Untuk va.J.idita·s dig·u·nakan· kOfe~asj product mo.men-t dari Kar~ Pearson, dan untuk reliabilitas soal digunakan Cronbach-Alpha. Data hasil perhitungan vaHditas dan reliabilitas soa·' ditunjukka·n tabel· berikut. : Tabel 1. Hasil Validitas Butir Soal . NomorSoal Unit 1
211
_... .•
i.
NomorSoid
r-hitung
Unit 2 Unit 3
0.715
Unit 4 , Unit 5 Unit 6 Unit 7 Unit 8
€:.65~
0.601 0.621 0.594 0.547 0.574
r-tabel 0.444 0.444 ,0.444 0.444 '0.444 0.444 0.444
Kompetensi
Keterangan
Refleksi Koneksi Refleksi Koneksi Koneksi Refleksi Koneksi
Valid Valid Valid, Valid Valid Valid Valid
Dari hasil pengujian validitas diatas terlihat bahwa soal matematika' yang
dikemb'a'ngkan telah memenuhi kriteria valid. Sed'angkan untuk reliabilitas didapatkan hasil koefisien reliabilitas sebesar 0,743, sehingga soal matematika yangd'ikembangkan dapat-dikatakan reliabel.
Hasil revisi 'berdasarkan tahap small group' dan' anaUsis butir soal,menghasilkan prototipe 3 yang terdiri dari 8 soal yang akan df uji 'cobakan pada tahap Field Test.
e. Field Test Pada tahap ini hasHpengembangan soal dalam prototipe 3 diujicobak.an pada subjek pen'e'Htian yakni
sisWci
SMP Xaverius 1 PaJembang kelas IX RSBI-2
sebanyak 30 siswa. ·Peraksanaan field test ini dilaksanakan pada tanggal 23 november 2012 salama
2 jam
pelaJaran (90 Menit). Slswa diberikan paket soal
prototipe 3 dengan lembar jawabannya, kemudian peneliti bertindak sebagai observer yang mengamati kesulitan-ke'sulitan dan, 'permasalahan yang dialami siswa dalam mengerjakan soal tersebut. Berdasarkan hasil pengembangan soal yang telah dijelaskan sebelumnya maka
telah dihasilkan seperang'kat soal matematika berdasarkan kompetensi koneksi ,dan refleksi PISA yang valid' dan praktis. Kevalidan dari scal yang dikembangkan ini
dipenuhi berdasarkan valrdasi secara kualitatif dan secara kuantitatif. Hal ini dapat ~itunjukkan
berdasarkan ,hasil
penUaian
vafidator
(kualitatif),
dimana
validator
menyatakan bahwa 50al telah baik ,berdasarkan konten (sesuai dengan Framework
PISA pada kompetensi koneksi dan refleksi),
konstruk (mengembang'kan
kemampuan literasi matematika, kaya dengan konsep, sesuai dengan level P'I'
siswa kelas IX SMP, mengundang pengembang,an konsep lebih jauh), dan
212
--
,.
..
i..
bahas~
(sesuai dengan EYD, 80al tidak berbel.it-belit, soal tidak mengandung
pen·afS~Fan-
g-a·nda, batasan- pertanyaan dan Jaw-a·ban.jela-s). SeJain ttu, dart has»
anal isis butir 50al didapatkan bahwa.· soal yang dikembangkan. talah valid secara ku·antitati·f dengan nUai' Cronbach-Alpha· 0,743 yang berarti soa·( memUikl reliabilitas tinggi.
Selanj-utnya dari
hasj~
peJaksanaan pada, tallap one-la-one dan small
group menunjukkan ·bahwa perangkat soal yan'g dikembangkan talah praktis. D·imana para ahli/praktisi teJa·h . menyatakan bahwa so·aJ yang dikemba·ngkan dapat .dj~erapkan· pada 'siswa
S.MP,. dan sesuai :kenyataan dilap~nga~· (tahap one-la-one dan
small group) semua siswa dapat menggunaka·n perangkat soal dengan baik. Ha~ ini berarti soal talah se.su~id.e.~gaf:l slur ~erpikir dan tingkat berpikir siswa,. serta
penggu.naan· kon.te~s yang digunakan talah diketahui oleh. siswa seh~ngga rnudah dibaca dan ti.dak menimbulkan.. penafsiran ganda 9leh. siswa. Beri·kut
i~ .pe·~bahasan
beberapa s·oal· y-ang .teJah dikemba~gkan
berdasarkan jawaban: si$wa pada tahap field test untuk m~lihat efek potensial soal dalam menggali potensi atau kemampuan siswa dalam men·y~lesaikan·soal,
serta melihat kreatifitas siswa dalam memilih dan memunculkan
.~trateginya
sendirL
1.
SAWAH· Pak Lutfi ~emiliki sebidang sawah berbent~k persegi
panjang. Kemudian dia akan membagi sawah tersebut kepada keempat orang anaknya. Sumber Gambar: http://agrimaniax.blogspot.com/2010/05/ Pak Lutfi membagi sawahnya yang berbentuk persegi
panjang sebagaimana terlihat pada gambar di bawah menjadi 4 daerah yang sarna luasnya. Ridho tidak setuju dengan cara pembagian ayahnya. Siapakah yang benar? Berikan argumentasi matematik untuk menunjukkan siapa yang benar.
_... .•
i.
Konten
': Ruang da'n bentuk "
Konte'ks,
: Umum I Masyarakat
Tipe Soal
: Open Constructed - Response
Sekilas scal in; terlihat sang at. niLJdah, 'narnun soal ini merupakan scal yang kompleks dan mensyaratkan' pengetahuan tentang kesebangunan yang baik :oleh 'siswa.
Siswa yang tidak, memahami konsep· bangunan akan
menyimpulkan ", bahwa Ridho yang benar dan hal ini juga' terlihat pad a saat ujicoba soal dilaksanakan. Soal ini meminta siswa secara implisit untuk dapat membuktikan 2 segitiga
tersebut metTtillki' sisi yang
luas yang' 'sarna 'atau tidak~
kongruen,· sudut-sudut,
Si'sWa' perlu meligidentifikaSi' sisi~
ataupun
melakukan
pemisalan
untuk
menu,njukkan' bahwa kedua segitiga tersebut memiliki IU$s 'yang' sarna. Sosl ini adalah soal,pada konipetensi refleksi PISA'dimana" sisws" disyaratkan' untuk da'pat merefleksikan s'ol'usi matematika
dengan' m'ertlbu~t penjelasan dan
argumentasi matematika yang mendukung atau menolak dengan memenuhi persyaratan penyelesala'n matematis. Berdasarkan indikator soal pada 'kompetensi refleksi, disini siswa harus mampu untuk mengkonstruksi pengetahuan, m'emberikan' penj-elasan, serta
membe'rikan argumentasi' dalam" 'permasalahan kontekstual" yang diberik~n dalam .,hal ini konteks sawah. Konsekuensi yang harus dilallJi' blah siswa yakni siswaharus dapat memahami tingkatan dan, batasan solusi matematik yang merupakankonsekuensi dari mode" mateniatika yan"g' digunakan. Dimana siswa, harus mampu me,mberikan argumentasi yang logis dara~ membuktikan apakah kedu8 bentuk bangun datar segitiga diatas memiliki Iuas yang sarna. Salah satu strategi dalam menyelesaikan soal diatas ditunjukkan oleh Odilia (gambar 2) yakni dengan melakukan pemisalan.
Odilia mencoba
menentukan nHai pada sisi-sisi persegi kemudian mencari luas setiap bentuk segitiga dengan menggunakan rumus luas segitig~. Kemudian menunjukk'an bahwa luas rlaer,~h Isam~ dengan luas daerah II, sehingga Odilia menyimpulkan
"bahwa yang benar 'adalah pak' LutfL·: 214
Berdasar~an ~.trategi
yang dilakukan oleh Odilia, terlihat pahwa Odilia
teJah'dapat beragum'entasi dengan menggun'aikan model· mate·matika· sederhana. Odilia menggunakan pembuktian secara langsung ;}'akni dengan memasukan nilai-nilai yang dimisalkan· dengan rumus fuas segitiga yang ada. Hal ini· menunjukkan bahwa, Odilia telah bisa memahami hubungan antara konteks dan permasalahan yang diberikan dengan menggunakan pemahamannya mengenai
luas segitiga untuk menafsirkan salusi terhadap permasalahanyang diberikan. Ada
sebanyak
10,:'71 %
menyelesaikan soal
siswa
yang
menggunakan
strategi
ini
dalam
unit 1" 'ini.
Gambar 2. Jaw~pan Odilia & Andre untuk sO.al unit 1 Be'tbeda dengan Odilia. Andre menggunakan strategi yang berbeda dalam menyelesaikan soal tersebut (gambar2). Andre telah dapat menjawab soal ini dengan
b~nar na~u~'tidak
memberikan penjelasan yang lengkap. Andre
m~ncoba. memb~g~ p~rs~.g.i panj~~g tersebut d~ngan rnenggunakan, 1 g~.ris
vertikal dan 19aris horisontal yang melalui titik pusat persegi. Kemudian menunjukkan kesamaan ,antara segitiga-segitiga yang terbentuk. Sekalipun tidak menuliskan
kaidah
matematika
mengapa
kedua
segitiga tersebut dapat
dikatakan sarna, namun berdasarkan wawancara peneliti dengan siswa tersebut,
terungkap' bahwa siswa telah dapat membuktikannya. Ada sebanyak 32~ 14% siswa yang menggunakan strategi ini. Kebanyakan siswa yang menggunakan strategi ini menunjukkan ke'samaan .'.' s·is·i dan sudut dalam me·m·buktikan permasalahan yang d·iberikan.
........ . .
1
Jawaban:
~Rid'no ~Q.ngbU1a}"l.!
lLohL('lo.
ku..0"1'~~ .dq.t./ah ~~·~~q91· ayah~8
t;1
as Ytl0:J SU())o . k.u.m pa.t dcu.-')cS') h;b h d.o!<.: Si.rnl).~n~c.. S--baogUfl., S(J.. ;nqC3~ lv,o.snyo h·c;JS't~<' 6a?~0;' Jtooya ,,:d:_ :1 paS"-r'g bangun tj .... n9 St'.banSt.lr) !l-<.oo9 YUUl ·;·1 Y'~h.l ··A ~S(bq .g'-lJ) ,I
dot( n.. .
(n-. pWl Ij\J.( !,)
di..nqCU'c,s:-Joo
,h1i9~ B t· O. l.((,~\}ipo.t
t
St'oo.nQu.() clU)OQj)
0, S"IO,19
'
<.Qr. ).
~c f,dol( S
S':jU-'Hlt 9g'L'1t((~.tT;.pa.t· bangUJ"'l ~71o.,s,a~a '~a$n~C( !:p .. ~a.noun ! l-u r.O.tH.I$ ~(.b Q..l1qun l~a.fYlCl. sth''-'SgQ ".t.CI.... riljO
. 5a.n-o" St:hQ;'tl.·~nqa., sOwo..h d..l· b09~ rn-trUacL "'1 bQg 'O,ri :5t.pt,.,h.bawa,.h ; n~'
J
•
'.
Iv
d-t' .
II
"-'\ A
.O _
_
...
~~~o'i.·' .
.
.......
Gambar 3. Jawaban Yoverina untuk 50al1 Dati' hasH
jawaban.· Yoverl'na:"df"'atas
'(g~imba'r 3) terlihat'
bahwa ¥overina
tidak dapat menjelaskan tentang kesamaan luas dari segitiga A dan B ataupun segitiga A dan D. Yoverina hanya mengambil kesimpulan secara visual dengan mengatakan bahwa luasnya tidak sarna karena banguntersebut tidak sebangun. Pernyataan itupun tidak didasari oleh argumentasi matematik, padahal dalam
soal telah diminta untuk menjelaskannya dengan memberikan argumentasi matematik. Sebanyak. 62,28% siswa melakukan kesaJahan serupa sehingga siswa-siswa tersebu~. tidak bisa menyeiesaikan persoalan yang diberikan dengan benar.
2. SEBIDANG TANAH Pak Ridwan mempunyai sebidang' tanah yang berbentuk trapesium seperti gambar berikut
40 m
40m
80m
Tanah tersebut.akan diberikan kepada 4 anaknya. Setiap anak akan menerima bagian tanah dengan luas yang sarna. Tunjukkan cara Pak Ridwan membagi
tanah tersebut menjadi 4bagian yang luas,nya sarna d'an sebangun!
.•
L
: Bent~k dan ruang
Konten ,,K'onteks
: Umum'
: Open Constructed - Response
Tipe 50al
Soal 'diatas termasuk "da'la'm ko'mpete'ns'i kon'eksi karena siswa diminta
untuk memahami masalah, melakukan perencanaan, da,n berpikir logis dalam -membentuk strategi 'pe'mecahan 'ma'sala,h da,lam menyefesaika'n soal tersebut. Gambar 4 merupakan jawaban Odilia yang menunjukkan dia talah m'ampu m'~maham'i,
m'erencanakan !d'an 'berp'ikir logis 'd'al'a'm 'm'em"b'entuk "strategi
pemecahan masalah dengan benar. Hal ini berbeda dengan Kevin yang .tidak
"m'amp'u "m'e'mberikan' solusi' 'yan'gb'en'ar :p'ad'a' 's'oal ters'sb'ut. 'Berikut ini jawaban kedua siswa tersebut. .~~': ~M
,
40,~,
40m
, i, ~o
',80m
Gambar 4. Jawaban Odilia & Kevin untuk soal 3 'B'erd'a"s-arka-n 'p'emb'a,h'asan
di'at~s
terlihat bahwa so'almatematika pa'da
kompotensi proses koneksi dan r~fI~ksi yang dikemb~ngkan dapat menggali
patens'i ,mate'matika 'si'swa (m'e'mlliki -efek p'ot,ensia'I). Terlihat bahwa 'siswa -ditu'ntut menggunakan seluruh kemampuan
matematikanya
secara optimal
dalam
m'en'yelesaikan permasalahan mate'mati,ka 'yangberkaitan dengan kehidupan sehari-hari seperti soal PISA ini. Hasil field test di atas menunjukkan bahwa ada
'sisw,a 'yang dapat me'n'u·nJukka'n kemampua'n 'mate'matika d'e'n'ga'n ba-ik, -mampu menjawab dengan benar dan memberikan
penjelasan
'menjawab 50al yang diberik~n. Ada juga yang
yang
baik dalam
mampu memahami da'n
merencanakan strategi dengan benar namun sunt melakukan pe~yelesaiannya. Na·m·u'n, ada ju'ga siswa ya'ng ti·dak bisa limen'gerja:kan -soal -karena tidak mem~hami maksud dari soal
yang diberikan.
~,
1
Berdasarkan analisis jawaban siswa di atas, dapat' disimpulkan bahwa siswa. telah mampu nie'nyelesaikan soal dengan menggunakan kO'mpetensi proses koneksi dan' refleksi dalam PISA. Siswa tatah dapat memuriculkan indikator kemampuah koneksi & refleksi maten1atis, antara'iain :
1. Menggunakan kon'eksi antara matematika dengan disipHn ilmu yang lain 2. Menggunakan k,oneksi antar topi'k matematika .
3. Menghubungkan 'prosedur antar representasi ekulivalen' 4. Menerapkan pemikiran dan pemodelan matematika untu,k,' menyele'saik,an masalah yang muncul pada. disiplin ilmu lain 5. Mengeksplorasi:, masalah d'an menjelasskan h:asiln·ya: dengan grafik numeric, fisik, aljabar, dan model matematika
6. Serta, .m,erepres~ntasi perm~s,~I~~an ,..m~tem~tik.~, ~,~n9?l~., c~.ra memb'u~t model sendiri melakukan analisis, berpikir kritis, sarta mengkomunikasikan J
da·n mengambil keputusan untuk mem'ecahkan mas'alah Dari hasH angket yang dilaksanakan pada tahap field test terlihat sebagian besar siswa mengatakan bahwa soal matematika yang pada kOFDpetehsi proses
koneksi dan refleksi yang diberikan menarik dan dapat memacu semangat dalam belajar matematika' karena soal yang dlberikan berkaitan dengan permasalahan
dalam kehidupan sehari-hari. . Berdasarkan h'asil analisis ini dapat dinyatakah bah'Wa aspek efektif .
.
..
(memiliki efek potensial) dari soal matematika yang dikembangkan dapat dikatakan baik karena memanuhr kriteria Akker (1999), yaitu:
1. Ahli dan praktisi berdasarkan pengalamannya menyatakan bahwa perangkat soal niemenuhi syarat efektif
2. Secara operasionaldi lapangan soal - soal tersebut mem·berikan hasil yang sesuai' harapan. '
Ofeh karena itu pengembangan soal matematika pada kompetensi proses koneksi
da·n refleksi
dapat
dikatakan
memiliki efek potensial. terhadap
kemarnpuan matematika siswa.
218
--
...
..
t...
KESIMPULAN & SARAN ,
'
·Serdasarka·n 'hasH -pengem'ba'nga'n soal matemati'kapada kompetensi proses koneksi dan refleksi .PISA pada penelitian ,ini, maka dapat
disimpulk~!,n
bflhwa 8 soal
ya·ng dike,mbangkan ;berdasarka·nkom·pete,nsi ·proses koneksi d·an re·flek.si PtSA terseb~t dapat dikategorikan valid dan praktis. Valid tergambar secara kualitatif yakni dari hasil pe,nilaian vaUdator, dimana, semua validator menyatakan ,balk berda's'ark·a'n konten,
konstruk, dan bahasa.' Selain itu, berdasarkan analisis butir soal terlihat bahwa soal ya,ng ,dlkembaAgkan tela·h va,lid seoara k-u,a·ntitati·f. Kepraktisan '-era-pat terg·a,mbar dari .
,
,
hasil pelaksanaan pada tahap one-fa-one dan. small group l1lenunjukkan bahwa
·per-a,ng·kat s·oa,1 y-ang '·d-i-kem·bangk·an telah praktis.
Dar~ ha~iI, jawab~n
siswa terlihat
bahwa pe'rangkat soal yang dikembangkan memiliki efek potensial untuk men-ggali -patensi siswa ·keJas
~x ~MP
Xaverius _1
~Palem,ba·~g.
·SeJai-A ·itu,' -aiper-Gleh ,·bahwa
terdapat 78,6 % siswa yang menguasai kompetensi prosesk'o'neksrdan 17,9 % siswa y~ang 'mengu8sai -kompetensi pros'es refieksL loi berarti" bahwa siswa memiliki patensi
untuk mengembangkan pengetahuan mereka send'iri. Berdasarkanhasil penelitian dan kesimpulan maka disar~nkan (1) sis:wa
agar melatih kemampuan matematikanya dengan menggunakan soal mod,el ,
,
PISA seperti yang dikembangkan pada penelitian ini; (2) guru' mate'matika hendaknya dapat menggunakan' soal matematika model PISA khususnya pada kompetensi proses kane,ksi da~ refleksi sebagai alternatif dal~m evalua'si pembelajaran dan proses pembelaj'aran karena dapat me'latih kemampuan matematika siswa d~lam mengaplikasikan pengetahuannya pada kehidupan sehari-hari. (3) hasH peneUtiandap~t digunakan sebag~i masukan dan referensi dalam penelitian tentang soal matematika model PISA selanjutnya.
DAFTAR PUSTAKA Akker, J.v.d. (1.999). Principes and Method of development research (Eds). Design 'Approaches and Tools in Education and Training. Dordrecht : Kluwer Academic Publisher.
Annisah. (2011). Pengembangan Soal Matematika Model PISA pada Konten Quantity untuk Mengukur Kemampuan Penalaran Matematis Siswa Sekolah Menengah P,ertama. Prosiding Seminar Nasionffil Pendidikan (pp. 152164). Parembang: FKIP ,UNSRI. "
219
Edo. (2012). Investigating Secondary School Students'·· D.ifficulties in Modeling problems PISA - Model Level 5 and 6 Journal on Mathematics Education (IndoMS-JME)} July 2012 Volume 3 No.2 J
Eka. (2012). Pengembangan Soal MatematikaModel PISA untuk Mengetahui Argumentasi Siswa di SMP. Tesis. Palembang : FKIP UNSRI Hayat, S., & Yusuf, S. (2010). Mutu Pendidikan. Jakarta: Bumi Aksara.
Kamaliyah. (2012). Deve.Jo:ping the Sixth Levet of PISA '''- Like' Mathem'atics Problem for Secondary School Students. Journal on Mathematics Educatiqn (IndoMS-JME), July 2012, Volumf3 3 Nomor. 2.
Mangelep, N (2013). Pengembangan Soal Matematika Pada Kompetensi Flroses Koneksi & Refleksi PISA. Tesis. Palembang : FKIP UNSRI
NCTM.
(1'989). Curriculum and Evaluation ,Mathematics.Reston, VA: NCTM
Standards
for' School
Nurh,adi,dkk. (2004). Pembelajaran Kontekstual dan penerapanny dalamKBK. Malang : UM Press
GEeD. (20:03)., Literacy Skill for the World' of Tommorow. 'Further Results from PISA,2000. Paris: O E C D . ' .
GEeD. (2004). Literacy for Tommorow's World.First Result (ro·m PISA 2003. Paris: OECD . OEeD. (2007). PISA 2006 : Scie"lce Competencies for: Tonimorow's, World. Paris: OECD
DECO. (2009). PISA 2009 Assesment Framework -, Key Competencies in Reading, Mathema.tics and Sciece . Paris: OECD... OEeD. (2010). PISA 2009 Result: What Students Know and Can Do. STUDENt PERFORMANCE IN READING, MA THEMA TICS, ,AND SCIENCE (Vol. ,I). Paris: OECD. OECD. (2010). PISA 2012 Matheatical FrC!m~work. Paris: OECD Rita. (2012). Explorin'g Primary Student's Problem Solving Ability. Journal on Mathematics Education (IndoMS-JME), July 2012, Volume 3 No.2. Shiel, G., dkk. 2007. PISA Mathematics: A Teacher's Guide. Dublin 2: The Stationery Office. Stace,y, K. (2010). The View of Mathe.,matical Literacy in Indonesia. Journal on Mathematics Education (IndoMS-JME), July 2011., Volume 2 " 1-24.
Tessmer, M. (1993). Plaryning and PhU~qelphia : Kogan Page.
Conducting Formative Evaluations .
ZuI·I~I~ardi.
(201 0). Ho~v to Design Mathematics Lessons based on the Realistic Approach? http://eprints.unsrLac.id/692/1/rme.htmIDiakses tanggal 13 S~,ptember
2012. 220 '.
f..
EVALUASI PENYELENGG..ARAAN UJIAN NASIONAL TAHUN 201.3, Bambang Suryadi Fakultas Psikologi UIN Syarif Hidayatullah Jakarta ~angs [email protected] ABSTRAK Tujuan penefitian ini adalah untuk mengevaluasi' penyelenggaraan Ujian Nasional (UN) tahun 2013 dan memberikan masukan untuk perbaikan dan pening,katan kualitas penyelenggaraan UN pada ,tahun yang akan datang. Sesuai dengan tujuan tersebut' penelitian ini meriggunakan pendekatan kualitatif. Pengumpula,n data, diJa·ku·kan melalui telaah dokumen dan wa,w-a·n,cara. HasU penelitian menunjukkan bahwa k~kisruhan p~nyelenggaraan UN tahun 2013 disebabkan' leni'ahnya manejemen di Kemente'rian 'Pendidikari dan Kebudayaan. Sentralisasi pencetakan bahan' UN juga menjadi penyebab kekisruhan penyelenggara~n UN. Untuk meningkatkan., penyelenggaraan UN, pe~cetakan naskah soalUN perlu dikembalikan ke masing-masing'-masing daerah.
Kata kunci: ujian nasionaf, manejemen, penilaian, evaluasi, pendidikan, pengelofaan.
PENDAHULUAN Penyelengaraan
Ujian
Nasional . (UN)
tahun
2013
merupakan
penyelenggaraan yang terburuk dalam sejarah pendidikan Indonesia. Hal ini dapat dilihat beberapa kasus atau keluhan tentang pelaksanaan UN, diantaranya
adalah: (1) Terjadinya dugaankebocoran soal ujian serta disinyalir adanya bocoran jawaban UN; (2) Terdapat fenomena contek menyontek secara masal dan sistematik; (3) Terlambatnya distribusi soal sampai ke satuan pendidikan; (4)
Tertukarnya sejumlah 50al UN atau kurangnya jumlah naskah UN yang diterima
satuan pendidikan; (5) Tertukarnya naskah UN antar daerah atau wilayah; (6) Terjadinya ketid'akjujuran dari aparatloknum di satuan pendidikan maupun di pemerintah daerah dan pusat; dan lain sebagainya. Khusus u'ntuk UN SMAIMA dan SMK, ada 11 provinsi di wifayah Indonesia bagian tengah dan timur yangpelaksanaan UN SMAIMA dan SMK ditunda karena naskah soar UN terl'ambat didistribusikan. Kondisi ini sangat berdampak 221
kepada psikologis peserta UN. Sebab mereka sudah belajar dan meompersiapkan diri dengan
sungguh-sunggu'h dan berus'aha keras untuk ikut ujian, ternyata
pada hari pelaksanaan ujian tidak bisa mengikuti ujian karena belum ada soal ujian. Dampak lainnya adalah
Kepafa Badan Penelitian dan Pengembangan
Kementerian Pendidikan dan Kebudayaan mengundurkan diri dari jabatannya serta adanya indikasi penyimpangan dalam penggunaan keuangan sesuai dengan hasH investigasi Inspektorat Jenderal Kemdikbud dan hasH audit Badan Pemerika Keuangan (BPK).
Karena
buruknya
penyelenggaraan
UN
tersebut muncul beberapa
komentar yang negatif. terhadap Kementerian Pendidikan° dan Kebudayaan~.·Ada
yang menyebut UN adalah ~jicm Nuh (Majalah Detik, 22-28April2013).A.dajuga yang meminta Menteri Pendidikan mundur dari jabatannya.,TV One: melalui acara
Indonesia Lawyer's Club membahas. UN dengan jUdul "UN' amburadul,siapa tanggungjawab" pada tanggal 23 April 2013. Yang lebih parah lagi adalah ada pihak yang menjadikan momentum ini untuk mengtlapuskan UN dari sistem pendidikan nasional.
Menyadari pentingnya peranan penHaian dan evaluasi dalam sistem pendidikan nasional d.an dengan semangat lJntuk memperbaiki sistem' penilaian (ujian nasional), maka perlu dilakukan evaluasi penyelenggaraan UN tahun
2013. Rumusan Masalah
Berdasarkan latar belakang masalah di atas, permasalahan penelitian ini dapat dirumuskan sebagai berikut. 1. Apadasar penyelenggaraan UN'tahun 2013? 2. Apa perbedaan dan persamaan penyelengg~raan U'N tahun 2012 dan' tahun
20·13? 3. Apa faktor penyebab kekisruhan penyefenggaraan UN ta'hun 201'3? . 4. Apa
dampak kekisruhan
manajenien
orgahisa'si
penyefenggaraan. UN di
lingkungan
Kebudayaan? 222
tahuh' 20.13
Kementerian
tethadap
Pendidikan
dan
5. Bagaimana keabsahan proses pelaksanaan dar.) keabsahan hasil UN SMA sederajat tahun 2013?
6. Apa usulan perbaikan penyelenggaraan ujian' nasional tahunyang. \d.ka". datang?
Tujuan Penelitian Tujuan penelitian in; adala~ untuk melakuk~n evaJuasi penyelenggaraan UN tahun 2013. Secara khusus penelitian in.i bertujuan untuk mengevaluasi penyelenggaraan UN dari aspek yuridisyang menjadi dasar penyelenggaraan UN, perbedaan penyelenggaraan UN tahun 2012 dan tahun 2013, faktor-,faktor' penyebab
kekisruhan
penyelenggaraan
UN,
dampak
kekisruhan
penyelenggaraan UN, dan keabsahan pelaksan.aan UN dan keabsahan hasil UN tahun 2013. PeneJitian ini juga bertujuan untuk memberikan pemikiran. untuk perbaikan penyelenggaraan UN dimasa yang: akan datang.
Manfaat Penefitian Hasil penelitian in; memiliki manfaat teoritis dan praktis. Se'cara teorifis penelitian ini dapat memberikan informasi tentang pentingnya penilaian dalam sistem pendidikan nasionaf. Sedahgkan secara praktis, hasil penelitian ini dapat dijadikan bahan pertimbangan bagi Pemerintah Pusat dan Pemerintah Daerah . serta satuan pendidikandalam menin'gkatkan kualitas pelaksanaan UN. METODE PENELITIAN' Penelitian inimenggunakan pendekatan kualitatif. .Pengumpulan data dilakukan meJalui telaah .dokumen dan wawancara mendafam (in-dept interview)
untuk mendapatkan informasi yang relevan dengan tujuan penelitian. Data yang ada dianalisis secara deduktif", yaitu analisis yang dimulai dari hal-hal yang sifatnya umum kemudian ditarik kesimpulan yang sifatnya khusus. Hasil Penelitian dan Pembahasan Sesuai dengan tujuan pene/itian yang telah. disebutkan di atas, hasil peneJitian ini diklasifikasikan menjadi beberapa sub topik sebagai berikut. 1. Dasar Penyelenggaraan UN Tahun 2013 223 .,
i.
Secara yuridis ujian nasional merupakan ,amanah Undang-undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional. Dalam Pasal 58 ayat (2) UU No. '20/2003 tentang Sisdiknas disebutkan '~Evaluasi peserta didik, satuan pendidikan, dan program pendidikan dilakukan oleh fembaga mandirisecara berkala, menyeluruh, transparan, dan sistemik untuk
menilai pencapaian
estandar nasional pendidikan". Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Estandar Nasiohal Pendidikan juga mengamanahkan Pemerintah untuk menyelenggarakan ujian nasional. Pasal 63 ayat (1): Penilaian pendidikan pada jenjang pendidikan dasar dan mensrigah terdiri atas: a~
Penilain hasil belajar oleh pendidikan;
b.
Penilaian hasil belajar oleh satuan pendidikan; dan
c.
Penilaian hasH belajar oleh Pemerintah.' ,
,
Pasal 66 ayat (2): Ujia.n Nasional dilakukan secara obyektif, berkeadiJah, dan akuntabel. Pasal 66 ayat (3): Ujian nasionaf diadakan
sekurang-kura~gnya,
satu kali dan sebanyak-banyaknya, dua kaJi daJam satutahury pelajaran. Pasal 68: Hasil Ujia,n Nasi'onal digunakan sebagai salah satu pertimbangan untuk:
a.
Pemet~an
b.
Dasar sefeksi masuk jenjang pendidikan b~rik~tnya;
c.
Penentuan kelulusan peserta didik dari
mutu program dan/atau satuan pendidikan;
progra~
dan/atau satuan pendidikan;
dan d.
Pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya
untuk meningkatkan mutu pendidikan'. Pasal 69 ayat (1): Setiap peserta didik jafur formal pendidikan da"sar dan menengah dan pendidikan jalur nonformal kesetaraan berhak mengikuti ujian
nasional dan berhak mengulanginya sepanjang belutn, dinyatakan lulus dar; satuan pendidikan. Pasal 69 ayat (2): Setiap peserta didik sebaga'imana dimaksud pada ayat (1) wajib mengikuti satu kali ujian nasional tanpa dipungut biaya.
224
Pasal 69 ayat (3): Peserta didik pendidikan informal dapat mengikuti ujian nasional setelah mem,enuhi syarat yang ditetapkan oleh Badan Estandar Na'sional PendidikCil1 (8SNP). Dari empat k~gunaan hasH UN sebagaimana' disebutkan dalam Pasal 68 di atas, yang masih menjadi masalah adalah untuk penentuan kelulusan peserta didik
dari
program
dan/atau
satuan
penyelenggaraan UN t~hun· 2013 adalah
pendidikan.
Selain
itu,
dasar
Peraturan Menteri Pe'ndidikan dan
Kebudayaan Republik Indonesia Nomor 3 Tahun 2013,tentang Kriteria Kelulusan Peserta
Didik
dari
Satuan
pendidikan
dan
Penyelenggaraan
Sekolah/Madrasah/Pendidikan Kesetaraan dan Ujian Nasional.
Ujian
Berdasarkan
Permendikbud ini, BSNP juga menetapkan Peraturan Badan. Estandar Nasional Pendidikan Nomor: 0020/P/BSNP/I/2013 Tentang Prosedur Operasi Standar Penyelenggaraan
Ujian
Nasional
Sekolah
Menengah
Pertama/Madrasah
Tsanawiyah, Sekolah Menengah Pertama L.ua'r Biasa, Sekolah Menengah Atas/Madrasa'h Aliyah, Sekolah Mene'ngah Atas Luar Siass, Sekolah Menengah
Kejuruan,Serta Pendidikan Kesetaraan Program Paket AlUla, Program Paket BlWustha, Program'
Pak~t
C, dan Program Paket C Kejuruan Tahun Pelajaran
2012/2013.
Memperhatikan dasar hukum di atas, penyelenggaraan UN tahun 2013 , memiliki dasar hukum yang kuat, sebab UN merupakan amanat undang-undang. Oleh sebab itu jika Pemerintah tidak menyelenggarakan UN berarti Pemerintah tidak memenuhi tuntutan perundang-undangan. 2.
Perbedaan dan persamaan penyelenggaraan ujian nasional tahun 2012 dan tahun 2013 Secara singkat, perb~ndingan penyel.enggaraan UN tahun 2012 dan 2013
dapat dilihat pada Tabel1 berikut ini (BSNP, 2013).
225
Tabel 1 Perbandingan Penyelenggaraa.n UN Tahun 2012 dan tah.un 2013
.-,.
..., . ;.:,;I6,Itf1.Q:.~i~~~.§,~~~&:~.~.: '. ··'2o.lf,?@q1;l~1ii';'j;ci'i:::;';:· ,.'
=
,:..' ":. . .
.f
"':
2012J20~3'"
f~'~/::.~. ".\ yr' '.
~--+--_--:-_-----~------:.....;;.....,;,;.,....,,;;,~~~-.:........;;..~------.....:..:....--::-.-.:....:...-------~.........,;,.,;~~----..;.~
1 2. 3.
Sobot UN dan NS untuk NA Kisi-kisi UN Peran Perguruan Tinggi
NA 60% UN + 40% NS Mengacu ke SK-KD (Standar lsi) Pelaksanaan &
Pengawasan UN khusus untuk
SMAlMA, dan SMK
=
NA 60% UN + 40% NS Mengacu ke SKKD (Standar lsi) Peran dalam Pelaksanaan dan Pengawasan UN
Sarna
Sarna Beda
SMAlMA, SMK ditingkatkan ditambah peran untuk pelaksanaan
dan pengawasan Paket C -Permen dijadikan satu - Dilaksanakan pada hari ,yang - Dilaksan'akan pads waktu yang berbeda .s?lma dengan waktu yang' berbeda "Terpusat untuk"UN Terpusat untuk U·N perididikan formal pendidikan formal dan di provinsi untuk UNPK dan UNPK setiap 5 Paket peserta ujian da·lam. Naskah dan satu ruang LJUN terpisah me~erima paket naskah sO'al yang berbeda Naskah dan LJUN menyatu Guru pada sekolah Guru p·ada sekolah A mengawas peserta UN Amengawas peserta UN di di sekolah B pada sekolah B pada jenjang yang sarna jenjang yang sarna Dibuat dalam POS Tidak dibuat dalam POSUN UN yang mencakup: bentuk laporan, jenis pelanggaran,
4.
UN pendidikari - Ada 2 Perman yang formal & UNPK terpisah untuk UN formal dan UNPK
Beda
5.
Penggandaan Naskah UN
Beda
6.
Naskah Soa·1 dan LJUN
7.
Pengawas Ruang UN
8.
Prosedur tindak \anjut pengaduan dugaan pelanggaran
9.
Pengiriman LJUN dari
Beda
Sarna·
Beda
investigasi,
Satuan Pendidikan mengirimkan ke Dinas
226
rekomendasi dan pelaksanaan keputusan ,("sanksi) Wakil PTN (tim pengawas satuan
Beda
. '. ·.·~.;~~H.~.~·.:~.:.f?.~;~'.'~;~:N/·
10.
··~t\~,~~:.:2f~;O~.:.~.,,; ',. ,': ;';' .':"
Pendidikan Kab/Kota kemudian diteruskan ke tempat pemindaian di PTN (khusus untuk SMAIMA dan SMK)
Pemindaian LJUN oleh
LJUN SMAIMA dan SMK
pendidikan) yang mengawas di 's~tuan pendidikan membawa langsung ke tempat pemindaian di PTN (khusus untuk SMA/MA, SMK, Paket C dan Paket C Kejuruan.) LJUN SMA/MA, SMK, Paket C, dan Paket C Kejuruan Waktu distribusi lebih awal dan jenis soalnya berbeda untuk mengantisipasi terjadinya kebocora.n Dilaksanakan di satuan pendidikan tempat pelaksanaan UN formal
Distribusi soal daerah
Waktu distribusi lebih awal
Tenipat pelaksanaan
Dilaksanakan di PKBM/SKB
UNPK
13.
14. 15.
:.'
.'. .·~g'1::,:1:;l~9:1:.~.~:i;;;~:.\~);:·~;.if?:,;~:ji~:~;~ri~,:~£:~~'i"i;':f;",(:; :.,
terpencil
12.
'.' '.' . "
sekolah ke PTN
PTN
11.
>r.: ~', : ;:,
Sampai di Dinas
Pengawalanl pengawasan naskah UN Sanks; Pelanggaran
Hanya untuk peserta ujian
POS UN
Ada POS UN 81M dan
Sampai titik akhir
Beda
Beda
Beda
Beda
.. distribusi .
Pendidikan
POS UNPK
Untuk peserta ujian dan peng~was ruang ujian POS UN 81M dan l)NPK menjadi satu. POS
Berdasarkan tabel di atas dapat dipahami bahwa dari
Beda
Beda
15 aspek
perbandingan tersebut, terdapat 3. (tiga) aspek yang sarna dan 12 (dua belas) aspek yangberbeda. Perbedaan ini menunjukk~n. adanya usaha peningkatan kualitas penyelenggaraan UN yang dilakukanoleh Badan 8tandar Nasional Pendidikan (BSNP). Peran dan wewenang perguruan tinggi dalam pengawasan UN ditingkatkan karena hasil UN akan dijadikan bahan pertimbangan masuk ke perguruan tingg 1 pada tahun 2013. Jumlah paket soal di setiap ruang ujian i
227 ,...:.
228
c.
Sentralisasi pencetakan bahan' UN Sejak tahun 2012, pencetakan bahan: UN dilakukan secara sentralisir.
Berbeda dengan tahim-tahuns'ebe~umnya yang dilakukan di daerah. Ada enam perusahana percetakan yang mencetak bahan UN sebagaimana terlihat dalam tabel berikut ini (Majalah Detik, 2013). TabeI2:, Perusahaan Percetakan Bahan UN Tahun 2013
Paket
Percetakan
Oplah
Wilayah'
1
PT. Balebat Dedikasi Prima, Bogar
.91.280.560
Sumatera Utara, Riau, dan Banten
2
PT. Pura
96.889.120
Jawa Tengah, Bengkulu
Barutama, Jawa Tengah PT. Ghalia Indonesia Printing ·(GIP) . Bogar
3
4
PT Ja.suindo Tiga Perkasa PT Karsa Wira Utama PT Temprina
5 6
Media
~rafika
Sumatera'
DIY,
Barat,
Jam;bi,
dado
106.575.~OO
Kalimantan Selatan, Kalimantan Ti.rnur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Nusa Tenggara Barat, Nusa Tenggara Timur, Gorontalo~' dan Sulawesi Barat 102.258.720· Jawa Timur, Maluku, Papua, Maluku Utara, dan Papua Barat 103.943.600 Jawa Barat, Bangka Belitung, dan Kepulauan Riau OKI JakartaJAceh, SLimatera Selatan, 90.077.760 Lampung, Kalimantan Barat, dan
Kalimantan Tengah Dari enam percetakan tersebut, PT Ghalia Indonesia Printing Bogar dan
P.T Balebat Dedikasi Prima Bogor yang paling bermasalah,
seba~
kurang
berpengalaman dala~ pengadaan .soal UN dan berakibat pada' penundaan UN SMA di 14 provinsi. Selain itu juga berakibat pada banyaknya kekurangan naskah soal dan LJUN. 4. Dampak kekisruhan p~nyelenggaraan ujian nasional tahun 2013 terhadap organisasi di lingkungan Kementerian Pendidikan dan Kebu~ayaan Kekisruhan penyelenggaraan UN tahun 2013 telah mendorong dilakukannya investigasi oleh· Inspektorat Jenderal Kemdikbud dan audit oleh BPK. Temuan masing-masing pihak akan disajikan secara singkat sebagai berikut.
229
a. Temuan Inspektorat Jenderal Kemdikbud Menurut temuan Inspektorat Jendral" Kemdikbut, Panitia lelang tidak
diajukan setiap perusahaan. Salah' satu memerika dokur'v'len penawaran yang _ - -...
...
~.
.
-
.,
.
.....
_.- _..-
soal untuk sebelas
perusahaan yang gagal mencetak dan mendistribusikan
provins; di Indonesia tengah dan timur, PT Ghalia Indonesia Printing, sebenarnya hanya sanggup menyelesaikan proyek dalam 75 hari kerja. Artinya pekerjaan baru kelar pada 29 Mei 2013, sebulan seteJah ujian salesai. Masih menurut temuan Investigasilnspektorat Jenderal, proses lelang terlambat. Enam perusahaan pemenang tender pencetak soal baru, meneken kontrakpada perencanaan.
tgl
15' Maret' 2013
~tau
mundur
dua
pekan
d~ri
Penye'babnya Komisi X (pendidikan) DPR baru menyetujui
anggaran UN Rp 664 miliar dua hari sebelumnya (13 Maret). Penundaan pencairan' anggaran oleh Kementerian Keuangan untuk semua program, k'ecua,li biaya ruti'n dangaji peg.awai, yang diajukan Kementerian
Pendidikan.Afasannya, karena" Kementerian Pendidikan mengajukan anggaran baru yang lebih tinggi Rp 100 miliar dari pagu anggaran yang sudah ditetapkan Presiden pada Oktober 2012.
.. Pihak yang bertanggungjawab adalah Kepala Balitbang sebagai KPA, Kepala Puspendik sebag'ai pihak yang menyiapkan soal UN, dan PPK UN. b. Temuan BPK Biaya
penyelenggaraan
UN
tahun2013
adalah
sebesar
Rp.
644.246.827'.000. Dari anggaran tersebut,' anggaran yang disediakan untuk penggandaan
dan distribusi 50al UN tingkat SMP dan SMA sebesar. Rp.
120.596.536.000. Penggandaan dan distribusi $oal UN tingkat SMP dan' SMA dipusatkan di Kementerian Pendidikan dan Kebudayaan
dan pelaksanaannya
terlambat di beberapa provinsi.
Untuk tingkat SO, anggaran yang disediakan untuk penggandaan
dan
distribusi sebesar Rp. 85.577.625.000~ Pelaksanaan penggandaan dan distribusi soal
UN
SO
dilakukan
oletl· masing-masing
provinsi,
dan
penyelenggaraan UN SD tidak terdapat masalah keterlambatan.
230 --,. 1
sel'ama
ini
Sebagaimana dimuat dalam majalah Tempo 7 Juli 2013, hasil audit Badan Pemeriksa
Keuangan
(B,PK)
menemukan
pelbagai
penyelewengan
ujian
nasional. Dalam' nota BPK ya'ng dikirim ke Balitbang pada tanggal 21 Juni 2013~ terdapat 33 temuan yang berindikasi kerugian negara atau anggaran tak wajar sedikitnya Rp 180 milyar. Diantara
penyelewengan
tersebut,
menurut
temuan
BPK
adalah:
Penetapan pemenang penggandaan dan distribusi soal yang diduga rekayasa sehingga barpotensi merugikan negara Rp 6,35 miliar. Perjalanan dinas fiktif, penggelembungan anggaran, misalnya proyek pencetakan dan distribusi soal dan jawaban ujian tingkat SMP dan sederajat u'1tuk 2012-2013. Proyek'ini terindikasi' .merugikan negara. Rp 3,6 miliar. Atau ada dana Rp 2,9 miliar biaya penyelenggaraan ujian untuk provinsi hingga sekolah 'yang tak disalurkan oleh Kementeria Pendidikan.
5. Keabsahan proses pelaksanaan dan keabsahan hasil ujian n~sional SMA sederajat tahun 2013 ,
,
~ertanyaan tentang keabsahan pelaksanaan dan keabsahan 'hasil ujian
nasional SMA sederajat muncul dalam rapat kerja antaraKomisi X DPR RI dan Kementerian Pendidikandan Kebudayaan pada tanggal 26 April 2013. BSNP dalam jumpa pers tanggal 29 April 2013 diJakarta, menyatakan bahwa sejauh pelaksanaan ujian nasianal dilakukan dengan'mengikuti seluruh prinsip dan langkah-Iangkah yang tercantum dalam POS UN dan Surat Edaran BSNP, pelaksanaan UN tersebut dinyatakan sah. POS UN disusun BSNP untuk pelaksanaan ujian nasianal dalam situasi dan kondisi normal. Pada saat terjadi situasi yang tidak diinginkan, yang dalam hal ini dipicu oleh keti'dakmampuan salah'satu percetakan dalam menyelesaikan pekerjaannya, maka BSNP
telah membuat keputusan untuk m'enetapkan
langkah-fangkah yang belum diatur dalam POS UN sebagai berikut: a. Penggeseran jawal pelaksanaan UN Tahun 2013 di 11 Provinsi untuk memenuhihak si'swa dalam mengikut~ UN.
231
b. Penggandaan naskah soal· UN dengan fotokopi yang dikoordinasikan Perguruan Tinggi dan disaksikan oleh Dinas Pendidikan dan Kepolisian. Hal ini
juga. dilakukan u~tuk memenuhi ha~.PE3~~~~. ~_i~i~ ._~~~~k. m.~~g.ikuti UN. Soal y~·nQ bervariasi antar zona tengah,zona barat, dan zona timur, serta adanya 20 (dua . puluh) variasi soaldi setiap ruang ujian telah mencegah dan menghindarkan kebocoran soal dari zona yang lain.
Sedangkan untuk. 'menetapkan keab$ahan hasil UN, BSNP b.ersama Puspendik melakukan analisis hasil penskoran secar~ ce.rrJlat dan menyeluruh. SIMPULAN DAN SARAN Pelaks.anaan UN tahun 2013 memiliki dasar hu.kum yang kuat karena ianya
merupakan
amanat
undang-undang.
Namun
sangat
disayangkan
pelaksanaan UN tahun 2013 merupakan pelaksanaan UN yang t~rburu~ dalam
sejarah pendidikan nasional IndQn~sia. Keki$r.u~an penyelenggaraan UN tahun 2013 disebabkan lemahnya manajemen interna.1 Kementerian Pendidikan dan Kebudayaan serta sentralis~si penggandaan dan distribusi oahan .
.
Untuk .meningkatkan pelaksanaa.n UN pada
ma~a
WN.
yang akan datang,
peneliti mem~~rikan beberapa rekomend~si sebagai berikut:
1.
P.enyelenggara~n
UN ditangani oleh lembaga atau badan yang .mandiri,
inde·penden,.. da~ profesional selain B$NP sehing.ga BSNP menengani
st~nda.r
fokus dalam
nasionar pendidikan dan buku teks pelajaran. Selain itu,
BSNP tidak memiJiki unit struktural yang berada di bawahnya, sehingga dalam
menggerakkan
dan/at~u
mengelola sumber daya yang
dibut~hkan
bergantung
pada hubungan fungsi9nal dengan Balitbang atau tim ahli yang bersifat ad-hoc. 2. Penggand~andan
distribusi bahan UN didelegasik:an kembali kepada
perrJerintah daerah (Dinas Pendidikan). Jika proses penggandaan dan distribusi
bahan
UN
diserahkan
penyelengg~raan
kepada
Pemerintah
daerah,
kekisruhan
UN diharapkan dapat d.iminimalkan.
OAFTAR PUSTAKA BSNP, Bahan Sosialisasi Ujian Nasional Tahun Pelajaran 2012/2013.
232 ---.. 1
dalam
Majalah Detik. Ujian Nuh. ~disi 73, 22-28 April 2013. Majalah Tempo Edisi 1-8 Juli 2013. "Tanda Korupsi Ujian Nageri". Laporan Bagja Hidayat, Tri Artining Putri, dan Addi M.I Idhom.
Peraturan
Badan Standar Nasional Pendidikan Nomor: 0020/P/BSNPII12013
Tentang Prosedur Operasi Standar Penyelenggaraan Ujian Nasional Sekolah Menengah Pertama/Madrasah Tsanawiyah, Sekolah Menengah Pertama Luar Biasa,' Sekolah Menenga'h Atas/Madrasah Aliyah, Sekolah Menengah Atas Luar Biasa, Sekolah Menengah Kejuruan,Serta Pendidikan Kesetaraan Program Paket AlUla, Program Paket BlWustha, Progra.m Paket C, dan Program Paket C Kejuruan Tahun Pelajaran
2012/2013. Peraturan Menter; Pendidikan' dan Kebudayaan Republik Indonesia Nomor 3 Tahun 2'013 tentang Kriteria' Kelulus~n Peserta Didik Dari Satuan Pendidikan dan. Penyelenggaraan Ujian Sekolah/Madrasah/Pendidikan Kesetaraan dan Ujian Nasiona:1.
Peraturan Pemerintah . .Nqmqr 19 Tahun 2005 tenta.ng Standar Nasional Pendidikan. Pernyataan Pers BSNP .tentang Pelaksanaan Ujian :Nasional Tahun Pe'ajaran 2012/2'013, tanggal 29 April 201.3. Siaran Pers . Badan Pemeri.k~a Keuangan, .. Pemeriksaan BPK RI atas Penyelenggaraan Ujiari Nasional Tahun 2012 dan 2013, tangg~~. 25 April
2013. Undang-undang Nomor20 Tahun 2003 tentang Sistem Pendidikan Nasional.
233 ........... .• L
r~'
EVALUASI PROGRAM IMPLEMENTASI STANDAR PAUD
Studi Evaluatif d~. TK Negeri Pembina Kabupaten Ende -
-
. - . -'-
.....
Tahun Ajaran
-
~
- - - --
...
- - - - - . -..
201.~/2013
Maria Goreti ·V·. Anamara·1 .
Prof. Dr.dr~ Myrnawati, ·C.H, MS, PKK2 Dr. Wardani Rah~yu, M~Si3 .:
ABSTRAK Penelitian .evaluasi· bertujuan untuk men'getahui efe.ktivitas· pelaksanaan standar
PAUD di TK Negeri Pembina· Ende. Penel.itian me~ggun·akan metoda· evaluasi dan m'odel CIPP dari ·Daniel Stufflebeam. Instrumen· :yang. d.igunakan 'dalam penelitian ini adalah wawancara, observasi, studi dokumen, dan angket. Hasil peneUtian menyimpulkan bahwa .pelaksanaan standar PAUD belum berjalan efektif, dimana kualifikasi akademik guru adalah tamatan ·SPGTK, kualifikasi akademik kepaJa sekolah setingkat 011 P'GTK, sekoJah tidak m~miliki kurikulum, program kegiatan semester dan rencana kegiatan mingguan/RKM disusun melalui wadah IGTKI~ dan penifaian terhadap peserta .didik berum dilakukan secara individu. Tentang sarana dan prasara·na, gedung sekolah didirkan dekat makam, ged~ng belakang qa~ samping kanan s~kolah berbatasan den.gan lahan yang lebih tinggi menyerupai tebing, alat permainah edukatif/APE dalam ruang keJas daJam kondis; tidak bersih, tidak diperbarui dan masih ada yang belum sesuai dengan area yang ada. Alat permainan luar ruang beralaskan lantai belum memperhatikan faktor keseram.atan·anak...
Kata kunci: evaluasi program, implementasi, dan standar PAUD.
ABSTRACT The evaluation research aimed to acknowledging the effectiveness of the implementation of early childhood education standards in Negeri Pembina . kindergarten. The evaluation research is selected as a re$earchmethod, use the CIPP model from Daniel Slufflebeam. The ins/rumen were use in this research is interview, observation, document study and questionnaire and analisyzing data use the descpriptive statistic and qualitative technique. The result of reasearch Mahasiswa Pascasarjana Program Stud; Pendidikan Anak Usia Dini! angkatan tahun 2011, Universitas Negeri Jakarta ([email protected], [email protected]). 2 Ketua Program Studi Pendidikan Anak Usia Dini, Pascasarjana Universitas Negeri Jakarta, pembimbing I. 3 Sekretaris Program Studi Program Evaluasi Pendidikan,Pascasarjana Universitas Negeri Jakarta, pembirnbing ii. 1
234 - '.. 1
give a conclusion that the implementation of early childhood standards has not been effective.lt was seem from (1) Teacher average graduation of SPGTK, (2) Headmaster of Negeri Pembina kindergarten garduation of 011 PGTK, (3) Negeri Pe,!,bina kindergarten has not ·been the curriculum, (4) Semester program'" acktivity and weekly activities plan were order to Ikatan Guru Taman Kanakkanak Indonesia (IGTKI), (5) format and contain of daily aktivities plan were make copy paste, (6) Assessment for progress of children were generally for each children. Some aspect were relative like as, development aspect, utilities and infrastructure. .
Keywords: evaluation program, implementation, and early childhood education standard
PENDAHULUAN Latar Belakang Sejak dikeluarkanny.a Und.ang-undang Standar Pendidikan Nasional No. 20tahun 2003, pembinaan terhadap anak usia din; menjadi perhatian dari·
berbagai kafangan baik masyarakat, individu, kelompok maupun lembaga dengan hadirnya berbagai jalur penyelanggaraan PAUD baik dalam bentuk formal
b~rbentuk
Taman Kanak-Kanak (TK)/Raudhatul Atfal (RA) dan bentuk
lainnya, non formal berbentuk Taman penitipan Anak (TPA), Kelompok Bermain (KB) dan bent~k lain yang sederajat dan informal.berbentuk Posyandu PAUD (Pes PAUD) di tengah masyarakat. Hal ini menjadi sebuah indikator semakin membaiknya perhatian dan pemahaman masyarakat terhadap pendidikan anak
usia dini. Namun di sisi lain penyelenggaraan PAUD ditemukan beberapa permasalahan terutama sumber daya manusia yaknl kualitas guru, pembelajaran yang monotqn dan berfokus pada guru, keterbatasan sarana dan prasarana pendidikan anak, ketersediaan dan penggunaan bahan ajar, alat peraga dan buku pegangan (Hakan Usakli, 2010:215-217). Salah satu upaya pemerintah dalam mengatasi masalah tersebut adalah rnengeluarkan Peraturan Menteri Pendidikan Nasional No. 58 Tahun 2009 tentang Standar PAUD, yang terdiri atas:,;, (1) standar tingkat pencapaian perkembangan; (2) standar pendidik dan tenaga .kependidikan; (3) standar isi,
235
proses, dan penilaian; dan (4) standar sarana dan prasarana, pengeJolaan, dan pembiayaan. Standar, PAUD, 'diharapkan menjadi standar acuan
minirriaJ bag;
masyarakat dan stakeholders untuk membe'rikan- -pelayaiian- -peholdika'n'
yang--
berkualitas bagi anak ,usia dini (ChristopherP. Brown, 2010: 3-4). N,amun dafam pelaksanaannya masih ditemukan ketidaksesuaian dengan peraturan yang ada termasuk yang ada di taman kanak-kanak Negeri Pembina, kabupaten Enqe, Nusa Tenggara Timur (NIT). Oi sekofah ini guru TK rata-rata berkualifikasi SPGTK dan befum pernah mengikuti pefatihan yang betkaitan dengan PAUD. Dafam membuat perencanaan dan kegiatan pembelajaran, guru belummemperhatikan kebutuhan, minat dan karakteristik anak. Penilaian perkembangan peserta didik dicatat seadanya tanpa mengg~nakan format yang baik untuk masing-masing peserta didik. Hal lainnya adalah guru melakukan penilaian secara general maksudnya capaian perkembangan anak tidak dicatat secara individu melatui salah satu
instrumen penifaian melainkan dicatat secara bersama-sama atau digabung antara anak yang satu dengan yang lainnya. Terkait metode pembelajaran, maka TK Negeri Pembina masih menerapkan pembelajaranyang berpusat pada guru,
peserta didik hanya mengikuti instruksi gurunya. Kondisi lainnya masih terbatasnya sarana belajar baik yang dipakai g'uru dalam prose$ pembelajaran maupun yang ada di sentra.
Tentunya kondisi-kondisi yang dipaparkan di atas tidak diharapkan berlangsung dalam waktu yang panjang. Pihak sekolah dan juga pemerintah yang diwakifi oleh dinas kabupaten setempat perfu mengatasi kondisi yang ada guna perbaikan mutu dan peningkatan kualitas sekolah dan peserta didiknya.
Hal
ini
sejalari
dengan
pendapat
yang
djkemukakan
oleh
Fasl;
JalaJ
(http://www.jpnn.com/read/2012) bahwa peran terberat pemerintah dan lembagafemnbaga PAUD saat ini adafah mefatih guru-guru PAUD dan memastikan guru yang menyentuh anak-ana.k memifiki kemampuan minimal, :sehingga dimanapun dia melakukan, apapun bentuk satuan pendidikannya, guru tersebut harus menguasai prinsip-prinsip dasarnya.
236
Berdasarkan permasalahan di atas, maka evaluasi terhadap impJementasi standar PAUD penting diJakukan untuk mengetah~i, sejauhmana efektivitas standar PAUD dafa'm penyelenggaraan pendidi-ka'n' anak usiadirii 'di TK' N'egeri Pembina kabupaten Ende.
Penelitian ini menggunakan model evaluasi yang berorientasi pada komponen context, input, proces d·an product atau evaluasi CIPP (SteHa Tan, Nicolette Lee, and David HaU, 2011 :1-5). Keemp~t komponen y~ng disebutkandi atas merupakan sasaran evaluasi, yang t,dak fain adalah komponendari pros~s sebuah program. Dengan'kata lain m'odel CIPP merupakan model evaluasi' yang memandangprogram sebagai sebuah sistema Model evaluasi ini merupakan model yang cukup komprehensif dan dapat menjangkau program yang fuas. METODOLOG.I PENELITIAN
Metode Penelitian .. ' Metode yang digun'akan' dalam pehelitian in; adalah' metode evaluasi dengan pendekatan kualitatif. D.engan metode evaluasi' diharapkan mampu memberi
penilaian
pengelolaan
terhadap
program,
program
kelebihan
dan
tentang
efektivitasnya,
kekurangan
dari
tentarig
program
yang
diJaksanakan. Desain Penelitian Desain penelitian merupakan suatu rencana tindakan untuk memperoleh
data melalui pertanyaan hingga kesimpulan. Desain penelitian ini mengikuti model evaluasi yang dikemukakan oleh Daniel Stufflebeam yaitu CIPP untuk memberikan gambaranumum terhadap proses evaluasi mulai dari tahap awal hinggapada tahap akhir penelitian. Selanjutnya ditunjukkan sebagai berikut:
237
--
,.
.
I..
desain model penelitian
S T
Arl~lisa
Fokus
Konteks'
Data
A N
0 A
-{
Masukan
~
Proses
R P A
H
Fokus
~
Fokus
}+
Analisa Data
Keputusan . Konteks Keputusan
Masukan
Keputusan
Proses
U Hasil
0
Fokus
Analisa Data
Gambar 1. Desain Penelitian
Keputusan Hasil
[RekOmendaSi
I
Teknik dan Pengumpulan Data I~strumen penelitian adalah pedoman tertulis tentang wawancara, atau
pengamatan, atau daft~r pertanyaan, yang dipersiapkan untuk menqapatkan
informasi dari responden.Sebelum instrumen diguna.kan·· terlebih dahulu dilakukan
v~.lidasi ole~
tiga orang pakar.
Teknik Analisa Data Penelitian evaluasi in; menggunakan teknik analisa kualitatif dan analisa deskriptif. Teknik anaJisa kuaJitatif dilakukan dengan mengorganisasikan data, menjabarkannya ke dalam unit-unit, meJakukan sintesa, menyusun ke daJam para, memilih mana yang penting dan yang akan dipefajari, dan membuat
kesimpulan yang dapat disampaikankepada orang lain. Analisa data bersifat regular, dimulai ketika. penelitimefTlperoleh data dan akan berlangsung hingga semua pengumpulan data berakhir. Sedangkan untuk data .kuantitatif akan menggunakan statistik deskriptif dalam bentuk persentase dan diagram batang. HASIL PENELITIAN DAN PEMBAHASAN 1. Komponen Konteks HasH evaluasi pada komponen konteks menunjukkan bahwa TK Neger; Pembina belum memiliki semua dokumen yuridis yang menjadi landasan formal
_... ..:238. .•
i..
t·
bagi penyeJenggaraan PAUD. TK hanya memiliki beberapa dokumen sebagai land·asan· pijak dalam menyelenggarakan PAUD antara lain 'Per:aturan Menter; Pendidikan Nasional/Permendiknas No. 58 tahun 2009 tentangStandar PAUD, dokumen
tentang
pembukaan
dan
penegerian
sekolah,
tata
cara
penyelenggaraan taman kanak-kanak serta penerimaan siswa baru. Dokumendokumen yang dimiliki s~kolah in; tidak dipelajari oleh .kepala sekolah dan juga tidak dibagikan kepada para pendidik guna· menarnbah pengetahuan terkait penyelenggaraan pendidikan bagi anakusia dini. 2. Komponen Masukafl '.
a. Peserta d·idik :' Hasil evaluasi· menemukan peserta didik dl TK Negeri Pembina terbagi ke dalam dua kelompokusia, yakni usia 4-5 tahun disebut keJompok A, dan usia 5-6 tahun, kelompok' B. Dua kelompok ini terbagi" ke dalam enam kelas dimana masing-masing kelas didampingi satu orang guru. Meski tidak diatur dalam standar PAUD terkait jumlah anak per kelompok usia yang semestinya diterima di suatu sekolah, temlian.· evaluasi memperlihatkan ada p·erbandingan yang cukup rnencolok antara ju~lah kelompokk usia 4-5 tahun (16% atau· 18 anak) dan 5-6 tahun (84% ,atau98 anak) yang diterima di TK Negeri Pembina pada tahun ajaran 2012/2013. Peserta didik usia 4-5 tahun hany~ satu rombongan belajar, sedangkan usia 5-6. tahun memiliki .lima rombongan belajar. Dari hasil wawancara diketahui bahwa perbedaan kuota yang cukup mencolok ini disebabkan oleh sistem perekrutan peserta didik yang sengaja membatasi jumlah usia 4-5 tahun dengan aJasan masih terlalu kecil untuk dididik serta membutuhkan pekerjaan ekstra untuk membimbing kelompok usia ini. Dari sisi standar PAUD, maka pengefompokkan peserta· didik .yang difakukan oleh TK Negeri Pembina telah sesuai dengan aturan yang ditetapkan. Namun, dari temuan lain terkait sistem perekrutan,. sebaiknya TK ini perlu meninJau ulang penentuan jumlah/kuota anak berdasarkan usia agar tidak menimbulkanasumsi adany~ praktek diskriminasi dan Ketidakad{lan dalam proses perekrutan murid baru.
239 ........ .•
.1..
.:.,..:...
1
b. Tenaga Pendidik
JmpJementa'si ·standar PAUD pada P9in· ini belum menunjukkan hasH sebagaimana disyaratkan dalam"'standar' PAUD. Temuan evaluasi menunjukkan
bahwa fembaga ini memiliki guru dengan pendidikan rata-rata setingkat SPGTK, hanya satu guru yang menyelesaikan pendidika'n D II PGTK dari .Universitas Terbuka. Guru-guru ini belum pe~nah' mendapat pelatihan terkait bidang pendidikan
dan
pengajaran.
yang' dige·lutinya.
Pada·hal
standar
PAU.D
mengharuskan pendidikpada TK menamatkan. pendidikan sarjanal51 jurusan pendidikanlpsikologidan memiliki beberapa kompetensi yang .disyaratkan. Jika konsep awal lahirnya standar PAUD adalah semangat. standarisasi, maka· perfu dipikirkan upaya agar: guru-guru pada TK Nageri 'Pemb'ina dapat . mem,liki kompetensi setara dengan guruiJuru yang memiliki latar pendidikan 81 pendidikanlpsiko.logi sehingga kemampuan yang mereka miliki dianggap layak dan sesuai dengan .aturan yang ditetapkan. Ini beralasan karena mutu ·guru ·yang b~ik
akan menghasilkan output peserta didik sesuai bjmbuh 'kembang ·yan·g
di.harapkan sebagai.mana diatur juga; dalam standar·PAUO.. Dalam konteks staffing atau perekrutan ··guru yang berfaku di TK Negeri Pembina~
diketahui wewenang pengadaan guru sepenuhnya berada pada .dinas
pendidikan setempat. Wewenang yang dimiliki dinas pendidikan termasuk dalam mengatur mutasi guru darisekolah yang satu ke sekolah yang lain.nya. c. Tenaga Kependidikan Yang dimaksudkan dengan tenaga kependidikan dalam evalusi ini adalah kepala seko(ah dan tenaga administrasi. Evaluasi pada komponen input tenaga kependidikan menemukan bahwa kepaJa sekolah befum memenuhi kualifikasi , sebagaimana diatur standar PAUD, sedangkan kuaJifikasi staf. administrasi sesuai dengan. yang disyaratkan. Kepala sekolah di TK Negeri Pembina, memifiki latar pendidikan OIlPGTK dari Universitas Terbuka. Terkait tenaga administrasi maka di sekolah ini tenaga administrasi memiliki kualifikasi setingkiat SMA,' yang bertugas melakukan I
pengetikan dengan fasilitas komp·uter yang kebetulan dimiliki lembaga ini.
240
--
..
..
i.
;r-:..
1
Sefebihnya mengatur berkas-berkas yang ada, mengatur APE dan jika ada kegiatan extra feeding maka staff ini . yang akan memasak dan menyiapkannya· di .
11. 1
.
dapur sekolah. Jika diamati dari segi kompetensi' yan'g"dimiHki, maka tidak sehiUa kompetensi dapatdilakukan oleh staff administrasi kare'na sebagian besar kompetensinya masih di handle olen kepala sekolah. d. lsi Program Evaluasi pada tahap ini menemukan bahwa TK Nageri befum dapat menyusun kurikulum pembelajarannya sendiri. Kurikulum yang dipakai sekolah berasal dari dinas pendidikan propinsi, sekolah tidak melakukan modifikasi .sesuai dengan kebutuhan sekolah. Dala'm hal alokasi waktu belajar, temuan evaluasi menunjukkan pembagian waktu belajar kelompok usia 4-6 tahun adalah 150 menit, yang. dimulai sejak pukuf 7.30 danberakhir pada pukul 10.00. Pertemuan dilakukan sepanjang mingg'u dari. hari Senin ·sampai Sabtu, efektif dalam 17 minggu per semester. Tampaknya pembagian waktu ini tidak melenceng dariaturan yang ditetapkan. Sekolah ini juga memiliki kalenderpendidikan yangmengatur kegiatan pembelajaran peserta didik selama satu tahun, meski terkesandibuat seadanya pada kertas folic;>, dan ditulis tangan namun kalender ini dapat menunjukkan bagaimana pengaturan kegiatan belajar mengaJar di sekolah ini. Ini artinya sekofah TK Negeri Pembina sudah mampu melakukan perencanaan kegiatan pembelajaran dalam kurun waktu setahun. e. Sarana dan Prasarana HasH evaluasipada prasarana relatif baik, terlihat pada beberapa hal seperti gedung sekolah, fuas tanah, dan transportasi telahmenunjukkan bahwa sekoJah ini sudah memenuhisyarat, dimana Juas tanah yang dibutuhkan untuk
mendirikan gedung TK Negeri Pembina jauh lebih besar melebihi standar yang ada yakni 1035 m 2 • Namun, dari segi lokasi gedung TK Negeri Pembina berada pada bagian yang landai sehingga nampak bagian kanan dan belakang gedung
ii,ii\sekolah . berbatasan tangsung dengan
tebi~g
(di bawah tebing). Persis di
beJakang sekolah,. mesk; di atas ketinggian merupakan termpat pemakaman. 241
Temuan Jainnya adalah halaman sekolah in; tidak dipagari, mesk,ipun berbatasan langsung de.ngan jalan utama. Dalam hal ..prasarana lainnya, gedung . .
sekolah ini dibangun permari'eri~
', ,
'oe'ngan
din'ding bagian depansekolah di'cat
khas anak. Lantai sekolah dipasang ubin nampak bersih, atap se,kolah dari seng, dan tidak ada bocor. Umumnya sekolah ini memiliki ruang yang sesuai dengan
aturan standar PAUD. Dinding antar ruang dibuat permanen berbahan semen/beton, namun s'atu ruang ditemukan bersekat tripleks. yang tidak utuh sehingga kegiatan belajar mengajar di kedua ruang ini sering terganggu. Menyangkut- sarana,
dari
temuan" evaluasi' memperlihatkan
bahwa'
pengadaan sarana indoor yang, mendukung pros'es pendidikan anak usia dini masih perlu ditingkatkan, maksudnya' material/peralatan yang dikenal dengan istilah APE perlu disesuaikan dengan bidang~bidang pengemb~ngan anak. 'Selain itu material yang: diletakkan padaarea bermain anak b.elum sepenuhnya mewakHi gambarari" yang ada karena alat bermain anak di sekolah ini belum memadai, terlihat usang, berdebu dan belum sepenuhnya mewakili area. Selanjutnya pada sarana outdoor, dari evaluasi menemukan bahwa sudah tersedia beberapa permainan di halaman sek.c;>lah untuk melatih motorik kasar anak seperti alat panjat, peluncur, jungkat jungkit, ayunan,. bak pasir dan alat putaran mini, salah satu permai~an yakn,i pefuncur terbuat dari ~emen sehingga dari sisi keamanan bisa membahayakan anak termasuk pijakan tempat alat-alat ini diletakkan juga dibuat dari semen. f. Pengelolaan
Evaluasi pada tatarari ini memperlihatkan bahwa TK Negeri Pembina telah memifiki visi, misi dan tujuan pendidikan yang dirumuskan bersama oleh kepala sekolah,pendidik, dan komite sekoJah. g.Pembiayaan
Hasil evafuasi pada tataran pembiayaan menemukan bahwasumber pembiayaanTK Negeri Pembina berasal dari p'emerintah pusat, propinsi, ,f'll
'
kabupaten, dan peserta didik dalam bentuk uang sekolah dan uang seragam. Hanya dari sisi pemanfaatan terlihat adanya
242
ketimpangan diantara pas
--
.•
..
i...
pengeJuaran yang ada.' Basaran biaya yang digunakan sekoJah ini untuk biaya operasional pendidikan tak langsung lebih besar dibanding pengeluaran untuk pas fainnya,dimana
52%, untuk sal/ery dan tun]angari- hari"
raya·
23%,
administrasi 14%, dan sisanya 11 % untuk belanja APE, seperti tampak pada gambar 4.5. Jika dikaitkan dengan kondisi sarana yang ada di sekolah ini, akan . keJihatan sekolah ini belum mampu memanfaatkan keuangan yang ada· untuk membiayai kebutuhan pendidikan yang berhubungan langsung dengan proses belajar anak, termasuk aJokasi dana untuk capasity building staff yang ada di sekolah ini.
3. Komponen Proses a. Perencanaan Temuan evaluasi 'memperlihatkan perencanaan kegiatan semester, dan penyusunan ren·cana· kegiatan mingguan (RKM) tidak dilakukan oleh pihak sekolah. Perencanaan kegiatan' semester dan. rencana kegiatan mingguan disusun
bersama
melalui
wadah
Ikatan
Guru
Tams.n
Kanak-kanak
Indonesia/IGTKI dengan alasansolidaritas dan unity. Haf.." lain yang didapati melalui penelitian ini adalah program semester dan rencana kegiatan mingguan (RKM) yang telah disusun, kemudian didistribusikan ke sekolah yang berada dalam
satu .gugus
dan
sekolah-sekolah
ters.ebut
membayar
sebagaimana tergambar dalam al~r berikut.
Gambar 2. Alur pembuatan program semester dan
--
24:3 .•
..
f..
ke
IGTKI
Dalam penyusunan rencana kegiatan haria'n (RKH), temuan evaluasi menunjukkan pembuatan RKHdilakukan oleh guru di sekolah. Tanpaada scedule yang dibuat kepala sekolah, guru-guru bebas menyusun' RKH 'bisa'untuk' seminagu,
atau
penyusunan
bisa
dilakukan
sehari
sebe(um
kegiatan
pembelajaran berlangsung. Rata-rata guru mengatakan hampir tidak ada kendala yang berarti dalam membuat RKH· karena pengalaman mengajar yang tinggi, namun masih ditemukan adanya perbedaan format antara guru yang satu dengan yang lain.
b. Pelaksanaan Semua ruang kelas di TK Negeri . Pembina telah di setting' secara permanen, maksudnya area dan peralatan telah ditetapkan pada lokasimasingmasing dengan' maksud tidak akan berubah lagi
pada~
kegiatan belajar
seterusnya sampai anak meninggalkan TK Negeri Pembina. K0n,disi seperti ini memperlihatk'an bahwa g·uru tidak melakukan pe·nataan ulang untuk kegiatan berajar hari-hari selanjutnya, maski sebenarnya "guru memiliki otoritas untuk mengubah lingkungan kelas anak guna· mendukung'proses kegiatan belajar yang menarik, dan tidak membosa·nkan.
Selain itu, temuanobservasi menunjukkan bahwa penggunaan alat permainan edukatif pada saat· kegiatan selalu sama, meskipun dari sisi keamanan sesuai bagi anak karena umumnya material ·berbahan plastik dan kayu.Namun dar; sisi kesehatan sangat relatif karena ada material yang terawat dan sebagiannya tidak, dengan kondisi usang dan berdebu. Alat-alat ini juga tidak sepenuhnya sesuai de.ngan fungsi stimufasi yang telah direncanakan karena terkesan
hanya untuk memenuhi syarat yakni setiap area ada
materialnya tanpa .mempertjmbangkan sebetulnya material apa yang sesuai dengan area serta bidang pengembangan a.nak. Temuan lain terkait pengorganisasian kegiatan menunjukkan kegiatan pembelajaran lebih dominan di lakukan dalam ruang kelas~ kegiatan outdoor sebatas bermain saat jam' istirahat, oJahraga danapel bendera.
Meski
pengelolaan kegiatan sudah terdiri atas kegiatan 'pembuka, kegiatan inti, dan
244
penutup, namun ditemukan tidak adaperbedaan antara pengeJoJaan kegiatan
dalam kelompok besar dan kelompok kecil karena semua kegiatan berpusat •
\1,·1!
kepada guru.
Hal lainnya, sekolah ini menekankan kegiatan yang syarat kognisi yakni m'embaca, menulis, dan berhitung sehingga semua kegjatan 'belajar diarahka'n agar anak dapat menguasai ketiga hal itu, ini dapat di lihat pada program kegi~tan
semester dan RKM yang mengarah pada calistung.
c. Penilaian
Hasil penelitian menunJukkan· penilaian ariak tidak dilakukan . secara kualitatif ataumelaluinarasi/deskripsi yang menjelaskan capaian anak didik, sebali.knya penilaian dilakukan dengan cara memberi tanda bintang. Tiap Jumlah
bintang mewakili kemampuan anak didik. Namun cara ini tidak fair, karena penilaian seperti ini tidak dilakukan per individu melainkan kemampuan beberapa
anak digabung menjadi satu dengan tanda bintang. Meski demikian, penHaian yang dilakukan sudah memperhatikan tingkat pencapaian perkembangan peserta didik, namun dalam hal status kesehatan masih belum ditemukan.
4. Komponen Hasil Evaluasi pada tataran ini
m~mperlihatkan
bahwa laporan hasil belajar
anak dilap'orkan sesuai dengan tingkat pencapaian perkembangan anak yang diatur daJam standar PAUD. Artinya tiap aspek pengembangan anak dijelaskan
tingkatketercapaiannya. Namun masih ada kelemahan terkait cara melakukan penilaian yang digunakan TK ini, dimana progress semua peserta didik dicatat secara general atau dengan kata lain digabungkan antara anak yang satu dengan yang lainnya.
PaoahaJ tiap peserta didik memiliki ciri/karakteryang berbeda satu sarna satu la"in, sehingga' mencatat secara individu akan membantu pendidik dalam menilai anak secara lebih mehdalam.
Oi TK Negeri Pembina, buku laporan penilaian perkembangan anak. ~~
memakai format buku laporan yang dikeluarkan dinas pendidikan propinsi. 'Ada' beberapa tahapan yangdikerjakan guru dalam membuat laporan hasil be·lajar
245 ~,
1
anak, yaitu perlama, meJakukan/menuJis penilaian harian dalam buku rencana kegiatan harian/RKH, kedua mernindahkan catatan pe.nilaian rekapitulasi,
ketiga
melakukan -analisa p'erkembangan
h.~rian
ke buku
anak per ihdivid.u
berdasarkan hasil rekapitulasi jumlah bintang yang diperoleh anak, keempat, memindahkan hasil analisa ke dalam buku raport, dan keJima menyerahkan buku
laporan/raport anak kepadaorang tua peserta didik. Sebenarnya penilaian semacam ini, tidak memberikan gambaran yang . cukup lengkap terhadap tingkat perkembangan anak karena guru tidak memiliki
bukti/dokumentasi yang cukup terkait capaian-capaian yang diperoleh anak. Penilaian sebatas memberikan bintang,. kemudian
rekapitulasi.,
dan guru
membuat narasi. KESIMPULANDAN REKOME:NDASI . Menyimak i,nformasi-informa$i yang merupakan hasH penelitian dengan pendekatan evafuasi terhadap implementasi stan.dar PAUD yang terjadi di TK
Negeri Pembina kabupaten Ende tahun ajaran 2012/2013,
maka dapat
disimpulkan bahwasannya pelaksanaan standar PAUD di sekolah ini beJum berjalan secara efekttif. Tingkat pendidikan yang belum sesuai dengan. aturan
main, rendahnya p.emahaman guru dankepala sekolah terhadap fungsi dan tujuan. PAUDberdampak .pada penyelenggaraan pendidikan di lernbaga ini. Oleh karenanya peneliti menyampaikan beberapa rekomendasi yang dapat dijadikan bahan pertimbang.an untuk memperbaiki pelaksanaan standar pAUD dalam rangka mewujudkan pendidikan a.nak us.ia dini yang· bermutu di TK Negeri Pembina kabupatenEnde, yaitu: 1. Kepala sekolah perJu mengalokasikan dana sekolah untuk kegiatan studi banding, mengikuti semi·nar atau lokakarya baik bagi guru maupun kepala sekolah guna peningkatkan pemahaman tentang pendidikan anak usia dini secara baik dan benar. 2. Kepala
sekolah
perlu
mendorong
guru
untuk
melakukan
kegiatan.
pembelajaran bersama an.~k di kelas secara variatif melalui field visit/visitasi,
246 ............. .i..
merubah setting kelas, pembelajaran dilakukan di luar kelas atau auf door dan menerapkan ~,~tode belajar student center. 3. Guru perlu meningkatkan- ketersedi-aan" sarana mengajar dan---b"elajar"artak" yang bervariasi dengan cara menyiapkan bahan-bahan/materi- belajar yang terus berganti sesuai dengan tema belajar agar anak tidak bosan dan dapat
belajar banyak hal. 4. Pemerintah Daerah, khususnya Dinas Pendidikan, Pemuda dan Olahraga (DPPO) Kabupaten Ende harus membangun kesadaran bersama bahwa pendidikananak usia dini (PAUD)penting untuk mencerdasakan generasi di
masa yang akan datang,
sehi~gga perlu
melakukan:
• Penetapan kebijakanangg:aran PAllO guna :_./ Penyelenggaraan pendidikan" da~ pelatihan (Diklat) bagi pendidik dan tenaga
kependidikan
yang
diberikan
oleh
lembaga
pelatihan
PAUD/universitas/nara 5umber yang memiHki kompetensi dan lembaga pefatihan yang diakui. ./ Pemberian beasiswa kepada: gu"ru/k'epala sekolah yang belum berijazah- 81
untuk meraih ijazah sesuai tuntutan"kualifikasi standar PAUD. .
.
.
'
.
'
.
.;' Pengadaan AJat Perm"ainan Edukatif/APE bagi anak yang tepat dan sesuai
_untuk meran"9sang perkembangan anak . ./ Pengadaan
sarana
pembefajaran
alat
bermain/peraga
yang
dapat
digunakan guru dengan mud~h. • Peninjauan ulang keberadaan peraturan - daerah/PERDA yang mengatur keberadaan PAUD sehingga 'secara struktuf PAUD tidaklag-i menjadi
bagian dari Pendidikan Luar Sekolah (PLS) dan TKlSD, melainkan berdiri -s"endirisehingga memiliki keleluasaan dalam- melaksanakan amanah pasal 28, Undang-undang No. 20 Tahun 2003 tenta~g Sistem Pendidikan Nasional dan PeraturanMenteri No. 58 Tahun 2009 tentang- Standar PAUD.
247
DAFTAR PUSTAKA . !
.
Arikuniv, £uharsimi, Capi Safruddin Abdul Jabar. Evaluasi Program' Pendidikan.
Jakarta: Bumi Aksara-Ceatakan Ke-S; 2009. Brinkerhoff , Robert O. Program Evaluation, A Practitioners Guide for Trainer and Educator. Boston: Kluwin-Nydoff Pu~l., 1983. Berk, Ronald A. Educational Evaluation Methodology. The State of The Art. London: The Johns Hopkins Press Ltd, 1981.
Fasli Jalal (http://www.jpnn.com/read/2012~ Jackman, Hilda L. Early" Education Curriculum,. fourth edition., Belmont: Dalmar Cengage Learning, 2009. Kostelnik, Marjorie J., Anne K. Soderman d.an Alice P. Whire~.· Developmentally Appropriate Curriculum. New Jersey: Pearson Merril Prentice Hall, 2007. Morrison, George,S. Dasar-Dasar Pendidikan Anak Usia bini. Jakarta: Indeks,
2012. Patton, Michael. 'Qualitative Evaluation and Research Methods. London: Sage, 1'990. Purwanto. EvaJuasi HasiJ Be/ajar. Yogyakarta:
Pust~ka
Pelajar,. ·2009.·
Rosyada, Dede~ Paradigma Pendidikan· DemokratisJ Sebuah Model 'Pelibatan Masyarakat da/am Penyelenggaraan Pendidikan. .Jakarta':' Kencana Preada,;~edia, 20'04. . . .
.
:
.
Rutman, Leonard. Evaluation Research Methodology, 2' edt New Delhi: Sage Publ. J 1984. Santoso, Soegeng. Konsep Pendidikan Anak' Usia Dini Menuruf Pendirinya. Jakarta: Bahan Semi~ar dan Workshop, 2011. Stufflebeam, Daniel L., Anthony J. Shinkfield.~ Evaluation Theory, Models & Applications. San Fransisco: John Wiley & Sons, 2007.
Scriven, Michael. Evaluation Inverness, 1981.
Thes~urus-third
edition.
California:
Gepress
Wirawan. Evaluasi: Teori, Model, Strandar, Aplikasi, dan Teori. Bandung: Rajawali Press, 2012.
Hakan Usakli. .Early Childhood Education: the case of Turkey, Contemporary Issues in Early Childnood Volume 11 Number 2 2010, www.wwwords.co.uklCIEC).
248 .......... ... £..
Christop.her P. Brown. ~ejng Accountable for One's Own Goveming:a case study of early educators responding to standards-based early childhood education reform} Contemporary Issues in Early Childhood Volume 11·
Number 2 2010,
www.wwwords.co.uklC/EC)~·
'.
-
.-
Stella Tan, Nicolette Lee, and David Hall. CfPP as a mode/for evaluating _ learning spaces, www.twely.co.uk.
249 .•
i..