SEMINAR NASIONAL "Membangun Strategi Evaluasi yang Kredibel untuk Ujian Sekolah dan Ujian Nasional"
Yogyakarta, 13 Oktober 2012
PROGRAM STUDI PENELITIAN DAN EVALUASI PENDIDIKAN BEKERJASAMA DENGAN HIMPUNAN EVALUASI PENDIDIKAN INDONESIA (HEPI) DIY DAN LAYANAN EVALUASI PENDIDIKAN PROGRAMPASCASARJANA UNIVERSITAS NEGERI YOGYAKARTA
/)
l!l4f" ... ~
BIDANG KAJIAN Computerized Adaptive Testing (CAT) Pengembangan Computerized Adaptive Test (CAT) untuk Meningkatkan Kredibilitas Ujian Dr. Suprananto Sistem Pengujian AdaptifBerdasarkan Software CerdasCAT Dr.Rukli
~
3
Computerized Adaptive Testing Using Triangle Decision Tree Method (CAT-TDT) Dr. Winamo
~
y
Pengembangan Sistem Pengujian Hasil Belajar Berbantuan Komputer ~
(Computerized Adaptive .Testing)
.S-
~ ?.:
I
Dr. Samsul Hadi & Dr. Haryanto
Standard Setting Penentuan Skor Batas Tingkat Kinerja Berdasarkan Metode Kelompok Kontras
~
Dr. Nanik Estidarsani
)
[mplementasi Metode Angoff dalam Ujian Nasional di Sekolah Dasar Sri Rejeki, M.Pd.
~~
Batas Kelulusan (Standard Setting) Ujian Nasional SMA dengan Metode Bookmark
I
Dr. Heri Retnowati
~valuasiProgranVJ(ebilakan
Dampak Program Pengentasan Kemiskinan di Kabupaten Jayapura )r. Istiana Hermawati
~
r
'8
_
i\.dopsi Pengarusutamaan Gender dalam Organisasi Fatayat Nahdlatul Ulama Dr. Marni Hajaroh
~'
\1odel Penilaian Kinerja Guru .~-LA!f~to )r. Badrun Kartowagiran ~ - .. " ~
r
,.
I i
r
PENENTUAN SKOR BATAS TINGKAT KINERJA BERDASARKAN METODE KELOMPOK KONTRAS Nanik Estidarsani
[email protected] Abstrak Penelitian ini bertujuan untuk meminimalkan kesalahan penentuan skor batas pada metode standard setting melalui tes kompetensi profesional guru dan calon guru di SMK bidang keahlian Teknik Bangunan. Penelitian bersifat deskriptif eksploratif ini melibatkan sejumlah 201 guru dan 131 mahasiswa calon guru. Metode pendekatan standard setting yang digunakan berfokus pada tes yaitu Extended Angon: Bookmark, dan Ebel, sedangkan yang berfokus pada testee adalah kelompok kontras (contrasting group). Proses validasi isi dan konstrak instrumen, serta kesepakatan standar kompetensi ideal dilakukan oleh guru, praktisi dan dosen, sedangkan diskusi final untuk memperoleh kesepakatan standar minimal dilakukan oleh dosel!: ..... Hasil penelitian menunjukkan: a) penentuan skor batas berdasarkan konsistensi kesepakatan ahli (intra judge) pada tiga metode adalah sangat tinggi, korelasi inter item dari tiga metode diantara cukup tinggi sampai sangat tinggi; b) analisis ketepatan pengklasifikasian adalah 88,009% dengan skor batas 63,24; dan c) jumlah guru yang berkompeten ada 42 orang dan seorang calon guru yang berkompeten.
Kata Kunci: Standard Setting, skor batas, Kompetensi Profesional.
Pendahuluan Sejak tahun 1970 pendidik telah menggunakan skor tes beracuan kriteria untuk menibuat penilaian tentang pengetahuan dan keterampilan siswa. Awalnya diadakan pengujian kompetensi minimum. Kompetensi minimum ini ditunjukkan dengan skor tes yang dicapai pada tingkat yang telah ditetapkan sesuai dengan pengetahuan dan keterampilan peserta tes. Proses penetapan ini yang dikenal sebagai pengaturan standar (standard setting). Metode standard-setting tradisional dikembangkan sebagian besar untuk konteks dua kategori saja seperti berhasil atau gagal, mastery atau nonmastery, dan berkompeten atau tidak berkompeten. Pada tahun 1990an program uji nasional terkemuka National Assessment of Educational Progress (NAEP), mengembangkan program pengujian yang menyatakan kinerja (performance) dengan rangkaian tingkatan penilaian Basic, Proficient, dan Advanced (Cizek, Bunch & Koons, 2004:31).
Masalah penentuan skor batas (biasa dituliskan cutoff, cut score, atau passing score,) banyak dibicarakan di kalangan peneliti dan praktisi diantaranya mengkomparasikan berbagai metode standard setting untuk menentukan skor batas, menggunakan skor batas sebagai dasar pertimbangan kebijakan, studi meta analisis tentang dampak modifikasi metode standard setting pada skor batas, dan mengestimasi standard error menggunakan dua metode perhitungan keputusan pada prosedur standard setting. Asumsi sistem pendidikan berbasis kompetensi adalah penilaian beracuan kriteria bukan norma, maka standar kompetensi perlu diukur sampai pencapaian tertentu. Dengan demikian standard setting mempunyai implikasi langsung pada masalah yang muncul dari interaksi antara persiapan akademis dan persyaratan kelayakan kinerja (Maslow, 1983:92). Artinya indikator persiapan akademis berhubungan dengan isi pekerjaan Uob content), syarat kelayakan kinerja dan relasinya pada pekerjaan Uob context), sedangkan tindakan ditunjukkan dengan skill, cerdas dengan kognisi dan tanggung jawab dengan ability (kecakapan/ kemampuan). Menurut Geisinger dan McCormick (2010:16), tujuan studi standard setting adalah memetakan tingkat pencapaian kinerja yang berbeda menggunakan penilaian dari panelis. Hal ini sejalan dengan perubahan pendidikan berbasis standar. Jaeger, 1989:492 dan Kane, 2002b:6 menyatakan bahwa kebanyakan metode standard-setting yang ada dapat dikategorikan sebagai model kontinum. Model kontinum terdiri atas model yang berfokus pada tes (test-centered) model berfokus pada testee (examineecentered). Model kontinum dibagi dalam tiga kategori yaitu judgmental models, empirical models dan combination models. Prosedur model judgmental memerlukan pertimbangan isi tes kompetensi seperti tingkat kesukaran butir tes; model empirical memerlukan pertimbangan langsung tentang kompetensi testee; dan model combination memerlukan pertimbangan kompetensi testee pada ranah butir yang di ases oleh sebuah tes kompetensi. Metode test-centered yang popular dan banyak digunakan adalah metode Angoff, Ebel, Nedelsky, dan Bookmark, sedang metode examinee-centered adalah Borderline, Contrasting Groups, kombinasi Borderline dengan Contrasting Groups, Body of Work Method dan Analytic judgment Method (Zieky, Perie, dan Livingston, 2008: 74-83). Menurut 'Cizek & Bunch (2006: 106) prosedur contrasting groups digunakan untuk menentukan perbedaan skor batas antara yang terlatih dan tidak terlatih atau yang telah menguasai materi dan yang tidak menguasai materi. Untuk menentukan skor batas pengklasifikasian diperlukan sejumlah panelis yang konsisten dan berkompeten di bidangnya dan berpengalaman.
Panelis dipilih berdasarkan pemahamannya kepada populasi peserta tes dan materi bidang level keahlian, serta mengelompokkan kompetensi peserta tes yang ideal dan minimal. Panelis menentukan tingkat yang memadai dan tidak memadai dari pengetahuan dan keterampilan peserta tes, selanjutnya panelis memilih secara acak peserta tes dengan interval yang merata dan menentukan skor batas. Panelis akan berpikir, bagaimana jika mereka tidak termasuk yang berkompeten? bagaimana jika keputusan panelis salah karena peserta gagal pengambil tes yang berkualitas? Dalam kasus ini, skor batas harus dinaikkan, tapi berapa skor batas yang ditentukan? (Zieky & Perie, http: /.fwww.ets.org/Media/Research /pdf/Cut Scores Primer.pd{). Prosedur standard setting memerlukan beberapa metode untuk mendapatkan keputusan teori statistik matematis yang sederhana dan mudah dipahami untuk menjawab permasalahan pengklasifikasian kelompok. Contohnya, keputusan tentang pengelompokan peserta tes yang termasuk dalam kategori berkompeten dan tidak berkompeten ini dapat salah (yang berkompeten dimasukkan dalam kategori tidak berkompeten dan sebaliknya). Satu hal yang perlu menjadi perhatian pada penggunaan metode contrasting groups adalah hal-hal yang berkaitan dengan validitas dan kebergantungan pada kriteria keputusan. Saran Maslow (1983:98) adalah menggunakan teori keputusan statistik, utamanya meminimalkan kesalahan pengelompokan, sehingga cukup beralasan untuk mempertimbangkan individu dengan studi perkembangan tes. Berdasarkan alasan di atas, penentuan skor batas ditetapkan melalui diskusi yang mempertimbangkan metode serta perhitungan secara statistik matematis. Penggunaan beberapa metode standard setting ini sangat dianjurkan, karena tujuan penggabungan atau modifikasi beberapa metode ini adalah untuk menentukan model analisis cutoff score yang akurat -clan berusaha memperkecil kesalahan (Hambleton, 1998 dalam Cizek, Bunch, & Koons, 2004:4 7). Goodwin (1996) dalam penelitiannya menggunakan pendekatan examinee dan test centered. Kedua metode yang diperbandingkan ini dipercaya karena reliabilitas asesmen intra dan inter-judgment tinggi (Kane, 1994b dalam Goodwin, 1996:252-253). Penelitian Doonoe (1997:3) menyebutkan ada tiga alasan pemilihan metode Angoff, Ebel dan Nedelsky yang digunakan untuk menetapkan skor kelulilsan, yaitu bahwa ketiga metode tersebut membantu dalam a) mengidentifikasi individu yang memiliki pengetahuan, keterampilan dan kemampuan (KSAs) minimum
untuk meJakukan tugasnya; b) mempertahankan standar minimum pekerjaan yang terkait keterampilan dan kompetensi, dan c) memilih yang terbaik saat calon pelamar melebihi lowongan kerja.
Fokus penelitian ini adalah dalam rangka memberikan perhatian terhadap kualitas guru dan mahasiswa calon guru sebagai kendali dalam bidang pendidikan dan pengajaran. Khususnya peningkatan kualitas pendidikan kejuruan yang tidak hanya memberi bekal pengetahuan teori untuk bersaing di pasar kerja, namun pendidikan vokasi seperti di sekolah menengah kejuruan (SMK) lebih menitikberatkan pada kompetensi vokasi yang berguna untuk menopang kecakapan hidup kepada peserta didik Ada hal mendasar yang dihadapi SMK adalah masalah mutu dan relevansi lulusan, yaitu belum tercapainya penguasaan kompetensi siswa tersebut antara lain karena pembelajaran produktif yang dilaksanakan belum memenuhi kaidahkaidah yang seharusnya ada, seperti kelengkapan fasilitas dan pengelolaannya, pelaksanaan pembelajaran efektif, sistem pendampingan siswa, dan semua yang berkaitan dengan pembelajaran produktif (Sukardi, 2008:1). Profesionalisme guru ini sudah selayaknya dikaji secara terus menerus sesuai tuntutan kebutuhan di lapangan kerja, karena keberhasilan peserta didik merupakan bagian dari dampak "kepemilikan kompetensi guru yang memadai dalam proses belajar mengajar". Tanpa kualitas guru yang baik semua itu tidak akan membuahkan hasil yang maksimal, dengan demikian guru diwajibkan memiliki sertifikat profesi sebagai bukti kewenangan untuk melaksanakan tugas. Tujuan Penelitian Tujuan penelitian menggunakan standar setting ini adalah: 1. Memvalidasi hasil kesepakatan para ahli melalui metode standard setting didukung oleh data empirik 2. Menentukan skor batas berdasarkan proses standard setting dengan metode Extended Angoff, Bookmark dan Ebel dalam kelompok kontras. Metode Penelitian Peserta sejumlah 332 orang adalah guru dan calon guru SMK Materi uji kompetensi profesional yang terdiri atas 11 indikator, dengan 60 butir soal diujikan kepada 201 guru SMK dan 131 mahasiswa calon guru yang telah melakukan PPL (Praktik Pengalaman Lapangan). Validasi isi atas instrumen dilakukan berulang untuk memastikan apakah butir tes sudah layak diujikan. Validasi oleh tim ahli dilakukan untuk menentukan standar kompetensi ideal dan minimal bagi guru dan calon guru profesional. Proses pertimbangan ahli terhadap tiap butir tes dilakukan dengan teknik Delphi (dengan minimal 2 putaran) dan focus groups discusion (FGD). Kesepakatan terbaik pada teknik Delphi ditentukan ~62,5%. Tes yang telah divalidasi oleh guru, praktisi, dan
I'
d()s~u \.~\\\. ~em\ld.\o.\\ \\.\\\.\~\\ ~~'-~\i ~\\\\\\\~ \\'tt\~ \~~ ~~li)~~\ ~~~~" seberapa kompetensi guru dan calon guru bidang ketekniksipilan. . . Proses ~GD ditetapkan berdasarkan probabilitas, bobot yang d1benkan pane11s, dan mempertimbangkan deviasi standar yang ada. Pada t~hap analisis pendekatan proses FGD, pengujian konstruk instrumen dilakukan melalui pertimbangan para ahli dari tiga perguruan tinggi
LPTK
sejumlah 9 orang dengan pengalaman mengajar di atas 12 tahun. Selain mengembangkan konstruk dan
mengidentifikasikan deskriptor tiap butir
soal dalam diskusi final, dilakukan juga pertimbangan standar kompetensi minimal dari ketiga pendekatan metode (Angoff, Ebel dan Bookmark). Syarat jumlah panelis untuk metode Angoff menurut Arrasmith dan ,Hambleton (1988:8), yang direkomendasikan untuk kelompok kerja adalah 3-5 orang, sedangkan para ahli yang memberikan pertimbangan tingkat kepentingan dan relevansi materi tidak kurang dari 5-10 orang (Norcini dan Shea (1997) dalam Brandon, 2004:65). Data penelitian terdiri atas dua bagian yaitu data hasil kesepakatan ahli atas proses standard setting (metode Angoff dan Ebel), dan data hasiJ kesepakatan ahli atas proses standard setting berdasarkan hasil tes obyektif (metode Bookmark). Kontrol terhadap besarnya skor batas yang digunakan pada analisis diskriminan ini, diasumsikan bahwa data dua kelompok kontras harus berdistribusi normal, tidak terjadi multi-kolenieritas, tidak ada data ekstrim (outlier) dan matriks varians-covarians harus equal (Tabacnick & Fidell, 2007: 381). Uji ketepatan pengklasifikasian dianalisis menggunakan analisis diskriminasi, dengan gambaran secara grafts analitik Analisis inter item atau uji kesepakatan dari para ahli digunakan ICC (Intraclass Correlation Coefficients) dari SPSS versi 15.0. Estimasi parameter butir digunakan pendekatan teori kJasik (Classical Test Theory, CTT) dengan program BILOG versi 4.30 phase 1. Demikian juga untuk mendapatkan estimasi parameter respon peserta tes digunakan pendekatan teori respon butir (Item Respon Theory, IRT) dengan output pada BILOG versi 4.30 (extension PAR). Untuk membantu menyelesaikan grafik analitik sederhana digunakari perangkat Microsof Office Excel 2007 dan SPSS 15.0. Analisis diskriminan dengan asumsinya diperlukan untuk menguji ketepatan pengklasifikasian dalam memutuskan skor batas. Tahap evaluasi dalam penentuan skor batas bertujuan untuk mendapatkan kesepakatan yang Iebih nyata pada kondisi kebutuhan minimal kompetensi dan hasil empirik yang ada. FGD dilakukan untU.k membuat kesepakatan visi dan misi dalam penentuan skor batas. Para ahli yang
bertindak sebagai panelis diminta pendapat, respon, dan perhatiannya untuk membahas kembali aspek kompetensi, instrumen yang menjaring kompetensi minimal yang dimiliki oleh guru dan calon guru SMK. Hasil kesepakatan ahli merupakan kriteria kemampuan yang diekspresikan melalui proporsi tingkat kesepakatan para judgment ahli. Basil Penelitian Berdasarkan status dan lokasi peserta tes maka rerata kompetensi profesional guru adalah 56,557 dan mahasiswa calon guru adalah 39,920. Perbedaan ini disebabkan banyaknya pengalaman mengajar, namun tuntutan kurikulum kompetensi bidang studi masih sama. Tampak pada Gambar 1. distribusi kompetensi empirik pada kedua kelompok menunjukkan titik perpotongan menurut trendline berada di antara 47-50. 40
-~
35 30 25
.s 20 <1>
-Guru
f! 15
'- 10
5 0 '\,~'?i,~O;,,'l.-,,<,,,'~""~~~~~~~~~'\o~~~~'lo,~<)
Skor Kompetensi Profesional
Gambar 1. Distribusi Kompetensi Profesional Basil pengelompokan guru dan mahasiswa calon guru yang ditunjukkan dari Gambar 1. dan Gambar 2., bahwa perpotongan kedua kelompok merupakan penentuan skor batas dari tes kompetensi profesional. Prosedur metode kontras telah dilakukan, panelis menentukan skor batas berdasarkan pengetahuan dan keterampilan peserta tes. Langkah berikutnya panelis mengambil skor secara acak dengan interval yang dekat, melalui kesepakatan kemudian dipilih skor batas yang mendekati median yaitu 49,5 pada skala 100. Hasil empirik ini menjadi bahan pertimbangan pada penentuan skor batas pada metode standard setting lainnya.
status Calon Guru Jalim
GuruJalim
..
!
20
15
10
5
0
5
10
15
2020
15
10
5
0
5
10
15
20
Frekuensl
Gambar 2. Distribusi Kompetensi Profesional Berdasarkan Status Hasil diskusi final untuk menyamakan isi materi adalah: a) konsistensi kesepakatan probabilitas jawaban responden menurut panelis (Extended Angoff) menunjukkan secara analitis rerata konsistensi inter-judgment adalah 0,667 pada putaran 1 dan 0,856 pada putaran 2. Sedangkan rerata konsistensi inter-judgment dari kombinasi pasangan ahli dalam putaran 1 adalah 0,760 dan putaran 2 adalah 0,903. Koefisien reliabilitas tersebut lebih besar dari kriteria minimal yang digunakan (0,70), sehingga dinyatakan bahwa kesepakatan ahli terhadap probabilitas menjawab dengan benar adalah reliabel; b) konsistensi kesepakatan probabilitas jawaban responden menurut panelis (Metode Ebel) menunjukkan secara analitis rerata konsistensi inter-judgment adalah 0,551 pada putaran 1, 0,841 pada putaran 2 dan 0,852 pada putaran 3. Rerata konsistensi inter-judgment dari kombinasi pasangan ahli dalam putaran 1 adalah 0,664, putaran 2 adalah 0,890, dan putaran 3 adalah 0,896. Koefisien reliabilitas tersebut lebih besar dari kriteria minimal yang digunakan (0, 70), kecuali pada putaran 1. Dengan demikian, dinyatakan bahwa kesepakatan ahli terhadap probabilitas menjawab dengan benar untuk putaran 2 dan 3 adalah reliabel. Rerata konsistensi intra-judgment putaran 1 dan 2 adalah 0,896; putaran 1 dan 3 . adalah 0,900; putaran 2 dan 3 adalah 0,949. Ketiga variasi putaran menunjukkan reliabilitas intra-judgment yang tinggi. Rerata konsistensi pada putaran 1, 2 dan 3 adalah 0, 945, artinya reliabilitas intra-judgment antar putaran lebih tinggi dari kriteria yang digunakan; c) Hasil metode Bookmark pada putaran 1 diperoleh nilai cutoff sebesar 61,826 dengan deviasi standar 6.539, sementara pada putaran 2 diperoleh niali cutoff sebesar 63,235 dengan deviasi standar 6,232. Bila ditetapkan nilai cutoff 61,826, maka
jumlah testee yang dapat menyelesaikan soal kompetensi adalah SS orang (16,S7%), demikian bila ditetapkan nilai cutoff 63,23S, maka jumlah testee yang dapat menyelesaikan soal kol!lpetensi adalah SS orang (16,S7%). Rerata konsistensi pada putaran 1, dan 2 adalah 0,877, artinya reliabilitas intra-judgment yang tinggi pada putaran 1 dan putaran 2 atau reliabilitasnya lebih tinggi dari kriteria (0,70) yang digunakan. Persyaratan uji normalitas dilakukan pada analisis diskriminasi dengan uji statistik dengan ketentuan Zhitung > ZtabeJ, bila skewness hitung 0,382 maka nilai Ztabel diinterpolasikan sehingga didapat O,lS~. Artinya Zhitung = 0,382 > 0,15S, menunjukkan penolakan asumsi normalitas pada tingkat signifikasi 0,05, sehingga variable dasar kompetensi normal. Matriks varians-covarians < dari 0,9, jadi tidak terjadi multikolinieritas pada data. Uji kesamaan vektor rerata dari tiap kelompok ditunjukkan oleh nilai p value < dari O,OS, sehingga rerata dalam variable di tiap untuk yang berkompeten dan tidak berkompeten adalah sama. Hasil uji Box's M tampak signifikasi < O,OS (digunakan tingkat kepercayaan 95%), artinya data berasal dari populasi yang sama. Catatan, untuk data dengan nilai ekstrim (outlier) telah dikeluarkan, dengan demikian analisis diskriminan dapat dilanjutkan. Hasil perhitungan uji ketepatan skor batas bahwa skor diskriminan . kkan fu ngs1. centr01"d seh"mgga d apat d"h" menun1u 1 1tung s k or b atasnya =-Zl+ZZ -, .
.
pada 1umlah sampel yang tidak sama maka rumus skor batasnya =
2 n1Zl+n2Z2 nl+n2
.
Contoh bila penentuan skor batas = 63,324, maka hasil analisis mengacu pada Casewise Statistics dengan melihat tanda dua bintang. Artinya bahwa pengelompokan yang berhasil dan gagal berada di daerah yang salah. Hasil akhir adalah 288 observasi telah diklasifikasikan secara cocok dan hanya 43 observasi dalam klasifikasi diantara keduanya yaitu kelompok yang berkompeten (kelompok yang aktual) dan tidak berkompeten (kelompok yang diprediksi). Hasil ketepatan klasifikasi adalah 288/311=87,009%. Ringkasan dari semua metode pada putaran ke 1, 2, dan 3 (putaran ·ke 3 khusus metode Ebel), bahwa ketepatan pengklasifikasian adalah antara 87,009% sampai dengan 88,SS4%. Hasil FGD tentang pengklasifikasian mempertimbangkan faktor·faktor a) hasil penentuan skor batas ideal dan minimal yang akan menimbulkan kesenjangan apabila diterapkan; b) kajian konsistensi inter dan intra-judge sehingga masalah tes dan proses standard setting perlu ditindaklanjuti; c) tujuan digunakannya skor batas pada analisis sasaran sebagai kriteria keberhasilan. Pertimbangan perlunya kajian secara statistik membuktikan bahwa dengan asumsi yang ketat dapat dijadikan pedoman dalam memutuskan skor batas.
, I
i
:::
I
Kesimpulan Berdasarkan hasil pengembangan instrumen kompetensi profesional bidang ketekniksipilan dan proses standard setting, maka a) kesepakatan penentuan skor batas ideal dalam menjawab dengan benar pada pendekatan metode Extended Angoff adalah sangat tinggi (0,923) dan penentuan skor batas minimal adalah sangat tinggi (0,926). Kesepakatan penentuan skor batas ideal dalam menjawab dengan benar pada pendekatan metode Bookmark adalah tinggi (0,728) dan penentuan skor batas minimal adalah tinggi (0,739). Sedangkan kesepakatan penentuan skor batas ideal dalam menjawab dengan benar pada pendekatan metode Ebel adalah tinggi (0,709) dan penentuan skor batas minimal adalah sangat tinggi (0,997); dan b) ketepatan pengklasifikasian adalah antara 87,009% sampai dengan 88,554%; dan c) jumlah guru yang berkompeten adalah 12,95% atau 42 guru dan seorang calon guru. Implikasi penelitian ini adalah dengan adanya penilaian kompetensi · profesional guru melalui UKG secara mendasar dan komprehensif merupakan gebrakan baru. Jika tes kompetensi profesional guru dilakukan secara intensif, maka hasilnya merupakan umpan balik dari proses pelatihan, penataran, seminar atau kegiatan pengayaan yang lain sehingga pemberian sertifikat profesi memberikan rasa keadilan, obyektif dan akurat. Pentingnya penentuan standar tidak saja memberikan rasa percaya diri dan semangat belajar, namun penentuan standar merupakan bentuk tanggung jawab moral seorang guru yang bersertifikasi dan profe~ional. Modifikasi sistem pengujian berbasis kompetensi dapat dikembangkan untuk disiplin ilmu yang lebih luas dan mendalam. Peta akademik seperti ini menjadi penting artinya bagi PMPTK untuk berbenah diri memasuki suatu jabatan atau profesi secara profesional. Referensi Arrasmith, D.G., Hambleton, R.K. (1988). Step for setting standards with the Angoff method. Report- Evaluative/Feasibility (142). Brandon, P. R. (2004). Conclusions about frequently studied modified Angoff standard-setting topics. Applied Measurement in Education, 14, .59-88. Cizek, G.J., Bunch M.B. & Koons, H. (2004). Setting Performance Standards: Contemporary methods. Educational Measurement. Issues and Practice. Washington: Winter 2004. Vol.23, No.4; pp. 31-50. Cizek, G.J. & Bunch, M.B. (2006). Standard Setting: A Guide to establishing and evaluating performance standard on test. ND: Sage.
.._i=... W £A: Amato. RP- (1997:3). Supportive data & guidelines for using die
~""*11t
Ebel and Nedelsky cutoff score methods. Available from
~lfwww_
ipacweb.org/conf/97 /donnoe.pdf (6 November 2009). ad. ILL 1972 Essentials of educational measurement. (3rd. ed.) Englewood Oiffts)iJ: Prentice Hall Inc. £.eisiirgec,. K.F. & McCormick, C.M. (2010). Adopting cut score: Post-standard setting panel considerations for decision makers. Educational Measurement: Issues and Practice, 29 (1), 38-44. Goodwin, L.D. (1996). Focus on quantitative method determining cut-off score. Research in Nursing & Health, 19, 249-256. Jaeger, R.M. (1989). Certification of student competence. In R. L. Linn (Ed.), Educational measurement (3rd ed., pp. 485-514). New York: American Council on Education/Macmillan. Kane, M.T. (2002b). Conducting examinee-centered standards setting studies based on standards of practice. The Bar Examiner, November 2002. Maslow, Albert P. (1983). Standards in occupational settings. In Anderson S.B., Helmick J.S., (Ed.), On Educational Testing (pp. 91-108). San Francisco: Jossey-Bass. Sukardi, T. (2008). Pengembangan model bengkel kerja praktik SMK. Disertasi tidak dipublikasikan. Yogyakarta: PPs UNY. Tabanick, B.G. & Fidell, L.S. (2007). Using Multivariate statistics (5th ed). Boston, MA: Allyn & Bacon. Van Nijlen, D. & Janssen, R. (2008). Modeling judgments in the angoff and contrasting-groups method of standard setting. journal of Educational Measurement, 45 (1), 45-63. Zieky, M.J., Perie M., & Livingston, S.A. (2008). Cutoff scores: A Manual for setting standards of performance on educational and occupational tests. Educational Testing Service. Zieky, M.J. & Perie, M. (--).A Primer on Setting Cut Scores on Tests of Educational Achievement Available from http: //www.ets.org/Media/Research/pdf/Cut Scores Primer.pdf (14 Desember 2010).
""' !I
ii
...
~,-~"~· "~:;-;'."';
::::t
!!!!!
!
. ~
·
I ii
....
KEMENTERIANPDIDIDllCAN DAN KEBUDAYftA~ UNIVDt.VfAS NEGERI YOGYAKARTA PROGllAM SI UDI PENEUTIAN DAN EVALUASI PENDIDIKAN Beketjawna dengan HIMPUNAN EVALUASI PENDIDIKAN INDONESIA
J
li1i
AJamat: ~ Yogyakarta-55281 Tdcpon: 0274-SS0835, Fai: 5203~6. E;.Mail:
[email protected]
Nomor , Hal Lampiran Kepada
: 72011UN34.17n'U/2012 : Pennohonan : I ekspl leaflet
: Yth Ibu Dr. Nanik Estidarsani
/
Dilaporkan dengan hormat bahwa Prodi PEP PPs UNY bekerjasama dengan Himpunan Evaluasi
P.;udidikan Indonesia (HEPi) akan menyeienggarakan Seminar Nasional dengan tema "Membangun Strategi Evaluasi yang Kredibel untuk Ujian Sekolah don Ujian Nasional". Sehubungan dengan bal itu, dengan surat ini kami Panitia Seminar Nasional mohon kepada Thu agar berkenan menjadi pemakalah pada acara tersebut pada: Hari/Tanggal
Jam Tempat Acara
: Sabtu, 13 Oktober 2012 : 08.00-15.30 WIB : Ruang Sidang Lantai III Gedung Barn Pascasarjana UNY : Pembukaan Seminar Nasional
Sebagai bahan pertimb~m~n. beri_lrnt tfifompirkan !e<>..f!et seminar nasfonm terkabulnya permohonan ini, diucapkan terima kasih.
j'mig diln~u¢
Atas
Yogyakarta, 28 September 2012 Ketua Panitia, A
'~---
Prof. Djemari Mardapi, Ph.D.
*) NB: Biaya transportasi dan akomodasi selama kegiatan akan diganti Panitia