PENYETARAAN DUA PERANGKAT TES PADA TEORI RESPON BUTIR (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013)
SITI HANDAYANI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014 Siti Handayani NIM G14100034
ABSTRAK SITI HANDAYANI. Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013). Dibimbing oleh DR FARIT MOCHAMAD AFENDI, MSi dan DR AGUS SANTOSO, MSi. Pendidikan merupakan aspek yang dapat memperlihatkan suatu negara termasuk kedalam kategori negara maju atau berkembang. Kondisi Negara Indonesia yang luas, dibutuhkan sebuah perangkat evaluasi pembelajaran yang bermakna sama. Maka dari itu, pemerintah melaksanakan Ujian Nasional.Pembuatan perangkat UN yang sempurna paralel sangatlah sulit. Provinsi Bali mendapat rata-rata UN MTK SMA tertinggi pada tahun 2013 sedangkan Provinsi DKI Jakarta merupakan pusat pemerintahan yang dianggap stabil dalam hal pendidikan. Rata-rata indeks parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar 0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak berbeda dengan Bali. Ketika kemampuan peserta yang sama-sama sebesar nol skor yang didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di Bali. Kata kunci: Penyetaraan Tes, Teori Respon Butir
ABSTRACT SITI HANDAYANI. Equating Score of Two Equipment Test on Item Response Theory (Case of Study: National Exam of Science Mathematic Senior High School Year 2013). Supervised by DR FARIT MOCHAMAD AFENDI, MSi dan DR AGUS SANTOSO, MSi. Education is one of aspect that can show whether a country is developed or developing country. In a big country such as Indonesia, it is necessary to have a learing evaluation equipment which has the same meaning. Thus, the goverment held a National Test. The making of National Test equipment is hard. Average score of national test on math in Bali Province is the highest in the country on 2013 however, the region that many considered stable in term of education, DKI Jakarta, has a lower average score. Estimated from three parametes, such as discriminating power, difficulty level, and probability of correct response carried out to these two equipment. Average of index from discriminating power showed that equipment on DKI Jakarta is lower than in Bali. Difficulty level in Bali is lower than DKI Jakarta. Average of probability of correct response in Bali and DKI Jakarta almost indicate the similarity that is 0.243 and 0.221. In theta is zero, score DKI Jakarta is 22.8 and equivalent to score 34.2 in Bali. Keyword: Item Response Theory, Test Equating
PENYETARAAN DUA PERANGKAT TES PADA TEORI RESPON BUTIR (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013)
SITI HANDAYANI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Judul Skripsi : Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013) Nama : Siti Handayani NIM : G14100034
Disetujui oleh
Dr Farit Mochamad Afendi, MSi Pembimbing I
Diketahui oleh
Dr Anang Kurnia, MSi Ketua Departemen
Tanggal Lulus:
Dr Agus Santoso, MSi Pembimbing II
PRAKATA Puji dan syukur Penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Mei 2014 ini ialah pendidikan, dengan judul Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013). Karya ilmiah ini Penulis susun sebagai salah satu kewajiban yang harus dipenuhi dan merupakan syarat untuk mendapatkan gelar Sarjana Statistika (SStat) pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulisan karya ilmiah ini dapat diselesaikan oleh Penulis tidak lepas dari dukungan, bimbingan, dan bantuan banyak pihak yang sangat berarti bagi Penulis. Oleh karena itu, Penulis mengucapkan terimakasih atas segala bantuan dan bimbingan yang diberikan kepada Bapak Dr Farit Mochamad Afendi, MSi selaku pembimbing pertama yang tiada lelah untuk membimbing, memberikan pembelajaran, dan mengingatkan agar selesai tepat waktu. Tak lupa juga terimakasih kepada Bapak Dr Agus Santoso, MSi selaku pembimbing kedua yang selalu memberikan masukan dan pembelajaran di setiap penulisan karya ilmiah ini. Di sisi lain, terimakasih kepada teman-teman Departemen Statistika tahun 2010 yang selalu mendukung hingga terselesaikannya karya ilmiah ini tepat waktu serta orang tua Penulis yang senantiasa menanti kelulusan Penulis. Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2014 Siti Handayani
DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Teori Respon Butir
2
Pendugaan Parameter
3
Penyetaraan Tes
4
Rancangan Tes Jangkar
4
Metode Rerata Sigma
5
METODE
6
Sumber Data
6
Prosedur Analisis data
6
HASIL DAN PEMBAHASAN
6
Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat
6
Asumsi Teori Respon Butir
8
Pendugaan Parameter pada Teori Respon Butir
8
Penyetaraan Kedua Perangkat SIMPULAN DAN SARAN
10 13
Simpulan
13
Saran
13
DAFTAR PUSTAKA
13
RIWAYAT HIDUP
17
LAMPIRAN
15
DAFTAR TABEL 1. Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes 2. Uji Beda Kemampuan Peserta dari Kedua Provinsi
9 10
DAFTAR GAMBAR 1. Histogram Skor UN MTK IPA SMA Provinsi Bali
6
2. Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta
7
3. Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI
Jakarta
7
4. Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan DKI
Jakarta
8
5. Grafik Daya Pembeda Bali dan DKI Jakarta
9
6. Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta
11
7. Daya Pembeda Kedua Perangkat setelah disetarakan
11
8. Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
12
9. Peluang Menebak Kedua Perangkat Setelah Disetarakan
12
DAFTAR LAMPIRAN 1. Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c)
Provinsi DKI Jakarta dan Bali
15
PENDAHULUAN Latar Belakang Pendidikan merupakan aspek yang sangat penting dalam kehidupan berbangsa dan bernegara. Bab 1 Pasal 1 UU No 20 Tahun 2003 memaparkan bahwa pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spritual keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta ketrampilan yang diperlukan dirinya, masyarakat, bangsa dan negara. Sistem pendidikan dapat memperlihatkan suatu negara termasuk kedalam kategori negara maju atau berkembang Negara Indonesia merupakan negara kepulauan terbesar di dunia dengan luas 5193250 km2 (mencakup daratan dan lautan) yang menjadikannya berada di urutan ke-7 sebagai negara terluas di dunia. Kementrian Pertahanan Republik Indonesia mencatat terdapat 17504 pulau di Indonesia. Untuk membandingkan pendidikan antar sekolah yang sangat banyak jumlahnya dan tersebar di seluruh pulau, dibutuhkan satu perangkat evaluasi yang bermakna sama secara nasional. Bermula pada tahun 1980, pemerintah memberlakukan Evaluasi Belajar Tahap Akhir Nasional (Ebtanas) yang mengembangkan perangkat ujian paralel untuk setiap mata pelajaran yang diujikan. Secara berangsur, Ebtanas berubah nama dan ketentuan. Pada tahun 2010 hingga sekarang evaluasi pembelajaran nasional bernama Ujian Nasional (UN). Pemerintah menjelaskan dalam PP No 19 Tahun 2005 tentang Standar Nasional Pendidikan, tepatnya pada bab 1 pasal 1 poin ke20 dinyatakan bahwa ujian adalah kegiatan yang dilakukan untuk mengukur pencapaian kompetensi peserta didik sebagai pengakuan prestasi belajar dan atau penyelesaian dari suatu satuan pendidikan. Kemudian, pada bab 10 pasal 63 disebutkan standar penilaian pendidikan yang diklasifikasikan kepada 3 kriteria, yaitu (1) penilaian hasil belajar oleh pendidik, (2) penialaian hasil belajar oleh satuan pendidikan, dan (3) penilaian hasil belajar oleh pemerintah. Khusus pada kriteria ketiga, dalam PP ini dijelaskan secara lebih spesifik lagi dalam pasal 66 butir 1 dinyatakan bahwa penilaian hasil belajar sebagaimana dimaksud dalam pasal 63 ayat 1 butir c bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan teknologi dan dilakukan dalam bentuk Ujian Nasional (UN). Pembuatan perangkat UN dilakukan pada masing-masing provinsi dan melalui tahapan uji coba sedemikian rupa sehingga perangkat layak untuk dijadikan perangkat tes yang bertaraf nasional. Terdapat 5 soal yang dibuat terpusat sebagai butir jangkar pada seluruh paket. Dimulai pada tahun 2013, terdapat sebanyak 20 paket soal tersebar di setiap provinsi.Namun, membuat perangkat tes yang sempurna paralel tidaklah mudah. Masih saja terdapat kekurangan pada masalah keadilan. Bisa jadi, perangkat di Provinsi X lebih mudah atau lebih sulit daripada perangkat tes di Provinsi Y. Hal tersebut menjadi kendala ketika penilaian UN dijadikan suatu patokan tertentu. Provinsi Bali merupakan Provinsi dengan rata-rata nilai UN tertinggi pada tahun 2013 dan tahun-tahun sebelumnya. Sedangkan Provinsi DKI Jakarta merupakan pusat pemerintahan yang dianggap paling stabil dalam hal pendidikan.
2 Oleh karena itu, pendugaan parameter soal UN untuk mata pelajaran matematika IPA SMA di Provinsi Bali dan Provinsi DKI Jakarta serta penyetaraan kedua perangkat tes dengan menggunakan Teori Respon Butir merupakan topik yang menarik untuk diambil pada penelitian ini.
Tujuan Penelitian Tujuan yang ingin dicapai dari penelitian ini adalah menduga parameter soal UN matematika IPA SMA di Provinsi DKI Jakarta dan Provinsi Bali serta melakukan penyetaraan kedua perangkat tersebut.
TINJAUAN PUSTAKA Teori Respon Butir Teori respon butir merupakan suatu pengkajian terhadap tes dan skor butir yang didasarkan pada asumsi-asumsi yang berkaitan antara parameter butir tes (yang tercermin dalam jawaban-jawaban butir tes) dan kemampuan. Hambelton et al (1991) menjelaskan bahwa model teori respon butir memiliki beberapa asumsi diantaranya Unidimensional atau satu dimensi. Asumsi ini dipenuhi dengan syarat adanya satu komponen yang dianggap dominan dalam menentukan kemampuan peserta tes. Pemeriksaan asumsi ini dapat dilakukan dengan melihat rasio akar ciri yang pertama dan kedua.Jika rasionya tinggi, maka model bersifat unidimensi Kemudian, Independensi local atau kebebasan lokal. Kebebasan lokal pada butir terpenuhi jika untuk menjawab butir satu dan yang lainnya tidak memiliki hubungan dalam suatu perangkat. Hal tersebut bermakna bahwa untuk menjawab satu butir tidak bergantung dengan butir yang lainnya. Asumsi kebebasan lokal akan terpenuhi jika asumsi unidimensi sudah terpenuhi. Terdapat tiga model pada teori respon butir yang sering digunakan saat ini, yaitu: 1. Model satu parameter logistik dengan penitikberatan pada parameter tingkat kesukaran saja. Kurva karakteristik butir pada model ini diberikan dengan persamaan: Pi(θ) = Keterangan: Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir soal ke- i dengan benar = parameter kemampuan peserta tes bi = parameter tingkat kesukaran 2. Model dua parameter logistik dengan penitikberatan pada parameter tingkat kesukaran dan daya pembeda soal. Kurva karaketeristik butir pada model ini diberikan dengan persamaan:
3
Pi(θ) = Keterangan: Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir soal ke- i dengan benar = parameter kemampuan peserta tes bi = parameter tingkat kesukaran ai = parameter daya pembeda soal butir ke- i 3. Model tiga parameter logistik degan penitikberatan pada parameter tingkat kesukaran, daya pembeda soal, dan peluang menebak peserta tes. Kurva karakteristik butir pada model ini diberikan dengan persamaan: Pi(θ) = Ci + (1-Ci) Keterangan: Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir soal ke- i dengan benar = parameter kemampuan peserta tes bi = parameter tingkat kesukaran = parameter daya pembeda soal butir ke- i ai ci = peluang tebakan benar butir ke- i D = faktor penskalaan yang diikutkan untuk menjadikan fungsi logistik serupa mungkin dengan fungsi ogive normal (D=1.7) (Thorpe et al 2012) Pendugaan Parameter Pendugaan kemampuan peserta tes pada dua perangkat dilakukan dengan menggunakan pendugaan parameter kemungkinan maksimum (maximum likelihood estimation, MLE). Hogg et al (1978) memaparkan bahwa prinsip dasar dari metode MLE adalah ketika terdapat contoh acak X1, X2, ….,Xn dari sebuah sebaran yang memiliki suatu fungsi kepekatan peluang f(x; ), . Fungsi kepekatan peluang bersama dari X1, X2,…,Xn adalah f(x1; ),f(x2; ),…f(xn; ). Fungsi kepekatan peluang bersama ini dipandang sebagai fungsi dari . Berdasarkan definisi yang telah dijelaskan, maka fungsi nisbah kemungkinan dapat dinotasikan sebagai berikut: L( ;x1,x2,…xn) = f(x1; )f(x2; )…f(xn; ) Hambelton et al (1991) mendefinisikan fungsi likelihood untuk model teori respon butir adalah sebagai berikut: L(x1,x2,…,xn | ) = l(X | ) = ln L(x1,x2,…,xn | ) l(X | ) = ln l(X | ) =
4 dengan = 0, = ( ; a, b, c) sehingga a, b, c adalah parameter butir soal, dan adalah parameter kemampuan peserta tes. Model ini merupakan model 3 parameter logistik. Penyetaraan Tes Naga (1992) menyatakan bahwa skor tes sebagai hasil koreksi dari setiap butir yang dikerjakan peserta tes yang menampilkan jawaban benar atau salah dibedakan menjadi dua, yaitu skor tunggal yaitu skor satu butir sebagai jawaban dari satu peserta tes dan skor komposit yaitu gabungan dari skor tunggal Crocker dan Algina (1986) memaparkan bahwa penyetaraan didefinisikan sebagai suatu proses untuk menetapkan skor-skor equivalen pada dua instrumen. Penyetaraan skor adalah suatu prosedur empiris yang diperlukan untuk mentransformasi skor suatu perangkat tes ke skor perangkat tes yang lain. Karena merupakan prosedur empiris maka penyetaraan skor didasarkan pada data skor tes. Dalam buku Fundamental of Item Response Theory (Hambleton et al 1991) Lord (1980) mengemukakan gagasan atau ide penyetaraan dalam beberapa implikasi, diantaranya: 1. Pengukuran tes dengan sifat yang berbeda tidak dapat di setarakan. 2. Skor mentah pada tes yang konsisten tidak sama, tidak dapat diproses. 3. Skor mentah pada tes dengan kesukaran yang bervariasi tidak dapat disetarakan karena tes tidak akan konsisten sama pada tingkat kesukaran yang sama. 4. Kekeliruan atau kesalahan skor pada tes atau paket Y dan X tidak dapat disetarakan kecuali jika kedua test tersebut benar-benar paralel. 5. Tes yang sempurna reliabilitasnya dapat dilakukan penyetaraan. Penyetaraan dilakukan dengan cara mengkonversikan satu paket ke paket yang lain, dari paket yang mengukur kemampuan yang sama. Penyetaraan perangkat tes merupakan pembuatan sejumlah keputusan dari skor yang diperoleh dari sebuah paket untuk disesuaikan ke bentuk yang berbeda tingkat kesukarannya. Jika ada paket X lebih sukar dari paket Y, maka penyetaraan paket X ke Y menghasilkan nilai paket X lebih tinggi atau berharga jika disetarakan ke paket Y (Crocker dan Algina 1986). Membuat soal yang setara dalam dua buah paket atau lebih, tentunya tidak mudah atau bahkan tidak mungkin, karena pasti ada perbedaannya.Hal tersebut disebabkan karena hampir tidak mungkin menyusun multi paket tes yang benarbenar paralel (Petersen, Kolen, & Hoover 1989). Meskipun penyusun tes menggunakan spesifikasi tes yang sama dalam menulis butir-butirnya dan hanya merubah angka, tidak ada jaminan bahwa tingkat kesukaran butir-butir tersebut akan sama. Apalagi jika yang berbeda adalah kata kunci dan isi dari pilihan jawaban. Rancangan Tes Jangkar Desain ini biasanya digunakan jika masalah keamanan tes menjadi salah satu pertimbangan penting dan memungkinkan untuk menyelenggarakan beberapa tes dalam satu waktu. Pada desain ini masing-masing perangkat tes mempunyai
5 beberapa item yang sama(common item) dan masing-masing kelompok mengerjakan perangkat tes yang berbeda. Crocker dan Algina (1986) memaparkan bahwa pada rancangan ini, bila digunakan dua perangkat tes yaitu X dan Y dan dua kelompok peserta yaitu K1 dan K2, masing-masing ditambahkan butir-butir jangkar (butir yang sama) Z, maka masing-masing kelompok mengerjakan soal X+Z dan Y+Z. Persamaan penyetaraan skor pada rancangan ini dapat dihitung dengan perhitungan sebagai berikut: b*k2 = bk1+ a*k2 = c*k2 = ck1 θ*k2 = αθk1 + β Keterangan: b*k2 = parameter tingkat kesukaran butir tes jangkar pada kelompok 2 a*k2 = parameter daya pembeda butir tes jangkar pada kelompok 2 c*k2 = parameter peluang menebak butir tes jangkar pada kelompok 2 θ*k2 = parameter kemampuan peserta tes jangkar pada kelompok 2 bk1 = parameter tingkat kesukaran butir tes jangkar kelompok 1 ak1 = parameter daya pembeda butir tes jangkar kelompok 1 ck1 = parameter daya pembeda buir tes jangkar kelompok 1 θk1 = parameter kemampuan peserta tes jangkar pada kelompok 1 α,β = konstanta konversi penyetaraan tes Metode Rerata Sigma Penentuan konstanta konversi a dan b menurut metode rerata dan sigma dilakukan dengan memperhatikan nilai estimasi parameter tingkat kesukaran butir tes pada kedua perangkat tes yaitu bx dan by. Metode rerata dan sigma ini bersifat timbal balik sehingga dengan cara yang sama hubungan dari y ke x dapat ditentukan. Menurut Hambleton & Swaminathan 1985, hubungan antara estimasi parameter butir tes atau parameter kemampuan peserta pada kedua perangkat tes yang akan disetarakan dan penentuan konstanta konversinya memenuhi persamaan sebagai berikut: y = x+ = +
=
-
Keterangan: y = estimasi kemampuan atau estimasi parameter butir pada perangkat tes Y x = estimasi kemampuan atau estimasi parameter butir pada perangkat tes X = rerata dari y = rerata dari x sx = simpangan baku dari x sy = simpangan baku dari y
6
METODE Sumber Data Penelitian ini menggunakan data sekunder status respon Ujian Nasional SMA yang dilaksanakan pada 18 April 2013 untuk mata pelajaran Matematika IPA Provinsi DKI Jakarta paket F05 dan Provinsi Bali paket C09 dengan format 1 0 (sudah di koreksi benar salahnya). Jumlah soal terdiri dari 40 butir diantaranya 5 butir jangkar (butir yang sama) dan 35 butir berbeda dari kedua perangkat. Data diambil dari Pusat Penilaian Pendidikan, Jakarta Pusat.Jumlah peserta tes yang diambil adalah 887 peserta di Provinsi Bali dan 1118 di Provinsi DKI Jakarta. Prosedur Analisis data Tahapan-tahapan yang dilakukan pada penelitian ini adalah sebagai berikut: 1. Persiapan data dan melakukan eksplorasi data. 2. Menduga parameter tingkat kesukaran (b), daya pembeda (a), dan peluang menebak (c) untuk kedua perangkat tes. 3. Menduga parameter kemampuan peserta tes untuk kedua kelompok peserta. 4. Menghitung konstanta persamaan penyetaraan dengan metode rerata sigma. 5. Membuat persamaan penyetaraan skor kedua perangkat tes. 6. Mengkonversi skor Bali terhadap DKI. 7. Interpretasi.
HASIL DAN PEMBAHASAN Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat Skor UN MTK IPA SMA dari kedua provinsi memiliki rata-rata nilai yang hampir sama. Namun, Bali memiliki rata-rata nilai yang lebih tinggi dari pada DKI Jakarta.
Gambar 1 Histogram Skor UN MTK IPA SMA Provinsi Bali
7
Gambar 2 Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta Sebaran skor dari kedua perangkat terlihat berbeda pada gambar histogram. Histogram skor UN MTK IPA SMA di Provinsi DKI Jakarta lebih berbentuk menyerupai genta (lonceng) yang menandakan kenormalan data sedangkan histogram skor di Provisi Bali lebih curam di sebelah kanan. Hal ini menunjukkan bahwa banyaknya peserta UN MTK SMA di Bali yang mendapat skor tinggi. Terdapat 26.606% peserta UN MTK SMA di Provinsi Bali memperoleh skor sebesar sama dengan lebih dari 90. Sedangkan terdapat 12.245% peserta di Provinsi DKI Jakarta yang memeperoleh skor sama dengan lebih dari 90.
Gambar 3 Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI Jakarta
8
Gambar 4 Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan DKI Jakarta Rata-rata skor butir jangkar UN MTK SMA di Provinsi Bali lebih kecil daripada di Provinsi DKI Jakarta yakni sebesar 66.448 dan 80.501. Jika dilihat dari tiga puluh lima soal lain tanpa butir jangkar, Bali memiliki rata-rata skor yang lebih tinggi daripada DKI Jakarta yaitu 72.613 dan 64.546. Hal demikian menimbulkan dugaan bahwa perangkat Bali lebih mudah daripada DKI Jakarta atau kemampuan peserta di Provinsi DKI Jakarta lebih tinggi daripada peserta di Provinsi Bali. Asumsi Teori Respon Butir Asumsi Unidimensi Teori respon butir dapat dilakukan ketika asumsi yang ada telah terpenuhi. Asumsi unidimendional terpenuhi ketika dua akar ciri pertama dari respon peserta memiliki rasio yang besar. Karena keterbatasan data yang didapat, maka peneliti tidak dapat melakukan pemeriksaan asumsi ini. Akan tetapi, asumsi unidimensi sudah di periksa ketika uji coba pembuatan perangkat soal. Maka dari itu, dapat disimpulkan bahwa kedua perangkat tes sudah memenuhi asumsi unidimensi. Asumsi Kebebasan Lokal Ketika asumsi unidimensi sudah terpenuhi, maka asumsi kebebasan lokal diperoleh. (Lord 1980) Maka dari itu, dapat disimpulkan bahwa respon dari perangkat tes DKI Jakarta dan Bali sudah memenuhi asumsi kebebasan lokal baik butir maupun peserta tes. Pendugaan Parameter pada Teori Respon Butir Model teori respon butir yang digunakan dalam penelitian ini adalah tiga parameter logistik. Parameter butir yang diduga dari kedua perangkat tes ini adalah daya pembeda butir, tingkat kesukaran butir, peluang menebak, dan kemampuan peserta tes. Pada proses perhitungan dengan software, terdapat dua butir dari kedua perangkat tes tidak keluar hasil nya. Hal tersebut dikarenakan
9 status respon yang benar semua. Pada Provinsi Bali butir nomer 24 dan 34 serta pada Provinsi DKI Jakarta butir nomer 20 dan 29. Daya Pembeda Daya pembeda butir selalu bernilai positif. Semakin tinggi nilai daya pembeda maka semakin baik pula butir soal. Daya pembeda butir mengindikasikan dapat atau tidaknya suatu butir membedakan peserta yang memiliki kemampuan pendidikan yang tinggi dan yang kurang. Daya pembeda paling tinggi pada perangkat Bali terdapat pada butir nomer 10 dan pada perangkat DKI Jakarta pada butir nomer 34. Nilai tengah daya pembeda pada perangkat Bali lebih tinggi daripada DKI Jakarta yakni sebesar 3.58 dan 2.43. Daya pembeda yang berkisar lebih dari 1.70 merupakan daya pembeda yang sangat tinggi yang mengndikasikan bahwa butir soal sudah sangat baik membedakan kategori peserta yang berkemampuan tinggi dan rendah. (Baker 1985)
12 10
8
DKI
6
BALI
4 2 0 1
3
5
7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Gambar 5 Grafik Daya Pembeda Bali dan DKI Jakarta Tingkat Kesukaran Tingkat kesukaran butir merupakan nilai kemampuan peserta ketika peluang peserta menjawab benar adalah sebesar 0.5. Hal ini berarti nilai tingkat kesukaran yang tertinggi merupakan kemampuan tertinggi yang dikerahkan untuk mempunyai peluang menjawab butir soal dengan benar sebesar 50%. (Humbelton et al 1991) Tabel 1 Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes
Bali DKI Jakarta
N
Mean
StDev
38
-0.699
1.377
38
-0.169
1.034
Thitung
Ttabel
-0.076
1.66-1.67
10
Hipotesis nol dari uji beda satu arah ini adalah nilai tengah indeks tingkat kesukaran di Provinsi Bali tidak lebih kecil daripada DKI Jakarta. Statistik uji t yang dihitung lebih kecil daripada statistika uji t pada tabel. Maka dari itu, kesimpulan yang didapat dari uji beda satu arah ini pada taraf nyata 5% adalah nilai tengah indeks tingkat kesukaran Bali tidak lebih kecil daripada DKI Jakarta berarti bahwa perangkat tes pada Provinsi Bali tidak lebih sulit daripada DKI Jakarta. Peluang Menebak Peserta untuk Menjawab Benar Peluang menebak peserta ini dikenal sebagai Pseudo-chance-level parameter. Peluang menebak peserta UN MTK SMA Bali dan DKI Jakarta untuk menjawab benar hampir mendekati nilai yang sama yakni 0.221 dan 0.243. Peluang menebak peserta untuk menjawab benar berkaitan dengan performa butir dan pilihan jawaban. Kemampuan Peserta Tes Pada perangkat tes Provinsi Bali, kemampuan peserta berkisar antara -2,92 sampai 1,59 sedangkan di Provinsi DKI Jakarta, kemampuan peserta berada pada kisaran -2,54 sampai 2,18. Tabel 2 Uji Beda Kemampuan Peserta dari Kedua Provinsi Provinsi
Mean
StDev
DKI Jakarta
0.004
0.982
Bali
-0.025
1.009
p value 0.507
Hipotesis nol dari uji beda dua arah ini adalah nilai tengah parameter kemampuan peserta tes di Provinsi Bali tidak berbeda dengan nilai tengah parameter kemampuan peserta tes di Provinsi DKI Jakarta. Setelah dilakukan pengujian dengan menggunakan sebesar 5% didapat p-value sebesar 0.507 dan dapat disimpulkan bahwa nilai tengah parameter kemampuan peserta tes di Provinsi Bali tidak berbeda dengan nilai tengah parameter kemampuan peserta tes di Provinsi DKI Jakarta. Penyetaraan Kedua Perangkat Perhitungan konstanta α dan β dilakukan menggunakan software yang kemudian diperoleh hasil 0.36 dan -0.49.
11
Gambar 6 Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta Tes DKI Jakarta yang dianggap sebagai tes 1 dijelaskan oleh garis hitam, tes Bali dijelaskan oleh garis hitam putus-putus. Garis berwarna merah merupakan hasil penyetaraan skor Bali terhadap DKI Jakarta. Garis berwarna biru merupakan butir jangkar dari kedua tes. Butir jangkar DKI jakarta dijelaskan oleh garis biru biasa sedangkan butir jangkar Bali dijelaskna oleh garis biru putus-putus. Ketika kemampuan peserta DKI Jakarta sebesar nol mendapatkan skor sekitar 22.8, lebih rendah daripada skor yang didapat peserta Bali dengan kemampuan yang sama. Pada hasil penyetaraan yang ditunjukkan oleh garis merah, dengan kemampuan peserta yang sama-sama sebesar nol skor yang didapatkan DKI Jakarta sebesar sekitar 22.8 akan setara dengan skor sekitar 34.2 di Bali. Keadaan berbeda ditunjukkan ketika kemampuan peserta berada pada selang -5 sampai -3. Skor yng dihasilkan menunjukkan angka yang hampir sama. Pergerakan naik dan turun skor yang didapat dari kedua tes terlihat tidak stabil pada kemampuan peserta pada selang -3 sampai 0. Pada interval kemampuan 2 sampai 5 skor yang didapat sudah stabil posisinya.
Gambar 7 Daya Pembeda Kedua Perangkat setelah disetarakan
12
Gambar 8 Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
Gambar 9 Peluang Menebak Kedua Perangkat Setelah Disetarakan Ketiga gambar tersebut merupakan hasil parameter butir jangkar yang telah dilakukan penyetaraan. Butir jangkar yang ada sebenarnya adalah 5 butir. Namun untuk butir nomor 29 pada perangkat DKI Jakarta tidak keluar parameter butir nya, maka butir jangkar yang dimasukkan hanya 4 butir yakni nomor 10, 12, 17, dan 23.
13 Pada daya pembeda baru hasil penyetaraan hanya terlihat tiga butir. Hal tersebut dikarenakan satu butir lainnya memiliki indeks daya pembeda yang lebih dari 3 dan plot yang ditampilkan hanya berkisar hingga 3.
SIMPULAN DAN SARAN Simpulan Pendugaan ketiga parameter yakni daya pembeda, tingkat kesukaran, dan peluang menebak dilakukan terhadap kedua perangkat tes. Rata-rata indeks parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar 0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak berbeda dengan Bali yang berarti bahwa kemampuan peserta DKI Jakarta dan Bali tidak berbeda. Ketika kemampuan peserta yang sama-sama sebesar nol skor yang didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di Bali.
Saran Penelitian ini masih terdapat banyak kekurangan, maka dari itu untuk penelitian selanjutnya disarankan agar mencoba semua model teori respon butir untuk keseluruhan perangkat.Selain itu, perangkat yang disetarakan diambil dari beberapa provinsi yang latar belakang pendidikannya sangat timpang.Diusahakan agar mendapatkan data hasil jawaban peserta secara lengkap bukan hanya status respon hasil pemeriksaan agar lebih memudahkan untuk analisis apapun.
DAFTAR PUSTAKA Crocker L, Algina J. 1986. Introduction to classical and modern test theory. New York(US): Holt, Rinehart and Winston, Inc. Davier, A. 2009. Statistical Models for Test Equating, Scaling, and Linking. Newyork(US): Springer. Hambleton RK, Swaminathan H, Jane RH.1991. Fundamentals of Item Response Theory. London(GB): SagePublications. Hogg RV, Mckean JW, AT Craig. 1978. Introduction to Mathematical Statistics 4th Edition. New York(US): Macmillan Publishing. Lord, FM. 1980. Application of Item Response Theory to Practocal Testing Problems. Erlbaum Associate. Naga, DS. 1992. Pengantar Teori Skor Pada Pengukuran Pendidikan. Jakarta(ID): Besbats Peterson NS, Kolen M J. 1989. Scalling, Norming, and Equating. In R. L. Linn (Ed), Educational Measurement. New York(US): Macmillan
14 Thorpe GL, Favia A. 2012. Data Analysis Using Item Response Theory Methodology: an Introduction to Selected Program and Aplication [Psychology Faculty Scholarship Paper 20]. Main(US): University of Maine. Wijaya, YS. 2013. Comparison of Item Difficulty Index National Exam Package (Analysis Using Item response Theory).Jakarta(ID): Universitas Negeri Jakarta
15 Lampiran 1 Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c) Provinsi DKI Jakarta dan Bali NOMOR BUTIR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
DKI JAKARTA a b c 1.827 -1.488 0.149 1.581 1.069 0.278 0.829 -0.396 0.136 1.345 -1.341 0.179 2.514 0.587 0.403 1.028 0.278 0.186 2.054 -1.486 0.113 0.644 -2.324 0.158 1.412 -1.252 0.168 0.805 -0.111 0.187 1.441 -1.510 0.146 2.306 -0.551 0.248 1.351 -1.101 0.228 1.879 -1.295 0.235 1.614 -1.401 0.199 3.230 0.202 0.330 2.074 -1.262 0.145 5.788 0.537 0.328 2.946 1.709 0.195 1.626 0.832 1.327 4.996 0.963 5.699 4.942 2.491
-1.494 0.489 -0.991 0.686 0.798 0.144 0.693 0.867
0.127 0.133 0.250 0.243 0.274 0.410 0.356 0.287
3.848 1.348 4.801 0.585 5.932 4.127
0.729 -1.335 0.808 -1.055 0.746 0.524
0.314 0.169 0.267 0.181 0.394 0.253
a 1.345 6.881 2.111 1.860 4.202 1.644 2.362 5.143 0.502 9.807 2.133 1.794 6.195 2.037 1.734 2.293 1.705 8.269 5.100 1.571 0.964 7.059 0.976
BALI b -2.269 0.443 -1.783 -1.213 0.148 -1.363 -1.281 0.502 -0.070 0.504 -1.851 -1.953 0.618 -1.883 -2.438 -1.136 -1.847 0.646 0.182 -1.912 -2.302 0.151 0.589
c 0.199 0.097 0.144 0.173 0.354 0.120 0.214 0.397 0.244 0.165 0.183 0.182 0.331 0.192 0.179 0.080 0.189 0.201 0.251 0.161 0.161 0.321 0.199
5.818 1.304 4.809 4.275 5.494 8.413 1.852 5.318 1.857
0.063 -5.750 0.291 0.143 0.202 0.150 -1.852 0.292 -1.261
0.219 0.200 0.295 0.184 0.146 0.313 0.200 0.259 0.134
3.821
0.771
0.243
16 DKI JAKARTA BALI NOMER BUTIR a b c a b 36 3.446 0.566 0.304 5.124 0.438 37 2.396 -0.110 0.365 0.947 -1.850 38 4.364 0.795 0.237 4.257 0.621 39 1.206 0.678 0.377 2.435 0.409 40 0.796 1.154 0.285 2.703 0.265 Keterangan: Butir jangkar (butir yang sama) dari kedua perangkat
c 0.272 0.162 0.252 0.409 0.394
Butir yang output nya tidak keluar karena status respon yang benar semua
17
RIWAYAT HIDUP Penulis dilahirkan di Bogor pada 5 Februari 1993 dan merupakan anak ketiga dari tiga bersaudara pasangan (alm.)Saefudin dan Siti Masitoh. Penulis menyelesaikan pendidikan dasar di SD Pertiwi pada tahun 2004, pendidikan menengah pertama di SMP Negeri 1 Bogor pada tahun 2007, pendidikan menengah atas di SMA Negeri 4 Bogor pada tahun 2010. Penulis diterima di Institut pertanian Bogor pada tahun 2010 melalui jalur Undangan Seleksi Masuk IPB (USMI) dan tercatat sebagai mahasiswa Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam dengan minor Ilmu konsumen. Selama perkuliahan, penulis mengikuti beberapa kegiatan non akademik seperti organisasi MAX!! dan Gamma Sigma Beta dan menjabat beberapa posisi. Penulis juga mengikuti beberapa kepanitiaan dan yang terahir adalah kepanitiaan the 8th Statistika Ria. Penulis mengikuti praktik lapang di Dinas Kependudukan dan Pencatatan Sipil Provinsi DKI Jakarta pada bulan Juli-Agustus 2013 selama dua bulan.