BAB II LANDASAN TEORI A. Tinjauan Pustaka 1. Pendidikan Pendidikan menurut Carter V. Good (1945) seperti dikutip oleh Arifin (2009:38) adalah “(1) proses perkembangan kecakapan seseorang dalam bentuk sikap dan perilaku yang berlaku dalam masyarakatnya, (2) proses sosial ketika seseorang dipengaruhi oleh suatu lingkungan yang terpimpin (sekolah) sehingga dia dapat mencapai kecakapan sosial dan mengembangkan pribadinya”. Sedangkan pengertian pendidikan menurut Arifin (2009:38) dapat dipahami dari pendekatan monodisipliner, di mana konsep pendidikan dilihat dalam berbagai disiplin keilmuan, antara lain: a. Sosiologi, yaitu melihat pendidikan dari aspek sosial, pendidikan berarti proses sosialisasi individu. b. Antropologi, yaitu melihat pendidikan dari aspek budaya, pendidikan berarti sarana pertumbuhan budaya. c. Psikologi, yaitu melihat pendidikan dari aspek tingkah laku, pendidikan berarti proses perubahan tingkah laku individu secara optimal. d. Ekonomi, yaitu melihat pendidikan sebagai usaha penanaman modal insane (human investment) e. Politik, yaitu melihat pendidikan sebagai usaha pembinaan kader bangsa. f. Agama, yaitu melihat pendidikan sebagai pengembangan kepribadian manusia secara utuh sebagai pengembangan kepribadian manusia secara utuh sebagai hamba Tuhan. Secara ringkas pendidikan adalah usaha yang dilakukan manusia untuk mengembangkan diri berupa kualitas kepribadian individu melalui suatu proses yang dilakukan dalam lingkungan tertentu. Proses tersebut berupa komponen yang saling mempengaruhi dan ketergantungan seperti halnya suatu sistem. Sebagaimana dikemukakan oleh P.H Coombs (1968) yang dikutip oleh Arifin (2009:39), bahwa “sistem pendidikan terdiri atas 12 komponen utama, yaitu tujuan dan prioritas, peserta didik, manajemen, struktur dan jadwal waktu, isis/materi, guru dan pelaksana, alat dan sumber
7
8 belajar, fasilitas, teknologi, pengawasan mutu, penelitian dan biaya pendidikan”. Pendidikan sendiri selalu berkembang seiring perkembangan zaman. Sedangkan untuk meningkatakan mutu pendidikan, Asmin (2006) dalam Supriyadi (2013:51) menyatakan “tidak terlepas dari penerapan penilaian yang dapat secara tepat mengukur hasil akhir dari suatu proses pembelajaran”. Artinya untuk menilai hasil akhir dalam pembelajaran diperlukan alat penilaian yang berkualitas. Salah satu alat penilaian yang sering digunakan adalah tes. Untuk mengetahui kualitas tes maka perlu dilakukan analisis soal sebelum soal tersebut diberikan kepada peserta tes. 2. Evaluasi Dari segi istilah, sebagaimana dikemukakan oleh Edwin Wnad dan Gerald W. Brown (1977) seperi yang dikutip oleh Sudijono (2005:1) :“Evaluation refer to the act or process to determining the value of something.” Menurut definisi tersebut maka istilah evaluasi itu berarti kegiatan atau proses untuk menentukan nilai dari sesuatu. Pengertian evaluasi menurut para ahli dirangkum oleh Arifin (2009:5), antara lain: a. Guba dan Lincoln (1985) bahwa evaluasi sebagai: “a process for describing an evaluand and judging its merit and worth” atau evaluasi adalah suatu proses untuk menggambarkan peserta didik dan menimbangnya dari segi nilai dan arti. Definisi ini menegaskan bahwa evaluasi berkaitan dengan nilai dan arti b. Gilbert Sax (1980:18) bahwa: “evaluation is a process through which a value judgement or decision is made from variety of observations and from the background and training of the evaluator”. Dapat pula disimpulkan bahwa pada hakikaktnya evaluasi adalah suatu proses yang sistematis dan berkelanjutan untuk menentukan kualitas (nilai dan arti) dari sesuatu, berdasarkan pertimbangan kriteria tertentu dalam rangka pembuatan keputusan. Menurut AS Hornby dalam Arikunto (2008:1) bahwa “evaluasi adalah to find out, decide the amount or value atau berarti upaya untuk menentukan jumlah atau nilai. Kegiatan evaluasi harus dilakukan secara hatihati, bertanggung jawab serta menggunakan strategi”.
9 Evaluasi sebagai sebuah proses dikemukakan Suchman (1961) dalam Arikunto (2004:1) berarti menentukan hasil yang telah dicapai dari beberapa kegiatan yang direncanakan untuk mendukung tercapainya tujuan. Objek evaluasi adalah program yang mempunyai banyak dimensi, oleh karena itu alat ukur yang digunakan juga bervariasi tergantung jenis data yang ingin diperoleh. Menurut Arikunto (2007:24) evaluasi meliputi pengukuran dan penilaian. Pengukuran adalah membandingkan sesuatu dengan satu ukuran sedangkan penilaian adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Seperti yang telah disebutkan diatas, pendidikan harus terus berkembang. Pengembangan pendidikan dilakukan oleh pemerintah dengan berbagai macam cara, karena inilah pendidikan juga membutuhkan evaluasi. Evaluasi dalam pendidikan bisa berupa evaluasi kurikulumnya ataupun dalam kegiatan pembelajaran. Menurut Ralph Tyler (1950) yang dikutip dalam Arikunto (2004:3), “evaluasi pendidikan merupakan proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa dan bagianmana tujuan pendidikan sudah tercapai. Jika belum, bagaimana yang belum dan apa sebabnya”. Dalam dunia pendidikan, khususnya dalam proses pembelajaran di sekolah, salah satu cara untuk mengenal atau mengetahui obyek dari evaluasi pendidikan adalah dengan menyoroti dari tiga segi, yaitu segi input, transformasi input, dan output, dimana input kita anggap sebagai “bahan mentah” yaitu adalah peserta didik, transformasi input kita anggap sebagai “mesin/alat
mengolah bahan mentah” yaitu meliputi (a) kurikulum atau
materi pelajaran (b) metode mengajar dan teknik penilaian (c) sarana atau media pendidikan (d) sistem administrasi (e) guru dan unsure-unsur personal lain yang terlibat dalam proses pendidikan, dan output yang kita anggap sebagai “hasil pengolahan yang dilakukan di dapur dan siap untuk dipakai”, yaitu tingkat pencapaian atau prestasi belajar yang berhasil diraih oleh masing-masing peserta didik. Untuk mengetahui seberapa jauh tingkat pencapaian atau prestasi belajar yang diraih oleh para peserta didik,
10 dipergunakan alat berupa Tes Prestasi Belajar atau Tes Hasil Belajar, yang biasanya dikenal dengan istilah tes pencapaian (achievement test). (Sudijono. 2005:73) 3. Kurikulum 2013 Kosakata kurikulum telah masuk ke dalam kosakata bahasa Indonesia, dengan arti susunan rencana pengajaran (Purwadarminta, 1991:543). Kosakata tersebut menurut sebagian ahli berasal dari bahasa Latin, curriculum yang berarti bahan pengajaran, dan ada pula yang mengatakan berasal dari bahasa Perancis, courier yang berarti berlari (Nasution, 1991:9). Sedangkan menurut Haryati (2007:1) “kurikulum adalah seperangkat terencana dan pengaturan mengenai tujuan, isi dan bahan pelajaran serta cara yang digunakan sebagai pedoman penyelenggaraan kegiatan pembelajaran untuk mencapai tujuan pendidikan tertentu”. Dengan demikian, dari penjelasan pengertian kurikulum di atas, dapat disimpulkan berdasarkan UUSPN No. 20 tahun 2003 Pasal 1, ayat 19 mengatakan “kurikulum adalah seperangkat rencana dan pengaturan mengenai tujuan, isi, dan bahan pelajaran serta cara yang digunakan sebagai pedoman penyelenggaraan kegiatan pembelajaran untuk mencapai tujuan pendidikan tertentu” (Sagala, 2009:141). Di Indonesia telah beberapa kali mengalami perbaikan kurikulum di antaranya kurikulum 1994 yang pada gilirannya diganti dengan Kurikulum Berbasis Kompetensi tahun 2004. Penerapan KBK pun di sekolah tidak bertahan lama karena dua tahun kemudian tahun 2006 pemerintah Indonesia meluncurkan kurikulum baru yaitu Kurikulum Tingkat Satuan Pendidikan (KTSP) sebagai penyempurna dari kurikulum sebelumnya. Kurikulum 2013 merupakan tindak lanjut dari kurikulum berbasis kompetensi (KBK) yang pernah diujicobakan pada tahun 2004. KBK atau (Competency Based Curriculum) dijadikan acuan dan pedoman bagi pelaksanaan pendidikan untuk mengembangkan berbagai ranah pendidikan (pengetahuan, keterampilan, dan sikap) dalam seluruh jenjang dan jalur pendidikan, khususnya pada jalur pendidikan sekolah (Mulyasa, 2013:66).
11 Mulyasa (2013:7) menyatakan bahwa “Kurikulum 2013 lebih ditekankan pada pendidikan karakter, terutama pada tingkat dasar yang akan menjadi fondasi bagi tingkat berikutnya”. Pendidikan karakter dalam kurikulum 2013 bertujuan untuk meningkatkan mutu proses dan hasil pendidikan, yang mengarah pada pembentukan budi pekerti dan akhlak mulia peserta didik secara utuh, terpadu, dan seimbang sesuai dengan standar kompetensi lulusan pada setiap satuan pendidikan. Melalui pengembangan kurikulum 2013 yang berbasis karakter dan berbasis kompetensi, diharapkan bangsa ini menjadi bangsa yang bermartabat, dan masyarakatnya memiliki nilai tambah (added value), nilai jual yang bisa ditawarkan kepada orang lain dan bangsa lain di dunia, sehingga dapat bersaing dengan bangsa-bangsa lain. Sementara itu, Mendikbud menjelaskan bahwa kurikulum 2013 lebih bersifat tematik integratif yang berarti bahwa ada mata pelajaran yang akan terkait satu sama lain. Dengan kata lain mata pelajaran bukan dihilangkan melainkan digabung (Muzamiroh, 2013:133). Mengenai proses pembelajaran, peserta didik akan diarahkan lebih aktif sehingga dan asumsi ini digunakan untuk menambah jam belajar dan perubahan proses penilaian. Pada kurikulum 2013 ini, guru tidak lagi dibebani dengan kewajiban membuat silabus pengajaran untuk peserta didik setiap tahun seperti yang terjadi pada KTSP. Silabus dan bahan ajar dibuat oleh pemerintah, sedangkan guru hanya mempersiapkan RPP dan media pembelajarannya. Kurikulum 2013 adalah kurikulum berbasis kompetensi. Kurikulum berbasis kompetensi adalah “outcomes-based curriculum” dan oleh karena itu pengembangan kurikulum diarahkan pada pencapaian kompetensi yang dirumuskan dari SKL. Demikian pula penilaian hasil belajar dan hasil kurikulum diukur dari pencapaian kompetensi. Keberhasilan kurikulum dartikan sebagai pencapaian kompetensi yang dirancang dalam dokumen kurikulum oleh seluruh peserta didik. Kompetensi untuk Kurikulum 2013 dirancang sebagai berikut:
12 a. Isi atau konten kurikulum yaitu kompetensi dinyatakan dalam bentuk Kompetensi Inti (KI) kelas dan dirinci lebih lanjut dalam Kompetensi Dasar (KD) mata pelajaran. b. Kompetensi Inti (KI) merupakan gambaran secara kategorial mengenai kompetensi dalam aspek sikap, pengetahuan, dan ketrampilan (kognitif dan psikomotor) yang harus dipelajari peserta didik untuk suatu jenjang sekolah, kelas dan mata pelajaran. Kompetensi Inti adalah kualitas yang harus dimiliki seorang peserta didik untuk setiap kelas melalui pembelajaran KD yang diorganisasikan dalam proses pembelajaran siswa aktif. c. Kompetensi Dasar (KD) merupakan kompetensi yang dipelajari peserta didik untuk suatu tema untuk SD/MI, dan untuk mata pelajaran di kelas tertentu untuk SMP/MTS, SMA/MA, MK/MAK. d. Kompetensi Inti dan Kompetensi Dasar di jenjang pendidikan menengah diutamakan pada ranah sikap sedangkan pada jenjang pendidikan menengah pada kemampuan intelektual (kemampuan kognitif tinggi). e. Kompetensi Inti menjadi unsur organisatoris (organizing elements) Kompetensi Dasar yaitu semua KD dan proses pembelajaran dikembangkan untuk mencapai kompetensi dalam Kompetensi Inti. f. Kompetensi Dasar yang dikembangkan didasarkan pada prinsip akumulatif, saling memperkuat (reinforced) dan memperkaya (enriched) antar mata pelajaran dan jenjang pendidikan (organisasi horizontal dan vertikal). g. Silabus dikembangkan sebagai rancangan belajar untuk satu tema (SD/MI) atau satu kelas dan satu mata pelajaran (SMP/MTS,SMA/MA,SMK/MAK). Dalam silabus tercantum seluruh KD untuk tema atau mata pelajaran di kelas tersebut. h. RPP dikembangkan dari setiap KD yang untuk mata pelajaran dan kelas tersebut. (Kemendikbud, 2013:43-45) 4. Tes dan Tujuannya Secara harfiah, kata “tes” berasal dari bahasa Perancis Kuno : testum yang berarti piring untuk menyisihkan logam-logam mulia, maksudnya adalah dengan alat berupa piring itu akan dapat diperoleh jenis-jenis logam mulia yang nilainya tinggia. Dalam bahasa Inggris ditulis dengan test yang dalam bahasa Indonesia diterjemahkan dengan “tes”, “ujian”, atau “percobaan”. (Sudijono, 2005:66) Ariani (2006:216) menyebutkan bahwa terdapat persyaratan prosedur yang sistematis maupun aturan tertentu dalam mengobservasi perilaku seseorang termasuk menilai hasil belajar. Salah satu cara untuk menilai hasil
13 belajar adalah melalui tes yang berarti pula penyusunan harus dilakukan secara sistematis dengan aturan yang jelas. Tujuannya adalah agar informasi yang diperoleh berupa hasil pengukuran melalui tes dapat akurat, atau paling tidak
mendekati
keadaan
yang
sesungguhnya
dan
dapat
dipertanggungjawabkan. Tes merupakan suatu teknik atau cara yang digunakan dalam rangka melaksanakan kegiatan pengukuran, yang di dalamnya ada berbagai pertanyaan, pernyataan atau serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik untuk mengukur aspek perilaku peserta didik. Dalam rumusan ini ada beberapa unsur penting, yaitu: a. Tes merupakan suatu cara atau teknik yang disusun secara sistematis dan digunakan dalam rangka kegiatan pengukuran. b. Di dalam tes terdapat pertanyaan, pernyataan atau serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik. c. Tes digunakan untuk mengukur suatu aspek perilaku peserta didik. d. Hasil tes peserta didik perlu diberi skor dan nilai. (Arifin, 2009:118) Fungsi tes menurut Sudijono (2005:67) adalah: a. Sebagai alat pengukur terhadap peserta didik. Dalam hubungan ini tes berfungsi mengukur tingkat perkembangan atau kemajuanyang telah dicapai oleh peserta didik setelah menempuh proses belajar mengajar dalam jangka waktu tertentu. b. Sebagai alat pengukur keberhasilan program pengajaran, sebab melalu tes tersebut akan dapat diketahui sudah seberapa jauh program pengajaran yang telah ditentukan, telah dicapai. “Ditinjau dari segi fungsi yang dimiliki oleh tes sebagai alat pengukur perkembangan belajar peserta didik, tes dapat dibedakan menjadi enam golongan, yaitu (1) Tes Seleksi, (2) Tes Awal, (3) tes Akhir, (4) Tes Diagnostik, (5) Tes Formatif, (6) Tes Sumatif”. (Sudijono, 2005:68) Tes sumatif (summative test) adalah tes hasil belajar yang dilaksanakan setelah sekumpulan satuan program pengajaran selesai diberikan. Di sekolah, tes ini dikenal dengan istilah “Ulangan Umum”, atau “EBTA” (Evaluasi Belajar Tahap Akhir), di mana hasilnya digunakan untuk mengisi nilai rapor atau mengisi ijazah. “Tes sumatif pada umumnya disusun
14 atas dasar materi pelajaran yang diberikan selama catur wulan atau satu semester. Tes sumatif dilaksanakan secara tertulis, agar semua siswa memperoleh soal yang sama”. (Sudijono, 2005:72) Dalam penelitian ini tes yang akan dianalisis adalah tes Ujian Akhir Semester, maka jenis tes ini termasuk dalam jenis tes sumatif. Syarat soal yang bermutu baik adalah soal harus sahih (valid) dan handal (reliable). Sahih maksudnya bahwa setiap alat ukur hanya mengukur satu dimensi/aspek saja. Handal maksudnya bahwa setiap alat ukur harus dapat memberikan hasil pengukuran yang tepat, cermat dan ajek. Untuk dapat menghasilkan suatu bahan ujian yang sahih dan handal, penulis soal harus merumuskan kisikisinya dan menuliskan soal berdasarkan kaidah penulisan soalnya, baik penulisan soal bentuk objektif ataupun uraian. (Depdiknas, 2003:7) Agar soal yang dipersiapkan dapat menghasilkan bahan Ujian/ujian yang sahih dan handal, maka dalam mempersiapkannya harus dilakukan langkah-langkah berikut, yaitu: (a) menentukan pokok bahasan yang diujikan, (b) menyusun kisi-kisi, (c) menuliskan soal, (d) merakit soal menjadi perangkat tes, (e) menyusun pedoman penskoran. (Depdiknas, 2003:10) 5. Karakteristik Soal Objektif Bentuk tes yang digunakan di sekolah dapat dikategorikan menjadi dua yaitu tes objektif dan tes non objektif. Objektif di sini dilihat dari sistem penskorannya, yaitu siapa saja yang memeriksa lembar jawaban tes akan menghasilkan skor yang sama. Tes non objektif adalah tes yang sistem penskorannya dipengaruhi oleh pemberi skor. Dengan kata lain tes objektif adalah tes yang sistem penskorannya objektif, sedangkan tes non objektif sistem penskorannya dipengaruhi oleh subjektivitas pemberi skor. Tes objektif (objective test) yang dikenal dengan tes jawaban pendek (short answer test), tes “ya-tidak” (yes-no test) dan tes model baru (new type test), adalah salah satu jenis tes hasil belajar yang terdiri dari butir-butir soal (items) yang dapat dijawab oleh testee (pihak yang dikenai tes) dengan jalan memilih salah satu di antara beberapa kemungkinan jawaban yang telah
15 dipasangkan pada masing-masing item, atau dengan jalan menuliskan (mengisikan) jawabannya berupa kata-kata atau symbol-simbol tertentu pada tempat atau ruang yang telah disediakan untuk masing-masing butir item yang bersangkutan. (Sudijono, 2005:106-107) Sebagai salah satu jenis tes hasil belajar, tes objektif dapat dibedakan menjadi lima golongan, yaitu: (a) Tes Objektif Bentuk Benar-Salah (TrueFalse Test) (b) Tes Objektif Bentuk menjodohkan (Matching Test) (c) Tes Objektif Bentuk Melengkapi (Completion Test) (d) Tes Objektif Bentuk Isian (Fill in Test) (e) Tes Objektif Bentuk Pilihan Ganda (Multiple Choice Item Test). (Sudijono, 2011 : 107) Pada penelitian ini, bentuk tes yang akan diteliti adalah tes objektif bentuk pilihan ganda. Soal tes pilihan ganda terdiri atas dua bagian, yaitu: a. Item atau soal, yang berbentuk pernyataan ataupun pertanyaan. b. Opsi atau alternatif, yaitu kemungkinan-kemungkinan jawabab yang dapat dipilih oleh testee. Opsi atau alternatif ini terdiri dari dua bagian yaitu: 1) Satu jawaban betul (kunci jawaban) 2) Beberapa pengecoh atau distraktor, yang jumlahnya berkisar antara dua sampai lima buah. Dalam perkembangannya, sampai saat ini tes objektif bentuk multiple choice item dapat dibedakan menjadi 9 model, yaitu: a. b. c. d. e. f. g. h. i.
Model melengkapi lima pilihan Model asosiasi dengan lima atau empat pilihan Model melengkapi berganda Model analisis hubungan antar hal Model analisis kasus Model perbandingan kualitatif Model hal kecuali Model hubungan dinamik Model pemakaian diagram, grafik, peta atau gambar (Sudijono, 2005:119-120) Menurut Arifin (2009:138), kemampuan yang dapat diukur oleh
bentuk soal pilihan ganda antara lain mengenal istilah, fakta, prinsip, metode dan prosedur; mengidentifikasi penggunaan fakta dan prinsip; menafsirkan
16 hubungan sebab akibat; dan menilai metode dan prosedur. Ada beberapa jenis tes bentuk pilihan ganda, yaitu: a. Distracters, yaitu setiap pertanyaan atau pernyataan mempunyai beberapa pilihan jawaban yang salah, tetapi disediakan satu pilihan jawaban yang benar. Tugas peserta didik adalah memilih satu jawaban yang benar itu. b. Analisis hubungan antar hal, yaitu bentuk soal yang dapat digunakan untuk melihat kemampuan peserta didik dalam menganalisis hubungan antara pernyataan dan alasan (sebab-akibat) c. Variasi negatif, yaitu setiap pertanyaan atau pernyataan mempunyai beberapa pilihan jawaban yang benar, tetapi disediakan satu kemungkinan jawaban yang salah. Tugas peserta didik adalah memilih jawaban yang salah tersebut. d. Variasi berganda, yaitu memilih beberapa kemungkinan jawaban yang semuanya benar, tetapi ada satu jawaban yang paling benar. Tugas peserta didik adalah memilih jawaban yang paling benar. e. Variasi yang tidak lengkap, yaitu pertanyaan atau pernyataan yang memiliki beberapa kemungkinan jawaban yang belum lengkap. Tugas peserta didik adalah mencari satu kemungkinan jawaban yang benar dan melengkapinya. (Arifin, 2009: 139) Sementara itu, Mosier, Myers, Price dalam P.A.Bott (1996) seperti yang dikutip oleh Arifin (2009:140-143) mengemukakan ada 14 tipe pertanyaan dengan menggunakan bentuk pilihan ganda, yaitu: a. Pertanyaan yang berkaitan dengan definisi. b. Pertanyaan yang berkaitan dengan tujuan. c. Pertanyaan yang berhubungan dengan kasus. d. Pertanyaan yang berkaitan dengan pengaruh. e. Pertanyaan yang berkaitan dengan asosiasi. f. Pertanyaan yang berkaitan dengan recognition of error. g. Pertanyaan yang berkaitan dengan identifikasi kesalahan. h. Pertanyaan yang berkaitan dengan evaluasi. i. Pertanyaan yang berkaitan dengan membedakan. j. Pertanyaan yang berkaitan dengan kesamaan. k. Pertanyaan yang berkaitan dengan susunan. l. Pertanyaan yang berkaitan dengan susunan yang tidak lengkap. m. Pertanyaan yang berkaitan dengan prinsip umum. n. Pertanyaan yang berkaitan dengan subjek controversial. Kebaikan soal pilihan ganda yang dikemukakan oleh Arifin (2009:143) antara lain: a. Cara penilaian dapat dilakukan dengan mudah, cepat, dan objektif,
17 b. Kemungkinan peserta didik menjawab dengan terkaan dapat dikurangi c. Dapat digunakan untuk menilai kemampuan peserta didik dalam berbagai jenjang kemampuan kognitif d. Dapat digunakan berulang-ulang e. Sangat cocok untuk peserta tes dalam jumlah yang banyak. Adapun kelemahan soal berbentuk pilihan ganda adalah: a. Tidak dapat digunakan untuk mengukur kemampuan verbal dan pemecahan masalah b. Penyusunan soal yang benar-benar baik membutuhkan waktu lama c. Sukar menggunakan alternatif jawaban yang benar-benar homogen, logis, dan berfungsi. Arifin (2009:143) Beberapa petunjuk praktis dalam penyusunan soal bentuk pilihan ganda, yaitu: a. Harus mengacu pada kompetisi dasar dan indikator soal. b. Member petunjuk pengerjaan dengan jelas. c. Jangan memasukkan materi soal yang tidak relevan dengan apa yang sudah dipelajari peserta didik. d. Pernyataan pada soal seharusnya merumuskan persoalan yang jelas dan berarti. e. Pernyataan dan pilihan hendaknya merupakan kesatuan kalimat yang tidak terputus. f. Alternatif jawaban harus berfungsi, homogeny dan logis. g. Panjang pilihan pada suatu soal hendaknya lebih pendek daripada item soalnya. h. Pernyataan dan pilihan sebaiknya tidak mudah diasosiasikan. i. Kunci jawaban yang benar hendaknya jangan sistematis. j. Hanya ada satu jawaban yang benar. (Arifin, 2009:143-144) 6. Analisis Butir Soal Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian tes tersebut. Dalam penilaian hasil belajar, tes diharapkan dapat menggambarkan sampel perilaku dan menghasilkan nilai yang objektif serta akurat. Jika tes yang digunakan guru kurang baik, maka hasil yang yang diperoleh juga tentunya kurang baik. Hal ini dapat merugikan peserta didik itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi tidak objektif dan tidak adil.
18 Analisis kualitas tes berkaitan dengan pertanyaan “apakah tes sebagai suatu alat ukur benar-benar mengukur apa yang hendak dan seharusnya diukur?”, “sampai mana tes tersebut dapat diandalkan dan berguna?” Kedua pertanyaan ini sebenarnya menunjuka pada dua hal pokok, yaitu validitas dan reliabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang baik.
R.L. Thorndike dan H.P. Hagen (1977) dalam Arifin (2009:246)
mengemukakan tentang karakteristik tersebut, “There are many specific considerations entering into the evaluation of a test, but we shall consider them…. under tree main heading. There are, respectively, validity, reliability and practicality” a. Analisis Butir Soal secara Kualitatif 1) Analisis Butir Soal Ditinjau dari Materi, Konstruksi, dan Bahasa Pada
prinsipya
analisis
butir
soal
secara
kualitatif
dilaksanakan berdasarkan kaidah penulisan soal. Aspek yang diperhatikan didalam penelaahan secara kualitatif adalah telaah soal dari
segi
materi,
konstruksi,
bahasa/budaya,
dan
kunci
jawaban/pedoman peskorannya. Tidak ada aturan yang baku untuk menntukan jumlah alternatif jawaban. Di Indonesia biasanya digunakan 3 atau 4 alternatif jawaban untuk sekolah dasar dan 5 alternatif jawaban untuk sekolah menengah. Semakin bnyak jumlah alternatif jawaban, maka akan semakin berkurang pula faktor menebak yang dilakukan peserta didik. Pengurangan faktor menebak akan meningkatkan reliabilitas dan validitas sepanjang alternatif jawaban dan soalnya dibuat bagus. Berikut kutipan pedoman utama dalam pembuatan butir soal bentuk pilihan ganda yang baik menurut Djemari Mardapi: (a) (b) (c) (d) (e)
Pokok soal harus jelas. Pilhan jawaban homogen dalam arti isi. Panjang kalimat pilihan jawaban relatif sama. Tidak ada petunjuk jawaban benar. Hindari menggunakan pilihan jawaban semua benar atau semua salah. (f) Pilihan jawaban angka diurutkan.
19 (g) Semua pilihan jawaban logis. (h) Jangan menggunakan negatif ganda. (i) Kalimat yang digunakan sesuai dengan perkembangan peserta tes. (j) Bahasa Indonesia yang digunakan baku. (k) Letak pilihan jawaban benar ditentukan secara acak. Ada
beberapa
teknik
yang
dapat
dilakukan
tingkat
untuk
menganalisis butir soal secara kualitatif, diantaranya adalah teknik panel. Teknik panel merupakan teknik menelaah butir soal berdasarkan kaidah penulisan butir soal yaitu ditelaah dari segi materi, konstruksi dan bahasa yang dilakukan oleh beberapa penelaah. Kriteria telaah dari segi materi, konstruksi, dan bahasa adalah sebagai berikut: (a) Materi Dari segi materi yang harus diperhatikan adalah: (1) Kesesuaian soal dengan indikator , apabila soal didasarkan atas kisikisi yang memuat indikator soal harus sesuai dengan kisi-kisi. (2) Kesesuaian materi yang diukur dengan kompetensi relevansi, kontinuitas, keterpakaian sehari-hari tinggi. (3) Pilihan jawaban homogen dan logis. (4) Hanya ada satu kunci jawaban. (b) Konstruksi (1) Pokok soal dirumuskan dengan singkat, jelas, dan tegas. (2) Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja. (3) Pokok soal tidak memberi petunjuk kunci jawaban. (4) Pokok soal bebas dari pernyataan yang bersifat negatif ganda. (5) Pilihan jawaban homogeny dan logis ditinjau dari segi materi. (6) Gambar, grafik, tabel, diagram, atau sejenisnya jelas dan berfungsi. (7) Panjang pilihan jawaban relatif sama. (8) Pilihan jawaban tidak menggunakan pernyataan “semua jawaban diatas salah/benar” dan sejenisnya. (9) Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya. (10) Butir soal tidak bergantung pada jawaban soal sebelumnya.
20 (c) Bahasa (1) Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. (2) Menggunakan bahasa yang komunikatif. (3) Tidak menggunakan bahasa yang berlaku setempat/ tabu. (4) Pilihan jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian. (Suke Silverius 1991 : 80-81). Untuk memudahkan penilaian maka dalam penelitian ini penulis menggunakan form penilaian seperti tercantum pada Lampiran 3. Kriteria keputusan yang diambil dengan kategori diterima, direvisi, dan diolak (diganti), dengan ketentuan sebagai berikut: (a) Item soal yang diterima adalah item soal yang karakteristiknya memenuhi semua kriteria yang ada. (b) Item soal yang direvisi adalah item soal yang karakteristiknya tidak memenuhi kriteria minimal pada aspek materi selain nomor 1 dan 3, pada aspek konstruksi maksimal 3 kriteria, sedangkan pada aspek bahasa tidak sesuai hanya satu kriteria saja. (c) Item soal yang ditolak adalah item soal yang karakteristiknya tidak memenuhi semua kriteria penilaian pada aspek materi poin nomor 1 dan 3, pada aspek konstruksi lebih dari tiga kriteria, sedangkan pada aspek bahasa tidak sesuai lebih dari satu kriteria yang ditentukan. 2) Analisis Distribusi Jenjang Ranah Kognitif Taksonomi Bloom Kualitas butir tes juga dilihat dari tingkat berfikir yang diperlukan dalam mengerjakan soal. Selama ini dikenal taksonomi Bloom untuk menunjukkan tingkatan berfikir pada ranah kognitif. Menurut taksonomi Bloom terdapat enam tingkatan ranah kognitif yaitu pengenalan (C1), pemahaman (C2), aplikasi (C3), analisis (C4), sintesa (C5), dan evaluasi (C6). Pada tahun 2001, Anderson dan teman-temannya melakukan revisi terhadap tingkatan berfikir Bloom dan diterbitkan pada buku yang berjudul A Taxonomy for Learning and
21 Teaching and Assessing: A Revision of Bloom’s Taxonomy of Educational Objectives. Pada taksonomi Bloom yang direvisi jumlah dan jenis proses kognitif tetap sama seperti dalam taksonomi yang lama, hanya kategori analisis dan evaluasi ditukar urutannya dan kategori sintesis kini dinamai mencipta (create). Seperti halnya taksonomi yang lama, taksonomi yang baru secara umum juga menunjukkan penjenjangan, dari proses kognitif yang sederhana ke proses kognitif yang lebih kompleks. Namun demikian penjenjangan pada taksonomi yang baru lebih fleksibel sifatnya. Artinya, untuk dapat melakukan proses kognitif yang lebih tinggi tidak mutlak disyaratkan penguasaan proses kognitif yang lebih rendah. Berikut adalah taksonomi proses kognitif yang baru: (a) Menghafal (Remember, C1): menarik kembali informasi yang tersimpan dalam memori jangka panjang. Mengingat merupakan proses kognitif yang paling rendah tingkatannya. Kategori ini mencakup dua macam proses kognitif: mengenali (recognizing) dan mengingat (recalling). Mengenali (Recognizing): mencakup proses kognitif untuk menarik kembali informasi yang tersimpan dalam memori jangka panjang yang identik atau sama dengan informasi yang baru. Bentuk tes yang meminta siswa menentukan betul atau salah, menjodohkan, dan pilihan berganda merupakan tes yang sesuai untuk mengukur kemampuan mengenali. Istilah lain untuk mengenali adalah mengidentifikasi (identifying). Mengingat (Recalling): menarik kembali informasi yang tersimpan dalam memori jangka panjang apabila ada petunjuk (tanda) untuk melakukan hal tersebut. Tanda di sini seringkali berupa pertanyaan. Istilah lain untuk mengingat adalah menarik (retrieving). (b) Memahami (Understand, C2): mengkonstruk makna atau pengertian berdasarkan pengetahuan awal yang dimiliki, mengaitkan informasi yang baru dengan pengetahuan yang telah dimiliki, atau mengintegrasikan pengetahuan yang baru ke dalam skema yang telah ada dalam pemikiran siswa. Karena penyususn skema adalah konsep, maka pengetahuan konseptual merupakan dasar pemahaman. Kategori memahami mencakup tujuh proses kognitif: menafsirkan (interpreting), memberikan contoh (exemplifying), mengkelasifikasikan (classifying), meringkas (summarizing),
22
(c)
(d)
(e)
(f)
menarik inferensi (inferring), membandingkan (comparing), dan menjelaskan (explaining). Mengaplikasikan (Apply, C3): mencakup penggunaan suatu prosedur guna menyelesaikan masalah atau mengerjakan tugas. Oleh karena itu mengaplikasikan berkaitan erat dengan pengetahuan prosedural. Namun tidak berarti bahwa kategori ini hanya sesuai untuk pengetahuan prosedural saja. Kategori ini mencakup dua macam proses kognitif: menjalankan (executing) dan mengimplementasikan (implementing). Menganalisis (Analyze, C4): menguraikan suatu permasalahan atau obyek ke unsur-unsurnya dan menentukan bagaimana saling keterkaitan antar unsur-unsur tersebut dan struktur besarnya. Ada tiga macam proses kognitif yang tercakup dalam menganalisis: membedakan (differentiating), mengorganisir (organizing), dan menemukan pesan tersirat (attributting). Mengevaluasi (Evaluate, C5): membuat suatu pertimbangan berdasarkan kriteria dan standar yang ada. Ada dua macam proses kognitif yang tercakup dalam kategori ini: memeriksa (checking) dan mengritik (critiquing). Memeriksa (Checking): Menguji konsistensi atau kekurangan suatu karya berdasarkan kriteria internal (kriteria yang melekat dengan sifat produk tersebut). Contoh: Memeriksa apakah kesimpulan yang ditarik telah sesuai dengan data yang ada. Mengkritik (Critiquing): menilai suatu karya baik kelebihan maupun kekurangannya, berdasarkan kriteria eksternal. Contoh: menilai apakah rumusan hipotesis sesuai atau tidak (sesuai atau tidaknya rumusan hipotesis dipengaruhi oleh pengetahuan dan cara pandang penilai). Mencipta (Create, C6): menggabungkan beberapa unsur menjadi suatu bentuk kesatuan. Ada tiga macam proses kognitif yang tergolong dalam kategori ini, yaitu: membuat (generating), merencanakan (planning), dan memproduksi (producing). Membuat (generating): menguraikan suatu masalah sehingga dapat dirumuskan berbagai kemungkinan hipotesis yang mengarah pada pemecahan masalah tersebut. Contoh: merumuskan hipotesis untuk memecahkan permasalahan yang terjadi berdasarkan pengamatan di lapangan. Merencanakan (planning): merancang suatu metode atau strategi untuk memecahkan masalah. Contoh: merancang serangkaian percobaan untuk menguji hipotesis yang telah dirumuskan. Memproduksi (producing): membuat suatu rancangan atau menjalankan suatu rencana untuk memecahkan masalah. Contoh: mendesain (atau juga membuat) suatu alat yang akan digunakan untuk melakukan percobaan. (Widodo Ari, 2006: 5)
23 b. Analisis Butir Soal Secara Kuantitatif Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Salah satu pendekatan pada analisis butir soal secara kuantitatif adalah pendekatan secara klasik. Pada pendekatan ini proses penelaahan melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan. Kelebihan analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-hari dengan cepat, sederhana, familier dan dapat mengunakan data dari beberapa peserta. Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah telaah dari segi reliabilitas, daya pembeda, tingkat kesukaran soal dan penyebaran pilihan jawaban. 1) Validitas Suatu alat penilaian dikatakan mempunyai validitas yang tinggi apabila alat penilaian tersebut mampu mengukur apa yang seharusnya diukur (Ngalim Purwanto, 2001: 138).
Lebih lanjut,
Ngalim Purwanto mengutip pernyataan Conbach: “How well a test or evaluative technique does the job that it is employed to do”. Maksudnya, validitas adalah syarat relatif suatu teknik evaluasi karena bergantung pada tujuan yang hendak dicapai dari proses evaluasi itu sendiri, jadi validitas bukanlah sebuah syarat mutlak. Hasil telaah kualitatif sudah dapat mewakili item soal yang memenuhi validitas isi. Suharsimi Arikunto (2010: 65) menjelaskan bahwa “Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris”. Validias logis biasanya menunjukkan kondisi valid suatu instrumen berdasarkan hasil penalaran sesuai dengan persyaratan yang ada. Termasuk di dalam jenis validitas logis adalah validitas isi dan validitas konstruksi (construct validity). Sedangkan yang dimaksud validitas empiris adalah penentuan valid atau tidaknya suatu instrumen berdasarkan sudah pernah diuji dari pengalaman atau belum. Terdapat empat bentuk validitas yaitu empiris, yaitu: validitas isi (content
24 validity), validitas konstruksi (construct validity), validitas “ada sekarang” (concurrent validity), dan validitas prediksi (predictive validity). Untuk mengetahui tingkat validitas rasional dapat dilakukan dengan mengadakan analisis rasional, yaitu analisis berdasarkan pikiran-pikiran yang logis bahan-bahan apa yang perlu dikemukakan dalam suatu tes. Jika penganalisisan secara rasional itu menunjukan hasil
yang
membenarkan
tentang
telah
tercerminnya
tujuan
instruksional khusus itu di dalam tes hasil belajar yang telah memiliki validitas isi maupun validitas konstruksi. Menurut Anas Sudijono (2008: 165), “upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel”. Dalam diskusi tersebut para pakar (expert) yang dipandang memiliki keahlian yang berhubungan dengan tes yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Sejalan dengan pendapat Anas Sudijono, Elvin Yusliana Ekawati dan Surantoro (2010: 182) menambahkan dengan lugas bahwa salah satu ahli (expert) bagi mahasiswa yang mengerjakan tugas akhir atau skripsi adalah dosen pembimbing, seperti kutipan berikut “Telaah kualitatif adalah analisis yang dilakukan oleh beberapa orang ahli (expert) seperti dosen pembimbing sebelum tes diujicoba atau digunakan”. Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Alat tes yang dianggap layak dan dapat dipertanggungjawabkan validitas isinya apabila dalam penyusunannya mendasarkan diri pada tabel kisi-kisi. Validitas isi merujuk pada kesesuaian antara butir-butir soal dengan tujuan dan bahan pengajaran. Karena tujuan dan bahan pengajaran tersebut tercantum pada tabel kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan
25 butir-butir soal yang mendasar pada tabel kisi-kisi dianggap layak dan dapat dipertanggungjawabkan validitas isinya. Secara sederhana dapat dikatakan bahwa tes yang disusun tidak boleh keluar dari isi mata pelajaran yang ada di dalam kurikulum. Sebuah tes dikatakan memiliki validitas konstruksi apabila setiap butir soal dalam tes tersebut mampu mengukur setiap aspek berpikir, misalnya ingatan, pemahaman, dan juga aplikasinya. Aspekaspek yang hendak diukur tersebut merupakan wujud dari indikator dalam tabel kisi-kisi. Sebuah tes dikatakan memiliki validitas “ada sekarang” (concurent validity) jika hasilnya sesuai dengan pengalaman. Untuk menilai validitas “ada sekarang” dapat dilakukan dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes yang sejenis yang telah diketahui mempunyai validitas yang tinggi. Sedangkan sebuah tes memiliki validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Cara pengujian dengan jalan mencari korelasi antara nilai-nilai yang dicapai oleh anak-anak dalam tes tersebut dengan nilai-nilai yang dicapai kemudian. Banyak faktor yang mempengaruhi hasil tes tidak valid. Beberapa sumber yang pada umumnya berasal dari faktor internal tes evaluasi diantaranya sebagai berikut: (a) Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes. (b) Kata-kata yang digunakan dalam struktur instrumen evaluasi, terlalu sulit. (c) Item-item tes dikontruksi dengan jelek. (d) Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa. (e) Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
26 (f) Jumlah item tes terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran. (g) Jawaban masing-masing item evaluasi bisa diprediksi siswa. 2) Reliabilitas Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability. Pengukuran yang mempunyai reliabilitas tinggi disebut sebagai pengukuran yang reliabel. Walaupun reliabilitas mempunyai berbagai nama seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi dan sebagainya namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauhmana hasil suatu pengukuran dapat dipercaya (Azwar, 1997: 4). Konsep keajegan atau kestabilan pada reliabilitas kurang tepat jika diartikan sebagai “sama”. Keajegan atau kestabilan tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada dibawah si B , maka jika diadakan pengukuran ulang, si A juga berada dibawah si B. itulah yang dikatakan ajeg atau tetap yaitu sama dalam kedudukan siswa diantara anggota kelompok yang lain (Arikunto, 2008 : 86). Tinggi rendahnya reliabilitas, secara empirik ditunjukkan oleh suatu angka yang disebut koefisien reliabilitas. Tinggi rendahnya reliabilitas dicerminkan oleh tinggi rendahnya korelasi antara dua distribusi skor dari dua alat ukur yang parallel yang dikenakan pada kelompok individu yang sama. Analisis reliabilitas dapat menggunakan pendekatan Tes-Ulang (test-retest), pendekatan Tes Sejajar (alternate-forms) dan pendekatan Konsistensi Internal (internal consistency). 3) Daya Pembeda Daya pembeda soal adalah kemampuan suatu butir soal untuk membedakan antara siswa yang telah menguasai materi dan siswa yang belum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal antara lain:
27 (a) Untuk meningkatkan kualitas butir soal berdasarkan data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal baik, direvisi atau ditolak. (b) Untuk mengetahui seberapa jauh setiap butir soal dapat membedakan
kemampuan siswa
yaitu siswa
yang telah
memahami atau belum memahami materi yang diajarkan oleh guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa maka terdapat kemungkinan seperti berikut: (1) Kunci jawaban butir soal tidak tepat. (2) Butir soal mempunyai 2 atau lebih jawaban yang benar (3) Kompetensi yang diukur tidak jelas (4) Pengecoh tidak berfungsi (5) Materi yang ditanyakan terlalu sulit, sehingga banyak siswa yang menebak. (6) Sebagian siswa yang memahami materi yang ditanyakan berfikir ada yang salah informasi dalam butir soalnya. Angka yang menunjukkan besarnya daya pembeda disebut indeks daya pembeda (DP). Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan siswa yang sudah memahami dan belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal maka semakin baik soal tersebut. Jika daya pembeda negatif berarti lebih banyak kelompok siswa yang belum memahami materi menjawab benar soal tersebut (Depdiknas, 2009: 11). 4) Tingkat Kesukaran Tingkat kesukaran soal adalah peluang untuk menjawab benar soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks kesukaran umumnya dinyatakan dalam bentuk proporsi yang besarnya antar 0,00 – 1,00. Semakin besar indeks kesukaran berarti semakin mudah soal tersebut dan sebaliknya. Fungsi
28 tingkat kesukaran butir biasanya dikaitkan dengan tujuan tes. Misalnya untuk ujian akhir semester digunakan soal dengan tingkat kesukaran sedang, untuk keperluan seleksi digunakan soal dengan tingkat kesukaran tinggi, dan untukn keperluan diagnostic digunakan soal dengan tingkat kesukaran mudah (Depdiknas, 2009: 9). Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya (Arikunto , 2008: 207). 5) Efektivitas Distraktor Pada soal pilihan ganda terdapat opsi atau pilihan jawaban yang terdiri dari kunci jawaban dan pengecoh. Kunci jawaban dan pengecoh pada suatu soal perlu diketahui berfungsi tidaknya kunci jawaban atau pengecoh tersebut. Kunci jawaban dikatakan berfungsi (efektif) apabila: (a) paling tidak dipilih oleh 25% peserta, (b) lebih banyak dipilih oleh siswa yang sudah memahami materi. Sedangkan pengecoh dapat dikatakan berfungsi apabila pengecoh: (a) paling tidak dipilih oleh 5% peserta, (b) lebih banyak dipilih oleh kelompok siswa yang belum memahami materi (Depdiknas, 2009: 14). 6) Kriteria Keputusan Total Informasi yang diperoleh tentang kategori item soal berdasarkan semua karakteristik dapat dimasukkan pada kriteria soal yang diterima, direvisi, atau ditolak jika memenuhi kriteria keputusan untuk penilaian item soal sebagai berikut: (a) Item soal diterima apabila karakteristik item soal memenuhi semua kriteria. Item soal yang terlalu sukar atau terlalu mudah, tetapi memiliki daya beda dan disribusi pengecoh item yang memenuhi kriteria, butir soal tersebut dapat diterima atau dipilih.
29 (b) Item soal direvisi apabila salah satu atau lebih dari ketiga kriteria karakeristik item soal tidak memenuhi kriteria. (c) Item soal ditolak apabila item soal memiliki karakteristik yang tidak memenuhi semua kriteria. 7. Tingkat Pencapaian Kompetensi Dasar dan Standar Kompetensi Kelulusan Pencapaian kompetensi dasar yang tertuang pada setiap indikator berkisar antara 0–100%. Kriteria ideal ketuntasan untuk masing-masing indikator 75%. Satuan pendidikan harus menentukan kriteria ketuntasan minimal dengan mempertimbangkan tingkat kemampuan rata-rata peserta didik, kompleksitas kompetensi, serta kemampuan sumber daya pendukung dalam
penyelenggaraan
pembelajaran.
Satuan
pendidikan
diharapkan
meningkatkan kriteria ketuntasan belajar secara terus-menerus untuk mencapai kriteria ketuntasan ideal. Pelaporan hasil belajar (rapor) peserta didik diserahkan pada satuan pendidikan dengan memerhatikan rambu-rambu yang disusun oleh direktorat teknis terkait. Dalam Permendiknas No. 23 tahun 2006 tentang Standar Kompetensi Lulusan untuk satuan pendidikan dasar dan menengah disebutkan bahwa Standar Kompetensi Lulusan (SKL) untuk satuan pendidikan dasar dan menengah digunakan sebagai pedoman penilaian dalam menentukan kelulusan peserta didik. SKL meliputi standar kompetensi lulusan minimal satuan pendidikan dasar dan menengah, standar kompetensi lulusan minimal kelompok mata pelajaran, dan standar kompetensi lulusan minimal mata pelajaran. Ini berarti ketentuan di dalam Permendiknas tersebut bersifat minimal yang harus dicapai lulusan peserta didik pada setiap satuan pendidikan. Tujuan setiap satuan pendidikan yang tertuang dalam lampiran Permendiknas No. 23 tahun 2006 adalah sebagai berikut. a) Pendidikan Dasar, yang meliputi SD/MI/SDLB/Paket A dan SMP/MTs./SMPLB/Paket B bertujuan: Meletakkan dasar kecerdasan, pengetahuan, kepribadian, akhlak mulia, serta
30 keterampilan untuk hidup mandiri dan mengikuti pendidikan lebih lanjut b) Pendidikan Menengah yang terdiri atas SMA/MA/SMALB/Paket C bertujuan: Meningkatkan kecerdasan, pengetahuan, kepribadian, akhlak mulia, serta keterampilan untuk hidup mandiri dan mengikuti pendidikan lebih lanjut c) Pendidikan Menengah Kejuruan yang terdiri atas SMK/MAK bertujuan: Meningkatkan kecerdasan, pengetahuan, kepribadian, akhlak mulia, serta keterampilan untuk hidup mandiri dan mengikuti pendidikan lebih lanjut sesuai dengan kejuruannya. (Depdiknas, 2008: 20) 8. Materi Pelajaran Fisika Kelas XI Ilmu Pengetahuan Alam (IPA) berkaitan dengan cara mencari tahu tentang gejala alam secara sistematis, sehingga IPA bukan hanya penguasaan kumpulan pengetahuan yang berupa fakta, konsep atu prinsip tetapi juga suatu proses penemuan. Proses pembelajarannya menekankan pada pemberian pengalaman langsung untuk mengembangkan kompetensi agar peserta didik memahami alam sekitar secara ilmiah. Berdasarkan Permendiknas Nomor 23 Tahun 2006 tentang standar isi dijelaskan bahwa tujuan mempelajari fisika adalah agar peserta didik memiliki kemampuan (1) membentuk sikap positif terhadap fisika dengan menyadari keteraturan dan keindahan alam serta mengagungkan kebesaran Tuhan Yang Maha Esa; (2) memupuk sikap ilmiah yaitu jujur, obyektif, terbuka, ulet, kritis dan dapat bekerjasama dengan orang lain; (3) mengembangkan pengalaman untuk dapat merumuskan masalah, mengajukan dan menguji hipotesis melalui percobaan, merancang dan merakit instrumen percobaan, mengumpulkan, mengolah, dan menafsirkan data, serta mengkomunikasikan hasil percobaan secara lisan dan tertulis. (4) mengembangkan kemampuan bernalar dalam berpikir analisis induktif dan deduktif dengan menggunakan konsep dan prinsip fisika untuk menjelaskan berbagai peristiwa alam dan menyelesaian masalah baik secara kualitatif maupun kuantitatif; (5) menguasai konsep dan prinsip fisika serta mempunyai keterampilan mengembangkan pengetahuan, dan sikap percaya diri sebagai bekal untuk melanjutkan pendidikan pada
31 jenjang yang lebih tinggi serta mengembangkan ilmu pengetahuan dan teknologi. Ruang lingkup mata pelajaran Fisika di SMA/MA merupakan pengkhususan IPA di SMP/MTs yang menekankan pada fenomena alam dan pengukurannya dengan perluasan pada konsep abstrak yang meliputi aspekaspek sebagai berikut. a) Pengukuran berbagai besaran, karakteristik gerak, penerapan hukum Newton, alat-alat optik, kalor, konsep dasar listrik dinamis, dan konsep dasar gelombang elektromagnetik b) Gerak dengan analisis vektor, hukum Newton tentang gerak dan gravitasi, gerak getaran, energi, usaha, dan daya, impuls dan momentum, momentum sudut dan rotasi benda tegar, fluida, termodinamika c) Gejala gelombang, gelombang bunyi, gaya listrik, medan listrik, potensial dan energi potensial, medan magnet, gaya magnetik, induksi elektromagnetik dan arus bolak-balik, gelombang elektromagnetik, radiasi benda hitam, teori atom, relativitas, radioaktivitas. (BSNP, 2006 : 6) Pada Kurikulum 2013 kompetensi materi pelajaran Fisika kelas XI semester pertama di SMA sesuai dengan silabus mencakup kemampuan berikut : a) Menganalisis gerak lurus, gerak melingkar dan gerak parabola dengan menggunakan vektor. b) Menganalisis keteraturan gerak planet dalam tatasurya berdasarkan hukum-hukum Newton. c) Menganalisis pengaruh gaya pada sifat elastisitas bahan. d) Menganalisis hubungan antara gaya dengan gerak getaran. e) Menganalisis hubungan antara usaha, perubahan energi dengan hukum kekekalan energi mekanik. f) Menerapkan hukum kekekalan energi mekanik untuk menganalisis gerak dalam kehidupan sehari-hari. g) Menunjukkan hubungan antara konsep impuls dan momentum untuk menyelesaikan masalah tumbukan. B. Penelitian yang Relevan Ada beberapa penelitian yang pernah dilakukan mengenai analisis terhadap item tes dengan aspek tinjauan yang berbeda. Penelitian-penelitian berikut ini menjadi salah satu referensi yang digunakan penulis dalam menyusun penelitian.
32 1. Lilis Tri Ariyana (2011) dengan judul “Analisis Butir Soal Ulangan Akhir Semester Gasal IPA Kelas IX SMP di Kabupaten Grobogan” dari 50 soal IPA yang diujikan di sekolah di seluruh kabupaten Grobogan tersebut, hanya ada 44 soal yang valid, dan memiliki daya beda yang cukup baik. Butir soal yang tidak valid tidak dapat digunakan untuk pengukuran hasil belajar. Sedangkan dari analisis tingkat kesukarannya, soal tersebut memiliki tingkat kesukaran sedang dan reliabilitassnya sudah cukup tinggi karena memiliki nilai reliabilitas sebesar 0,711 yang berarti memiliki nilai kehandalan atau keajegan yang tinggi pula. 2. Mujiyanto (2007) dengan judul “Analisis Butir Soal Ulangan Akhir Semester bidang Studi Ilmu Pengetahuan Alam (IPA) Kelas VIII Semester Gasal Sekolah Menengah Pertama Negeri I Sukorejo Kabupaten Kendal Tahun Pelajaran 2006/2007” menyatakan bahwa dari 45 soal pilihan ganda terdapat 4 soal dengan kriteria yang sangat baik, dan sisanya perlu dilakukan revisi ulang. 3. Chan Yuen Fook and Gurnam Kaur Sidhu (2010) dengan judul “Authentic Assessment and Pedagogical Strategies in Higher Education”, dapat diketahui bahwa
strategi
penilaian
sangat
berkaitan
dengan
pengajaran
dan
pembelajaran. Menilai harus menjadi bagian dari siklus instruksional dan umpan balik yang diberikan oleh guru sehingga dapat membantu siswa menilai kemampuan
dan
kelemahan
mereka,
mengidentifikasi
bakat
dan
mengembangkannya. 4. Romel A Morales (2009) dengan judul “Evaluation of Mathematics Achievement Test” dapat disimpulkan bahwa berdasarkan analisis butir soal ulangan matematika yang diujikan kepada mahasiswa jurusan matematika Universitas Philipina terdapat item yang mencakup materi mudah namun tidak ada mahasiswa yang mampu menjawabnya yaitu item no 9. Item tersebut akan ditolak atau ditinjau kembali secara menyeluruh. Item tersebut akan ditata ulang
kalimatnya
karena
pengarang
merasa
bahwa
item
tersebut
membingungkan siswa. Item soal dengan korelasi total negatif akan dihapus karena item tersebut akan sangat membingungkan siswa. Tes tersebut dibuat
33 untuk mengukur pengetahuan siswa sehingga alat ukurnya harus memenuhi syarat. C. Kerangka Berfikir Tes sebagai alat evaluasi dalam pendidikan mempunyai peranan yang penting dalam mengukur prestasi hasil belajar siswa. Tes yang baik perlu memperhatikan validitas, reliabilitas, tingkat kesukaran dan daya beda, serta kemampuannya untuk dapat mengukur ketercapaian kompetensi yang diharapkan dapat dicapai oleh siswanya. Untuk mengetahui apakah suatu tes telah memenuhi persyaratan tes yang baik, maka perlu dilakukan analisis terhadap kualitas soal tersebut. Tes mempunyai peranan penting dalam mengukur prestasi hasil belajar siswa sebagai alat evaluasi. Tes yang baik harus dapat mengukur sesuatu yang seharusnya diukur, sehingga perlu diperhatikan aspek kualitatif dan kuantitatifnya. Sesuai dengan perkembangan dalam dunia pendidikan, maka alat evaluasi yang digunakan harus sesuai dengan kurikulum yang berlaku saat itu. Begitu juga kualitas dari alat evaluasi diharapkan memenuhi syarat secara kualitatif dan kuantitatif. Dari aspek kualitatif dapat dilihat dari segi materi, konstruksi, bahasa maupun jenjang soal. Sedangkan dari aspek kuantitatif meliputi reliabilitas, daya pembeda soal dan tingkat kesukaran soal serta efektivitas kunci dan efektivitas pengecoh untuk soal bentuk pilihan ganda. Sekolah yang dipilih adalah SMA Negeri 1 Purwokerto karena merupakan Sekolah Standar Nasional (SSN), yang sedang merintis untuk menjadi Sekolah Bertaraf Internasional (RSBI) dan merupakan satu-satunya sekolah yang menjadi barometer bagi sekolah-sekolah SMA lainnya yang ada di Kabupaten Banyumas. Oleh karena itu, soal ulangan akhir semester bidang studi Fisika kelas XI SMA Negeri 1 Purwokerto Tahun Ajaran 2015/2016 yang merupakan salah satu alat evaluasi, maka perlu dilakukan analisis untuk mengetahui bagaimanakah kualitas soal-soalnya, ditinjau dari validitas, reliabilitas, tingkat kesukaran dan daya bedanya, serta apakah melalui soal tersebut sudah dapat menunjukkan seberapa jauh kemampuan siswanya terhadap ketercapaian setiap kompetensi dasar yang harus dicapai pada semester itu.
34 Sebelum diujikan siswa, soal ulangan akhir semester yang diujikan di SMA N 1 Purwokerto tidak diujicobakan terlebih dahulu. Hal ini untuk menjaga kerahasiaan dari soal tersebut. Sehingga belum diketahui kualitas dari alat evaluasi tersebut. Sebagai sekolah yang menjadi barometer bagi sekolah-sekolah lainnya yang ada di Kabupaten Banyumas, maka sangatlah penting untuk menganalisis soal Ujian semester tersebut, sehingga didapatkan informasi mengenai kualitas dari soal tersebut. Soal ulangan akhir semester yang telah dianalisis dan hasilnya berkualitas baik, dapat dijadikan contoh bagi sekolahsekolah SMA lainnya yang ada di Kabupaten Banyumas. Adapun dasar untuk mengembangkan diagram alir dalam penelitian ini adalah kompetensi dasar serta indikator dalam kisi-kisi soal yang dipakai oleh penyusun soal dalam mengembangkan soal ulangan akhir semester bidang studi Fisika kelas XI SMA Negeri 1 Purwokerto. Alat evaluasi yang baik harus dapat mengukur keadaan yang sebenarnya. Diagram alir penelitian ditunjukkan pada Gambar 2.1.
35 Butir Soal Ujian Akhir Semester Fisika Kelas XI SMA Negeri 1 Purwokerto Tahun Pelajaran 2015/2016
Dianalisis
Kualitatif
Materi
Konstruksi
Bahasa
Kuantitatif
Validitas
Reliabilitas
Tingkat Kesukaran
Daya Pembeda
Keefektifan Fungsi Opsi
Kriteria Keputusan Akhir
Gambar 2.1 Kerangka Berfikir
Distribusi Jenjang Ranah Kognitif
36 Berikut ini secara lebih terperinci langkah-langkah untuk menganalisis instrumen UAS kelas XI mata pelajaran Fisika yang akan dilakukan: 1. Tahap Studi Literatur “Studi literatur adalah kegiatan yang meliputi mencari secara teratur, melokalisasi, dan menganalisis dokumen yang berhubungan dengan masalah yang akan diteliti” (Ruseffendi, 1994: 16). Dokumen itu dapat berupa buku, jurnal, kamus, maupun abstrak yang berisi teori-teori, definisi, ataupun hasilhasil penelitian yang telah dilakukan mengenai permasalahan yang berhubungan dengan permasalahan yang akan diteliti. Tahap studi literatur ini dimulai
dengan
pengumpulan
bahan-bahan,
membacanya,
menelaah,
menyarikan, kemudian menyusunnya sehingga menjadi sampai penyusunan proposal skripsi. 2. Wawancara Sebelum melakukan penelitian, terlebih dahulu dilakukan wawancara di SMA Negeri 1 Purwokerto. Wawancara ini meliputi beberapa hal dasar yang harus diketahui untuk melakukan penelitian, misalnya: apakah di sekolah tersebut masih menyimpan jawaban siswa yang nantinya akan dijadikan objek penelitian, apakah di sekolah juga masih menyimpan kisi-kisi, silabus, soal UAS, dan apakah soal UAS dievaluasi atau tidak. Apabila data-data yang diperlukan masih ada, barulah mengurus perizinan ke sekolah yang bersangkutan agar dapat dilakukan penelitian. 3. Penelitian Setelah melakukan wawancara awal dan segala perizinan selesai, barulah dilakukan penelitian. Kegiatan yang dilakukan saat penelitian adalah meminta data-data yang diperlukan seperti yang disebutkan pada tahap observasi awal. 4. Analisis Data a. Analisis kualitatif. Pada tahap ini penelaahan biasanya dilakukan sebelum tes digunakan atau diujikan. Bahan-bahan penunjang yang perlu disiapkan pada aspek ini adalah kisi-kisi tes, kurikulum yang digunakan, dan buku
37 sumber. Urutan aspek yang akan ditelaah meliputi materi, konstruksi, dan bahasa serta analisis jenjang ranah kognitif taksonomi Bloom. Pada masing-masing aspek harus mempunyai kriteria penilaian. Penggunaan format penelaahan soal akan sangat membantu prosedur pelaksanaannya. b. Analisis kuantitatif Pada tahap ini penelaahan dilakukan setelah tes diujikan. Data yang dianalisis diperoleh dari jawaban siswa. Urutan aspek yang akan ditelaah adalah tingkat kesukaran, validitas, daya beda, reliabilitas, dan yang terakhir pola jawaban. D. Pertanyaan Penelitian Berdasarkan kerangka pemikiran di atas, dapat dituliskan pertanyaan penelitian, sebagai berikut : 1. Apakah hasil analisis kualitatif soal Ulangan Akhir Semester ganjil mata pelajaran Fisika Kelas XI SMA Negeri 1 Purwokerto memenuhi kriteria baik dilihat dari aspek materi, konstruksi, bahasa dan distribusi jenjang ranah kognitif taksonomi Bloom? 2. Apakah hasil analisis kuantitatif soal Ulangan Akhir Semester ganjil mata pelajaran Fisika Kelas XI di SMA Negeri 1 Purwokerto memenuhi kriteria baik dilihat dari aspek validitas, reliabiltas, tingkat kesukaran soal, daya pembeda dan efektifitas distraktor?