Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
PEMANFAATAN PROGRAM ITEMAN 3.0 UNTUK ANALISIS BUTIR SOAL LOMBA CERDAS CERMAT TEKNOLOGI INFORMASI DAN KOMUNIKASI TINGKAT SMA SEDERAJAT Ilham Rais Arvianto Prodi Teknik Informatika STMIK AKAKOM Yogyakarta
[email protected] Abstrak Tujuan dari penelitian ini adalah untuk mendeskripsikan kualitas soal penyisihan LCC TIK tingkat SMA sederajat pada kegiatan Akakom IT-Fest 2016. Tergolong jenis penelitian kualitatif dengan menggunakan teknik survey dengan 16 partisipan. Pengumpulan data menggunak metode dokumentasi. Analisa data menggunakan teknik analisa butir secara kuantitatif menggunakan program ITEMAN 3.0. Kesimpulan dalam penelitian ini adalah soal penyisihan LCC IT Fest Akakom 2016 memiliki kualitas yang tidak baik. Hal ini dapat dilihat berdasarkan kriteria indeks kesukaran, daya beda dan pengecoh diperoleh sebanyak 56% soal yang tidak dipakai, 34% soal harus direvisi terlebih dahulu sebelum dipakai dan hanya 10% soal yang dapat langsung dipakai. Soal tersebut juga tidak reliable, kerena memiliki nilai reliabilitas 0,679. Kata kunci: Kualitas Soal, Lomba Cerdas Cermat, dan ITEMAN
akan dibahas lebih mendalam adalah soal
Pendahuluan Dalam kegiatan lomba cerdas cermat
penyisihan. Soal yang digunakan untuk LCC
(LCC), instrument soal menjadi hal yang vital.
tersebut
Soal digunakan sebagai alat ukur penentu
mendalam dari sisi tingkat kesukaran, daya beda,
seorang peserta LCC dapat lolos ke babak
efektifitas
berikutnya ataupun tidak. Sebagai alat ukur, soal
Berdasarkan skor pada babak penyisihan masih
harus benar-benar mengukur kemampuan peserta
banyak peserta yang memperoleh nilai rendah.
dengan
Hal ini mengindikasikan soal LCC belum
sebaik-baiknya
sehingga
dalam
penggunaannya akan menghasilkan pengukuran yang objektif.
belum
pernah
distraktor
dianalisis
dan
secara
reliabilitas.
memenuhi standar baku penyusunan tes. Rustaman (2005) menyebutkan bahwa
Dari hasil observasi awal, ditemukan tiga
syarat tes yang baik ada lima, yaitu tes harus
set soal yang digunakan pada kegiatan beregu
valid, reliabel, objektif, bersifat diagnostik serta
LCC IT-Fest Akakom 2016 pada tanggal 29
efisien. Baik dan tidaknya soal dapat diketahui
April 2016 tingkat SMA sederajat nasional. Tiga
setelah dilakukan analisis terhadap soal yang
set soal tersebut terdiri dari satu set soal
bersangkutan. Arikunto (2009) menyebutkan
penyisihan berbentuk pilihan ganda (multiple
kegunaan
choice test) serta satu set soal semifinal dan satu
mengidentifikasi butir-butir soal yang baik,
set soal final yang masing-masing berbentuk
cukup baik, atau kurang baik, serta memperoleh
jawaban singkat. Pada penelitian ini, soal yang
informasi
analisis
yang
soal
dapat
adalah
digunakan
untuk
untuk
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
menyempurnakan soal-soal untuk kepentingan
penelitian ini akan menggunakan cara kuantitatif
lebih lanjut dalam bentuk perbaikan dan
untuk
memperoleh gambaran tentang karakteristik
Penelitian-penelitian
soal.
penelitian ini yaitu Sukirno (2006), Masruroh Cara
menganalisis
soal
menurut
menganalisis
soal yang
LCC
tersebut.
sejalan
dengan
(2012), Otaya (2014), Ruspidu (2014)
Surapranata (2009) dapat dilakukan melalui dua
Pendekatan
analisis
dengan
cara
cara, yaitu analisis kualitatif dan analisis
kuantitatif digunakan untuk melihat apakah suatu
kuantitatif. Analisis kualitatif sebagai validitas
soal berfungsi dengan baik atau tidak. Soal yang
logis dalam aspek materi, konstruksi, dan bahasa
berfungsi dengan baik harus memenuhi syarat-
untuk melihat berfungsi tidaknya sebuah soal
syarat berikut.
serta analisis kuantitatif sebagai validitas empiris
1. Tingkat Kesukaran
untuk melihat lebih berfungsi tidaknya sebuah
Untuk mengetahui tingkat kesukaran,
soal, setelah soal diuji coba pada sampel yang
terlebih dahulu harus mencari nilai indeks
representatif. Analisis kualitatif pada soal LCC
kesukaran (P). Indeks kesukaran adalah
telah dilakukan oleh juri lomba LCC. Analisis
proporsi banyaknya siswa yang menjawab
soal secara kualitatif dilakukan menurut prosedur
benar pada suatu soal dengan seluruh siswa.
validasi isi (content validity), yaitu melihat
Indeks kesukaran setiap butir soal yang
apakah
diperoleh dengan memakai rumus yang
soal
LCC
yang
telah
dirancang
merupakan sampel yang representative dari
dikemukakan oleh Budiyono (2011).
seluruh materi TIK ataupun belum. Dalam hal
Cara yang dapat digunakan untuk
ini, soal yang telah dirancang telah dinyatakan
menafsirkan (menginterpretasikan) angka
oleh juri LCC sudah memenuhi kriteria valid
indeks kesukaran item, menurut Thorndike
menurut validitas isi. Melihat hal tersebut, maka
(Sudijono, 2011) disajikan dalam tabel
yang belum dilakukan adalah analisis soal
berikut.
dengan
cara
kuantitatif,
sehingga
untuk
Tabel 1. Interpretasi Indeks Kesukaran Nilai Indeks Kesukaran (P) Tingkat 0,00 ≤ P < 0,30 Sulit 0,30 ≤ P ≤ 0,70 Sedang 0,70 < P ≤ 1,00 Mudah
Interpretasi Tidak baik Baik Tidak baik
Soal yang baik memiliki interpretasi
dapat membedakan kategori peserta yang
tingkat indeks kesukaran sedang (0,30 ≤ P
pandai (kelompok atas) dan tidak pandai
≤ 0,70). Karena dengan tingkat kesukaran
(kelompok bawah). Salah satu cara untuk
sedang dapat mengakibatkan nilai yang
menghitung daya pembeda (D) menurut
berdistribusi normal.
Budiyono (2011) adalah menggunakan
2. Daya Pembeda.
rumus korelasi biserial titik (point biserial
Soal harus memiliki daya beda yang
correlation) atau ditulis rp-bis. Interpretasi
baik, maksudnya adalah soal tersebut
nilai D tersaji dalam tabel berikut.
2
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
Tabel 2. Interpretasi Daya Pembeda Nilai Daya Pembeda (D) -1,00 ≤ P < 0,30 0,30 ≤ P ≤ 1,00
Interpretasi Tidak baik Baik
Soal dengan daya pembeda bernilai
kekonsistensian
suatu
suatu
soal
pengukuran.
dalam
negatif menandakan lebih banyak peserta
melakukan
Soal
tidak pandai yang menjawab benar pada
dikatakan reliabel jika pada
soal tersebut. Soal dengan daya pembeda
kapanpun dilakukan pengukuran, jika
bernilai nol menandakan banyaknya
objek pengukuran tetap maka hasil
peserta pandai dan tidak pandai yang
pengukurannya juga akan tetap. Terdapat
menjawab benar pada soal tersebut sama
beberapa rumus yang dapat digunakan
banyaknya. Soal yang baik adalah soal
untuk mencari nilai reliabilitas dari suatu
yang lebih banyak dijawab benar oleh
soal, antara lain menggunakan metode
peserta pandai dibandingkan dengan
satu kali tes, teknik Spearman-Brown,
peserta tidak pandai, yaitu dengan daya
teknik Flanagan, teknik Rulon, teknik
pembeda positif. Oleh karena itu, menurut
Kuder-Richardson, dan teknik Alpha.
Budiyono (2011) soal yang memiliki daya
Nilai reliabilitas yang digunakan untuk
beda baik adalah soal dengan daya beda
menentukan reliabel atau tidaknya suatu
positif, atau biasa digunakan nilai ambang
soal sebetulnya tidak mempunyai patokan
D ≥ 0,30 (daya beda baik).
yang baku. Tetapi biasanya diambil nilai
waktu
reliabilitas ≥ 0,70. Ini berarti, hasil
3. Berfungsinya Pengecoh Pengecoh (distractor) dirancang
pengukuran
yang
mempunyai
nilai
dengan tujuan untuk mengecoh peserta
reliabilitas 0,70 atau lebih dikatakan
yang tidak menguasai materi dengan baik.
reliabel (Budiyono, 2003).
Oleh karena itu, pengecoh yang baik
Dari kombinasi baik maupun tidak
berarti harus dapat mengecoh. Syarat
baiknya
pengecoh yang baik yaitu dipilih minimal
pembeda dan pengecoh dapat memunculkan
5% peserta (Budiyono, 2011).
beberapa kemungkinan dalam pengambilan
4. Reliabilitas Reliabilitas ditulis
dengan
nilai
indeks
kesukaran,
daya
keputusan. Pedoman pengambilan keputusan (reliability) r11
biasa
yang digunakan disajikan pada tabel berikut.
menunjukkan
3
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
Tingkat Kesukaran Baik Baik Baik Tidak baik Baik Tidak baik Tidak baik Tidak baik
ISSN: 1907-2430
Tabel 3. Pedoman Pengambilan Keputusan Daya Beda Pengecoh Baik Baik Baik Tidak baik Tidak baik Baik Baik Baik Tidak baik Tidak baik Baik Tidak baik Tidak baik Baik Tidak baik Tidak baik
Keputusan Dipakai Dipakai Revisi Revisi Revisi Revisi Tidak Dipakai Tidak Dipakai
Analisis soal secara kuantitatif dapat
Salah satu paket program komputer
dilakukan secara manual maupun dengan
yang ditawarkan untuk melakukan analisis
menggunakan program komputer. Analisis
butir adalah ITEMAN, singkatan dari Item
secara
dengan
Analysis. ITEMAN dipilih di antara yang lain
memanfaatkan rumus yang sudah ada seperti
karena merupakan program komputer yang
rumus untuk mencari tingkat kesukaran, daya
dipergunakan untuk menganalisis soal secara
beda,
klasik. Artinya program ini menggunakan
manual
dilakukan
pengecoh
Sedangkan
maupun
untuk
program
reliabilitas. komputer
rumus-rumus
baku
yang
sudah
lazim
dilakukan menggunakan program seperti
digunakan dalam melakukan analisis soal.
Anbuso, Anatest dan ITEMAN. Tujuan
Paket
dilakukannya analisis soal menurut Aiken
Assessment Systems Corporation di Amerika
(1994) dalam Masruroh (2012) adalah
Serikat.
merevisi atau membuang soal yang tidak
menggunakan sistem operasi DOS.
efektif dan untuk mengetahui informasi diagnostik
pada
siswa
apakah
program
ITEMAN
ITEMAN
Versi
dibuat
3.0
oleh
masih
File input data yang akan dianalisis
sudah
diketik dalam Notepad dengan ekstension
memahami materi yang diajarkan atau belum.
.dat, misalkan DATA.dat. Berikut ini adalah
Tes yang baik dan dapat dipergunakan harus
pedoman penulisan file input data pada
reliabel, memiliki daya beda dan tingkat
ITEMAN.
kesukaran yang baik.
1. Baris pertama berisi kode-kode sebagai berikut.
Tabel 4. Pedoman Penulisan File Input Data ITEMAN Baris Pertama Kolom Keterangan Contoh 1–3 Banyaknya butir yang dianalisis 020 4 Kosong/spasi 5 Untuk jawaban omit/kosong O 6 Kosong/spasi 7 Untuk butir soal yang tidak (belum sempat) dikerjakan N 8 Kosong/spasi 9 – 10 Banyaknya kolom yang diperlukan untuk identitas peserta tes 04 2. Baris kedua berisi kunci jawaban
3. Baris ketiga berisi banyaknya alternatif jawaban
4
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
4. Baris keempat: berisi kode: ”Y” berarti
ISSN: 1907-2430
http://www.assess.com/iteman.
butir dianalisis, ”N” butir tidak
Program ITEMAN. EXE ini harus diletakkan
dianalisis.
dalam satu folder yang sama dengan file input
Pada ITEMAN 3.0, file yang harus
data. Berikut adalah tampilan awal ITEMAN 3.0 ketika dijakankan.
dieksekusi diberi nama ITEMAN.EXE. Program
ini
bisa
diunduh
di
.
Gambar 1 Tampilan Awal ITEMAN 3.0
Petunjuk penggunaan program ITEMAN 3.0
Terkait belum dilakukannya analisis
adalah:
kuantitatif terhadap soal penyisihan LCC
Enter the name of the input file (masukkan
tersebut, maka dilakukan penelitian dengan
nama dari file input), isikan dengan nama
tujuan untuk mendeskripsikan kualitas soal
dari file input, misal DATA. Kemudia
penyisihan LCC TIK tingkat SMA sederajat
tekan tombol Enter.
pada kegiatan Akakom IT-Fest 2016. Adapun
Enter the name of the output file (masukkan
nama
digunakan
sebagai
file
yang
output),
materi TIK SMA yang diambil adalah pada
akan
kelas X, XI dan XII kurikulum KTSP.
misal
METODE PENELITIAN
OUTPUT. Kemudia tekan tombol Enter. Do you want the scores written to a file?
Penelitian ini tergolong dalam jenis
(Y/N) (Apakah Anda ingin menuliskan
penelitian
nilai peserta pada sebuah file), jika Anda
bertujuan mengungkap kualitas dari objek
menginginkan hal ini isi dengan Y, tetapi
penelitian. Dalam hal ini objek penelitiannya
jika tidak isi dengan N. Kemudia tekan
adalah soal penyisihan LCC TIK tingkat
tombol Enter.
SMA sederajat Akakom IT-Fest 2016.
Enter the name of the score file
deskriptive
kualitatif,
karena
Instrumen tes yang dikembangkan mengacu
akan
kepada silabi TIK kurikukum KTSP 2006.
digunakan sebagai nilai), misal NILAI.
Soal penyisihan berbentuk pilihan ganda
Kemudia tekan tombol Enter untuk
(multiple choice) sebanyak 50 soal dengan 5
mengakhiri program.
alternatif jawaban (A, B, C, D dan E) yang
(masukkan
nama
file
yang
dikerjakan dengan durasi 30 menit secara
5
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
berkelompok (3 orang tiap kelompok).
pelaksanaan LCC. Data diperoleh dengan
Proporsi materi TIK yang digunakan adalah
menelusuri arsip-arsip sekolah yang berupa
25 soal kelas X, 10 soal kelas XI, dan 15 soal
benda mati yaitu berupa soal ujian, kunci
kelas XII.
jawaban dan hasil jawaban pekerjaan peserta.
Penelitian ini dilaksanakan dengan menggunakan
teknik
survei,
Analisa data dalam penelitian ini
yaitu
menggunakan teknik analisis butir secara
mendapatkan dan mengumpulkan informasi
kuantitatif.
tentang karakteristik dari objek penelitian.
dilakukan dengan menggunakan Program
Informasi
yang
selanjutnya
ITEMAN (Item and Test Analysis) versi 3.00
digunakan
untuk
kualitas,
yang hasilnya meliputi tingkat kesukaran,
kelayakan dan karakteristik soal LCC TIK
daya pembeda soal, efektifitas pengecoh serta
tingkat SMA berdasarkan analisis secara
reliabilitas soal.
diperoleh mengetahui
Analisis
secara
kuantitatif
kuantitatif.
Hasil Dan Pembahasan
Penelitian ini menggunakan metode
Dari hasil dokumentasi, diperoleh
dokumentasi atau telaah dokumen sebagai metode
pengumpulan
datanya.
sebaran jawaban dari 16 partisipan yang telah
Data
dokumentasi yang diamati adalah data primer
menjawab soal LCC tersebut.
karena langsung bersumber dari partisipan,
dijalankan maka tampilan akan terlihat
yaitu 16 tim peserta lomba dan panitia
seperti pada gambar di bawah ini:
Tabel 5. Kunci Jawaban dan Data Sebaran Jawaban dari Partisipan KUNCI SOAL RESP01 RESP02 RESP03 RESP04 RESP05 RESP06 RESP07 RESP08 RESP09 RESP10 RESP11 RESP12 RESP13 RESP14 RESP15 RESP16
Data
A 1 A A A A A A A A A A A A A B A A
B 2 B B B B B B B B B B B B E B B B
B 3 B B A E C A B B E A E O O E A B
E 4 E E E E E E E E E E E E E E E E
A 5 A A A C B A A A A A A A A A A A
tersebut
D 6 D D D A E B D D D D D D E B D D
A 7 A A A A A A A A A A A A A A A A
B 8 C O C C D B O E O E E O E C E C
A 9 A A A A A A A A A A A A A A A A
D 10 D D D D D E D D D D D D E D O D
A 11 A A B A A B O A B A A A A A A A
kemudian
B 12 B B B B B B B B B B B B B B B B
D 13 D D E E E E D D D D E D E D D E
B 14 B B B B B B O B B D B B B A B B
B 15 B B B B B B B B B B B B B B B B
ditulis
D 16 D D D A D D D D D B D D D D O D
C 17 C C E C C C C C C C C C C D C C
A 18 A A A A A A A A A A A A A A A A
B 19 B B B B B B B B B B B D B B B B
E 20 C C A C C C E C C O B C C C C C
C 21 C C C C C C C C C C C C C C C C
A 22 A A A A A A A A A A A A A A A A
D 23 D D D D D D D D D D D D D D D D
B 24 B B B B B B B B B B B B B B B B
C 25 C C C C C C C C C C C C C C C C
E 26 E E C C E E E E E E E E E C B E
C 27 B C A E A B A A A C A E E E O A
A 28 A A A A A A A A A A A A A C A A
D 29 B D D D D D D D D B D D D B D D
C 30 O O E C E D O O B B B C B E O E
E 31 E E E E E E E E E E E E E E E E
C 32 C C B E C C C C C C C C B C C C
B 33 E O A B B O O O B B B B B E O B
C 34 C C C C B C C C C C C C C C C C
A 35 A C A A A A C A O A A A C A A A
B 36 B B B B B B B B B B B B B B B B
A 37 B B C E B B B A B B B B B B B B
A 38 A A A A B A O A A A A A A A A A
A 39 A B B D D E O E A A O A O E A A
C 40 B O D C C C O C C C B C C C C B
B 41 B B B B E B A B B B B B B B B B
E 42 E E E E B E E E E E E E O E E E
E 43 C C C C B C C C C C C C C C C C
A 44 A A A A D A O A O A C A A C A A
D 45 O B E A D B O O B O B O D B A A
disimpan dengan nama DATA.dat. Berikut
dalam
ini adalah tampilan file input datanya.
NOTEPAD sesuai dengan pedoman file input data pada ITEMAN. File tersebut kemudian
6
B 46 B B B B B B O B B B C B O B B B
B 47 B B B A A B O D B B B B B C B B
B 48 B B B B B B B B B B B B B D B B
A 49 O D D D D D O D D D D O D D O A
C 50 C C D C E E O C D B C C O D C C
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
Gambar 2 Tampilan File Input Data
Selanjutnya,
dijalankan
program
file baru untuk OUTPUT dan NILAI. Berikut
ITEMAN.EXE. Inputkan masukan yang
ini adalah potongan tampilan dari file
diminta pada program tersebut seperti contoh
OUTPUT.
pada Gambar 1. Setelah selesai, terlihat ada
Seq. No. ---1
Scale -Item ----0-1
Item Statistics ----------------------Prop. Point Correct Biser. Biser. ------- ------ -----0.938
Scale Statistics ---------------Scale:
0 ------N of Items 50 N of Examinees 16 Mean 35.688 Variance 14.965 Std. Dev. 3.868 Skew -0.320 Kurtosis -1.032 Minimum 28.000 Maximum 41.000 Median 36.000 Alpha 0.679 SEM 2.193 Mean P 0.714 Mean Item-Tot. 0.281 Mean Biserial 0.426
1.000
0.513
Alternative Statistics ----------------------------------Prop. Point Alt. Endorsing Biser. Biser. Key ----- --------- ------ ------ --A B C D E Other
0.938 0.063 0.000 0.000 0.000 0.000
1.000 -1.000 -9.000 -9.000 -9.000 -9.000
0.513 -0.513 -9.000 -9.000 -9.000 -9.000
*
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
Output ITEMAN dapat dibedakan ke
(daya beda pengecoh). Tanda bintang *
dalam 2 bagian yaitu: (1) Statistik butir soal
yang muncul di sebelah kanan hasil
dan
analisis menunjukkan kunci jawaban.
(2)
statistik
tes/skala.
Berikut
menunjukkan hasil analisis statistik butir soal dan hasil analisis statistik tes/skala:
2. Statistik tes. Disamping menampilkan statistic
1. Statistik butir soal.
butir soal, ITEMAN juga menampilkan
Untuk tes yang terdiri dari butir-
statistic tes untuk keseluruhan. Statistik
butir soal yang bersifat dikotomi misalnya
tes yang dimaksudkan adalah:
pilihan ganda, statistik berikut adalah
N of Items: Jumlah butir soal dalam
output dari setiap butir soal yang
tes yang dianalisis. Untuk tes yang
dianalisis.
terdiri atas butir-butir soal dikotomi
Seq. No. adalah nomor urut butir soal
hal ini merupakan jumlah total butir
dalam file data.
soal dalam tes.
Scala item adalah nomor urut butir soal dalam tes.
N of Examines: Jumlah peserta tes yang digunakan dalam analisis.
Prop. Correct adalah Proporsi siswa yang menjawab benar butir tes. Nilai
Mean: skor/rata-rata peserta tes Variance: Varian dari distribusi skor
ekstrem mendekati nol atau satu
peserta
menunjukkan
gambaran
bahwa
butir
soal
tersebut terlalu sukar atau terlalu
tes
yang
tentang
memberikan sebaran
skor
peserta tes.
mudah untuk pesserta tes. Indeks ini
Std. Deviasi: Deviasi standar dari
disebut juga indeks tingkat kesukaran
distribusi skor peserta tes. Deviasi
soal secara klasikal.
standar merupakan akar dari variance.
Biser adalah indeks daya pembeda
Skew. : Kemiringan distribusi skor
soal dengan menggunakan koefisien
peserta yang memberikan gambaran
korelasi biserial.
tentang bentuk distribusi skor peserta
Point biserial adalah juga indeks daya
tes. Kemiringan negatif menunjukkan
pembeda soal dan pilihan jawaban
bahwa sebagian besar skor berada
(alternatif)
pada bagian atas/skor tinggi dari
dengan
menggunakan
koefisien korelasi point biserial. Keterangan di atas merupakan
distribusi kemiringan
skor.
Sebaliknya
positif
menunjukkan
penjelasan untuk bagian Item Statistics,
bahwa sebagian besar skor berada
Sementara
pada bagian bawah/skor rendah dari
pada
bagian
Alternative
Statistics yang perlu diperhatikan adalah
distribusi
skor.
Kemiringan
Alt. (pilihan jawaban), Prop. Endorsing
menunjukkan
(proporsi peserta tes yang menjawab
berdistribusi secara simetris di sekitar
alternative jawaban), dan Point Biser.
rata-rata/mean.
bahwa
nol skor
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
Kurtosis: Puncak distribusi skor yang
ISSN: 1907-2430
ada perubahan kemampuan maka skor
menggambarkan kelandaian distribusi
yang diperoleh akan konstan.
skor dibanding dengan distribusi
SEM: kesalahan pengukuran standar
normal. Nilai positif menunjukkan
untuk setiap tes. SEM merupakan
distribusi
lebih
estimit dari deviasi standar kesalahan
lancip/memuncak dan nilai negatif
pengukuran dalam skor tes. Kesalahan
menunjukkan distribusi yang lebih
pengukuran membantu pemakai tes
landai/merata.
dalam memahami kesalahan yang
yang
Kurtosis
untuk
distribusi normal adalah nol.
bersifat random yang mempangaruhi
Minimum: Skor terendah peserta
skor peserta dalam pelaksanaan tes. Mean p: rata-rata tingkat kesukaran
dalam tes. Maximum: Skor tertinggi peserta
semua butir soal dalam tes secara
dalam tes.
klasikal dihitung dengan cara mencari
Median: Skor tengah dimana 50%
rata-rata proporsi peserta tes yang
berada pada/lebih rendah dari skor
menjawab benar untuk semua butir
tersebut.
soal dalam tes.
Alpha: Koefisien reliabilitas alpha
Mean item tot: Nilai rata-rata indeks
untuk tes yang merupakan indeks
daya pembeda dari semua soal dalam
homogenitas tes. Koefisien alpha
tes
bergerak
menghitung
Koefisien
dari
0.0
alpha
sampai hanya
1.0. cocok
kecepatan
dan
diperoleh nilai
rata-rata
dengan point
biserial dari semua soal dalam tes. Mean biserial: Nilai rata-rata indeks
digunakan pada tes yang bukan mengukur
yang
hanya
daya pembeda yang diperoleh dengan
mengukur satu dimensi (single trait).
menghitung nilai ratarata korelasi
Reliabilitas adalah kestabilan skor
biserial dari semua butir soal dalam
yang diperoleh orang yang sama
tes.
ketika diuji ulang dengan tes yang
Scale intercorelation: Indeks korelasi
sama pada situasi yag berbeda. Jadi
antara skor-skor peserta tes yang
reliabilitas dapat dikatakan sebagai
diperoleh dari setiap subtes.
tingkat
dua
Hasil analisis secara kuantitatif dari 50
pengukuran terhadap hal yang sama.
soal pilihan ganda menggunakan program
Dengan perangkat soal yang reliable
ITEMAN 3.0 menurut indeks kesukaran,
apabila tes diberikan dua kali pada
daya beda dan pengecoh tersaji pada tabel
orang yang sama tetapi dalam selang
berikut.
konsistensi
hasil
waktu yang berbeda sepanjang tidak
9
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
Tabel 6. Hasil Analisis dengan ITEMAN 3.0 Tingkat Kesukaran No. Soal Angka Kategori 1 2 3 1 0.938 Tidak baik 2 0.938 Tidak baik 3 0.313 Baik 4 1.000 Tidak baik 5 0.875 Tidak baik 6 0.688 Baik 7 1.000 Tidak baik 8 0.063 Tidak baik 9 1.000 Tidak baik 10 0.813 Tidak baik 11 0.750 Tidak baik 12 1.000 Tidak baik 13 0.563 Baik 14 0.813 Tidak baik 15 1.000 Tidak baik 16 0.813 Tidak baik 17 0.875 Tidak baik 18 1.000 Tidak baik 19 0.938 Tidak baik 20 0.063 Tidak baik 21 1.000 Tidak baik 22 1.000 Tidak baik 23 1.000 Tidak baik 24 1.000 Tidak baik 25 1.000 Tidak baik 26 0.750 Tidak baik 27 0.125 Tidak baik 28 0.938 Tidak baik 29 0.813 Tidak baik 30 0.125 Tidak baik 31 1.000 Tidak baik 32 0.813 Tidak baik 33 0.500 Baik 34 0.938 Tidak baik 35 0.750 Tidak baik 36 1.000 Tidak baik 37 0.063 Tidak baik 38 0.875 Tidak baik 39 0.375 Baik 40 0.625 Baik 41 0.875 Tidak baik 42 0.875 Tidak baik 43 0.000 Tidak baik 44 0.688 Baik 45 0.125 Tidak baik 46 0.813 Tidak baik 47 0.688 Baik 48 0.938 Tidak baik 49 0.063 Tidak baik 50 0.500 Baik 9 Baik 41 Tidak Baik
Daya Pembeda Angka Kategori 4 5 0.513 Baik 0.246 Tidak baik 0.403 Baik -9.000 Tidak baik 0.311 Baik 0.643 Baik -9.000 Tidak baik -0.046 Tidak baik -9.000 Tidak baik 0.127 Tidak baik 0.289 Tidak baik -9.000 Tidak baik 0.287 Tidak baik 0.417 Baik -9.000 Tidak baik -0.080 Tidak baik 0.556 Baik -9.000 Tidak baik -0.355 Tidak baik -0.313 Tidak baik -9.000 Tidak baik -9.000 Tidak baik -9.000 Tidak baik -9.000 Tidak baik -9.000 Tidak baik 0.438 Baik 0.275 Tidak baik 0.513 Baik 0.085 Tidak baik 0.177 Tidak baik -9.000 Tidak baik 0.375 Baik 0.145 Tidak baik 0.313 Baik 0.140 Tidak baik -9.000 Tidak baik 0.288 Tidak baik 0.458 Baik 0.630 Baik -0.129 Tidak baik 0.458 Baik 0.409 Baik -9.000 Tidak baik 0.538 Baik -0.409 Tidak baik 0.334 Baik 0.503 Baik 0.513 Baik 0.355 Baik 0.695 Baik 20 30
A 6 * 0.0 25.0 0.0 * 6.3 * 0.0 * 0.0 * 0.0 0.0 6.3 0.0 6.3 0.0 * 0.0 6.3 0.0 * 0.0 0.0 0.0 0.0 43.8 * 0.0 0.0 0.0 0.0 6.3 0.0 * 0.0 * * * 0.0 6.3 0.0 0.0 * 18.8 0.0 12.5 0.0 * 0.0
10
B 7 6.3 * * 0.0 6.3 12.5 0.0 * 0.0 0.0 18.8 * 0.0 * * 6.3 0.0 0.0 * 6.3 0.0 0.0 0.0 * 0.0 6.3 12.5 0.0 18.8 25.0 0.0 12.5 * 6.3 0.0 * 81.3 6.3 12.5 18.8 * 6.3 6.3 0.0 31.3 * * * 0.0 6.3
Pengecoh (%) C D E 8 9 10 0.0 0.0 0.0 0.0 0.0 0.0 6.3 0.0 25.0 0.0 0.0 * 6.3 0.0 0.0 0.0 * 12.5 0.0 0.0 0.0 31.3 6.3 31.3 0.0 0.0 0.0 0.0 * 12.5 0.0 0.0 0.0 0.0 0.0 0.0 0.0 * 43.8 0.0 6.3 0.0 0.0 0.0 0.0 0.0 * 0.0 * 6.3 6.3 0.0 0.0 0.0 0.0 6.3 0.0 75.0 0.0 * * 0.0 0.0 0.0 0.0 0.0 0.0 * 0.0 0.0 0.0 0.0 * 0.0 0.0 18.8 0.0 * * 0.0 25.0 6.3 0.0 0.0 0.0 * 0.0 * 6.3 25.0 0.0 0.0 * * 0.0 6.3 0.0 0.0 12.5 * 0.0 0.0 18.8 0.0 0.0 0.0 0.0 0.0 6.3 0.0 6.3 0.0 0.0 0.0 0.0 12.5 18.8 * 6.3 0.0 0.0 0.0 6.3 0.0 0.0 * 93.8 0.0 * 12.5 6.3 0.0 0.0 * 6.3 6.3 0.0 0.0 6.3 6.3 0.0 0.0 6.3 0.0 0.0 68.8 0.0 * 18.8 12.5
Kategori 11 Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik Tidak baik 1 49
Keputusan 12 Revisi Tidak Dipakai Dipakai Tidak Dipakai Revisi Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Revisi Revisi Tidak Dipakai Tidak Dipakai Revisi Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Revisi Tidak Dipakai Revisi Tidak Dipakai Tidak Dipakai Tidak Dipakai Revisi Revisi Revisi Tidak Dipakai Tidak Dipakai Tidak Dipakai Tidak Dipakai Dipakai Revisi Revisi Revisi Tidak Dipakai Dipakai Tidak Dipakai Revisi Dipakai Revisi Revisi Dipakai
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
Dari kategori indeks kesukaran, soal
peserta pandai (kelompok atas) dengan
yang baik adalah soal yang memiliki tingkat
peserta tidak pandai (kelompok bawah). Dari
kesukaran sedang nilai proporsi 0,30 ≤ P ≤
data di atas diperoleh 20 soal (40%) memiliki
0,70. Soal LCC IT ini termasuk soal dengan
daya beda baik, sedangkan 30 soal (60%)
kualitas tidak baik dari segi indeks kesukaran
memiliki daya beda tidak baik. Dengan
karena dari 50 soal, terdapat 9 soal (18%)
demikian dapat dikatakan bahwa soal LCC TI
yang memenuhi tingkat kesukaran sedang
tersebut memiliki kualitas daya beda yang
dan 41 soal tidak memenuhi. Menurut
tidak baik. Pada set soal terdapat 20 soal yang
Arikunto (2009) soal yang baik adalah soal
memiliki indeks daya beda negatif, yaitu
yang tidak terlalu mudah atau terlalu sukar
nomor 4, 7, 8, 9, 12, 15, 16, 18, 19, 20, 21,
karena soal yang terlalu mudah tidak akan
22, 23, 24, 25, 31, 36, 40, 43 dan 45. Butir
mendorong siswa untuk memecahkannya
soal seperti ini menunjukkan bahwa peserta
serta
akan
tes yang menjawab benar soal tersebut
menyebabkan siswa putus asa dan tidak mau
memiliki skor yang relatif rendah sehingga
mencobanya
batas
butir soal tersebut tidak bisa membedakan
kemampuannya. Jika dianalisis dari soal yang
siswa berkemampuan tinggi dengan rendah.
tidak memenuhi kriteria, sebanyak 31 soal
Beberapa faktor
(62%) memiliki kategori mudah (0,70 < P ≤
adalah soal yang kurang tegas dan jelas
1,00) dan 10 soal (20%) memiliki kategori
perumusannya, soal yang bersifat mendua
sulit. Ini menandakan, kualitas sebagian besar
dapat menyebabkan pengertian yang berbeda
soal penyisihan LCC IT terlalu mudah. Hal
di siswa.
soal
yang
terlalu
sebab
itu
sulit
diluar
ini kemungkinan disebabkan peserta LCC
Suatu
yang
distraktor
menyebabkannya
dikatakan
baik
berasal dari seleksi yang ketat dari tiap
apabila dipilih oleh minimal 5% peserta tes
sekolahnya.
tingkat
(Budiyono, 2011). Pada soal LCC TI ini
kemampuannya tergolong tinggi. Sebuah soal
hanya 1 soal (2%) saja yang memiliki
jika
yang
pengecoh yang baik, yaitu pada soal nomor 6.
berkemampuan tinggi tingkat kesukarannya
Selain itu, sebanyak 49 soal (98%) memiliki
akan menjadi kecil (terasa mudah) sebaliknya
pengecoh
jika
dengan
Oleh
diberikan
diberikan
karena
kepada
kepada
itu
siswa
siswa
yang
yang baik.
kurang/tidak Dengan
berfungsi
demikian
dapat
berkemampuan rendah tingkat kesukarannya
dikatakan bahwa soal LCC TI tersebut
akan menjadi tinggi (terasa sulit). Sehingga
memiliki kualitas distractor/pengecoh yang
soal yang disusun perlu ditingkatkan tingkat
tidak baik. Distraktor yang kurang berfungsi
kesukarannya. Salah satu caranya adalah
dengan baik sebanyak 21 soal (42%), artinya
dengan memberikan soal yang sifatnya
dari 4 distraktor yang direncanakan hanya 2
aplikatif dan pengembangan.
atau 3 distraktor saja yang berfungsi. Ini
Daya beda suatu butir tes merupakan
menandakan distractor yang sebagian tidak
kemampuan tes tersebut dalam membedakan
berfungsi perlu dilakukan revisi. Berfungsi
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
ISSN: 1907-2430
tidaknya suatu distraktor banyak ditentukan
jawaban yang terlalu panjang juga menjadi
oleh cara penyusunan suatu tes. Distraktor
salah satu penyebab kurang berfungsinya
yang
kualitas distraktor.
disusun
tanpa
memperhatikan
homogenitas dari alternatif jawaban akan menyebabkan
tidak
dipilihnya
Dari
Tabel
6,
selanjutnya
jika
option
dilakukan rekap menurut soal yang dipakai,
tersebut, akibatnya tidak dapat berfungsi
revisi dan tidak dipakai. Hasilnya tersaji pada
sebagaimana yang diharapkan. Alternatif
tabel berikut.
Tabel 7. Rekap Hasil Analisis dengan ITEMAN 3.0 Banyak Keputusan No. Soal Soal Dipakai 3, 6, 39, 47, 50 5 Revisi 1, 5, 13, 14, 17, 26, 28, 32, 33, 34, 40, 17 41, 42, 44, 46, 48, 49 Tidak dipakai 2, 4, 7, 8, 9, 10, 11, 12, 15, 16, 18, 19, 28 20, 21, 22, 23, 24, 25, 27, 29, 30, 31, 35, 36, 37, 38, 43, 45
Persentase Soal 10% 34% 56%
Berdasarkan Tabel 6, terlihat bahwa 56% soal
semakin tinggi reliabilitasnya. Perbedaan
tidak dipakai, 34% soal harus direvisi terlebih
bakat dan kemampuan murid yang dites, jika
dahulu sebelum dipakai dan 10% soal yang
tes
dapat langsung dipakai. Melihat persentase
kemampuannya
yang begitu besar dari keputusan soal yang
reliabilitas soalnya akan semakin tinggi
tidak dipakai, maka secara umum dapat
(Purwanto, 2009).
dikatakan soal LCC IT ini masih banyak
SIMPULAN DAN SARAN
kekurangan (kurang memenuhi kualitas). Dari
output
lebih
siswa
yang
heterogen
maka
Berdasarkan hasil penelitian dan pembahasan dapat disimpulkan bahwa soal
Statistics dapat dilihat nilai Alpha 0.679
penyisihan LCC IT Fest Akakom 2016
yang merepresentasikan nilai reliabilitas soal.
memiliki kualitas yang tidak baik. Hal ini
Reliabilitas soal terkait dengan tingkat
dapat dilihat berdasarkan kriteria indeks
keajegan soal dalam menilai kemampuan
kesukaran, daya beda dan pengecoh diperoleh
siswa. Hasil analisis menunjukan soal LCC
sebanyak 56% soal yang tidak dipakai, 34%
IT
kualitas
soal harus direvisi terlebih dahulu sebelum
reliabilitas rendah atau tidak reliable, karena
dipakai dan hanya 10% soal yang dapat
r11 < 0,7. Faktor yang mempengaruhi tinggi
langsung dipakai. Soal tersebut juga tidak
rendahnya
lain
reliable, kerena memiliki nilai reliabilitas
banyaknya butir soal dimana semakin banyak
dibawah standar. Dari kesimpulan tersebut,
butir
dapat disarankan bahwa dalam membuat soal
soal
dalam
reliabilitas
yang
bagian
kepada
Scale
termasuk
pada
diberikan
kategori
soal
antara
digunakan,
maka
LCC
reliabilitasnya semakin tinggi. Luas tidaknya sampling yang digunakan, semakin luas akan
12
IT
berikutnya
sebaiknya
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
memperhitungkan analisis secara kuantitatif dan kualitatif.
DAFTAR PUSTAKA Arikunto, S. 2009. Dasar-dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi Aksara. Budiyono. 2011. Penilaian Hasil Belajar. Surakarta: Program Pascasarjana Universitas Sebelas Maret Surakarta. Masruroh, dkk. 2012. Analisis Soal Ulangan Semester Gasal Biologi Kelas X di Kecamatan Petanahan Kebumen. Unnes Journal of Biology Education, Vol. 1(2), 116121. Otaya, Lian G. 2014. Analisis Kualitas Butir Soal Pilihan Ganda Menurut Teori Tes Klasik dengan Menggunakan Program ITEMAN. TADBIR Jurnal Manajemen Pendidikan, Vol. 2(2), 231-251. Purwanto, N. 2009. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT Remaja Rosdakarya. Ruspidu, MT. 2014. Analisis Butir Soal Ujian Akhir Mata Pelajaran Ekonomi Akuntansi Menggunakan Iteman Microcat. Kajian Pendidikan Akuntansi Indonesia, 55-66 Rustaman, N. 2009. Strategi Belajar Mengajar Biologi. Malang: Penerbit Universitas Negeri Malang. Sudijono. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo Persada. Sukirno. 2006. Pengembangan Tes Formatif untuk Mata Kuliah Akuntansi Manajemen Jurusan Pendidikan Akuntansi FIS UNY. Jurnal Pendidikan Akuntansi Indonesia, Vol. 5(1), 1-18. Supranata, S. 2009. Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung: PT Remaja Rosdakarya
13
ISSN: 1907-2430
Vol. XI Nomor 32 Juli 2016 – Jurnal Teknologi Informasi
14
ISSN: 1907-2430