1
TESTLET SEBAGAI ALTERNATIF PENGEMBANGAN BENTUK TES PRESTASI BELAJAR PADA PEMBELAJARAN KIMIA DI SEKOLAH Purwo Susongko Fakultas Keguruan dan Ilmu Pendidikan Universitas Pancasakti Tegal e-mail:
[email protected] Abstrak Ada banyak keuntungan yang didapat bila bentuk tes uraian disusun dalam testlet. Selain keunggulankeunggulan bentuk tes objektif pada umumnya, bentuk tes testlet juga mempunyai sistem penskoran yang bersifat multikategorik. Penelitian ini bertujuan : (1) Menyusun bentuk tes testlet dari bentuk tes uraian dengan penerapan model penskoran graded response model(GRM) pada tes prestasi belajar kimia, (2) Menguji secara empirik validitas konstrak tes pada bentuk tes testlet sebagai alternatif bentuk tes uraian pada tes prestasi belajar kimia, (3)Membandingkan parameter item dengan menerapkan item response theory model politomus. Pengembangan instrumen dilakukan dengan beberapa tahap. Instrumen penelitian terdiri dari 20 item berbentuk uraian terstruktur yang merupakan tes prestasi belajar kimia siswa SMA kelas XI yang diujikan pada siswa sebagai tes persiapan sebelum pelaksanaan ujian akhir semester I. Dengan item-item tes yang sama, tes uraian disusun dalam bentuk testlet yaitu sebanyak 20 testlet masing masing testlet terdiri dari 3 item tes pilihan ganda. Tes prestasi belajar kimia ini dibuat oleh peneliti bersama--sama dengan guru–guru kimia di lingkungan Dinas Pendidikan, Pemuda dan Olahraga Kabupaten Tegal. Tes uraian diujicobakan kepada 253 siswa kelas XII Program IPA SMA yang diambil dari 2 SMA yaitu SMA 1 SLAWI dan SMA 3 SLAWI. Sedangkan testlet di
ujicobakan kepada 311 siswa kelas XII dari dua SMA yang sama dengan tes uraian. Untuk memperoleh bukti validitas isi digunakan penilaian pakar untuk naskah tes. Untuk membuktikan validitas konstrak dan asumsi unidimensi terhadap tes yang dikembangkan, data yang diperoleh dari hasil uji coba dianalisis menggunakan structural equation modeling (SEM)..Penskoran kedua instrumen menggunakan metode analitik dengan menggunakan empat kriteria yaitu skor 0, 1, 2, dan 3 dengan model graded response model (GRM). Masing-masing jawaban diskor oleh dua rater secara terpisah. untuk memperoleh karakteristik parameter item yang dikalibrasi dengan menggunakan program parscale versi 3,2. Hasil penelitian menunjukkan: (1) Bentuk tes uraian pada tes prestasi belajar kimia dapat disajikan dalam bentuk testlet, (2) Bentuk tes testlet memenuhi validitas isi maupun konstrak sehingga bentuk testlet dapat ,menjadi alternatif bentuk tes yang digunakan, (3) Dengan menerapkan model penskoran graded response model(GRM), ada kecenderungan daya beda item-item tes yang disajikan dalam bentuk uraian lebih tinggi bila dibandingkan disajikan dalam bentuk testlet sedangkan untuk tingkat kesukaran, item tes dalam bentuk uraian cenderung lebih kecil dibanding dalam bentuk testlet. Abstract There are so many advantages from the form of essay test are made by testlests. Not only the advantages of objective test generally, the testlests also has multicategorical score system. The purposes of this study are to find: (1) arranging the testlets from essay through the Graded Response Model (GRM) Application on Chemistry achievement test, (2) Investigating construct validity of the test empirically on testlets for the alternative of Chemistry achievement test, (3) comparing the item paramaters of the tests through the Graded Response Model (GRM) Application.
The development of the instruments was made in several stages. The instrument,
2
namely one consisting of 20 essay items as a chemistry achievement test for Year XI students of Senior High Schools and administered as a preparation test before the examination at the end of semester I. With the same test items, the essay test was converted into 20 testlets, each of which consisted of 3 multiple choice test items. The chemistry achievement test was made by the researcher in collaboration with chemistry teachers in the Office of Education, Youths and Sports of the Tegal Regency. The essay test administered to 253 Year XII students of two Senior High Schools, namely SMA I Slawi and SMA 2 Slawi. The testlets test administered to 311 Year XII students of two Senior High Schools namely SMA I Slawi and SMA 2 Slawi. To obtain evidence of the content validity or content representation, the test papers were assessed through the expert judgment. To prove the construct validity and the unidimensional assumption of the tests developed, the data obtained from the tryout results were analyzed by using the structural equation modeling (SEM). The SEM employed to prove the construct validity and the unidimensional assumption was the confirmatory factor analysis (CFA) model. The program employed to analyze the data using this model was PRELIS to obtain the product moment correlation coefficients among items. The scoring of the two instruments employed the analytic method involving four criteria, namely scores 0, 1, 2, and 3. The scoring of the tests response employed the two raters separatedly. The item parameters were estimated by using the computer program PARSCALE VERSION 3,2 The findings of the study are: (1) the Chemistry essay test can be made by testlest. (2) the testlets test has a good construct and content validity so the testlets can be the alternative of tes used . (3) by the
Graded Response Model (GRM) Application,
the essay test tends to have values of the item discrimination index which are higher than those in the testlets and the essay test tends to have values of the item diffulty index which are lower than those in the testlets. 1 . Pendahuluan Bentuk tes uraian lebih kaya informasi berkaitan dengan kemampuan penempuh tes dibanding dengan tes objektif. Hal ini dapat dipahami karena jika tes dimaksudkan untuk melihat pola pikir yang kompleks dari penempuh tes, bentuk tes uraian lebih tepat dibandingkan dengan bentuk tes pilihan ganda. Bentuk tes uraian memberikan kebebasan kepada setiap penempuh tes untuk mengekspresikan daya nalarnya sehingga jawaban yang diberikan oleh setiap peserta akan menunjukkan kemampuan berpikir secara kompleks. Penggunaan bentuk tes uraian membutuhkan kemampuan yang tinggi untuk mengorganisasi jawaban, membutuhkan kemampuan mengingat kembali terhadap materi, membutuhkan pengetahuan yang integratif dan kemampuan menulis dengan baik. Pada tes objektif tidak didapatkan hal seperti itu karena peserta tinggal memilih opsi yang telah disiapkan. Ada beberapa kelemahan bentuk tes uraian. Dalam memberikan skor, bentuk tes uraian membutuhkan waktu yang lama dan relatif lebih sulit sehingga bentuk tes uraian sulit digunakan untuk tes-tes yang berskala besar. Di samping itu, sifat subjektif dari penilai dalam memberikan skor pada tes berbentuk uraian sering muncul. Sudah banyak usaha yang dilakukan untuk memperbaiki kelemahan-kelemahan yang terjadi pada tes bentuk uraian. Salah satunya dengan meningkatkan objektivitas dalam penentuan skor. Hal ini dilakukan dengan menggunakan lebih dari satu rater serta dengan memperjelas pedoman penskoran yang disusun. Melihat keunggulan dan
3
kelemahan yang dimiliki bentuk tes objektif maupun tes dalam bentuk uraian maka perlu pemikiran untuk mencari alternatif bentuk tes yang lebih baik dari keduanya. Bentuk tes tersebut diharapkan dapat mempunyai keunggulan-keunggulan yang dimiliki oleh bentuk tes objektif dan uraian serta bebas dari kelemahankelemahan yang dimiliki oleh bentuk tes objektif maupun uraian. Tes dapat menggunakan kumpulan beberapa item dalam satu kelompok yang saling berhubungan. Sekumpulan item yang saling berhubungan yang merupakan bagian dari satu tes biasa disebut testlet (Wainer, 1995). Testlet telah digunakan pada pengukuran di bidang bahasa (Lee et al., 2001), TOEFL (Wainer & Wang, 2000), tes masuk sekolah hukum (Wainer, 1991), tes masuk sekolah kedokteran (Zenisky et al., 2002), pengukuran kemampuan dalam skala besar (Ferrara et al., 1997) dan sikap terhadap identitas ras (Fischer & Tokar, 1998). Pada TOEFL, testlet terutama digunakan pada bagian reading. Dengan demikian testlet telah banyak digunakan dalam berbagai bidang pengukuran.Dilaporkan oleh Zenisky, Hambleton, & Sireci (2002) bahwa itemitem dalam satu testlet tidak mempunyai sifat independensi lokal sehingga bila itemitem tersebut dianggap sebagai item - item yang independen maka tidak memenuhi persyaratan analisis dengan IRT model dikotomus. Lee, et al., (2001) melakukan penyetaraan dengan pendekatan IRT politomus, pada tes yang tersusun dari testlet. Hasil penelitian Lee, et al., (2001) menunjukkan bahwa penyetaraan lebih baik secara psikometris dengan menganggap kumpulan item sebagai respons tunggal yang bersifat politomus daripada setiap item tersebut dianggap sebagai item - item yang independen. Setidaknya ada lebih dari 25 hasil penelitian sejak tahun 1989 (www.questia.com) yang menunjukkan bahwa respons peserta terhadap testlet cukup baik secara psikometrik bila dimodelkan sebagai respons politomus
yang bersifat multikategorik. Beberapa pakar telah menyusun dukungan teoretis terhadap penerapan IRT politomus dalam penskoran testlet (Verhelst & Verstralen, 1997). Penerapan IRT politomus juga baik pada penskoran bentuk tes testlet. Hal ini memberikan kemungkinan tes yang disajikan dalam bentuk tes uraian diubah formatnya menjadi bentuk tes testlet. Ada banyak keuntungan yang didapat bila bentuk tes uraian disusun dalam testlet. Selain keunggulankeunggulan bentuk tes objektif pada umumnya, bentuk tes testlet juga mempunyai sistem penskoran yang bersifat multikategorik. Namun demikian, testlet tetap memiliki kelemahan-kelemhan yang melekat dari bentuk tes objektif karena dalam bentuk tes testlet, penempuh tes tetap tidak dapat mengungkapkan kebebasan untuk mengekspresikan daya nalarnya seperti pada bentuk tes uraian. Oleh karena itu perlu dikaji sejauh mana bentuk tes dapat berfungsi sebagai salah satu bentuk tes alternatif menggantikan bentuk tes uraian bila kedua bentuk tes tersebut mengukur konstrak tes yang sama.Penelitian ini bertujuan : 1. Menyusun bentuk tes testlet dari bentuk tes uraian dengan penerapan model penskoran graded response model(GRM) pada tes prestasi belajar kimia 2. Menguji secara empirik validitas konstrak tes pada bentuk tes testlet sebagai alternatif bentuk tes uraian pada tes prestasi belajar kimia 3. Membandingkan parameter item dengan menerapkan item response theory model politomus. 2.Metode Penelitian Pengembangan instrumen dilakukan dengan beberapa tahap. Pertama, pengembangan instrumen uji coba yaitu instrumen yang terdiri dari 20 item berbentuk uraian terstruktur yang merupakan tes prestasi belajar kimia siswa SMA kelas XI yang diujikan pada siswa sebagai tes persiapan sebelum pelaksanaan ujian akhir semester I (Tes U). Dengan item-item tes yang sama, tes
4
U disusun dalam bentuk testlet (Tes T) yaitu sebanyak 20 testlet masing masing testlet terdiri dari 3 item tes pilihan ganda. Jumlah item disesuaikan dengan cakupan materi pada kelas XI dan kecukupan waktu yang dialokasikan yaitu sebanyak 120 menit. Tes prestasi belajar kimia ini dibuat oleh peneliti bersama--sama dengan guru–guru kimia di lingkungan Dinas Pendidikan, Pemuda dan Olahraga Kabupaten Tegal. Tes U dan Tes T diujicobakan pada siswa SMA kelas XII di lingkungan Dinas Pendidikan, Pemuda dan Olahraga Kabupaten Tegal. Untuk memperoleh bukti validitas isi atau representasi isi digunakan penilaian pakar untuk naskah tes. Untuk membuktikan validitas konstrak dan asumsi unidimensi terhadap tes yang dikembangkan, data yang diperoleh dari hasil uji coba dianalisis menggunakan structural equation modeling (SEM). Alasan menggunakan SEM adalah bahwa penelitian ini menggunakan pengukuran-pengukuran untuk menjabarkan konstrak. Salah satu bentuk dari SEM berkaitan secara langsung dan dapat menjawab pertanyaan apakah pengukuran yang dilakukan dapat merefleksikan konstrak yang diukur. Dengan demikian pengolahan data dengan SEM sekaligus dapat mengevaluasi kualitas pengukuran dan memperoleh bukti validitas konstrak.Model SEM yang digunakan untuk membuktikan validitas konstrak dan asumsi unidimensi adalah model analisis faktor konfirmatori (AFK). Program yang digunakan untuk menganalisis dengan menggunakan model ini adalah nilai koefisien korelasi produk momen antar item yang diperoleh PRELIS. Penskoran kedua instrumen menggunakan metode analitik (Mehrens & Lehmann, 1973: 229) dengan menggunakan empat kriteria yaitu skor 0, 1, 2, dan 3. Bila model yang digunakan adalah model GRM, item tes diselesaikan dengan tahapan-tahapan seperti yang dijelaskan berikut ini. Jawaban pada tahapan sebelumnya mempengaruhi pada tahap berikutnya, sehingga siswa yang menjawab benar pada tahapan pertama diberi skor 1. Apabila siswa menjawab benar pada tahapan kedua , dan tahapan pertama benar, diberi skor 2. Siswa yang dapat menjawab
benar keseluruhan tahapan, diberi skor 3. Siswa yang menjawab tahapan kedua benar, tetapi tahapan pertama salah atau pada kedua tahapan siswa menjawab salah diberi skor 0. Penerapan standar yang sama pada respons seluruh siswa merupakan bagian yang penting dalam penskoran model GRM, untuk memperoleh pengukuran yang valid mengenai prestasi siswa. Jawaban siswa disekor oleh guru kimia yang telah dilatih oleh peneliti. Guru menskor jawaban siswa dengan menggunakan pedoman penskoran yang telah dibuat oleh peneliti. Masing-masing jawaban diskor oleh dua rater secara terpisah. Data penelitian terdiri dari skor tunggal untuk satu jawaban yang diperoleh berdasarkan pedoman penskoran yang telah ditetapkan. Pedoman untuk penyusunan rubrik jawaban digambarkan dalam Tabel 1. Pedoman penskoran (rubrik jawaban) dibuat berdasarkan langkah penyelesaian setiap item dan telah didiskusikan dengan tim (peneliti dan guru). Rater I dan Rater II masing-masing adalah guru kimia yang mengajar SMA kelas XI di Kabupaten Tegal. Ketika hasil analisis menunjukkan ada perbedaan antara skor siswa yang diskor oleh rater I dan rater II untuk setiap item, maka dilakukan penskoran ulang dengan melibatkan peneliti sehingga semua rater mempunyai kesepahaman.Sebagai contoh penyusunan item dan rubrik jawaban model GRM pada item tes prestasi belajar kimia dapat dijelaskan sebagai berikut: Item dalam bentuk tes uraian: Diketahui entalpi pembentukan H 2O( l ) = 285 kj/mol, CO2( g ) = -393 kj/mol dan C2 H 2( g ) 227 kj/mol. Hitunglah jumlah
kalor yang dibebaskan pada pembakaran 5,6 liter gas C2 H 2 ( g ) (STP). Item dalam bentuk testlet: Kasus Sebanyak 5,6 liter gas C2 H 2 ( g ) (STP) dibakar sempurna . Diketahui entalpi pembentukan H 2O( l ) = -285 kj/mol,
CO2( g ) = -393 kj/mol dan C2 H 2( g ) 227 kj/mol.
5
Butir soal: 1. Persamaan reaksi pembakaran C2 H 2 yang telah setimbang adalah... 5 a. C2 H 2 ( g ) O2 ( g ) 2CO2 ( g ) H 2O( g ) 2 b. C2 H2( g ) 5O2( g ) 2CO2( g ) H2O( g ) c. 2C2 H2( g ) O2( g ) 4CO2( g ) H2O( g ) d. 2C2 H2( g ) O2( g ) 2C( g ) CO( g ) H2O( g ) e. C2 H2( g ) 2O2( g ) 2CO2( g ) H2O( g ) 2. Besarnya H pada reaksi pembakaran 1 mol gas C2 H 2 adalah... a. 844 kj d. -844 kj b. 1298 kj e. 649 kj c. -1298 kj 3. Besarnya kalor yang dibebaskan pada reaksi tersebut sebesar... a. 1298 kj d. -324,5 kj b. 6,49 kj e. -649 kj c. 324,5 kj Tabel 1 Pedoman Penyusunan Rubrik Jawaban Model GRM dengan 4 Kategori No
Aspek Penilaian
Skor
1
Siswa tidak dapat menyelesaikan 0 langkah atau tahapan pertama dengan benar
2
Siswa dapat menyelesaikan langkah 1 atau tahapan pertama dengan benar , tetapi tidak dapat menyelesaikan tahapan kedua
3
Siswa dapat menyelesaikan dua 2 langkah atau tahapan kedua dengan benar, tetapi tidak dapat menyelesaikan tahap ketiga
4
Siswa dapat menyelesaikan 3 keseluruhan tahapan atau langkah dengan benar
Untuk berhasil menjawab benar item tes tersebut, penempuh tes harus berhasil menyelesaikan tiga langkah yaitu: (1) membuat persamaan reaksi yang setara dari pembakaran sempurna C2 H 2 ( g ) ; (2) menghitung besarnya perubahan entalpi reaksi berdasarkan persamaan reaksi pada langkah pertama; (3) menghitung jumlah kalor yang
dilepaskan pada reaksi tersebut berdasarkan besarnya perubahan entalpi pada langkah kedua. Semua langkah tersebut ditunjukkan oleh masing-masing item pilihan ganda pada bentuk testlet. Contoh pedoman untuk penyusunan rubrik jawaban digambarkan dalam Tabel 2, sedangkan pedoman penskoran selengkapnya dapat dilihat pada lampiran 4. Tabel 2 Contoh Pedoman Penyusunan Rubrik Jawaban Model GRM pada Item Tes Prestasi Belajar Kimia Pokok Bahasan : Energitika Materi Pokok : Penentuan H reaksi Indikator : Menentukan H reaksi dengan menggunakan hukum Hess Item Soal Diketahui enthalpi pembentukan H 2O( l ) = -242
Sk or
kj/mol, CO2( g ) = -393 kj/mol dan
C2 H 2( g ) 227 kj/mol. Hitunglah jumlah kalor yang dibebaskan pada pembakaran 5,6 liter gas C2 H 2 ( g ) (STP). Jawab: 1.Siswa dapat menyusun reaksi pembakaran C2 H 2 yang telah setimbang.
1
Reaksi pembakaran C2 H 2 dapat dinyatakan sebagai berikut:
5 C2 H 2 ( g ) O2 ( g ) 2CO2 ( g ) H 2O( g ) 2 2.Siswa dapat menentukan H pembakaran 1 mol gas C2 H 2 Dengan menggunakan masing-masing H f senyawa yang terlibat reaksi, maka H reaksi dapat dicari sebagai berikut:
2
5 H 2.H f CO2 H f H 2O (H f C2 H 2 H f O2 ) 2 = 2.-393 + -242 – (227 + 0 ) = -786 + -242 – 227 = - 1255 kJ/mol 3 Siswa dapat menentukan besarnya kalor yang dibebaskan pada reaksi tersebut. Banyaknya
C2 H 2 yang dibakar:
5,6 0,25 mol. 22,4
H pada reaksi tersebut: 0,25. -1255 kJ = 313,75 kJ. Kalor yang dilepaskan sebanyak 313,75 kJ
3
6
3. Hasil Penelitian dan Pembahasan A. Konstruksi Tes Dengan menggunakan kisi-kisi yang sama, tes disusun dalam 2 bentuk tes yaitu tes bentuk uraian (Tes U) dan testlet (Tes T). Tes di konstrak atas empat pokok bahasan yaitu: (1) struktur atom, sistem periodik, dan ikatan kimia; (2) energitika; (3) laju reaksi; dan (4) kesetimbangan kimia. Pokok bahasan tersebut diberikan pada siswa kelas XI SMA semester gasal.Pada Tes U, dari keempat pokok bahasa tersebut diuraikan dalam 20 item dengan masing-masing item mempunyai 4 kategori yaitu item yang mempunyai langkah penyelesaian sebanyak 3 langkah. Rancangan Tes U dapat digambarkan sebagai berikut : Tes U
Struktur Atom, sistem Periodik dan ikatan kimia(V1 – V5)
Energiti ka kimia (V6 – V10)
Laju Reaksi (V11 – V15)
Kesetim bangan Kimia (V16 – V20)
Gambar 1: Konstrak Tes U Pada Tes T, dari keempat pokok bahasan tersebut diuraikan dalam 20 testlet dengan masing-masing testlet terdiri dari 3 item tes bentuk objektif. Dengan demikian satu item tes uraian setara dengan 1 testlet (dalam hal ini disebut kasus) sehingga terdapat 20 kasus dengan tiap kasus terdapat 3 item tes objektif. Urutan itemitem dalam satu kasus menunjukkan langkah-langkah yang harus dikerjakan penempuh tes uraian (Tes U). Sebelum dilakukan uji coba, kedua bentuk tes di telaah oleh satu orang ahli pendidikan kimia dan dua orang guru senior yang telah lebih dari 20 tahun mengajar kimia di SMA. Hal ini dilakukan untuk memenuhi validitas rasional sebelum dibuktikan secara empirik. Uji coba
dilaksanakan untuk memperoleh bukti validitas konstrak, uji unidimensi tes dan untuk memperoleh karakteristik parameter item yang dikalibrasi dengan menggunakan program parscale versi 3,2. Tes U diujicobakan kepada 253 siswa kelas XII Program IPA SMA yang diambil dari 2 SMA yaitu SMA 1 SLAWI dan SMA 3 SLAWI, Kabupaten Tegal. Sedangkan Tes T di ujicobakan kepada 311 siswa kelas XII Program IPA dari dua SMA yang sama dengan Tes U. Penskoran dilakukan dengan model analitik secara terurut sehingga pengerjaan soal harus melalui tahapan secara terurut. Ada tiga rater dalam penskoran tes ini yaitu dua guru senior dan peneliti. Bila dari dua guru senior terjadi perbedaan skor, barulah peneliti menentukan skor setelah terlabih dahulu berdiskusi dengan dua guru senior maupun peneliti. Hal ini disebabkan pedoman penskoran telah dibuat sejelas mungkin seperti halnya pada lampiran 4. B. Uji Keunidimensian Tes Tes yang unidimensi merupakan asumsi yang harus dipenuhi bagi suatu perangkat tes sebelum digunakan untuk mengukur suatu kemampuan. Untuk membuktikan validitas konstrak dan asumsi keunidimensian suatu tes, data yang diperoleh dari hasil uji coba dianalisis menggunakan Model Persamaan Struktural (MPS). MPS yang digunakan adalah Analisis Faktor Konfirmatori (AFK).Ada beberapa ukuran goodness of fit yang digunakan dalam menilai ketepatan dari model yang telah disusun. Hal ini dilakukan agar didapatkan dukungan empirik yang komprehensif terhadap model. Ukuran-ukuran tersebut adalah RMSEA, NFI, NNFI, CFI, IFI, RFI dan PGFI. Untuk Tes U maupun tes T , model analisis faktor konfirmatori bertujuan membuktikan kontruksi seperti pada Gambar 1 dan Gambar 2. Dukungan terhadap model yang dikembangkan dari data empirik (sampel), dapat dilihat dari besarnya nilai RMSEA (root mean square error of approxmation). RMSEA ini
7
mengukur penyimpangan nilai parameter pada suatu model dengan matriks kovarian populasi (Imam Ghozali & Fuad, 2005: 31). Mac Callum et al (1996) menyatakan bahwa RMSEA berkisar antara 0,08 sampai dengan 0,1 merupakan model yang memiliki fit cukup, bahkan untuk Tes U lebih baik dari Tes T, yaitu memiliki nilai RMSEA sebesar 0, 083. Dukungan terhadap model yang lain dapat dilihat dari nilai NFI (Normed Fit Index) sebesar 0, 90 (cut- off sebesar 0,9), NNFI (Non – Normed Fit Index ) sebesar 0, 92 (cut- off sebesar 0,9), CFI(Camparative Fit Index) sebesar 0 93 (cut- off sebesar 0,9) dan IFI (Incremental Fit Index) sebesar 0, 93 (cutoff sebesar 0,9), RFI (Relative Fit Index) sebesar 0, 90 (mendekati 1), PGFI (Parsimony Goodnes Of Fit Index) sebesar 0, 64 (cut- off sebesar 0, 6)(Imam Ghozali & Fuad, 2005: 29-33). Pada Tes T memiliki nilai RMSEA sebesar 0, 090. Dukungan terhadap model yang lain dapat dilihat dari nilai NFI (Normed Fit Index) sebesar 0, 92 (cut- off sebesar 0,9), NNFI (Non – Normed Fit Index ) sebesar 0, 92 (cut- off sebesar 0,9), CFI(Comparative Fit Index) sebesar 0 93 (cut- off sebesar 0,9) dan IFI (IncrementalFit Index) sebesar 0, 93 (cut- off sebesar 0,9), RFI (Relative Fit Index) sebesar 0, 90 (mendekati 1), PGFI (Parsimony Goodnes Of Fit Index) sebesar 0, 62 (cut- off sebesar 0, 6)(Imam Ghozali & Fuad, 2005: 29-33). Berdasarkan hasil tersebut, validitas konstrak Tes T dan Tes U terbukti kebenaranya dan asumsi keunidimensian tes dipenuhi dalam penelitian ini. Namun demikian, estimasi terhadap parameter perlu diuji satu per satu, apakah hasilnya signifikan secara statistik. Koefisien estimasi hubungan antara variabel laten struktur atom, sistem periodik dan ikatan kimia (IK), energitika (EN), laju reaksi (LR) dan kesetimbangan kimia (KE) dengan variabel-variabel indikatornya secara statistik signifikan. Besarnya nilai koefisien estimasi (λ), nilai t dan standard error yang dihasilkan pada analisis di atas,
ditunjukkan oleh Tabel 3 untuk Tes U dan Tabel 4 untuk Tes T. Tabel 3 dan Tabel 4 menggambarkan pengaruh variabel laten struktur atom, sistem periodik dan ikatan kimia (IK) terhadap indikator x1 – x5 secara statistik signifikan, energitika (EN) wwwterhadap indikator x6 – x10 secara statistik signifikan, laju reaksi (LR) terhadap indikator x11 – x15 secara statistik signifikan dan kesetimbangan kimia (KE) terhadap indikator x16 – x20 secara statistik signifikan . Tabel 3 dan Tabel 4 menunjukkan bukti bahwa variabel laten struktur atom, sistem periodik dan ikatan kimia (IK) secara teoritis dapat diukur dengan indikator x1 – x5, energitika (EN) secara teoritis dapat diukur dengan indikator x6 – x10, laju reaksi (LR) dapat diukur dengan indikator x11 – x15 dan kesetimbangan kimia (KE) secara teoritis dapat diukur dengan indikator x16 – x20. Selanjutnya, hubungan antara variabel laten (K, EN, LR,KE) dengan variabel KIM pada bentuk tes uraian dapat digambar pada Tabel 5 sedangkan pada tes testlet dapat digambar pada Tabel 6. Tabel 5 dan Tabel 6 menunjukkan bahwa variabel Kim terhadap variabel laten struktur atom, sistem periodik dan ikatan kimia (IK), energitika (EN), laju reaksi (LR) dan kesetimbangan kimia (KE) secara statistik signifikan. Ini berarti Tes kimia (Kim) dalam bentuk testlet maupun bentuk uraian secara teoritis dapat diukur dengan variable laten, IK, EN, LR dan KE. Hasil analisis ini menunjukkan bahwa validitas konstruk terbukti dan asumsi keunidimesian dipenuhi dengan demikian proses penguraian tes dengan asumsi keunidimensian dapat dilakukan.
8
Tabel 3 Koefisien λ, Standard Error, dan Nilai t pada Tes U V
V
EN)
V
(LR)
V
(IK) X 1.00 1 0
X 1,000 6
X 0,83 2 (0,0 38) 21, 91*
X 1,13 7 (0,06 2) 18,20 *
X 0,70 3 (0,0 37) 19,1 5* X 0,76 4 (0,0 34) 22,0 8*
X 1,07 8 (0,06 2) 16,36 * X 1,05 9 (0,06 6) 16,03 *
X 0,67 5 (0,0 34) 19,6 2*
X 0,90 1 (0,06 0 9) 12,95 *
V
X 1 1 X 1 2
1,000
X 16
0,96 (0,06 3) 15,19 *
X 17
X 0,99 1 (0,05 3 8) 17,18 * X 0,95 1 (0,06 4 2) 15,42 *
X 18
X 19
(KE ) 1,00 0 1,03 (0,0 45) 22,6 7,13 * 1,04 (0,0 46) 22,7 9* 1,02 ( 0,04 3) 24,0 5* 1,05 (0,0 45) 23,6 1*
X 1,04 X 1 (0,06 20 5 1) 17,14 * Tabel 4 Koefisien λ, Standard Error, dan Nilai t pada Tes T V (EN) V (LR) V (KE)
(IK) X 1.00 1 0
X 1,000 6
X 0,81 2 (0,0 40) 20,4 9* X 0,81 3 (0,0 40) 20,3 9* X 0,59 4 (0,0 40) 12,6
X 1,09 7 (0,03 2) 33,52 * X 1,01 8 (0,03 7) 27,11 * X 0,98 9 (0,03 7) 26,39
X 1 1 X 1 2
1,000
X 16
1,000
1,01 (0,02 3) 44,22 * X 0,99 1 (0,02 3 3) 43,98 * X 0,94 1 (0,02 4 9) 32,99
X 17
1,03 (0,03 1) 33,13 * 0,99 (0,03 1) 32,09 * 0,95 ( 0,038 )
X 18
X 19
7* X 0,86 5 (0,0 36) 24,0 2*
*
*
X 0,94 1 (0,04 0 1) 23,00 *
X 0,94 1 (0,02 5 7) 35,37 *
X 20
25,29 * 1,02 (0,03 1) 33,54 *
Tabel 5 Nilai Koefisian Gamma (J), Standard Error dan Nilai t pada Tes Bentuk Uraian Kim Koef Variabel Standard Gamma Nilai t Error () IK 0, 82 0, 11 7, 31* EN 0, 32 0, 069 4, 57* LR 0, 38 0, 075 5, 08* KE 0, 34 0, 075 4, 50* * : Signifikan pada = 0, 05 Tabel 6 Nilai Koefisian Gamma (J), Standard Error dan Nilai t pada Tes Bentuk testlet. Variabel IK EN LR KE
Koef Gamm () 0, 46 0, 34 0, 49 0, 44
Kim Standart Error 0, 080 0, 073 0, 080 0, 076
Nilai t 5, 83* 5, 40* 6, 14* 5, 83*
* : Signifikan pada = 0, 05 C. Karakteristik Parameter Item Proses selanjutnya adalah analisis untuk memperoleh karakteristik parameter item. Data yang diperoleh dari hasil ujicoba dikalibrasi dengan menggunakan PARSCALE 3.20 (Muraki & Bock, 1998). Kalibrasi item akan menghasilkan parameter slope /daya beda dan parameter tingkat kesukaran (b), dipaparkan dalam Tabel 7 untuk tes dalam bentuk uraian dan Tabel 8 untuk tes dalam bentuk testlet.
9
Tabel 7: karakteristik parameter item Pada bentuk tes uraian Item Slope b1 b2 b3 1 0.747 -2.007 -1.083 -0.573 2 0.627 -1.484 -0.956 0.61 3 0.492 -1.774 -1.041 0.397 4 0.692 -1.105 -0.317 1.302 5 0.53 -1.444 -0.567 1.023 6 0.368 -0.048 1.128 3.256 7 0.368 0.191 1.176 2.738 8 0.203 0.282 1.414 3.728 9 0.272 -0.449 0.869 3.276 10 0.397 -0.808 0.315 2.74 11 0.461 -0.515 0.357 1.676 12 0.551 -0.821 0.03 0.968 13 0.552 0.114 0.594 2.258 14 0.469 -0.928 0.692 2.057 15 0.543 -0.153 0.43 1.201 16 2.028 0.372 0.496 0.701 17 2.205 0.258 0.518 0.888 18 3.526 0.364 0.552 0.873 19 4.373 0.412 0.558 0.926 20 4.136 0.426 0.542 0.943 Tabel 8: karakteristik parameter item Pada bentuk testlet Item 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Slope b1 b2 b3 0.356 0.769 2.702 3.660 0.179 -6.161 -4.275 1.836 0.232 -4.798 -2.650 -0.088 0.208 -4.300 -2.026 2.756 0.118 -6.883 -4.189 2.798 0.313 -0.820 1.501 3.769 0.260 -0.516 1.392 3.456 0.269 -1.081 1.551 3.364 0.183 -1.475 1.705 5.276 0.295 -0.907 1.425 2.728 2.192 -0.682 0.055 0.750 2.564 -0.578 0.072 0.527 1.904 -0.147 0.096 1.212 1.624 -0.776 0.089 0.804 2.109 -0.512 0.096 0.695 0.383 -1.008 0.797 1.667 0.422 -0.529 0.656 2.603 0.405 -0.577 0.627 2.362 0.379 -1.268 0.876 2.144
20
0.471
-0.683
0.726
3.029
Tabel 7 dan Tabel 8 menunjukan secara IRT, bahwa daya beda item tes yang disajikan dalam bentuk uraian lebih tinggi dibanding bila disajikan dalam bentuk testlet, sehingga konsekuensinya fungsi informasi tes (reliabilitas dalam teori klasik) dalam bentuk uraian lebih tinggi dibanding dari bentuk testlet. Fungsi informasi suatu item model politomus pada dasarnya merupakan penjumlahan dari fungsi informasi item dari tiap kategori. Hal ini disebabkan pada skor yang didapat oleh penempuh tes pada item politomus model GRM dianggap merupakan penjumlahan skor dari tiap langkah yang bersifat dikotomus. Seperti halnya untuk menentukan fungsi informasi item pada model dikotomus, formula untuk menentukan fungsi informasi item model politomus juga menunjukkan nilai daya beda sangat berpengaruh terhadap besarnya nilai fungsi informasi item. Hal ini dapat ditunjukkan oleh formula berikut ini: I j ( )=
mj
( Pjk ( )(1 Pjk ( )) Pj , k 1 ( )(1 Pj , k 1 ( )))2
k 0
Pjk ( )
D2a j
Hasil penelitian empirik juga menunjukkan bahwa ada kecenderungan item yang disajikan dalam bentuk uraian mempunyai tingkat kesukaran yang lebih rendah dibanding bila disajikan dalam bentuk testlet. Dengan formula tersebut dapat diketahui bahwa untuk melihat besarnya fungsi informasi item adalah kombinasi dari pengaruh daya beda dan tingkat kesukaran dari tiap tiap item penyusun tes. Dengan demikian tes yang disajikan dalam bentuk testlet dapat digunakan sebagai alternatif dari tes yang berbentuk uraian. 4. Kesimpulan (1) Bentuk tes uraian pada tes prestasi belajar kimia dapat disajikan dalam bentuk testlet, (2) Bentuk tes testlet
10
memenuhi validitas isi maupun konstrak sehingga bentuk testlet dapat ,menjadi alternatif bentuk tes yang digunakan, (3) Dengan menerapkan model penskoran graded response model(GRM), ada kecenderungan daya beda item-item tes yang disajikan dalam bentuk uraian lebih tinggi bila dibandingkan disajikan dalam bentuk testlet sedangkan untuk tingkat kesukaran, item tes dalam bentuk uraian cenderung lebih kecil dibanding dalam bentuk testlet. 5. Daftar pustaka. Allen, M. J. & Yen, W. M. (1979). Introduction to measurement theory. Belmont, CA : Woodsworth, Inc. Anastasi, A. (1988). Psychological testing. New York: Macmillan . Attali, Y & Tamar, F .(2000). The pointbiserial as a discrimination index for distractor in multiple choice item: Deficiencies in usage and an alternative. Journal of Education Measurement,. 37 (1) , 77-86. Attali,Y & Bar-Hillel, M.(2003). Guess where: The position of correct answer in multiple choice test item as psychometric variable. Journal of Educational Measurement, 40 (2), 109-128. Azwar, S. (2003 ). Reliabilitas dan validitas (Edisi ke-7). Yogyakarta: Pustaka Pelajar Depdiknas. (2003). Standar kompetensi mata pelajaran kimia sekolah menengah atas dan madrasah aliyah. Jakarta: Pusat Kurikulum, Balitbang Depdiknas Ferrara, S, Huynh, H, & Baghi, H. (1997). Contextual characteristics of locally dependent open–ended item cluster in a large-scale performance assessment. Applied Measurement in Education, 10(2),123-144. Fischer, A. R & Tohar, D. M. ( 1998 ). Validity and construct contamination of the racial identity attitude scale – long form. Journal of Counceling Psychology, 45(2),212-224. Hambleton, R K. (1989). Principles and selected applications of item response theory. Dalam R.L. Linn (Ed.). Educational
Measurement hal. 147-200. New York: Macmillan.. Hambleton, R. K & Jones, R. W. (1994). Item parameter estimation errors and their influence on test information functions. Applied Measurement in Education, 7(3), 171-186. Hambleton, R. K & Swaminathan, H. (1985). Item response theory. Boston, MA Imam Ghozali & Fuad, (2005). Structural equation modeling, Semarang: Badan Penerbit Universitas Diponegoro Lee G.et al. (2001). Comparisons of dichotomous and polythomous item respons models in equiting scores from test composed of teslets. Applied Psychological Measurement , 25 ( 4 ), 357-372. Mehrens, W. A. & Lehmann, I. J, (1973). Measurement and evaluation in education and psychology. New York: Holt, Rinehart, and Winston, Inc. Verhelst, N. D & Verstralen, H. H. F. M. (1997). Modeling sums of binary responses by the partial credit model. Measurement and Research Departement Reports, 1-18 Wainer, H. (1995). Precision and differential item functioning an a teslets based test : The 1991 law school admissions test as an example. Applied Measurement in Education, 8, 157-186. Wainer, H & Wang, X. (2000). Using a new statistical model for teslets to score TOEFL.Journal of Educational Measurement,. 37, 203-220 Wainer, H, Sireci, S. G & Thissen, D. (1991). Differential testlets functioning: Definition and detecting . Journal of Education Measurement, 24, 185-201. Zenisky, A., Hambleton, R & Sireci, S. G (2002). Identification an evaluation of local item dependencies in the medical college admission test, Journal of Educational Measurement, 39 (4), 291309.