ANALISIS KEMAMPUAN SAINS DOMAIN KONTEN DAN KOGNITIF SISWA INDONESIA KELAS VIII SMP/MTs BERDASARKAN DATA TIMSS 2007
PUSAT PENILAIAN PENDIDIKAN BADAN PENELITIAN DAN PENGEMBANGAN KEMENTERIAN PENDIDIKAN NASIONAL JAKARTA 2010
ANALISIS KEMAMPUAN SAINS DOMAIN KONTEN DAN KOGNITIF SISWA INDONESIA KELAS VIII SMP/MTs BERDASARKAN DATA TIMSS 2007
Tim Penyusun : Kepala Pusat Penilaian Pendidikan Wasis Editor : Ainun Salim
PUSAT PENILAIAN PENDIDIKAN BADAN PENELITIAN DAN PENGEMBANGAN KEMENTERIAN PENDIDIKAN NASIONAL JAKARTA 2010
KATA PENGANTAR Data hasil TIMSS 2007 yang diikuti oleh siswa Indonesia kelas 8 SMP/MTs bersama dengan siswa setingkat dari berbagai negara merupakan sumber informasi yang penting untuk dikaji, untuk mengetahui mutu pendidikan dasar dan menengah di Indonesia, khususnya dalam bidang matematika dan sains. Rata-rata skor siswa Indonesia pada TIMSS 2007 di bawah skor ratarata internasional (500), dan berada di peringkat 35 dari 49 negara. Untuk dapat menemukan jawaban terhadap permasalahan mengapa kemampuan sains siswa Indonesia tergolong rendah, perlu ditelusuri faktorfaktor apa yang menyebabkan rendahnya prestasi tersebut. Faktor-faktor tersebut dapat bersumber dari responden (siswa), instrumen pengumpul data (butir soal TIMSS), maupun proses analisisnya. Kajian ini berusaha menganalisis item atau butir soal sains yang digunakan dalam studi TIMSS, kemudian menggali informasi lebih lanjut, baik dari domain konten maupun kognitif, agar dapat dipergunakan untuk meningkatkan prestasi siswa Indonesia. Semoga laporan ini berguna bagi perumusan kebijakan di bidang pendidikan khususnya sains, dalam upaya kita bersama untuk meningkatkan mutu pendidikan.
Jakarta, Mei 2010
Dr. Nugaan Yulia Wardhani S., M.Psi. Kepala Pusat Penilaian Pendidikan
i
DAFTAR ISI
KATA PENGANTAR ............................................................................................. i DAFTAR ISI .......................................................................................................... ii DAFTAR TABEL .................................................................................................. iii DAFTAR GAMBAR .............................................................................................. iv BAB I PENDAHULUAN ....................................................................................... 1 A. Latar Belakang ......................................................................................... 1 B. Rumusan Masalah ................................................................................... 2 C. Tujuan Penelitian ..................................................................................... 3 D. Manfaat Penelitian ................................................................................... 3 BAB II KAJIAN PUSTAKA ................................................................................... 4 A. Hakikat Sains ........................................................................................... 4 B. Domain Kognitif dan Konten Sains dalam TIMSS 2007 .......................... 5 C. Kemampuan Sains .................................................................................. 7 D. Uji Fit (Kecocokan) Item .......................................................................... 8 BAB III METODE PENELITIAN ........................................................................... 9 A. Jenis Penelitian ........................................................................................ 9 B. Responden Penelitian.............................................................................. 9 C. Instrumen Pengumpul Data ..................................................................... 9 D. Analisis Data .......................................................................................... 11 BAB IV HASIL PENELITIAN DAN PEMBAHASAN ........................................... 12 A. Analisis Fit Item ..................................................................................... 12 B. Estimasi Kemampuan Sains .................................................................. 15 C. Estimasi Kemampuan Sains: Domain Konten ....................................... 18 D. Estimasi Kemampuan Sains: Domain Kognitif ...................................... 19 F. Pembahasan .......................................................................................... 24 BAB V KESIMPULAN DAN REKOMENDASI.................................................... 36 A. Kesimpulan ............................................................................................ 36 B. Rekomendasi ......................................................................................... 36 DAFTAR PUSTAKA........................................................................................... 38
ii
DAFTAR TABEL Tabel 1. Tabel 2. Tabel 3. Tabel 4. Tabel 5. Tabel 6. Tabel 7. Tabel 8. Tabel 9. Tabel 10.
Komposisi Item Sains TIMSS 2007 ................................................. 10 Komposisi Domain Konten Item Sains TIMSS 2007 ....................... 10 Item-item yang mendapat respons salah oleh seluruh responden . 12 Item misfit hasil program Quest ....................................................... 13 Item misfit hasil program Parscale .................................................. 13 Komposisi Item Sains yang fit pada TIMSS 2007 ........................... 15 Korelasi Estimasi Kemampuan Sains.............................................. 15 Rata-rata estimasi Kemampuan Sains ............................................ 17 Uji Anova Rata-rata Estimasi Kemampuan Hasil Quest ................. 17 Uji Anova Rata-rata Estimasi Kemampuan Hasil Parscale ............. 17
iii
DAFTAR GAMBAR Gambar 1. Estimasi kemampuan menggunakan seluruh item dan item yang fit hasil program Quest ................................................. 16 Gambar 2. Estimasi kemampuan menggunakan seluruh item dan item yang fit hasil program Parscale ............................................. 16 Gambar 3. Estimasi kemampuan domain konten hasil program Quest ......... 18 Gambar 4. Estimasi kemampuan domain konten hasil program Parscale ..... 18 Gambar 5. Estimasi kemampuan domain konten laporan IEA ....................... 19 Gambar 6. Estimasi kemampuan domain kognitif hasil program Quest ......... 20 Gambar 7. Estimasi kemampuan domain kognitif hasil program Parscale .... 20 Gambar 8. Estimasi kemampuan domain kognitif laporan IEA (Martin dkk, 2008) ......................................................................... 21 Gambar 9. Estimasi kemampuan siswa Indonesia merespons item uraian dan pilihan ganda (hasil Quest) ......................................... 22 Gambar 10. Peta estimasi kemampuan (sebelah kiri) dan estimasi tingkat kesukaran item (sebelah kanan) pada item format uraian (hasil Quest) .................................................................................. 23
iv
BAB I PENDAHULUAN A.
Latar Belakang TIMSS (Trends in Mathematics and Science Study) adalah studi
internasional 4 tahunan yang dilakukan oleh IEA (International Association for the Evaluation of Educational Achievement) sejak tahun 1955. TIMSS menilai prestasi matematika dan sains siswa grade 4 dan 8, serta mengumpulkan berbagai informasi berkaitan dengan sekolah, kurikulum, dan pembelajaran. Dengan berpartisipasi dalam TIMSS, suatu negara dapat: (a) memperoleh data yang komprehensif dan dapat dibandingkan secara internasional tentang konsep, proses, dan sikap siswa di bidang matematika dan sains; (b) menilai dan membandingkan kemajuan pembelajaran matematika dan sains secara internasional;
(c)
mengidentifikasi
aspek-aspek
yang
mempengaruhi
peningkatan pengetahuan dan keterampilan di bidang matematika dan sains; (d) memonitor efektivitas pembelajaran matematika dan sains; (e) memahami kebijakan internasional di bidang kurikulum, pengajaran, dan sumber daya yang mendukung terwujudnya situasi belajar yang baik; dan (f) menggunakan hasil TIMSS untuk mengintervensi isu-isu kebijakan dalam negeri (Mullis dkk, 2005). Pemerintah Indonesia berpartisipasi dalam TIMSS sejak tahun 1999 hingga sekarang, tetapi hanya mengikutkan siswa grade 8, yaitu siswa kelas VIII SMP/MTs. Dengan demikian, Indonesia telah tiga kali berpartisipasi dalam TIMSS, yaitu tahun 1999, 2003, dan 2007. Rata-rata skor prestasi sains siswa Indonesia hasil TIMSS tahun 1999, 2003, dan 2007 secara berurutan adalah 435, 420, dan 433. Dengan skor tersebut siswa Indonesia menempati peringkat 32 dari 38 negara (tahun 1999), peringkat 37 dari 46 negara (tahun 2003), dan peringkat 35 dari 49 negara (tahun 2007). Rata-rata skor siswa Indonesia pada TIMSS 2007 di bawah skor ratarata yaitu 500; dan hanya mencapai Low International Benchmark. Dengan capaian tersebut, rata-rata siswa Indonesia hanya mampu mengenali sejumlah fakta dasar tetapi belum mampu mengkomunikasikan dan mengaitkan berbagai topik sains, apalagi menerapkan konsep-konsep yang kompleks dan abstrak. Hasil TIMSS ini mempertegas sinyalir beberapa pemerhati pendidikan yang 1
mengatakan bahwa kecenderungan pembelajaran kita hanya memaparkan fakta, pengetahuan, dan hukum, kemudian dihafalkan; tidak berusaha mengaitkan konten yang dipelajari dengan kehidupan sehari-hari; karena itu siswa mengalami kesulitan untuk mengaplikasikan pengetahuan yang dimiliki dalam kehidupan nyata (Conny semiawan, 2000; Zamroni, 2000; Sumarna 2004). Perlu
ditelusuri
faktor
apakah
yang
menyebabkan
rendahnya
kemampuan sains siswa Indonesia. Faktor tersebut dapat bersumber dari responden (siswa), instrumen pengumpul data (butir soal TIMSS), maupun proses analisisnya. Penelitian ini berusaha menganalisis item atau butir soal sains yang dipergunakan dalam studi TIMSS kemudian menggali informasi lebih lanjut baik dari domain konten maupun kognitif, agar dapat dipergunakan untuk meningkatkan prestasi siswa Indonesia. B.
Rumusan Masalah Beberapa pertanyaan penelitian yang akan dijawab melalui penelitian ini
adalah: 1. Apakah semua item dalam instrumen TIMSS bidang sains memenuhi kecocokan model (fit) bila diujikan pada siswa Indonesia? 2. Bagaimanakah korelasi antara estimasi kemampuan menggunakan seluruh item dan estimasi kemampuan menggunakan item yang fit saja? 3. Apakah rata-rata estimasi kemampuan menggunakan seluruh item dan rata-rata estimasi kemampuan menggunakan item yang fit saja berbeda secara signifikan? 4. Bila menggunakan item yang fit saja, bagaimanakah estimasi kemampuan siswa Indonesia pada domain konten: biologi, kimia, fisika, dan bumiantariksa? 5. Bila menggunakan item yang fit saja, bagaimanakah estimasi kemampuan siswa Indonesia pada domain kognitif: pengetahuan, penerapan, dan penalaran? 6. Bagaimanakah rata-rata estimasi kemampuan siswa Indonesia dalam merespons item berbentuk uraian dan pilihan ganda? 2
7. Bagaimanakah profil item TIMSS bidang sains yang tidak fit dengan siswa Indonesia? C.
Tujuan Penelitian
1. Menguji kecocokan model (fit) item TIMSS bidang sains untuk siswa Indonesia 2. Menguji korelasi antara estimasi kemampuan menggunakan seluruh item dan estimasi kemampuan menggunakan item yang fit 3. Menguji perbedaan rata-rata estimasi kemampuan menggunakan seluruh item dan rata-rata estimasi kemampuan menggunakan item yang fit 4. Menganalisis estimasi kemampuan siswa Indonesia pada domain konten: biologi, kimia, fisika, dan bumi-antariksa menggunakan item yang fit 5. Menganalisis estimasi kemampuan siswa Indonesia pada domain kognitif: pengetahuan, penerapan, dan penalaran menggunakan item yang fit 6. Menganalisis estimasi kemampuan siswa Indonesia dalam merespons item berbentuk uraian dan pilihan ganda 7. Menganalisis profil item TIMSS bidang sains yang tidak fit dengan siswa Indonesia D.
Manfaat Penelitian Jika domain kognitif dan konten sains yang belum dikuasai dengan baik
oleh siswa Indonesia sudah diketahui, profil item yang tidak fit sudah terdeskripsi, dan perilaku siswa dalam merespons item sudah teridentifikasi, maka hasil tersebut dapat digunakan sebagai dasar untuk melakukan perbaikan dalam
pembelajaran
sains,
meningkatkan
sarana
dan
prasarana
pendukungnya, serta menetapkan berbagai kebijakan pendidikan yang lain.
3
BAB II KAJIAN PUSTAKA A.
Hakikat Sains Gersthen (Druxes, 1986: 3) menyatakan bahwa sains merupakan ilmu
yang menerangkan gejala alam sesederhana-sederhananya dan menemukan hubungan antara gejala-gejala alam tersebut dalam bentuk konsep, prinsip, hukum, dan teori. Konsep, prinsip, hukum, dan teori sebenarnya hanyalah salah satu dimensi sains, yang disebut dimensi produk ilmiah. Sains juga memiliki dimensi sikap dan proses ilmiah. Ketiga dimensi sains di atas merupakan satu kesatuan yang tidak dapat saling dipisahkan. Sikap ilmiah, antara lain: selalu ingin tahu, tidak takut gagal, tidak mudah percaya, jujur, objektif, toleran, dan terbuka. Dengan sikap ilmiah para ilmuwan senantiasa bertanya-tanya dan berusaha menemukan jawabannya. Jawaban yang ilmiah atas pertanyaan-pertanyaan yang muncul akan ditemukan bila prosedur menemukan jawaban tersebut juga bersifat ilmiah, yaitu objektif, konsisten, dan reproducible. Untuk menemukan jawaban yang bersifat ilmiah tersebut harus ditempuh sejumlah keterampilan proses sains, baik keterampilan proses dasar maupun keterampilan proses lanjut, meliputi:
mengamati,
mengklasifikasi, mengkomunikasikan, mengukur, mengestimasi, memprediksi, membuat inferensi, mengidentifikasi, mengontrol variabel, merumuskan definisi operasional,
merumuskan
hipotesis,
melakukan
eksperimen,
membuat/membaca grafik, menginterpretasi, membuat model, dan melakukan investigasi (Martin dkk, 1997). Lingkup sains SMP/MTs meliputi bidang kajian energi dan perubahannya, bumi antariksa, makhluk hidup dan proses kehidupan, serta materi dan sifatnya. Menurut Permendiknas No. 22 tahun 2006, lingkup sains tersebut dibelajarkan dalam satu mata pelajaran, yaitu IPA. Konsekuensi logisnya adalah bahwa dalam pembelajaran IPA, bidang kajian tersebut dikemas menjadi satu kesatuan yang utuh. Pelaksanaan pembelajaran IPA seyogyanya juga memberi penekanan pada pembelajaran salingtemas (sains, lingkungan, teknologi, dan masyarakat). Karena itulah mata pelajaran IPA harus disajikan melalui pembelajaran IPA terpadu. IPA terpadu adalah sebuah pendekatan 4
integratif yang mensintesis berbagai perspektif (sudut pandang/tinjauan) disiplin keilmuan untuk memecahkan permasalahan. Dengan pembelajaran terpadu, siswa diharapkan mempunyai pengetahuan IPA yang utuh (holistik) untuk menghadapi permasalahan kehidupan sehari-hari secara kontekstual. B.
Domain Kognitif dan Konten Sains dalam TIMSS 2007 Domain kognitif sains grade 8 dalam TIMSS 2007
meliputi:
pengetahuan (knowing), penerapan (applying), dan penalaran (reasoning). Untuk bidang sains, domain pengetahuan mencakup fakta, informasi, konsep, peralatan sains, dan prosedur ilmiah. Domain pengetahuan diukur melalui kemampuan mengingat, mendefinisikan, memaparkan, menggambarkan, dan menjelaskan alat atau prosedur. Domain penerapan menunjukkan kemampuan siswa dalam menerapkan pengetahuan atau konsep yang dimilikinya dalam situasi masalah tertentu. Domain penalaran diukur melalui kemampuan membandingkan, mengklasifikasi, menggunakan model, menghubungkan, menginterpretasi informasi, menjelaskan, dan menemukan suatu pemecahan. Domain
penalaran
mencakup
peningkatan
kemampuan
menyelesaikan
permasalahan rutin/biasa ke situasi masalah yang tidak biasa, lebih kompleks, dan memiliki banyak tahapan. Domain penalaran diukur melalui kemampuan menganalisis, sintesis, memprediksi, merancang, merumuskan kesimpulan, menggeneralisasi, mengevaluasi, dan memutuskan. Domain konten sains grade 8 dalam TIMSS 2007 meliputi: biologi, kimia, fisika, serta bumi dan antariksa. Domain biologi mencakup: ciri-ciri, klasifikasi, dan proses hidup organisme; sel dan fungsinya; siklus hidup, reproduksi, dan hereditas; keragaman, adaptasi, dan seleksi alam; ekosistem; dan kesehatan tubuh. Domain kimia mencakup: klasifikasi dan komposisi materi; sifat-sifat materi; dan perubahan kimia. Domain fisika mencakup: wujud zat dan perubahannya; perubahan energi, suhu, dan panas; cahaya; bunyi; kelistrikan dan kemagnetan; serta gaya dan gerak. Domain ilmu bumi dan antariksa mencakup: struktur bumi; siklus dan proses yang terjadi di bumi; sumber daya alam, manfaat, dan konservasinya; serta bumi dalam sistem tatasurya dan jagad raya. 5
Capaian kemampuan sains dalam TIMSS 2007 dibagi menjadi 4 tingkatan yang disebut International Benchmark, yakni Low International Benchmark (skor 400-474), Intermediate International Benchmark (skor 475549), High International Benchmark
(skor 550-624), dan Advanced
International Benchmark (skor 625 ke atas). Deskripsi kemampuan untuk masing-masing tingkatan sebagai berikut: Advanced International Benchmark – 625. Siswa dapat mendemonstrasikan konsep biologi, kimia, fisika, dan bumi-antariksa yang abstrak dan kompleks. Mereka memiliki pemahaman tentang kehidupan organisme yang kompleks dan hubungannya dengan lingkungan. Mereka menunjukkan pemahaman tentang sifat-sifat magnet, bunyi, dan cahaya. Mereka mampu mendemonstrasikan pemahaman tentang struktur zat serta perubahan fisika dan kimia. Siswa menerapkan pengetahuan tentang sistem tata surya, proses yang terjadi di permukaan bumi, serta memahami isu-isu global tentang lingkungan. Mereka memahami beberapa prinsip penyelidikan ilmiah dan dapat menerapkan prinsip-prinsip fisika untuk memecahkan beberapa permasalahan secara kuantitatif. Mereka dapat menyajikan tulisan untuk mengomunikasikan pengetahuan sains mereka. High International Benchmark – 550. Siswa secara konseptual dapat mendemonstrasikan pemahaman tentang siklus, sistem, dan prinsip-prinsip. Mereka memiliki pemahaman beberapa konsep biologi termasuk proses dalam sel, tubuh, dan kesehatan, serta hubungan tumbuhan dan hewan dalam ekosistem. Mereka menerapkan pengetahuannya tentang cahaya dan bunyi, mendemonstrasikan pengetahuannya tentang panas dan gaya, serta menunjukkan pemahaman tentang struktur zat, sifat-sifat fisika dan kimia, serta perubahannya. Mereka mendemonstrasikan pemahaman tentang sistem tata surya, proses di permukaan bumi, sumber daya alam, dan beberapa isu lingkungan. Mereka mendemonstrasikan beberapa keterampilan inkuiri ilmiah. Mereka mengumpulkan informasi untuk merumuskan kesimpulan, menginterpretasi tabel dan grafik, serta menyajikan tulisan pendek tentang pengetahuan sains mereka. Intermediate International Benchmark – 475. Siswa dapat mengenali dan mengomunikasikan pengetahuan sains dasar lintas topik. Mereka mendemonstrasikan beberapa pemahaman tentang ciri-ciri hewan, jaring-jaring makanan, dan dampak perubahan populasi dalam suatu ekosistem. Mereka mengenal beberapa aspek tentang bunyi dan gaya, dan memiliki pengetahuan awal tentang perubahan kimia. Mereka menunjukkan pemahaman awal tentang sistem tatasurya, proses perubahan di permukaan bumi, sumber daya alam dan lingkungan. Siswa merumuskan intisari informasi dari suatu table dan menginterpretasi diagram bergambar. Mereka dapat menerapkan pengetahuannya pada situasi praktik dan mengomunikasikan tanggapan mereka melalui deskripsi singkat. 6
Low International Benchmark – 400. Siswa dapat mengenali sejumlah fakta dasar dari kehidupan dan sains secara fisik. Mereka memiliki sejumlah pengetahuan tentang tubuh dan mendemonstrasikan fenomena fisik yang dikenal dalam kehidupan sehari-hari. Siswa dapat menginterpretasi diagram bergambar dan menerapkan konsep-konsep fisik sederhana pada situasi praktik. C.
Kemampuan Sains Kemampuan di bidang sains merupakan integrasi kemampuan dalam
dimensi sikap, proses dan produk secara utuh. Kemampuan dalam dimensi sikap, misalnya: selalu objektif dan jujur, memiliki rasa ingin tahu yang tinggi, tidak mempercayai hal-hal yang bersifat tahayul (irasional), dan menghargai perbedaan pendapat. Kemampuan dalam dimensi proses, misalnya: mampu merumuskan dugaan atau hipotesis, merancang eksperimen, melakukan pengamatan untuk mengumpulkan data, melakukan analisis data, membuat inferensi, dan merumuskan kesimpulan berdasarkan analisis data yang akurat. Kemampuan dalam dimensi produk, misalnya: mampu membandingkan berbagai konsep, menerapkan berbagai prinsip, dan menggunakan hukum atau teori untuk menjelaskan fenomena alam. Tolman & Hardy (1995: 48) menyatakan kemampuan seseorang di bidang
sains,
memecahkan
dapat
diukur
masalah
dari
(problem
keterampilan solving),
orang
meliputi:
tersebut (i)
dalam
keterampilan
menerjemahkan masalah ke dalam bahasa sains (science linguistic); (ii) keterampilan mengidentifikasi skema penyelesaian masalah (schematic knowledge); (iii) keterampilan merumuskan strategi penyelesaian masalah (strategy knowledge); dan (iv) keterampilan melakukan tahapan-tahapan penyelesaian masalah (algorithmic knowledge). Agar siswa kompeten dalam pemecahan masalah yang dihadapi dalam kehidupan sehari-hari, pembelajaran sains sebaiknya dilaksanakan secara inkuiri ilmiah (scientific inquiry) untuk menumbuhkan kemampuan berpikir, bekerja, dan bersikap ilmiah serta mengkomunikasikannya sebagai aspek penting kecakapan hidup (life skills). Pemberian pengalaman belajar secara langsung melalui penggunaan dan pengembangan keterampilan proses dan sikap ilmiah adalah suatu keharusan dalam pembelajaran sains. 7
D.
Uji Fit (Kecocokan) Item Salah satu keputusan penting dalam IRT (Item Response Theory)
adalah pemilihan model. Model dipilih dengan dua pertimbangan utama: (i) kecocokannya dengan keadaan sesungguhnya, dan (ii) seberapa rinci model tersebut mengungkapkan keadaan sesungguhnya ke dalam skor (Naga, 1992). Tetapi karena keadaan sesungguhnya tidak diketahui, maka alasan pemilihan model didasarkan pada measurement theory, yang menyatakan bahwa parameter item dan paramter kemampuan harus bersifat invarian. Tingkat kesukaran
item
haruslah
tetap
sama,
tidak
perduli
siapapun
yang
menjawabnya. Kemampuan seseorang juga harus tetap sama, tidak perduli item seperti apa yang mereka jawab. Semakin tidak cocok antara model dan data (keadaan sesungguhnya), maka estimasi parameter item dan kemampuan yang dihasilkannya semakin tidak invarian. Akhirnya, analisis dan interpretasi yang dilakukan berdasarkan parameter-parameter tersebut menjadi tidak akurat (Hambleton, 1991). Dalam penelitian ini analisis fit item menggunakan program Quest (1 Parameter Logistik/PL) dan Parscale (3 PL). Program Quest menghasilkan analisis fit item berdasarkan nilai infit mean square, outfit mean square, infit t, dan outfit t berdasarkan statistik akumulasi residu dengan pembobotan dan tanpa pembobotan (Wright & Master, 1982: 99). Infit dan outfit mean square menggambarkan aproksimasi distribusi normal menggunakan transformasi Wilson-Hilferty. Dengan aproksimasi tersebut, data atau respons dikatakan fit dengan model Rasch, bila harga infit dan outfit mean square-nya mendekati 1 dan harga infit dan outfit t-nya mendekati 0 (Adams & Khoo, 1996: 30). Sedangkan program Parscale menganalisis fit item menggunakan metode Mislevy dan Bock yang dimodifikasi (Muraki, 1999: 37). Metode Mislevy dan Bock
menggunakan
the
likelihood-ratio-chi-square
statistic, dan model
dinyatakan fit dengan data (keadaan sesungguhnya) bila p>0,00 (du Toit, 2003). Dalam penelitian ini, suatu item disebut fit bila memiliki nilai p>0,05.
8
BAB III METODE PENELITIAN A.
Jenis Penelitian Jenis penelitian ini merupakan penelitian deskriptif kuantitatif untuk
mengeksplorasi respons siswa Indonesia terhadap instrumen sains pada TIMSS 2007, sehingga diperoleh informasi kemampuan yang akurat meliputi domain kognitif dan konten. Analisis respons dalam penelitian ini berbeda dengan analisis yang telah dilakukan oleh IEA, selaku penyelenggara TIMSS, karena dalam penelitian ini item sains diuji kecocokannya (fit item) dulu untuk siswa Indonesia. Selanjutnya, hanya item yang fit dengan siswa Indonesia saja yang digunakan untuk mengestimasi kemampuan siswa kelas VIII SMP/MTs. Sedangkan, item-item yang tidak fit akan digali lebih jauh dari sisi domain konten, kognitif, maupun formatnya sehingga diperoleh profil yang utuh. B.
Responden Penelitian Responden penelitian ini adalah siswa kelas VIII SMP/MTs dari seluruh
wilayah Indonesia yang berjumlah 4203 siswa, sekitar 51% wanita dan 49% pria. C.
Instrumen Pengumpul Data Penelitian ini menggunakan data sekunder yang telah dikumpulkan
oleh penyelenggara TIMSS 2007. Untuk mengukur kemampuan sains siswa kelas VIII SMP/MTs, TIMSS menggunakan instrumen tes tulis dengan format pilihan ganda dan uraian. Jumlah seluruh item 227, terdiri atas 107 item (47,1%) pilihan ganda dan 120 item (52,9%) uraian. Komposisi item ditunjukkan Tabel 1 dan Tabel 2.
9
Tabel 1. Komposisi Item Sains TIMSS 2007 Domain
Konten
Kognitif
Sub Domain
Jumlah Item
Persentase
Biologi
82
36,0%
Kimia
42
18,5%
Fisika
60
26,5%
Bumi dan Antariksa
43
19,0%
Pengetahuan
88
39,0%
Penerapan
96
42,5%
Penalaran
43
18,5%
Tabel 2. Komposisi Domain Konten Item Sains TIMSS 2007 Sub Domain
Biologi
Kimia
Fisika
Bumi dan Antariksa
Cakupan Domain
Jumlah Item
Ciri-ciri, klasifikasi, dan proses hidup organisme
15
Sel dan fungsinya
14
Siklus hidup, reproduksi, dan hereditas
12
Keragaman, adaptasi, dan seleksi alam
8
Ekosistem
25
Kesehatan tubuh
8
Klasifikasi dan komposisi materi
22
Sifat-sifat materi
7
Perubahan kimia
13
Wujud zat dan perubahannya
14
Perubahan energi, suhu, dan kalor
14
Cahaya
6
Bunyi
5
Gaya dan gerak
13
Kelistrikan dan kemagnetan
8
Struktur bumi
9
Siklus dan proses di permukaan bumi
18
Sumber daya alam, manfaat, & konservasinya
6
Bumi dalam sistem tatasurya dan jagad raya
10
10
D.
Analisis Data Respons siswa terhadap item sains dianalisis dengan tahapan sebagai
berikut: 1. Melakukan analisis fit item menggunakan program analisis Parscale dan Quest. 2. Melakukan estimasi kemampuan siswa menggunakan seluruh item dan menggunakan item yang fit saja. 3. Mengkorelasikan hasil estimasi kemampuan menggunakan seluruh item dan menggunakan item yang fit saja. 4. Membandingkan rata-rata estimasi kemampuan menggunakan seluruh item dan menggunakan item yang fit saja. 5. Mengestimasi kemampuan siswa sub-domain biologi, kimia, fisika, dan IPBA. 6. Mengestimasi
kemampuan
siswa
sub-domain
kognitif,
meliputi:
pengetahuan, penerapan, dan penalaran. 7. Mengestimasi kemampuan siswa dalam merespons item pilihan dan uraian 8. Mengeksplorasi profil item yang tidak fit dengan siswa Indonesia
11
BAB IV HASIL PENELITIAN DAN PEMBAHASAN A.
Analisis Fit Item Dari 227 item sains pada TIMSS 2007, terdapat 4 item yang tidak
pernah direspons benar oleh 4203 siswa Indonesia. Domain konten, kognitif, dan format keempat item tersebut disajikan dalam Tabel 3. Tabel 3. Item-item yang mendapat respons salah oleh seluruh responden Nomor Item
Domain Kognitif
Domain Konten
Format Item
S042238c
Penalaran
Fisika Perubahan Energi, Suhu, dan Kalor
Uraian
S042311
Penerapan
Bumi dan Antariksa Bumi dalam sistem Tatasurya dan Jagad Raya
PG
S032141
Penerapan
Fisika Gaya dan gerak
PG
S042401
Penerapan
Kimia Perubahan kimia
PG
Tabel 3 menunjukkan bahwa siswa Indonesia yang menjadi responden TIMSS 2007 mengalami kesulitan ketika menjawab item-item yang mengukur domain kognitif penerapan dan penalaran. Keempat item yang tidak pernah direspons benar oleh seluruh responden TIMSS 2007 tidak digunakan dalam penelitian ini. Terhadap 223 item sains lainnya dilakukan uji kecocokan (fit model) menggunakan program Quest (1-PL) dan Parscale (3-PL), untuk menemukan item-item yang sesuai, kemudian digunakan untuk mengukur kemampuan sains siswa Indonesia. Program Quest menghasilkan 11 item misfit, sebagaimana ditunjukkan Tabel 4, sedangkan program Parscale menghasilkan 39 item misfit, sebagaimana ditunjukkan pada Tabel 5.
12
Tabel 4. Item misfit hasil program Quest Program Quest (1-PL) Jumlah Nomor Item Item S032697d 11
Kognitif
Konten
Format
Penerapan
Biologi
Uraian
S032310b
Pengetahuan
Biologi
Uraian
S032310d
Pengetahuan
Biologi
Uraian
S032680
Penalaran
Kimia
Uraian
S042228c
Penerapan
Kimia
Uraian
S042173
Penerapan
Uraian
S032650d
Penerapan
Uraian
S032310a
Pengetahuan
Kimia Bumi dan Antariksa Biologi
S042015
Pengetahuan
Biologi
PG
S032530d
Pengetahuan
Uraian
S022244
Penalaran
Biologi Bumi dan Antariksa
Uraian
Uraian
Tabel 5. Item misfit hasil program Parscale Program Parscale (3-PL) Jumlah Nomor Kognitif Item Item S032697d Penerapan 39 S032310b Pengetahuan S032310d Pengetahuan S032680 Penalaran S042228c Penerapan S042173 Penerapan S032650d Penerapan S032516 Penerapan S022244 Penalaran S032693b Penalaran S032697a Penerapan S042011 Penerapan S042307 Pengetahuan S042052 Penerapan S032035 Pengetahuan S042298 Penerapan S042051b Penalaran S042404 Penerapan S042272 Pengetahuan 13
Konten
Format
Biologi Biologi Biologi Kimia Kimia Fisika Bumi dan Antariksa Bumi dan Antariksa Bumi dan Antariksa Biologi Biologi Biologi Bumi dan Antariksa Biologi Biologi Biologi Biologi Bumi dan Antariksa Fisika
Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian PG Uraian Uraian Uraian PG
Program Parscale (3-PL) Jumlah Nomor Kognitif Item Item S042100 Pengetahuan S042141 Pengetahuan S032015 Pengetahuan S032392 Penerapan S032425 Pengetahuan S032555 Penalaran S042053 Penerapan S042408 Penerapan S042049a Penerapan S042049b Penalaran S042182 Pengetahuan S042228b Penalaran S042135 Pengetahuan S042173a Penerapan S042173b Penerapan S042173c Penerapan S042173d Penerapan S042173e Penerapan S042317 Pengetahuan S042300a Penerapan
Konten
Format
Kimia Bumi dan Antariksa Biologi Fisika Fisika Bumi dan Antariksa Biologi Biologi Biologi Biologi Fisika Kimia Bumi dan Antariksa Fisika Fisika Fisika Fisika Fisika Bumi dan Antariksa Biologi
Uraian PG Uraian PG PG Uraian PG Uraian Uraian Uraian PG Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian Uraian
Tabel 4 dan Tabel 5 menunjukkan sebagian besar item yang misfit baik hasil analisis Quest maupun Parscale adalah item format uraian, masingmasing 90% pada Tabel 4 dan 82% pada Tabel 5. Hal ini mengindikasikan munculnya masalah yang dirasakan oleh siswa Indonesia ketika merespons item bentuk uraian yang digunakan dalam TIMSS 2007. Masalah tersebut dapat berupa ketidakterbacaan item, keterbatasan siswa dalam menuliskan gagasan dan argumentasi, atau ketidak sesuaian tingkat kesukaran item dengan kemampuan siswa (tidak on target). Berdasarkan hasil uji kecocokan di atas, distribusi item fit pada domain kognitif dan konten sains ditunjukkan Tabel 6.
14
Tabel 6. Komposisi Item Sains yang fit pada TIMSS 2007 Domain
Konten
Kognitif
B.
Sub Domain
Jumlah Item Total
Jumlah Item Fit
Biologi
82
Quest 77
Parscale 65
Kimia
41
39
37
Fisika
58
58
48
Bumi dan Antariksa Pengetahuan
42
41
34
88
84
75
Penerapan
93
91
72
Penalaran
42
40
35
Estimasi Kemampuan Sains Estimasi kemampuan sains dilakukan menggunakan seluruh item (227)
dan menggunakan item yang fit saja, baik fit hasil program Quest maupun Parscale. Hal ini dilakukan untuk memperoleh informasi yang lebih meyakinkan. Korelasi antara estimasi kemampuan menggunakan seluruh item dan estimasi kemampuan menggunakan item yang fit saja, ditunjukkan Tabel 7.
Tabel 7. Korelasi Estimasi Kemampuan Sains Korelasi Estimasi Kemampuan Sains Menggunakan Seluruh Item dan Menggunakan Item yang Fit saja Hasil Quest
Hasil Parscale
0,988 (p<0,01)
0,927 (p<0,01)
15
Scatterplot hasil estimasi program Quest dan Parscale secara berurutan ditunjukkan Gambar 1 dan Gambar 2.
Estimasi kemampuan fitmenggunakan item fit
2,00
0,00
- 2,00
- 4,00
- 4,00
- 2,00
0,00
2,00
Estimasi kemampuan menggunakan seluruh item misfit
fit menggunakan item fit Estimasi kemampuan
. Gambar 1. Estimasi kemampuan menggunakan seluruh item dan item yang fit hasil program Quest
3,00
2,00
1,00
0,00
- 1,00
- 2,00
- 2,00
0,00
2,00
se mua Estimasi kemampuan menggunakan seluruh item
Gambar 2. Estimasi kemampuan menggunakan seluruh item dan item yang fit hasil program Parscale 16
Rata-rata estimasi kemampuan sains menggunakan seluruh item dan menggunakan item yang fit saja ditunjukkan Tabel 8. Tabel 8. Rata-rata estimasi Kemampuan Sains Rata-rata Estimasi Kemampuan Sains (SD)(R) Hasil Quest
Hasil Parscale
Seluruh Item
Item yang Fit
Seluruh Item
Item yang Fit
-0,99 (0,88)
-1,00 (0,87)
-0,084 (0,84)
-0,042 (0,82)
SD = standar deviasi; R = reliabilitas Selanjutnya dilakukan uji statistik menggunakan program SPSS untuk mendapatkan bukti apakah rata-rata estimasi kemampuan menggunakan seluruh item dan menggunakan item yang fit saja tersebut berbeda atau tidak. Hasilnya ditunjukkan pada Tabel 9 dan Tabel 10. Tabel 9. Uji Anova Rata-rata Estimasi Kemampuan Hasil Quest Sum of Squares
df
Mean Square
F
Sig.
Between Groups
3194,500
342
9,341
513,428
,000
Within Groups
70,224
3860
,018
Total
3264,724
4203
Tabel 10. Uji Anova Rata-rata Estimasi Kemampuan Hasil Parscale Sum of Squares
df
Mean Square
F
Sig.
Between Groups
196462,082
2198
89,382
4,345
,000
Within Groups
1933,795
94
20,572
Total
198395,877
2292
Tabel 9 dan Tabel 10 menunjukkan nilai p < 0,05, berarti pada taraf kepercayaan 95% kedua rata-rata estimasi pada Tabel 8 adalah berbeda. Berdasarkan hasil tersebut, perlu dilakukan estimasi ulang kemampuan sains 17
siswa Indonesia, baik pada domain kognitif maupun konten, kemudian hasilnya dibandingkan dengan hasil estimasi yang telah dilaporkan oleh IEA.
C.
Estimasi Kemampuan Sains: Domain Konten Menggunakan item-item fit sebagaimana ditampilkan pada Tabel 8,
dilakukan estimasi kemampuan sains domain konten (biologi, kimia, fisika, dan bumi-antariksa)
menggunakan
program
Quest
dan
Parscale.
Hasilnya
ditunjukkan pada Gambar 3 dan Gambar 4.
43
Mean Score
42,5 42 41,5 41 40,5 40 39,5 Biology Biologi
Chemistry Kimia
Physics Fisika
Earth Science Bumi-Antariksa
Content Domains
Gambar 3. Estimasi kemampuan domain konten hasil program Quest 50,1 50 49,9 49,8 49,7 49,6 49,5 49,4 Biologi
Kimia
Fisika
Bumi-Antariksa
Gambar 4. Estimasi kemampuan domain konten hasil program Parscale 18
Sedangkan hasil estimasi yang dilaporkan Martin dkk (2008: 117) ditampilkan pada Gambar 5. 445 440 435 430 425 420 415 410 Biologi
Kimia
Fisika
Bumi-Antariksa
Gambar 5. Estimasi kemampuan domain konten laporan IEA (Martin dkk, 2008) Berdasarkan Gambar 3, 4, dan 5 terlihat bahwa estimasi kemampuan domain konten yang dihasilkan Quest, Parscale, dan yang dilaporkan IEA senada, yakni kemampuan bidang kimia paling rendah dan kemampuan bidang bumi-antariksa paling tinggi. D.
Estimasi Kemampuan Sains: Domain Kognitif Menggunakan item-item fit sebagaimana ditampilkan pada Tabel 8,
dilakukan
estimasi
kemampuan
sains
domain
kognitif
(pengetahuan,
penerapan, dan penalaran) menggunakan program Quest dan Parscale. Hasilnya ditunjukkan pada Gambar 6 dan Gambar 7.
19
46 44 42 40 38 36 34 Penerapan
Penalaran
Pengetahuan
Gambar 6. Estimasi kemampuan domain kognitif hasil program Quest
49,9 49,85 49,8 49,75 49,7 49,65 49,6 49,55 49,5 49,45 49,4 Penerapan
Penalaran
Pengetahuan
Gambar 7. Estimasi kemampuan domain kognitif hasil program Parscale
20
Sedangkan hasil estimasi yang dilaporkan Martin dkk (2008: 117) ditampilkan pada Gambar 8. 440 435 430 425 420 415 Penerapan
Penalaran
Pengetahuan
Gambar 8. Estimasi kemampuan domain kognitif laporan IEA (Martin dkk, 2008) Berdasarkan Gambar 6, 7, dan 8 terlihat bahwa estimasi kemampuan domain kognitif yang dihasilkan Quest, Parscale, dan yang dilaporkan IEA berbeda-beda. Hasil estimasi Quest dan Parscale menunjukkan estimasi kemampuan
pengetahuan
siswa
Indonesia
paling
tinggi
dibandingkan
kemampuan penerapan dan penalaran. Kemampuan kognitif yang paling rendah adalah penerapan menurut Quest, sedangkan menurut Parscale adalah penalaran. Hasil paling menarik untuk dicermati adalah estimasi yang dilaporkan oleh IEA (Martin dkk, 2008: 117), yang menunjukkan kemampuan paling tinggi adalah penalaran, kemudian penerapan, dan yang paling rendah adalah pengetahuan. Hal ini bertentangan dengan hasil analisis yang ditunjukkan Tabel 3, bahwa siswa Indonesia justru menemukan kesulitan pada kemampuan penerapan dan penalaran. Terdapat peluang misinterpretasi atau mistransformasi skor pada laporan Martin dkk di atas, bila hasil pada Gambar 8 dibandingkan dengan Gambar 7. Estimasi pada Gambar 7 dan 8, keduanya dihasilkan oleh program Parscale. Estimasi kemampuan yang diperoleh penulis pada Gambar 7, dari output program Parscale sebenarnya berharga negatif, yaitu -0,015 untuk pengetahuan, -0,019 untuk penerapan, dan -0,043 untuk penalaran. Urutan 21
angka ini (tanpa memperhatikan tanda minusnya) sesuai dengan urutan grafik Martin, dkk pada Gambar 8. Tetapi bila skor negatif hasil Parscale tersebut ditransformasi ke skala positif 0-100 atau 0-1000, mestinya urutannya menjadi kebalikannya seperti ditunjukkan Gambar 7. E.
Kemampuan Siswa Merespons Item Pilihan dan Uraian TIMSS 2007 menggunakan item dengan format pilihan ganda (multiple
choice) dan uraian (constructed response), dengan jumlah item secara berurutan 107 item dan 120 item. Respons item pilihan ganda terdiri dua kategori, 0 dan 1. Respons item uraian ada yang dua kategori, 0 dan 1; ada pula yang tiga kategori, 0, 1, dan 2. Dari 107 item pilihan ganda, hanya 96 item yang fit dengan siswa Indonesia; dan dari 120 item uraian, hanya 88 item yang fit dengan siswa Indonesia. Menggunakan item-item yang fit saja, estimasi kemampuan siswa Indonesia dalam merespons item uraian dan item pilihan ganda ditunjukkan Gambar 9.
50 45 40 35 30 25 20 15 10 5 0 Constructed Response
Multiple Choice
Gambar 9. Estimasi kemampuan siswa Indonesia merespons item uraian dan pilihan ganda (hasil Quest) Dari Gambar 9 terlihat bahwa estimasi kemampuan siswa Indonesia dalam
merespons
item
uraian
(constructed
response)
lebih
rendah
dibandingkan kemampuannya merespons item pilihan ganda (multiple choice). 22
Posisi estimasi kemampuan siswa Indonesia dalam merespons item uraian dibandingkan tingkat kesukaran itemnya, ditunjukkan Gambar 10 di bawah ini. Constructed Response -------------------------------------------------------------------------------------------------Item Estimates (Thresholds) 26/ 8/ 9 18:56 all on all (N =4203 L = 88 Probability Level= .50) -------------------------------------------------------------------------------------------------3.0 | | | 43 | | 8.2 | 32 | | 2.0 | 11 41 42 48 | 37 | | 6 10 24 50 | 16.2 31 56.2 X | X | 9 35 X | 3 67 1.0 X | 12 | 29 39 49 86 X | 8.1 46.2 51 52 53 55.2 71 XXX | 15 61 XX | 62 68 78.2 84 XX | 2 18 21 45 70 87 XX | 34 58 81 83 88 XXXX | 40 55.1 59.2 65 .0 XXXXXXXX | 1 17 33 66 72 XXXX | 5.2 23 56.1 XXXXXXX | 59.1 XXXXXXX | 44 77 78.1 XXXXXX | 22.2 36 64 74 80.2 82 XXXXX | 76.2 XXXXXXXX | 25 30 -1.0 XXXXXXXXXX | 47 XXXXXXXXX | 4 13 46.1 80.1 XXXXXXXXX | 5.1 16.1 19.2 22.1 27 28 60 76.1 XXXXXXXXXXXXX | 14 XXXX | 54 79 XXXXXXXXXXXXX | 26 XXXXXXXXXX | 57 73 75 XXXXX | 63 -2.0 XXXXXXXXXXXXXXXXXXXX | XXXXXXXX | 19.1 XXXXXXXXXXXXXXX | 7 | 85 XXXXXXXXXXXX | XXXXXX | 69 XXXX | 20 XXXXXXXXX | -3.0 XXXXX | XXXXX | | 38 XXX | XXXXXX | XXXX | | | -4.0 | -------------------------------------------------------------------------------------------------Each X represents 15 students
Gambar 10. Peta estimasi kemampuan (sebelah kiri) dan estimasi tingkat kesukaran item (sebelah kanan) pada item format uraian (hasil Quest) Gambar 10 menunjukkan bahwa estimasi kemampuan siswa Indonesia dalam merespons item uraian cenderung mengumpul di bawah, dengan rata23
rata estimasi sebesar -1,52 logit. Item dengan tingkat kesukaran tertinggi menurut Gambar 10 adalah item nomor 43, yaitu item S022289 dengan konten biologi dan domain kognitif penalaran. F.
Pembahasan Hasil analisis menunjukkan bahwa tidak semua item yang digunakan
dalam studi TIMSS 2007 fit dengan siswa Indonesia. Terdapat 10 item yang misfit menurut program Quest, dan 38 item misfit menurut program Parscale. Hasil
analisis
juga
menunjukkan
bahwa
hasil
estimasi
kemampuan
menggunakan seluruh item dan menggunakan item yang fit saja ternyata berbeda signifikan secara statistik. Hasil ini perlu dikonfirmasi untuk studi internasional yang lain, misalnya PISA dan PIRLS. Bila hasil analisis studi internasional yang lain menyimpulkan hal yang sama, maka di waktu mendatang, bila Indonesia mengikuti suatu studi internasional, maka estimasi kemampuan harus dilakukan menggunakan item-item yang fit saja dengan siswa Indonesia, sehingga hasil estimasinya memiliki akurasi yang dapat dipertanggungjawabkan. Analisis kemampuan sains siswa Indonesia ditinjau dari domain konten menunjukkan bahwa kemampuan rata-rata konten kimia paling rendah dibandingkan kemampuan rata-rata pada konten biologi, fisika, dan IPBA. Satu di antara sejumlah permasalahan di lapangan yang patut diduga menjadi penyebab rendahnya kemampuan rata-rata konten kimia dibandingkan yang lain adalah kualifikasi guru sains yang mayoritas berlatar belakang fisika dan biologi. Karena tidak ada guru sains yang berlatar belakang kimia, maka pembelajaran materi kimia
menjadi tidak optimal dan pada akhirnya
pemahaman siswa terhadap kimia menjadi rendah. Untuk mengatasi masalah di atas, perlu dilakukan kebijakan jangka pendek antara lain berupa pembekalan materi kimia kepada guru-guru sains SMP yang berlatar belakang fisika atau biologi. Analisis kemampuan sains siswa Indonesia ditinjau dari domain kognitif menunjukkan bahwa kemampuan rata-rata siswa paling tinggi adalah pada domain pengetahuan (knowing), sedangkan kemampuan pada domain penalaran (reasoning) dan penerapan (applying) relatif rendah. Hasil ini 24
memperkuat sinyalir Conny Semiawan, 2000; Zamroni, 2000; dan Sumarna 2004, yang menyatakan bahwa kecenderungan model pembelajaran kita adalah
memaparkan
fakta
dan
pengetahuan,
kemudian
siswa
menghafalkannya. Sementara penerapan dan penalaran belum mendapatkan perhatian yang memadai. Dibawah ini disajikan beberapa item misfit yang sudah di-release oleh IEA (2009) dan dianalisis dari berbagai sudut pandang untuk memberikan gambaran respons siswa Indonesia terhadap item-item tersebut. Soal S032693 A dan B di bawah ini mengukur domain kognitif reasoning, domain konten Biologi, dengan format constructed response.
25
Soal S032693A dan B R/CR/1/B
26
Soal S032693A direspons dengan cara menuliskan nama organisme yang ada di dalam tabel ke dalam lingkaran (ellips), sehingga bagan jaringjaring makanan menjadi lengkap dan benar. Soal tersebut masih fit dengan siswa Indonesia. Sedangkan soal S032693B meminta siswa memprediksi apa yang terjadi pada populasi hiu jika tuna banyak ditangkap sehingga menjadi langka. Respons siswa dinilai benar sempurna (kode 11) bila mengandung prediksi dan argumentasi yang komprehensif, yaitu populasi hiu akan turun sejak tak ada tuna, tetapi hiu masih dapat makan hering. Bila hiu sudah menemukan jenis makanan pengganti, maka populasi hiu akan terjaga kembali. Bila prediksi (populasi hiu turun) sudah ada tetapi argumentasinya linier, hanya dihubungkan dengan tuna, maka dinilai benar sebagian (kode 10). Ternyata proporsi respons benar siswa Indonesia untuk soal S032693B tersebut hanya 36,5%, itupun gabungan dari respons 10 dan 11. Sedangkan respons benar sempurna dengan argumentasi komprehensif (kode 11), hanya sekitar 10%. Lemahnya keterampilan memprediksi atau menerapkan pengetahuan yang telah dimiliki dalam situasi masalah yang belum terjadi juga ditunjukkan oleh siswa ketika menjawab soal S032516 di bawah ini.
27
S032516
Terjemahan soal S032516, yang dilingkari, kurang tepat. Kalimat aslinya dalam bahasa inggris: Give one possible long-term effect of their decision on the environment.
Terjemahan yang lebih tepat: Tulislah satu
dampak jangka panjang yang mungkin terjadi terhadap lingkungan akibat keputusan mereka. Kata effect pada soal bermakna dampak yang akan tejadi pada lingkungan, bukan pengaruh yang diberikan pada lingkungan.
S042011
28
Jawaban yang benar untuk pertanyaan di atas adalah suhu tubuh ratarata orang yang tinggal di kedua iklim adalah sama (kotak terbawah yang dicecklist). Proporsi jawaban benar siswa Indonesia sebesar 6,3%. Sebagian besar siswa menjawab suhu tubuh rata-rata orang yang hidup di iklim panas lebih tinggi dibandingkan suhu tubuh rata-rata orang yang hidup di iklim dingin. Hal ini menunjukkan bahwa siswa Indonesia menganggap suhu tubuh manusia bergantung suhu lingkungannya. Pada hal, suhu tubuh normal sekitar 37o C. Bila suhu tubuh jauh lebih tinggi dari suhu normal akan mengalami demam; bila suhu tubuh jauh di bawah suhu normal juga akan mengalami gangguan fungsi organ. S032555
Jawaban soal S032555 harus mendeskripsikan pengaruh jumlah pupuk yang diberikan terhadap hasil panen. Jawaban secara eksplisit harus menyebutkan rentang pemupukan yang optimum, yaitu 70-100 unit nitrogen per area. Pemupukan di atas 100 unit nitrogen per area justru akan menurunkan produktivitas hasil panen. Jawaban siswa Indonesia yang cermat hingga rentang pemupukan yang optimum tidak sampai 5%. Sekitar 10% menjawab tidak lengkap, menyatakan pengaruh pemupukan terhadap hasil panen tetapi 29
tidak menangkap batas pemupukan yang optimum atau menyebutkan batas pemupukan optimum tetapi tidak lengkap uraiannya. Sedangkan, sekitar 85% siswa Indonesia memberikan respons yang tidak jelas. S042052
Masalah yang mungkin terjadi sebagai jawaban soal S042052: polusi udara, polusi air, kepadatan penduduk, produksi sampah/limbah melimpah, dan lain-lain. Jawaban siswa dinilai correct (kode 20) bila kedua jawaban benar, bila salah satu jawaban saja yang benar jawaban dinilai partial correct (kode 10). Persentase jawaban benar (correct) siswa Indonesia untuk soal S042052 sangat rendah, yakni hanya sekitar 8,2%. Berdasarkan respons kelima soal di atas terlihat bahwa siswa Indonesia mengalami kesulitan ketika harus menjawab soal uraian, apalagi kalau jawaban itu menuntut keterampilan menganalisis, memprediksi, dan melakukan inferensi. Meskipun tidak banyak siswa Indonesia kelas VIII juga mengalami kesulitan ketika merespons soal pilihan ganda, terutama bila soal pilihan ganda tersebut
menguji
pemahaman
konsep-konsep
yang
sering
mengalami
miskonsepsi, misalnya soal S032035, S032425, S032392, dan S032141.
30
S032035
Hanya 11,4% siswa Indonesia yang menjawab benar soal S032035, yakni memilih option C, sedangkan sebagian besar memilih option A. Soal S032035 menjadi tidak fit dengan siswa kelas 8 di Indonesia, bisa jadi karena konten soal belum dikenal oleh siswa ketika mengikuti tes. Materi tentang gen, pewarisan sifat, dan penerapannya baru diajarkan di kelas 9 semester 1. Sementara, siswa lebih mengenal hubungan keluarga atau kekerabatan melalui identifikasi golongan darah, karena itu sebagian besar memilih option A. S032425
Hanya 37,6% siswa Indonesia yang menjawab benar soal S032425, yakni memilih option A. Option yang lain juga dipilih dengan persentase yang berbeda-beda. Option B dan C (volume dan bentuk) memiliki persentase pemilih paling sedikit, karena dalam kehidupan sehari-hari rambatan energi panas atau kalor memang secara jelas menyebabkan benda atau zat berubah volumenya atau bentuknya, contoh: alkohol dalam pipa termometer akan naik (volumenya bertambah) bila termometer mendapat panas dari luar atau lilin akan berubah bentuknya bila dibakar. Sedangkan, massa dan jarak antar 31
partikel adalah abstrak, tidak teramati secara nyata ketika mendapat pengaruh panas. Semakin abstrak suatu konsep, memang semakin berpeluang untuk mengalami miskonsepsi. Siswa tidak memahami bahwa perubahan volume atau wujud pada zat selalu diawali dari perubahan jarak pertikel penyusunnya, sedangkan massa zat selalu tetap karena massa tidak dapat diciptakan atau dimusnahkan. S032141 (soal belum direlease)
Tak satu pun siswa Indonesia kelas 8 mampu menjawab soal di atas dengan benar. Ketakmampuan siswa Indonesia tersebut bisa jadi karena pengetahuan tentang gravitasi cenderung dihafal atau hanya dipersepsi sebagai pengetahuan faktual. Siswa Indonesia sangat hafal bahwa percepatan gravitasi diberi notasi g dan besarnya sekitar 10 m/s2, tetapi bagaimana gaya 32
gravitasi bekerja dan berpengaruh pada sistem gerak benda di alam? Dianggap tidak penting. Siswa Indonesia mayoritas merespons item S03241 dengan memilih option B. Mereka menganggap percepatan gravitasi atau gaya gravitasi hanya bekerja ketika benda bergerak, terutama bila bergerak mendekati bumi. Hasil serupa juga terjadi ketika mahasiswa baru MIPA diberi pernyataan “Ketika benda dilempar vertikal ke atas dan mencapai titik tertinggi, maka percepatan benda di titik tertinggi tersebut adalah nol”. Sebanyak 63% dari 410 mahasiswa baru MIPA yang menjadi responden penelitian menjawab benar. Pada hal ketika ditanya kecepatan benda saat mencapai titik tertinggi, 68% responden menjawab benar, kecepatan benda nol (Wasis, 2009). Bila kecepatan benda di titik tertinggi nol dan percepatannya juga nol, mestinya benda akan selamanya diam di titik tertinggi. Faktanya, ini tidak terjadi dan mereka mengamati secara langsung
dalam
menunjukkan
kehidupan
bahwa
konsep
sehari-hari. gravitasi
Dua
hasil
dominan
penelitian
dipahami
di
atas
pada
level
pengetahuan, belum mencapai level penalaran dan penerapan. Masalah lain yang dialami oleh siswa Indonesia adalah kemampuan membaca dan menganalisis tabel dan grafik. Pada respons soal S032555 terlihat bahwa kemampuan siswa membaca tabel sangat rendah. Hanya 5% siswa yang cermat membaca data dalam tabel, kemudian berhasil merumuskan inferensi yang benar. Kemampun siswa membaca dan menganalisis grafik juga rendah. Hal ini terlihat pada respons soal nomor S042238c.
33
S042238c (soal belum direlease)
Lanjutan soal S042238c (soal belum direlease)
34
Siswa Indonesia tak satu pun mampu menjawab soal S042238c dengan benar. Berarti siswa Indonesia mengalami masalah ketika harus membaca grafik. Karena tidak mampu membaca grafik, maka tidak mampu juga menemukan informasi apa yang ada dalam grafik tersebut, apalagi menggunakan informasi tersebut untuk menjelaskan sesuatu. Membuat dan membaca grafik (graphing) merupakan salah satu keterampilan proses sains tingkat lanjut (Martin, dkk, 1997), karena itu harus dilatihkan secara sngguhsungguh dalam kegiatan pembelajaran. Analisis
lain
menunjukkan
bahwa
kemampuan
rata-rata
siswa
Indonesia dalam merespons item format uraian (constructed response) lebih rendah dibandingkan kemampuan rata-rata mereka dalam merespons item format pilihan ganda (multiple choice). Hasil ini sekaligus mengindikasikan bahwa penyebab misfit sejumlah item TIMSS 2007 bagi siswa Indonesia adalah karena rendahnya kemampuan siswa Indonesia dalam merespons item format uraian. Karena 90% item misfit yang terdeteksi oleh program Quest adalah item format uraian, dan 81,6% item misfit yang terdeteksi oleh program Parscale juga item dengan format uraian. Tentu saja, tanggapan yang seharusnya kita ambil untuk menyikapi hasil penelitian ini bukanlah meminta TIMSS untuk lebih banyak
menggunakan item
pilihan ganda
dalam
studinya, melainkan
melatihkan keterampilan menuliskan ide dan tanggapan; mengkomunikasikan dan mengaitkan berbagai topik sains, dan menerapkan konsep-konsep sains yang kompleks dan abstrak kepada siswa-siswi kita. Menurut Martin, dkk (1997) proses pembelajaran sains harus lebih banyak memberi ruang bagi siswa untuk beraktivitas, baik hands on activities maupun minds on activities, kemudian memberi kesempatan kepada mereka untuk presentasi, mengungkapkan apa yang diperoleh dan dipikirkan dalam proses membangun pengetahuan.
35
BAB V KESIMPULAN DAN REKOMENDASI
A. Kesimpulan 1. Tidak semua item yang digunakan dalam studi TIMSS 2007 fit dengan siswa Indonesia kelas VIII. Analisis menggunakan program Quest menemukan 10 item misfit, sedangkan analisis menggunaka program Parscale menemukan 38 item misfit. 2. Estimasi kemampuan menggunakan seluruh item dan menggunakan item yang fit saja, secara statistik menunjukkan perbedaan yang signifikan. 3. Ditinjau dari domain konten sains, estimasi kemampuan rata-rata siswa Indonesia
berdasarkan
studi
TIMSS
2007,
paling
rendah
adalah
kemampuan rata-rata pada konten kimia dan yang paling tinggi adalah kemampuan rata-rata pada konten IPBA (Ilmu Pengetahuan Bumi dan Antariksa). 4. Ditinjau dari domain kognitif, estimasi kemampuan rata-rata siswa Indonesia berdasarkan studi TIMSS 2007, paling tinggi adalah kemampuan rata-rata pada level pengetahuan (knowing), sedangkan kemampuan ratarata pada level penalaran (reasoning) dan penerapan (applying) lebih rendah. 5. Kemampuan rata-rata siswa Indonesia dalam merespons item format uraian (constructed response) lebih rendah dibandingkan kemampuan rataratanya dalam merespons item format pilihan ganda (multiple choice). 6. Item TIMSS 2007 format uraian yang tidak fit dengan siswa Indonesia secara umum adalah item yang menguji kemampuan analisis, prediksi, dan membuat inferensi; sedangkan item format pilihan ganda yang tidak fit dengan siswa Indonesia secara umum adalah item yang menguji miskonsepsi atau memiliki konten yang belum dipelajari oleh siswa. B.
Rekomendasi
a. Pemerintah
Indonesia
harus
merumuskan
langkah
strategis
untuk
meningkatkan kualitas pembelajaran sains, apalagi yang berkaitan dengan 36
konten kimia. Karena menurut hasil penelitian ini, kemampuan rata-rata siswa Indonesia pada konten kimia paling rendah dibandingkan pada konten lain. Langkah strategis tersebut berkaitan dengan: (i) analisis kurikulum (apakah substansi kimia dalam kurikulum IPA SMP sudah mencakup materi-materi esensial sesuai dengan lingkup kimia dalam studi TIMSS?), (ii) kompetensi guru (apakah guru IPA SMP yang umumnya berlatar belakang fisika dan biologi, sudah membelajarkan kimia secara optimal? Bila belum, perlu diberikan pembekalan substansi kimia kepada guru IPA SMP). b. Kegiatan pembelajaran harus memberikan ruang yang lebih luas lagi bagi siswa untuk melakukan proses menalar dan menerapkan dibandingkan mengumpulkan
pengetahuan
semata.
Keterampilan
memprediksi,
melakukan inferensi, menganalisis, membuat dan membaca grafik, harus dilatihkan secara sungguh-sungguh dan terus-menerus dalam kegiatan pembelajaran. Karena keterampilan-keterampilan tersebut berdasarkan data TIMSS 2007 belum dikuasai oleh siswa Indonesia. c.
Khusus pada aspek penilaian, secara nasional (dengan dimotori oleh Puspendik, LPMP, dan LPTK) perlu dikondisikan penggunaan item-item yang mampu mengukur kemampuan kognitif level penalaran dan penerapan pada semua jenis penilaian (formatif, sumatif, dan ujian nasional). Secara khusus perlu diberikan kemudahan bagi guru untuk meningkatkan kemampuannya dalam mengembangkan item yang bermutu, misalnya melalui pelatihan atau penyediaan contoh-contoh soal yang bermutu oleh puspendik, LPMP, atau LPTK yang dapat diakses dengan mudah oleh guru.
d. Juga perlu digalakkan penggunaan format item uraian, terutama dalam penilaian formatif dan sumatif, karena berdasarkan hasil penelitian ini kemampuan rata-rata siswa Indonesia dalam merespons item format uraian (constructed response) lebih rendah dibandingkan kemampuan rataratanya dalam merespons item format pilihan ganda (multiple choice).
37
DAFTAR PUSTAKA Adams, R. J., & Khoo, S. T. (1996). Quest (program komputer). The interactive test analysis system. Victoria: ACER. Conny Semiawan. 2000. Relevansi Kurikulum Pendidikan Masa Depan dalam Sindhunata (Ed) Membuka masa depan anak-anak kita. pp:19-31. Jogjakarta:Penerbit Kanisius. Druxes, H. (1986). Kompendium didaktik fisika. Bandung: CV Remaja Karya. du Toit, M. (2003). IRT from SSI: Bilog-MG multilog parscale testfact. Chicago: Scientific Software International. Martin, M.O., Mullis, I.V.S., Gonzalez, E.J., dan Chrostowski, S.J. (2004). Findings from IEA’s trends in international mathematics and science study at the fourth and eighth grades. Boston College, Chestnut Hill: TIMSS & PIRLS International Study Center. Martin, R., Sexton, C., Wagner, K., dan Gerlovich, J. (1997). Teaching science for all children. Second edition. Needham Heights, Massachusetts: Allyn and Bacon. Mullis, I.V.S., Martin, M.O., Ruddock, G.J., O’Sullivan, C.Y., Arora, A., dan Erberber, E. (2005). TIMSS 2007 Assessment frameworks. Boston College, Chestnut Hill: TIMSS & PIRLS International Study Center. Muraki, E., & Bock, R. D. (1998). Parscale. IRT item analysis and test scoring for ratingscale data. Chicago: Scientific Software International. Peraturan Menteri Pendidikan Nasional Republik Indonesia (2006). Peraturan menteri pendidikan nasional Republik Indonesia nomor 22 tahun 2006 tentang standar isi untuk satuan pendidikan dasar dan menengah. Shiddiq, M. (Mei 2006). Potret pendidikan Indonesia antara konsep, reality dan solusi. Makalah disampaikan dalam Seminar Nasional tanggal 7 Mei 2006 diselenggarakan oleh Forum Ukhuwah dan Studi Islam (FUSI) Universitas Negeri Malang. Singgih Santoso. (2001). Mengolah data statistik secara profesional. SPSS versi 10. Jakarta: Elex Media Komputindo. Sumarna. S. 2004. Peningkatan pendidikan MIPA dalam master plan pendidikan Indonesia 2005-2009. Makalah disampaikan dalam Seminar Nasional Penelitian, Pendidikan, dan Penerapan MIPA tanggal 2 Agustus 2004, kerjasama FMIPA UNY, Ditjen Dikti Depdiknas, dan IMSTEP-JICA. Tolman, M. N., & Hardy, G. R. (1995). Discovering elementery science: Method, content, and problem-solving activities. Boston: Allyn and Bacon. Wasis (2009). Model penskoran partial credit pada item multiple true-false bidang fisika. Disertasi, tidak diterbitkan. Yogyakarta: Universitas Negeri Yogyakarta. Wright, B. D., & Masters, G. N. (1982). Rating scale analysis. Chicago: Mesa Press. Zamroni. (2000). Paradigma pendidikan pasa depan. Yogyakarta: Bigraf Publisi.
38