0,7) Jumlah
Tes tipe A No item Jml 0 (0%) 5,6
Tes tipe B No item Jml 0 (0%)
2 (33%)
2,3,5
3 (50%)
1,2,3,4 4 (67%) commit to user 6
1,4,6
3 (50%) 6
55 digilib.uns.ac.id
perpustakaan.uns.ac.id
Berdasarkan tabel 4.12, untuk paket tes A terdapat 7% soal dalam katagori mudah, 13% soal dalam katagori sedang, dan 80% soal dalam katagori sulit. Pada item paket tes B terdapat 13 % soal dalam katagori mudah, 47% soal dalam katagori sedang, dan 40% soal dalam katagori sulit. Dibandingkan dengan tabel 4.13 untuk soal essay tidak jauh berbeda dengan soal pilihan ganda. Untuk soal A tidak terdapat soal dalam katagori mudah, 33% dalam katagori sedang, dan 67% masuk dalam katagori sulit. Sedangkat soal B juga tidak terdapat soal dalam katagori mudah, 50% dalam katagori sedang, serta 50% dalam katagori sulit.
Kategori Rendah (<0,0 – 0,20) Sedang (0,200,40) Tinggi (0,401,00) Jumlah
Kategori Rendah (<0,0 – 0,20) Sedang (0,200,40) Tinggi (0,401,00) Jumlah
Tabel 4.14 Daya Beda Item Tes Uji Coba 1 Pilihan Ganda Tes tipe A Tes tipe B Keterangan No item Jumlah No item Jumlah Ditolak 1, 3, 6, 7, 11 5 (33%) 6, 8, 13 3(20%) A (33%) B (20%) 2, 8, 12 3 (20%) 14 1 (7%) Diterima A (67%) B (80%) 4, 5, 9, 10, 7 (47%) 1, 2, 3, 4, 11 13, 14, 15 5, 7, 9, 10, (73%) 11, 12, 15 15 15 Tabel 4.15. Daya Beda Item Tes Uji Coba 1 Essay Tes tipe A Tes tipe B Keterangan No item Jumlah No item Jumlah Ditolak 2,4,6 3 (50%) 2 1(17%) A (50%) B (17%) 3 1 (17%) 1,3,5 3 (50%) Diterima A (50%) B (83%) 1,5 2 (33%) 4,6 2 (33%)
6 commit to user
6
56 digilib.uns.ac.id
perpustakaan.uns.ac.id
Berdasarkan tabel 4.14, pada paket tes A terdapat 33% termasuk dalam katagori rendah, 20 % katagori sedang, serta 47% termasuk dalam katagori tinggi. Pada paket tes B terdapat terdapat 20% soal dalam katagori rendah, 7% katagori sedang, serta 73% soal masuk dalam katagori tinggi. Hal ini menunjukkan soal pilihan ganda tipe B lebih banyak diterima daripada soal pilihan ganda tipe A. Pada tabel 4.15, daya beda pada soal essay yang diterima terdiri atas 83% soal B diterima, 50% soal A diterima. Tabel 4.16. Efektifitas distraktor Item Tes Uji Coba 1 Pilihan Ganda Distraktor yang berfungsi 4 3 2
10 4 2,5,6,9,14
1 (7%) 1 (7%) 5 (33%)
1 0
8,12,13,15 1,3,7,11
4 (27%) 4 (27%)
Jumlah
Tes tipe A No item Jumlah
Tes tipe B No item Jumlah 7,13 4,5,6,8,9,11, 12,14,15 1,2,3,10 -
15
Keterangan
0 (0%) 2 (13%) 9 (60%)
Baik Baik Baik
4 (27%) 0 (0%)
Tidak baik Tidak baik
15
Pada tabel 4.16 dapat dilihat bahwa paket tes A memiliki 47% item soal yang distraktornya berfungsi baik. Sedangkan 27 % yang distraktornya hanya 1 yang berfungsi, dan 27% distraktornya tidak berfungsi.Pada paket tes B distraktor yang berfungsi baik berkisar 73% sedangkan yang tidak baik hanya 27%.Secara keseluruhan berdasarkan efektifitas distraktor, soal yang termasuk dalam katagori tidak baik perlu direvisi
.
commit to user
57 digilib.uns.ac.id
perpustakaan.uns.ac.id
Tabel 4.17. Kesimpulan Uji Coba 1 Pilihan Ganda Dan Essay
Kategori Diterima
Pilihan Ganda Tes tipe A Tes tipe B Nomor item Jumlah Nomor item Jumlah 2, 4, 5, 9, 10, 4, 5, 7, 9, 11, 6 (40%) 8 (53%) 14 12,14,15
Direvisi
6,8,12,13,15
5 (33%)
1,2,3,6,8,10,13
7 (47%)
Ditolak
1, 3, 7, 11
4 (27%)
-
0 (0%)
Jumlah Kategori Diterima
15 Essay Tes tipe A Nomor item Jumlah 3,1,5 3 (50%)
15 Tes tipe B Nomor item Jumlah 1,3,5,4,6 5 (83%)
Direvisi
-
0 (0%)
-
0
Ditolak
2,4,6
3 (50%)
2
1 (17%)
BJumlah
6
6
Berdasarkan hasil analisis untuk tingkat kesukaran, daya beda dan efektifitas distraktor menggunakan program ITEMAN versi 3,00, diperoleh kesimpulan penerimaan item tes pada uji coba instrumen tes yang disajikan dalam Tabel 4.17. Hasil analisis uji kemampuan berpikir tingkat tinggisiswa SMA menggunakan program ITEMAN versi 3,00 dan Microsoft Excel berdasarkan tingkat kesukaran, daya beda, dan efektifitas distraktor maka kualitas antara soal tipe A dan soal tipe B hampir setara. 5. Uji Coba Lapangan Uji coba lapangan dilakukan pada 25 siswa pada lima sekolah. Siswa pada uji coba lapangan diminta untuk mengerjakan soal dan hasilnya dianalisis untuk melihat validitas, reliabilitas, daya beda, efektifitas distraktor dan tingkat kesukaran butir soal yang dikembangkan. Menurut Arikunto (2007) menyebutkan bahwa sebuah tes yang baik harus memiliki persyaratan kualitas tes, yaitu memiliki validitas, reliabilitas, objektivitas dan praktibilitas. Hasil uji commit to user validitas dan reliabilitas instrumen dengan menggunakan program QUEST
58 digilib.uns.ac.id
perpustakaan.uns.ac.id
yang secara otomatis akan memberikan nilai reliabilitas soal, daya beda, taraf kesukaran dan keefektifan pengecoh. Jumlah item soal adalah 25 pilihan ganda dan 5 essay. a) Validitas Validitas pada uji lapangan ini dilihat dari pengujian goodness of fit untuk tes secara keseluruhan maupun tiap item, pengujian penetapan fit atau tidek fit setip item soal dengan Model Rasch mengikuti kaidah Adam dan Khoo (1996), nilai nya dapat dilighat dari nilai INFIT MNSQ pada hasil output program Quest
Tabel 4.18 Kecocokan Item Soal Uji Coba lapangan Kategori INFIT MNSQ > 1,30 0,77 INFIT MNSQ 1,30 INFIT MNSQ < 0,77
SMAN A
SMAN B
-
-
SMAN C 1 Soal
SMAN D
SMAN E
-
-
(item 28) 30
30
29
30
30
-
-
-
-
-
Kesimpulan
Belum fit denagn model Rasch Fit dengan model Rasch Belum fit denagn model Rasch
b) Reliabilitas Reliabilitas adalah ketetapan suatu alat evaluasi. Tes atau alat evaluasi dikatakan reliabel jika hasilnya dipercaya, konsisten dan stabil. Reliabilitas seringkali disebut dngan drajat konsistensi (keajegan). Selain untuk menguji kecocokan, Pengujian reliabilitas juga bisa dilakukan dengan menggunakan program Quest yang secara otomatis nilai ditampilkan. Pada Lembar Hasil Quest dapat dilihat pada Summary Of Item Estimates- Reliability of estimate. Untuk detailnya kami sajikan dalam Tabel berikut.
commit to user
59 digilib.uns.ac.id
perpustakaan.uns.ac.id
Tabel 4.19 Reliabititas Item Uji Coba lapangan Kategori
SMAN A
SMAN B
SMAN C
SMAN D
SMAN E
0,80-1,00
Sangat Tinggi
0,60-0,79 0,40-0,59
Tafsiran
0,70 0,54
0,60
0,63
0,51
Tinggi Cukup
0,20-0,39
Rendah
0,00-0,19
Sangat rendah
Pada Tabel diatas reliabilitas soal paling rendah adalah di SMAN C dengan r = 0,51 artinya drajat konsistensi termasuk dalam katagori cukup. Pada SMAN B mempunyai nilai reliabilitas yang paling tinggi di antara sekolah yang lain, yaitu r = 0,70 termasuk dalam katagori tinggi. Secara keseluruhan tingkat keajegan hasil pengujian soal pada 5 sekolah diatas sudah baik.
c) Daya Beda Daya beda adalah kemampuan suatu instrument evaluasi untuk membedakan siswa yang termasuk kelompok berkemampuan tinggi dengan siswa berkemampuan rendah berdasarkan kriteria tertentu. Pada program Quest daya beda bisa dilihat dari nilai point biserial. Semakin tinggi nilai biserial maka semakin tinggi daya beda butir soal tersebut, artinya semakin tinggi kemampuan butir soal tersebut untuk membedakan siswa yang berkemampuan tinggi dan berkemampuan rendah.
commit to user
60 digilib.uns.ac.id
perpustakaan.uns.ac.id
Tabel 4.20 Daya Beda Item Uji Coba Lapangan Pilihan Ganda SMA A Kategori Kurang (0,00 – 0,19)
Cukup (0,200,39)
Baik (0,400,69)
Sangat Baik (0,701,00)
SMA B
No item
Jml
No item
-
(0%)
-
13 (52%)
1267 911 1315 1719
345 911 12 16 17 18 19 20 21 25 126 78 10 13 14 15 22 23 24
-
Jumlah
SMA C
SMA D
Jml
No item
-
(0%)
10 (40 %)
3568 1014 2021 23
12 (48%)
3458 1214 1618 2324
(0%)
1020 21 2225
Rata -rata
Jml
Jml
-
(0%)
-
(0%)
0%
9 (36%)
612 1920 2124 25
7 (28%)
28 1314 1819 2425
8 (32%)
37,6 %
10 (40 %)
1247 911 1315 1618 1922 24
13 (52%)
1234 5789 1011 1314 1516 1718 2223
18 (72%)
1346 7910 1112 1516 1720 2122
15 (60%)
54%
5 (20 %)
1217 25
3 (12%)
-
(0%)
5,23
2 (8%)
8%
(0%)
25
SMA E No Item
Jml
No item
25
25
25
25
Tabel 4.21 Daya Beda Item Uji Coba Lapangan Essay SMA A Kategori
No item
Kurang (0,00 – 0,19)
SMA B
Jml
No item
-
(0%)
Cukup (0,200,39)
345
Baik (0,400,69) Sangat Baik (0,701,00) Jumlah
SMA C
Jml
No item
-
(0%)
3 (60%)
23
12
2 (40%)
-
(0%)
5
SMA D
Jml
No item
-
(0%)
2 (40%)
12
145
3 (60%)
-
(0%)
SMA E
Ratarata
Jml
No Item
Jml
-
(0%)
-
(0%)
0%
2 (40%)
23
2 (40%)
354
3 (60%)
48 %
345
3 (60%)
145
3 (60%)
12
2 (40%)
52 %
-
(0%)
-
(0%)
-
(0%)
0%
5
commit to user
5
5
5
61 digilib.uns.ac.id
perpustakaan.uns.ac.id
Berdasarkan Tabel 4.20, pada uji coba lapangan pilihan ganda terdapat 37,6% termasuk dalam katagori cukup, 54% katagori baik, serta 8% termasuk dalam katagori sangat baik. Jumlah soal yang masuk pada kategori cukup (0,20-0,39) berkisar antara 7-13 item soal yang relatif berbeda pada setiap sekolahnya. Artinya item soal yang masuk dalam kategori cukup di satu sekolah belum tentu juga masuk dalam kategori cukup di sekolah lainnya. Jumlah soal yang masuk pada kategori baik (0,40-0,69) berkisar antara 10-18 item soal sedangkan soal yang masuk dalam katagori sangat baik (0,70-1,00) berkisar 3-5 item soal. Pada Tabel 4.21 daya beda item uji lapangan dengan soal essay rata-rata di setiap sekolah 48% item soal masuk dalam katagori cukup (0,20-0,39) sedangkan 52% item soal masuk dalam katagori baik (0,40-0,69). Hal ini menunjukkan rata-rata di setiap sekolah item soal dapat diterima dilihat dari daya beda. d) Tingkat Kesukaran Tingkat kesukaran adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran berkisar 0,00-1,00. Semakin besar indeks tingkat kesukaran yang diperoleh berarti semakin mudah soal tersebut, analisis terhadap tingkat kesukaran butir soal dalam penelitian ini ditinjau dari nilai percent pada tabel hasil analisis per item soal.
commit to user
62 digilib.uns.ac.id
perpustakaan.uns.ac.id
Tabel 4.22 Tingkat Kesukaran Item Uji Coba Lapangan Pilihan Ganda SMA A No Jml item (0%)
SMA B No Jml item 2 23,24 (8%)
Sedang (0,30-0,69)
1,2,3, 6,7,9, 13,14 1718, 19,20 22,23 24
15 (60%)
1,2,3, 4,6,7, 9,13,1 5,16,1 8, 19,20, 22
Sulit (0,00-0,29)
4,5,8, 10,11 12,15 16,21 25
10 (40%)
5,8,10 ,11,12 ,14,17 ,21,25
Kategori Mudah (0,70-1,00)
Jumlah
25
SMA C No Jml item -
SMA D No Jml item
- (0%)
-
14 (56%)
1,3,6, 7,8,9, 11,13, 16,18, 19,20, 22, 23,24
9 (36%)
2,4,5, 10,12, 14,15, 17,21, 25
25
SMA E No Jml Item
RataRata
- (0%)
-
- (0%)
1,6 %
15 (60%)
1,2,3, 6,7,9, 13,16, 18,19, 20,22, 23, 24
14 (56%)
1,2,3, 6,7,8, 9,13,1 6,18,1 9,20,2 2,23,2 4
15 (60%)
58,4 %
10 (40%)
4,5,8, 10,11, 12,14, 15,17, 21,25
11 (44%)
4,5,10 ,11,12 ,14,15 ,17,21 25
10 (40%)
40%
25
125
25
25
Tabel 4.23 Tingkat Kesukaran Item Uji Coba Lapangan Essay Kategori Mudah (0,70-1,00)
SMA A No item Jml (0%)
SMA B No item Jml
SMA C No item Jml
SMA D No item Jml
SMA E No Item Jml
RataRata
-
- (0%)
-
- (0%)
-
- (0%)
-
- (0%)
0%
Sedang (0,30-0,69)
1,2
2 (40%)
1,2
2 (40%)
1,2
2 (40%)
1,2
2 (40%)
1,2
2 (40%)
40%
Sulit (0,00-0,29)
3,4,5
3 (60%)
3,4,5
3 (60%)
3,4,5
3 (60%)
3,4,5
3 (60%)
3,4,5
3 (60%)
60%
5
25
Jumlah
5
5
5
5
Berdasarkan Tabel 4.22, untuk tingkat kesukaran item soal pilihan ganda pada uji lapangan terdapat 1,6% soal dalam katagori mudah, 58,4% soal dalam katagori sedang, dan 40% soal dalam katagori sulit. Di SMA B terdapat dua item soal (nomor 23 dan 24) yang masuk katagori mudah yang tidak termasuk pada sekolah lain. Artinya pada SMA B tingkat kualitas soal yang dianggap susah bagi sekolah yang lain termasuk soal yang normal di SMA B yang hanya 9 soal yang masuk dalam katagori sulit. Hal ini mendorong peneliti berasumsi bahwa kualitas siswa di SMA B sedikit lebih baik dibandingkan dengan SMA lainnya. Pada item soal Essay sebagaimana di jabarkan dalam Tabel 4.23 commit to user
63 digilib.uns.ac.id
perpustakaan.uns.ac.id
secara keseluruhan hampir sama yaitu rata-rata tingkat kesukaran soal 40% masuk dalam katagori sedang dan 60% masuk dalam katagori sulit. Perihal ini dianalisis sebagai akibat dari pertanyaan yang termasuk dalam ranah metakognisi siswa.
e) Efektifitas distraktor Analisis terhadap efisiensi distraktor dilihat dari keragaman jawaban dari katagori yang dipilih. Distraktor dikatakan berfungsi dengan baik apabila setiap katagori terisi. Jika setiap katagori tersebut dipilih oleh siswa berarti distraktor tersebut dipilih oleh siswa yang berkemampuan rendah. Tabel 4.24 Efektifitas Distraktor Item Uji Coba Lapangan Pilihan Ganda Distraktor yang berfungsi
4 (Baik)
3 (Baik)
SMA A No Jml item 1,2,4, 7,10, 11,13, 14,15, 14 16,17, 21,22, 24
3,5,6, 9,12,1 8,19,2 3, 25
SMA B No Jml item
5,13, 16, 24
SMA C No Jml item
SMA D No Jml item
SMA D No Jml Item
Ratarata
11
1,2,4, 5,8.10 ,11,12 ,13,14 16,17, 19,21
14
41,6%
6
40,8%
9
9,10, 11,12, 13,15, 16,18, 19,22, 24
17
3,5,7, 9, 13,19, 22,23, 24
9
1,4,5, 6,7,8, 14,21, 23,25
10
7,9,15 , 22,24, 25
7
2,3,17 , 20
4
3,6,18 , 23
4
16%
4
2,4,8, 10,12, 14,16, 18,21
9
1,2,3 ,7,8, 9,10, 11,1 2,14, 17, 18, 19,2 0,21, 22,2 3
3
1,6,11 , 15,17, 20,25
2 (Baik)
8,20
2
4,15, 25
1 (Tidak Baik)
-
-
6
1
-
-
-
-
20
1
1,6%
0 (Tidat Baik)
-
-
-
-
-
-
-
-
-
-
0%
Jumlah
25
25
25
commit to user
25
25
64 digilib.uns.ac.id
perpustakaan.uns.ac.id
Pada Tabel 4.24 dapat dilihat bahwa rata-rata 41% item soal yang 4 distraktornya berfungsi baik. 40,8% yang 3 distraktornya berfungsi baik, dan 16% yang 2 distraktornya berfungsi dengan baik. Sedangkan 1,6 % distraktor yang berfungsi hanya 1, rata rata keseluruhan hampir di setiap SMA di atas mempunyai distraktor yang baik. Berdasarkan hasil analisis dari reliabilitas, daya beda, tingkat kesukaran dan efektifitas distraktor menggunakan program Quest maka diperoleh kesimpulan penerimaan item tes pada uji coba lapangan instrument tes high order thinking skills pada 5 sekolah di Surakarta secara keseluruhan hampir diterima di semua SMA N di Surakarta sedangkan yang direvisi hanya 1,6% yang terdiri dari 2 item soal. Untuk lebih detail dapat dilihat pada Tabel 4.25 di bawah ini. Tabel 4.25 Kesimpulan Item Uji Coba Lapangan Pilihan Ganda Kategori
SMA A No Jml item
Diterima
1-25
25
Direvisi
-
-
Ditolak
-
-
Jumlah
SMA B No Jml item
SMA C No Jml item
SMA D No Jml item
SMA E No Jml Item
Ratarata
23
1-25
25
1-25
25
1-25
25
98,4%
23,24
2
-
-
-
-
-
-
1,6%
-
-
-
-
-
-
-
-
-
1-22, dan 25
25
25
25
25
25
Tabel 4.26 Kesimpulan Item Uji Coba Lapangan Essay Kategori
SMA A No Jml item
SMA B No Jml item
SMA C No Jml item
SMA D No Jml item
Diterima
1-5
5
1-5
5
1-5
5
1-5
Direvisi
-
-
-
-
-
-
Ditolak
-
-
-
-
-
-
Jumlah
25
25
25
commit to user
SMA E
Rata-rata
No Item
Jml
5
1-5
5
100%
-
-
-
-
-
-
-
-
-
-
25
25
65 digilib.uns.ac.id
perpustakaan.uns.ac.id
6. Revisi Produk Akhir (Revisi III) Revisi III dilakukan berdasarkan hasil diperoleh dari uji lapangan. Setelah revisi dan penyempurnaan dilakukan, maka akan diperoleh produk berupa Instrumen Penilaian Kemampuan Berpikir Tingkat Tinggi Siswa yang disertai dengan kisi-kisi instrumen evaluasi, lembar soal, lembar jawaban, kunci jawaban dan rubrik penilaian. Hasil revisi produk ketiga merupakan produk akhir yang layak karena telah melalui tahap validasi dan uji lapangan. B. Pembahasan 1. Karakteristik Produk Instrumen Penilaian untuk Mengukur Kemampuan Berpikir Tingkat Tinggi Siswa Kemampuan Berpikir Tingkat Tinggi (High Order Thinking Skills) adalah kemampuan yang terjadi ketika seseorang mengambil informasi baru dan informasi yang telah tersimpan di dalam ingatannya, selanjutnya dikombinasikan sehingga saling berhubungan untuk mencapai suatu tujuan atau menemukan jawaban dalam situasi yang membingungkan (Lewis dan Smith, 2001). Penerapan yang sukses dari kemampuan berpikir tingkat tinggi terjadi ketika siswa berhasil menjelaskan, memutuskan, menunjukkan, dan menghasilkan penyelesaian masalah dalam konteks pengetahuan dan pengalaman (King, et al, 2010). Kemampuan berpikir tingkat tinggi di dasarkan pada konsep domain kognitif Taksonomi Bloom (2001), kemampuan yang melibatkan analisis, evaluatif
dan
menciptakan. Anderson dan
Krathwohl (2001) menyatakan bahwa indikator ketrampilan berpikir tingkat tinggi penting untuk dikembangkan disekolah, hal ini karena tuntutan penguasaan ketrampilan berpikir tingkat tinggi dengan standar kompetensi lulusan. Siswa diharapkan dapat membangun dan menerapkan pengetahuan secara logis, kreatif, kritis dan inovatif; hal ini ditunjukkan dengan pengambilan keputusan serta menunjukkan kemampuan menganalisis dan memecahkan masalah (Permendiknas No.23 Tahun 2006). Penguasaan ketrampilan berpikir tingkat tinggi membutuhkan penilaian commit to user yang jelas dan valid, tetapi dalam pengembangan penilaian belum banyak
66 digilib.uns.ac.id
perpustakaan.uns.ac.id
dilakukan oleh praktisi pendidikan. Penilaian formatif yang terdapat di sekolah hanya sedikit memberikan kesempatan siswa untuk mengembangkan pengetahuan lebih mendalam (Cullinane, 2011). Alternatif penilaian yang mampu mengukur kemampuan berpikir tingkat tinggi siswa dibutuhkan oleh guru di sekolah. Salah satu cara nya adalah mengembangkan penilaian berupa soal berpikir tingkat tinggi dengan memuat kasus pada setiap soalnya. Ahli materi adalah ahli pada sistem reproduksi. Tujuan dari validasi adalah menjamin tentang validasi isi yang dikembangkan agar tidak terjadi kesalahan konsep. Validator selanjutnya adalah ahli evaluasi dengan tujuan memvaliditas konstruk instrumen penilaian yang dikembangkan sehingga dapat memberdayakan kemampuan berpikir tingkat tinggi. Praktisi pendidikan adalah guru senior yang ada di sekolah, yaitu dua guru SMA IT Nur Hidayah. Hasil dari validator dilakukan revisi sebelum diterapkan ke sekolah. Saran dari validator antara lain memperbaiki tata penulisan, kebenaran konsep. Saran dari validator diperbaiki sebelum dilakukan uji coba lapangan awal. Uji coba lapangan digunakan untuk mendapatkan revisi dan dilakukan perbaikan selanjutnya. Uji coba lapangan bertujuan untuk mendapatkan produk instrumen penilaian
yang baik meliputi, valid, reliabel serta praktis
(Arikunto,2007). Hasil uji coba lapangan mendapatkan kesimpulan bahwa penilaian kemampuan berpikir tingkat tinggi siswa memiliki validitas dan reliabilitas baik, memiliki taraf kesukatan soal dengan proporsi 1,6% mudah, 58,4% sedang dan 40% sukar untuk soal pilihan ganda dan 0% mudah, 50% sedang dan 50% sukar untu soal essay, memiliki daya pembeda soal dengan interpretasi minimal cukup dan memiliki kepraktisan soal evaluasi yang baik. Instrumen
Penilaian
Kemampuan
berpikir
tingkat
tinggi
siswa
berdasarkan indikator dari Anderson dan Krathwohl, 2001 yaitu memiliki kemampuan berpikir tingkat tinggi, memiliki validitas dan reliabilitas minimal cukup, memiliki taraf kesukatan soal dengan proporsi 30% mudah, 53% sedang dan 17% sukar, memiliki daya pembeda soal dengan interpretasi minimal cukup dan memiliki kepraktisan soal tes yang baik. commit to user
67 digilib.uns.ac.id
perpustakaan.uns.ac.id
Produk berupa soal tes dapat digunakan untuk memberdayakan kemampuan berpikir tingkat tinggi. Penggunaan produk mampu memberikan stimulus atau rangsangan dari siswa dan tanggapan terhadap adanya rangsangan adalah respon siswa dalam menjawab dengan memilih pilihan yang telah disediakan. 2. Kelayakan Produk Instrumen Penilaian untuk Mengukur Kemampuan Berpikir Tingkat Tinggi Siswa Produk instrumen penilaian ini secara keseluruhan menekankan pada proses pembelajaran sampai dengan pengujian hasil proses pembelajaran berupa alat evaluasi tentang pemahaman soal dari kasus yang di tampilkan sehingga layak apabila konsep produk ini diterapkan (Assessment Reform Group, 2002) Instrumen penilaian untuk mengukur kemampuan berpikir tingkat tinggi siswa pada KD 2.1 Menganalisis hubungan antara struktur jaringan penyusun organ reproduksi dengan fungsinya dalam proses reproduksi manusia melalui studi literatur, pengamatan, percobaan, dan stimulasi., bertujuan untuk membantu guru mempersiapkan soal
yang mampu
memberdayakan kemampuan berpikir tingkat tinggi. Instrumen penilaian yang baik adalah memiliki validitas, reliabilitas dan kepraktisan. Validitas instrumen penilaian untuk mengukur kemampuan berpikir tingkat tinggi siswa dijamin melalui validitas isi dan konstruk yang telah divalidasi oleh ahli evaluasi, materi dan praktisi. Validasi juga dilakukan oleh guru pengguna atau guru senior. Validitas isi dilakukan agar produk pengembangan tidak memiliki kesalahan konsep. Validitas konstruk dilakukan untuk menjamin instrumen penilaian mampu memberdayakan kemampuan berpikir tingkat tinggi siswa. Validasi guru senior atau guru pengguna dilakukan untuk kelayakan dari instrumen penilaian. Pengujian pada instrumen penilaian dilakukan secara bertahap kepada guru senior atau guru pengguna. Hasil penilaian produk oleh ahli evaluasi, ahli materi dan praktisi diperoleh bahwa produk pengembangan instrumen penilaian untuk mengukur commit to user
68 digilib.uns.ac.id
perpustakaan.uns.ac.id
kemampuan berpikir tingkat tinggi siswa termasuk pada kategori baik dan layak digunakan. Rincian hasil penilaian dapat dijelasksn sebagai berikut : a.
Produk pengembangan instrumen penilaian dinilai oleh ahli evaluasi dengan skor
93,11 %. Berdasarkan hasil penilaian dapat disimpulkan
bahwa instrumen penilaian untuk mengukur kemampuan berpikir tingkat tinggi siswa dapat diimplementasikan dalam pembelajaran di kelas dengan kategori baik. b.
Produk pengembangan instrumen evaluasi dinilai oleh ahli materi dengan skor 96,65%. Berdasarkan hasil penilaian dapat disimpulkan bahwa instrumen penilaian untuk mengukur kemampuan berpikir tingkat tinggi siswa dapat diimplementasikan dalam pembelajaran di kelas dengan kategori sangat baik
c.
Produk pengembangan instrumen penilaian dinilai oleh praktisi 95,71%. Berdasarkan hasil penilaian dapat disimpulkan bahwa instrumen penilaian untuk mengukur kemampuan berpikir tingkat tinggi siswa dapat diimplementasikan dalam pembelajaran di kelas dengan kategori baik.
d.
Tahap mengujikan soal dilapangan dengan 25 siswa di setiap SMA di Surakarta. bertujuan untuk menguji validitas, reliabilitas, daya pembeda, tingkat kesukaran soal yang dikembangkan. Hasil analisis soal menunjukkan bahwa soal yang dikembangkan termasuk kategori baik. Butir soal memiliki validitas dengan interpretasi minimal cukup, reliabilitas baik, tingkat kesukaran soal dengan proporsi 1,6% mudah, 58,4% sedang dan 40% sukar untuk soal pilihan ganda dan 0% mudah, 50% sedang dan 50% sukar untu soal essay. Daya pembeda soal dengan interpretasi minimal cukup, serta tingkat kepraktisan soal yang baik.
e. Validitas eksternal dapat dilihat dari soal tipe higher order thinking skills yang sudah ada kemudian dibandingkan dengan soal higher order thinking skills yang dibuat secara keseluruhan tingkat pengukurannya baik, dan dari segi similarity hampir sama. Yang menjadi perbedaan mendasar adalah pada saat analisis pembuatan soal. Produk yang dibuat sebelum di to user validasi, dianalisis secara commit mendalam dengan melihat aspek-aspek dalam
69 digilib.uns.ac.id
perpustakaan.uns.ac.id
dimensi pengetahuan dan aspek-aspek dalam dimensi proses kognitif. Kemudian produk dibuat mencakupi dimensi pengetahuan faktual, konseptual, prosedural, dan metakognisi, serta mencakupi dimensi proses kognitif Higher Order Thinking Skills berdasarkan Taksonomi Bloom, yaitu : menganalisis, mengevaluasi, dan mencipta Berdasarkan hasil validasi secara keseluruhan dapat disimpulkan bahwa
produk
pengembangan
Instrumen
penilaian
untuk
mengukur
kemampuan berpikir tingkat tinggi siswa telah layak untuk diimplementasikan di lapangan.
3. Profil Skor Produk Penilaian Untuk mengukur Kemampuan Berpikir Tingkat Tinggi Siswa Pembentukan kebenaran fakta dari data yang telah dianalisis dengan menggunakan program Quest selanjutnya dibutuhkan profil agar data yang telah di analisis dapat dilihat dalam bentuk yang berbeda. profil memiliki prinsip bahwa setiap proporsi yang disajikan memiliki makna jika proporsi tersebut bisa di uji dengan pengamatan. Profil lebih bersifat logis yang banyak digunakan dalam karya ilmiah. Hasil dari profil untuk mengukur kemampuan berpikir tingkat tinggi dapat dilihat pada tabel di bawah ini. Tabel 4.27. Hasil Analisis Skor Kemampuan Berpikir Tingkat Tinggi Siswa Di SMA Negeri Di Surakarta Materi Sistem Reproduksi Sekolah Jumlah Siswa Skor SMA N 2 Ska
30
60,26
SMA N 3 Ska
26
71.61
SMA N 4 Ska
25
65,46
SMA N 6 Ska
25
66.03
SMA N 7 Ska
27
63.69
Jumlah
133
65,41
commit to user
70 digilib.uns.ac.id
perpustakaan.uns.ac.id
Berdasarkan Tabel 4.27 hasil analisis skor di setiap sekolah yang ada di surakarta dengan jumlah siswa sebanyak 133 orang siswa di SMA secara urut adalah SMA N 3 dengan skor tingkat kemampuan berpikir tingkat tinggi mencapai 71,61, kemudian dilanjutkan dengan SMA N 6 dengan skor 66,03, SMA N 4 dengan Skor 65,46, SMA N 7 dengan skor 63,69, dan yang terakhir SMA N 2 dengan skor 60,26. Artinya secara keseluruhan dengan jumlah siswa 133 orang mempunyai skor rata-rata 65,41.
100
Skor Rerata Sekolah
90 80 70
71,61 60,26
65,46
66,03
63,69
4/DL
6/PBL
7/DL
60 50 40 30 20 10 0 2/DL
3/PBL
Sekolah dan Model Pembelajaran Keterangan 2/DL 3/PBL 4/DL 6/PBL 7/DL
: SMA Negeri 2/ Discovery Learning : SMA Negeri 3/ Problem Base Learning : SMA Negeri 4/ Discovery Learning : SMA Negeri 6/ Problem Base Learning : SMA Negeri 7/ Discovery Learning
Gambar 4.2 Profil Rata-Rata Skor Kemampuan Berpikir Tingkat Tinggi Siswa Pada Materi Sistem Reproduksi Berdasarkan profil di atas, rata-rata skor kemampuan berpikir tingkat tinggi siswa di setiap sekolah berbeda-beda, hal ini dikarenakan model pembelajaran, metode pembelajaran serta tingkat kemampuan berpikir analisis soal setiap siswa berbeda. Dari limatosekolah commit user yang ada, pendekatan dalam
71 digilib.uns.ac.id
perpustakaan.uns.ac.id
proses pembelajaran semuanya menggunakan pendekatan saintifik (sciencetific approach) akan tetapi model dan metode pembelajaran dari lima sekolah tersebut berbeda hal ini bisa dilihat dari Rencana Pelaksanaan Pembelajaran (RPP) yang dibuat oleh guru di sekolah. SMA Negeri 2 menggunakan Model Pembelajaran Discovery Learning dan metode ceramah SMA N 3 menggunakan model pembelajaran Problem Base Learning dan metode diskusi dan tanya jawab. SMA N 4 menggunakan model pembelajaran Discovery Learning dan metode ceramah, studi literatur dan Tanya jawab. SMAN 6 menggunakan model pembelajaran Problem Base Learning dan metode diskusi, ceramah, tanya jawab, dan studi literatur. Sedangkan di SMA N 7 menggunakan
model
pembelajaran
Discovery
Learning
dan
metode
pembelajaran diskusi dan tanya jawab. dengan demikian pendekatan, model serta metode pembelajaran sangat berpengaruh pada hasil skor kemampuan berpikir tingkat tinggi siswa. Semakin baik penerapan model, metode serta pendekatan dalam proses pembelajaran maka akan berdampak baik pula terhadap skor yang diperoleh siswa. Perihal lain yang membuat skor kemampuan berpikir tingkat tinggi siswa di setiap sekolah berbeda adalah intensitas penerapan latihan tes evaluasi untuk mengasah kemampuan berpikir siswa, dari hasil wawancara yang dilakukan mendapatkan SMA yang intensitas penerapan latihan tes lebih banyak akan terbiasa mengerjakan soal dengan analisis yang baik pula, representasi dari kemampuan berpikir siswa tersebut bisa dilihat dari hasil analisis kebutuhan serta perbedaan skor rata-rata dalam Gambar 4.2. Selain faktor yang diterangkan di atas, hal lain yang menyebabkan perbedaan skor kemampuan berpikir tingkat tinggi siswa adalah waktu pelaksanaan pengerjaan soal
dilaksanakan
setelah
liburan
panjang
dan
ketidaksiapan
siswa
mengerjakan soal, artinya banyak siswa yang dipaksa mengingat kembali materi yang pernah dipelajari, walaupun secara konten isi soal lebih mengedepankan analisis dari suatu kasus yang ditampilkan dalam soal tersebut. commit to user
72 digilib.uns.ac.id
Jumlah siswa
perpustakaan.uns.ac.id
25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
SMAN 2 SMAN 3 SMAN 4 SMAN 6 SMAN 7
0-25
26-50 51-75 Interval Skor Yang Diperoleh
76-100
Gambar 4.3 Profil Hasil Uji Coba Kemampuan Berpikir Tingkat Tinggi Siswa Pada Materi Sistem Reproduksi
Berdasarkan Gambar 4.3 diketahui dari nilai hasil uji coba lapangan untuk mengukur kemampuan berpikir tingkat tinggi di lima SMA Negeri Surakarta, skor dengan nilai interval 0-25 tidak ada siswa yang mendapatkan nilai tersebut di setiap SMA. Pada nilai interval 26-50, terdapat 9 siswa yang mendapatkan nilai tersebut, masing-masing terdiri dari 7 siswa SMA 2 , 1 siswa SMA 6 dan 1 siswa SMA 7. Pada nilai interval 51-75 terdapat 104 siswa, yang terdiri dari 21 siswa SMA 2, 19 siswa SMA 3, 23 siswa SMA 4, 19 siswa SMA 6, dan 22 siswa SMA 7. Pada nilai interval 76-100 terdapat 20 siswa yang terdiri dari 2 siswa SMA 2, 7 siswa SMA 3, 2 Siswa SMA 4, 5 siswa SMA 6, dan 4 siswa SMA 7. Secara keseluruhan nilai yang diperoleh siswa paling banyak adalah pada interval 51-75. Dari hasil tes kemampuan berpikir tingkat tinggi tampak kemampuan mereka mengenai konten spesifik dan pedagoginya cukup baik terlihat dari perolehan hasil pada profil rata-rata skor kemampuan berpikir tingkat tinggi di lima sekolah yang diatas 50%. dari hasil wawancara commit to user
perpustakaan.uns.ac.id
73 digilib.uns.ac.id
ternyata guru tersebut memperoleh workshop dan peer teaching tentang model-model pembelajaran yang meningkatkan kemampuan tingkat tinggi siswa. Kemampuan siswa mengenai materi spesifik menunjukkan adanya peningkatan yang baik. Peningkatan pertama terlihat setelah guru melakukan workshop dan terjadi peningkatan kembali setelah guru melakukan beberapa kali peer teaching. Guru yang di latih dalam workshop mampu membuat beberapa pedagogi yang terkait cara mengajarkan materi sistem reproduksi. Pada materi ini guru telah mengisi metode untuk mengajarkan materi sistem reproduksi dengan baik dengan pendekatan saintifik sehingga guru tersebut sudah terlatih untuk mengupas ide-ide atau konsep-konsep penting mana yang harus disampaikan kepada siswa, walaupun terkadang guru juga belum bisa mengaitkan ide-ide mana yang belum saatnya dipelajari oleh siswa. Hal ini terlihat dari hasil wawancara serta melihat beberapa perangkat pembelajaran yang mereka buat. Kemudian peningkatan kedua adalah kemampuan siswa menganalisis soal tes kemampuan berpikir tingkat tinggi menuntut siswa harus bisa menganalisis soal dengan teks yang ditampilkan kemudian melatih untuk fokus agar bisa membedakan konten isi dalam setiap kalimatnya sehingga bisa mengambi kesimpulan untuk menentukan jawaban yang tepat dan rinci baik itu pada soal pilihan ganda maupun soa essay yang berbasis metakognitif. Siswa yang sudah biasa mengerjakan soal yang seperti ini akan mudah mencari titik poin manakah yang harus diperhatikan sehingga dengan cepat dan tepat pula bisa mengerjakan soal. Hal ini dapat dilihat dari skor kemampuan berpikir tingkat tinggi, terlihat grid dari setiap sekolah akan berbeda pencapaian hasil skor nya dengan kemampuan siswa yang sering dilatih kemampuan berpikir tingkat tinggi. Berdasarkan hasil profil skor rata-rata kemampuan berpikir tingkat tinggi siswa pada materi sistem reproduksi maka dapat ditarik suatu kesimpulan sementara bahwa kemampuan materi/subjek spesifik pedagogi commit to user guru biologi yang telah mengikuti program workshop pendidikan guru
74 digilib.uns.ac.id
perpustakaan.uns.ac.id
dalam mengenal pendekatan saintifik dan model-model pembelajaran masih minim, namun setelah mengikuti workshop dan peer teaching kemampuan Subjek Spesifik Pedagogi calon guru mengalami peningkatan yang cukup baik dan siswa yang dilatih dingan pemahaman materi yang baik akan bisa menganalisis dan membuat keputusan dengan baik sehingga bisa mengerjakan soal dalam katagori kemampuan berpikir tingkat tinggi.
C. Temuan di Lapangan Temuan di lapangan menunjukkan bahwa soal hasil pengembangan dalam bentuk soal pilihan ganda dan essay dengan kasus terkait materi memiliki keunggulan dan kelemahan sebagai berikut. 1. Keunggulan soal pilihan ganda dan essay dengan kasus a. Jumlah materi yang ditanyakan relatif lebih banyak dibandingkan dengan materi pada umumnya terutama di materi sistem reproduksi b. Dapat mengukur jejeng kemampuan berpikir tingkat tinggi (analisis, evaluasi dan mencipta) yang umumnya sulit dilakukan oleh soal pilihan ganda biasa c. Memberikan wawasan kepada siswa terkait dengan kasus kasus yang terjadi pada materi yang di bahas d. Penskoran mudah, cepat dan objektif e. Memaksakan siswa untuk menganalisis kasus terlebih dahulu yang kemudian baru bisa menegerjakan soal yang ada f. Reliabilitas soal relatif lebih baik dibandinggkan dengan soal yang biasa g. Dapat digunakan untuk mengukur kemampuan problem solving h. Dapat digunakan sebagai alat diagnosis pemahaman materi siswa i. Dapat digunakan untuk mendeteksi miskonsepsi yang mungkin dimiliki siswa j. Dapat digunakan untuk mengetahui efektifitas pembelajaran yang dilakukan guru commit to user
75 digilib.uns.ac.id
perpustakaan.uns.ac.id
k. Peluang untuk menerka dan menebak jawaban lebih sedikit karena antara soal satu dengan yang lain saling berkaitan pada setiap kasusnya.
2. Kelemahan soal pilihan ganda dan essay dengan kasus a. Siswa belum terbiasa mengerjakan soal dengan kasus pada pelajaran biologi terutama pada materi sistem reproduksi. b. Guru belum pernah menggunakan soal pilihan ganda dan essay dengan kasus. c. Penyususnan soal yang baik memerlukan waktu yang relatif lama dibandingkan dengan bentuk soal lainnya. d. Pengerjaan soal relatif lebih lama dibandingkan dengan pengerjaan soal biasa. e. Kurang dapat digunakan untuk mengukur kemampuan verbal
commit to user