-Konferensi Nasional Bahasa dan Sastra III-
PROGRAM QUEST – SALAH SATU CARA MENINGKATKAN VALIDITAS INTERNAL PENELITIAN BAHASA INDONESIA Pujiati Suyata Universitas Ahmad Dahlan
Abstract This article aims at improving the role of Indonesia language the communication within the implementation of the AFTA through optimizing the quality of research applying the Quest Program. The Quest Program is a modern program applicable for measurement using an Item Response Theory with one parameter. Applying this program seems to be quit practical due to accommodate any kind of data including dichotomy, politomony, and their combinatory data. The data of the Indonesian language research could be dichotomy, politomony scale and the combination of both data, and the Quest Program could be applied to handle these data.. Using the program, the measurement instrument would be more accurate and would increase their internal validity of the instrument as the whole. Keywords: program QUEST, Indonesia language reasearch
Abstrak Tujuan penulisan ini adalah meningkatkan peran bahasa Indonesia dalam komunikasi MEA dengan mengoptimalkan mutu penelitian melalui aplikasi program Quest. Quest adalah program pengukuran modern yang menggunakan Item Respons Theory satu parameter. Aplikasi program tersebut lebih praktis karena dapat digunakan untuk data dikhotomus, politomus, dan kombinasi. Data penelitian bahasa Indonesia tidak cukup hanya berskala dikhotomus, melainkan juga berskala politomus dan. kombinasi. Dengan demikian, program Quest sesuai untuk diaplikasikan dalam penelitian bahasa Indonesia. Dengan program tersebut pengukuran instrumen penelitian akan lebih akurat dan hal itu akan meningkatkan validitas internal penelitian secara keseluruhan. Kata Kunci: program QUEST, penelitian Bahasa Indonesia
Pendahuluan Saat ini Indonesia sedang menyambut datangnya Masyarakat Ekonomi Asean (MEA). Berbagai penataan dilakukan, termasuk dalam bidang pendidikan sebagai upaya meningkatkan daya saing Indonesia. Dalam hal ini, bahasa Indonesia memegang peran strategis dalam komunikasi MEA mengingat keunggulan bahasa tersebut dibanding bahasa lain di kawasan Asia. Bahasa Jepang, Korea, Cina, dan Thailand, misalnya, merupakan bahasa yang sulit dipelajari mengingat tulisan dan bunyi bahasanya berbeda. Lain halnya dengan bahasa Indonesia yang bunyi dan tulisan sama (Boeriswati, 2014). Di bidang pendidikan, disusunlah Standar Nasional Pendidikan Tinggi (SN-PT) yang merupakan kriteria dan ukuran yang harus dipunyai semua perguruan tinggi di Indonesia. SNPT disusun dengan memperhatikan Asia University Network (AUN). Dengan mengikuti AUN, perguruan tinggi di Indonesia dapat disejajarkan dengan perguruan tinggi lain di kawasan Asia. Dalam hal akreditasi, perguruan tinggi di Indonesia dapat mengikuti AUN dan KKNI. Terkait dengan kondisi ini, bahasa Indonesia merupakan hal penting yang perlu diperhatikan. Terlebih adanya ketentuan bahwa mahasiswa asing wajib menguasai bahasa Indonesia. Mereka diharapkan mampu berbicara dan menggunakan bahasa Indonesia dengan baik. Hal itu terungkap dalam International Student Summit (ISS), pertemuan tahunan mahasiswa internasional yang belajar di Indonesia, beberapa waktu yang lalu di UGM. Peningkatan mutu lewat SN-PT dan AUN tersebut juga diikuti perlunya peningkatan dalam pembelajaran dan penelitian. Mutu pembelajaran dijaga, demikian pula dalam bidang penelitian. Khusus untuk bidang penelitian, menjaga validitas internal dan validitas eksternal
112
-Konferensi Nasional Bahasa dan Sastra III-
merupakan suatu keharusan. Untuk itu, berbagai cara dapat dilakukan, salah satu di antaranya dengan menggunakan aplikasi program Quest dalam analisis instrumen penelitian. Penelitian Bahasa Indonesia dan Kualitasnya Perkembangan permasalahan dalam dunia penelitian saat ini sudah sedemikian pesat sehingga dalam pelaksanaan penelitian tidak terhindarkan timbulnya masalah-masalah yang berkaitan dengan perlunya metodologi yang canggih, tidak terkecuali dalam penelitian bahasa Indonesia. Metode single method dirasa belum dapat mengatasi semua masalah, muncullah Mixed methods (Creswell, 2012). Mixed methods itu sendiri bukanlah antitesis antara metode kuantitatif dan kualitatif, melainkan merupakan interconnection method, dua hal yang tidak terpisahkan dan saling mendukung. Ilmu dan teknologi terus berkembang, salah satu cara pengembangannya dilakukan melalui penelitian. Penelitian dengan kualitas yang baik diharapkan dapat memenuhi tugas pengembangan ilmu secara optimal. Permasalahannya, suatu penelitian dikatakan berkualitas, kriteria apa sajakah yang menjadi tolok ukurnya. Banyak teori mengatakan bahwa kualitas suatu penelitian dapat dideteksi melalui kecanggihan metodologinya. Wiersma (2003) misalnya, berpendapat bahwa peran metodologi adalah melakukan penelitian secara ilmiah dan dengan cara-cara yang canggih. Kecanggihan tersebut antara lain tampak dari ketepatan prosedur dan keakuratan pelaksanaan langkahlangkah penelitian yang dilaluinya. Lebih lanjut, Cohen (2007) menegaskan kecanggihan suatu penelitian tidak saja pada kecukupan prosedur yang dilaluinya, tetapi juga bagaimana prosedur penelitian tersebut memenuhi karakteristik metode ilmiah. Oleh karena itu, setiap peneliti perlu menetapkan desain penelitiannya secara tepat dan dilaksanakan secara akurat agar keseluruhan pelaksanaan penelitian berjalan sesuai dengan yang diharapkan. Validitas Penelitian Tugas peneliti adalah menjaga validitas penelitiannya. Penelitian dengan desain R&D misalnya, mempunyai validitas tinggi karena dihasilkan melalui serangkaian uji coba lapangan dan validitas ahli. Dalam penelitian eksperimental, sangat penting menjaga validitas internal dan validitas eksternal. Validitas internal menyangkut kondisi-kondisi internal yang memengaruhi penelitian, misalnya tampak pada prosedur pretesting, proses kematangan, pemilihan subjek, dan instrumen pengukuran yang digunakan. Validitas eksternal penelitian, terkait dengan kondisi luar yang dapat memengaruhi hasil penelitian, seperti efek interaktif berbagai faktor yang memengaruhinya. Tidak saja dalam penelitian kuantitatif, dalam penelitian kualitatif masalah validitas juga perlu dijaga. Dalam penelitian kualitatif, validitas penelitian dipertahankan keberadaannya, meskipun dengan cara berbeda. Untuk penelitian kualitatif, validitas penelitian menyangkut prosedur, misalnya bias seleksi atau masalah jumlah observasi (Richey, 2007). Lebih lanjut Richey menegaskan, dalam penelitian R&D, khususnya dalam penemuan model, perlu dilakukan validasi model secara internal, seperti mengon irmasi komponen-komponen model dan sekuennya serta validasi eksternal yang menyangkut kon irmasi pengaruh model yang ditemukan. Hal itu juga berlaku untuk penelitian bahasa Indonesia. Jenis desain penelitian bahasa Indonesia bermacam-macam, ada desain kualitatif, kuantitatif, maupun kombinasi. Yang harus dijaga dari semua desain tersebut adalah validitas penelitiannya, baik validitas internal maupun validitas eksternal.
113
-Konferensi Nasional Bahasa dan Sastra III-
Kualitas Instrumen Penelitian Penelitian kuantitatif, salah satu cara mempertahankan validitas internal suatu penelitian adalah menjaga kualitas instrumen yang digunakan. Peneliti berusaha agar semua data numerik hasil pengukuran yang dilakukan benar-benar merupakan konstruksi (construct) yang ingin diukur. Untuk itu instrumen yang digunakan harus memiliki validitas yang tinggi. Selain itu, instrumen yang digunakan juga harus memiliki indeks reliabel, yang tinggi pula. Uji instrumen yang dilakukan harus menghasilkan kesalahan yang sekecil-kecilnya. Makin kecil kesalahan pengukuran, makin tinggi reliabel alat ukur tersebut. Untuk instrumen yang berbentuk tes, baik bentuk pilihan maupun uraian, kualitas instrumen juga dilihat dari butir-butir soalnya. Dikatakan demikian, sebab secara keseluruhan mungkin suatu instrumen valid dan reliabel, namun belum tentu setiap butirnya juga baik. Untuk mengetahui kualitas butir tes, dapat digunakan program komputer yang khusus dibuat untuk keperluan itu. Ada program pengukuran klasik dan ada pula program pengukuran modern. Program pengukuran klasik, seperti ITEMAN sudah banyak dikenal orang. Program tersebut sederhana, banyak dikenal, dan mudah diaplikasikan. Namun, ada beberapa kelemahan. Program pengukuran modern diciptakan guna menutup kelemahan program klasik tersebut. Dalam penelitian bahasa yang dilakukan dengan model penelitian kuantitatif, hal-hal tersebut juga perlu dilakukan. Instrumen untuk mengetahui hasil belajar bahasa, seperti pemahaman bacaan, perlu diuji dengan instrumen yang benar-benar valid dan reliabel serta butir-butirnya baik. Dengan instrumen seperti itu, diyakini hasil pengukuran akan mencerminkan hal yang benar-benar ingin diukur dan konsisten. Jika instrumen pengambil data baik, diyakini pula data yang terambil juga mencerminkan hal itu. Quest sebagai Salah Satu Program Analisis Data Penelitian Pada penelitian bahasa Indonesia, yang menyangkut dugaan (asessment) hasil belajar, kualitas tes menjadi perhatian utama. Dikatakan demikian sebab hal itu dikatakan berkualitas, valid, dan reliabel, dengan butir-butir yang teridenti ikasi baik akan dapat mengukur pencapaian hasil belajar secara tepat. Apa dan bagaimanakah program Quest itu? Program Quest adalah salah satu program pengukuran yang berkembang dari Item Respons Theory (IRT) 1 parameter. Program Quest relevan untuk kebutuhan analisis butir tes, khususnya dalam bidang penelitian bahasa. Dikatakan demikian sebab kompetensi berbahasa, membaca, menulis, berbicara, dan menyimak, dapat diukur dengan tes tipe pilihan saja, uraian saja, atau pilihan ganda dan uraian sekaligus. Program Quest dapat melayani data ketiga tipe tes tersebut, yaitu bentuk pilihan dengan data benar (1) dan salah (0), uraian dengan data berjenjang (1,2,3, dan 4), dan kombinasi kedua jenis soal tersebut. Dengan demikian, program Quest lebih praktis sebab dengan satu program sudah dapat menganalisis semua jenis data dalam tes hasil belajar bahasa. Dalam teori analisis butir soal dikenal dua macam pendekatan, yakni pendekatan klasik yang disebut Teori Tes Klasik atau (Classical Test Theory/CTT) dan pendekatan modern, yaitu Teori Respons Butir (Item Response Theory/IRT). Pada Teori Tes Klasik, analisis butir tes didasarkan pada tingkat kesukaran butir serta korelasi skor butir dengan skor total. Dengan asumsi ini, soal akan dinilai sulit atau tidak tergantung pada peserta tes (testi). Hamillton, Swaminathan dan Rogers (1991) menyebutnya bersifat group dependent. Selain itu, tes klasik juga bersifat item dependent. Hasil pengukuran tergantung dari tes yang diujikan. Jika tes yang diujikan mempunyai tingkat kesulitan tinggi, estimasi kemampuan peserta tes akan rendah. Sebaliknya, jika tes yang diujikan mempunyai tingkat kesulitan rendah, estimasi peserta tes akan tinggi. Program yang memberikan layanan pada CTT antara lain ITEMAN (Item Analysis). 114
-Konferensi Nasional Bahasa dan Sastra III-
Hasil pengukuran tes klasik berubah-ubah, tergantung peserta tes, dan tidak dapat digunakan untuk melihat tingkat kesulitan butir tes yang sebenarnya. Padahal di sisi lain, ada banyak faktor yang memengaruhi kondisi peserta tes. Searah dengan itu Stark et. al. (2001b) mengemukakan bahwa ada dua kelemahan dalam teori tes klasik, yakni: a. Teori Tes Klasik tergantung pada peserta tes. Berbeda peserta tes, berbeda pula nilai ratarata skor atribut variabel yang diukur. b. Ketepatan pengukuran pada level-level skor tertentu tidak diketahui sebab ketepatan pengukuran dirata-ratakan ke semua level kemampuan yang diukur. Dengan berbagai kelemahan pendekatan Teori Tes Klasik (Clasical Test Theory/CTT) di atas, maka dikembangkanlah suatu pendekatan untuk analisis butir soal yang lebih modern dan lebih canggih yang disebut Teori Respons Butir (Item Response Theory/IRT). Teori Respons Butir tersebut diharapkan dapat mengukur secara tepat kualitas soal yang digunakan. Dengan demikian, hasil pengukuran dengan teori tersebut lebih dapat dipercaya. Analisis soal dengan teori tes modern didasarkan pada distribusi logistik. Ada tiga macam pola distribusi logistik yang dikenal, yakni: satu parameter logistik (1-PL) yang mendasarkan pada tingkat kesulitan butir soal yang juga dikenal dengan Rasch Model, dua parameter logistik (2-PL), yang mendasarkan pada tingkat kesulitan butir soal dan daya beda, dan tiga parameter logistik (3-PL), yang mendasarkan pada tingkat kesulitan butir soal, daya beda, dan menebak (guessing). Semakin banyak parameter logistik yang digunakan, semakin bagus kalibrasi soal karena mempertimbangkan lebih banyak faktor. Faktor tebakan juga dipertimbangkan mengingat kadang ada peserta tes yang sebenarnya tidak tahu jawaban benar, menjadi benar karena menebak saja. Hasil ini akan tampak pada keluaran program yang menggunakan analisis butir tes dengan tiga parameter logistik (3-PL) misalnya dalam program Bilog. Namun, program tersebut hanya dapat dipakai untuk instrumen dengan skala dikhotomus. Padahal banyak data dalam dugaan hasil belajar bahasa dengan skala politomus yang memerlukan analisis dengan IRT. Dalam hal ini, dikenal adanya program Quest yang menggunakan konsep analisis butir tes dengan satu parameter (1-PL) yang dikenal dengan Rasch Model. Perkembangan analisis butir tes dengan Rasch Model antara lain Partial Credit Model (PCM) (Ostini & Nering, 2006). Melalui konsep PCM, soal dapat dianalisis dengan scoring 0 untuk jawaban salah (nol credit), 1 untuk jawaban mendekati benar (partial credit), dan 2 untuk jawaban benar (full credit) seperti cara yang dipakai berbagai lembaga internasional untuk scoring jawaban. Biasanya model PCM digunakan untuk soal uraian singkat. Sementara itu, program Quest digunakan untuk soal pilihan, uraian, dan kombinasinya. Aplikasi Program Quest untuk Analisis Butir Instrumen Ada tiga kunci utama dalam melakukan analisis butir soal dengan program Quest, yaitu a. File perintah yang ditulis dalam program Notepad, b. File data dari hasil jawaban testi yang ditulis dalam Notepad, c. Software program Quest Perlu diingat, ketiga ile tersebut harus disimpan dalam satu folder. Berikut disajikan secara sederhana langkah-langkah analisis butir tes dengan menggunakan program Quest. File data dapat ditulis sesuai jenis datanya, bisa berupa data dikhotomus, yaitu (1) dan (0) dan dapat pula dalam bentuk skala Politomus, yaitu 1, 2, 3 dan 4. Data dikhotomus digunakan untuk instrumen tes pilihan, benar-salah, sementara data politomus untuk data instrumen bentuk tes uraian. File data juga dapat ditulis dalam bentuk kombinasi, misalnya instrumen 115
-Konferensi Nasional Bahasa dan Sastra III-
ditulis dalam bentuk tes pilihan dan uraian, maka data dapat ditulis dalam bentuk benar-salah (1 dan 0) dan data berjenjang (1,2,3,4). Ketiga jenis ile tersebut, ile data, ile perintah, dan software Quest ditempatkan dalam satu folder, kemudian ketik perintah analisis, yaitu “ketik submit, spasi, nama ile perintah lengkap dengan kode ekstensinya, kemudian tekan enter. Selanjutnya, program Quest akan melakukan perintah analisis. Simpulan Akhirnya dapat disimpulkan beberapa hal sebagai berikut. a. Quest adalah program pengukuran modern, menggunakan Item Respons Theory satu parameter yang dapat mengatasi kelemahan program klasik. Aplikasi program menghasilkan hasil pengukuran yang lebih akurat dan dapat mengukur instrumen dengan data yang bermacam-macam, dikhotomus, politomus, dan kombinasi. b. Data penelitian bahasa Indonesia tidak cukup hanya berskala benar-salah (dikhotomus), melainkan juga berskala politomus dan kombinasi. Dengan demikian, program Quest sesuai untuk diaplikasikan dalam penelitian bahasa Indonesia. c. Keakuratan analisis data menggunakan program Quest memberikan sumbangan berharga bagi terwujudnya validitas internal penelitian yang dilakukan. Dengan kata lain, peningkatan mutu penelitian bahasa Indonesia akan terjaga, jika digunakan program analisis data ini. d. Akhirnya, peran bahasa Indonesia dalam komunikasi MEA dengan mengoptimalkan mutu penelitian melalui aplikasi program Quest dapat terwujud.
Daftar Pustaka Boeriswati. 2014. Implementasi Kerangka Kuali ikasi Nasional Indonesia dalam Kompetensi Utama Kurikulum Program Studi PBSI. Ketua AJPBSI. Cohen, Luis., Manion Lawrence., Morrison, Leith. ( 2007). Research methods in education. Oxson: Routledge. Creswell, John. W. (2012). Educational research: Planning, conducting, and evaluating quantitative and qualitative research. Boson: earson Education. Inc. Hambleton, N,J,, Swaminathan, H & Rogers, H.L. (1991). Item Respons Theory. Boston, MA: Kluwer Inc. Ostini, R. & Nering, M. (2006). Polytomus item response theory models. USA: SAGE Publication, Ltd. Richey, Rita C & Klein. James. D. (2007). Desain and development research: Methodes, strategies, and issues. New Jersey: Lawrence Erlbaum Associates, Publishers. Stark, S.,Chernyshenko, S., Chuah, D., Wayne Lee, Wellington, F. (2001b). IRT modeling lab: Test development using classical test theory (versi electronic). Urbana: University of Illinois. Wiersma, William. (2003). Research methods in education. Illinois:Publisher, Inc.
116