BAB II TINJAUAN PUSTAKA
A. Tes Kraepelin 1. Sejarah Perkembangan Tes Kraepelin Emil Kraepelin adalah seorang psikiater asal Jerman yang hidup antara tahun 1856-1926.Pada awal kariernya, ia pernah mengikuti Wilhelm Wundt sebagai muridnya(Kuncoro&Nuryati Atamimi, 1984; Japar, 2013).Kraepelin menciptakan sebuah tes yang bertujuan untuk membedakan antara orang yang normal dengan abnormal. Tes ini awalnya diberi nama Simple Arithmetic Test yang kemudian dikenal dengan tes Kraepelin (Mangunsong, dkk. , 1993). Kraepelin memiliki pemikiran bahwa terdapat perbedaan pada proses sensori sederhana, sensori motor, perceptual dan tingkah laku(Japar, 2013). Tes ini awalnya diciptakan sebagai tes kepribadian untuk mengukur faktor dasar dari karakteristik individu seperti memori, efek latihan, kerentanan terhadap kelelahan dan distraksi (Anastasi&Urbina, 1997).Dengan mengubah fokus pada penilaian dan intepretasi hasil tes, tes ini sekarang telah berkembang menjadi tes bakat (Mangunsong, dkk. , 1993). Tes Kraepelin masuk ke Indonesia setelah dimodifikasi oleh Fakultas Psikologi Universitas Gajahmada (UGM) dan Fakutas Psikologi Universitas Indonesia.Norma yang digunakan di Indonesia merupakan hasil adaptasi dari beberapa penelitian sebelumnya. Pembakuan norma tes ini juga sudah dilakukan berdasarkan kelompok usia antara 15 sampai 44 tahun. Nuryati Attamimi pada
14 Universitas Sumatera Utara
15
tahun 1980 juga telah melakukan pembakuan norma tes ini untuk siswa-siswa lulusan SMEA dan STM di Yogyakarta dan pada tahun 1981 untuk siswa lulusan SMA jurusan IPA dan IPS di Yogyakarta (Attamimi, 1984).
2. Penelitian Terdahulu Tes Kraepelin Sutarlinah Sukadji pada tahun 1993 melakukan penelitian tentang Tes Kraepelin karena menduga adanya bias pada tes ini. Tes ini diduga bias karena menggunakan kemampuan berhitung untuk mengukur kecepatan dan ketelitian kerja. Penelitian dilakukan dengan subjek 641 siswa SMA, STM, SMEA Yayasan Pendidikan Menengah di Tebet Jakarta Selatan.Hasil yang diperoleh yaitu ada hubungan positif dan signifikan antara kemampuan berhitung dengan kecepatan dan ketelitian kerja yang diukur dengan tes Kraepelin. Selain itu, ia juga menemukan bahwa kemampuan berhitung yang mengandung unsur penalaran lebih berpengaruh pada kecepatan kerja, sedangkan skor berhitung yang berunsur kemampuan verbal lebih berperan dalam ketelitian (Sukadji, 1993).
B. Karakteristik Psikometri 1. Validitas a. Definisi Konsep validitas telah ada sejak masa awal pengukuran pada pertengahan abad ke-20. Pada tahun 1937, Garrett (dalam
Osterlind 2010) menyatakan
validitas sebuah tes sebagai konsep mengukur apa yang menjadi tujuan pengukuran tes tersebut. Pada perkembangan teori pengukuran, konsep yang
Universitas Sumatera Utara
16
diungkapkan Garrett menjadi asumsi yang salah karena mengabaikan konsep psikologis yang terdapat di dalamnya.Cureton pada tahun 1950 mendefinisikan valditas sebagai hubungan korelasional antara skor yang diamanati dan skor murni.Konsep ini kemudian juga tidak digunakan lagi karena lebih sesuai dengan definisi reliabilitas yang digunakan sekarang (Osterlind, 2010). Konsep validitas telah berubah dari berorientasi pada tesnya menjadi orientasi
skor
hasil
pengukurannya.Landy
mengungkapkan
validitas
mengungkapkan kebenaran dari hasil tes.Hasil tes sangat bergantung pada tujuan penggunaan tes. Vernon menyatakan bahwa sebuah tes tidak dapat dikatakan valid atau tidak jika tidak dihubungkan dengan tujuan penggunaan tes(Coaley,2010). Messick (1989)mengungkapkan validitas adalah penilaian evaluasi yang terintegrasi mengenai derajat bukti empiris dan teoritis mendukung kesesuaian inferensial berdasarkan skor tes yang diperoleh. Penilaian yang dilakukan harus berdasarkan bukti-bukti empiris dan berbasiskan teori. Objek yang dinilai menurut Messick adalah skor sebuah test atau output dari sebuah tes (Osterlind, 2010). Validitas adalah prinsip dasar dalam pengukuran ilmu psikologi.Validitas dapat didefinisikan sebagai kesesuaian antara skor sebuah tes dengan kualitas yang dipercaya dapat diukur oleh tes tersebut.Untuk mengetahui sesuai atau tidaknya skor yang telah diperoleh, maka harus dilakukan pengujian sistematis untuk menyimpulkan apakah hasil tes tersebut didukung oleh bukti-bukti yang ada (Kaplan&Saccuzzo, 2005).
b. Sumber Bukti Validitas
Universitas Sumatera Utara
17
Terdapat beberapa sumber bukti validitas yang dapat digunakan untuk mendukung hasil dari sebuah tes agar dapat dikatakan valid.Perbedaan jenis bukti validitas ini tidak berarti menggambarkan bentuk validitas yang berbedabeda.Pengkategorian bukti validitas ini hanya untuk mempermudah para ahli untuk melakukan pembedaan (Kaplan&Saccuzzo, 2005). 1) Bukti validitas berdasarkan isi tes Bukti validitas dapat diperoleh dengan melihat konstruk pengukuran sebuah atribut tertentu.Tes yang dikatakan baik apabila konstruk tes tersebut sesuai dengan blueprint yang direncanakan pembuat tes. Mengacu pada blueprint, akan diketahui tujuan awal perancangan tes tersebut sehingga dapat membantu proses evaluasi validitas. Azwar (2013) mengemukakan tujuan dari evaluasi validasi ini adalah untuk melihat sejauhmana aitem dalam sebuah tes mewakili keseluruhan aspek yang ingin diukur (aspek representasi) dan sejauh mana aitem tersebut
dapat
menggambarkan
perilaku
yang
ingin
diukur
(aspek
relevansi).Untuk menganalisa validitas ini dapat dilakukan melalui penilaian ahli untuk melihat relevansi isi tes, atau dengan metode statistic yaitu analisis faktor(Kaplan&Saccuzzo, 2005). 2) Bukti validitas berdasarkan proses respon Pembuktian validitas berdasarkan proses respon berkembang dari pernyataan Messick untuk langsung mendalami cara seseorang menyelesaikan aitem atau tugas yang ada dengan menjelaskan proses yang mendasari respon sebuah aitem dan kinerja seseorang. Validitas yang dibuktikan dengan proses
Universitas Sumatera Utara
18
respon ini sering digunakan dalam perkembangan sebuah tes dan dalam evaluasi karakteristik psikometri sebuah tes (Padilla&Benitez, 2014). Bukti validitas berdasarkan proses respon diperoleh dengan mengevaluasi proses mental atau kognitif yang digunakan peserta tes
untuk menghasilkan
sebuah respon. Proses respon perlu dibuktikan khususnya untuk tes yang melibatkan analisa penalaran berhitung(Osterlind, 2010).Terdapat beberapacara untuk mendapatkan bukti validitas berdasarkan bukti respon. Padilla&Benitez (2014) membagi cara-cara tersebut dalam dua kategori. Kategori pertama adalah metode yang langsung meneliti proses psikologis atau operasi kognitif seseorang seperti thinking aloud, focus group dan wawancara. Kategori selanjutnya adalah dengan melalui indikator tidak langsung yang masih membutuhkan intepretasi tambahan seperti waktu respons dan gerakan mata. Osterlind (2010) juga mengemukakan beberapa cara yang dapat digunakan untuk menganalisa proses respon secara statistik yaitu analisa variabel laten, structural equation modeling (SEM), hierarchicallinear modeling (HLM), conjectural analysis, path analysis dan meta-analisis. 3) Bukti validitas berdasarkan struktur internal Struktur internal sebuah tes dapat dianalisa sebagai salah satu bukti validitas.Hal pertama yang harus diperhatikan yaitu teori yang mendasari pengembangan konstruk suatu alat tes. Dengan teori dasar yang jelas akan lebih memungkinkan untuk mengembangkan aitem tes yang sesuai dan pengukuran yang lebih tepat (Osterlind, 2010). Beberapa cara analisa validitas berdasarkan struktur internal yaitu
Universitas Sumatera Utara
19
a) Common FactorModel Model faktor umum ini sejalan dengan teori faktor tunggal yang diungkapkan oleh Charles Spearman. Asumsi dasar dari model ini yaitu setiap faktor mempunyai suatu kesamaan yang juga diukur oleh faktor lain yang disebut commonality, dan juga mempunyai keunikan yang dimiliki setiap faktor berbedabeda(Osterlind, 2010). Hasil tes dari peserta tes pada dasarnya tidak hanya mengandung pengetahuan si peserta terhadap konstruk yang diukur tetapi juga derajat seberapa tinggi suatu fakor mengukur konstruk tes tersebut. Dengan kata lain, model ini akan mencari seberapa kuat faktor-faktor dalam tes berhubungan dengan konstruk dari tes (Coaley, 2010). Model faktor umum ini dapat diuji dengan principal components analysis (PCA) dan factor analysis. Kedua metode ini memiliki tujuan utama untuk mengurangi varians total antar faktor dalam tes menjadi varians yang dimiliki bersama setiap faktor, sehingga faktor umum dari konstruk alat tes dapat diperkirakan (Osterlind, 2010). PCA adalah teknik reduksi variabel yang mengurangi jumlah variabel tampak menjadi komponen-komponen yang berkontribusi banyak terhadap varians dari variabel tampak tersebut dengan jumlah yang lebih sedikit. Teknik analisis faktor adalah teknik reduksi variabel untuk menentukan variabel laten dari sebuah konstruk pengukuran (Suhr, 2005). Teknik analisis faktor juga menghitung besarnya kontribusi dari masing-masing faktor terhadap faktor-faktor lain dan terhadap faktor umum tes tersebut yang disebut muatan faktor (factorloading).
Apabila semua faktor dalam tes
mempunyai muatan faktor yang tinggi terhadap faktor umum, danmuatan faktor
Universitas Sumatera Utara
20
yang rendah terhadap faktor-faktor lain, maka tes tersebut dapat dikatakan factorally pure. Semakin mendekati kriteria factorally pure, maka semakin valid sebuah alat tes. Metode analisis faktor berdasarkan tujuannya terbagi atas dua metode yaitu
Exploratory
Factor
Analysis
(EFA)
dan
Confirmatory
Factor
Analysis(CFA). Tinsley& Brown (dalam Cudeck, 2000 ) menyatakan penggunaan metode EFA bertujuan untuk megetahui jumlah dari faktor laten yang mendasari sebuah variabel dan seberapa besar pengaruhi setiap faktor terhadap variabel tersebut. Metode CFA digunakan untuk memastikan hubungan variabel laten dengan variabel tampak bersifat reflektif. Dengan kata lain, variabel-variabel tampak memang merupakan pengukuran dari variabel laten (Wijanto, 2008). Metode statistik yang dapat digunakan untuk melakukan CFA adalah Hierarchical Linear Modelling (HLM) dan Structural Equation Model (Osterlind, 2010). Kline pada tahun 1979 mengemukakan jumlah sampel yang dibutuhkan untuk melakukan analisis faktor paling sedikit 100 sampel. Cattell menyatakan jumlah sampel yang dibutuhkan lebih banyak dengan N harus lebih besar dari 250 subjek. Tinsley & Tinsley mengemukakan bahwa penelitian dengan jumlah sampel 100 dapat dikatakan poor, mencapai 200 subjek dikatakan fair, 300 subjek tergolong good, menggunakan 500 subjek dikatakan very good, dan jika mencapai 1000 subjek disebut excellent. Comrey & Lee kemudian pada tahun 1992 menekankan pada para peneliti untuk memperoleh paling sedikit 500 sampel
Universitas Sumatera Utara
21
ketika akan menggunakan metode analisis faktor (Trninić, dkk., 2013; Wolf, dkk., 2013). b) Multitrait-Multimatrix Method (MTMM) MMTM adalah prosedur yang dapat digunakan untuk menganalisis hubungan dan pola antar data dari sebuah tes (Osterlind, 2010). Asumsi dasar dari metode ini adalah mencari persamaan dan perbedaan antara data dari alat tes yang diuji dengan data dari alat tes lain, baik yang mengukur atribut yang sama ataupun berbeda. Apabila hasil dari sebuah tes menghasilkan intepretasi konvergen dengan hasil dari tes lain yang mengukur atribut sejenis,
dan
menghasilkan intepretasi divergen dengan hasil dari tes lain yang mengukur atribut berbeda, maka tes tersebut dapat dikatakan valid. Melalui MMTM, validitas kovergen dan diskriminan juga dapat diestimasi melalui matriks korelasi antara skor tes yang diuji dengan skor tes lainnya (Azwar, 2013). 4) Bukti validitas berdasarkan hubungan dengan variabel lain Hubungan antara variabel suatu alat tes dengan variabel lainnya dapat menjadi sumber bukti pengujian validitas.Predictive evidence diperoleh dengan melihat kemampuan hasil sebuah alat tes digunakan untuk memprediksi nilai sebuah variabel lain yang diukur setelahnya. Menurut Azwar (2013), variabel yang diprediksi disebut sebagai kriteria validasi.Concurrent evidence diperoleh dengan melihat kemiripan hasil pengukuran sebuah tes dengan hasil dari tes lain yang sejenis(Osterlind, 2010). Apabila skor sebuah tes dan skor kriteria validasi diperoleh pada waktu yang sama, maka koefisien validiasi dapat diperoleh dari korelasi antara kedua skor tersebut(Azwar, 2013).Analisa kedua jenis validitas ini
Universitas Sumatera Utara
22
dengan mengkorelasikan hasil tes dengan kriteria validitas yang telah ditentukan dengan berbagai pertimbangan (Kaplan&Saccuzzo, 2005). 5) Bukti validitas berdasarkan pertimbangan eksternal Bukti-bukti validitas dapat juga diperoleh dengan melihat faktor-faktor eksternal seperti tampilan alat tes – face validity, kemampuan hasil tes digeneralisasikan ke situasi baru – validity generalization, dan konsekuensi sosial dari penggunaan sebuah tes – consequential validity evidence(Osterlind, 2010). Pemerolehan bukti validitas yang mendukung sebuah tes merupakan proses yang terus berlanjut. Semakin sering sebuah tes digunakan, maka semakin banyak yang harus dipelajari mengenai tes tersebut.Dunnette & Borman menyatakan bahwa pengguna tes tidak pernah boleh merasa puas dan yakin dirinya telah cukup tahu mengenai metode pengukuran yang mereka pilih (Kaplan&Saccuzzo, 2005). c. Faktor-Faktor yang Mempengaruhi Validitas Validitas adalah bagian dari pengukuran mental yang terus berkembang. Coaley (2010) menyatakan bahwa suatu tes yang digunakan dalam keadaan, kondisi, dan konteks yang berbeda, akan memiliki validitas yang berbeda pula. Bukti-bukti validitas harus terus dikembangkan untuk mendukung penggunaan tes tersebut. Hasil dari sebuah penelitian juga sangat mungkin berubah. Tes yang sudah didukung bukti validitas yang baik mungkin saja menjadi tes yang kualitasnya kurang baik keesokan hari. Perubahan ini bisa dikarenakan faktor internal atau faktor eksternal yang berasal dari lingkungan sekitar. Faktor internal seperti aitem yang tidak sesuai lagi dalam mengukur suatu atribut sedangkan
Universitas Sumatera Utara
23
faktor eksternal seperti perkembangan teknologi, perpaduan budaya, perubahan bahasa dan lain sebagainya. Intepretasi validitas sangatlah rentan berubah sehingga pengujian validitas harus terus dipantau dan diperbaharui (Osterlind, 2010). Coaley (2010) juga menambahkan beberapa faktor yang
dapat
mempengaruhi pengukuran validitas, yaitu : 1) Batasan jangkauan data Jangkauan data yang terbatas dapat dikarenakan peserta tes yang mempunyai skor yang mirip sehingga variasi datanya rendah. Seperti yang diungkapkan Azwar (2013) bahwa kelompok dengan variasi data yang lebih besar akan menghasilkan skor dengan koefisien valitas yang lebih tinggi. Batasan jangkauan data juga dapat terjadi ketika sebuah kelompok lebih homogen dalam karakteristik usia, jenis kelamin, kepribadian. Variabel-variabel ini dapat menjadi variabel moderator yang mempersempit jangkauan data. 2) Hilangnya sampel Hilangnya
sampel
di
tengah penelitian meningkatkan terjadinya
peneyempitan jangkauan data.Untuk mengatasi sebagian sampel yang hilang, dapat digunakan formula matematis statistik yang telah dikoreksi atau program tertentu yang menghitung koefisien validitas.Koefisien validitas kemudian dapat diperkirakan seakan tidak terjadi kehilangan sampel. 3) Ukuran sampel Jumlah partisipan yang ikut dalam sebuah tes dapat turut mempengaruhi validitas sebuah tes. Dengan sampel yang lebih sedikit, akan lebih besar
Universitas Sumatera Utara
24
kemungkinan terjadinya kesalahan pengukuran. Begitu juga sebaliknya, dengan sampel yang lebih banyak maka error juga semakin kecil. Azwar (2013) menyatakan bahwa tes dengan tingkat kesalahan pengukuran yang lebih rendah akan mempunyai validitas yang lebih tinggi. 4) Atenuasi Efek atenuasi adalah menurunnya nilai sebuah statistik karena hilangnya asosiasi murni antar konstruk pengukuran (Osterlind, 2010). Dengan kata lain, menurunnya nilai validitas dikarenakan hilangnya asosiasi dengan skor laten. Skor tampak yang diperoleh juga dipengaruhi oleh kesalahan pengukuran yg terjadi pada prediktor dan kriteria validasi sehingga menjauhi skor murni (Azwar, 2013).Johnson dan Ree menyatakan bahwa efek ini dapat diatasi dengan rumus koreksi statistika berikut untuk mengestimasi koefisien validitas yang lebih tepat (Coaley, 2010). ..........................................(4)
Keterangan : koefisien validitas koresi untuk atenuasi = varians nilai kelompok tidak mengalami atenuasi = varians nilai kelompok yang mengalami atenuasi = korelasi antara skor tes dengan pengukuran kriteria dalam keadaan mengalami atenuasi
Universitas Sumatera Utara
25
5) Kontaminasi kriteria Kriteria yang terkontaminasi adalah kriteria validasi yang melibatkan faktor-faktor eksternal yang tidak sesuai atau tidak berhubungan dengan pengukuran yang dilakukan.Koefisien validitas dapat menjadi rendah disebabkan oleh bias dan variasi pengukuran yang menjadi kriteria. Validitas akan menjadi lebih tinggi apabila dampak dari faktor yang lain yang tidak berhubungan dengan kriteria dapat diminimalisir (Coaley, 2010). 6) Asumsi mengenai kriteria validitas yang salah Terdapat dua buah asumsi yang dapat mempengaruhi koefisien validitas sebuah pengukuran.Yang pertama adalah asumsi linearitas koefisien validitas antara sebuah tes dengan kritera pengukurannya.Asumsi ini memprediksikan koefisien validitas sebuah tes akan semakin tinggi apabila tes lain yang menjadi criteria pengukuran semakin mampu mengukur dengan akurat, dan sebaliknya. Asumsi kedua yaitu pemikiran bahwa sebuah tes dan criteria pengukurannya akan mengukur suatu atribut yang sama persis. Pada kenyataannya, dua tes bisa saja mengukur atribut yag mirip namun tidak akan sama persis. d. Analisa Koefisien Validitas Tidak ada aturan mengenai seberapa besar koefisien validitas yang cukup agar hasil dari sebuah tes dapat dikatakan valid. Pada umumnya, koefisien validitas yang berkisar antara 0,3 sampai 0,4 sudah tergolong cukup baik. Untuk memperoleh koefisien validitas yang lebih dari 0,6sangatlah sulit pada praktek nyata. Koefisien validitas akan signifikan secara statistik apabila probabilitas memperoleh nilai ini lebih kecil dari 0,05 (Kaplan&Saccuzzo, 2005).
Universitas Sumatera Utara
26
Koefisien validitas yang dikuadratkan adalah persentasi dari variasi kriteria yang dapat diketahui dengan informasi dari hasil tes. Dengan kata lain, koefisien yang dikuadratkan ini menjelaskan seberapa besar variansi data yang dimiliki bersama antaradua kelompok yang dibandingkan (Kaplan&Saccuzzo, 2005 ; Osterlind, 2010).
2. Reliabilitas a. Definisi Reliabilitas dapat didefinisikan sebagai ketepatan, keakuratan, atau kekonsistenan dari hasil-hasil pengukuran berulang Pengukuran berulang yang dilakukan harus independen dan melibatkan variabel yang parallel atau sama. Dalam mendefinisikan reliabilitas sebuah pengukuran sangat bergantung pada konteks penggunaan suatu pengukuran. Sebuah pengukuran yang sama bisa saja mempunyai tingkat reliabilitas yang berbeda apabila dilakukan dalam konteks yang berbeda(Osterlind, 2010). Reliabilitas tes juga berarti keakuratan tes.Tidak adanya error dalam sebuah pengukuran juga dapat menggambarkan reliabilitas sebuah pengukuran. Sebuah pengukuran akan semakin reliabel apabila tingkat error dalam hasil pengukuran semakin rendah.Secara sederhana, reliabilitas dapat dikatakan berbanding terbalik dengan tingkat error (Coaley, 2010). Mengacu pada classical test theory, reliabilitas dapat didefinisikan dalam beberapa
konsep
yaitu
reliabilitas,
indeks
reliabilitas
dan
koefisien
realibilitas.Lord & Novick (1968) mengemukakan konsep reliabilitas sebagai
Universitas Sumatera Utara
27
korelasi kuadrat antara skor tampak dengan skor murni. Indeks reliabilitas didefinisikan sebagai korelasi antara skor tampak dengan skor murni.Kedua definisi di atas mengandung skor murni yang merupakan variabel teoritis dan tidak dapat dihitung nilainya.Gulliksen (1950) kemudian mengemukakan teori reliabilitas yang dapat diaplikasikan dalam psikometri.Ia mengemukakan konsep koefisien reliabilitas yang merupakan korelasi antara skor tampak dari dua tes parallel (Osterlind, 2010). b. Pengukuran Parallel Reliabilitas dalam pengukuran mental hanya dapat dihitung dari beberapa pengukuran berulang yang sifatnya parallel. Pada awalnya, pengukuran parallel dilakukan dengan cara meminta peserta tes yang sama berpartisipasi dalam beberapa administrasi tes yang identik. Pada kenyataanya, metode ini sulit dilakukan sehingga para ahli psikometri membentuk beberapa cara untuk menghasilkan pengukuran yang parallel agar dapat mengestimasi nilai reliabilitas (Osterlind, 2010). 1) Test-retest Cara pertama untuk memperoleh pengukuran yang parallel adalah dengan menggunakan tes yang sama dua kali dengan administrasi berulang. Tes yang sama diadministrasikan pada kelompok responden yang sama pada waktu yang berbeda diasumsikan sebagai tes parallel. Coombs (1953) mengemukakan alternative lain yang lebih memenuhi asumsi CTT, yaitu koefisien ketepatan. Statistik ini menjelaskan pengulangan administrasi sejumlah tes yang sama pada kelompok individu yang sama. Cara ini mengasumsikan semua pembelajaran dan
Universitas Sumatera Utara
28
kondisi administrasi tes bersifat konstan sama yang hampir tidak mungkin dapat dilakukan (Osterlind, 2010). Estimasi reliabilitas yang banyak digunakan adalah dengan pengulangan dua kali dikarenakan dua kali pengukuran dianggap sudah mendekati bentuk tes parallel. Azwar (2013) menyatakan koefisien reliabilitas yang diperoleh lewat cara ini sangat rentan terhadap perubahan. Hal ini dikarenakan peserta tes sangat mungkin untuk mengalami perubahan saat jeda antara tes pertama dengan tes kedua. Kelemahan dari metode ini adalah adanya carryover effect.Efek ini terjadi ketika tes pertama mempengaruhi nilai dari tes kedua.Salah satu jenis dari efek ini adalah adanya efek latihan. Pada tes yang kedua diikuti oleh peserta tes, akan sangat memungkinkan ia memperoleh hasil yang lebih bagus karena kemampuannya telah bertambah saat mengikuti tes yang pertama. Untuk mengatasi hal ini, maka jeda antara kedua tes tersebut haruslah dipilih dan dievaluasi dengan baik (Kaplan&Saccuzzo, 2005). Selang waktu antara dua tes sangatlah signifikan berpengaruh pada reliabilitas.Reliabilitas cenderung menurun apabila selang waktunya semakin lama.Selang waktu beberapa hari sampai beberapa minggu menghasilkan estimasi yang lebih tinggi dibandingkan dengan selang waktu yang lebih lama.Jika selang waktu antara kedua tes cukup singkat, maka reliabilitas yang diperoleh adalah coefficient of dependability (Coaley, 2010).
Universitas Sumatera Utara
29
2) Bentuk tes alternatif Apabila pengulangan administrasi tes tidak dapat dilakukan, maka tes hanya dapat dilakukan sekali. Bentuk pengukuran parallel untuk tes yang hanya dilakukan sekali adalah dengan menggunakan bentuk alternatif dari tes yang mengukur atribut yang sama (Osterlind, 2010). Bentuk tes alternatif ini dapat digunakan untuk mengurangi carryover effect yang merupakan kelemahan dari metode test-retest. 3) Metode konsistensi internal Tidak semua alat tes mempunyai bentuk alternatifnya. Untuk tes yang hanya mempunyai satu bentuk saja, maka pengukuran parallel dapat dilakukan dengan membagi dua tes tersebut. Setiap bagian tes yang telah dibagi dianggap sebagai satu pengukuran. Estimasi reliabilitas yang dilakukan dengan cara ini menghasilkan split-half reliability.Pembagian tes menjadi dua bagian dapat dilakukan dengan beberapa cara yaitu membagi dengan angka genap dan ganjil atau dengan membagi dua tes berdasarkan letak awal dan akhir dari isi tes. Kelemahan dari penggunaan cara ini adalah memperpendek panjang tes yang juga mempengaruhi nilai reliabilitas (Osterlind, 2010).
Azwar (2013) menyatakan
bahwa pengukuran reliabilitas dengan metode konsistensi inernalberarti menguji konsistensi antar bagian atau antar item dalam sebuah tes. c. Perhitungan Koefisien Reliabilitas Osterlind (2010) mengemukakan tiga cara menghitung koefisien reliabilitas, yaitu:
Universitas Sumatera Utara
30
1) Spearman-Brown Formula Formula Spearman-Brown ini dapat digunakan untuk menghitung reliabilitas pada tes yang telah dibagi dua. Spearman-Brown mengasumsikan data yang terdistribusi normal dari sebuah pengukuran mental apabila dibagi dua akan menghasilkan dua distribusi data yang sama dan normal serta memiliki standar deviasi yang sama. Formula Spearman-Brown sebagai berikut : ..........................................(5) Keterangan : koefisien reliabilitas koefisien antara kedua belahan tes 2) Kuder-Richardson Reliability Coefficient Kuder dan Richardson mengemukakan metode pengujian reliabilitas untuk tes yang hanya diadministrasikan sekali (Kaplan&Saccuzzo, 2005). mengembangkan
Mereka
metode estimasi reliabilitas yang fokus pada varians
interkorelasi item untuk mengukur konsistensi pengukurannya. Konsep dasar dari metode ini adalah dengan mengkorelasikan setiap item dengan keseluruhan item yang lain satu per satu. Formula yang dikemukakan yaitu : .............................(6) Keterangan : = koefisien reliabilitas = proporsi populasi yang menjawab aitem benar (atau aitem pertama). = proporsi populasi yang menjawab aitem salah (atau aitem kedua).
Universitas Sumatera Utara
31
= banyak aitem dalam tes. = varians skor tes. Kuder dan Richardson merevisi formula mereka karena dianggap terlalu panjang bahkan untuk tes yang memiliki sedikit item.Perhitungan dengan rumus koreksi ini lebih sederhana namun menghasilkan nilai yang lebih rendah.Koreksi formula tersebut menjadi : ................................(7) Keterangan: = koefisien reliabilitas = mean dari tes 3) Coefficient Alpha Cronbach mengembangkan formula Kuder-Richardson yang menekankan pada struktur internal sebuah tes.Ia berasumsi bahwa setiap aitem mengukur sebuah trait tunggal, memiliki korelasi antar item yang sama dengan kelompok data yang besar, dan mempunyai varians yanag sama dengan sampel besar (Coaley, 2010). Menurutnya, varians antar item mendasari perhitungan varians keseluruhan tes yang akan digunakan untuk mengestimasi koefisien reliabilitas. ..........................................(8) Keterangan: = Koefisien reliabilitas
= Jumlah aitem dalam tes = Varians skor tes
Universitas Sumatera Utara
32
d. Faktor-Faktor yang Mempengaruhi Reliabilitas 1) Tujuan, waktu dan konteks penggunaan tes Reliabilitas tes sangat bergantung pada tujuan penggunaan tes, waktu dan kondisi dimana sebuah tes digunakan. Jika tujuan penggunaan tes berbeda, maka reliabilitas dari sebuah tes juga akan berubah. Sebuah tes bisa saja dikatakan reliabel untuk mengukur suatu variabel tertentu namun tidak variabel untuk tujuan pengukuran yang lain(Osterlind, 2010). 2) Atenuasi Koefisien reliabilitas selalu lebih rendah daripada indeks reliabilitas.Hal ini dikarenakan terjadinya atenuasi.Koefisien reliabilitas yang membandingkan skor tampak dari pengukuran pertama dan kedua mengalami penyempitan karena tidak mengasosiasikan skor sebuah tes dengan skor murninya(Osterlind,2010). 3) Panjang tes Reliabilitas dari suatu tes dipengaruhi oleh reliabilitas dari masingmasingaitem dalam sebuah tes.Semakin banyak item, maka semakin baik kemampuan
sebuah
tes
menggambarkan
karakteristik
yang
hendak
diukur(Kaplan&Saccuzzo, 2005).Penambahan jumlah aitem dalam sebuah tes berarti memperpanjang tes. Perpanjangan tes akan meningkatkan koefisien reliabilitas dari tes tersebut. Sebaliknya, apabila tes semakin pendek maka koefisien reliabilitas juga semakin rendah. Hal yang perlu ditekankan yaitu itemitem yang ditambahkan haruslah setara atau parallel dengan aitem yang sudah ada sebelumnya (Azwar, 2013).
Universitas Sumatera Utara
33
4) Heterogenitas kelompok Kelompok yang heterogen adalah kelompok yang variasi atau perbedaan distribusi data dalam kelompok.Gulliksen berasumsi bahwa reliabilitas dapat berubah jika terdapat perbedaan varians kelompok (Osterlind, 2010).Pada dasarnya, tes yang dikenakan pada kelompok sampel yang lebih heterogen akan menghasilkan koefisien reliabilitas yang lebih tinggi(Azwar,2013). e. Analisa Koefisien Reliabilitas Tingkat reliabilitas yang baik untuk setiap tes adalah berbeda-beda, tergantung pada penggunaan dari tes tersebut. Pada kebanyakan penelitian, nilai reliabilitas yang berkisar antara 0,7 sampai 0,8 sudah tergolong baik.Sebuah tes yang memiliki fokus pengukuran yang sangat sempit biasanya baru bisa mempunyai nilai reliabilitas yang sangat tinggi.Sedangkan untuk tes yang memiliki konstruk yang kompleks cenderung memiliki reliabilitas yang rendah (Kaplan&Saccuzzo, 2005). Menurut Anastasi (1998) dan Bartram (1995a), batasan paling rendah dari koefisien reliabilitas yang dapat diterima adalah 0,7. Akan tetapi, nilai yang lebih rendah masih dapat diterima untuk penelitian-penelitian tertentu.Untuk tes penalaran kemampuan, bakat dan tes intelegensi harus memiliki koefisien di atas 0.8.Apabila tes bertujuan untuk membandingkan skor antar peserta tes, maka nilai 0.85 sebaiknya menjadi patokan (Coaley, 2010).
Universitas Sumatera Utara
34
C. Karakteristik Psikometri Tes Kraepelin Tes Kraepelin adalah tes yang dibuat pada akhir abad ke-19 di Jerman.Tes yang berisikan angka-angka sederhana ini mulai digunakan di Indonesia pada tahun 1900-an. Tes ini merupakan tes yang masih digunakan hingga saat ini, khususnya dalam bidang pendidikan dan pekerjaan, meskipun tes Kraepelin termasuk tes yang cukup tua.Mengingat hal ini, tes Kraepelin harus diuji secara berulang untuk melihat apakah tes masih baik untuk digunakan atau tidak. Data mengenai karakteristik psikometris tes Kraepelin yang terakhir ditemukan berasal dari pengujian validitas dan reliabilitasnya pada tahun 1960-an, atau lebih dari 50 tahun yang lalu.Seperti yang telah diungkapkan Osterlind (2010), validitas dan reliabilitas sangat rentan berubah apabila sebuah tes digunakan pada waktu dan konteks yang berbeda. Tes Kraepelin pada awalnya dibuat untuk membedakan antara orang normal dan abnormal. Dalam perkembangannya, tes ini telah beralih fungsi menjadi tes bakat. Setelah lebih dari 50 tahun tes Kraepelin digunakan tanpa ada pengujian ulang terhadap karakteristik psikometrisnya, fungsi tes Kraepelin untuk mengukur bakat sangat mungkin berubah. Terdapat beberapa faktor yang turut mempengaruhi perubahan validitas dan reliabilitas dari sebuah tes, seperti jangkauan data, ukuran sampel, efek atenuasi, kontaminasi kriteria dan asumsi-asumsi salah mengenai kriteria, serta konteks penggunaan tes. Untuk meningkatkan ketepatan pengujian validitas dan reliabilitas dari tes Kraepelin, maka penelitian ini menggunakan sampel dengan
Universitas Sumatera Utara
35
jumlah besar dan tidak terbatas pada kriteria populasi apapun. Hal ini bertujuan untuk memperluas jangkauan data dan heterogenitas dari kelompok data. Efek atenuasi juga dikoreksi secara statistik dalam analisis SEM. Kriteria validitas tidak akan terkontaminasi dengan faktor eksternal karena pengujian tes Kraepelin dilakukan terhadap struktur internal dari tes itu sendiri. Hal yang tidak kalah penting dalam penelitian ini adalah tujuan penggunaan tes ini. Pengujian validitas dan reliabilitas tes Kraepelin tidak terlepas dari tujuan penggunannya untuk mengukur bakat peserta tes. Penelitian ini bertujuan untuk menguji validitas dan reliabilitas tes Kraepelin mengukur bakat dalam bidang pendidikan dan pekerjaan. Pengujian validitas tes Kraepelin sudah pernah dilakukan pada tahun 1965-1967. Validitas tes Kraepelin dapat berubah setelah waktu yang sangat lama. Waktu dapat memunculkan berbagai perubahan yang menyebabkan faktor-faktor dalam tes Kraepelin tidak mampu mengukur bakat lagi. Oleh karena itu, pengujian struktur internal tes Kraepelin harus dilakukan. Dengan membandingkan skorskor yang diperoleh dari tes ini, peneliti ingin melihat apakah hasil tes ini memang masih valid untuk mengukur faktor kecepatan kerja, ketelitian kerja, keajegan kerja, dan ketahanan kerja. Cara untuk melakukan pengujian validitas berdasarkan struktur internal adalah dengan melakukan analisis faktor konfirmatori melalui Structural Equation Model (SEM). Analisis faktor dilakukan untuk melakukan konfirmasi terhadap empat faktor yang seharusnya diukur. Pada model ini, setiap faktor dalam tes Kraepelin dihubungkan dan diuji untuk melihat communalities, atau faktor umum yang diukur keempatfaktordalam tes Kraepelin.
Universitas Sumatera Utara
36
Reliabilitas tes Kraepelin juga sangat rentan berubah. Salah satu faktor yang menyebabkan perubahan reliabilitas tes Kraepelin adalah waktu penggunaan tes (Osterlind, 2010). Reliabilitas tes Kraepelin terakhir diperoleh dari penelitian tahun 1967 dan kemungkinan besar telah berubah saat ini. Pengujian terhadap reliabilitas tes Kraepelin dilakukan dengan formula koefisien alfa. Dengan formula ini, setiap faktor akan dipasangkan dengan faktoryang lain untuk melihat varians dari keseluruhan tes. Nilai varians ini kemudian digunakan untuk mengestimasi nilai reliabilitas(Osterlind, 2010).Tes Kraepelin sebagai tes bakat akan dikatakan berkualitas baik apabila memiliki nilai reliabilitas minimal 0,8.Ketika tes Kraepelin dipakai sebagai tes seleksi kerja, nilai subjek akan dibandingkan dengan subjek lainnya. Untuk fungsi seleksi karyawan, tes Kraepelin harus memiliki nilai reliabilitas minimal 0,85. Hal ini berdasarkan nilai koefisien reliabilitas minimum untuk tes psikologi yang dikemukakan oleh Coaley (2010). Analisis reliabilitas berdasarkan formulasi Cronbach Alpha (α) bisa dilakukan dengan Structural Equation Model (Kano&Azuma, 2003). Pada penelitian ini, pengukuran reliabilitas tes Kraepelin dilakukan dengan mengukur reliabilitas konstruk (Construct Reliability) dan ekstrak varian (Variance Extracted). Reliabilitas konstruk menunjukkan konsistensi pengukuran konstruk laten tes. Ekstrak varian menunjukkan jumlah varian keseluruhan dalam faktorfaktor tes yang dijelaskan variabel laten.
Universitas Sumatera Utara