STUDI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN METODE CFA Skripsi Diajukan untuk Memenuhi Persyaratan Memperoleh Gelar Sarjana Psikologi (S.Psi)
Disusun oleh: AFIFAH NIM: 107070002378
FAKULTAS PSIKOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 1432H / 2011
1
UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN METODE CFA
SKRIPSI Diajukan kepada Fakultas Psikologi untuk memenuhi syarat-syarat memperoleh gelar Sarjana Psikologi Oleh: AFIFAH NIM: 107070002378
Di bawah bimbingan: Pembimbing I
Pembimbing II
Jahja Umar, Ph.D NIP: 130 885 522
Mulia Sari Dewi, M.Si NIP: 19780502 200801 2 026
FAKULTAS PSIKOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 1432 H / 2011 M
2
PENGESAHAN Skripsi yang berjudul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN METODE CFA” telah diujikan dalam sidang munaqasyah Fakultas Psikologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 7 Oktober 2011. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar Sarjana Program Strata 1 (S1) pada Fakultas Psikologi.
Jakarta, 7 Oktober 2011
Sidang Munaqasyah
Dekan/ Ketua merangkap Anggota
Pembantu Dekan/ Sekretaris
Jahja Umar, Ph.D NIP: 130 885 522
Dra. Fadhilah Suralaga,M.Si NIP: 19561223 198303 2 001
Anggota:
Yunita Faela Nisa, M.Psi, Psi NIP: 19770608 200501 2 003
Mulia Sari Dewi, M.Si NIP: 19780502 200801 2 026
3
PERNYATAAN ORISINALITAS Saya yang bertanda tangan di bawah ini:
Nama : Afifah NIM
: 107070002378
Dengan ini menyatakan bahwa skripsi yang berjudul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN METODE CFA” adalah benar merupakan karya saya sendiri dan tidak melakukan tindakan plagiat dalam penyusunan skripsi tersebut. Adapun kutipankutipan yang ada dalam penyusunan skripsi ini telah saya cantumkan sumber pengutipannya dalam daftar pustaka. Saya bersedia untuk melakukan proses yang semestinya sesuai dengan undang-undang jika ternyata skripsi ini secara prinsip merupakan plagiat atau jiplakan dari karya orang lain. Demikian pernyataan ini saya buat untuk dipergunakan sebaik-baiknya.
Jakarta, 7 Oktober 2011
Afifah . NIM: 107070002378
4
MOTTO DAN PERSEMBAHAN MOTTO:
“Karena sesungguhnya sesudah kesulitan itu ada kemudahan. Maka apabila kamu telah selesai (dari sesuatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain, dan hanya kepada Tuhanmulah hendaknya kamu berharap” (QS. Al Insyirah : 5-8).
“All your dreams can come true if you have the courage to pursue them” -Walt Disney
“If we believe in something, and we just keep on trying we’ll survive.. we will survive.. It’s a beautiful life act from the heart when you play your part. It’s a beautiful life when you survive and everything is alright” -Maliq n D’essentials
5
PERSEMBAHAN:
Skripsi ini ku persembahkan untuk Ummi, Abi serta ketiga adikku tersayang.. Yang tanpa pernah lelah selalu memberikan cinta, kebahagiaan, serta canda tawa tanpa syarat. Kalianlah penyemangatku dalam menyelesaikan ini.. 6
ABSTRAK (A) Fakultas Psikologi Universitas Islam Negeri Syarif Hidayatullah Jakarta (B) September 2011 (C) Afifah (D) xv + 108 halaman + lampiran (E) Uji Validitas Konstruk General Aptitude Test Battery (GATB) Dengan Metode CFA (F) Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan sumber daya manusia dalam bidang industri dan organisasi. Pengambilan keputusan tersebut berkaitan dengan penerimaan dan penempatan, promosi, evaluasi, maupun penepatan karier. Kebutuhan akan alat tes untuk asesmen mendorong banyak dikembangkan berbagai alat ukur tes psikologis baik tes, self-report, skala, maupun inventori. Salah satu alat tes tersebut adalah General Apitude Test Battery (GATB). GATB adalah suatu alat tes yang berhubungan dengan jabatan yang berorientasi pada beberapa tes bakat baterai yang mengukur sembilan bakat dalam delapan tes tulis serta empat perangkat tes. Dalam penelitian ini digunakan empat subtes dari GATB yaitu computation, three dimensional space, vocabulary, dan arithmetic reasoning dengan jumlah total 175 item. keempat subtes tersebut digunakan karena mengukur bakat skolastik atau hanya dari keempat subtes tersebut telah dapat mengukur kemampuan kognitif atau inteligensi (general intelligence) atau dapat menghasilkan skor IQ. Penelitian ini bertujuan untuk mengetahui apakah seluruh item dalam keempat subtes GATB yang dijadikan penelitian adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada suatu subtes mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut. Dan apakah setiap item dalam masing-masing subtes adalah secara signifikan mengukur kemampuan pada subtes tersebut. Tujuan yang kedua adalah untuk mengetahui apakah
7
empat subtes dalam GATB fit (sesuai) dengan model satu faktor, yaitu satu faktor umum “inteligensi”. Penelitian ini menggunakan data sekunder yang merupakan hasil tes GATB yang diperoleh dari Divisi Asesmen SDM PPM Manajemen. Data yang digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang menjalani tes di Jakarta. Pelaksaan tes dilakukan pada tahun 2009 dan ditempuh oleh 3257 orang. Metode analisis faktor yang digunakan dalam penelitian ini adalah Confirmatory Factor Analysis (CFA) dengan program lisrel 8.70. Berdasarkan perhitungan dengan metode CFA dapat disimpulkan bahwa hasil pengujian hipotesis 1 menunjukkan bahwa hipotesis diterima, bahwa semua subtes fit (sesuai) mengukur model satu faktor, namun untuk subtes three dimensional space serta artihmetic reasoning diperlukan modifikasi model pengukuran untuk dapat memperoleh nilai fit. Hasil pengujian hipotesis 2 melalui analisis faktor dua tingkat (second order confirmatory factor analysis) menghasilkan bahwa terdapat tiga dari empat subtes GATB yang signifikan dalam mengukur inteligensi umum, yaitu subtes computation, three dimensional space, dan vocabulary. Dengan hasil seperti ini, maka alat tes GATB masih dapat dan layak digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan perbaikan
dan
pembaharuan
terhadap
multidimensionalitas yang terlalu banyak. (G) Daftar Bacaan: 36, 22 buku; 4 jurnal; 8 internet.
8
item-item
yang
memiliki
KATA PENGANTAR Alhamdulillahi rabbil 'alamin, puja dan puji syukur penulis panjatkan kehadirat Allah SWT atas segala rahmat, hidayah, dan kasih sayang yang diberikan-Nya, sehingga penulis dapat menyelesaikan penulisan Skripsi dengan judul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN METODE CFA”. Shalawat serta salam semoga selalu tercurahkan kepada junjungan kita semua, Rasulullah Muhammad SAW, berikut para keluarga dan sahabat. Terwujudnya skripsi ini tidak lepas dari bantuan berbagai pihak, baik dalam bentuk sumbangan pikirian, tenaga, dan waktu yang tidak terukur dalam menyelesaikan skripsi ini. Oleh karena itu dengan segala kerendahan hati penulis menyampaikan rasa terima kasih kepada: 1. Bapak Jahja Umar, Ph.D, Dekan Fakultas Psikologi UIN Syarif Hidayatullah Jakarta dan sekaligus sebagai Dosen Pembimbing I. Terima kasih sudah meluangkan waktu dalam jadwal yang padat untuk melakukan proses bimbingan skripsi ini. Terima kasih atas segala arahan, masukan, kritik, cerita penuh inspirasi, serta motivasi dalam penyelesaian skripsi ini. 2. Ibu Mulia Sari Dewi, M.Si., sebagai Dosen Pembimbing II, terima kasih atas bimbingan,
sumbangan
pikiran
dalam
penulisan,
serta
saran
demi
kesempurnaan skripsi ini. 3. Ibu Yufi Adriani M.Psi., Dosen Pembimbing Akademik, terima kasih atas bimbingannya dan semangatnya selama Penulis menjalani perkuliahan. 4. Seluruh dosen Fakultas Psikologi UIN Syarif Hidayatullah Jakarta, yang telah banyak memberikan ilmu dan pembelajaran kepada Penulis. 5. Seluruh karyawan Fakultas Psikologi UIN Syarif Hidayatullah Jakarta yang telah banyak membantu Penulis dalam menjalani perkuliahan, Mbak Rini yang tanpa pernah bosan memberikan informasi mengenai kegiatan Bapak, sehingga Penulis dapat bertemu dengannya.
9
6. Kedua orangtuaku tersayang, Muchtadi dan Iin Indarwati yang merupakan sumber inspirasi bagi penulis dan senantiasa memberikan doa yang selalu menyertai penulis, kasih sayang, cinta, motivasi, bantuan dan material yang tidak akan pernah bisa terganti dan terbayar oleh apapun. Thank you for being my super great parents. 7. Ketiga Adikku tersayang, Ja’far Fathul Haq, Muhammad Al-Fatih, dan Farhan Muharam. Adik-adikku yang selalu setia menghiburku dan menyemangatiku, setiap bermain bersama kalian rasanya semua kepenatan dan kegalauan kakak hilang. Terima kasih telah sabar menjadi adik dari kakak yang cerewet dan semoga kalian bisa menjadi seorang yang ‘LEBIH’ hebat dari kakak kalian ini. 8. Reza Inspirawan, terima kasih sudah menjadi partner yang hebat dalam segala situasi dan kondisi 9. Hildi Okatatia Iskadar, terima kasih untuk canda tawanya, cerita-cerita labil nan aneh juga semangat yang diberikan ketika penulis sudah mulai galau dalam mengerjakan skripsi, dan untuk semua waktu yang telah kita habiskan bersama. 10. Sahabatku tersayang, Renny dan Vhia. Terima kasih untuk semua persahabatan kita selama ini, untuk semua cerita yang tertumpah dan untuk semua waktu yang kita jalani bersama, terima kasih sudah mau mengertiku. Ayank-ayankku, Chahyu, Imel, Tya, Ami, dan Zya. Terima kasih untuk canda tawa yang telah dibagi, untuk gosip-gosip terhangat, untuk tempat-tempat yang telah kita kunjungi bersama dan untuk kantong-kantong belanja. Sangat mewarnai hari-hari penulis selama perkuliahan. 11. Seluruh teman-teman kelas A angkatan 2007, terima kasih untuk semua kebersamaan kita selama 4 tahun ini, untuk semua cerita dan pengalaman yang luar biasa serta diskusi-diskusi berbobot dalam setiap mata kuliah. 12. Teman sesama bimbingan skripsi, Risna, Nuran, Kak Sarah, dan Kak Aji.. Terima kasih sudah menemani hari-hari Penulis selama menjadi penunggu setia ruangan dekanat, menghabiskan waktu menunggu dengan canda tawa,
10
dan berbagi kegalauan dalam proses penyelesaian skripsi. Yeaay, kita bisa ko ‘menjalani’ semua ini yang pada awalnya terkesan sangat berat. 13. Kak Adiyo, terima kasih telah sabar mengajari penulis tata cara penggunaan Lisrel mulai dari Penulis tidak bisa sama sekali sampai akhirnya bisa. Kak Vhia, terima kasih atas sharing nya serta masukan bagi Penulis. 14. Pihak PPM atas data yang telah disediakan, terima kasih telah memudahkan Penulis dalam mengambil data bagi penelitian ini. 15. Seluruh pihak yang tidak dapat disebutkan satu per satu, terima kasih untuk segala doa, dukungan dan bantuan yang telah diberikan untuk membantu penulis dalam menyelesaikan skripsi ini. Semoga seluruh bantuan yang telah diberikan dibalas berlipat ganda oleh Allah SWT. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan. Oleh karena itu, segala kritik dan saran yang membangun akan sangat berguna agar pada penulisan selanjutnya dapat menghasilkan karya yang lebih baik. Semoga skripsi ini dapat bermanfaat bagi siapapun yang membacanya.
Jakarta, 22 September 2011
Penulis
11
DAFTAR ISI
Lembar Pengesahan Pembimbing
i
Lembar Pengesahan Panitia Ujian
ii
Lembar Orisinalitas
iii
Motto dan Persembahan
iv
Abstrak
vi
Kata Pengantar
viii
Daftar Isi
xi
Daftar Tabel
xiii
Daftar Gambar
xv
Daftar Lampiran
xvi
BAB I Pendahuluan 1.1 Latar Belakang
1
1.2 Pembatasan Masalah
10
1.3 Perumusan Masalah
10
1.4 Tujuan Penelitian
11
1.5 Manfaat penelitian
11
1.6 Sistematika Penulisan
12
BAB II Kajian Teori 2.1 Bahasan Umum Mengenai Tes Psikologi
14
2.2 Bakat 2.2.1 Definisi Bakat
17
2.2.2 Faktor-faktor Yang Mempengaruhi Perkembangan Bakat
17
2.2.3 Tes Bakat
19
2.3 Inteligensi
22
2.3.1
Definisi Inteligensi
22
2.3.2
Teori-teori Inteligensi
23
2.3.3
Pengukuran Inteligensi
28
2.3 Konstruksi Tes
33
12
2.3.1
Validitas
33
2.3.2
Reliabilitas
38
2.4 Gambaran Umum GATB
40
2.5 Kerangka Berpikir
48
2.6 Hipotesis
50
BAB III Metode Penelitian 3.1 Subjek Penelitian
51
3.2 Instrumen Penelitian
52
3.3 Metode Analisis Data
54
3.4 Prosedur Penelitian
61
BAB IV Hasil Penelitian 4.1 Validitas Konstruk Tingkat Subtes
63
4.1.1 Validitas Konstruk Subtes Computation
63
4.1.2 Validitas Konstruk Subtes Three Dimensional Space
70
4.1.3 Validitas Konstruk Subtes Vocabulary
81
4.1.4 Validitas Konstruk Subtes Arithmetic Reasoning
88
4.2 Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu
97
Konstruk Bersifat Umum (General Intelligence) BAB V Kesimpulan, Diskusi dan Saran 5.1 Kesimpulan
100
5.2 Diskusi
104
5.3 Saran
107
5.3.1 Saran Metodologis
108
5.3.2 Saran Praktis
109
Daftar Pustaka
110
Lampiran
112
13
DAFTAR TABEL
Tabel 2.1
Faktor-Faktor dan Komposit General Aptitude Test
48
Battery (GATB) Tabel 4.1
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
67
pada Computation Tabel 4.1
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
68
pada Computation (Lanjutan) Tabel 4.2
Muatan Faktor Item GATB Subtes Computation
69
Tabel 4.2
Muatan Faktor Item GATB Subtes Computation
70
(Lanjutan) Tabel 4.3
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
74
pada Three Dimensional Space Tabel 4.3
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
75
pada Three Dimensional Space (Lanjutan) Tabel 4.3
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
76
pada Three Dimensional Space (Lanjutan) Tabel 4.4
Muatan Faktor Item GATB Subtes Three Dimensional
77
Space Tabel 4.4
Muatan Faktor Item GATB Subtes Three Dimensional
78
Space (Lanjutan) Tabel 4.5
Rotated
Component
Matrix
pada
Subtes
Three
80
Dimensional Space Tabel 4.6
Sebaran Item GATB subtes Three Dimensional Space
81
Tabel 4.7
Muatan Faktor Item GATB Subtes Vocabulary
85
Tabel 4.7
Muatan
Faktor
Item
GATB
Subtes
Vocabulary
86
Item
GATB
Subtes
Vocabulary
87
(Lanjutan) Tabel 4.7
Muatan
Faktor
(Lanjutan)
14
Tabel 4.8
Matriks Korelasi antar Kesalahan Pengukuran Butir Item pada
Tabel 4.8
92
Arithmetic Reasoning
Matriks Korelasi antar Kesalahan Pengukuran Butir Item
93
pada Arithmetic Reasoning (Lanjutan) Tabel 4.9
Muatan Faktor Item GATB Subtes Arithmetic Reasoning
94
Tabel 4.10
Rotated Component Matrix pada Subtes Arithmetic
96
Reasoning Tabel 4.11
Sebaran Item GATB subtes Arithmetic Reasoning
97
Tabel 4.12
Koefisien Muatan Faktor Untuk General Intelligence
98
Tabel 5.1
Analisis CFA Pada Setiap Subtes GATB
101
Tabel 5.2
Hasil Pengujian Model Satu Faktor Setiap Subtes GATB
102
15
DAFTAR GAMBAR
Gambar 2.1
Model Hirarki Inteligensi Vernon
27
Gambar 2.2
Kerangka Berfikir Berdasarkan Subtes
49
Gambar 2.3
Kerangka Berfikir Berdasarkan Sebaran Item
49
Gambar 4.1
Analisis faktor Konfirmatorik Untuk Subtes Computation
66
Gambar 4.2
Analisis faktor Konfirmatorik Untuk Subtes
73
Three Dimensional Space Gambar 4.3
Analisis faktor Konfirmatorik Untuk Subtes Vocabulary
84
Gambar 4.4
Analisis faktor Konfirmatorik Untuk Subtes Arithmetic
91
Reasoning Gambar 4.5
Koefisiein Muatan Faktor Untuk General Intelligence
16
98
DAFTAR LAMPIRAN
Lampiran A
: Surat Keterangan Penelitian
Lampiran B
: Analisis Faktor Konfirmatorik Computation Analisis Faktor Konfirmatorik Three Dimensional Space Analisis Faktor Konfirmatorik Vocabulary Analisis Faktor Konfirmatorik Arithmetic Reasoning Analisis Faktor Konfirmatorik 2nd Order GATB
17
BAB I PENDAHULUAN
Dalam bab pendahuluan ini akan dibahas mengenai latar belakang penelitian, batasan masalah, perumusan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penelitian.
1.1 Latar Belakang
Sumber daya manusia dalam perusahaan merupakan aset yang paling berharga. Optimalisasi hasil pencapaian perusahaan akan sangat didukung oleh peningkatan peran para manajer fungsional yang terlibat dalam pengelolaan sumber daya manusia. Dewasa ini aspek pengembangan sumber daya manusia semakin mendapat perhatian khusus dari para pimpinan perusahaan. Pimpinan perusahaan memperhatikan aspek sumber daya manusia dalam menentukan pola penentuan strategi dan kebijakan secara terpadu. Pengelolaan faktor sumber daya manusia sangat penting karena memegang peran utama dalam pelaksanaan kegiatan fungsifungsi yang lain dalam perusahaan.
Untuk mencapai visi dan misi perusahaan, kualitas SDM merupakan faktor penting yang perlu dipersiapkan perusahaan sejak dini mulai dari melakukan proses rekruitmen. Proses rekruitmen pada dasarnya adalah proses untuk memilih berbagai sumber dari calon karyawan potensial dan usaha untuk menariknya agar bersedia masuk menjadi bagian dari suatu perusahaan. Dengan merekrut karyawan yang potensial dan memiliki kesiapan psikologis yang baik, serta
18
penempatan karyawan
yang tepat, perusahaan akan lebih lebih mudah
memperoleh produktivitas yang optimal dari karyawan dan karyawan pun merasa nyaman serta dapat menikmati pekerjaan yang mereka lakukan.
Munandar (2001) menjelaskan bahwa sasaran seleksi adalah suatu rekomendasi atau suatu keputusan untuk menerima atau menolak seorang calon untuk pekerjaan tertentu berdasarkan suatu dugaan tentang kemungkinankemungkinan dari calon untuk menjadi tenaga kerja yang berhasil pada pekerjaannya.
Tujuan utama dari proses seleksi adalah untuk mendapatkan orang yang tepat bagi suatu jabatan tertentu, sehingga orang tersebut mampu bekerja secara optimal dan dapat bertahan di perusahaan untuk waktu yang lama. Meskipun tujuannya terdengar sangat sederhana, proses tersebut ternyata sangat kompleks, memakan waktu cukup lama, menggunakan biaya yang tidak sedikit dan sangat terbuka peluang untuk melakukan kesalahan dalam menentukan orang yang tepat. Kesalahan dalam memilih orang yang tepat sangat besar dampaknya bagi perusahaan atau organisasi. Hal tersebut bukan saja karena proses rekruitmen dan seleksi itu sendiri telah menyita waktu, biaya dan tenaga, tetapi juga karena menerima orang yang salah untuk suatu jabatan akan berdampak pada efisiensi, produktivitas, dan dapat merusak moral kerja pegawai yang bersangkutan dan orang-orang di sekitarnya. Tahapan seleksi yang utama dalam proses perekrutan adalah mengikuti tes psikologi.
19
Tes psikologi adalah sebuah instrumen pengukuran yang memiliki tiga karakteristik yang menentukan sebuah contoh dari perilaku, sampel yang diperoleh dalam suatu tes harus dibawah kondisi standar, dan ada penetapan aturan untuk penilaian atau untuk memperoleh informasi kuantitatif (numerik) dari sampel perilaku (Murphy, 1994).
Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan sumber daya manusia dalam bidang industri dan organisasi (Gregory, 2000). Pengambilan keputusan tersebut berkaitan dengan penerimaan dan penempatan, promosi, evaluasi, maupun penepatan karier. Keberagaman dari perkembangan tes psikologi sangat mengejutkan. Terdapat lebih dari 1.000 tes psikologis yang berbeda dan tersedia secara komersial di negara-negara barat dan tidak diragukan lagi terdapat ratusan lainnya yang diterbitkan di seluruh bagian dunia. Tes ini berkisar dari tes kepribadian dan tes guna mendapatkan skor IQ, tes pemeriksaan skolastik sampai tes persepsi. Meskipun terdiri dari berbagai keberagaman, ada beberapa bagian yang biasanya terdapat di semua tes psikologi, diambil secara bersama-sama, dan kemudian terciptalah definisi dari “test” (Loewenthal, 1997 ).
Kebutuhan akan alat tes untuk asesmen mendorong banyak dikembangkan berbagai alat ukur tes psikologis baik itu berupa tes, self-report, skala, maupun inventori. Pengembangan alat ukur dapat dilakukan dengan membuat alat ukur atau melakukan adaptasi terhadap alat ukur yang telah dibuat di luar negeri.
Di Indonesia, psikotes merupakan istilah umum yang digunakan untuk menjelaskan proses pemeriksaan psikologis calon pegawai. Banyak alat tes yang
20
dapat digunakan untuk proses seleksi, seperti melalui proses assessment, tes pengetahuan, psikotes, battery test, maupun Behavior Interview. Tujuan dari proses seleksi tentunya adalah untuk benar-benar dapat memperlihatkan kapabilitas calon karyawan dan menentukan apakah kapabilitas yang dia miliki sesuai dengan jabatan. Kunci utama keberhasilan sebuah seleksi adalah tersedia rincian kompetensi (baik teknis maupun perilaku) yang diperlukan agar dapat berhasil.
Menurut Davis (2009) keutamaan dari tes psikologi bila digunakan dalam bidang industri adalah:
1. Objektif dalam arti mengurangi sekecil mungkin efek bias atau prasangka berdasarkan usia, jenis kelamin, agama, maupun politik. 2. Konsisten karena semua calon mendapatkan pertanyaan atau latihan yang sama dengan urutan yang sama dengan durasi waktu yang sama untuk menjawabnya, dengan asumsi dilakukan dalam lingkungan terkendali sesuai petunjuk pembuatnya. Bahkan sekarang ada variasi di mana beberapa tes kemampuan verbal dan numerik secara online menciptakan sekumpulan pertanyaan khas dari bank soal yang besar, di mana tiap pertanyaan dianggap memiliki tingkat kesulitan yang sama, sehingga masih memungkinkan dilakukan penilaian komparatif. 3. Dapat memprediksi kinerja efektif. Banyak studi menunjukkan bahwa penggunaan tes psikologi yang berkualitas dalam hubungannya dengan
21
asesmen pengetahuan dan wawancara terstruktur ternyata dapat meningkatkan efektivitas rekrutmen. 4. Dapat memberikan wawasan "kesadaran diri" kepada calon dan juga organisasi. Perasaan bahwa seorang individu akan belajar dan berkembang secara pribadi merupakan motivator yang penting. Oleh karena itu keadaan ini bermanfaat untuk mempertahankan karyawan (retention agent).
Dalam proses seleksi, salah satu cara yang umum dilakukan adalah melakukan pemeriksaan atau tes psikologis pada calon karyawan guna untuk meramalkan kemungkinan keberhasilan calon karyawan dalam jabatan atau pekerjaan tertentu. Ada berbagai alat ukur psikologis yang umumnya digunakan dalam proses seleksi seperti kepribadian objektif
tes kecakapan atau kemampuan kognitif, tes
dan proyektif, tes situasional, informasi biografi, dan
wawancara. Salah satu tes yang paling umum digunakan dan menjadi dasar pada tes selanjutnya adalah tes bakat dan tes inteligensi.
Dalam bidang pekerjaan, kegiatan seleksi, penempatan dan promosi karyawan juga melibatkan tes inteligensi. Smith (dalam Cook & Cripps, 2005) menunjukkan bahwa pengukuran mental ability bersifat universal dalam kegiatan seleksi, sesuatu yang dibutuhkan dan berguna pada berbagai bidang pekerjaan. Melalui tes inteligensi perusahaan terbantu dalam mengidentifikasi calon-calon karyawan yang potensial untuk diseleksi atau dikembangkan.
22
Tes Inteligensi merupakan upaya untuk mengukur kecerdasan seseorang, yaitu kemampuan dasar seseorang untuk memahami dunia di sekitarnya seperti fungsi asimilasi dan menerapkan pengetahuan tersebut untuk meningkatkan kualitas hidupnya. Telah diketahui bahwa kinerja pada tes inteligensi akademik memiliki korelasi yang substansial dengan tingkat pendidikan. Maka akan terlihat bahwa persyaratan pendidikan dapat diterapkan untuk mencakup kualifikasi pelamar dalam kelompok keterampilan kognitif dan pengetahuan. Namun hal tersebut dirasa tidak adil, karena pengetahuan dan keterampilan dapat diperoleh melalui pendidikan non formal atau pelatihan-pelatihan yang lain (Anastasi & Urbina, 1997).
Tes-tes inteligensi didesain untuk mengukur general ability, tetapi orang merasakan bahwa kemampuan-kemampuan yang terukur oleh tes inteligensi tidak meliput kemampuan-kemampuan atau fungsi-fungsi khusus yang dibutuhkan dalam pekerjaan. Sejak Perang Dunia I para psikolog mulai membuat testes aptitude khusus untuk kebutuhan konseling pekerjaan (vocational counseling) yang dapat melengkapi tes-tes inteligensi umum. Tes-tes aptitude atau bakat khusus yang banyak dipakai adalah tes-tes mekanikal, spasial, perseptual, klerikal, musikal, dan artistik. Tes-tes ini dipakai dalam seleksi dan penempatan (klasifikasi) karyawan dalam perusahaan dan ketentaraan (Anastasi & Urbina, 1997).
23
Tes bakat atau aptitude test adalah tugas-tugas baku yang dirancang untuk mengungkapkan kemampuan atau keberhasilan seseorang dalam melaksanakan suatu pekerjaan di masa mendatang. Dalam bidang industri,bakat seseorang perlu diketahui apakah ia tepat menduduki jabatan tertentu. Hasil tes bakat bisa membantu suatu perusahaan atau lembaga untuk menempatkan karyawan atau calon karyawan pada posisi yang sesuai dengan kualifikasi yang dibutuhkan.
Tes bakat dapat meramalkan bakat-bakat seseorang dalam berbagai bidang atau dalam hal pekerjaan yang dipilihnya serta kesuksesan-kesuksesan bekerja di masa datang. Seorang yang dapat memilih dan menyesuaikan pekerjaan yang sesuai dengan bakatnya akan membuat seseorang tersebut mempunyai semangat kerja yang tinggi dan kepuasan kerja akan tercapai. Sebaliknya seorang individu yang dipaksa atau terpaksa bekerja tidak sesuai dengan bakatnya akan menimbulkan kelesuan kerja, semangat kerja rendah, ketidakpercayaan pada diri sendiri, banyak membuat kesalahan-kesalahan dan menimbulkan frustrasi bagi individu yang bersangkutan.
Salah satu alat tes yang biasa dipakai tersebut adalah General Apitude Test Battery (GATB). GATB adalah suatu alat tes yang berhubungan dengan jabatan yang berorientasi pada beberapa tes bakat baterai yang mengukur sembilan bakat dalam delapan tes tulis serta empat perangkat tes yaitu name comparison, computation, three dimensional space, vocabulary, tool matching, arithmetic reason, form matching, mark making, place, turn, dan disassemble.
24
Penelitian ini menggunakan empat subtes dari GATB yaitu computation, three dimensional space, vocabulary, dan arithmetic reasoning dengan jumlah total 175 item. Keempat subtes tersebut digunakan karena subtes ini merupakan tes bakat dalam penilaian skolastik. Tes bakat skolastik adalah sebuah tes yang bertujuan
untuk mengetahui bakat dan kemampuan seseorang di bidang
keilmuan. Tes ini juga dapat mencerminkan tingkat kecerdasan intelektual (IQ) seseorang.
Dalam penelitian ini GATB digunakan karena tes tersebut mengukur kemampuan-kemampuan umum pada individu dan dapat dipakai untuk semua kalangan. GATB merupakan salah satu alat tes bakat dan inteligensi yang telah lama diciptakan dan digunakan dalam pengetesan psikologi. GATB dapat digunakan secara individual, klasikal maupun berkelompok, serta dapat memberikan gambaran atau profil seseorang mengenai kelemahan maupun kekuatan yang dimilikinya berdasarkan berbagai aspek yang terkait dengan fungsi inteligensinya.
Keuntungan dari penggunaan alat tes GATB sebagai salah satu tes untuk mengukur inteligensi adalah pengadministrasian tes lebih mudah, waktu pengerjaan tes yang relatif singkat dapat menghemat waktu dalam pengerjaan. Dalam penghitungan skor IQ juga jauh lebih mudah apabila dibandingkan dengan menggunakan alat tes inteligensi lainnya sehingga tidak perlu lagi menggunakan tenaga professional yang berdampak pada penghematan biaya tes. Namun, alat tes GATB ini telah lama digunakan karena termasuk salah satu alat tes yang tertua.
25
Belum adanya pengujian validitas pada item subtes GATB yang menyebabkan item subtes GATB belum memuaskan. Oleh karena itu, peneliti akan meneliti dengan teori modern dalam rangka menguji validitas konstruk dari GATB. Dikarenakan peneliti belum mempelajari secara khusus statistik tentang analisis faktor, maka peneliti hanya akan mempraktekkannya saja dengan software yang sudah ada, yaitu Lisrel kemudian menafsirkan hasil analisis faktor terhadap data hasil tes.
Alat tes GATB telah lama digunakan sebagai alat penyeleksian calon pegawai. Mengingat alat tes tersebut digunakan untuk banyak kegiatan penyeleksian calon karyawan maka perlu adanya pengujian validitas, sehingga tes tersebut masih layak digunakan sebagai alat tes inteligensi. Kaplan & Saccuzzo (2009) mengatakan bahwa tes yang baik minimal harus memenuhi syarat: 1) validity; 2) reliability; 3) objectivity; dan 4) usability. Dalam menggunakan alat ukur psikologis, setelah kriteria valid telah dipenuhi, maka hasil validitas itu akan memberikan jawaban sebagai alat ukur yang baik atau tidak. Setelah validasi alat tes, dapat diketahui item yang gugur dan membuat kurang baiknya suatu alat ukur psikologis.
Kenyataan ini menunjukkan bahwa perlu sekali mengadakan berbagai penelitian yang berkaitan dengan ‘keabsahan’ (keabsahan ramalan, keabsahan konstruk, keabsahan isi, keabsahan sintetik) dari perangkat tes psikologik yang digunakan dalam seleksi dan asesmen, sehingga seleksi dan asesmen psikologik
26
untuk berbagai tujuan menjadi lebih menggunakan kaidah-kaidah ilmiah (Munandar, 2001).
Berdasarkan pemaparan di atas, peneliti tertarik untuk melakukan penelitian mengenai studi validitas konstruk alat tes GATB secara lebih mendalam agar mendapatkan gambaran yang lebih jelas mengenai tingkat validitas suatu alat tes. Data penelitian di dapatkan dari Asesmen SDM PPM Manajemen yang juga menggunakan GATB sebagai salah satu alat tes psikologis dalam proses rekruitmen dan seleksi di seluruh Indonesia.
1.2 Pembatasan Masalah
Penelitian ini menggunakan data sekunder di PPM, yang beralamatkan Jl. Menteng Raya 9, Jakarta. Respondennya adalah semua karyawan dari PT Semen Tonasa yang mengikuti serangkaian proses asesmen dari PPM pada tahun 2009 yang mengikuti tes di Jakarta. Untuk mengukur validiasi dari sebuah alat tes, penelitian ini terfokus kepada empat subtes dalam GATB yang terdiri dari: computation, three dimensional space, vocabulary, dan arithmetic reasoning.
1.3 Perumusan Masalah
Merujuk kepada latar belakang yang telah diuraikan, maka penulis merumuskan masalah sebagai berikut, yaitu:
1. Apakah benar seluruh item dalam empat subtes GATB yang dijadikan penelitian mengukur konstruk yang dimaksud. Konstruk yang dimaksud
27
adalah computation, three dimensional space, vocabulary, dan three dimensional space. Dimana setiap item dalam masing-masing subtes adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada suatu subtes mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut. Apakah setiap item dalam masing-masing subtes secara signifikan mengukur kemampuan pada subtes tersebut? 2. Apakah empat subtes dalam GATB fit (sesuai) dengan model satu faktor, yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah “Inteligensi”?
1.4 Tujuan Penelitian
Penelitian ini bertujuan untuk mengetahui validitas konstruk GATB, sehingga alat tes GATB tersebut masih dapat digunakan pada pengetesan calon pegawai di dalam berbagai lembaga psikologi yang menggunakan alat tes GATB karena pada kenyataannya alat tes GATB masih dipakai secara konsisten dalam pengetesan kemampuan umum atau inteligensi.
1.5 Manfaat Penelitian
Secara pokok dan
prinsip tujuan penelitian ini adalah menjawab pertanyaan
penelitian yang telah peneliti rumuskan diatas. Oleh karenanya tujuan dan manfaat subtansial penelitian ini sangat berkaitan erat dengan pertanyaan penelitiannya yaitu:
28
a. Secara teoritik, hasil penelitian ini diharapkan dapat menambah khasanah ilmu pengetahuan psikologi, khususnya psikologi industri dan organisasi dan memberikan gambaran mengenai bagaimana menggunakan software Lisrel untuk menguji validitas konstruk dari sebuah alat ukur psikologi. Sehingga, menambah ilmu baru pada peneliti, lembaga psikologi yang menggunakan alat tes GATB, maupun pembaca. b. Secara praktis, hasil penelitian ini bermanfaat bagi pengguna tes GATB, sehingga alat tes tersebut dapat disempurnakan dan digunakan pada pengetesan calon pegawai berikutnya di lembaga psikologi yang menggunakan GATB sebagai salah satu alat tes
dengan tingkat
validitas yang lebih tinggi.
1.6 Sistematika Penelitian
Sistematika penulisan skripsi dengan judul “Uji Validitas Konstruk General Aptitude Test Battery (GATB) Dengan Teknik CFA” terdiri dari lima bab, yaitu
BAB 1
: Pendahuluan Dalam bab pendahuluan ini akan dibahas mengenai latar belakang penelitian, pembatasan masalah, perumusan masalah, tujuan penelitian, manfaat penelitian baik yang teoritis maupun praktis, dan sistematika penelitian.
29
BAB 2
: Kajian Teori Dalam bab kajian teori ini berisi sub bab deskriptif teoritis yang membahas mengenai bahasan umum mengenai tes psikologi, halhal mengenai bakat dan inteligensi serta teori inteligensi yang digunakan oleh alat tes GATB, definisi validitas dan reliabilitas, gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis penelitian
BAB 3
: Metode Penelitian Dalam bab metode penelitian ini akan dibahas mengenai metode penelitian yang terdiri dari subjek penelitian, metode analisis data, dan prosedur penelitian.
BAB 4
: Hasil Penelitian Dalam bab empat ini, akan dibahas mengenai hasil penelitian yang telah dilakukan. Pembahasan tersebut meliputi validitas yang dihasilkan oleh analisis faktor, dengan masing-masing skalanya.
BAB 5
: Kesimpulan, Diskusi, dan Saran Dalam bab lima ini akan dipaparkan keseluruhan isi penelitian dan menyimpulkan hasil penelitian. Dalam bab ini juga akan dimuat diskusi dan saran.
30
BAB II KAJIAN TEORI
Dalam bab kajian teori ini akan dipaparkan mengenai teori yang digunakan dalam penelitian ini yang terdiri dari sub bab deskriptif teoritis yang membahas mengenai tes psikologi, hal-hal mengenai bakat dan inteligensi serta teori inteligensi yang digunakan dalam penelitian, definisi validitas dan reliabilitas, gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis penelitian.
2.1.
Bahasan Umum Mengenai Tes Psikologi
Dalam kamus Psikologi, tes adalah satu perangkat pertanyaan yang sudah dibakukan, yang dikenakan pada seseorang dengan tujuan untuk mengukur perolehan atau bakat pada suatu bidang tertentu (Chaplin, 2006). Anne Anastasi (1997) menjelaskan bahwa tes psikologi merupakan alat ukur yang terstandar dan objektif tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes psikologi - melalui item-itemnya - haruslah mencerminkan perilaku yang hendak diukur. Ia objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah berisi hal-hal penting yang hendak diukur supaya representatif.
Cronbach (1984) menyatakan tidak ada definisi tes yang dianggap tuntas, melainkan para ahli mendefinisikan tes menurut cara pandangnya sendirisendiri. Cronbach (1984) cenderung mendefinisikan tes psikologis sebagai suatu prosedur yang distandardisasikan (standardization of procedure) yang digunakan tester untuk mengukur kemampuan potensi subyek. Dalam pandangan ini,
31
prosedur (procedure) diartikan sebagai tata cara yang spesifik dan konkrit. Dari batasan tersebut dapat diambil kesimpulan. Pertama, tes merupakan prosedur sistematis. Item-item dalam tes disusun dengan cara dan aturan tertentu, prosedur administrasi dan pemberian angka (skoring) tes harus jelas dan dispesifikasikan secara terperinci, dan setiap orang yang mengambil tes tersebut harus mendapat item-item yang sama dan dalam kondisi yang sebanding. Kedua, tes berisi sampel perilaku. Keseluruhan item itu mustahil dapat seluruhnya tercakup dalam tes. Kelayakan tes lebih tergantung kepada sejauh mana item-item di dalam tes mewakili secara representatif kawasan (domain) perilaku yang diukur. Ketiga, tes mengukur perilaku. Item-item dalam tes menghendaki subyek agar menunjukkan apa yang diketahui atau apa yang telah dipelajari subyek dengan cara menjawab item-item atau mengerjakan tugas-tugas yang dikehendaki oleh tes.
Sebuah tes psikologi pada dasarnya adalah alat ukur yang objektif dan dibakukan atas sampel perilaku tertentu (Anastasi & Urbina, 1997). Dalam psikologi, tes dapat diklasifikasikan menjadi lima, yaitu: Pertama, tes yang mengukur inteligensi umum (general intelligence test). Tes ini dirancang untuk mengukur kemampuan umum seseorang dalam suatu tugas. Kedua, tes yang mengukur kemampuan khusus atau tes bakat (special ability test). Tes ini digunakan untuk mengungkap kemampuan potensial subjek dalam bidang tertentu. Ketiga, tes yang mengukur prestasi (achievement test). Tes ini dimaksudkan untuk mengukur tingkat pembelajaran, keberhasilan, atau prestasi seseorang dalam memahami hasil pembelajaran. Keempat, tes yang mengungkap aspek kepribadian (personality assesment). Tes ini mengungkap sifat-sifat,
32
kualitas, atau perilaku individual subjek dalam aspek non ability. Kelima, tes yang menilai kreativitas dari seseorang (creativity test). Tes ini menilai kemampuan subjek untuk menghasilkan ide-ide baru, atau kreasiartistik yang dapat diterima sebagai nilai sosial, artistik, atau ilmiah (Greogory, 2000)
Berdasarkan beberapa pengertian di atas dapat disimpulkan pengertian tes adalah suatu alat atau metode pengumpulan data yang sudah distandardisasikan untuk mengukur atau mengevaluasi salah satu aspek kemampuan atau kecakapan dengan jalan mengukur sampel dari salah satu aspek tersebut. Dengan demikian tes merupakan alat pengumpul data untuk mengetahui kemampuan individu atau kelompok
individu
dalam
menyelesaikan
sesuatu
atau
memperlihatkan
keterampilan tertentu, dalam memperlihatkan hasil belajar, atau dalam menggunakan kemampuan psikologis untuk memecahkan suatu persoalan.
Penelitian ini akan menggunakan definisi tes psikologi yang disampaikan oleh Anastasi, bahwa tes psikologi adalah alat ukur yang terstandar dan objektif tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes psikologi – melalui item-itemnya - haruslah mencerminkan perilaku yang hendak diukur. Ia objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah berisi halhal penting yang hendak diukur supaya representatif.
33
2.2.
Bakat
2.2.1. Definisi Bakat
Bakat menurut definisi Bingham (dalam Saparinah Sadli, 1991) adalah suatu kondisi atau seperangkat karakteristik yang dianggap sebagai kemampuan individu untuk memperoleh pengetahuan melalui suatu latihan khusus guna mencapai suatu keterampilan, kemampuan berbahasa, bermusik dan lain sebagainya.
Coyle (2009) mendefinisikan bakat sebagai keterampilan bersifat berulang yang tidak tergantung pada ukuran fisik. Atas dasar definisi tersebut, bakat tidak berhubungan sama sekali dengan kondisi fisik seseorang. Menurut Buckingham & Coffman (1999) Bakat adalah suatu pola berulang dalam berpikir, merasakan, atau berperilaku yang bisa diterapkan secara produktif.
Dari pengertian mengenai bakat diatas dapat disimpulan bahwa bakat adalah kemampuan bawaan yang merupakan potensi yang masih perlu dikembangkan atau dilatih untuk mencapai suatu kecakapan, pengetahuan, dan keterampilan khusus.
2.2.2. Faktor-faktor Yang Mempengaruhi Perkembangan Bakat
Bakat berkembang sebagai hasil interaksi dari faktor yang bersumber dari dalam diri individu dan dari lingkungannya. Apabila kedua faktor tersebut bersifat saling mendukung maka bakat yang ada akan dapat berkembang secara optimal.
34
Manakah di antara kedua faktor tersebut yang paling besar pengaruhnya, ini sangat sulit sekali untuk menentukannya dengan tepat (Rahman,2004).
Faktor
yang
bersumber
dari
diri
individu
yang
mempengaruhi
perkembangan bakat, antara lain:
1. Kemampuan atau potensi individu yang dibawa sejak lahir. Faktor bawaan akan sangat menentukan pembentukan dan perkembangan bakat seseorang. Lingkungan tidak akan dapat merubah membentuk manusia melebihi batas kemampuan yang dimiliki manusia. 2. Minat individu yang bersangkutan. Suatu bakat tertentu tidak akan berkembang dengan baik apabila tidak disertai minat yang cukup tinggi terhadap bidang atau hal yang sesuai dengan bakat tersebut.. 3. Motivasi yang dimiliki individu. Suatu bakat akan menjadi kurang berkembang atau tidak akan menonjol bila kurang disertai oleh adanya motivasi yang cukup tinggi untuk mengaktualisasikannya, karena motivasi berhubungan erat dengan daya juang seseorang untuk mencapai suatu tujuan. 4. Nilai hidup yang dimiliki individu. Yang dimaksud dengan nilai hidup di sini adalah bagaimana cara seseorang memberi arti terhadap sesuatu di dalam hidupnya. 5. Kepribadian individu. Faktor kepribadian ini sangat memegang peranan bagi perkembangan bakat seseorang, misal konsep diri, rasa
35
percaya diri, keuletan atau keteguhan dalam berusaha, kesediaan untuk menerima kritik dan saran demi untuk meraih sukses yang tinggi. 6. Maturity (kematangan). Bakat tertentu akan berkembang dengan baik apabila sudah mendekati atau menginjak masa pekanya. Suatu hal yang sulit adalah dalam menentukan kapankah saatnya (pada usia berapakah) suatu kemampuan atau bakat tertentu sudah matang untuk dikembangkan atau dilatih, karena untuk masing-masing kemampuan dan untuk setiap orang kematangannya belum tentu atau tidak selalu sama.
Sebagaimana sudah diuraikan sebelumnya bahwa lingkungan juga memegang peranan yang sangat menentukan berkembang tidaknya suatu bakat. Oleh karena itu lingkungan dapat berfungsi sebagai perangsang untuk berkembangnya bakat, tetapi dapat juga sebaliknya lingkungan justru menjadi faktor penghambat bagi aktualisasi dan perkembangan bakat yang dimiliki seseorang.
2.2.3. Tes Bakat
Tes bakat pada awalnya diprakarsai oleh seorang ahli yang bernama A. Musterberg. Mula-mula tes bakat digunakan pada masa perang dunia I untuk menyeleksi pilot, pengemudi dan kemudian meluas ke bidang industri.
Tahun 1920-1930, tes yang digunakan adalah tes inteligensi umum, karena tes inteligensi pada saat itu dianggap sebagai satu-satunya tes yang mutlak dapat
36
mementukan kemampuan seseorang. Tes inteligensi umum ini meskipun mengandung berbagai aspek penting yang menunjang berfungsinya inteligensi seseorang seperti kemampuan berbahasa, kemampuan penalaran, semuanya menunjang satu angka sebagai keseluruhan unit inteligensi yang biasanya dinyatakan sebagai IQ. Namun, masing-masing aspek tidak dimaksudkan untuk disimpulkan sendiri-sendiri.
Tes inteligensi yang hanya dapat memberikan gambaran kemampuan umum dan tidak dapat memberikan gambaran kemampuan umum dan profil kemampuan seseorang pada aspek tertentu dirasakan kurang. Diperlukan adanya tes lain yang dapat mengukur bermacam aspek secara khusus, ileh karena pada kenyataannya ada perbedaan profil kemampuan antara individu yang satu dengan individu lainnya. Maka diperlukan penciptaan tes bakat yang dapat mengukur kemampuan di dalam berbagai aspek sebagai pelengkap tes inteligensi.
Dasar dari tes bakat adalah membandingkan profil nilai seseorang dengan profil nilai orang lain yang dianggap berkemampuan tinggi mengenai bidang tertentu. Dengan cara menyimpulkan kekuatan atau kelemahannya, maka dapat terukur kadar bakat yang dimiliki oleh seseorang.
Secara garis besar tes bakat dapat dikelompokkan menjadi dua bagian besar (Anastasi, 1997), yaitu:
1.
Multiple Aptitude Batteries yaitu tes bakat yang mengukur bermacammacam kemampuan, seperti. pengertian bahasa, kemampuan angka-
37
angka, penglihatan keruangan, penalaran dalam berhitung, kecepatan dan ketepatan dalam persepsi. Dari hasil tes dapat dilihat kemampuan, kekuatan dan kelemahan seseorang yang masing-masing dinyata- kan dalam angka-angka tersendiri, hasilnya adalah berupa profil angkaangka. Berbeda dengan tes inteligensi umum dimana semua aspek inteligensi keluar sebagai satu angka yaitu IQ. Tes ini termasuk tes bakat yang sudah cukup lama dipakai, yaitu sejak perang Dunia I. Yang termasuk jenis kelompok tes ini antara lain:
a) Differential Aptitude Test (DAT), terdiri dari 8 subtes. b) General Aptitude Test Batteries (GATB), terdiri dari 9 subtes. c) Flanagan Aptitude Classification Test (FACT), terdiri dari 14 subtes.
2.
Special Aptitude Test atau Single Aptitude Test atau tes bakat khusus, yakni tes yang hanya mengukur satu bakat khusus tertentu. Sebagai contoh:
a) Musical Aptitude Test b) Artistical Aptitude Test. c) Clerical Aptitude Test. d) Mathematical Aptitude Test.
38
2.3.
Inteligensi
2.3.1. Definisi Inteligensi
Definisi inteligensi telah banyak yang dikemukakan oleh para ahli psikologi maupun ahli pendidikan. Beberapa diantaranya akan dikemukakan disini untuk mengarahkan pemahaman terhadap penelitian ini.
J. P. Guilford menjelaskan bahwa tes inteligensi hanya dirancang untuk mengukur proses berpikir yang bersifat konvergen, yaitu kemampuan untuk memberikan satu jawaban atau kesimpulan yang logis berdasarkan informasi yang diberikan. Sedangkan kreativitas adalah suatu proses berpikir yang bersifat divergen, yaitu kemampuan untuk memberikan berbagai alternatif jawaban berdasarkan informasi yang diberikan. Lebih jauh, Guilford menyatakan bahwa inteligensi merupakan perpaduan dari banyak faktor khusus.
Howard Gardner (1985) mengemukakan bahwa inteligensi adalah kemampuan untuk memecahkan masalah, atau menciptakan suatu produk dalam berbagai macam setting dan dalam situasi nyata.
Menurut adalah kapasitas
David
Wechsler
(dalam
Jackson,
2003),
Inteligensi
keseluruhan atau global individu untuk bertindak, berpikir
rasional, dan menangani lingkungan secara efektif. Istilah keseluruhan atau global digunakan karena terdiri dari elemen atau kemampuan yang meskipun tidak sepenuhnya independen, namun secara kualitatif terdiferensialkan
39
William Stern mengemukakan inteligensi ialah kesanggupan untuk menyesuaikan diri kepada kebutuhan baru, dengan menggunakan alat-alat berfikir yang sesuai dengan tujuannya. William Stern berpendapat bahwa inteligensi sebagian besar tergantung dengan dasar dan turunan, pendidikan atau lingkungan tidak begitu berpengaruh kepada inteligensi seseorang (Anne Anastasi, 1997).
Alfred Binet (dalam Kaplan, 2009) seorang tokoh utama perintis pengukuran inteligensi bersama Theodore Simon mendefinisikan inteligensi sebagai sisi tunggal dari karakteristik seseorang yang terdiri atas tiga komponen, yaitu (a) kemampuan untuk mengarahkan fikiran atau mengarahkan tindakan, (b) kemampuan untuk mengubah arah tindakan bila tindakan tersebut telah dilaksanakan, dan (c) kemampuan untuk mengeritik diri sendiri atau melakukan autocriticism.
Berdasarkan
pendapat
para
pakar
di
atas
dapat
di
jelaskan
bahwa inteligensi adalah suatu kemampuan mental yang melibatkan proses berpikir secara rasional. Inteligensi tidak dapat diamati secara langsung, melainkan harus disimpulkan dari berbagai tindakan nyata yang merupakan manifestasi dari proses berpikir rasional.
2.3.2. Teori–teori Inteligensi
Penggambaran secara sepintas tentang inteligensi sebagai suatu kemampuan dasar yang bersifat umum telah berkembang menjadi berbagai teori inteligensi, diantaranya adalah:
40
1. Teori Uni Faktor
Teori ini dipandang sebagai teori yang tertua. Alfred Binet termasuk salah satu ahli psikologi yang mengatakan bahwa inteligensi bersifat monogenetik, yaitu berkembang dari satu faktor satuan atau faktor umum. Menurut Binet, inteligensi merupakan sisi tunggal dari karakteristik
yang
terus
berkembang
sejalan
dengan
proses
kematangan seseorang.
Binet menggambarkan inteligensi sebagai sesuatu yang fungsional sehingga memungkinkan orang lain untuk mengamati dan menilai tingkat perkembangan individu berdasar suatu kriteria tertentu. Jadi untuk melihat apakah seseorang cukup cerdas atau tidak, dapat diamati dari cara dan kemampuannya untuk melakukan suatu tindakan dan kemampuannya untuk mengubah arah tindakannya itu apabila perlu. Inilah yang dimaksud dengan komponen arah, adaptasi dan kritik dalam definisi inteligensi.
2. Teori Dwifaktor (The Two-Factor Theory)
Teori dwifaktor dikembangkan oleh Charles Spearman seorang psikolog dan ahli statistik dari Inggris. Spearman (1927) mengusulkan teori kecerdasan dua faktor yang menurutnya dapat menjelaskan pola hubungan antara kelompok tes kognitif yang ia analisis. Dalam bentuknya yang paling sederhana, teori ini menyatakan bahwa kinerja
41
pada setiap tugas kognitif tergantung pada faktor umum (g) ditambah satu atau faktor yang lebih spesifik dan unik untuk tugas tertentu (s) (Aiken, 1997).
Kedua faktor ini, baik faktor “g” maupun faktor “s” bekerja bersamasama sebagai suatu kesatuan. Semua faktor yang spesifik akan bersama-sama membentuk single common factor “g” faktor. Spearman berpendapat bahwa kemampuan seseorang bertindak dalam setiap situasi
sangat
bergantung
pada
kemampuan
umum
maupun
kemampuan khusus. Jadi setiap faktor baik faktor “g” maupun faktor “s” memberi sumbangan pada setiap perilaku yang intelegen.
3. Teori Multifaktor (Multiple factor Theory)
Teori multifaktor dikembangkan oleh Edward Lee Thorndike (1916). Menurut teori ini, inteligensi terdiri dari hubungan-hubungan neural antara stimulus dan respon. Hubungan-hubungan neural khusus inilah yang mengarahkan tingkah laku indivivu. Pada dasarnya teori Thorndike menyatakan bahwa inteligensi terdiri atas berbagai kemampuan spesifik yang ditampakkan dalam wujud perilaku intelegen. Thorndike mengemukakan empat atribut inteligensi, yaitu:
1) Tingkatan, 2) Rentang, 3) Daerah, dan
42
4) Kecepatan
4. Teori Hirearki
Model Hirearki dicetuskan oleh Vernon. Dalam menjelaskan teori inteligensinya, teori ini menempatkan satu faktor kognitif umum (g) dipuncak hierarki, kemudian dibawahnya terdapat dua faktor inteligensi utama (mayor) yaitu verbal-eduacitional (v:ed) dan practical-mechanical-spatial (k:m). Setiap kelompok mayor tersebut kemudian terpecah kedalam beberapa faktor kelompok minor. Sebagai contoh, v:ed terdiri dari kemampuan seperti kefasihan verbal, kemampuan numerik, dan mungkin kreativitas. Beberapa faktor kelompok kecil di bawah k:m adalah pemahaman mekanik, kemampuan psikomotorik, serta hubungan spasial yang kemudian terpecah lagi menjadi bermacam-macam faktor spesifik pada tingkat hierarki yang paling rendah.
Dalam model hirarki kemampuan mental Vernon apabila semakin tinggi posisi faktor dalam diagram maka semakin luas rentang perilakunya.
43
Gambar 2.1 Model Hirarki Inteligensi Vernon
Sumber: Aiken, 1997
5. Teori Primary Mental Ability
Teori ini dikembangan oleh L.L. Thurstone berdasarkan analisis faktor dengan mengkolerasikan 60 tes, yang akhirnya disusun menjadi kecakapan-kecakapan
primer. Thurstone menjelaskan mengenai
organisasi inteligensi yang abstrak atau biasa disebut dengan “Primary-Mental Ability”. Thurstone berpendapat bahwa inteligensi terdiri dari faktor yang jamak (multiple factors), mencakup tujuh kemampuan mental utama (primary mental abilities), yaitu:
1) Verbal meaning (V): Memahami gagasan dan arti kata, yang diukur dengan tes kosa kata. 2) Number (N): Kecepatan dan akurasi melakukan perhitungan aritmatika.
44
3) Space (S): Kemampuan visualisasi hubungan yang berbentuk dalam tiga dimensi, seperti dalam mengenali gambar dalam orientasi berbeda. 4) Perceptual speed (P): Kemampuan untuk membedakan detail visual, serta menetapkan
persamaan dan perbedaan antara
obyek dalam gambar secara cepat. 5) Word fluency (W): Kecepatan dalam memikirkan kata-kata, seperti dalam membuat puisi atau dalam memecahkan anagram. 6) Memory (M): Kemampuan untuk menghafal kata-kata, angka, huruf, dan sejenisnya, dengan cara menulis. 7) Inductive reasoning (I): Kemampuan untuk menurunkan aturan
dari
informasi
yang
diberikan,
seperti
dalam
menentukan aturan dari serangkaian angka dari hanya sebagian dari rangkaian angka tersebut.
Dalam penelitian ini, peneliti akan menggunakan teori inteligensi menurut Thrustone karena teori Thrustone paling sesuai dengan teori yang terdapat dalam GATB.
2.3.3. Pengukuran Inteligensi
Pada awalnya pengukuran inteligensi telah dipraktekkan di negara Cina sebelum dinasti Han, pengukuran inteligensi dilakukan oleh jenderal Cina untuk menguji
45
rakyat sipil yang ingin menjadi legislatif berdasarkan pengetahuan menulis klasik, persoalan administratif dan manajerial.
Pengukuran inteligensi kemudian dilanjutkan sampai pada masa dinasti Han (200 SM- 200 M), namun seleksi ini tidak lagi untuk legislatif saja, tetapi mulai merambah pada bidang militer, perpajakan, pertanian, dan geografi. Meskipun diawali dengan sedikit mencontoh pada seleksi militer Prancis dan Inggris, sistem ujian telah disusun dan berisi aktivitas yang berbeda, seperti tinggal dalam sehari semalam dalam kabin untuk menulis artikel atau puisi, hanya 1 % sampai dengan 7 % yang diizinkan ikut ambil bagian pada ujian tahap kedua yang berakhir dalam tiga hari tiga malam. Menurut Gregory (2007), seleksi ini keras namun dapat memilih orang yang mewakili karakter orang Cina yang kompleks. Tugas-tugas militer yang berat cukup dapat dilakukan dengan baik oleh para pegawai yang diterima dalam seleksi fisik dan psikologi yang intensif.
Tokoh psikologi yang berperan antara lain adalah Wundt. Beliau merupakan
psikolog
pertama
yang
menggunakan
laboratorium
dengan
penelitiannya mengukur kecepatan berpikir. Wundt mengembangkan sebuah alat untuk menilai perbedaan dalam kecepatan berpikir. Tokoh yang tidak kalah pentingnya adalah Alfred Binet. Kontribusi nyata Binet adalah menciptakan tes inteligensi. Binet dibantu oleh Theophile Simon (1904) membuat instrumen pengukur inteligensi dengan skala pengukuran level umum pada soal-soal mengenai kehidupan sehari-hari sehingga tesnya dikenal dengan nama Tes BinetSimon. Perkembangan selanjutnya dua tokoh ini mengembangkan penggunaan tes
46
inteligensi dengan tiga puluh item yang berfungsi mengidentifikasikan kemampuan sekolah anak (Van Ornum, 2008).
Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah “tes mental” yaitu James Mckeen Cattell (1860-1944), yang menerbitkan bukunya Mental Tes and Measurements di tahun 1890. Buku ini berisi serangkaian tes inteligensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah (Gregory, 2007):
1. Dynamometer Pressure, yaitu ukuran kekuatan tangan menekan pegas yang dianggap sebagai indikator aspek psikofisiologis 2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu tertentu yang dianggap memiliki komponen mental didalamnya. 3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat yang terpisah dikulit yang masih dapat dirasakan sebagai 2 titik berbeda. 4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam diaknosis terhadap penyakit saraf dan dalam mempelajari status kesadaran abnormal. 5. Least noticabele difference in weight, yaitu pengukuran perbedaan berat yang terkecil yang masih dapat dirasakan seseorang. 6. Reaction time for sound, yang mengukur waktu antara pemberian stimulus dengan timbulnya reaksi tercepat.
47
7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap proses yang lebih ‘mental’ daripada waktu-reaksi yang dianggap reflektif., 8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran terhadap akurasi ‘space judgment’ 9. Judgment of 10 second time, yang dimaksudkan sebagai ukuran akurasi dalam ‘time judgment’ (subyek diminta menghitung 10 detik tampa bantuan apapun). 10. Number of latters repeated upon once hearing, yang dimaksudkan sebagai ukuran terhadap perhatian dan ingatan (subyek diminta mengulang huruf yang sudah disebutkan 1x)
Terdapat berbagai tes inteligensi yang terstandrisasi dan telah banyak digunakan untuk berbagai keperluan pengetesan psikologi, diantaranya adalah (Azwar, 2005):
1. Stanford-Binet Intelligence Scale
Tes Stanford-Binet digunakan pada anak-anak. Materi yang digunakan dalam
tes
Stanford-Biner
ini
terdapat
dalam
sebuah
kotak.
Penyelenggaraan tes dan Penentuan Skor menggunakan buku-buku kecil berisi kartu-kartu tercetak untuk presentasi, flip-over soal tes, objek tes mainan anak seperti balok, manik, papan bentuk, sebuah gambar besar boneka yang uniseks dan multietnik,
buku kecil untuk tester,
pedoman penyelenggaraan dan pen-skoran skala.
48
dan
2. The Wechsler Intelligence Scale for Children – Revised (WISC-R).
Revisi skala WISC yang dinamai WISC-R diterbitkan tahun 1974 dan dimaksudkan untuk mengukur inteligensi anak-anak usia 6 sampai dengan 16 tahun. WISC-R terdiri atas 12 subtes yang dua diantaranya digunakan hanya sebagai persediaan apabila diperlukan penggantian subtes.
3. The Wechsler Adult Intelligence Scale-Revised (WAIS-R).
Sebagaimana versi WAIS lainnya, WAIS-R terdiri dari skala verbal dan skala performansi. Kedua skala tersebut masing-masing menghasilkan IQ verbal dan IQ performansi, sedangkan kombinasi keduanya menjadi dasar untuk perhitungan IQ deviasi sebagai IQ keseluruhan.
4. The Standard Progressive Matrices (SPM)
SPM merupakan salah satu contoh bentuk skala inteligensi yang dapat diberikan secara individual ataupun kelompok. Skala ini dirancang oleh J.C. Raven dan terbit pada tahun 1960. SPM merupakan tes yang bersifat nonverbal, artinya materi soal-soalnya diberikan tidak dalam bentuk tulisan ataupun bacaan melainkan dalam bentuk gambar-gambar. Raven sendiri menyebut skala ini sebagai tes kejelasan pengamatan dan kejelasan berfikir, bukan tes inteligensi umum.
49
5. The Kaufman Assessment Battery for Children (K-ABC).
Kumpulan tes ini menghasilkan empat skor global: Pemrosesan Berurutan, Simultan, Komposit, dan Pemrosesan Mental. Pemrosesan simultan dipresentasikan oleh tujuh subtes sementara pemrosesan berurutan dipresentasikan oleh tiga subtes. K-ABC dimaksudkan untuk mengakomodasi
kebutuhan
pengetesan
bagi
kelompok-kelompok
khusus, seperti anak-anak cacat dan anak-anak dari kelompok minoritas kultural dan bahasa, dan untuk membantu diagnosis ketidakmampuan belajar.
2.4.
Konstruksi Tes
Dua istilah yang paling sering diterapkan pada pengembangan tes psikologi adalah validitas (validity) dan keandalan (reliability).
2.4.1. Validitas
Validitas suatu tes menerangkan apa yang diukur oleh tes dan sejauh mana tes tersebut mengukur apa yang hendak diukur (Anastasi, 1997). Penentuan validitas tes berkenaan dengan hubungan antara kinerja dengan fakta-fakta lain yang independen dan dapat diamati. Prosedur pengujian sebuah alat ukur selalu membutuhkan satu hal atau fakta lain di luar alat ukur yang disebut dengan kriteria. Kriteria harus bersifat independen, dapat diukur, konsisten, relevan, dan bebas dari bias. Pengukuran validitas yang menghasilkan koefisien validitas berarti mencari korelasi antara skor tes dengan kriteria.
50
Dalam bidang psikologi konsep validitas memiliki tiga konteks yaitu (Suryabratha, 2005):
1. Validitas Penelitian (Content Validity)
Konsep validitas penelitian ini bermakna adanya kesesuaian hasil-hasil simpulan sebuah penelitian dengan kondisi senyatanya dilapangan. Terkait dengan konsep validitas penelitian ini, Suryabrata (2005) menyatakan bahwa validitas penelitian mengandung dua sisi, yaitu:
a) Validitas Internal
Konsep validitas internal membahas mengenai kesesuaian antara hasil penelitian dengan kondisi sebenarnya. Adapun untuk mengungkap validitas internal ini dapat dilakukan dengan menggunakan instrumen yang disusun berdasarkan pada tahapan penulisan instrumen yang baik.
b) Validitas Eksternal
Konsep
validitas
eksternal
membahas
kesesuaian
antara
generalisasi hasil penelitian dengan keadaan yang sebenarnya. Untuk mendapatkan hasil validitas eksternal dapat dilakukan dengan memilih sampel yang tepat dari populasi yang diteliti.
51
2. Validitas Item (Item Validity)
Item merupakan bagian dari sebuah instrumen, sehingga dalam memaknai validitas item ini tidak terlalu menyamakannya dengan validitas seluruh item atau validitas instrumen. Validitas item merujuk pada tingkat kesesuaian item (butir soal) dengan perangkat soal-soal lainnya, secara sederhana dapat pula dinyatakan bahwa yang dimaksud validitas item adalah tingkat korelasi antara skor butir soal (item) dengan skor total (seluruh).
3. Validitas Alat Ukur (Test Validity)
Konsep validitas alat ukur merujuk pada makna kemampuan sebuah alat ukur (instrumen/ skala/ tes) untuk mengukur apa yang seharusnya diukur. Cara yang dapat digunakan untuk menghitung koefisien validitas alat ukur adalah sebagai berikut (Kerlinger, 2006):
a) Validitas Isi (Content-Related Validation)
Validitas
isi
merupakan
seperangkat
item-item
tes
yang
menunjukkan sejauhmana isi dari item-item tersebut memang mengukur apa yang hendak diukur. Dengan menggunakan spesifikasi tes yang telah dikembangkan (telah ada), kemudian dilakukan analisis logis untuk menetapkan apakah item-item yang telah dikembangkan tersebut mengukur apa yang hendak diukur.
52
b) Validitas Konstruk (Construct Corelated Validation)
Validitas konstruk mengukur mengenai sejauh mana skor-skor hasil pengukuran dengan instrumen itu sesuai atau tidak dengan teori yang mendasari penyusunan alat ukur tersebut. Validasi konstruk ini merupakan proses yang kompleks, yang memerlukan analisis logis dan dukungan data empiris.
Teknik-teknik yang dapat digunakan untuk mengukur validitas konstruk adalah sebagai berikut (Suryabratha, 2005):
1) Analisis faktor
Dasar pemikiran penerapan analisis faktor untuk validasi adalah bahwa walaupun perilaku manusia itu sangat banyak ragamnya, namun perilaku yang sangat beragam itu didasari oleh sejumlah faktor yang terbatas. Dengan analisis faktor dapat ditemukan faktor-faktor yang mendasari perilaku yang beragam tersebut. Tinggi-rendahnya validitas konstruk suatu alat tes tercermin pada sejauh mana muatan faktor yang diperoleh dari analisis faktor ini berkontribusi pada teori yang mendasarinya.
53
2) Korelasi dengan tes lain
Korelasi antara tes baru dengan tes lama yang serupa menunjukkan bahwa tes baru juga mengukur konstruk yang kurang lebih sama. Korelasi dengan tes lain dilakukan untuk menunjukkan bahwa tes baru bebas dari pengaruh faktor-faktor yang tidak relevan.
3) IRT (Item Responses Theory)
Analisis item-item secara modern yaitu penelaahan item dengan menggunakan Item Respons Theory (IRT) atau teori jawaban terhadap item. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu skala dengan kemampuan testee (Umar, 2008). Teori ini menjelaskan tentang apa yang terjadi jika seseorang menempuh satu butir item. Menurut teori ini, jika satu butir item dengan tingkat kesukaran tertentu ditempuh oleh ribuan orang yang kemampuannya berbeda-beda, maka orang yang kemampuannya lebih tinggi akan memiliki peluang yang lebih besar untuk menjawab benar pada item tersebut dibandingkan dengan orang yang kemampuannya lebih rendah. Atau dengan kata lain, makin tinggi kemampuan seseorang makin tinggi pula peluangnya untuk menjawab benar pada satu butir item, dan sebaliknya.
54
c) Validitas Berdasarkan Kriteria (Criterion-Related Validation)
Prosedur validitas kriteria menunjukkan efektivitas dari suatu tes dalam meramalkan kinerja seseorang pada aktivitas tertentu. Kriteria pengukuran untuk validitas skor tes dapat diperoleh dalam waktu yang bersamaan dengan skor tes atau dalam interval waktu tertentu.
Dalam pelaksanaan penelitian ketiga konteks tersebut harus terpenuhi, agar penelitian yang dilakukan dapat memberikan data yang sebagaimana diharapkan, sehingga proses pengambilan kesimpulannya juga memiliki nilai jaminan tinggi.
Penelitian ini menggunakan uji validitas konstruk dengan teknik analisis faktor. Dengan melakukan uji pengukuran melalui analisis faktor maka dapat ditemukan variabel yang diukur oleh item-item dan juga dapat dilihat bagaimana hubungan antar item, item dengan faktor, serta korelasi antar variabel.
2.4.2. Reliabilitas
Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan berbeda atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau dalam kondisi pengujian yang berbeda (Anastasi, 1997).
55
Pendekatan yang dipergunakan untuk menghitung reliabilitas pengukuran ada bermacam-macam. Berikut ini dikemukakan beberapa cara untuk menghitung reliabilitas yang dikemukakan oleh Anastasi (1997):
1.
Metode Pengujian Kembali (Test-Retest Methods)
Pengukuran terhadap sekelompok subyek dilakukan dua kali dengan satu alat pengukur. Reliabilitas dihitung dengan cara mengkorelasikan hasil pengukuran pertama dengan hasil pengukuran kedua. Metode ini mengandung time sampling error, yaitu kesalahan yang timbul karena pengukuran pada waktu yang berbeda.
2.
Reliabilitas Alat Ukur Alternatif (Alternate-Form Reliability)
Pendekatan tes dilakukan dengan jalan menggunakan dua macam alat pengukur dimana dua alat pengukur tersebut harus sama. Untuk mengestimasi reliabilitasnya, maka dua alat ukur tersebut diberikan pada sekelompok subyek secara berturut-turut. Kemudian hasil pengukuran dari alat pengukuran yang pertama dicari korelasinya dengan hasil pengukuran dari alat pengukuran kedua.
3.
Metode Konsistensi Internal (Internal Consistency Methods)
Pengestimasian kadar reliabilitas dengan prosedur konsistensi internal dilakukan dengan memfokuskan diri pada unsur-unsur internal instrument, yaitu butir-butir pertanyaan atau item. Jadi, estimasi itu
56
cukup dilakukan berdasarkan kekuatan tiap-tiap butir pertanyaan yang secara keseluruhan membentuk N item, dan tidak membutuhkan datadata dari hasil pengukuran yang lain sebagaimana kedua prosedur reliabilitas di atas.
2.5. Gambaran Umum GATB
General Aptitude Test Batteray (GATB) diciptakan oleh Charles E. Odell dari United States Employes Services dan mulai dikembangkan pada tahun 1940. General Aptitude The Battery (GATB) telah digunakan sejak 1947 oleh State Employment service yang bergabung dengan United States Employment Service untuk memenuhi kebutuhan tes yang bisa dipergunakan untuk berbagai tujuan (multipurposes). Sejak masa itu, GATB telah dimasukkan kedalam program penelitian yang berkelanjutan untuk menjadikannya tes yang akurat terhadap kesuksesan pada berbagai pekerjaan yang berbeda. Karena dasar risetnya yang luas, GATB dikenal sebagai sejumlah tes bakat ganda yang akurat dalam pengadaanya untuk digunakan dalam bimbingan jurusan dan menilai kecerdasan umum dari seseorang.
Kemampuan yang diukur oleh General Aptitude Test Battery adalah sebagai berikut (Lynne Bezanson dalam Jigau, 2007):
57
a. Aptitude G (General Learning Ability)
Kemampuan untuk menangkap atau untuk memahami pelajaran dan prinsip-prinsip yang mendasari suatu hal. Kemampuan untuk menalar dan menyatakan pendapat atau mengambil keputusan.
b. Aptitude V (Verbal Aptitude)
Kemampuan
untuk
memahami
arti
kata-kata
dan
ide-ide,
menghubungkannya dan menggunakannya dengan baik. Kemampuan untuk memahami bahasa, memahami hubungan diantara kata-kata, dan memahami arti kalimat dan paragraph secara jelas dalam setiap bentuk lisan maupun tulisan.
c. Aptitude N (Numerical Aptitude)
Kemampuan untuk mengoperasikan aritmatik seperti menjumlahkan, mengalikan, mengurangi, dan membagi dengan cepat dan tepat.
d. Aptitude S (Spatial Aptitude)
Kemampuan untuk menggambarkan secara visual bentuk-bentuk geometric
dan
memahami
objek-objek
dua
dimensi
serta
menggambarkan objek-objek dalam tiga dimensi. Kemampuan untuk mengenali relasi ruang yang diakibatkan bergeraknya objek-objek dalam ruang.
58
e. Aptitude P (Form Perception)
Kemampuan untuk melihat seluk beluk atau detail yang penting dalam objek-objek, gambar-gambar, atau grafik. Kemampuan untuk melihat persamaan dan perbedaan dalam corak dan bentuk bilangan, panjang dan lebar atau garis-garis.
f. Aptitude Q (Clerical Perception)
Kemampuan untuk melihat seluk-beluk atau detail dari bahan-bahan tertulis atau yang disajikan dalam bentuk table-tabel. Kemampuan untuk melihat perbedaan salinan, untuk mengoreksi kata-kata dan angka-angka dalam cetak coba, dan untuk menghindari penyimpangan dalam mengerjakan aritmatik yang sederhana.
g. Aptitude K (Motor Coordination)
Kemampuan untuk mengkoordinasikan mata dan tangan atau jari dengan cepat dan akurat dalam membuat gerakan yang tepat dengan kecepatan. Kemampuan untuk membuat respon gerakan akurat dan cepat.
h. Aptitude F (Finger Dexterity)
Kemapuan untuk menggerakkan jari tangan dan menangani objek-objek yang kecil dengan cepat dan akurat
59
i. Aptitude M (Dexterity Manual)
Kemampuan
untuk
menggerakkan
tangan
dengan
mudah
dan
terampil. Kemampuan untuk bekerja dengan tangan dalam menempatkan dan mengubah gerakan.
Dewasa ini GATB meliputi 12 tes; 4 tes membutuhkan alat sederhana, sementara 8 tes yang lainnya hanya menggunakan kertas dan pensil. Keseluruhan kumpulan tes dapat diselenggarakan dalam waktu kurang lebih 2,5 jam (Anastasi, 1997). Adapun subtes yang terdapat dalam GATB adalah sebagai berikut:
a.
Bagian 1 - Membandingkan nama-nama (name comparison). 6 menit, skor maksimal 150.
Tes ini berisi dua kolom nama. Peserta tes memeriksa masing-masing kolom, dan menunjukkan apakah nama-nama yang ada sama atau berbeda. Subtest ini mengukur persepsi klerikal (clerical perception)
b.
Bagian 2 - Perhitungan (computation). 6 menit, skor maksimal 50.
Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan penjumlahan,
pengurangan,
perkalian,
atau
pembagian
seluruh
bilangan. Subtes ini mengukur kemampuan numerik (numerical aptitude)
c.
Bagian 3 - Tiga dimensi ruang (three dimensional space). 6 menit, skor maksimal 40.
60
Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi. Gambar perangsang disajikan sebagai suatu potongan-potongan metal yang datar dimana salah satu berputar-putar (berguling-guling) atau keduanya. Garis-garis mengindikasikan dimana salah satu dari empat gambar dengan objek tiga dimensi bisa dibentuk dari gambar perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan ruang (general learning ability & spatial aptitude).
d.
Bagian 4 – Perbendaharaan kata (Vocabulary). 6 menit, skor maksimal 60.
Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua katakata yang sama atau arti kata yang berlawanan. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan verbal (general learning ability & verbal aptitude).
e.
Bagian 5 – Mencocokkan alat-alat (tool matching). 5 menit, skor maksimal 49.
Tes ini berisi serangkaian latihan yang mengandung suatu gambar perangsang dan empat gambar hitam-putih alat-alat perlengkapan bengkel yang sederhana. Peserta tes menunjukkan mana dari empat gambar hitam-putih itu yang sama seperti pada gambar perangsang. Variasi yang ada hanya mendistribusikan masing-masing gambar hitam putih. Subtes ini mengukur persepsi bentuk (form perception).
61
f.
Bagian 6 – Penalaran aritmatik (arithmetic reason). 7 menit, skor maksimal 25.
Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan numerik (general learning ability & numerical aptitude).
g.
Bagian 7 – Mencocokkan bentuk (form matching). 6 menit, skor maksimal 60.
Tes ini berisi dua kelompok dengan berbagai cara dibentuk gambar yang berpotongan. Peserta tes menunjukkan gambar mana dalam kelompok kedua-duanya persis (tepat) sama ukurannya dan bentuk potongannya
seperti
masing-masing
gambar
dalam
kelompok
perangsang pertama. Subtes ini mengukur persepsi bentuk (form perception).
h.
Bagian 8 – Membuat tanda-tanda (mark making).
60 menit, skor
maksimal 130.
Tes ini berisi suatu rangkaian hasil perkalian (kuadrat), dimana peserta tes membuat tiga tanda pensil, dikerjakan secepat-cepatnya. Tandatanda yang dibuat dengan garis-garis pendek, dua garis vertical dan tiga garis horizontal dibawahnya. Subtes ini mengukur koordinasi gerak (motor coordination).
62
i.
Bagian 9 – Menempatkan (place). 3 percobaan, masing-masing waktu 15 menit, skor maksimal 144.
Peralatan yang digunakan untuk tes ini berisi 10 bagian papan pasak empat persegi panjang yang dibagi dalam dua bagian, masing-masing berisi 48 lubang. Pelaksanaan ini dilakukan dalam tiga waktu, dimana peserta tes harus bekerja dengan cepat untuk memindahkan sebanyak mungkin pasak selama waktu yang disediakan. Tiga percobaan diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan (manual dexterity).
j.
Bagian 10 – Memutar (turn). 3 percobaan, masing-masing 30 menit, skor maksimal 144.
Tes ini menggunakan perlatan. Peralatan yang digambarkan dalam bagian 9 juga digunakan dalam tes ini. Peserta tes bekerja dengan cepat untuk memutar dan menempatkan kembali secepat mungkin pasak yang berbentuk silinder selama waktu yang disediakan. Tiga percobaan diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan (manual dexterity).
k.
Bagian 11 – Memasang (assemble). 90 detik, skor maksimal 50.
Tes ini menggunakan peralatan. Peralatan yang digunakan untuk tes ini dan bagian 12 yang berisi papan persegi panjang kecil (papan kecekatan tangan) berisi 50 lubang, dan menyediakan paku penyumbat kecil dari
63
metal dan cincin penutup (ring). Peserta tes bekerja dengan cepat dalam memindahkan dan menempatkan setepat mungkin. Subtes ini mengukur kecekatan tangan (manual dexterity).
l.
Bagian 12 – Membongkar (disassemble). 60 detik, skor maksimal 50.
Tes ini mempergunakan peralatan yang sama seperti digambarkan pada bagian 11. Peserta tes memindahkan paku sumbat kecil dari metal memasang suatu lubang dalam papan bagian bawah, mendorong ring pada dasar papan, meletakkan ring pada tangkai dengan satu tangan dan paku sumbat ke dalam lubang yang cocok pada papan bagian atas dengan tangan yang lainnya. Peserta tes bekerja dengan cepat untuk memindahkan dan menempelkan paku sumbat dan ring setepat mungkin selama waktu yang disediakan. Subtes ini mengukur kecekatan tangan (manual dexterity).
Kumpulan tes ini menghasilkan skor pada sembilan faktor dan pada tiga ukuran komposit utama yang ditarik dari faktor-faktor tersebut, keseluruhannya didaftarkan pada tabel 2.1 berikut ini (Anastasi & Urbina, 1997):
64
Tabel 2.1 Faktor-Faktor dan Komposit General Aptitude Test Battery (GATB)
Faktor-faktor G: Kemampuan Belajar
S: Kemampuan Ruang
K: Koordinasi Motor
V: Kemampuan Verbal
P: Persepsi Bentuk
F: Kelincahan Jari-jari
N: Kemampuan Numerik
Q: Persepsi Klerikal
M: Kelincahan Manual
Perseptual = S + P + Q
Psikomotorik = K + F + M
Umum
Komposit Kognitif = G + V + N
Sumber: Anastasi & Urbina, 1997, hal.498
2.6. Kerangka Berpikir
Dari latar belakang dan teori yang sudah ada, maka dapat disimpulkan dalam suatu kerangka sebagai berikut:
65
Diagram 2.2 Kerangka Berpikir Berdasarkan Subtes
Diagram 2.3 Kerangka Berpikir Berdasarkan Sebaran Item
66
2.7.
Hipotesis
Sesuai dengan kerangka berpikir yang telah digambarkan, maka dapat disusun hipotesis sebagai berikut:
1. Bahwa seluruh item dalam empat subtes GATB yang dijadikan penelitian mengukur konstruk yang dimaksud. Konstruk yang dimaksud adalah computation, three dimensional space, vocabulary, dan three dimensional space. Dimana setiap item dalam masing-masing subtes adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada subtes mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut, dan setiap item dalam masing-masing subtes menghasilkan informasi secara signifikan tentang kemampuan pada subtes tersebut. 2. Bahwa empat subtes GATB adalah fit (sesuai) dengan model satu faktor, yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah “inteligensi”
67
BAB III METODE PENELITIAN
Hal yang hendak diteliti dalam penelitian ini adalah tingkat validitas alat tes GATB. Selanjutnya untuk menjawab pertanyaan penelitian ini ada beberapa hal yang dirancang oleh peneliti, diantaranya Subjek Penelitian, Instrumen Penelitian, Metode Analisis Data, dan Prosedur Penelitian.
3.1.
Subjek Penelitian
Penelitian ini hendak menguji validitas dari alat tes GATB. Untuk menguji validitas tersebut digunakan pendekatan uji validitas konstruk yang akan menentukan apakah setiap subtes dalam GATB mengukur komponen yang dapat mengukur general intelligence. Dalam penelitian ini peneliti menggunakan data mentah yang tersedia di Divisi Asesmen SDM PPM Manajemen. Data yang digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang menjalani tes di Jakarta. Pelaksanaan tes dilakukan pada tahun 2009 dan ditempuh oleh 3257 orang. Karakteristik dari para peserta tes pada data yang tersedia ini adalah sebagai berikut:
a.
Umur 22-32 tahun
b.
Tingkat pendidikan minimal D3
68
3.2.
Instrumen Penelitian
Dalam penelitian ini, GATB dijadikan short form dengan empat subtes yang memiliki jumlah item sebanyak 175, dikarenakan keempat subtes tersebut mengukur kognisi atau inteligensi dari seseorang dan dari hasil penilaian tes tersebut dapat menghasilkan skor IQ seseorang. Keempat subtes tersebut adalah:
1. Subtes kemampuan numerik (computation). 6 menit, skor maksimal 50.
Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan penjumlahan, pengurangan, perkalian, atau pembagian seluruh bilangan. Subtes ini mengukur kemampuan numerical (numerical aptitude)
Contoh Soal:
1) Kurang (-) 9 4
A. 2 B. 3 C. 5 D. 9 E. Selain di atas
2. Subtes tiga dimensi ruang (three dimensional space). 6 menit, skor maksimal 40.
Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi. Gambar perangsang disajikan sebagai suatu potongan-potongan metal yang datar dimana salah satu berputar-putar (berguling-guling) atau keduanya. Garis-garis mengindikasikan dimana salah satu dari empat gambar dengan objek tiga dimensi bisa dibentuk dari gambar
69
perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan ruang (general learning ability & spatial aptitude).
Contoh Soal:
3. Subtest kemampuan verbal (Vocabulary). 6 menit, skor maksimal 60.
Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua katakata yang sama atau arti kata yang berlawanan. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan verbal (general learning ability & verbal ability).
Contoh Soal:
1) A. Besar
B. Luas
C. Kering
D. Lambat
4. Subtes penalaran aritmatik (arithmetic reason). 7 menit, skor maksimal 25.
Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal. Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan numerical (general learning ability & numerical aptitude).
70
Contoh Soal:
1) Satu bagian pekerjaan dapat diselesaikan dalam waktu setengah jam. Berapa bagian pekerjaan yang dapat diselesaikan dalam waktu 8 jam?
A. 8 B. 10 C. 16 D. 24 E. Selain di atas
Subjek penelitian diminta untuk mengerjakan item pertanyaan sesuai dengan waktu yang telah disediakan. Jawaban diberikan oleh subjek dengan memilih 4 pilihan jawaban yang telah disediakan dimana diantara keempat tersebut terdapat satu jawaban yang benar. Khusus untuk subtes vocabulary dalam satu item pertanyaan terdapat dua jawaban yang benar dan saling berkaitan. Untuk penskoran, apabila subjek menjawab dengan benar maka akan mendapatkan nilai 1 dan mendapatkan nilai 0 apabila menjawab dengan salah.
3.3.
Metode Analisis Data
Metode analisis yang digunakan dalam penelitian ini adalah metode analisis faktor. Pada dasarnya terdapat dua jenis pandangan mengenai analisis faktor, yaitu: Exploratory Factor Analysis (EFA) dan Confirmatory Factor Analysis (CFA). Analisis faktor pada awalnya dikemukakan oleh Spearman (1940) yang pada saat ini dikenal dengan Exploratory Factor Analysis (EFA). Dalam EFA, peneliti tidak memiliki ekspektasi tertentu mengenai jumlah atau sifat faktor yang mendasari konstruk. Metode analisis faktor yang lebih modern adalah Confirmatory Factor Analysis (CFA). Dalam CFA, peneliti harus memiliki gambaran yang spesifik mengenai (a) jumlah faktor, (b) variabel yang
71
mencerminkan suatu faktor, dan (c) faktor-faktor yang saling berkolerasi (Thompson, 2004).
Dalam rangka penelitian mengenai studi validitas konstruk General Aptitude Test Battery (GATB) maka penulis menggunakan metode analisis faktor Confirmatory Factor Analysis (CFA) dengan program lisrel 8.70. Alasan penulis menggunakan CFA sebagai metode dalam penelitian karena dengan menggunakan CFA maka setiap dimensi dapat diuji satu persatu. Validitas dari masing-masing item juga dapat diuji dan digambarkan dalam matriks korelasi CFA.
Confirmatory Factor Analysis (CFA) adalah model teori-pengujian yang bertentangan dengan metode teori yang menghasilkan faktor seperti eksploratori. Dalam Confirmatory Factor Analysis (CFA), penelitian dimulai dengan membuat hipotesis sebelum analisis. Model, atau hipotesis dengan spesifik menentukan variabel mana yang akan berkolerasi dengan faktor dan faktor mana yang berkolerasi. Hipotesis ini didasarkan pada teori yang kuat atau landasan empiris. Tujuan dari CFA adalah (Umar, 2011) :
1. Untuk menguji hipotesis tentang satu atau lebih faktor serta saling keterkaitan antara faktor tersebut sesuai model teori yang ditetapkan. 2. Untuk menguji validitas dari setiap indikator yang digunakan untuk mengukur faktor atau konstruk tersebut.
CFA sering digunakan dalam proses pengembangan skala untuk memeriksa struktur laten dari suatu alat tes (Brown, 2006). Dalam konteks ini,
72
CFA digunakan untuk verifikasi jumlah dimensi yang mendasari instrumen (faktor) dan pola hubungan item dengan faktor (factor loading). Hasil CFA dapat memberikan bukti kuat dari validitas convergent dan diskriminan dari sebuah konstruk teoritis. Validitas konvergen diindikasikan oleh bukti bahwa alat tes dengan konstruk yang sama dan secara teori juga mengukur hal yang sama, maka korelasi antar tes tersebut tinggi. Sedangkan validitas diskriminan diindikasikan oleh hasil yang menunjukkan bahwa indikator secara teoritis berbeda konstruksi tidak saling berkorelasi tinggi..
Alat tes dikatakan bias ketika beberapa item tidak mengukur konstruk yang mendasarinya jika dibandingkan dengan seluruh kelompok. Adapun logika dasar dari CFA adalah sebagai berikut (Umar, 2011):
1.
Sebuah konsep atau trait berupa kemampuan yang didefinisikan secara operasional sehingga dapat disusun pertanyaan atau pernyataan untuk mengukurnya. Kemampuan ini disebut faktor. Sedangkan pengukuran terhadap faktor ini dilakukan melalui analisis terhadap respon (jawaban) atas item-itemnya.
2.
Setiap item diteorikan hanya mengukur atau memberi informasi tentang satu faktor tertentu saja. Artinya baik item maupun subtes bersifat unidimensional.
3.
Berdasarkan teori yang dipaparkan di atas, dapat disusun sehimpunan persamaan matematis. Persamaan tersebut dapat digunakan untuk memprediksi (dengan menggunakan data yang
73
tersedia) matriks korelasi antar item yang seharusnya akan diperoleh jika teori tersebut (unidimensional) benar. Matriks korelasi ini dinamakan sigma (Σ). Kemudian matriks ini akan dibandingkan dengan matriks korelasi yang diperoleh secara empiris dari data (disebut matriks S). Jika teori tersebut benar (unidimensional), maka seharusnya tidak ada perbedaan yang signifikan antara elemen matriks Σ dengan elemen matriks S. Secara matematis dapat dituliskan: S-Σ=0 4.
Pernyataan matematik inilah yang dijadikan hipotesis nihil yang akan dianalisis menggunakan CFA. Dalam hal ini dilakukan uji signifikasi dengan Chi Square. Jika Chi Square yang dihasilkan tidak signifikan (nilai p>0,05), maka dapat disimpulkan, bahwa hipotesis nihil yang menyatakan: “tidak ada perbedaan antara matriks S dan Σ” tidak ditolak. Artinya teori yang menyatakan bahwa ke 20 item tersebut semuanya mengukur hal yang sama, yaitu kemampuan berpikir analogis, dapat diterima kebenarannya (didukung oleh data). Sebaliknya, jika nilai Chi Square yang diperoleh signifikan, maka hipotesis nihil S- Σ =0 ditolak. Artinya teori tersebut tidak didukung data (ditolak).
5.
Jika teori diterima (model fit), langkah selanjutnya, adalah menguji hipotesis tentang signifikan tidaknya masing-masing item dalam mengukur apa yang hendak diukur (kemampuan berpikir analogis). Uji hipotesis ini dilakukan dengan t-test. Jika nilai t signifikan,
74
berarti item yang bersangkutan signifikan dalam mengukur apa yang hendak diukur. Dengan cara seperti ini, dapat dinilai butir item yang mana yang valid dan yang tidak valid di dalam konteks validitas konstruk. Dengan kata lain, analisis faktor konfirmatori dalam hal ini adalah pengujian terhadap hipotesis nihil (H0): S - Σ = 0. Artinya, tidak ada perbedaan antara matriks korelasi yang diharapkan oleh teori dengan matriks korelasi yang diperoleh dari hasil observasi. 6.
Persamaan matematis pada butir tiga di atas adalah persamaan regresi untuk setiap butir soal dalam hubungannya dengan faktor yang diukur yaitu: X1= λ1F+δ1
Dimana:
X1
= Skor yang diperoleh pada item no.1
F
= Konstruk yang hendak diukur (faktor)
λ1
= Koefisien Regresi untuk item no. 1 dalam mengukur F, disebut juga sebagai ”koefisien muatan faktor”
δ1
= Segala hal yang mempengaruhi Varians X1 (selain F), disebut juga ”kesalahan pengukuran”
Untuk menguji validitas alat ukur yang digunakan dalam penelitian ini, peneliti menggunakan Confirmatory Factor Analysis (CFA) dengan bantuan
75
software Lisrel 8.70 (Joreskog dan Sorbom, 2006). Adapun langkah-langkah yang dilakukan untuk mendapatkan kriteria hasil CFA yang baik adalah (Umar, 2011):
1.
Dilakukan uji CFA dengan model satu faktor dan dilihat nilai ChiSquare yang dihasilkan. Jika nilai Chi-Square tidak signifikan (p > 0.05) berarti semua item hanya mengukur satu faktor saja. Namun jika nilai Chi-Square signifikan (p < 0.05), maka perlu dilakukan modifikasi terhadap model pengukuran yang diuji sesuai langkah kedua berikut ini.
2.
Jika nilai Chi-Square signifikan (p < 0.05), maka dilakukan modifikasi model pengukuran dengan cara membebaskan parameter berupa korelasi kesalahan pengukuran. Ini terjadi ketika suatu item selain mengukur konstruk yang ingin diukur, item tersebut juga mengukur hal yang lain (mengukur lebih dari satu konstruk / multidimensional). Jika setelah beberapa kesalahan pengukuran dibebaskan untuk saling berkorelasi dan akhirnya diperoleh model yang fit, maka model terakhir inilah yang akan digunakan pada langkah selanjutnya.
3.
Jika telah diperoleh model yang fit, maka dilakukan analisis item dengan melihat apakah muatan faktor item tersebut signifikan dan mempunyai koefisien positif. Melihat signifikan tidaknya item tersebut mengukur faktornya, dengan cara melihat t-value koefisien muatan faktor item. Jika t > 1.96 maka item tersebut signifikan dan tidak akan di drop, begitu pun sebaliknya.
76
4.
Setelah itu dilihat apakah ada item yang muatan faktornya negatif. Dalam hal ini, jika ada pernyataan negatif, maka ketika dilakukan skoring terhadap item, arah skoringnya dirubah menjadi positif. Jika setelah diubah arah skoringnya masih terdapat item bermuatan faktor negatif, maka item tersebut akan di drop.
5.
Apabila kesalahan pengukurannya berkorelasi terlalu banyak dengan kesalahan pengukuran pada item lain, maka item seperti ini pun dapat di drop karena bersifat multidimensi yang sangat kompleks.
6.
Jika dilakukan CFA dengan model satu faktor tidak diperoleh model yang fit, maka dapat dilakukan analisis dengan menggunakan model dua faktor dan mengulang tahap dua sampai lima hingga didapatkan model yang paling fit.
Dalam GATB, ada empat faktor yang diteorikan untuk diukur. Oleh sebab itu, dalam penelitian ini dilakukan empat kali uji validitas konstruk (untuk setiap subtes) yang masing-masing terdiri dari dua jenis analisis statistik, yaitu:
1.
Menguji teori yang menyatakan bahwa semua item pada satu subtes bersifat unidimensional (mengukur apa yang hendak diukur)
2.
Menguji tingkat signifikansi setiap butir soal dalam mengukur apa yang hendak diukur.
Selanjutnya, dalam GATB juga diteorikan bahwa keempat faktor (subtes) tersebut adalah mengukur satu hal (dimensi) yang sama yaitu kognitif (general intelligence). Hanya saja, disini berkenaan dengan hubungan antara subtes dan
77
general intelligence. Artinya, dapat dilakukan analisis faktor konfirmatori seperti yang dilakukan pada masing-masing subtes, tetapi yang dijadikan datanya disini adalah skor subtes, sedangkan faktornya adalah general intelligence. Namun demikian, peneliti akan melakukan kedua jenis analisis faktor tersebut secara simultan (untuk subtes dan general intelligence ).
Dengan kata lain, diteorikan bahwa item-item mengukur faktor tingkat satu (subtes) dan selanjutnya faktor-faktor tersebut (subtes) mengukur faktor tingkat dua yang lebih umum yaitu general intelligence. Analisis faktor konfirmatori secara simultan (sekaligus seperti ini) disebut second order confirmatory factor analysis. Dalam hal ini, subtes adalah faktor tingkat (orde) ke satu dan general intelligence adalah faktor tingkat (orde) kedua.
3.4. Prosedur Penelitian Penelitian ini dilaksanakan melalui beberapa tahapan, yaitu: prosedur penelitian melalui data sekunder pada tes masuk calon karyawan PT Semen Tonasa di PPM yang jumlahnya 3257 orang pada tahun 2009 di Jakarta. Sebelum memproses data, diadakan pengamatan terbatas dengan cara mewawancarai Divisi Asesmen SDM PPM Manajemen perihal kegiatan asesmen dan rekruitmen serta mengobservasi kegiatan asesmen yang dilakukan oleh mereka. Studi awal ini bertujuan untuk memperjelas permasalahan sebagai langkah awal dalam penelitian, dengan ini dapat diketahui:
78
1.
Perumusan masalah.
2.
Studi kepustakaan guna mendapatkan gambaran dan landasan teoritis yang tepat mengenai variabel penelitian.
3.
Surat izin melakukan penelitian kepada pihak fakultas Psikologi dan meminta izin melakukan penelitian pada SDM PPM Manajemen.
4.
Pengujian terhadap data mentah yang sudah ada.
79
Divisi Asesmen
BAB IV HASIL PENELITIAN
Sejalan dengan judul penelitian, uji validitas konstruk akan dilakukan per subtes untuk mengukur mengenai sejauh mana skor-skor hasil pengukuran item dengan instrumen sesuai atau tidak dengan teori yang mendasari penyusunan alat ukur tersebut. Pengujian validitas konstruk dilakukan melalui dua tahap:
1. Menguji hipotesis tentang model teori yang mengatakan bahwa item pada masing-masing subtes mengukur satu faktor saja. Secara teknis, yang diuji adalah tentang ada tidaknya perbedaan yang signifikan antara matriks korelasi yang diharapkan atau diprediksi oleh teori dengan yang diperoleh dari data. 2. Menguji hipotesis apakah setiap butir item itu memberikan informasi yang signifikan mengenai aspek yang hendak diukur.
Kedua tahapan ini dilakukan dengan menggunakan teknik Confirmatory Factor Analysis (CFA). Berikut ini dipaparkan hasil penelitian baik pada tingkat subtes maupun pada tingkat general intelligence:
4.1. Validitas Konstruk Tingkat Subtes 4.1.1. Validitas Konstruk Subtes Computation
Hasil perhitungan awal untuk subtes computation dengan model satu faktor (unidimensional) tidak fit, karena didapatkan Chi - Square = 1557.36, df = 1175, P-value = 0.00000 RMSEA = 0.010. Setelah dilakukanlah modifikasi terhadap
80
model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkorelasi satu dengan lainnya, maka didapatkanlah model fit dengan P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu computation. Namun karena pada model ini ada beberapa item yang kesalahannya saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensional.
Pada awalnya df berjumlah 1175, namun setelah mencapai model fit, df tersisa menjadi 1152. Ini berarti dalam perhitungan awal terdapat 1175-1152 = 23 korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal kualitas item tersebut.
Dari 50 item yang mengukur subtes computation, terdapat 22 item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan bernilai negatif. Kedua puluh dua item inilah yang harus di-drop, yaitu item nomor 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, dan 25.
Untuk mendapatkan hasil dengan item yang benar-benar murni, maka dilakukan analisis ulang setelah seluruh item yang tidak signifikan dan bernilai
81
negatif dibuang. Hasil yang diperoleh untuk perhitungan kedua pada subtes computation dengan model satu faktor (unidimensional) dan item negatif yang sudah di-drop adalah tidak fit, didapatkan Chi Square = 515.28, df = 350, P-value = 0.00000 RMSEA = 0.012. Kemudian dilakukan modifikasi kembali terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada gambar 4.1 berikut ini:
82
Gambar 4.1 Analisis Faktor Konfirmatorik untuk Subtes Computation
Terlihat dari gambar 4.1, bahwa nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu
83
computation. Pada model ini, terdapat 12 pasang korelasi antar item (tabel 4.1) yaitu item 3 yang berkolerasi dengan item 35, 40, 41, 43, 45, dan 49. Item 27 yang berkolerasi dengan item 26. Item 28 berkolerasi dengan item 26 dan 27. Item 30 berkolerasi dengan item 28, item 47 yang berkolerasi dengan item 39 dan item 48 yang berkolerasi dengan item 47.
Tabel 4.1 Matriks korelasi antar kesalahan pengukuran butir item pada Computation Item 1 2 3 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
1
2
3
26
27
28
1 0.70 0.58
1 0.53
1
29 30
31
32 33 34 35 36
1 1 1
1 0.53
1 1 1 1 1
-0.62
1 1
-0.65 -0.56 -0.59 -0.72
-0.57
84
Tabel 4.1 Matriks korelasi antar kesalahan pengukuran butir item pada Computation (Lanjutan) Item 37 38 39 40 41 42 43 44 45 46 47 48 49 50
37
38
39
40
41
42
43
44
45
46
47
48
1 -0.94
1
49
50
1 1 1 1 1 1 1 1 1 1 -1.04
1 1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini, yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.2 berikut ini:
85
Tabel 4.2 Muatan Faktor Item GATB subtes Computation
Item
Koefisien
Standar Error
T- Value
Signifikan
1
0.58
0.08
7.20
V
2
0.44
0.08
5.41
V
3
0.71
0.08
7.91
V
26
0.27
0.08
3.31
V
27
0.26
0.08
3.27
V
28
0.47
0.08
5.75
V
29
0.42
0.08
5.25
V
30
0.43
0.08
5.29
V
31
0.49
0.08
6.14
V
32
0.52
0.08
6.44
V
33
0.59
0.08
7.37
V
34
0.50
0.08
6.19
V
35
0.64
0.08
7.72
V
36
0.70
0.08
8.73
V
37
0.68
0.08
8.47
V
38
0.69
0.08
8.57
V
39
0.73
0.08
8.98
V
40
0.70
0.08
8.51
V
41
0.74
0.08
9.03
V
42
0.78
0.08
9.75
V
43
0.80
0.08
9.67
V
44
0.70
0.08
8.72
V
45
0.65
0.08
7.90
V
46
0.76
0.08
9.40
V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
86
Tabel 4.2 Muatan Faktor Item GATB subtes Computation (Lanjutan)
Item
Koefisien
Standar Error
T-Value
Signifikan
47
0.65
0.08
7.89
V
48
0.67
0.08
8.23
V
49
0.70
0.08
8.46
V
50
0.72
0.08
8.94
V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
Dari 28 item yang mengukur subtes computation, semua item dinyatakan signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan bernilai positif. Item yang paling baik sesuai urutannya: 42, 43, 46, 41, 39, 50, 36, 44, 38, 40, 37, 49, 48, 3, 45, 47, 35, 33, 1, 32, 34, 31, 28, 2, 30, 29, 26, dan 27. Oleh karena itu, model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap item dalam subtes ini bersifat unidimensional dengan hanya mengukur computation saja.
4.1.2. Validitas Konstruk Subtes Three Dimensional Space
Hasil perhitungan awal yang diperoleh untuk subtes three dimensional space dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 71620.74, df = 740, P-value = 0.00000 RMSEA = 0.172. Setelah dilakukan modifikasi terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit dengan P>0,05 (tidak signifikan). Dengan demikian, model dengan hanya satu faktor tidak dapat diterima, dikarenakan pada model ini
87
terdapat banyak item yang kesalahannya saling berkolerasi sehingga item tersebut bersifat multidimensional pada dirinya masing-masing, yang berarti seluruh item selain mengukur three dimensional space juga mengukur hal yang lain.
Pada awalnya didapatkan df dengan jumlah 740, namun setelah mencapai model fit, df tersisa menjadi 250. Ini berarti pada perhitungan awal terdapat 740250= 490 korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal kualitas item tersebut. Pada subtes ini, semua item yang terdapat pada subtes three dimensional space bersifat multidimensional.
Dari 40 item yang mengukur subtes three dimensional space, terdapat tujuh item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan signifikan namun bernilai negatif . Ke tujuh item inilah yang harus di-drop, yaitu item nomor 32, 34, 35, 36, 37, 38, dan 40.
Dikarenakan banyaknya korelasi antar item pada subtes three dimensional space dan masih adanya item yang berkoefisien negatif sedangkan item dengan koefisien negatif tidak diperbolehkan dalam sebuah tes kemampuan dan untuk mendapatkan hasil dengan item yang benar-benar murni, maka akan dilakukan
88
analisis kembali dengan cara membuang semua item negatif dan item yang tidak signifikan pada perhitungan.
Hasil yang diperoleh untuk perhitungan kedua pada subtes three dimensional space dengan model satu faktor (unidimensional) dan item negatif yang sudah di drop tidak fit, didapatkan Chi Square = 25586.12, df = 495, P-value = 0.00000 RMSEA = 0.125. Kemudian dilakukan modifikasi kembali terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada gambar 4.2 berikut ini:
89
Gambar 4.2 Analisis Faktor Konfirmatorik untuk Subtes Three Dimensional Space
Terlihat dari gambar 4.2, bahwa nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat diterima, namun masih terdapat banyak item yang saling berkorelasi dengan kesalahan pengukuran pada item lainnya. Hal ini menandakan bahwa beberapa item tersebut sebenarnya memang bersifat multidimensional. Pada awalnya df
90
berjumlah 495, namun setelah mencapai model fit, df yang tersisa hanya 214. Ini berarti terdapat 495–214 =281 korelasi kesalahan yang dibebaskan. Kesalahan pengukuran item-item yang saling berkolerasi disajikan pada tabel 4.3.
Tabel 4.3 Matriks korelasi antar kesalahan pengukuran butir item pada Three Dimensional Space Item 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 33 39
1
2
3
1 0.25 0.16 0.21 0.13
1 0.05 0.08 0.20
1 0.04 0.11
4
1 0.12 0.03
0.07 -0.04
5
6
1 0.03 0.10
1
-0.04
-0.07
-0.03 0.04
0.08 0.04
0.04 -0.02 0.09 0.05
-0.04 -0.04 0.04
-0.05 -0.04 -0.04
0.14 0.05 0.03
-0.04 -0.10 -0.05 -0.05
-0.06
-0.08 -0.11
-0.03 0.04
-0.06 0.05 0.04 -0.05
10
0.05 -0.08
1 -0.04
-0.07 0.05 -0.05 0.07
-0.04
-0.05 0.04
-0.08 -0.05
1 0.08 -0.04 -0.07 -0.06 -0.03 -0.07 -0.05
-0.03
0.11 0.07 0.03 -0.05 -0.06 0.06 0.08
0.03 0.06 0.05 -0.07 -0.08 -0.07 -0.12
1
-0.05
-0.07
0.06
-0.06
0.03
0.03 -0.05 0.00
-0.03
-0.06
-0.07 -0.04
-0.01
0.06
-0.05 0.04 -0.05 -0.05 0.04 0.02 -0.04
11
1
-0.08 -0.05
9
0.05
-0.03 -0.05
8
1 -0.07
0.03 0.06 0.07
7
0.08 -0.03
0.07 0.05 0.04 -0.04
-0.03 0.08 0.07
0.07 0.04 -0.03 -0.08
0.07 -0.07
-0.04 0.04
91
-0.02
0.07 0.03 0.12
-0.13 -0.03
-0.03 0.01 -0.05 -0.08
Tabel 4.3 Matriks korelasi antar kesalahan pengukuran butir item pada Three Dimensional Space (Lanjutan) Item 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 33 39
12 1 -0.04
13
14
1 -0.06
1
15
1 0.07
0.03 0.02 -0.04 -0.02 0.04
0.06
0.03 -0.06
0.06 0.03
-0.07
-0.05 -0.06 -0.09
-0.01
1 0.07
18
1 0.11 0.09 0.06
0.04 -0.05
19
1 0.17 0.06 0.06 0.07
20
1 0.04 0.15 0.12 0.14 0.10
-0.05 -0.04
-0.04 -0.12 -0.05
1 -0.05
0.04 -0.05
-0.05 -0.04
17
-0.04 -0.03 -0.04
0.03
16
0.05
-0.06
-0.07 -0.04 -0.05 -0.09 -0.13 -0.03 -0.05
-0.04
-0.06 -0.06 -0.05
0.07 0.14 -0.09 -0.04 -0.04 -0.04
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
92
21
1 0.16 0.13 0.16 0.12 0.11 0.09 0.09 0.11 0.06 0.04 -0.10
22
1 0.30 0.32 0.21 0.28 0.14 0.22 0.21 0.07 0.08 0.06 0.16
Tabel 4.3 Matriks korelasi antar kesalahan pengukuran butir item pada Space Perception (lanjutan) Item 23 24 25 26 27 28 29 30 31 33 39
23 1 0.38 0.44 0.25 0.24 0.30 0.10 0.14 0.13 0.23 0.03
24
25
26
27
28
29
30
31
33
39
1 0.36 0.28 0.23 0.23 0.20 0.14 0.21 0.12 0.11
1 0.34 0.31 0.44 0.21 0.23 0.14 0.27 0.06
1 0.37 0.36 0.27 0.25 0.26 0.15 0.18
1 0.42 0.28 0.27 0.28 0.28 0.15
1 0.48 0.44 0.36 0.47 0.26
1 0.35 0.29 0.31 0.25
1 0.50 0.47 0.24
1 0.46 0.31
1 0.44
1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini, yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.4 berikut ini:
93
Tabel 4.4 Muatan Faktor Item GATB subtes Three Dimensional Space Item
Koefisien
Standar Error
T- Value
Signifikan
1
0.37
0.02
19.84
V
2
0.48
0.02
27.39
V
3
0.62
0.02
34.72
V
4
0.55
0.02
30.72
V
5
0.59
0.02
33.93
V
6
0.22
0.02
11.35
V
7
0.55
0.02
30.86
V
8
0.59
0.02
34.28
V
9
0.15
0.02
7.97
V
10
0.52
0.02
27.83
V
11
0.49
0.02
27.72
V
12
0.70
0.02
41.70
V
13
0.31
0.02
16.72
V
14
0.62
0.02
36.72
V
15
0.56
0.02
31.83
V
16
0.48
0.02
26.57
V
17
0.53
0.02
28.27
V
18
0.36
0.02
19.77
V
19
0.60
0.02
35.32
V
20
0.51
0.02
28.66
V
21
0.51
0.02
28.92
V
22
0.18
0.02
9.48
V
23
0.45
0.02
25.16
V
24
0.29
0.02
15.28
V
25
0.33
0.02
18.05
V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan
94
Tabel 4.4 Muatan Faktor Item GATB subtes Three Dimensional Space (Lanjutan) Item
Koefisien
Standar Error
T-Value
Signifikan
26
0.38
0.02
20.64
V
27
0.23
0.02
11.94
V
28
0.11
0.02
5.69
V
29
0.10
0.02
5.18
V
30
0.24
0.02
12.28
V
31
0.11
0.02
5.93
V
33
0.29
0.02
15.13
V
39
0.14
0.02
7.29
V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan
Dari 33 item yang mengukur subtes three dimensional space, semua item dinyatakan signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan semua item dinyatakan bernilai positif. Item yang paling baik sesuai urutannya: 12, 14, 19, 3, 8, 5, 15, 7, 4, 2, 20, 17, 10, 11, 2, 16, 23, 26, 1, 18, 25, 13, 24, 33, 30, 27, 6, 22, 9, 39, 31, 28, dan 29.
Setelah melakukan analisis untuk kedua kalinya dengan membuang item negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan. Setiap item dalam subtes three dimensional space masih menunjukkan kolerasi antar item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model satu faktor yang diteorikan dalam subtes ini sebenarnya tidak dapat diterima karena ternyata setiap item dalam subtes ini tidak hanya mengukur satu faktor three dimensional space saja.
95
Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan mengenai berapa banyak faktor yang diukur oleh subtes three dimensional space dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes three dimensional space sebenarnya mengukur delapan faktor (Tabel 4.5). Namun perhitungan ini hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut mengenai berapa sebenarnya jumlah faktor yang diukur oleh subtes three dimensional space dan
penjelasan mengenai faktor-faktor tersebut tidak
dilakukan dalam penelitian ini.
Penjelasan mengenai kedelapan faktor dapat dilihat pada tabel 4.5 mengenai Rotated Component Matrix.
96
Tabel 4.5 Rotated Component Matrix pada Subtes Three Dimensional Space
Rotated Component Matrix
a
Component 1 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28 V29 V30 V31 V32 V33
.037 .111 .256 .045 .183 -.029.203 .485 .058 .308 .186 .480 .193 .479 .265 .355 .434 .488 .602 .561 .375 .189 .198 .167 .055 .047 -.055-.033.061 -.026-.018.056 .168
2 .002 .033 .068 .117 .045 .035 .115 .044 .062 .119 .048 .075 -.011.022 .038 -.014.049 .038 .131 .244 .321 .510 .628 .582 .660 .538 .432 .447 .184 .107 .021 .081 -.118-
3
4
.031 .070 .026 -.068.050 -.031.029 .116 -.056-.051-.032.022 .085 .034 .066 .073 -.046-.054.010 .012 .033 -.035.048 .050 .103 .191 .293 .462 .441 .645 .586 .656 .365
.699 .458 .489 .585 .428 .087 .111 .089 .000 .121 .130 .278 .120 .146 .133 -.016.248 -.011.044 .054 -.022.092 .109 .016 .026 .103 .009 -.002.001 -.008-.040.072 .064
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 15 iterations.
97
5 -.171.233 .116 .119 .356 -.120.265 .255 -.050.389 .522 .250 -.075.195 .275 .109 -.067-.107.076 .038 -.055-.342.100 -.110.181 .018 .251 .037 -.185.058 .012 .054 -.262-
6 -.051.216 .023 .014 .241 .764 .252 -.080-.026.062 -.052-.003-.045.142 .402 .352 .036 .038 .133 -.108.279 -.028.009 .121 -.059.116 .002 -.182-.084.060 .091 .001 -.009-
7 .054 .189 -.034-.047.078 -.222.245 -.052-.012-.325-.017.023 .659 .004 .202 .217 .173 -.012.028 .045 .177 -.099.066 .065 .042 -.070-.075-.031-.006.143 -.043.010 -.442-
8 -.106.058 .103 .002 .042 -.047.329 .059 .839 -.137-.036.014 .029 -.009.104 .023 .100 .147 -.030-.102.004 -.081.000 -.124.054 .193 .111 .079 -.088-.036-.064.092 .250
Tabel 4.6 Sebaran Item GATB subtes Three Dimensional Space Faktor
Item
1
8, 12, 14, 16, 17, 18, 19, 20, 21
2
22, 23, 24, 25, 26, 27
3
28,29, 30, 31, 32, 33
4
1, 2, 3, 4, 5
5
10, 11
6
6, 15
7
13
8
7, 9
Dari tabel 4.6 terlihat bahwa faktor 1 terukur oleh item 8, 12, 14, 16, 17, 18, 19, 20, 21. Faktor 2 terukur oleh faktor 22, 23, 24, 25, 26, 27. Faktor 3 terukur oleh faktor 28,29, 30, 31, 32, 33. Faktor 4 terukur oleh faktor 1, 2, 3, 4, 5. Faktor 5 terukur oleh faktor 10 dan 11. Faktor 6 terukur oleh faktor 6 dan 15. Faktor 7 terukur oleh faktor 13 saja serta faktor 8 yang terukur oleh faktor 7 dan 9. 4.1.3. Validitas Konstruk Subtes Vocabulary Hasil perhitungan awal yang diperoleh untuk subtes Vocabulary dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 2163.52, df = 1710, P-value = 0.00000 RMSEA = 0.009. Setelah dilakukan modifikasi terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkan model fit dengan P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu
98
vocabulary. Namun karena pada model ini ada beberapa item yang kesalahannya saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensional pada dirinya masing-masing.
Pada awalnya df berjumlah 1710, namun setelah mencapai model fit, df tersisa menjadi 1691. Ini berarti dalam perhitungan awal terdapat 1710-1691 = 19 korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal kualitas item tersebut.
Selanjutnya, kualitas item juga dapat dilihat dari signifikan atau tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini, yang diuji adalah hipotesis nihil dari muatan faktor. Dari hasil tersebut, ternyata didapatkan hanya ada satu item yang baik serta bernilai positif dari 60 item yang ada dalam subtes vocabulary yaitu item nomor 9 dan ke 59 item sisa yang ada bernilai negatif.
Dikarenakan hasil dari analisis awal yang hanya menghasilkan satu item dengan nilai yang positif, diprediksi subtes ini memiliki kesalahan dalam penyusunan skalanya, maka dilakukanlah pengecekan kembali terhadap kunci jawaban. Setelah melakukan pengecekan kunci jawaban dan tidak terjadi
99
kesalahan di dalamnya, 1 item yang bernilai positif tersebut dinyatakan berlawanan arah dan dilakukanlah analisis kembali dengan cara membuang item yang bernilai positif yaitu item nomor 9.
Hasil yang diperoleh untuk subtes vocabulary dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 1804.71, df = 1652, P-value = 0.00479 RMSEA = 0.005. Kemudian dilakukan modifikasi kembali terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada gambar 4.3 berikut ini:
100
Gambar 4.3 Analisis Faktor Konfirmatorik untuk subtes Vocabulary
Terlihat dari gambar 4.3, bahwa nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal, yaitu vocabulary. Pada model ini, hanya terdapat 2 pasang item yang saling berkolerasi 101
yaitu antara item nomor 49 dengan 18 dan item nomor 56 dengan 24. Dengan nilai koefisien korelasi untuk item 48 dengan 17 adalah -1.16 dan item nomor 56 dengan 24
adalah -1.15 dengan koefisien yang tidak signifikan. Dapat
disimpulkan bahwa dalam model ini semua item bersifat unidimensional yaitu hanya mengukur vocabulary saja.
Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini, yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.7 berikut ini:
Tabel 4.7 Muatan Faktor Item GATB subtes Vocabulary Item
Koefisien
Standar Error
T- Value
Signifikan
1
0.19
0.07
2.66
V
2
0.24
0.07
3.33
V
3
0.28
0.07
3.95
V
4
0.17
0.07
2.40
V
5
0.21
0.07
3.00
V
6
0.19
0.07
2.63
V
7
0.22
0.07
3.14
V
8
0.27
0.07
3.71
V
10
0.17
0.07
2.33
V
11
0.17
0.07
2.43
V
12
0.12
0.07
1.75
X
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
102
Tabel 4.7 Muatan Faktor Item GATB subtes Vocabulary (Lanjutan) Item
Koefisien
Standar Error
T-value
Signifikan
13
0.06
0.07
0.85
X
14
0.12
0.07
1.65
X
15
0.24
0.07
3.29
V
16
0.03
0.07
0.41
X
17
0.33
0.07
4.56
V
18
0.19
0.07
2.58
V
19
0.24
0.07
3.39
V
20
0.14
0.07
1.95
X
21
0.27
0.07
3.76
V
22
0.28
0.07
3.91
V
23
0.36
0.07
5.01
V
24
0.26
0.07
3.64
V
25
0.51
0.07
7.11
V
26
0.29
0.07
4.08
V
27
0.34
0.07
4.81
V
28
0.46
0.07
6.41
V
29
0.62
0.07
8.67
V
30
0.60
0.07
8.42
V
31
0.62
0.07
8.71
V
32
0.73
0.07
10.34
V
33
0.66
0.07
9.33
V
34
0.58
0.07
8.09
V
35
0.67
0.07
9.41
V
36
0.88
0.07
12.41
V
37
0.87
0.07
12.26
V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
103
Tabel 4.7 Muatan Faktor Item GATB subtes Vocabulary (Lanjutan) Item
Koefisien
Standar Error
T-Value
Signifikan
38
0.74
0.07
10.42
V
39
0.80
0.07
11.36
V
40
0.89
0.07
12.65
V
41
0.85
0.07
12.09
V
42
0.73
0.07
10.25
V
43
0.88
0.07
12.49
V
44
0.87
0.07
12.27
V
45
0.88
0.07
12.48
V
46
0.85
0.07
12.01
V
47
0.84
0.07
11.84
V
48
0.83
0.07
11.76
V
49
0.87
0.07
12.36
V
50
0.84
0.07
11.96
V
51
0.77
0.07
10.91
V
52
0.78
0.07
11.00
V
53
0.70
0.07
9.93
V
54
0.74
0.07
10.47
V
55
0.70
0.07
9.93
V
56
0.66
0.07
9.31
V
57
0.70
0.07
9.80
V
58
0.62
0.07
8.72
V
59
0.61
0.07
8.53
V
60
0.64
0.07
8.96
V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
104
Dari 59 item yang mengukur subtes vocabulary, ternyata ada lima item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute). Ke lima item inilah yang harus di drop, yaitu item 12, 13, 14, 16, dan 20. Dari hasil tersebut semua item dinyatakan bernilai positif, item yang paling baik sesuai dengan urutannya adalah item nomor 40, 43, 45, 36, 49, 37, 44, 41, 46, 50, 47, 48, 39, 52, 51, 54, 38, 32, 42, 53, 55, 57, 35, 33, 56, 60, 58, 31, 29, 59, 30, 34, 25, 28, 23, 27, 17, 26, 3, 22, 21, 8, 24, 19, 2, 15, 7, 5, 1, 6, 18, 11, 4, dan 10. Oleh karena itu, model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap item dalam subtes ini bersifat unidimensional dengan hanya mengukur vocabulary saja.
4.1.4. Validitas Konstruk Subtes Arithmetic Reasoning (AR)
Hasil perhitungan awal yang diperoleh untuk subtes arithmetic reasoning (AR) dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 29884.13, df = 275, P-value = 0.00000 RMSEA = 0.182. Kemudian setelah dilakukanlah modifikasi terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka diperoleh model fit dengan Chi – Square = 57.98 , df = 44 , P-value = 0.07693 , RMSEA = 0.10. Nilai Chi – Square menghasilkan P-value > 0.05 (tidak signifikan). Namun, model dengan hanya satu faktor tidak dapat diterima, dikarenakan pada model ini terdapat banyak item yang kesalahannya saling berkolerasi sehingga item tersebut bersifat multidimensional, yang berarti seluruh item selain mengukur arithmetic reasoning juga mengukur hal yang lain.
105
Karena GATB adalah alat tes kemampuan, maka tidak boleh ada item yang berkoefisien negatif karena negatif itu menandakan semakin salah jawaban pada item tersebut semakin tinggi kemampuan arithmetic reasoningnya. Oleh sebab itu, bila terjadi seperti ini, maka item tersebut tidak dapat dipakai sehingga harus didrop atau direvisi. Setelah itu dilakukan analisis kedua setelah item negatif dikeluarkan. Hasil run pertama menunjukkan bahwa item nomor 5 berkorelasi negatif, sehingga harus dibuang dan tidak diikutkan dalam analisis kedua.
Dari hasil analisis kedua untuk subtes arithmetic reasoning dengan model satu faktor (unidimensional) dan item negatif yang sudah di-drop tidak fit, didapatkan Chi Square = 6100.55, df = 252, P-value = 0.00000 RMSEA = 0.084. Kemudian
dilakukan
modifikasi
kembali
terhadap
model
dengan
cara
membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya.
Pada model dengan item negatif yang sudah di-drop ternyata masih terdapat item yang berkorelasi dengan kesalahan pengukuran pada item lainnya. Hal ini menandakan bahwa beberapa item tersebut sebenarnya memang bersifat multidimensional. Setelah melihat kualitas item dengan menguji hipotesis nihil dari muatan faktor maka didapatkan bahwa dari 24 item yang mengukur subtes arithmetic reasoning (AR), ternyata ada empat item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute). Ke empat item inilah yang harus di drop,
106
yaitu item nomor 9, 16, 22, dan 23. Dari hasil tersebut semua item dinyatakan bernilai positif. Untuk mendapatkan hasil dengan item yang benar-benar murni, maka dilakukan analisis kembali namun kali ini seluruh item yang tidak signifikan tidak diikutsertakan atau dengan kata lain di-drop terlebih dahulu. Item yang tidak diikutsertakan adalah item nomor 9, 16, 22, dan 23
Hasil yang diperoleh untuk analisis ketiga pada subtes arithmetic reasoning dengan model satu faktor (unidimensional) dan item negatif yang sudah di-drop tidak fit, didapatkan Chi Square = 4289.60, df=170, P-Value = 0.00000 RMSEA=0.086. Kemudian dilakukan modifikasi kembali terhadap model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada gambar 4.4 berikut ini.
107
Gambar 4.4 Analisis Faktor Konfirmatorik untuk Subtes Arithmetic Reasoning
Pada awalnya nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat diterima. Namun, setelah model dengan item negatif yang sudah di-drop ternyata hanya terdapat satu item yang bersifat unidimensional yaitu item nomor 7 dan sisa item yang ada masih saling berkolerasi dengan kesalahan pengukuran pada item lainnya, hal ini menandakan
108
bahwa beberapa item tersebut sebenarnya memang bersifat multidimensional namun korelasi antar item nya telah banyak berkurang seiring dengan beberapa item negatif dan tidak signifikan yang di drop.
Pada awalnya df berjumlah 170, namun setelah mencapai model fit, df yang tersisa hanya 95. Ini berarti terdapat 170-95 = 75 korelasi kesalahan yang dibebaskan. Kesalahan pengukuran item-item yang saling berkolerasi disajikan pada tabel 4.8.
Tabel 4.8 Matriks korelasi antar kesalahan pengukuran butir item pada Arithmetic Reasoning Item 1 2 3 4 6 7 8 10 11 1 1 0.13 1 2 0.09 1 3 1 4 0.19 0.15 0.19 0.12 1 6 -0.08 1 7 0.08 0.07 0.27 1 8 0.06 1 10 0.08 1 11 0.12 12 -0.08 -0.09 13 -0.07 14 15 17 0.00 -0.12 0.03 18 0.09 19 0.07 20 -0.08 -0.05 -0.09 21 -0.12 -0.08 -0.11 24 -0.09 -0.07 -0.19 -0.19 -1.08 25 Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
109
12
1 0.12 0.08 0.07
Tabel 4.8 Matriks korelasi antar kesalahan pengukuran butir item pada Arithmetic Reasoning (Lanjutan) Item 13 14 15 17 18 19 20 21 24 13 1 0.15 14 1 0.26 0.21 15 1 0.13 0.14 0.24 17 1 0.12 0.11 0.40 18 1 0.10 0.13 0.20 0.47 0.54 19 1 0.09 0.12 0.37 0.29 0.59 20 1 0.09 0.10 0.30 0.36 0.57 0.59 21 1 0.13 0.09 0.13 0.36 0.25 0.33 0.41 24 1 0.25 0.15 0.28 0.07 0.27 0.53 0.42 0.57 25 Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini, yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.9 berikut ini:
110
25
1
Tabel 4.9 Muatan Faktor Item GATB subtes Arithmetic Reasoning Item
Koefisien
Standar Error
T- Value
Signifikan
1
0.28
0.03
8.71
V
2
0.50
0.03
15.39
V
3
0.49
0.03
14.57
V
4
0.57
0.03
16.65
V
6
0.35
0.03
9.31
V
7
0.59
0.03
18.59
V
8
0.48
0.03
14.38
V
10
0.52
0.03
16.08
V
11
0.53
0.03
16.37
V
12
0.41
0.03
12.98
V
13
0.50
0.03
15.27
V
14
0.18
0.03
5.17
V
15
0.36
0.03
10.96
V
17
0.31
0.03
9.16
V
18
0.37
0.03
10.81
V
19
0.25
0.03
7.54
V
20
0.18
0.03
5.45
V
21
0.27
0.03
8.14
V
24
0.17
0.03
4.75
V
25
0.19
0.03
5.21
V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan
Dari 20 item yang mengukur subtes arithmetic reasoning (AR), semua item dinyatakan signifikan, karena nilai t lebih besar dari 1, 96 (absolute) dan juga bernilai positif. Item yang paling baik sesuai dengan urutannya adalah item nomor 7, 4, 11, 10, 2, 13, 3, 8, 12, 15, 18, 6, 17, 1, 21, 19, 20, 25, 14, dan 24. 111
Setelah melakukan analisis untuk ketiga kalinya dengan membuang item negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan. Setiap item dalam subtes arithmetic reasoning masih menunjukkan kolerasi antar item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model satu faktor yang diteorikan dalam subtes ini tidak dapat diterima karena ternyata setiap item dalam subtes ini tidak hanya mengukur satu faktor arithmetic reasoning saja.
Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan mengenai berapa banyak faktor yang diukur oleh subtes arithmetic reasoning dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes arithmetic reasoning sebenarnya mengukur lima faktor (Tabel 4.10). Namun perhitungan ini hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut mengenai berapa sebenarnya jumlah faktor yang diukur oleh subtes arithmetic reasoning dan penjelasan mengenai faktor-faktor tersebut tidak dilakukan dalam penelitian ini.
Penjelasan mengenai kelima faktor dapat dilihat pada tabel 4.10 mengenai Rotated Component Matrix.
112
Tabel 4.10 Rotated Component Matrix pada Subtes Arithmetic Reasoning
Rotated Component Matrix
a
Component 1
2
3
4
5
V1
-.104-
.478
-.096-
.150
.147
V2
.038
.471
.193
.035
.035
V3
.075
.537
.062
.052
-.076-
V4
.099
.403
.283
-.111-
-.134-
V5
-.025-
.667
.024
-.029-
-.002-
V6
.083
.274
.389
.162
.014
V7
.001
.474
.261
.064
-.126-
V8
.069
.178
.545
-.055-
-.020-
V9
.060
.103
.645
-.007-
.087
V10
-.052-
.004
.592
.205
.026
V11
.071
.065
.373
.545
-.022-
V12
.030
.127
-.232-
.666
.088
V13
.140
.024
.223
.628
.014
V14
.548
-.044-
.144
.303
-.078-
V15
.631
.008
.091
.104
-.092-
V16
.762
.005
.033
.082
.007
V17
.553
.056
-.047-
-.076-
.335
V18
.575
.069
-.027-
-.087-
.307
V19
.074
-.054-
.100
-.020-
.654
V20
.056
-.035-
-.018-
.112
.765
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 7 iterations.
113
Tabel 4.11 Sebaran Item GATB subtes Arithmetic Reasoning Faktor
Item
1
14, 15, 16, 17, 18
2
1, 2, 3, 4, 5, 7
3
6, 8, 9, 10
4
11, 12, 13
5
19, 20
Dari tabel 4.10 terlihat bahwa faktor 1 terukur oleh item 14, 15, 16, 17, 18. Faktor 2 terukur oleh faktor 1, 2, 3, 4, 5, 7. Faktor 3 terukur oleh faktor 6, 8, 9, 10. Faktor 4 terukur oleh faktor 11, 12, 13 serta faktor 5 yang terukur oleh faktor 19 dan 20 4.2. Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu Konstruk Bersifat
Umum (General Intelligence)
Langkah selanjutnya yang harus dilakukan setelah menganalisis faktor konfirmatorik dari setiap subtes adalah melakukan analisis faktor konfirmatori untuk kostruk umum yang hendak diteliti yaitu inteligensi. Dalam konteks ini, matriks korelasi antar faktor (subtes) digunakan sebagai input. Namun apabila menggunakan Lisrel, kedua tingkatan analisis faktor ini dapat dilakukan secara simultan (satu kali analisis). Analisis seperti ini disebut juga dengan nama “analisis faktor konfirmatorik orde kedua” (second order factor analysis). Dalam hal ini item merupakan indikator dari masing-masing subtes (faktor tingkat satu)
114
dan pada saat yang sama subtes merupakan indikator dari faktor tingkat kedua (inteligensi/general factor). Peneliti menggunakan metode ini, karena lebih efisien (hanya satu kali analisis secara simultan) dan dari sudut statistik, analisis seperti ini lebih terpercaya (Joreskog, dan Sorbom, 2006).
Hasil yang diperoleh untuk model dengan second order faktor analisis, nilai Chi - Square = 5692.46, df = 8906, P-value = 1.00000 atau P>0,05 , dan RMSEA = 0.000. Dapat disimpulkan bahwa model dengan dua tingkatan faktor (second order CFA) fit dengan data. Artinya, teori yang mengatakan bahwa itemitem mengukur empat subtes dan keempat subtes mengukur inteligensi umum dapat diterima. Hasilnya dapat dilihat pada tabel 4.12 dan gambar 4.5.
Tabel 4.12 Koefisien Muatan Faktor Untuk General Intelligence
Subtes
Koefisien
Standar
T-Value
Signifikan
Error Computation
0.35
0.06
6.20
V
Three Dimensional
0.11
0.03
3.70
V
Vocabulary
0.12
0.05
2.23
V
Arithmetic
0.01
0.07
0.17
X
Space
Reasoning
115
Gambar 4.5 Koefisiein Muatan Faktor Untuk General Intelligence
Dari tabel dan gambar di atas ditemukan bahwa, subtes yang muatan faktornya signifikan dalam mengukur inteligensi adalah computation, three dimensional space dan vocabulary. Sedangkan yang tidak signifikan adalah arithmetic reasoning. Berdasarkan hasil ini, terdapat kemungkinan bahwa pengukuran terhadap inteligensi umum cukup dengan menggunakan subtes yang signifikan saja, yaitu subtes computation, three dimensional space dan vocabulary .
116
BAB V KESIMPULAN, DISKUSI DAN SARAN
Dalam bab lima ini akan dipaparkan tentang kesimpulan, diskusi, dan saran mengenai hasil dari penelitian.
5.1
Kesimpulan
Pada bagian ini, akan dipaparkan kesimpulan dari pengujian hipotesis yang telah diuraikan pada bab empat. Hipotesis itu adalah:
1. Seluruh item dalam empat subtes GATB yang dijadikan penelitian adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada
suatu
didefinisikan
subtes pada
mengukur subtes
hanya
tersebut
satu yaitu
kemampuan
yang
computation,
three
dimensional space, vocabulary, dan arithmetic reasoning. Bahwa setiap item dalam masing-masing subtes adalah secara signifikan mengukur kemampuan pada subtes tersebut. 2. Empat subtes GATB adalah fit (sesuai) dengan model satu faktor, yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah “Inteligensi”.
Kesimpulan mengenai jumlah df yang menjadi korelasi sebelum dan sesudah dilakukannya modifikasi terhadap model dapat dilihat pada tabel 5.1.
117
Tabel 5.1 Analisis CFA Pada Setiap Subtes GATB
Subtes
Chi Square
Df
P-Value
RMSEA
515.28
350
0.00000
0.012
374.86
338
0.08157
0.006
Three Dimensional
25586.12
495
0.00000
0.125
Space
247.29
214
0.05887
0.007
1804.71
1652
0.00479
0.005
1714.36
1650
0.13186
0.003
4289.60
170
0.00000
0.086
116.05
95
0.07105
0.008
Computation
Vocabulary
Arithmetic Reasoning
Sedangkan kesimpulan mengenai hasil pengujian hipotesis 1 dipaparkan dalam tabel 5.2 berikut ini:
118
119
Berdasarkan tabel 5.2 dapat dilihat bahwa hipotesis 1 diterima yang artinya bahwa semua subtes dalam GATB fit (sesuai) dengan model satu faktor, yaitu mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut. Dari empat subtes dalam GATB terdapat dua subtes yang untuk mencapai model fit hanya memerlukan modifikasi yang singkat, namun dua subtes lainnya untuk mencapai model fit harus dilakukan beberapa kali modifikasi yang lebih mendalam karena banyaknya item yang saling berkolerasi.
Terdapat dua subtes yang dalam mencapai model fit hanya memerlukan modifikasi yang singkat karena memiliki item yang baik setelah item-item yang tidak signifikan dan bernilai negatif dibuang. Subtes tersebut adalah computation dan vocabulary, keduanya dianggap bernilai baik karena tidak memiliki korelasi antar item yang terlalu banyak sehingga setiap item terbukti memang mengukur konstruk yang dimaksud. Kedua subtes tersebut memiliki karakteristik yang baik dikarenakan memiliki jenis item yang setara dan mengukur satu jenis kemampuan saja sehingga mudah dipahami dalam pengerjaannya.
Subtes yang untuk mencapai model fit harus melakukan banyak modifikasi adalah three dimensional space dan arithmetic reasoning. Jenis item dalam subtes ini memiliki karakteristik yang tidak baik karena memiliki terlalu banyak multidimensionalitas, dalam arithmetic reasoning hal ini dikarenakan dalam setiap item selain mengukur kemampuan numerik namun juga memerlukan kemampuan penalaran verbal.
Item mengukur kemampuan numerik, namun
persoalan dalam setiap item dibalut dengan soal berbentuk cerita yang terstruktur.
120
Apabila subjek tidak mengerti perintah dalam setiap item pada subtes arithmetic reasoning, maka subjek tidak akan mampu untuk menjawab persoalan.
Hasil pengujian hipotesis 2 melalui analisis faktor dua tingkat (second order confirmatory factor analysis) menghasilkan pernyataan bahwa terdapat tiga dari empat subtes GATB yang signifikan dalam mengukur inteligensi umum, yaitu subtes computation, three dimensional space, dan vocabulary. Dalam analisis faktor dua tingkat ini item-item yang berkoefisien negatif dan tidak signifikan pada setiap subtes tidak digunakan atau di drop supaya menghasilkan perhitungan yang baik.
Setelah melakukan analisis faktor terhadap empat subtes dalam GATB yang mengukur inteligensi, menunjukkan bahwa alat tes GATB masih dapat dan layak digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan perbaikan dan pembaharuan terhadap
item-item
yang
memiliki
multidimensionalitas yang terlalu banyak.
5.2
Diskusi
Melihat hasil analisis yang menyatakan bahwa terdapat subtes yang bersifat multidimensional karena ternyata secara teoritis, tiga subtes dari empat subtes yang diteliti dalam GATB memang mengukur lebih dari 1 faktor. Subtes yang murni mengukur 1 faktor hanyalah computation yaitu mengukur kemampuan numerik, sedangkan untuk subtes three dimensional space mengukur kemampuan spatial dan general learning ability, subtes vocabulary selain mengukur
121
kemampuan verbal ternyata juga mengukur general learning ability dan subtes arithmetic reasoning yang mengukur kemampuan numerik juga general learning ability.
Dari hasil pengujian hipotesis 1 dengan menggunakan CFA menunjukkan bahwa terdapat banyak korelasi antar measurement error pada setiap item di subtes GATB. Hal ini menunjukkan bahwa banyak item dalam tes GATB yang selain mengukur apa yang hendak diukur, ternyata juga mengukur hal yang lain (multidimensional). Pada subtes computation terdapat 12 buah korelasi antar kesalahan pengukuran pada satu item dengan kesalahan pengukuran pada item lainnya dalam subtes tersebut. Selanjutnya pada subtes three dimensional space terdapat 281 korelasi yang sejenis, pada subtes vocabulary terdapat 2 korelasi, pada subtes arithmetic reasoning terdapat 75 korelasi. Jadi, kesimpulannya subtes yang paling kompleks (multidimensional) adalah subtes three dimensional space, dilanjutkan dengan arithmetic reasoning, computation dan yang memiliki kesalahan korelasi paling sedikit adalah vocabulary.
Hal ini menunjukkan bahwa pada subtes yang itemnya valid (signifikan) juga terdapat masalah multidimensionalitas dari item dalam subtes tersebut. Beberapa hal yang mungkin menyebabkan multidimensional adalah:
1.
Waktu pengerjaan yang diberikan untuk setiap subtes relatif singkat, tidak sebanding dengan jumlah item dari setiap subtes yang cenderung banyak sehingga sebagian besar subyek tidak dapat menyelesaikan semua persoalan dalam setiap subtes.
122
2.
Waktu pengerjaan untuk setiap subtes yang singkat menuntut subjek untuk bekerja sesuai waktu yang ditentukan hal ini dapat menyebabkan subjek menebak (guessing) jawaban dari setiap item yang disajikan sehingga pelaksanaan tes yang mengacu pada normanorma tidak dapat berlaku.
3.
Item yang diberikan terlalu mudah sehingga hampir setiap subyek dapat menjawab dengan benar atau sebaliknya, item terlalu sulit sehingga hampir setiap subyek menjawab salah.
4.
Terdapat jenis item dalam subtes yang memerlukan penalaran dan penafsiran lebih mendalam. Hal ini dapat dilihat dalam subtes three dimensional space yang mengharuskan subjek untuk membayangkan suatu bentuk peritmean kubus, balok maupun bentuk tiga dimensi lainnya dan dalam subtes arithmetic reasoning yang mengharuskan subjek untuk mengerjakan soal perhitungan namun harus terlebih dahulu menalar soal cerita yang diberikan sehingga menyebabkan banyak kekeliruan dalam menjawab item yang diberikan. Jenis Item ini menyebabkan dengan mudahnya terjadi penafsiran ganda terhadap apa yang ditanyakan.
5.
Rentangan atau varians dari tingkat kesukaran soal antar satu subtes dengan yang lainnya, sebaiknya jangan terlalu berbeda (homogenitas varians dari kesukaran soal antar subtes). Artinya, dalam rangka mengukur inteligensi sebaiknya semua subtes memiliki tingkat variasi kesukaran soal yang relatif sama. Karena hal ini dapat berpengaruh
123
pada di dropnya item tertentu. Dari hasil indeks validitas item, terlihat bahwa dari semua item, lebih dari setengahnya (77,14 % = 135 item) dapat terus digunakan, walaupun akan lebih baik bila dilakukan revisi terhadap pilihan jawaban. Sedangkan 22,86 % sisanya (40 item) indeks validitas itemnya tergolong rendah sehingga tidak dapat terus digunakan, dalam arti di drop atau perlu dilakukan revisi terhadap item-item tersebut.
Penelitian mengenai perkembangan GATB pernah dituliskan oleh Steven J. Mellon Jr pada tahun 1996 dalam jurnalnya yang berjudul Development of General Aptitude Test Battery (GATB) Forms E and F. Jurnal ini bertujuan untuk mengembangkan bentuk-bentuk alternatif dari bagian kognitif pada GATB. Dalam jurnal dijelaskan bahwa bentuk kognitif mencakup tujuh subtes dalam GATB yaitu
arithmetic reasoning, vocabulary, three dimensional space,
computation, name comparation, tool matching, dan form matching. Secara umum, sejumlah perubahan dilakukan untuk memperbaiki penampilan dan menyederhanakan item tes itu sendiri. Sebagai contoh dari perbaikan item tes, pada subtes three dimensional space, kualitas cetak dan resolusi ditingkatkan melalui CorelDRAW untuk mengembangkan item.
5.3
Saran
Dalam penelitian ini, peneliti menyadari masih banyak terdapat kekurangan. Oleh karena itu, peneliti memberi saran yang dapat digunakan untuk pengembangan
124
penelitian ke depannya. Saran tersebut berupa saran metodologis dan saran praktis.
5.3.1 Saran Metodologis
1. Untuk penelitian selanjutnya, ada baiknya mempertimbangkan variabel lainnya seperti perbedaan usia, jenis kelamin, latar belakang, budaya dan hal penting lainnya yang dalam penelitian ini tidak dimiliki datanya. 2. Untuk pengembangan uji validitas kedepannya, dapat menggunakan seluruh subtes dalam GATB pada pengujian validitas konstruk. Dengan menggunakan seluruh subtes dalam GATB maka akan didapatkan kostruk mengenai bakat yang dimiliki seseorang, jadi tidak terbatas hanya inteligensi saja. 3. Terdapat banyak item yang bersifat multidimensional. Hal ini dapat disebabkan oleh kerangka berfikir teori GATB dimana dijelaskan setiap subtes sebenarnya masih terdiri dari beberapa sub faktor, yang seharusnya dapat diwujudkan dalam bentuk faktor tersendiri yang berbeda tingkatan (analisis faktor tiga tingkat). Jadi, akan lebih baik, bila analisis faktor dilakukan 3 tingkat (third order CFA). Namun demikian, perlu dilakukan identifikasi terlebih dahulu untuk melihat item yang mengukur sub faktor di dalam masing-masing subtes tersebut.
125
5.3.2 Saran Praktis
1.
Untuk penyedia layanan tes psikologi, sebaiknya mencari informasi dan melakukan pengecekan terlebih dahulu sebelum memutuskan untuk menggunakan suatu alat tes.
2.
Selanjutnya, bagi institusi psikologi pengguna alat tes GATB, cukup menggunakan 3 subtes saja dalam GATB yaitu computation, three dimensional space, dan vocabulary untuk mengukur inteligensi. Namun perlu ada penelitian lebih lanjut untuk membuktikan mengenai skor inteligensi yang dihasilkan.
126
DAFTAR PUSTAKA
Aiken, Lewis. R. (1997). Psychological testing and assessment. Boston: Allyn and bacon. Anastasi, Anne. (1997). Psychological testing, seventh edition. New Jersey: Prentice-Hall, Inc. Azwar, Saifuddin. (2004). Reliabilitas dan validitas. Yogyakarta: Pustaka Pelajar. Brown, T. A. (2006). Confirmatory factor analysis for applied research. New york:
The Guildford Press.
Buckingham, Marcus and Donald 0. Clifton. (2001). Now, discover your strengths. New York: The Free Press. Chaplin, JP. (2006). Kamus lengkap psikologi. Jakarta: PT Raja Grafindo Pustaka. Coyle, Daniel. (2009). Talent code. New York: Bantam Dell. Davis, Tony. (2009). Talent assessment. Jakarta: PPM Djaali, H & Pudji Muljono. (2007). Pengukuran dalam bidang psikologi. Jakarta: Gramedia Pustaka Gardner, Howard. (1985). Frames of mind, the theory of multiple intelligences. New York: Basic Book, Inc. Greogry, Robert J. (2007). Psychological testing: History, principles, and application 5th Edition. New Jersey: Pearson Education, Inc. Jigau, Mihai. (2007). Career counselling, compendium of methods and techniques.
Bucharest: AFIR.
127
Jöreskog, K.G. & Sörbom, D. (2006). LISREL 8.70 for windows (computer software). Lincolnwood, IL: Scientific Software International, Inc. Kaplan, Robert M.
& Dennis P. Saccuzzo. (2009). Psychological testing:
Principles, apllication & issues 7th edition. Belmont: Wadsworth Kerlinger, F.N. (2006). Asas-asas penelitian behavioral. Yogyakarta: Gadjah Mada University Press. Loewenthal, Kate Miriam. (1996). An introduction to psychological test and scales. London: UCL Press. Munandar, Ashar Sunyoto. (2001). Psikologi industri dan organisasi. Jakarta: Universitas Indonesia. Murphy, Kevin R. (1994). Psychological testing: Principels and application. London: Prentice-hall Int. Thompson, Bruce. (2004). Explanatory and confirmatory factor analysis. Washington DC: American Psychological Assosiation. Sadli, Saparinah. (1991). Inteligensi bakat dan test IQ. Jakarta: Gaya Favorit Pres.
Shaleh, A.R & Wahab, M.A. (2004). Psikologi suatu pengantar, Jakarta: Prenada Media. Sukardi, Dewa Ketut. (2009). Analisis tes psikologi teori dan praktik. Jakarta: Rineka Cipta. Umar, Jahja. (2011). Personal Communication.
Van Ornum, William. (2008). Psychological testing across the life span. New Jersey: Pearson Education, Inc
128
LAMPIRAN
129
130