BAB II TELAAH PUSTAKA
A. Analisis Karakteristik Psikometri 1. Validitas a. Pengertian Validitas Pada tahun 1989, Messick (dalam Osterlind, 2010) mengemukakan bahwa validitas adalah evaluasi yang terintegrasi terhadap sejauh mana kesimpulan atau hipotesis hasil tes didukung oleh bukti-bukti empiris dan alasan-alasan teoritis. Ketika seseorang melakukan validasi suatu tes, orang tersebut berarti memastikan sejauh mana bukti-bukti empiris sejalan dengan kesimpulan atau hipotesis dari hasil tes. Hal tersebut dapat disebut sebagai validity evaluation (Osterlind, 2010). Menurut Cronbach (dalam Azwar, 2003), proses validasi bukan bertujuan untuk melakukan validasi tes, tetapi melakukan validasi terhadap kesimpulan data yang diperoleh. Kesimpulan yang diputuskan harus berdasarkan nilai/hasil tes, serta asumsi-asumsi yang mendukung kesimpulan tersebut. Teori skor-murni klasik (Azwar, 2003) mengartikan pengertian validitas sebagai sejauh mana skor tampak (observed scores) dapat mendekati nilai skor murni (true scores). Tetapi, skor tampak tidak akan persis sama dengan skor murni kecuali alat ukur tersebut memiliki validitas sempurna atau pengukuran tanpa eror. Sedangkan pada buku Standards, validitas berarti derajat sejauh mana bukti dan teori mendukung interpretasi dari skor tes yang sesuai dengan tujuan tes dikonstrak
(American
Educational
Research
Association,
dkk.
dalam
9 Universitas Sumatera Utara
10
Osterlind, 2010). Osterlind (2010) mengungkap tiga aspek dalam validitas. Pertama, validitas itu berarti menginterpretasikan skor tes dalam situasi assesmen tertentu, bukan pada alat ukurnya. Kedua, untuk membangun sebuah validitas, diperlukan proses evaluasi. Ketiga, validitas juga berarti mengeksplorasi bagian psikologi.
b. Sumber Bukti Validitas Ada beberapa sumber bukti validitas yang dikemukakan Osterlind (2010), yaitu bukti validitas berdasarkan: 1) Isi/Konten Tes Mengevaluasi bukti validitas dari skor tes biasanya selalu menggunakan informasi mengenai konten dari tes. Hal yang dimaksud adalah content domain (dalam tes berbasis domain), atau construct (dalam tes yang mengungkap sifat-sifat laten). Walaupun orang yang mengkonstrak tes seharusnya membuat deskripsi atau informasi mengenai konstrak tes, kebanyakan orang tidak menjelaskannya secara detail. Padahal, informasiinformasi tersebut (misalnya informasi mengenai fungsi alat tes) sangat membantu dalam mempertimbangkan konten tes. Namun, ada beberapa pertimbangan untuk konstrak tes yang bersifat psikologis, terutama pada tes psikologi yang tidak boleh mengungkap informasi secara langsung. Agar dapat lebih mudah membuat konstrak tes, biasanya blueprint digunakan. Dengan blueprint alat tes, evaluasi validitas dapat menjadi lebih jelas dan teliti. Blueprint tersebut kemudian akan dilakukan professional judgment.
Universitas Sumatera Utara
11
2) Proses Merespon Bukti validitas juga bisa didapat dari proses kognitif (merespon) subjek, yaitu apakah subjek menjawab pertanyaan dari tes berdasarkan pemahaman yang sesuai dengan tes. Proses respon dapat dievaluasi dengan menggunakan metode latent variable analyses, structural equation modeling (SEM), hierarchical linear modeling (HLM), conjectural analysis, path analysis, dan beberapa tipe dari meta-analyses. Selain itu, metode Taxonomy Bloom juga dapat digunakan. Tetapi, dalam melakukan evaluasi menggunakan metode ini, perlu hati-hati juga karena evaluasi proses respon peserta juga dapat menjadi cara yang mudah dan tidak tepat. 3) Struktur Internal Mengevaluasi struktur internal dari suatu tes berarti mengevaluasi validitas secara keseluruhan. Struktur internal ini sama dengan validitas konstrak. Struktur internal tes tertuju pada pembuatan kesimpulan yang tepat dan reliabel mengenai konstrak yang dievaluasi. Biasanya struktur internal tes dievaluasi dengan mengevaluasi teori-teori dasar yang berhubungan dengan tes. Teori yang dikonstrak dengan baik akan menyediakan dasar yang lebih baik untuk pengembangan konstrak. Ketika teori diungkap dengan jelas, aitem-aitem tes cenderung akan dikonstrak lebih baik lagi. Lebih jauh lagi, ketika teori yang mendasari fokus pada satu dimensi, menentukan konstrak tes untuk evaluasi dapat lebih teliti. Dengan kata lain, metode psikometri tersedia untuk mengevaluasi struktur internal tes. Tehnik evaluasi struktur internal tergantung pada tujuan tes dikembangkan,
dengan
pertimbangan
hati-hati
bagaimana
cara
Universitas Sumatera Utara
12
penggunaannya dan informasi apa yang akan diungkap dari tes. Untuk mengevaluasi struktur internal, terdapat metode-metode psikometris, yaitu: a) Model Faktor Umum (Common Factor Model) Salah satu metode yang digunakan dalam model ini adalah Factor Analysis (analisis faktor). Analisis faktor digunakan ketika terdapat banyak tes yang terlibat, tetapi koefisien reliabilitasnya tidak mudah untuk diinterpretasikan. Metode ini dipengaruhi oleh muatan faktor. Muatan faktor menggambarkan kontribusi/besar muatan varians aitem pada konstrak tes. Semakin besar muatan faktor, semakin besar kontribusi varians aitem. Ketika semua variabel memiliki muatan faktor yang tinggi pada faktor yang dievaluasi dan rendah pada faktor lainnya, maka validitas konstrak akan semakin baik. Demikian juga, hal ini berlaku sebaliknya. Berdasarkan tujuannya, ada dua cara untuk mengurangi banyak variabel menjadi sedikit, yaitu analisis faktor konfirmatori dan analisis faktor eksploratori. Analisis faktor konfirmatori bertujuan untuk memastikan konstrak atau sifat yang telah disimpulkan di dalam data. Peneliti mengidentifikasi variabel yang tidak sesuai dengan tujuan alat ukur dikonstrak. Hayden, Dixon, Dixon, dan O’Brien (2009) mengatakan bahwa analisis faktor konfirmatori biasanya digunakan untuk menguji hipotesis yang telah dibuat sebelumnya berdasarkan teori atau hasil dari penelitian sebelumnya. Sedangkan analisis faktor eksploratori bertujuan untuk memeriksa data baru dengan memadukan variabel-variabel yang bervariasi. Peneliti mengeksplorasi suatu data untuk melihat apakah ada data-data yang memiliki kesamaan dengan data yang dilihat. Biasanya
Universitas Sumatera Utara
13
analisis faktor konfirmatori digunakan dalam meneliti struktur internal tes, khususnya memastikan dimensi-dimensi dalam tes. b) Multitrait-multimethod matrix (MTMM) Metode ini merupakan suatu prosedur untuk menganalisis hubungan antar data atau antar aitem, yang dapat mengungkap bukti validitas untuk dievaluasi. Dengan metode ini, validitas dapat mengevaluasi persamaan dan perbedaan antar data (validitas konvergen dan divergen). Dalam mengevaluasi alat tes, diperlukan tiga tes dengan konstrak yang paralel dan metode assessment yang berbeda-beda. Ada beberapa pertimbangan dalam menginterpretasi koefisien validitas ini. Pertama, perlunya karakteristik spesifik untuk penarikan kesimpulan. Kedua, koefisien reliabilitas yang dihasilkan harus tinggi. Ketiga, koefisien validitas konvergen harus lebih besar daripada koefisien validitas divergen. 4) Hubungan dengan Variabel Lain Variabel lain yang dimaksud adalah bukti prediktif dan bukti konkuren. Bukti prediktif adalah indikator yang diambil dari perbandingan antara satu tes dengan kriteria-kriteria untuk administrasi posttest. Dengan kata lain, bukti prediktif akan diuji dengan melihat apakah tes tersebut dapat memenuhi kriteria-kriteria yang diprediksikan untuk posttest (setelah tes diberikan). Sedangkan bukti konkuren diindikasikan dengan perbandingan antara satu tes dengan kriteria-kriteria yang paralel dengan tes tersebut. Dengan alasan-alasan yang jelas, tes lain yang paralel dengan tes yang dievaluasi juga dapat menjadi kriteria.
Universitas Sumatera Utara
14
Meskipun validitas yang berhubungan dengan kriteria sudah menjadi sumber bukti untuk evaluasi validitas, masih belum ada perbedaan dalam penggunaan bukti prediktif dan konkuren, karena sampai sekarang tidak ada masalah ketika satu validitas lebih kuat dari validitas lain. 5) Pertimbangan Eksternal Faktor eksternal yang menjadi bukti validitas adalah face validity atau validitas tampang. Seorang subjek yang pertama kali melihat suatu alat tes tidak boleh dihadapkan pada hal-hal yang tidak biasa, karena dapat menyebabkan validitas tidak baik. Untuk menguji validitas tampang, metode statistika tidak dapat digunakan. Selain validitas tampang, ada juga validitas generalisasi
yang
melihat
apakah
bukti
validitas
kriteria
dapat
digeneralisasikan pada situasi baru tanpa menguji validitas tersebut lagi.
c. Interpretasi Validitas Nilai yang menentukan ada tidaknya hubungan antara hasil alat ukur dengan kriteria lain yang berhubungan dengan pengukuran disebut koefisien validitas (Osterlind, 2010). Koefisien validitas biasanya diberitahu ketika melakukan evaluasi validitas. Namun, perlu diingat bahwa koefisien validitas hanya berlaku pada situasi tes diberikan dan belum tentu berlaku pada situasi lainnya. Selain koefisien validitas, konsep yang tidak bisa lepas dari konsep koefisien validitas adalah Standard Error of the Estimate (SEE). SEE adalah indikasi ketidak akuratan prediksi dari skor tes (Osterlind, 2010). Konsep ini sama seperti konsep Standard Error of Measurement (selanjutnya akan disebut SEM)
Universitas Sumatera Utara
15
(Azwar, 2003). Alat ukur yang memiliki koefisien validitas yang tinggi akan memiliki nilai SEM yang kecil (Azwar, 2003). Skor yang diperoleh dari alat ukur tidak jauh berbeda dari skor sesungguhnya (true scores). Namun, tidak mudah untuk mendapatkan koefisien validitas yang tinggi, terutama validitas pada alat ukur yang mengungkap sifat laten. Selain itu, pada kenyataannya, koefisien validitas tidak akan pernah mencapai atau mendekati angka 1,0.
2. Reliabilitas a. Pengertian Reliabilitas Reliabilitas merujuk pada keakuratan pengukuran dalam menilai kemampuan atau kepribadian individu (Osterlind, 2010). Keakuratan suatu pengukuran ditentukan dengan konsistensi hasil pengukuran dari berbagai penilaian. Semakin konsisten hasil pengukuran, semakin baik reliabilitasnya. Konsep yang dilihat reliabilitas adalah seberapa baik salah satu stimulus (misalnya aitem) pada alat ukur menggambarkan stimulus secara keseluruhan alat ukur. Menurut Coaley (2010), suatu alat ukur harus memiliki konsistensi, sehingga hasil alat ukur dari satu subjek memiliki nilai yang relatif tidak berbeda setiap kali alat ukur digunakan. Tetapi, tidak ada alat ukur yang benar-benar akurat.
b. Metode Estimasi Reliabilitas Sebelum melakukan uji koefisien reliabilitas, pertama-tama kita harus menentukan metode yang akan digunakan dalam melakukan estimasi reliabilitas.
Universitas Sumatera Utara
16
Ada beberapa metode yang digunakan dalam melakukan estimasi reliabilitas yaitu: 1) Metode Tes-Ulang Asumsi dalam metode tes-ulang adalah tes yang sama digunakan pada peserta tes yang sama pada rentang waktu yang berbeda dan menggunakan administrasi yang sama (Osterlind, 2010). Ketika tes digunakan dua kali, koefisien reliabilitas yang paralel akan terpenuhi. Tenggang waktu menjadi hal yang sangat penting dalam tes-ulang, karena mempengaruhi reliabilitas (Coaley, 2010). Tetapi, metode tes-ulang memiliki beberapa kelemahan. Peserta tes cenderung akan berubah dalam beberapa aspek (misalnya pada sifat) di antara sesi tes. Hal ini dapat menyebabkan eror karena adanya tenggang waktu, yang rentan pada pengukuran perilaku yang cenderung berubah karena perubahan waktu (Azwar, 2003). Metode tes-ulang juga terkesan kurang praktis karena tester harus kembali menghubungi peserta tes untuk mengikuti tes selanjutnya (Coaley, 2010). 2) Metode Bentuk Paralel dan Bentuk Alternatif Asumsi dari metode bentuk paralel adalah mengembangkan tes yang memiliki aitem yang ekuivalen, misalnya indeks kesukaran aitem setara. Korelasi di antara kedua tes tersebut kemudian akan digunakan untuk mengestimasi reliabilitas tes. Dengan menggunakan metode ini, efek carry-over akan berkurang karena menggunakan dua tes yang berbeda. Rentang waktu antara tes pertama dan tes kedua juga tidak menjadi peranan penting. Walaupun begitu, mengembangkan bentuk tes yang paralel sangat sulit dan memerlukan biaya banyak. Selain itu, tidak ada jaminan bahwa bentuk tes ekuivalen
Universitas Sumatera Utara
17
dengan tes yang akan dievaluasi. Sesuai dengan apa yang dikemukakan Osterlind (2010), kesulitan penggunaan pengukuran yang paralel adalah mengidentifikasi pengukuran dengan tepat (ekuivalen terhadap tes yang akan dievaluasi). Hal ini yang menyebabkan metode bentuk alternative muncul. Namun, metode ini memiliki kesamaan, yaitu menggunakan alat ukur lain sebagai pembanding. Hal yang membedakan antara metode bentuk alternatif dan metode bentuk paralel adalah cara mendapatkan alat ukurnya. Metode bentuk paralel menggunakan alat ukur yang dikembangkan sendiri, sedangkan metode bentuk alternatif tidak. 3) Metode Konsistensi Internal Cara lain yang dapat digunakan ketika tidak ada bentuk alternatif tes lain adalah dengan menggunakan metode konsistensi internal. Metode ini digunakan dengan membagi tes menjadi n bagian (n ≥ 2). Ketika tes dibagi menjadi dua, asumsi yang didapat adalah kedua tes yang dibelah ekuivalen. Menurut O’Connor (dalam Javali, Gudaganavar, & Shodan, 2011), semakin homogen atau ekuivalen aitem-aitem dalam belahan tes, semakin tinggi reliabilitasnya. Metode ini disebut sebagai metode split-half. Administrasi tes dilakukan satu kali saja, sehingga menghemat waktu. Selain itu, efek carryover dapat diminimalisir. Biasanya masalah yang muncul terdapat pada tes (misalnya korelasi antar belahan tes rendah), tidak pada peserta tes. Cara pembelahan tes tergantung pada jenis dan fungsi tes yang bersangkutan (Azwar, 2003). Cara pembelahan tes yang dipilih akan menentukan formula apa yang akan digunakan untuk menghitung koefisien reliabilitas. Menurut Azwar (2003), ada beberapa cara pembelahan tes, yaitu:
Universitas Sumatera Utara
18
a) Pembelahan Cara Random Pembelahan cara random dapat dilakukan dengan mengambil beberapa aitem secara acak untuk dimasukkan ke belahan pertama dan belahan kedua. Namun, perlu diingat bahwa pembelahan cara random hanya dapat digunakan jika tes yang dibelah memiliki aitem yang homogen, baik dari segi isi maupun dari segi kesukaran aitem. b) Pembelahan Ganjil Genap Pembelahan ganjil genap dapat dilakukan dengan mengambil aitem-aitem bernomor ganjil dimasukkan ke belahan pertama dan aitem-aitem bernomor genap dimasukkan ke belahan kedua. Pembelahan cara ini digunakan dengan asumsi apabila aitem-aitem yang disusun dalam suatu tes memiliki urutan-urutan tertentu, seperti kesukaran aitem, sehingga setelah tes dibelah, setiap belahan memiliki isi yang setara. c) Pembelahan Matched-Random Subsets Pembelahan matched-random subsets digunakan pada tes yang telah diukur tingkat kesukaran aitem dan korelasi antar aitem tes. Aitem-aitem tersebut kemudian dimasukkan ke dalam grafik kartesius dengan sumbu x untuk koefisien korelasi antar aitem dan sumbu y untuk indeks kesukaran aitem. Dengan meletakkan aitem-aitem tersebut, dapat dilihat aitem-aitem yang berdekatan memiliki tingkat setara, sehingga ketika dibelah, belahan pertama dan belahan kedua memiliki tingkat setara.
Universitas Sumatera Utara
19
c. Formula Estimasi Koefisien Reliabilitas Pada metode konsistensi internal, terdapat beberapa formula (rumus) yang digunakan dalam mengestimasi koefisien reliabilitas, yaitu Formula SpearmanBrown, Koefisien Reliabilitas Kuder-Richardson, dan Koefisien Alpha. 1) Formula Spearman-Brown Asumsi pemakaian formula ini adalah ketika tes dibagi dua secara random, kedua belahan harus memiliki distribusi normal dengan mean dan standard deviation yang setara (Azwar, 2003). Umumnya, cara pembelahan tes dilakukan dengan pembelahan ganjil genap atau matched-random subsets. Perlu diingat bahwa formula ini dipakai ketika korelasi antar kedua belahan tes memiliki nilai yang tinggi. Jika tidak, koefisien reliabilitas yang dihasilkan cenderung memiliki nilai yang rendah (underestimasi). Rumus SpearmanBrown adalah: ························································ (1) Keterangan: koefisien reliabilitas koefisien antara kedua belahan tes 2) Koefisien Reliabilitas Kuder-Richardson Ketika tes tidak dapat dibelah menjadi dua belahan sama besar (karena aitem dalam tes sedikit), maka formula ini dapat digunakan. Pembelahan tes dilakukan dengan membelah sebanyak jumlah aitem. Ada 2 rumus KuderRichardson, yaitu: ··············································· (2)
Universitas Sumatera Utara
20
··········································· (3) Keterangan: = proporsi populasi yang menjawab aitem benar (atau aitem pertama). = proporsi populasi yang menjawab aitem salah (atau aitem kedua). = banyak aitem dalam tes. = varians skor tes. = mean dari tes. Rumus
muncul karena rumus
cenderung menghasilkan
komputasi yang lebih panjang (karena menggunakan korelasi antar aitem), sedangkan rumus Namun, rumus
hanya menggunakan nilai mean (Osterlind, 2010). cenderung menghasilkan koefisien reliabilitas yang
lebih rendah daripada rumus
.
3) Koefisien Alpha Ketika belahan tes yang dikorelasikan belum tentu memenuhi asumsi paralel, koefisien Alpha dapat digunakan. Tetapi, jika asumsi paralel tidak dapat terpenuhi, estimasi reliabilitas cenderung underestimasi. Jadi, ketika alat ukur memiliki koefisien reliabilitas yang cukup tinggi, akan ada kemungkinan koefisien reliabilitas yang lebih tinggi bisa dicapai. Tetapi, jika alat ukur memiliki koefisien reliabilitas yang rendah, akan ada kemungkinan bahwa reliabilitas alat ukur tersebut rendah atau asumsi ekuivalen tidak terpenuhi (Allen & Yen dalam Azwar, 2003).
Universitas Sumatera Utara
21
Koefisien Alpha dapat dipakai ketika tes dibelah dua, tiga, hingga sebanyak jumlah aitem, dengan asumsi ekuivalen terpenuhi. Rumus koefisien Alpha yang digunakan adalah: ··················································· (4) Keterangan: = banyak aitem dalam tes. = varians skor tes.
d. Faktor – Faktor yang Mempengaruhi Reliabilitas Menurut Osterlind (2010), terdapat tiga faktor yang mempengaruhi hasil reliabilitas, yaitu: 1) Efek atenuasi Koefisien reliabilitas tidak pernah kurang dari koefisien validitas. Karena itu, jika koefisien reliabilitas rendah, koefisien validitas juga akan rendah. Rendahnya koefisien validitas yang disebabkan oleh rendahnya koefisien reliabilitas disebut efek atenuasi (Azwar, 2003). 2) Efek dari panjang tes pada estimasi reliabilitas Semakin banyak aitem dalam suatu tes, semakin tinggi koefisien reliabilitas. Aitem-aitem yang membentuk tes memiliki karakteristik-karakteristik tertentu yang dibentuk menjadi satu tes. Sehingga semakin banyak aitem yang menggambarkan karakteristik tersebut, akan semakin rinci gambaran konstruk seutuhnya. Jumlah aitem yang diperlukan agar mencapai nilai reliabilitas yang baik adalah lebih dari lima puluh aitem (Javali, dkk., 2011).
Universitas Sumatera Utara
22
3) Heterogenitas kelompok Semakin bervariasi kelompok dalam suatu tes, semakin tinggi koefisien reliabilitasnya. Hal ini dikarenakan kelompok yang memenuhi asumsi heterogenitas cenderung memiliki pilihan-pilihan aitem yang berbeda-beda pula. Sedangkan, ketika setiap orang memiliki pilihan-pilihan aitem yang sejenis (tidak ada perbedaan), maka alat ukur tersebut memiliki koefisien reliabilitas 0,0 (Murphy & Davidshofer, 1994).
e. Hubungan Reliabilitas dan SEM SEM muncul karena reliabilitas alat ukur tidak dapat menggambarkan secara tepat apakah interpretasi hasil alat ukur benar-benar merepresentasikan subjek yang mengikuti tes. SEM adalah indikator yang melihat adanya perbedaan skor tampak dan skor murni (Osterlind, 2010). Konsep SEM muncul karena dalam pengukuran bisa saja terjadi eror. Dengan adanya konsep ini, dapat diketahui bahwa tingginya reliabilitas hasil alat ukur menunjukkan sedikitnya eror yang dihasilkan, dan demikian juga sebaliknya (Coaley, 2010). Semakin tinggi nilai SEM, maka koefisien reliabilitas akan semakin rendah. SEM juga menunjukkan variasi hasil skor tes yang mungkin dicapai karena adanya eror pengukuran (Murphy & Davidshofer, 1994). Dengan adanya SEM, interval kepercayaan dapat dibentuk. Interval kepercayaan digunakan sebagai indikator terhadap seberapa akurat skor murni dari hasil alat ukur. Namun, kelemahan SEM adalah penggunaannya tidak selalu setara pada semua skor tes. Nilai SEM cenderung kecil pada skor ekstrim dan besar pada skor ratarata (Murphy & Davidshofer, 1994).
Universitas Sumatera Utara
23
f. Interpretasi Reliabilitas Suatu alat ukur dikatakan memiliki reliabilitas yang baik ketika koefisien reliabilitas dari hasil pengukuran alat ukur tinggi. Tetapi, koefisien reliabilitas yang memuaskan tidak dapat ditentukan. Menurut Azwar (2003), hal ini dikarenakan koefisien reliabilitas yang didapat berdasarkan perhitungan hanya merupakan estimasi dari reliabilitas yang sesungguhnya, dan hanya berlaku pada kelompok subjek yang diukur saja. Selain itu, setiap alat ukur memiliki tuntutan tingkat reliabilitas minimal yang berbeda-beda, sehingga interpretasi koefisien reliabilitas alat ukur tidak dapat lepas dari fungsi dan tujuan pengukuran. Murphy & Davidshofer (1994) mengemukakan bahwa reliabilitas yang tinggi diperlukan ketika tes digunakan untuk membuat keputusan terhadap seseorang (misalnya penempatan posisi kerja) dan ketika individu dari kelompok yang setara dikelompokkan ke dalam satu kategori baru. Sedangkan reliabilitas yang rendah diperbolehkan ketika tes yang digunakan hanya sebagai pendahuluan/permulaan dan ketika tes digunakan individu dari populasi random akan dikategorikan ke dalam kelompok-kelompok kecil. Menurut Bartam (dalam Coaley, 2010), tes IQ biasanya memiliki reliabilitas lebih dari 0,9, sedangkan pada tes kepribadian dan inventori memiliki reliabilitas berkisar 0,7 hingga 0,9. Besarnya sampel yang digunakan juga menjadi faktor penting dalam koefisien reliabilitas. Tidak cukup jika jumlah sampel yang mengikuti tes kurang dari 30 (Coaley, 2010). Kline (dalam Coaley, 2010) juga mengatakan tidak cukup juga jika jumlah sampel kurang dari 100. Nunally (dalam Coaley, 2010) mengatakan jika sampel yang digunakan mencapai 500, maka 95% dapat dikatakan koefisien reliabilitas tes tersebut di atas 0,62.
Universitas Sumatera Utara
24
Ketika menginterpretasi koefisien reliabilitas, terdapat dua hal yang perlu dipahami (Azwar, 2003), yaitu: 1) Estimasi reliabilitas tes pada satu kelompok subjek dalam situasi tertentu akan menghasilkan koefisien yang tidak sama pada kelompok subjek lain dalam situasi yang lain. 2) Koefisien reliabilitas hanya mengindikasikan besarnya inkonsistensi skor hasil pengukuran tes, bukan menyatakan sebab-sebab inkonsistensi tersebut secara langsung.
B. Edwards Personal Preference Schedule 1. Sejarah EPPS EPPS dikonstrak pada tahun 1958 dan direvisi pada tahun 1959 (dalam Indrawati). EPPS dikonstrak untuk mengukur manifestasi kebutuhan yang dibuat oleh Murray (Edwards; Helms; dalam Gregory, 2004). EPPS menggunakan format forced-choice. Testee harus memilih satu dari dua pernyataan yang paling menggambarkan dirinya. Karena adanya masalah social desirability, Edwards memasangkan kalimat yang tidak berhubungan sama sekali. Sehingga, testee dapat merasa tidak nyaman ketika mengerjakan EPPS (Gregory, 2004). EPPS adalah tes ipsative. Dalam tes ipsative, skor keseluruhan tes selalu sama dalam setiap individu. Ketika ada skor yang lebih tinggi pada satu sub tes, sub tes yang lain akan memiliki skor yang lebih rendah. Selain itu, dalam tes ipsative, skor tinggi merupakan skor yang relatif, bukan absolut. Maksudnya, skor yang tinggi tercapai pada satu sub tes dikarenakan skor lain dari sub tes lain.
Universitas Sumatera Utara
25
2. Manisfestasi Kebutuhan EPPS Manifestasi kebutuhan yang diungkap Murray (dalam Kaplan & Saccuzzo, 2005) adalah sebagai berikut: a) Abasement: Untuk menerima tekanan dari luar. Untuk menyerah. Menerima dilukai, disalahkan, dikritisi, dihukum. Untuk menyerah pada takdir. Untuk mengakui inferioritas, kesalahan, atau kekalahan. Untuk menyalahkan diri sendiri. Mencari dan menikmati rasa sakit, hukuman, penyakit, dan ketidak beruntungan. b) Achievement: Untuk menyelesaikan sesuatu yang sulit. Untuk menguasai, memanipulasi, atau mengorganisasi objek, manusia, atau ide. Untuk melakukannya dengan cepat dan mandiri. Untuk mengatasi hambatan dan mencapai tujuan. Untuk menjadi unggul. Untuk melampaui orang lain. c) Affiliation: Untuk membentuk hubungan pertemanan. Untuk menyapa, mengikuti, dan tinggal dengan yang lain. Untuk bekerja sama dan berkomunikasi dengan yang lain. Untuk mencintai, untuk masuk dalam kelompok. d) Aggression: Untuk berkelahi. Untuk memukul, melukai, atau membunuh yang lain. Untuk menghukum, melawan pertentangan. e) Autonomy: Untuk mendapatkan kebebasan. Untuk menghindari pengekangan. Untuk menjadi mandiri dan bebas melakukan apapun. f) Blamavoidance: Untuk menghindari disalahkan, dikucilkan, atau diberi hukuman dengan mencegah melakukan perilaku tidak baik. Untuk berperilaku baik dan mematuhi hukum.
Universitas Sumatera Utara
26
g) Counteraction: Menolak kekalahan dengan berjuang kembali dan membalas. Untuk memilih tugas tersulit. Untuk melindungi harga diri sendiri. h) Defendance: Untuk melindungi diri sendiri dari disalahkan atau dilecehkan. Untuk memberikan penjelasan, alasan. Untuk menghindari ditanya terus menerus. i) Deference: Untuk mengagumi dan mendukung atasan. Untuk memuji dan menghormati. Untuk menurut pada adat istiadat. Untuk meniru atasan. j) Dominance: Untuk mempengaruhi atau mengontrol orang lain. Untuk melarang, untuk mengarahkan orang lain. Untuk mengekang, untuk mengoganisasikan perilaku kelompok. k) Exhibition: Untuk membuat kesan, untuk dilihat dan didengar. Untuk menghibur, mengejutkan orang lain. l) Harmavoidance: Untuk menghindari rasa sakit, luka fisik, penyakit, dan kematian. Untuk menghindari situasi berbahaya. m) Infavoidance: Untuk menghindari penghinaan, untuk tidak melecehkan dan dilecehkan, untuk tidak bertindak karena takut kesalahan. n) Nurturance: Untuk membantu, atau melindungi orang yang membutuhkan bantuan. Untuk mengekspresikan simpati. o) Order: Untuk menyusun sesuatu dalam urutan, untuk mencapai kerapian, keseimbangan, kebersihan, dan ketelitian. p) Play: Untuk mencari kesenangan, membahagiakan diri, untuk bermain, untuk ketawa dan bercanda, untuk menghindari tekanan. q) Rejection: Untuk mendiskriminasi, untuk menjauh dan tidak peduli. r) Sentience: Untuk mendapatkan kesan sensual.
Universitas Sumatera Utara
27
s) Sex: Untuk membentuk dan mendapatkan hubungan erotis. Untuk mendapat hubungan seksual. t) Succorance: Untuk mencari bantuan, perlindungan, atau simpati. Untuk bergantung dengan orang lain. u) Understanding: Untuk menganalisis pengalaman, untuk berpikir abstrak, untuk menggabungkan ide, untuk mendefinisikan hubungan. Edwards hanya mengambil dan mengembangkan lima belas kebutuhan, yaitu Achievement, Deference, Order, Exhibition, Autonomy, Affection, Intraception, Succorance,
Dominance,
Abasement,
Nurturance,
Change,
Endurance,
Heterosexual, dan Aggression.
C. Analisis Karakteristik Psikometri EPPS EPPS merupakan tes kepribadian yang mengukur manifestasi kebutuhan yang dikemukakan oleh Murray. EPPS saat ini lebih sering digunakan dalam proses seleksi calon karyawan baru dan dalam penentuan treatment untuk klien. Oleh karena itu, sebagai tes seleksi dan tes penentu treatment, EPPS harus memiliki kualitas yang baik. Apabila EPPS tidak memiliki kualitas yang baik, tentu saja proses seleksi dan pemberian treatment menjadi kurang tepat atau bahkan salah. Kualitas suatu alat tes dapat dilihat dari banyak hal. Reliabilitas dan validitas (dalam hal ini adalah struktur internal) hasil alat tes adalah beberapa dari banyak hal tersebut. Struktur internal suatu alat ukur sangat penting, karena struktur internal menentukan alat tes memang mengukur atribut yang hendak diukur. Struktur internal EPPS dapat dikatakan baik jika hasil yang diperoleh dari
Universitas Sumatera Utara
28
EPPS memang menunjukkan manifestasi kebutuhan Murray. Manifestasi kebutuhan yang dikemukakan Murray adalah achievement, deference, order, exhibition, autonomy, affiliation, intraception, succorance, dominance, abasement, nurturance, change, endurance, heterosexuality, dan aggression. Bukti validitas berdasarkan struktur internal dikatakan baik ketika nilai muatan faktor aitem di atas 0.50, dengan toleransi paling rendah adalah 0.30 (Azwar, 2003). Sedangkan reliabilitas EPPS yang baik berarti hasil yang diperoleh dari EPPS memang dapat dipercaya. Koefisien reliabilitas yang baik untuk tes kepribadian berkisar antara 0.7 hingga 0.9. Ketika EPPS memiliki reliabilitas yang baik dan didukung bukti validitas berdasarkan struktur internal, maka hasil pengukuran EPPS dapat digunakan untuk bahan pertimbangan untuk pengambilan keputusan.
Universitas Sumatera Utara