Jurnal Psikologi Indonesia 2011, Vol. VIII, No. 1, 54-62, ISSN. 0853-3098
Himpunan Psikologi Indonesia
MENYIDIK KEBERADAAN SOCIAL DESIRABILITY (SD) PADA VARIABEL PENELITIAN PERILAKU (DETECTING THE EXISTENCE OF THE SOCIAL DESIRABILITY BIAS IN A BEHAVIORAL RESEARCH VARIABLE) E.S. Jaya, G.T.B. Hartana, & W.G. Mangundjaya Universitas Indonesia Banyak penelitian perilaku mendasarkan kesimpulannya pada data yang dikumpulkan lewat kuesioner self-report. Walaupun memiliki berbagal keunggulan dan favorit, metode pengumpulan data mi memiliki kelemahan, yang utama adalah kerentanannya pada bias social desirability (SD). Peneliti perlu mengontrol bias tersebut agar tidak mempengaruhi penarikan kesimpulan penelitian. Salah satu cara untuk mengontrolnya adalah menggunakan alat ukur SD. Penelitian ml memvalidasi alat ukur SD Strahan-Gerbasi (1972) yang sangat populer di kalangan peneliti perilaku (Thompson & Phua, 2005) dengan metode validasi kriteria dan melibatkan dua kelompok responden, Kelompok A dan B. Kelompok A diminta mengisi kuesioner seideal mungkin (SD tinggi), sedangkan Kelompok B diminta mengisi kuesioner tidak seideal mungkin (SD rendah). Hash validasi menunjukkan bahwa alat ukur mi memhliki validitas yang balk (r = 0,88), kendati salah satu itemnya gugur. Kemudian, alat ukur diuji-cobakan pada sampel karyawan tetap sebuah organisasi untuk pemeriksaan reliabilitas. Hasilnya menunjukkan reliabilitas yang tidak tinggi (r = 0,68), namun dapat diterima mengingat jumlah itemnya yang sedikit. Walaupun terbukti valid, alat ukur ml memiliki berbagai keterbatasan selain reliabilitasnya yang tidak tinggi. Maka juga dibahas berbagai metode untuk mengurangi keterbatasan dan meningkatkan reliabilitas alat ukur mi. Kata kunci: social desirability (SD), metode penelitian self-report, alat ukur, khas Indonesia (indigenous). Many behavioral researches rely solely on self-report questionnaire for their findings. Although highly popular among behavioral researchers, such data gathering method is not without limitations. One of its main weakness is its inherent risk for social desirability (SD) bias. It is important for researchers to take heed and control it so that it does not intervene their research. Administering an SD questionnaire is one of the most practical way to control the bias. This research validated the Strahan-Gerbasi Social Desirability Measure (1972), one of the most popular SD measures (Thompson & Phua, 2005). Criterion validation was done using two groups of subject. Group A was instructed to fill in the questionnaire in the most possible ideal way (placing the group with high social desirability). By contrast, group B was instructed to fill in the questionnaire in a way that was far from ideal (placing the group withlow social desirability). This resulted in the elimination of one item. Overall, the measure showed good criterion validity (r = 0.88). The measure was also administered to a sample of tenured staffs in a profit oriented organisation to check its reliability on different sample characteristics. This resulted in a reliability coefficient of r = 0.68, which was acceptable enough considering its small number of items. Although some evidence for its validity had been found, this measure still has some other shortcomings in addition to its quite low level of reliability. Hence, some approaches to overcome its shortcomings as well as to improve its reliability were discussed. Keywords: social desirability (SD), self-report research method, questionnaire, specifically Indonesian (indigenous).
Metode kuesioner dengan self-report kerap kali menjadi pilihan utama pada banyak penelitian perilaku. Akurasi metode kuesioner self-report menjadi isu yang sangat vital karena seluruh kesimpulan dan teori perilaku yang dihasilkan oleh penelitian yang menggunakan metode tersebut bersandar pada ketepatan data yang tertera di kuesioner. Seperti berbagai metode pengambilah data lainnya, metode
kuesioner self-report memiliki sejumlah kelemahan. Kelemahan utama kuesioner selfreport yang mengancam keakuratan hasil penelitian adalah sifatnya yang rentan terhadap kemungkinan untuk dijawab secara tidak jujur (Anastasi & Urbina, 1997; Nunnaly & Bernstein, 1994). Bahkan, Nunnaly dan Bernstein (1994) berpendapat bahwa social desirability (SD) bertanggung jawab atas
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA sebagian besar varians data yang dikumpulkan dengan kuesioner self-report. Anastasi dan Urbina (1997) menjelaskan, hal mi disebabkan oleh kenyataan bahwa terhadap setiap item kuesioner self-report selalu ada kemungkinan jawaban yang lebih diterima oleh masyarakat atau lebih menguntungkan responden. Bukan berarti bahwa responden akan selalu memberikan respon SD berdasarkan kebohongan yang disengaja, melainkan karena seringkali tanpa sadar responden cenderung hanya menunjukkan hal-hal yang baik tentang dirinya (Anastasi & Urbina, 1997). Penelitian Edwards (1957, dalam Anastasi & Urbina, 1997) menunjukkan bahwa responden dengan SD tinggi cenderung kurang memiliki pengertian dir suka membohongi din, atau tidak suka menerima keterbatasan din. Dalam penelitian, respon SD dapat mengecoh peneliti untuk menarik kesimpulan yang salah. Nunnaly dan Bernstein (1994) sampai berpendapat bahwa salah satu sumber bagi terungkapnya korelasi antara dua vaniabel dalam seluruh penelitian perilaku adalah variabel SD. Sejalan dengan pendapat mereka, van de Mortel (2008) juga menunjukkan dampak negatif SD dalam penelitian, yaitu membentuk hubungan semu atau sebaliknya menghilangkan hubungan antara dua variabel. Dalam penelitian, faktor SD akan muncul dalam jumlah atau kadar yang berbeda-beda tergantung pada konteks pengukuran dan akan muncul paling kuat saat meneliti topik-topik yang dianggap sensitif di masyarakat atau topiktopik yang rentan terhadap pengaruh harapan masyarakat (Nunnaly & Bernstein, 1994; van de Mortel, 2008; Oppenheim, 1966). Selain itu, variasi kecenderungan individual untuk menunjukkan respon SD juga berpengaruh pada tingkat SD (Nunnaly & Bernstein, 1994). Burns, Johnson, dan O’Rourke (2003) berpendapat bahwa penelitian tentang SD masih sedikit dan banyak peneliti menutup mata terhadap dampak SD pada hasil akhir suatu penelitian. Pendapat mi didukung oleh temuan van de Mortel (2008), dan 14.275 penelitian yang diamati, yang melakukan kontrol SD dengan kuesioner SD hanya sebanyak 31 (0,2%) dan 43% dan jumlah tersebut menemukan
55
pengaruh SD dalam penelitian mereka. Sejalan dengan pendapat Nunnaly & Bernstein (1994) mengenai kaitan antara konteks dan SD, temuan van de Mortel (2008) menunjukkan bahwa SD memiliki pengaruh yang signifikan pada penelitian dengan konteks perilaku kekerasan dalam rumah tangga, sejarah kriminalitas dan gangguan jiwa, tingkat kegiatan fisik, tingkat stres psikologis, kekerasan pada pasangan (pacar), tingkat pemakaian narkoba dan alkohol, serta pola makan. Upaya mengontrol respon SD kiranya memang sangat penting. Terdapat dua cara yang dapat ditempuh untuk mengontrol respon SD pada penelitian penilaku yang menggunakan kuesioner self-report, yaitu: membuat item yang lebih baik, dalam arti tidak ambigu, faktual, dan tidak mudah diketahui sifat favorable unfavorable-nya dengan proses penyamaran, atau menggunakan alat ukur SD (Anastasi & Urbina, 1997). Pada cara pertama, para peneliti dapat menerapkan tahapan pembuatan alat ukur sebagaimana dikemukakan oleh Edwards (1957). Ia menyarankan peneliti untuk menguji item yang telah disusun pada sekelompok orang. Mulamula mereka diminta untuk seolaholah memiliki sikap favorable terhadap item tersebut. Kelompok orang yang sama tersebut kemudian diminta untuk menjawab kembali item yang sama, namun kini seolaholah mereka memiliki sikap unfavorable. Bila mereka membenikan nilai yang sama pada suatu item baik pada saat diminta bersikap favorable maupun unfavorable, berarti item tersebut tidak berguna karena terbukti rentan terhadap SD. Cara kedua adalah melalui penyusunan kuesioner yang dapat mengukur bias SD, sehingga peneliti bias mengetahui seberapa besar bias SD yang terdapat dalam pengambilan data dan penarikan kesimpulan (Cronbach, 1984; Anastasi & Urbina, 1997; Cohen & Swerdlik, 2005). Hasil penelitian Thompson dan Phua (2005) menunjukkan bahwa kuesioner SD yang paling sering dipakai sebagai control SD dalam penelitian adalah bentuk pendek kuesioner SD CrowneMarlowe yang disusun oleh Strahan dan Genbasi (1972).
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA Strahan dan Gerbasi (1972) memecah kuesioner SD Crowne-Marlowe (33 item) menjadi tiga yang dinamai kuesioner SD Strahan-Gerbasi bagian A, B, dan C, masingmasing benisi 10 item. Masing-masing bagian mampu mengukur SD dengan valid, sehingga pengukuran SD menjadi lebih singkat dan mudah karena peneliti hanya perlu menyertakan 10 item tambahan dalam kuesionernya, meliputi 5 item favorable dan 5 item unfavorable yang diskor benar salah. Item favorable berupa pernyataan yang menunjukkan penilaku yang dianggap baik oleh masyanakat tetapi hampir tidak mungkin dilakukan, sehingga menjawab benar terhadap item mi berdampak meningkatkan skor SD. Sebaliknya, item unfavorable berisi pernyataan yang menunjukkan perilaku yang dianggap buruk oleh masyarakat tetapi hampir semua orang pernah melakukannya, sehingga menjawab salah terhadap item ml berakibat meningkatkan skor SD. Kuesioner SD dapat meningkatkan validitas penelitian melalui berbagai metode, yaitu (1) mengelimmnasi atau setidaknya bersikap hati-hati terhadap subjek dengan skor SD yang tinggi (Cronbach, 1984)), (2) memasukkan dampak SD tetapi tidak mengontrolnya, dan (3) mengoreksi data subjek dengan skor SD yang tinggi (van de Mortel, 2008). Dan ketiga metode ini, mengoreksi data subjek adalah metode yang paling disarankan karena dianggap paling rigorous dan dapat dilakukan melalui kontrol statistik, misal dengan menerapkan korelasi partial, regresi, ataupun structural equation modelling (van de Mortel, 2008). Beberapa contoh penelitian yang menggunakan metode ini meliputi: (1) Genia (1996) yang menggunakan skala StrahanGerbasi (1972) untuk mengontrol pengukuran religiusitas; (2) Wade dan Walsh (2008) yang memasukkan skala SD sebagai kontrol dalam penelitian tentang kepribadian Big-5 (OCEAN) dan reaksi cemburu atau perselingkuhan, serta (3) Gibson dan Hurdes (1999) yang menggunakan metode serupa dalam meneliti perilaku beresiko HIV. Mereka menemukan hasil yang berbeda secara signifikan ketika menggunakan kontrol SD dibandingkan ketida
56
tidak mengontrol SD. Selain itu alat ukur SD juga dapat dipakai dalm analisis item sebagai proses tambahan dalam penyusunan alat ukur sebagaimana dilakukan oleh Shaunders dan Munro (2000) serta oleh Liden dan Maslyn (1998). Dengan cara ini, item yang memiliki korelasi signifikan dengan skor SD dieliminasi. Pendekatan Social Desirability Pengertian SD perlu dibedakan berdasarkan dua pendekatan yang berlawanan, yaitu pendekatan klasik dan pendekatan perilaku sebenarnya (true behavior) (Johnson, Fendrich, & Hubbel, 2002). Pendekatan klasikmenganggapbahwa SD adalah suatu sikap kepribadian tertentu yang dapat mengintervensi hasil kuesioner penelitian. Pendekatan klasik ini didasarkan pada penelitian korelasional terkait variabel socially desirable dan socially undesirable. Hasil penelitian tersebut menunjukkan bahwa responden cenderung memiliki skor tinggi dan berkorelasi positif pada variabel socially desirable, sebaliknya cenderung memiliki skor rendah dan berkorelasi negative pada variabel socially undesirable. Contoh penelitian yang mendukung pendekatan ini adalah penelitian yang dilakukan oleh Gibson, Hudes, dan Donovan (2009). Sebaliknya, pendekatan penilaku sebenarnya menganggap bahwa SD adalah benar-benar sikap dan perilaku seseorang, bukan sesuatu yang mengintervensi hasil penelitian. Pendekatan mi didasarkan pada penelitian McRae dan Costa (1983) yang menunjukkan bahwa seseorang yang memiliki skor SD dan skor Lie dan Eysenck yang tinggi dipandang lebih positif oleh pasangannya (Johnson, Fendrich, & Hubbel, 2002). Pendekatan mi menganggap bahwa responden dengan skor SD yang tinggi memiliki motivasi untuk berbuat altruis yang lebih tinggi dibandingkan responden dengan skor SD rendah. Hal mi didukung oleh kenyataan bahwa item-item skor SD cenderung bersandar pada perilaku altruis. Dan antana kedua pendekatan tersebut, peneliti memilih pendekatan klasik. Alasan penulis, beberapa hasil penelitian ternyata lebih
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA mendukung pendekatan kiasik dibandingkan pendekatan perilaku sebenannya. Penelitian Gibson, Hudes, dan Donovan (2009) dengan sangat jelas menunjukkan bahwa memasukkan SD sebagam vaniabel kontrol akan meningkatkan secara signifikan kesesualan (korelasi) antara kuesioner self-report tentang perilaku menyuntik (pemakalan narkoba) dengan hasil pemeniksaan fisiologis tentang kadar zat narkoba dalam danah. Peningkatan mi juga terjadi setelah dilakukan kontrol terhadap data demografis (jenis kelamin, umur, status pernikahan, tempat tinggal, orientasi seksual, tahun dalam perawatan methadone, jumlah melakukan detoksiflkasi, dan umun saat menggunakan heroin pentama kali). Selain itu, hasil penelusuran terhadap 14.275 sumber pustaka terkait yang dilakukan oleh van de Mortel (2008) juga mendukung pendekatan ini. Maka penelitian ini bertujuan memvalidasi salah satu bagian dan kuesioner SD Strahan Gerbasi (1972) dalam konteks budaya Indonesia. Peneliti berasumsi bahwa orang Indonesia memiliki kepatuhan yang tinggi pada nilai ideal/moral dalam masyarakat, sehingga kebutuhan untuk memperhatikan SD dalam penelitian menjadi lebih penting dilakukan di Indonesia daripada di Barat. Menyadari minimnya penelitian tentang SD di Indonesia, peneliti mencoba menvalidasi salah satu kuesioner SD yang cukup populer (Thompson & Phua, 2005). Kuesioner mi termasuk singkat, yaitu terdiri atas 10 item, dan berpotensi menjadi salah satu alat pengontrol SD yang murah dan efektif, sehingga diharapkan dapat meningkatkan antusiasme peneliti variabel perilaku di Indonesia untuk melakukan kontrol SD dalam penelitian mereka. Metode Partisipan Penelitian mi menggunakan dua kelompok partisipan. Kelompok partisipan pertama berjumlah 20 orang dengan rentang usia 17-60 tahun, merupakan gabungan mahasiswa dan karyawan tetap universitas. Rentang usia yang besar digunakan untuk melihat sejauh mana alat ukur mi dapat digunakan pada responden dengan rentang usia
57
yang besar, paling tidak dalam hal keterbacaannya. Kelompok partisipan kedua adalah 158 karyawan tetap suatu organisasi untuk uji reliabilitas pengukuran. Prosedur Peneliti memilih menggunakan dan menerjemahkan bagian pertama kuesioner SD Strahan-Gerbasi (1972) karena dipandang sebagai bagian yang paling reliabel (Thompson & Phua, 2005). Langkah pertama adalah melakukan back-translation pada seluruh item. Kemudian, hasil terjemahan bahasa Indonesia disesuaikan dengan konteks budaya Indonesia dengan mempertahankan makna esensial itemitem tersebut. Setelah itu, peneliti menguji validitas alat ukur menggunakan metode contrasted group (validasi kriteria) dan reliabilitas pengukurannya. Reliabilitas pengukuran penting diketahui karena menjadi landasan untuk mengetahui besarnya proporsi true score yang berhasil diukur dan hal ml menjadi dasar tes signifikansi dan berbagai analisis statistik Iainnya (Guilford, 1956). Memeriksa reliabilitas pengukuran pada alat ukur ini dapat menjadi sebuah tantangan berarti, sebab dimensionalitas alat ukur ini kurang dibahas dalam literatur sedangkan penskorannya pun bersifat dikotomi. Kedua hal mi memperumit penggunaan koefisien alpha sebagal indeks reliabilitas. Pertama, syarat Tequivalent harus dipenuhi yang berarti factor yang diukur harus bersifat unidimensional (Cortina, 1993; Soöan, 2000; Tan, 2009). Sebagaimana ditunjukkan oleh Contina (1993), bila factor yang dikur tidak unidimensional maka koefisien alpha tidak efektif sebagai penunjuk reliabilitas. Maka Cortina (1993) menyarankan untuk memastikan unidimensionalistas factor yang diukur terlebih dahulu dengan menggunakan principal component analysis (PCA) sebelum menggunakan koefisien alpha sebagai penunjuk reliabilitas pengukuran. Kedua, koefisien alpha paling cocok dipakai untuk alat ukun yang menggunakan skala Likert dengan cara penskoran 0-3 atau 1-5 dan bukan menggunakan penskoran dikotomis, sebab skor dikotomi akan
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA mengurangi varians data dan berakibat menurunkan koefisien alpha (Guilford, 1956; Ray, 1980). Pemeriksaan reliabilitas pengukuran akan dilakukan dengan menggunakan sampel pegawai tetap kantor sebagai contoh penggunaan alat ukur. Sampel pegawal tetap kantor dipilih untuk menguji kembali hasil penelitian Thompson dan Phua (2005) yang men unjukkan bahwa alat ukur ml tidak reliabel digunakan pada sampel pegawai kantor serta hanya valid dan reliabel diterapkan pada sampel mahasiswa, seperti konstruksi awal alat ukur mi sebagaimana dilakukan oleh Strahan & Gerbasi (1972)). Peneliti meragukan temuan Thompson dan Phua (2005) karena bukti-bukti lain menunjukkan bahwa alat ukur mi reliabel diterapkan pada sampel pengguna narkoba (Gibson, Hudes, & Donovan, 2009) maupun pada berbagai komunitas di Sidney dan Munich yang diteliti dengan menggunakan cluster sampling (Ray, 1984). Metode Validasi Validasi alat ukur dilakukan dengan menggunakan validasi isi, validasi kriteria, dan validasi konstruk (konsistensi internal). Validasi isi dilakukan dengan metode penerjemahan bolak-balik (back translation) dan bahasa lnggris ke bahasa Indonesia dengan mempertahankan konteks dan berkonsultasi dengan seorang ahli psikometri untuk menyesuaikan konteks budaya Indonesia. Validasi kriteria dilakukan dengan metode contrasted group (Anastasi & Urbina, 1997). Untuk menunjukkan kemampuan alat ukur membedakan tingkat SD tinggi dan rendah, peneliti menciptakan dua kelompok dengan perlakuan yang berbeda, yaitu kelompok dengan SD tinggi (A) dan kelompok dengan SD rendah (B). Kelompok A diberi perlakuan berupa instruksi untuk mengisi kuesioner dengan
58
membayangkan dirinya sebagai orang yang sulit ditemui (terlalu idealis). Sebaliknya, kelompok B diberi instruksi untuk mengisi kuesioner dengan membayangkan dirinya sebagai orang yang mudah ditemul (seperti kebanyakan orang di masyarakat). Dengan cara itu kelompok A diharapkan mendapatkan skor SD tinggi, sedangkan kelompok B diharapkan mendapatkan skor SD rendah. Perlakuan mi didasarkan pada pengertian social desirability dan seperti yang dilakukan oleh Haghigat (2007) saat menvalidasi alat ukur SD. Pengertian SD adalah kecenderungan untuk menampilkan respon yang dianggap baik oleh masyarakat, bukan respon yang sebenarnya. Perlakuan untuk meningkatkan SD (kelompok A) mencerminkan pengertian mi karena setiap responden diberikan instruksi “Anda perlu membayangkan anda sendiri sebagal ‘tipe orang yang sulit ditemuI sehari-hari” IsiIah pernyataan benar/salah berikut, yang sesuai dengan karakteristik orang yang sulit ditemui sehari-hari.” I nstruksi mi d iperjelas Iebih lanjut agar responden paham bahwa mereka penlu mengisi kuesioner mi seolaholah sebagai orang lain (proyeksi) yang sangat idealis. Dengan demikian, perlakuan mi akan membawa responden untuk mengisi kuesioner se-ideal mungkin, yaitu SD yang tinggi. Sebaliknya, kelompok B diberi instruksi “Anda perlu membayangkan anda sendiri seba gal “tipe orang yang mudah ditemul seharihari.” lsllah pernyataan benar/salah berikut, yang sesual den gan karakteristik orang yang mudah ditemui sehari-hari.” Instruksi ml juga diperjelas lebih lanjut agar responden paham bahwa mereka perlu mengisi kuesioner ml seperti orang lain (proyeksi) pada umumnya, yaitu realistis atau non-idealis. Perlakuan seperti INi sesuai dengan saran Edwards (1957) dan Cnonbach (1984) dalam proses validasi alat ukur.
59
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA Tabel I Hasil Validasi Kriteria No. Item 1 2 3 4
Koefisien
Saya selalu mengakui kesalahan saya. Saya selalu melakukan apa yang saya katakan. Saya selalu membalas kebaikan orang lain dengan senang hati. Saya tidak pernah terganggu saat orang lain mengekspresikan pemikiran yang sangat berbeda dengan pemikiran saya. 5 Saya tidak pernah mengatakan sesuatu untuk menyakiti orang lain dengan sengaja. 6 Saya kadang kala suka bergosip. 7 Saya kadang kala memanfaatkan orang lain. 8 Saya cenderung untuk membalas dendam daripada memaafkan 9 Saya kadang kala memaksakan kehendak saya. 10 Saya kadang kala merasa ingin merusak sesuatu. Hasil Validasi Kriteria Validasi kniteria dilakukan dengan memeriksa korelasi antara skor item dengan kelompok eksperimen. Peneliti mempertahankan item dengan nilai koefisien di atas 0,2 sesuai saran Aiken dan GrothMarnat (2006), karena item dengan koefisien serendah 0,20 dapat berkontribusi untuk memprediksi kriteria. Hasil validasi kriteria menunjukkan bahwa 1 dari 10 item harus dieliminasi, yaitu item 8. Setelah item 8 dieliminasi, koefisien validitas kriteria meningkat dan r=0,867 ke r=0,877, sehingga tergolong cukup baik. Kemudian, analisis PCA dilakukan untuk melihat dimensionalitas alat ukur. Hasilnya menunjukkan bahwa seluruh item mengelompok ke satu faktor (A=4.77). Selain itu, seluruh item memiliki kekuatan di atas 0,3 sehingga tidak perlu dilakukan eliminasi item (Giles, 2002; Costello & Osborne, 2005). Setelah memastikan unidimensionalitas, koefisien alpha dipakai sebagai penunjuk reliabilitas (Cortina, 1993). Hasilnya adalah r = 0,879, berarti reliabilitas pengukuran dianggap cukup baik dan pengukuran mi dapat dipercaya. HasH Uji Coba Reliabilitas pada Sampel Karyawan tetap Organisasi
0,91 0,80 0,58 0,31 0,30 0,66 0,58 0,14 0,58 0,91
Analisis PCA dilakukan pada sampel karyawan tetap organisasi (n = 158) merujuk pada satu faktor (A = 2.60) yang ditunjukkan pada Tabel 2. Sama seperti pada sampel sebelumnya, seluruh item juga memiliki loading di atas 0,3 sehingga tidak perlu dilakukan eliminasi item (Giles, 2002; Costello & Osborne, 2005). Koefisien alpha pengukuran adalah r = 0,68. Koefisien sebesar ini dapat ditenima, mengingat alat ukur ini hanya memiliki 9 item dengan skor dikotomi. Cortina (1993) menunjukkan bahwa pada alat ukur dengan jumlah item sedikit, koefisien alpha memiliki kecenderungan untuk underestimate.
Kesimpulan dan Diskusi Kesimpulan Hasil penelitian menunjukkan bahwa hasil adaptasi alat ukur SD Strahan-Gerbasi (1972) ke bahasa Indonesia efektif untuk mengukur SD, walaupun kehilangan satu item (item 8). Hasil penelitian juga menunjukkan bahwa alat ukur ini cocok dipakai pada karyawan di organisasi dengan reliabilitas pengukuran yang dapat diterima.
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA
60
Tabel 2 Hasil Analisis Faktor pada Sampel Uji Validitas Kriteria Item
Faktor I
Item 1
.863
Item 2
.767
Item 3
.621
Item 4
.479
Item 5
.533
Item 6
.782
Item 7
.803
Item 9
.648
Item 10
.902
Elgenvalue Varians Temuan ini bertentangan dengan temuan Thompson dan Phua (2005) yang menunjukkan bahwa pengukuran SD pada karyawan di organisasi memiliki reliabilitas yang terlalu rendah. Dengan demikian, alat ukur mi dapat digunakan pada berbagai penelitian yang menggunakan kuesioner self-report sebagai bagian dan upaya peneliti untuk mengontrol SD. Diskusi Proses validasi alat ukur SD mi memiliki sejumlah keterbatasan. Pertama, validitas pengukuran SD mi belum diuji pada berbagai konteks dan sampel dengan menggunakan kritenia indikator perilaku yang pasti (melalul obsenvasi Iangsung) dan kuesioner selfreport, seperti yang dilakukan oleh Gibson, Hudes, dan Donovan (2009). Penelitian mereka menunjukkan kuatnya pengaruh SD dalam perilaku menyuntik (narkoba) pada sampel pengguna narkoba yang ingin detoksifikasi. Metode penelitian seperti ini dapat menunjukkan besarnya pengaruh SD pada pengukuran self-report dengan memperhatikan konteks. Contoh beberapa konteks yang rentan terhadap pengaruh SD adalah konteks perilaku
4.777 47.771% kekerasan dalam rumah tangga, sejarah kriminalitas dan gangguan jiwa, tingkat kegiatan fisik, tingkat stres psikologis, kekerasan pada pasangan (pacar), tingkat pemakalan narkoba dan alkohol, serta pola makan (van de Mortel, 2008). Penelitian lanjutan mengenai SD penting untuk dilakukan di Indonesia karena budaya masyarakat Indonesia sangat tunduk pada nilainilai moral masyarakat. Hal ini dapat menyebabkan responden di Indonesia melakukan respon SD tanpa disadari, karena dirinya sangat lekat dengan nilai-nilai masyarakat. Penelitian yang menggunakan kuesioner self-report di Indonesia dapat mengikuti metode penelitian Gibson dan Hurdes (1999) agar dapat mendeteksi secara langsung pengaruh SD pada hasil akhir penelitian. Kedua, reliabilitas pengukuran tidak terlalu tinggi (r=0,68), sehingga masih perlu ditingkatkan. Untuk meningkatkan reliabilitas, kita dapat menggunakan teknik modifikasi alat ukur seperti yang dipakai oleh Ray (1984) dalam meningkatkan reliabilitas alat ukur SD-nya. Ray (1984) mengubah seluruh item pernyataan menjadi item pertanyaan.
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA
61
Tabel 3 Hasil Analisis Faktor pada Sampel Karyawan Tetap Organisasi Item Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 9 Item 10 Elgenvalue Varians Sebagal contoh, pernyataan “Saya selalu mengakui kesalahan saya” diubah menjadi “Apakah anda selalu mengakui kesalahan anda?” Walaupun memiliki sejumlah keterbatasan, alat ukur ini tetap penting sekali dipakai pada penelitian yang bersandar pada data self-report untuk merekam perilaku. Jenis penelitian yang validitasnya paling rentan terhadap dampak negatif faktor SD adalah tipe penelitian korelasional yang hanya bersandar pada data self-report dan berbagal alat ukur psikologis. Hal ini disebabkan oleh kesamaan metode pengumpulan data antar variabel, sehingga terjadi bias kesamaan metode (common method bias). Diskusi mengenai hal mi dipaparkan dengan sangat lengkap oleh Podsakoff, MacKenzie, Lee, dan Podsakoff (2003). Mereka menyimpulkan bahwa salah satu unsur penting dalam upaya mengontrol bias tersebut adalah dengan mengukur SD serta melakukan kontrol statistik yang umumnya dilakukan dengan metode analisis Structural Equation Modelling. Daftar Pustaka Aiken, L. R., & Groth-Marnat, G. (2006). Psychological testing and assessment (1 2th ed.). Boston: Allyn and Bacon. Anastasi,A., & Urbina, S. (1997). Psychological testing (7th ed.). New Jersey: Prentice Hall.
Faktor I .476 .606 .521 .529 .559 .447 .551 .525 .605 2.603 28.927% Burns, J. E., Johnson, T. P., & O’Rourke, D. P. (2003). Validating self-reports of socially desirable behaviors. Dalam Proceedings of the survey research Methods Section. American Statistical Association. Cohen, R. J., & Swerdlik, M, E. (2005). Psychological testing and assessesment (6th ed.). New York: McGraw-Hill. Cortina, J. 5. (1993). What is coefficient alpha? An examination of theory and application. Journal of Applied Psychology, 78(1), 98-1 04. Costello, A. B., & Osborne, J. W. (2005). Best practices in exploratory factor analysis: Four recommendations for getting the most from your analysis. Practical Assessment, Research & Evaluation, 10(7), 1-9. Cronbach, L. J. (1984). Essentials of psychological testing (4th ed.). New York: Harper & Row. Edwards, A. L. (1957). Techniques of attitude scale construction. New York: Appleton Century-Crofts. Genia, V. (1996). I, E, Quest, and Fundamentalism as predictors of psychological and spiritual well-being. Journal for the Scientific Study of Religion, 35(1), 56-64.
E. S. JAYA, G.T.B. HARTANA, & W.G. MANGUNDJAYA Gibson, D. R., Hudes, E. S., & Donovan, D. (1999). Estimating and correcting for response bias in self-reported HIV riskbehavior. The Journal of Sex Research, 36(1), 96-101. Giles, D. C. (2002). Advanced research methods in psychology. Hove: Routledge. Haghigat, R. (2007). The development of the brief social desirability scale (BSDS). Europe’s Journal of Psychology, 11. Diunduh dan http://www.ejop.org/archives/ 2007/11/the_development. html Johnson, T. P., Fendrich, M., & Hubbell, A. (2002). A validation of the CrowneMarlowe Social desirability Scale. 57th Annual Meeting of the American Association for Public Opinion Research. St. Pete Beach.
62
Shaunders, S., & Munro, D. (2000). The construction and validation of a consumer orientation questionnaire (SCOI) designed to measure Fromm’s (1955) ‘marketing character’ in Australia. Social Behavior and Personality, 28(3), 219-241. Strahan, R., & Gerbasi, K. C. (1972). Short, homogenous versions of the MarlowCrowne Social desirability Scale. Journal of Clinical Psychology, 28, 191-193. Sočan, G. (2000). Assessment of test reliability when test items are not essentially Tequivalent. Developments in survey methodology, 15, 23-35. Tan, S. (2009). Misuses of KR-20 and Cronbach’s Alpha reliability coefficients. Education and Science, 34(152), 101-112.
Liden, R. C., & Maslyn, J. M. (1998). Multidimensionality of Leader-Member Exchange: An empirical assessment through scale development. Academy of Management Review, 24(1), 43-72.
Thompson, E. R., & Phua, F. T. T. (2005). Reliability among seniors of the MarloweCrowne short form social desirability scale. Journal of Business and Psychology, 19(4), 541-544.
Nunnaly, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). New York: McGraw-H ill.
Van de Mortel, T. F. (2008). Faking it: Social desirability response bias in self-report research. Australian Journal of Advanced Nursing, 25(4), 40-48.
Oppenheim, A. N. (1966). Questionnaire design and attitude measurement. London: Heinemann. Podsakoff, P. M., MacKenzie, S. B., Lee, J. Y., & Podsakoff, N. P. (2003). Common method biases in behavioral research: A critical review of the literature and recommended remedies. Journal of Applied Psychology, 88(5), 879-903. Ray, J. J. (1980). How many answer categories should attitude and personality scales use? South African Journal of Psychology, 10, 5354. Ray, J. J. (1984). The reliability of short social desirability scales. The Journal of Social Psychology, 123, 133-134.
Wade, T. J., & Walsh, H. (2008). Does the Big5 relate to jealousy, or infidelity reactions? Journal of Social, Evolutiona,y, and Cultural Psychology, 2(3), 133-143.
Email:
[email protected]: Hp: 081807215888