i
ii
ISBN: 978-602-17331-1-0
PROCEEDINGS Workshop and International Conference on Measurement and Evaluation in Education
Date: September 20th-22nd, 2012
Venue: Faculty of Psychology, Syarif Hidayatullah State Islamic University Jakarta, Indonesia.
Organized by :
Faculty of Psychology Syarif Hidayatullah State Islamic University Jakarta, Indonesia. Indonesian Educational and Evaluation Association HIMPUNAN EVALUASI PENDIDIKAN INDONESIA (HEPI) 2012
iii
Published by: Faculty of Psychology Syarif Hidayatullah State Islamic University Jakarta Indonesia
Editor Coordinator Bambang Suryadi
Members Miftahuddin Solicha Neneng Tati Sumiati Ikhwan Lutfi
All papers in this book have been selected by the reviewers and technical committee. All rights reserved. No part of this book may be reproduced, downloaded, disseminated, published, or transferred in any form or bay any means,except with the prior written permission of , and with express attribution to the authors.
The publisher makes no representation, express or implied, with regard to the accuracy of the information contained in this book and cannot accept any legal responsibility or liability for any errors that may be made.
Copyright ©by the Faculty of Psychology Syarif Hidayatullah State Islamic University Jakarta 2012
iv
TABLE OF CONTENTS
Tabel of Contents .................................................................................................
v
A Message from the Rector of UIN Jakarta ..........................................................
vii
A Message from the Dean of Faculty of Psychology, UIN Jakarta........................
viii
A Message from the Conference Chairperson ......................................................
ix
Programme ..........................................................................................................
x
Difficulties And Stumbling Blocks With Measurement In Psychodiagnostics. Peter Paul Moormann Leiden University, The Netherlands.................................................................
1
Categorical Perception of Colour: The Background of Perception Abdulrahman Saud Al-rasheed Department of psychology, King Saud University, Riyadh, KSA......................
2
The Differential Item Functioning In The Politomus Data (An Application of the Area and Likelihood Ratio Methods in Identifying DIF) Heri Retnawati & Kana Hidayati Mathematics Education Departement, Mathematics & Science Faculty Yogyakarta State University.............................................................................
15
National Examination As An Intrument of Quality Education Improvement: Analysis of Current condition and Effort for Achieving Better Future Condition
Bambang Suryadi Faculty of Psychology, UIN Syarif Hidayatullah Jakarta...............................
23
Test of Item Validity of Artistic Aptitude Test on Vocational High School Students (SMK) in Denpasar Bali Ni Ketut Widiartini University of Ganesha Education (UNDIKSHA) Singaraja-Bali ……………..
43
Penggunaan Instrumen Asesmen Untuk Mendeteksi Anak SD Kelas Rendah Berkebutuhan Khusus Maria J. Wantah Universitas Negeri Manado………………………………………………………...
53
Pengaruh Organization-Based Self-Esteem dan Komitmen Organisasi Terhadap Etos Kerja Ferdian Satriawan & Miftahuddin Fakultas Psikologi UIN Syarif Hidayatullah Jakarta.....................................
69
Hubungan Kepribadian Dan Psychological Well Being Dengan Penggunaan Facebook Vinaya Fakultas Psikologi Universitas Pancasila……………………………………….
81
v
Relationship Between Time Perspective, Psychological Well-Being, And Academic Achievement Evanytha Faculty of Psychology, Pancasila University...................................................
91
Uji Validitas Konstruk Dependent Personality Inventory (Adaptasi dari Nicole M Huber) Fauziyati Junariyah & Neneng Tati Sumiati Fakultas Psikologi Universitas Islam Negeri Jakarta.....................................
105
The Influence of Test Length Onreliability Coefficient in Terms of Probabilities Guessing Yusep Ridwan, Gaguk Margono, Dan Wardani Rahayu Program Pascasarjana Universitas Negeri Jakarta …………………………...…
119
Pemetaan Materi Sulit Ujian Nasional Bahasa Indonesia Pada Siswa SMA Jurusan Bahasa di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara Provinsi Sulawesi Utara Harol R. Lumapow Universitas Negeri Manado………………………………………………………..…
113
Ahmad Dahlan University Belongingness Scale: Measurement and Construct Development Triantoro Safaria Faculty of Psychology, Ahmad Dahlan University Yogyakarta.......................
153
Persepsi Terhadap Theraupetic Community dengan Self-efficacy terhadap Resiliensi pada Recovery Addict Pasca Perawatan Di UPT-T&R BNN Lido Sukabumi Sitti Evangeline Imelda Suaidy Fakultas Psikologi, UIN Syarif Hidayatullah Jakarta....................................
163
Pengaruh Motivasi, Sikap dan Kebiasaan Belajar, serta Faktor Demografis TerhadapHasil Belajar Mahasiswa Yunita Deskariani Lestari & Solicha Fakultas Psikologi, UIN Syarif Hidayatullah Jakarta………………..…………..
179
vi
A Message from the Rector of UIN Jakarta It is my great honor to welcome you all to the Workshop and International Conference on Measurement and Evaluation in Education and Psychology, organized by the Faculty of Psychology in collaboration with Indonesian Educational Evaluation Association (Himpunan Evaluasi Pendidikan Indonesia--HEPI). Founded in 1957, the establishment of Syarif Hidayatullah Jakarta State Islamic University [UIN] Jakarta was the result of a long and exhausting struggle by Indonesian Muslims, which began when the institute was still a State Academy of Religious Sciences [ADIA]. It „s vision is to be a prominent Islamic higher learning institution at the national and international levels that integrates sciences, Islamicity and Indonesianess. Once of the characteristics that distinguish UIN Jakarta from other universities in Indonesia is our commitment in disseminating Islamic character to our students who will later become part of Indonesia‟s heterogeneous society and will participate in developing the nation in accord with Islamic morality. UIN Jakarta will continue to carry its vision, mission, and responsibility in promoting Islamic values, aside from its role as a center for scientific research and education. With our commitments in providing excellent academic services, we believe that UIN Jakarta will continue to play its important role in producing high profile Muslim thinkers, community leaders, religious scholars as well as other professionals. UIN Jakarta is one of the fastest growing, the best and the largest State Islamic University in Indonesia. Our students come from various socio-economic background and have different ethnicities making it as a representation of Indonesia‟s cultural richness. In line with the above, the Faculty of Psychology in its 10th anniversary, has clearly declared to be a center for quantitative psychology. This conference is to be seen as a milestone for making this dream a reality. Once again, we welcome you to your journey to excellence with UIN Syarif Hidayatullah Jakarta. Happy 10th anniversary.
Prof. Dr. Komaruddin Hidayat Rector of UIN Jakarta
vii
A Message from the Dean of Faculty of Psychology, UIN Jakarta On behalf of Faculty of Psychology, Syarif Hidayatullah State Islamic University , I wish to welcome you to the workshop and international conference on measurement and evaluation in education and psychology. The theme of the conference is in line with the vision and mission of the Faculty of Psychology to be a leading faculty in quantitative psychology. The topics to be covered during the course of this Conference are of great importance to the future psychology and educational field. Therefore, we are fortunate to have among the speakers at this conference some of the foremost authorities on them. We are grateful for the support of the Rector of UIN Jakarta and Indonesian Educational Evaluation Association (HEPI). We also thank to the Organizing Committee for their tireless efforts in putting this conference together. It provides an opportunity for all of us to contribute and to learn from each other. In addition, I hope that all of you will leave the conference determined to be leaders in the effort to improve the quality of measurement and evaluation in education and psychology. Best wishes.
Jahja Umar Ph.D Dean faculty of Psychology
viii
A Message from the Conference Chairperson The organizing committee is pleased to have you at the Faculty of Psychology, Syarif Hidayatullah State Islamic University to participate in the Workshop and International Conference on Measurement and Evaluation in Education and Psychology. The theme of the conference is Achieving Excellence in Quantitative Psychology for Better Future Education. The conference is jointly organized with Indonesian Educational Evaluation Association (Himpunan Evaluasi Pendidikan Indonesia--HEPI). This conference will gather distinguished scholars in the field of psychology, statistics, and psychometrics to lead careful deliberation and discussions on ideas and proposals. In partnership and collaboration with other institutions and agencies this conference will serve as a platform for various participants to share their knowledge, perspectives and expertise in furthering progress and advancement on issues and studies related to all aspects of psychology using quantitative method. On behalf of the organizing committee, I would like to take this opportunity to express our heartfelt gratitude and thanks. First, the donors who have contributed to the funds for this conference. Please accept our sincere thank and appreciation for your generosity. Secondly, the invited guests for taking the time to be with us here. Thirdly, the paper presenters for their contributions. We wish you success in your presentation. Finally, to all organizing committee members for their hard work and dedication in making this workshop and conference a success. May Allah reward you all. To sum up, we chose the Faculty of Psychology as the conference venue because apart from the opportunities afforded by the conference‟s working session, you will also have the opportunity to experience life at the Syarif Hidayatullah State Islamic University, campus of knowledge and Islamic civilization. Sincerely
Bambang Suryadi, Ph.D Conference Chairperson
ix
PROGRAMME A.
WORKSHOP Date : 20th September 2012 Venue : Theater Room, Faculty of Psychology UIN Jakarta
Time 08.00-08.30 08.30-12.00
Programme Coffee Morning THE BERMOND VORST ALEXITHYMIA QUESTIONNAIRE (BVAQ) By Prof. Peter Paul Moormann, Ph.D (Leiden University)
Remarks Lecture room 108 Chairperson: Bambang Suryadi Note Taker: Puti Febrayosi
Content of BVAQ Workshop: a. What is alexithymia? b. Some instruments (BVAQ versus TAS-20). c. BVAQ d. Alexithymia types e. Some research with BVAQ. f. Concluding remarks
12.00-13.00
Lunch
Lecture room 108
13.00-15.30
APPLICATION OF FACTOR ANALYSIS FOR INSTRUMENT VALIDITY TEST By Jahja Umar, Ph.D Dean, Faculty of Psychology UIN Jakarta
Chairperson: Miftahuddin
x
Note taker: Adiyo R
B. INTERNATIONAL CONFERENCE (September 21st -22nd , 2012)
DAY ONE Date : Friday, September 21st, 2012 Time
Time
: 08.00 am – 16.30 pm
Programme
Venue
OFFICIATING CEREMONY 08.00-08.30 08.30-09.30
09.30-11.00
11.00-13.00
13.00 -16.30
18.30- 20.30
Registration
Syahida Inn Auditorium
Quranic Recitation By Lailatul Badriyah MC: Solicha Welcoming Speech M. Avicenna By Jahja Umar, Ph.D Dean, Faculty of Psychology Note taker: Yulistin Speech and Conference Lecture Officiating By Prof. Dr. Komaruddin Hidayat Room 108 Rector, UIN Jakarta Do‟a/Prayer Miftahuddin, M.Si Keynote Speech : “Difficulties and stumbling blocks with measurement in psychodiagnostics” Prof. Peter Paul Moormann, Ph.D Leiden University The Nederlands Tea Break & Friday Prayer Lunch
Parallel Session group 1 and 2 (see details below)
Dinner
Faculty of Psychology
Faculty of Psychology
xi
DAY TWO Saturday, September 22nd, 2012 Time
Programme
Venue
08.00-08.30
Coffee Morning
Lecture Room 108
09.00-11.15
Parallel Session DAY 2 (see detail below)
Faculty of
11.15-12.00
Closing Ceremony
Psychology
12.00-13.00
Lunch Lecture room 108
CLOSING CEREMONY Date Venue Time
: September 22nd, 2012 : Theater Room Faculty of Psychology : 11.00-12.00
Time
Program
Remarks
11.00-11.10
Conference Concluding Remarks
11.10-11.20
Conference Closing by Dean
Jahja Umar,
Faculty of Psychology
Ph.D
11.20-11.25
Do‟a/Prayer
Committee
11.25-11.40
Certificate distribution
Committee
11.40-12.30
Lunch
Committee
xii
Committee
DIFFICULTIES AND STUMBLING BLOCKS WITH MEASUREMENT IN PSYCHODIAGNOSTICS Peter Paul Moormann Leiden University, The Netherlands
In contrast with physics in psychology there is more than only one paradigm. Hence there isn‟t only one theory, but there are many. Some scientists are adherents of phenomenological thinking, other prefer psychodynamic, social-behavioral, psychometric, or neurobiological approaches. It cannot be denied that the popularity of a specific psychological theory is related to what the Germans call „‟Zeitgeist”. Nowadays neurobiological theories are in fashion, especially the working of the brain. Human behavior, our thinking, feeling and will power is thought to be regulated by or is reduced to brain mechanisms. Several highly sophisticated techniques from medicine can be used to measure human factors, although its validity can be questioned as it remains a form of indirect measurement, despite being quantitative. In that way it hardly differs from projective techniques. The interesting point to be made is that each theoretical perspective in psychology is characterized by its own assessment technique. Phenomenological assessment usually is qualitative: in depth interviews where the experience of the subject is crucial. Although psychodynamic assessment can be quantitative the problem lies in its indirect nature. The clinician has to reveal the latent content of the response, and the expertise of the assessor is crucial for the validity of the measurement. Psychometric approaches use questionnaires or self reports and are highly quantitative in nature. However they also have their weaknesses and are apt to response sets, response styles and social desirability. Considering the foregoing one may wonder which is the best assessment technique in psychological testing. In solving this problem Pervin used the metaphor of the blind men and the elephant. What is an elephant? Each blind man represents a specific psychological assessment technique and each man only grasps a qualitatively different aspect of the elephant (skin, ears, tail, trumpeter, legs, etc.). Hence the most complete picture of an elephant can be obtained by combining the outcomes of the different assessment techniques, based on different psychological theories. Psychodiagnostic questions such as for instance “Is William suffering from alexithymia?” can be handled according to the blind men and the elephant metaphor. In addition to semi-structured interviews and behavioral observations (DSM approach) a battery of questionnaires can be administered to allow for a differential diagnosis. Questionnaires, although being quantitative, are the next stumbling block. In addition to a sound theoretical frame, each questionnaire should be reliable and valid. But even then we are confronted with another stumbling block: norms. We need the right norm group to compare the individual‟s raw score with the norm expressed in percentiles, deciles, quartiles, vingtiles, T-scores, Zscores or stanines. However we are not yet there. Even when we succeed in obtaining good norms we have to decide where we situate the cut-off score. In fact this is an arbitrary decision, where the psychometric enemy, called subjectivity, invades or creeps in, like a cockroach. Hence watch out brothers and sisters. In psychology the enemy is always on the run! Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
1
Categorical Perception of Colour: the background of perception Abdulrahman Saud Al-rasheed Department of psychology, King Saud University, Riyadh, KSA Email:
[email protected] Abstract Categorical perception (CP) of colour is demonstrated by faster and/or more accurate discrimination of pair of stimuli that cross a category boundary (across-category), than two stimuli from the same category (within-category), even when the stimulus differences between the pairs of stimuli are equal. Despite a plethora of behavioural research exploring the origin and nature of colour CP, all the evidence for the CP of color was derived from Roman script readers and as, to date, no studies of colour CP have been conducted on right-to-left readers in support of this theory. However, the influence of reading habits to perception has been shown in several studies (e.g., Eviatar, 1995,1997; Farid, & Grainger 1996; Prunet, Beland & Adrissi 2000; Berent 2002; Schwalm, Eviatar, Golan & Blumenfeld, 2003). it is not entirely clear how to predict the effect of habitual reading direction on CP of colour, but it was worth exploring to test the generality of CP of color across variation of cultures and habitual reading directions. Two experiments (Target detection task and grid search task) has been conducted to investigates the colour CP, by testing participants from language their reading direction is from right-to-left as in Arabic. forty participants (twenty men and twenty women) took part in this study. All spoke Arabic as their first language and most were undergraduate students at King Saud University. Their ages ranged from 18 to 30 years with a mean of 24.3 years (SD = 5.29). The result indicated that the reaction times in the between categories condition were much faster than those in the within category condition; this suggested that CP of colour was unaffected by the habitual reading directions. So that Arabic samples performed similarly as Roman script readers and the pattern of colour CP has been replicated, but this time, it has also been shown that the effect is independent of habitual reading direction. 1. Introduction The colour spectrum is a physical continuum but it is perceived discontinuously, as discrete categories or segments of hues (Harnad, 1987). This is part of an effect called Categorical Perception (henceforth, CP). 2
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
is found when a continuum is divided into categories, and when these categories appear to affect discrimination. In operational terms, CP can be defined by faster and/or more accurate discrimination of pair of stimuli that cross a category boundary (across-category), than two stimuli from the same category (within-category), even when the stimulus differences between the pairs of stimuli are equal. This definition of CP will be used throughout, and is illustrated in the classic form shown in Figure 1.
B2
B1
G1
G2
Figure 1. Diagram representing CP. There are four colours: two blues (B2, B1) and two greens (G1, G2). The arrows show the separation between adjacent pairs which are equally separated. The vertical line shows the category boundary.
Figure 1 shows four stimuli designated as B2, B1, G1 and G2. Two (B2, B1) belong to the same the linguistic category, blue, and two (G1, G2) belong to the linguistic category green, with the category boundary between B1 and G1. The separation between the adjacent stimuli is equal. Discrimination of the cross-category stimulus pair (B1, G1) is faster and/or more accurate than discrimination of the within-category stimuli, (B1, B2) or (G1, G2). CP was first shown in speech perception. Liberman, Harris, Hoffman and Griffith, (1957) tested participants on an X-AB task. The participant‟s task was to indicate whether stimulus X is the same as stimulus A or B. The speech stimuli were from a continuum of sounds, varying in equal steps from one phoneme to another. Participants showed better discrimination when the target stimuli and test stimuli were from different phonemic categories than when they were from the same category. CP occurs for a range of perceptual phenomenon. For instance, perception of non speech sounds (e.g., Cutting & Rosner, 1974; Pastore, Li & Layer, 1990), perception of line length (Tajfel & Wilkes, 1963), and also dimensions of face perception such as facial expressions (e.g., Etcoff & Magee, 1992; Beale & Keil, 1995; De Gelder, Teunisse & Benson, 1997; Campbell, Woll, Benson & Wallace, 1999; Bimler & Kirkland, 2001; Campanella, Chrysochoos & Bruyer, 2001; Rossion, Shiltz, Laurence, Pirenne & Grommelinck, 2001; & Levin & Angelone, 2002;). Evidence for CP has also been reported on a wide range of colour perception tasks for example, recognition memory and X-AB tasks (e.g., Uchikawa & Shonida, 1996; Roberson, Davidoff & Braisby, 1999; Roberson & Davidoff, 2000, Roberson, Davies & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003) same-different tasks (e.g., Bornstein & Korda, 1984, Boynton, Fargo, Olson & Smallman, 1989) similarity judgements (e.g., Laws, Davies & Andrews, 1995; Roberson, Davidoff & Braisby, 1999) and target detection and visual search tasks (e.g., Franklin, Pilling & Davies, 2005; Daoutis, Franklin, Riddett, Clifford & Davies, 2006; Daoutis, Pilling & Davies, 2006). In the 2-X-AB task, a target stimulus (e.g., blue1) is presented followed by two test stimuli; one of the test stimuli is identical to the target and the other one (the foil) is different. The foil can be either from same category as the target (e.g., blue2), or from a different category (e.g., green1). The task is to decide as fast as possible which of the test stimuli is identical to the target. The results showed that target identification was faster and/or more accurate for different category than same category foils. In the search task, a target stimulus is presented among other stimuli (distractors); the distractors can either be from the same category as the target (e.g., blue1 among blue2s) or from a different category to the target (blue1 among green1s). The task is to detect the location of the target as fast as possible. Detection of a target that is from a different category Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3
to the distractors is faster and/or more accurate than detection of a target from the same category as the distractors. 1.2 Theories of CP Although CP has been reported in a wide range of studies, it is not clear what the origin and nature of this effect is. The degree to which language and perception contribute to the category effect has been extensively debated. Three main ideas have been emerged from the literature to account for the origin and nature effect of the CP: CP is „hardwired‟ into the visual system – it is innate; CP is due to verbal labelling; CP is due to perceptual change. 1.2.1 Innate perceptual effect The principal claim of the Naturalistic theories (e.g., Bornstein, 1987; Snowden, 1987) is that, CP is an inborn, universal perceptual effect. Naturalistic theories are potentially supported by evidence for CP in young infants and in animals. Pre-linguistic participants perceive colour categorically before colour terms are learned. Bornstein, Kessen and Weiskopf, (1976) tested 4- month old infants for colour categorisation. Infants were habituated to a target coloured stimulus, then they were shown a test coloured stimulus. The test stimulus either belonged to a different category, or to the same category, as the target stimulus. Although physical distances between stimuli were equal, infants dishabituated to the novel stimulus only when the test stimulus belonged to a different category to the habituated stimulus. Franklin and Davies (2004) also found evidence that infants had colour categories. Following familiarisation to one hue, infants only show novelty preference for a novel hue, if it comes from a different category to the familiarised hue. The findings are completely consistent with Bornstein et al.‟s. Another study by Franklin, Pilling and Davies (2005) tested 4 -to- 6 month old infants for colour CP on a target detection task. Infants were shown a coloured target on a coloured background, with the target either from the same or different lexical category to the background. Infant eye movements to the target were recorded. Infants showed faster fixation of the target when the target and background were from different categories than from the same category. This findings provide strong evidence to support the naturalistic account of CP. Macaque monkey have also shown better discrimination for colours drawn from different categories than colours from the same category (Sandell, Gross and Bornstein, 1979). However, even if colour categories are found in pre-linguistic infants and in primates, colour categories need not necessarily be innate – even pre-linguistic colour categories could be learnt. 1.2.2 Verbal labelling Labelling theories argue that CP is driven by verbal labelling rather than by perception, and thus CP is not truly a perceptual phenomenon (e.g., Fujisaki and Kwakshima, 1971; Kay and Kempton, 1984; Roberson and Davidoff, 2000). It is assumed that discrimination between perceptually different stimuli from different lexical categories is easier than stimuli from the same lexical category due to the different labels aiding discrimination. Thus, it is assumed that CP should not be shown when verbal labelling is absent. Evidence of the verbal account of the CP comes from cross-cultural and verbal interference studies. From the cross-cultural approach several studies (e.g., Kay & Kempton, 1984; Roberson, Davies & Davidoff, 2000; Daoutis, Franklin, Riddett, Clifford & Davies, 2006) report that CP only occurs when the categories boundaries are marked linguistically. Another set of studies investigated the contribution of verbal labelling to CP by adding verbal interference to the colour task (e.g., Roberson & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003; Winawer, Witthoft, Frank, Wu, Wade & Boroditsky, 2007). For instance, 4
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Roberson and Davidoff (2000) used a successive X-AB task. Participants were shown a target colour followed, after 5 secs, by two test colours, the target and the foil. As described earlier, the foil was either from the same category as the target, or from a different category; the perceptual distance between the foil and the target was the same for both conditions. The participant‟s task was to decide which colour in the test pair was identical to the target. Three types of interference were used in the ISI period: visual interference, verbal interference and no interference. CP was found in the visual and no interference conditions, but not in the verbal interference condition. The elimination of CP by verbal interference was assumed to be due to the interference impeding the retention of the name (verbal label), thus forcing the task to be done using visual memory alone. As no CP now occurs, this was taken as evidence that the benefit of CP is due to comparison of verbal labels enhancing cross-category comparisons, but not enhancing within-category comparisons 1.2.3 Perceptual change Perceptual change theories (e.g., Harnad, Hanson & Lubin, 1991; Goldstone, Lippa & Shiffrin, 2001) maintain that learning plays an important role in warping the representation of perceptual space. It is argued that learning to name a new stimulus dimension either in massed practice or in learning to distinguish the stimuli lexically leads to change in the representation of the stimulus dimension. Evidence from the perceptual learning experiment by Özgen and Davies (2002) has supported this idea. Participants were trained to learn a novel colour category such as yellowy-green vs. bluey-green. CP was then found around the recently learned category boundary. 1.3 Aims of the current study The aim of the paper is to investigate whether the colour CP is still be shown by participants from language their reading direction is from right-to-left as in Arabic. All of the studies that have tested the CP of colour (e.g., Bornstein & Korda, 1984; Boynton, Fargo, Olson & Smallman, 1989; Laws, Davies & Andrews, 1995; Uchikawa & Shonida, 1996; Roberson, Davidoff & Braisby, 1999; Roberson & Davidoff, 2000; Roberson, Davies & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003; Franklin, Pilling & Davies, 2005; Daoutis, Franklin, Riddett, Clifford & Davies, 2006; Daoutis, Pilling & Davies, 2006; Drivonikou et al. 2007 a & b; Roberson et al. 2008; Tan, Chan, Kay, Khong, Yip & Luke, 2008; Liu et al. 2009) have examined the colour CP with left–to–right script readers. However, the influence of reading habits to perception has been shown in several studies (e.g., Eviatar, 1995, 1997; Farid, & Grainger 1996; Prunet, Beland & Adrissi 2000; Berent 2002; Schwalm, Eviatar, Golan & Blumenfeld, 2003). This paper investigate the possible effect of habitual scanning on CP of colour, by examining participants from language who vary in their reading direction: right-to-left in Arabic. A preliminary study (Rasheed, 2010) established the location of the azrock „blue‟- akhdar, „green‟ boundary in Arabic. the Arabic blue-green category boundary was around 7.5BG which is in the same location as for English (Bornstein and Monroe, 1980). CP of colour was then tested in the two samples using first, a Target detection task, (Experiment 1) and then grid search task (Experiment 2). 2. Experiment 1: CP of Colour in a Target Detection Task. 2.1 Introduction Experiment 1 was carried out to investigate whether habitual reading direction might affect the pattern of CP of colour. Arabic speakers, who read from right-to-left were tested. CP was investigated using a version of the target detection task where a circle target appeared Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
5
on a differently coloured background at one of twelve locations around a central fixation point that, originally used by Franklin, Pilling & Davies, 2005. The findings showed that CP of colour was independent of habitual reading direction and broadly replicated previous results (Bornstein & Korda, 1984; Boynton, Fargo, Olson & Smallman, 1989; Laws, Davies & Andrews, 1995; Uchikawa & Shonida, 1996; Roberson, Davidoff & Braisby, 1999; Roberson & Davidoff, 2000; Roberson, Davies & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003; Franklin, Pilling & Davies, 2005; Daoutis, Franklin, Riddett, Clifford & Davies, 2006; Daoutis, Pilling & Davies, 2006; Drivonikou et al. 2007 a & b; Roberson et al. 2008; Tan, Chan, Kay, Khong, Yip & Luke, 2008; Liu et al. 2009).
2.2 Method 2.2.1 Participants Participants were twenty native Arabic-speaking. Post and undergraduates recruited from the student population of the University of King Saud. There were 10 males with a mean age of 24.8 years (SD=5.31), and 10 females, with a mean age of 22.7 years (SD = 4.92), with an age range from 18 to 34 years old. Based on self-report, all were right-handed and had normal colour vision, as indicated by the City University Test (Fletcher, 1981); all participated for course credit, and none of them were aware of the predictions of the experiment at the time of testing. 2.2.2 Stimuli, and apparatus Four colours were selected for this experiment as shown in Figure 2. Two stimuli were blue and two were green. They varied only in Munsell hue: 10G, 5BG, 10BG and 5B, with value and chroma kept constant (6/7). The separation between stimuli was 5 hue steps (∆E ~ 15). Their CIELUV coordinates (u* v*) were: -43.64, 12.12; -45.65, -2.73; -44.83, 18.68; 39.62, 32.97. A Cambridge Research Instruments ColorCal was used to measure CIE co-ordinates. The colour stimuli were displayed on calibrated 17 inch CRT Sony Trinitron monitor. 7.5BG
B2
5B
B1
G1
G2
10B
5BG
10G
G Within-blue
Within-green Cross-category
Figure 2. Illustration of the Munsell codes of the four stimuli used. B2 and B1 are blue and G1 and G2 are green. Adjacent colours are 5 hue steps apart. The line between B1 and G1 indicates the English bluegreen boundary.
2.2.3 Procedure The target was a circle of 3 cm diameter (visual angle = 3.22º) that appeared on a differently coloured background (40 × 30 cm) at one of twelve locations around a central fixation point, half of them located in the left visual field and half in the right visual field (Figure 3). Adjacent stimuli were paired, to give one within-category pair (green1-green2) and one between-category pair (green1-blue1). For each pair, on a given trial, one stimulus 6
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
was used as the target and one stimulus as the background. However, across trials, each stimulus within a pair was used as the target half of the time and half of the time as the background. Fixation point
Blank
Stimuli
Response
250 ms
400 ms
Figure 3. Example of the target detection task, the black dot shows the target, and the other 11 white circles indicate the possible target locations.
There were three target-background pairs: two within-category (blue1-blue2 and green1-green2) and one between category (blue1-green1). Within each pair, half the time, one was the target and the other the background, and on the other half of the trials, the relationship was reversed. There were 96 trials in total, consisted of 24 trials for the combinations of CP of colour (within- between-). Trial order was randomised subject to the above constraints. The participants were tested individually in a dark room, and were seated 60 cm away from the monitor and at eye-level to the centre of the monitor, with head restrained using a chin rest. Participants were instructed to click on the mouse button as quickly as possible when the target appeared on the monitor. The target could occur, at random, in any one of 12 locations arranged on a notional circle around the fixation cross. 2.3 Results
Figure 4. Mean response times (ms +/-1se) for correct trials for detecting of chromatic target on colour background. The data were averaged over the category (within/across).
As the main interest is in CP of colour, I only report the analysis of trials; the withinbetween category. Overall, there were only 1.2% errors; too small a rate to be usefully analysed. For each participant, the mean RT for each category (within category and cross Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
7
category) was calculated. Figure 4 shows the mean RT across participants for each within category and cross category. A paired t-tests (2-tailed) showed that between-category (mean (SD) = 379 (40.31) ms) was about 44 ms faster than within-category (mean (SD) = 422 (40.31) ms; t(19) = 7.25, p < 0.001 2.4 Discussion The results mirrored the finding of previous studies (Bornstein & Korda, 1984; Boynton, Fargo, Olson & Smallman, 1989; Laws, Davies & Andrews, 1995; Uchikawa & Shonida, 1996; Roberson, Davidoff & Braisby, 1999; Roberson & Davidoff, 2000; Roberson, Davies & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003; Franklin, Pilling & Davies, 2005; Daoutis, Franklin, Riddett, Clifford & Davies, 2006; Daoutis, Pilling & Davies, 2006; Drivonikou et al. 2007 a & b; Roberson et al. 2008; Tan, Chan, Kay, Khong, Yip & Luke, 2008; Liu et al. 2009). Examined the colour CP with left–to–right script readers, discrimination of pairs of colour from different lexical categories (blue and green) was faster than pairs from the same lexical category (different shades of blue). The aim of the experiment was to replicate the original finding CP of colour using a participants varied in habitual reading direction and in a task that varied in design and instructions to the tasks used in previous research. Participants were asked to decide as soon as possible when the target appeared on the coloured background. Response times showed the RT was significantly larger for the cross category than for the within category suggesting that CP of colour still occurs with participants who vary in their reading direction: right-to-left in Arabic. This result provides converging evidence that habitual scanning has no effect on CP of colour. 3. Experiment 2:CP of Colour in Grid Search Task 3.1. Introduction The previous experiments in this paper investigated whether the CP of colour was independent of reading direction. The results showed that CP of colour was independent of habitual reading direction and broadly replicated previous results (e.g., Bornstein & Korda, 1984; Boynton, Fargo, Olson & Smallman, 1989; Laws, Davies & Andrews, 1995; Uchikawa & Shonida, 1996; Roberson, Davidoff & Braisby, 1999; Roberson & Davidoff, 2000; Roberson, Davies & Davidoff, 2000; Pilling, Wiggett, Özgen & Davies, 2003; Franklin, Pilling & Davies, 2005; Daoutis, Franklin, Riddett, Clifford & Davies, 2006; Daoutis, Pilling & Davies, 2006; Drivonikou et al. 2007 a & b; Roberson et al. 2008; Tan, Chan, Kay, Khong, Yip & Luke, 2008; Liu et al. 2009) have examined the colour CP with left–to–right script readers. However, the influence of reading habits to perception has been shown in several studies (e.g., Eviatar, 1995, 1997; Farid, & Grainger 1996; Prunet, Beland & Adrissi 2000; Berent 2002; Schwalm, Eviatar, Golan & Blumenfeld, 2003). Most tests of CP of colour have used one or other of these tasks, and it is important to establish that the effect is independent of the detailed methods used. Here, I investigate a number of distractors affects the CP of colour. Most of the studies that tested the CP of colour used tasks similar in design Franklin, Pilling and Davies (2005). In this experiment (Experiment 2), the number of distracters was enlarged (35 distracters) to test whether search time was independent of the number of distractors, indicating „pop-out‟ (Treisman & Gelade, 1980), or that search was „efficient‟ (Wolfe, 1994). If search was not efficient, then the pattern of CP of colour might interact with the number of distracters. 8
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3.2 Method 3.2.1 Participants Twenty participants (ten male and ten female) took part in the a grid search task. They spoke Arabic as their first language and most were undergraduate students at King Saud University. None of them have participated in the first experiment. Based on self-reports, all were righthanded and had normal colour vision, as indicated by the City University Test (Fletcher, 1981). Their ages ranged from 17 to 35 years. Male, mean age was 24.3 years (SD = 5.29) and females, with a mean age of 20 years (SD=6). Fewt of the participants participated for course credit and a most volunteered. 3.2.2 Stimuli and apparatus three colour stimuli were used in this experiment as shown in Figure 4,; one green (5BG) and two blues (10BG and 5B; Value and Chroma = 6/8). The separation between adjacent stimuli was 5 Munsell hue steps (AE ~ 15). Their CIELUV coordinates (u* v*) were -45.65, -2.73; 44.83, -18.68; -39.62, -32.97; all at L* = 61.70; a Cambridge Research Systems, ColorCal colorimeter was used to measure the CIE co-coordinates and they were displayed on a 17inch CRT model GDM-F520. 3.2.3 Procedure Adjacent stimuli were paired, to form one within-category pair (blue1-blue2) and one between-category pair (blue1-green1). For each pair, one stimulus was the target and the other stimulus was used for the distractors, with both stimuli in a pair appearing equally often as distractors. The target for all trials was always blue and the distractors were randomly switched between „within‟ (blue) and „across‟ (green). There were equal numbers of trials for each combination of category (within- or between-) and visual field (LVF or RVF) and the order of trials was randomised across these four conditions. In addition, target location was randomised across trials with the constraint that the target appeared equally often to the left and right of fixation. Stimuli were shown as 2.5 cm squares with 5 mm gaps between adjacent locations, appearing in locations specified by a 6×6 square grid on the display (Figure 5).The target appeared amongst 35 distractors on a grey background (19.47 cd/m², 0.336, 0.344) see Figure 6. 7.5BG B2
5B
B1
G1
10B
5BG
G Within-category Cross-category
Figure 5. Illustration of the Munsell codes of the three stimuli used. Stimuli B1 and B2 are from the same category, while stimulus G1 belongs to a different category. B1-B2 and B1-G1 differ by 5 Munsell Hue steps. The line between B1 and G1 indicates the Arabic blue-green boundary.
The experiment began with a fixation cross which remained for 100 ms to alert the participants that the trial was beginning. Then the test display followed and remained on Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
9
screen for 200 ms. The next trial began when the participants had responded. There were 64 trials. Participants were given 15 practice trials before starting the experiment, and they took about seven minutes to complete the task. Blank Fixation point (100ms)
Stimuli (200ms) Responds (100ms)
Figure 6. Example of the grid task. The blue square shows the target, and the other green squares indicate the distractors.
The participants were tested individually in a dark room and sat with their head position constrained by a chin-rest, so that eye-level was at the centre of the monitor, with a viewing distance of 60 cm. Participants were informed that they would be presented with a target stimulus among a 35 number of distractors and their task was to clicking the mouse button as soon as possible when they see the target )different colour than the other 35 distractors). 3.4 Results
Figure 7. Mean response times (+/-1se) for each combination of category and visual field.
The percentage of incorrect trials was calculated for each subject, for each combination of category (within/cross). A paired sample t-tests (2-tailed) showed that there was significant effect on the number of incorrect trials between-category (mean (SD) = 3.00 (1.56) was smaller by 1.90 trials than within-category (mean (SD) = 4.90 (1.56); t(19) = 4.25, p < 0.001. Then, for each participant, median RTs for correct trials for each category (within category and cross category) was calculated. Figure 7 shows the mean RT across participants for each within category and cross category. A paired sample t-tests (2-tailed) showed that betweencategory (mean (SD) = 467 (46.19) ms) was about 49 ms faster than within-category (mean (SD) = 560 (91.68) ms; t(19) = 7.28, p < 0.001 10
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3.5 Discussion The characteristic pattern of CP of colour was found again in this study, there was clearly category effect between-category was about 49 ms faster than within-category. In addition, there was no suggestion that the number of distractors affected RTs, indicative of pop-out or efficient search, nor any suggestion that the number of distractors affected the pattern of CP of colour. These data provide further support for the bias in colour CP. 4. general desiccation This paper reported two experiments of investigations into aspects of the „Psychology of Colour‟. These investigations all relate to long standing questions about the origin, nature and interaction of colour language, perception and cognition. The main aim of investigation is to contribute to the debate about the origin of categorical perception of colour by establishing whether categorical perception of colour are invariant across reading direction and tasks. This section summarises the findings for each of two investigations, whilst also highlighting the contribution to the debates and identifying the need for further research. The first investigation in (experiment 1) was into factors affecting the categorical colour perception. explored how universal and robust a CP of colour is ? by establish whether the CP of colour was affected by reading direction as the influence of habitual scanning on perception which has been shown in several studies (e.g., Eviatar, 1995, 1997; Schwalm et al., 2003; Farid, and Grainger 1996; Prunet et al., 2000; & Berent, 2002). Research on the blue-green colour CP was conducted in experiment 1and using a version of Franklin et al. (2008) target detection task. Despite the differences in reading direction for Arabic sample, still right-to-left script readers samples showed effectively the same pattern of results. They discriminated pairs of colours from different lexical categories significantly faster than pairs from the same lexical categories (CP). Experiment 2 further tested the robustness of CP of colour by testing Arabic samples with a new colour tasks. The effect has previously been tested for in adults using target detection tasks where participants are required to indicate whether a target appeared on colour background (Franklin et al, 2008). Experiment 2 experiments used variant task, a grid search task that varied the number of distractors (35 distractors). The characteristic pattern of CP of colour was found on this tasks, showing a trend for a CP of colour bias and a significant CP effect. These experiments confirmed that readers of right-to-left scripts, such as Arabic, show the same pattern of lateralisation as readers of left-to-right scripts, such as English. Habitual scanning direction seems to have no effect on how colour CP is categorised.
REFERENC A Dictionary of Modern Written Arabic. Cowan, J. M. (1974). London: Macdonald & Evans. Al-rasheed, A. S. (2010). Colour Cognition in Arabic and English Speakers. Doctoral thesis, University od Surrey. Androulaki, Ann, Natalia Gômez-Pestaña, Christos Mitsakis, Julio Lillo Jover, Kenny Coventry & Davies, Beale, J. M. & Keil, F. C. (1995). Categorical effects in the perception of faces. Cognition, 57, 217-239. Beebe-Center, J. G., (1932). The psychology of pleasantness and unpleasantness. New York: Van Nostrand.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
11
Beke, L.; Kutas, G.; Kwak, Y.; Young Sung, G.; Park, D. S. & Bodrogi, P. (2008). Color preferences of aged observers compared to young observers. Color Research & Application, 33 (5), 381–394. Berent, I. (2002). Identity avoidance in the Hebrew lexicon: Implications for symbolic accounts of word formation. Brian and Language, 81, 326-341. Berlin, B. & Kay, P. (1969). Basic color terms: their universality and evolution. Berkeley & Los Angeles: University of California Press. Bimler, D. & Kirkland, J. (2001). Categorical perception of facial expressions of emotion: Evidence from multidimensional scaling. Cognition and Emotion, 15 (5), 633-658. Bjersted, A., (1960). Warm-cool color preferences as potential personality indicators: Preliminary note. Perception and Motor Skills, 10, 31-34. Bornstein, M. H. (1975). Qualities of color vision in infancy. Journal of Experimental Child Psychology, 19, 401–419. Bornstein, M. H. (1987). Infants are trichromats. Journal of Experimental Child Psychology, 21, 425-445. Bornstein, M. H., Kessen, W. & Weiskopf, S. (1976). Color vision and hue categorization in young infants. Journal of Experimental Psychology: Human Perception and Performance, 1, 115-129. Bornstein, M. H. & Korda, N. (1984). Discrimination and matching within and between hues measured by reaction times: some implications for categorical perception and levels of information processing. Psychological Research, 46, 207-222. Bornstein, M. H. & Monroe, M. D. (1980). Chromatic information processing: Rate depends on stimulus location in the category and psychological complexity. Psychological Research, 42, 213-225. Boynton, R. M., Fargo, L., Olson, C. X. & Smallman, H. S. (1989). Category effect in color memory. Color Research and Application, 14 (5), 229-234. Campanella, S., Chrysochoos, A. & Bruyer, R. (2001). Categorical perception of facial gender information: Behavioural evidence and the face-speech metaphor. Visual cognition, 8 (2), 237-262. Campbell, R., Woll, B., Benson, P. & Wallaca, S. B. (1999). Categorical perception of face actions: their role in sign language in communicative facial displays. Quarterly Journal of Experimental Psychology, 52 (1), 67-95. Cutting, J. E. & Rosner, B. S. (1974). Categories and boundaries in speech and music. Perception and Psychophysics, 16, 564-570. Daoutis, C. A., Franklin, A., Riddet, A., Clifford, A. & Davies, I. R. L. (2006a). Categorical effects in children‟s colour search: a cross-linguistic comparison. British Journal of Developmental Psychology, 24 (2), 373-400. Daoutis, C. A., Pilling, M. & Davies, I. R. L. (2006b). Categorical effects in visual search of colour. Visual Cognition, 14, 229-234. De Gelder, B. L. M. F., Teunisse, J. P. & Benson, P. J. (1997). Categorical effects of facial expressions: Categorical and their internal structure. Cognition and Emotion, 11 (1), 1-23. Drivonikou, G. V., Davies, I. R. L. Franklin, A. & Taylor, C. (2007b). Lateralisation of colour categorical perception: A cross-cultural study. Perception, 36, ECVP Abstract Supplement. Drivonikou, G. V., Kay, T., Regier, R. B., Ivry, A. L., Franklin, A. & Davies, I. R. L. (2007a). Further evidence that Whorfian effects are stronger in the right visual field than the left. Proceeding of the National Academy of Sciences, 104, 1097-1102. Eichstedt, J. A. (1997). Infants’ metaphorical knowledge about gender. Unpublished master‟s thesis, Concordia University, Montreal, Quebec.
12
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Etcoff, N. L. & Magee, J. J. (1992). Categorical effects in the perception of faces. Cognition, 57 (3), 217-239. Eviatar, Z. (1995). Reading direction and attention: Effects on lateralized ignoring. Brian and Cognition, 29, 137-150. Eviatar, Z. (1997). Language experience and right hemisphere task: The effects of scanning habits and multilingualism. Brian and Cognition, 58, 157-173. Eysenck, H. (1941). A critical and experimental study of colour preference. American Journal of Psychology, 54, 385-391. Farid, M. & Grainger, J. (1996). How initial fixation position influences visual word recognition: A comparison of French and Arabic. Brian and Language, 53, 351-368. Fletcher, R. (1980). The City University Colour Vision Test. Keeler Ltd. Windsor, Berks. Franklin, A., Pilling, M. & Davies, I. R. L. (2005). The nature color categorisation: Evidence from eye-movements on a target detection task. Journal of Experimental Child Psychology, 91, 227-248. Gilbert, A. L., Regier, T., Kay, P. & Ivry, R. B. (2006). Whorfian hypothesis supported in the right visual field but not the left. Proceeding of the National Academy of Sciences, 103, 489-494. Goldstone, R. L., Lippa, Y. & Shiffrin, R. M. (2001). Altering object representations through category learning. Cognition, 78, 27-43. Harnad, S. (1987). Categorical Perception: The groundwork of cognition. New York: Cambridge University Press. Harnad, S., Hanson, S. J. & Lubin, J. (1991). Categorical perception and the evolution of supervised learning in neural nets. In D. W. Powers & Reeker, L., (Eds), Working papers of the AAAI spring symposium on machine learning of natural language and ontology, 65-74. Presented at Symposium on Symbol Grounding: Problems and Practice, Stanford University, March 1991. Kay, P. & Kempton, W. (1984). What is the Sapir-Whorf hypothesis? American Anthropologist, 86, 65-79. Laws, G., Davies, I. & Andrews, C. (1995). Linguistic structure and non-linguistic cognition: English and Russian blues compared. Language and Cognitive Processes, 10 (1), 59-94. Levin, D. T. & Angelone, B. L. (2002). Categorical perception of race. Perception, 31 (5), 567-578. Liberman, A. M., Harris, K. S., Hoffman, H. S. & Griffith, B. C. (1957). The discrimination of speech sounds within and across phoneme boundaries. Journal of experimental Psychology, 45, 358-368. Liu, Q., Li, H., Campos, J. L., Wang, Q., Zhang, Y., Qiu, J., Zhang, Q. & Sun, H. (2009). The N2pc component in ERP and lateralization effect of language on color perception. Neuroscience Letters, 454, 58-61. Özgen, E. and Davies, I. R. (2002). Acquisition of categorical color perception: A perceptual learning approach to the Linguistic Relativity Hypothesis. Journal of Experimental Psychology, 131 (4), 477-493. Pastore, R. E., Li, X. & Layer, J. K. (1990). Categorical perception of non-speech chirps and bleats. Perception and Psychophysics, 48 (2), 151-156. Pilling, M., Wiggett, A., Özgen, E. and Davies, I. R. L. (2003). Is color „categorical perception‟ really perceptual?. Memory and Cognition, 31 (4), 538-551. Prunet, J. F., Beland, R. & Idrissi, A. (2000). The mental representation of Semitic word. Linguistic Inquiry, 31, 609-648. Roberson, D. & Davidoff, J. (2000). The categorical perception of colors and facial expressions: the effect of verbal interference. Memory and cognition, 28 (6), 977-986.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
13
Roberson, D., Davidoff, J. & Braisby, N. (1999). Similarity and categorisation: neuropsychological evidence for a dissociation in explicit tasks. Cognition, 71, 1-42. Roberson, D., Davies, I. R. L. & Davidoff, J. (2000). Color categories are not universal: Replications and new evidence from a Stone-Age culture. Journal of Experimental Psychology: General, 129, 369-398. Roberson, D., Park, H. & Hanley, R. J. (2008). Categorical perception of colour in the left and right visual field is verbally mediated: Evidence from Korean. Cognition, 107 (2), 752-762. Rossion, B., Schilitz, C., Laurence, R., Pirenne, D. & Grommelinck, M. (2001). How does the brain discriminate familiar and unfamiliar faces?: A PET study of face categorical perception. Journal of Cognitive Neuroscience, 13 (1019-1034. Sandell, J. H., Gross, C. C. &Bornstein, M. H. (1979). Color categories in macaques. Journal of Comparative and Physiological Psychology, 93 (4), 626-625. Schwalm, N. D., Eviatar, Z., Golan, Y. & Blumenfeld, Y. (2003). The effect of reading direction habit on numerical processing. Proceeding of the Human Factors and Ergonomics Society, 47th, Annual Meeting. Tan, L. H., Chan, A. H. D., Kay, P. Khong, P. Yip, L. K. C. & Luke, K. (2008). Language affects patterns of brain activation associated with perceptual decision. Journal of Experimental Psychology: Human Perception and Performance, 105 (10). 4004-4009. Treisman, A. & Gelade, G. (1980). A feature integration theory of attention. Cognitive Psychology, 12, 97-136. Uchikawa, K & Shonida, H. (1996). Influence of basic color categories on color memory discrimination. Color Research and Application, 21 (6), 430-439. Winawer, J., Witthoft, N., Frank, M., Wu, L., Wade, A. & Boroditsky, L. (2007). Russian blues reveal effects of language on color discrimination. Proceedings of the National Academy of Sciences, 104, 7780-7785. Wolfe, J. (1994). Guided Search 2.0: A revised model of visual search. Psychonomic Bulletin and Review, 1, 202-238.
14
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
THE DIFFERENTIAL ITEM FUNCTIONING IN THE POLITOMUS DATA (An Application of the Area and Likelihood Ratio Methods in Identifying DIF) Heri Retnawati (
[email protected]) Kana Hidayati (
[email protected]) Mathematics Education Departement Mathematics & Science Faculty Yogyakarta State University Abstract This study aims to determine the content of differential item functioning (DIF) in the politomous data especially the generalized partial credit model. The data is generated using WINGEN. The item parameters of Indonesia and the international parameters of test in TIMSS 2007 is used, and the participants' ability scale generated by assuming respectively the data has normal distribution (N [-1.2,1] for Indonesia‟s and the N [0,1] for the international‟s). The DIF analyzes conducted by using the area under the curve and its significance is tested using Likelihood ratio test . The results showed that there were DIF loading in the politomus data. Key word: DIF, area under the curve, Likelihood ratio test Introduction In education, there are many various forms of tests commonly used in education or psychology (Grounlund & Linn, 1990). Various forms of tests are often used in mathematics education including the form of an objective form (multiple choice) and constructed response (or essay form). In the objective form, the scoring model is dichotomy, scored 1 if the student answer is right and wrong really scored 0. For the essay form, the scoring is done by concern at the stages of test participants in solving problems, making the score not only 0 and 1, but can be 012, 0123, 01234, and so on in accordance with the number of stages of completion. Final scoring model is often called scoring using polytomous model. One example of scoring using polytomous model is mathematics test in TIMSS 2007, derived from multiple the multiple choice items and the constructed response that scored 01 and 012. In the international study, the Trend in International Mathematics and Science Studies (TIMSS) 2007 for example, the students‟ achievement of Indonesia have not been satisfying. The empirical results suggesting that the abilities of students in Mathematics and Science was very low, and lower than students from other Asian countries. The explanation that the low abilities of students showed the failure of learning is caused by the low quality of education in Indonesia. One of the ways to understand why the results of estimation abilities‟ students of Indonesia are low, ie, by comparing of item parameters estimated from participant responses Indonesia to international item parameters. Those things are the reason for a study on the characteristics of the TIMSS mathematics items that identify the load of differential item functioning (DIF) with Indonesia as a focal group with students of other countries as the reference group. To find out the load of DIF, one approach that can be used are the item response theory. In item response theory, the relationship between the probability to answer correctly to the scale of ability and item parameters expressed by mathematical equations called Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
15
models. One of the mathematical model by scoring politomus is the Generalized Partial Credit Model (GPCM). GPCM by Muraki (1999) is a common form of partial credit model (PCM), which is expressed in mathematical form, called as a function of item response categories as follows. h
Pjh ( )
exp Z jr ( ) v 0
mi
e 0
e exp Z jr ( ) v 0
, k=0,1,2,...,mj ...............................(1)
and Zjh( )=Daj( -bjh)=Daj( -bj+dh), bj0=0
...............................................(2)
where Pjk( ) : probability of testee‟s ability ( ) to get k score in item- j, : testee‟s ability, aj : item discrimination index of item- j, bjh : item difficulty of item- j, bj : location parameter of item-j dk : category parameter of k, mj+1 : number of category in item- j, and D : scaling factor (D=1.7) The bjh parameter, by Master is named with the steps parameters. This parameter represent the intersection between curve of Pjk( ) and Pjk-1( ). The two of curves will be intersect only at one point on scale (van der Linden & Hambleton, 1997). Jika = bjk, maka Pjk( ) = Pjk-1( ) Jika > bjk, maka Pjk( ) > Pjk-1( ) Jika < bjk, maka Pjk( ) < Pjk-1( ), K=1,2,3,...,mj .................................(3) The GPCM is formulated based on the assumption that each probability of choosing k-category exceeds the (k-1) was built by the dichotomy model. Pjk is a specific probability to select a k-category from mj +1 categories. The relationship of probability to answer correctly to each ability are presented in the graph called item characteristic curve (is also called as the Categorical Response Function, CRF) (du Toit, 2003). Graphics CRF in 4 categories are presented in Figure 1. (The parameters‟ item of Figure 1 are item discrimination index is (a) 1.0 and item difficulty index in answering categories are -2.0, 0.0 and 2.0. 1 0.8 P0
0.6
P1
0.4
P2
0.2
P3 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4
0
Fig 1. Graph of CRF for 4 categories 16
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
The concept of item bias or also called differential item fungtioning (DIF) is defined as the difference of opportunity to answer correctly between the two groups named the Focal Group and the Reference Group. In the item response theory, DIF is expressed as the difference of probability to answer correctly of an item between the Focal group and the Reference group. Because of the size of DIF expressed by "how much difference" between the two groups, the characteristic curve indicated by the shaded area in Figure 2. The area was named with SIGNED-AREA, the extent size can be calculated mathematically using the method of integration. Because of the size of DIF related to the size of a simple local area, then by Camilli and Shepard (1994) method is called with Simple Area Index. SIGNED-AREA =
P ( ) P R
F
( ) d
………………………………………..(4)
In a DIF analysis of an item, it could be characteristic curve of the two groups are intersect. If this occurs, the size of DIF that are positive and negative results will cancel each other, as illustrated in Figure 3. In this case, the size of the area can be calculated by unsigned-AREA which is the integral of the squared difference between the chance of correctly answering a reference group with focal group. UNSIGNED-AREA =
P ( ) P ( )
2
R
F
d ………………………………..(5)
By using the concept of diferrence probability to answer correctly between the reference group with focal groups, it can be used in the function of politomous model of scoring. The concept of an area as different probabilities as the Simple Area Index in IRT with dichotomous data developed into the Simple Area Index on item response theory with data politomus. The uniform DIF is identified using the area between these two characteristic curves are named with SIGNED-AREA (Heri Retnawati, 2011). Basic on Figure 2a and 2b (CRF on 3 category response data), the size can be calculated mathematically by the method of integration. The DIF Index is formulated as follow: SIGNED-AREA =
+ … (6)
If the two CRF curve of the two groups are intersect (load nonuniform DIF), the area between the two CRF is UNSIGNED AREA. The size of unsigned area on Figure 3a and 3b is estimated using formula: UNSIGNED-AREA = + + + + +
……(7)
The significance of DIF in an item of test can be estimated by likelihood ratio test or the model comparison approach (Camilli and Shepard, 1994: 76-97; Thissen et. al., 1993: 72). The model comparison approach is implemented by comparing the relative fit of two models. The first is called the compact model (C) and the second is the augmented model (A). The augmented model is an elaboration of the compact model; it has all of the parameters of model C plus a set of additional parameters. The comparison is to see weather the additional parameters in set A are really necessary. A simpler model with a single ICC for the Reference and Focal Group (for a particular item) is always preferable to a more complex Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
17
model with each group has its own ICC. Only if a more complex model demonstrates significantly better fit to the data, its additional features is deemed necessary.
Fig 2.a. The category response function of Fig 2.b. The category response function to focal group and reference with 3 category
estimate uniform DIF Index with 3 category
Fig 3.a. The category response function of Fig 3.b. The category response function to focal group and reference with 3 category estimate nonuniform DIF Index with 3 (load nonuniform DIF) category For illustration, L * is value of L likelihood function. There are two models will be compared, C model (compact model) and A model (augmented model). The C Model is simpler model. The hypothesis is Ho : = Set C ( Set C contains N parameters) ……………..…………..…….. (8) Ha : = Set A ( Set A contains N+M parameters) ……....…….............……. (9) Stands for the true set parameters. The C model has M fewer parameters than A model. The Likelihood Ratio for the two models is: LR =
L*( C ) L( A )
…………………………………………………………………. (10)
Where L*(C ) is value of L likelihood function of C model and L*( A) is value of likelihood function of A model . Then it is transformed in the natural logarithm: 2 (M ) = -2 in (LR)
=[-2 ln L*(C ) ]-[-2ln L*( A) ] …………………………………….………..…(11) 18
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
L
For simplicity notation, G(C) = [-2 ln L*(C ) ] and G (A) = [-2ln L*( A) ], then the ratio likelihood becomes 2 (M ) = -2ln(LR) = G( C) – G(A)………………………………….…..………(12) 2 (M ) is approximately distributed as a chi-square with M degrees of freedom.
The steps for detecting DIF are can be elaborated as follows. Firstly, estimate item‟s parameter and get G(C) in test consisted of k item. Second, determine one of item test to be evaluated. Third, item the test is made impressing becomes two items. Item firstly contains answers from Reference group, which is not responded by the Focal group. The second item contained the answers from Focal group which is not responded by the Reference group. Fourth, estimate the parameters again and get G (A) for test consisted of 2 k+1 item. Then, (M ) can be determined to know the significance of DIF in one item of test. The aim of the study is to determine the DIF of politomous data especially generalized partial credit model (GPCM). The response pattern is generated by the model parameters from the data of Indonesia and the international of TIMSS 2007 in mathematics test. Methods This study identify the DIF of constructed response mathematics items of TIMSS 2007. The signifcancy test of DIF used the generated data for the focal group and reference group. The politomus data sets are generated by the model parameter estimation results of the response pattern of Indonesian students in TIMSS 2007 (for the focal group) and the international items‟ parameter of mathematics test in TIMSS 2007 (for the reference group), particularly in the consructed response form that scored 3 category and the total of items is 19 items. The students‟ responses were generated using WINGEN, with ability parameter of students respectively have the normal distribution (N [-1.2,1] for Indonesia's and the N [0.1] for the international. The estimation of parameter from the response patterns of students in TIMSS 2007 Indonesia conducted with PARSCALE. The estimation of DIF index used the method of the area between CRF curve is conducted by Rieman sum integral. The estimation of likelihood to determine the significance of DIF has done using PARSCALE, and the result then compared with the Chi-square table. Result Indonesia students' response patterns to mathematics items in TIMSS 2007 were analyzed to estimate the items‟ parameters, i.e. items‟ discrimination, item difficulty index, and items‟ location parameters. Parameter estimation results are then compared to items‟ paramater of TIMSS, to conduct early detection of DIF in the politomous data. The comparison of the items‟ location parameter of Indonesia to the international parameters is presented in Figure 4. Looking at the results in Figure 4, it can be obtained that the slope of line item location parameter trend (straight line) is lower than the slope of the line y = x (dash line with gradient 1). This indicates that the difficulty parameters in Indonesian‟s data is higher than the difficulty parameter in international‟s data and this is one indication of the DIF loading. By using the same parameters with the parameters estimated from students‟ Indonesia (Indonesia parameter) and the original items parameters from TIMSS (international Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
19
International
parameter), then 1000 responses generated by the abilities distribution N [(-1.2), 1] for Indonesia and N [0.1] for the international. The data generated by the Indonesia parameter is the focal group, and the data generated by the international parameters is considered as the reference group.
-1
1.800 1.600 1.400 1.200 1.000 0.800 0.600 0.400 0.200 0.000 -0.200 0 -0.400 -0.600
1
2
3
Indonesia
Figure 4. The Difficulty Index Estimated from Students‟ Responses of Indonesia and The Origin Difficulty Index (International) By using the item parameters that is item discrimination index, difficulty index, and the location parameter of focal and reference group, then described the characteristic response function (CRF) curve. The CRF curve is then used to calculate the index of DIF is the area between the probability of the focal group and reference group. The CRF curve for example items are presented in Figure 5 for item M022232. DIF index is then calculated by the method of unsigned area by using the Rieman integral approach. 1.2 1 Pj01
0.8
Pj11 0.6
Pj21 Pj02
0.4
Pj12 0.2
Pj22
-4.00 -3.71 -3.42 -3.13 -2.84 -2.55 -2.26 -1.97 -1.68 -1.39 -1.10 -0.81 -0.52 -0.23 0.06 0.35 0.64 0.93 1.22 1.51 1.80 2.09 2.38 2.67 2.96 3.25 3.54 3.83
0
Figure 5. Characteristic Response Function Curve of item M022232 The response data as result of data generation were analyzed using PARSCALE, to estimate the value of its likelihood, both on the compact models (G (C)) and the augmented 20
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
model (G (A)). The results of calculation of DIF index, G (C) and G (A), and significance test results of the DIF loading are presented in Table 1. Table 1. The Result of DIF Index, G(C ), G(A) Estimation and Summary of DIF Significant test DIF Index Chi-square (df=3, G(C )Item G(C ) G(A) G(A) =5%) Conclution significantly load 64611.72 1 1.01057 64459.92 151.806 7.815 DIF significantly load 64611.72 2 0.567007 64544.95 66.773 7.815 DIF significantly load 64611.72 3 1.095973 64579.61 32.117 7.815 DIF significantly load 64611.72 4 0.922476 64603.26 8.464 7.815 DIF significantly load 64611.72 5 0.860822 64510.79 100.932 7.815 DIF Not significantly 64611.72 6 1.179005 64606.01 5.709 7.815 load DIF significantly load 64611.72 7 1.135855 64582.62 29.104 7.815 DIF significantly load 64611.72 8 0.845997 64556.88 54.839 7.815 DIF significantly load 64611.72 9 0.599182 64601.29 10.435 7.815 DIF significantly load 64611.72 10 0.668134 64602.2 9.524 7.815 DIF significantly load 64611.72 11 0.882603 63615.89 995.835 7.815 DIF significantly load 64611.72 12 0.655143 64597.64 14.078 7.815 DIF significantly load 64611.72 13 1.668576 64598.79 12.931 7.815 DIF significantly load 64611.72 14 1.178902 64598.88 12.846 7.815 DIF significantly load 64611.72 15 1.040604 64589.5 22.221 7.815 DIF significantly load 64611.72 16 1.437656 64561.49 50.237 7.815 DIF significantly load 64611.72 17 1.373445 64585.77 25.952 7.815 DIF significantly load 64611.72 18 0.57608 64592.93 18.792 7.815 DIF significantly load 64611.72 19 0.799731 64354.39 257.328 7.815 DIF
Conclution and Discussion
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
21
The results showed that there were DIF loading in items mathematics constructed response TIMSS 2007 with parameter Indonesia as parameter of focal group and the international parameter as a reference parameter. The there are 18 of 19 items load DIF statistically significant with significance in 5 % level, using the data generated by the politomus items‟ parameters and the distribution abilities of students from Indonesia and the TIMSS 2007. Looking at the results of this study, the difficulty parameters of the constructed response items in Indonesia are higher than the international parameters. This needs to be a concern for educators, to vary the use of various forms of test to held the evaluation of education. To identify the DIF loading, there are various methods that can be done. In this research, it is using a area to find out the index of DIF and the likelihood ratio test to test its significance. Therefore, it is necessary to identify and test using other methods, then compared. The results of the comparison can be used to determine the most effective methods of detecting item bias. Reference Anonim. (tth). The Trends in International Mathematics and Science Study (TIMSS). nces.ed.gov/timss/. Camilli, G. & Shepard, L.A. (1994). Methods for identifying biased test items, Vol.4. London: Sage Publications, Inc. Du Toit, M. (2003). IRT from SSi: BILOG-MG, MULTILOG, PARSCALE, TESTFACT. Lincolnwood: SSi. Gronlund, N.E. & Linn, R.L. (1990). Measurement and evaluation in teaching (6th ed). New York : Collier Macmillan Publishers Heri Retnawati (2011). Identifying item bias of test using the simple area Index on polytomous data using generalized partial credit modele. Paper presented in International Seminars of Mathematics Education on July 2011 Yogyakarta State University. Muraki, E. (1999). New appoaches to measurement. Dalam Masters, G.N. dan Keeves, J.P.(Eds). Advances in measurement in educational research and assesment. Amsterdam : Pergamon. Thisen, D. et al. (1993). Detection of differential item functioning using the parameters of item respons model. Dalam P.W. Holland & H. Wainer (Ed). Differential Item Functioning. Englewood Clifp, NJ : Lawrence Erlbaum. p.67-86. Van der Linden, W.J., & Hambleton, R.K. (1997). Handbook of modern item response theory. New York: Springer-Verlag.
22
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
NATIONAL EXAMINATION AS AN INTRUMENT OF QUALITY EDUCATION IMPROVEMENT
Analysis of Current condition and Effort for Achieving Better Future Condition Bambang Suryadi Faculty of Psychology, UIN Syarif Hidayatullah Jakarta Email:
[email protected] Abstract Although the National Examination (UN) system has been implemented more than 40 years in Indonesia, however until now the results are not credible. Consequently the UN results cannot be trusted as an indicator for improving the quality of national education. Instead the UN has undermined the educational values or character. Cheating in the UN is clear evidence that the UN has lowered the dignity of the nation. The purpose of this study is to evaluate the implementation of the UN, and to provide recommendations for improving the quality of UN implementation. This study used mixed method, namely the qualitative approach (study of documents) and quantitative approach. The respondents of this study involving 357 students of SMP / MTs, 322 SMA / MA, and 225 teachers in all 33 provinces in academic year 2010/2011. The study results show that in the juridical perspective, UN has a strong legal protection and the implementation of the UN is mandated by law. But there is still a misunderstanding of the legislation. Empirically, UN has an impact on students and teachers. The majority of student respondents (82%) stated that the UN can improve the spirit of learning. But no doubt the UN has an impact on the students' anxiety with the percentage 63%. As for teachers, more than half (59%) stated that the UN can improve their teaching motivation. The findings also indicate a total of 48% from respondents from SMP / MTs (48%) and 47% from respondents from SMK offered the answer key to all the subjects tested in the examination. As for the SMA / MA, 55% of respondents offered the key answers of the subjects tested in the UN In an effort to improve the implementation of UN and to make it more objective, credible, and accountable, this study recommended that it is necessary to review the existing UN policies on four aspects, namely the UN organizers, methods, management, and technology. Key words: Education, the National Examination, motivation, management, assessment, evaluation. Pendahuluan Dalam proses pembelajaran di sekolah/madrasah, penilaian adalah sesuatu yang lazim dan dilakukan untuk mengukur pencapaian kompetensi peserta didik sebagai hasil belajar yang telah ditetapkan dalam kurikulum. Oleh karena itu, penilaian tersebut harus dikaitkan sebagai salah satu upaya peningkatan mutu pendidikan dan guru wajib melakukan penilaian selama dan setelah proses pembelajaran berdasarkan pada suatu kompetensi dasar atau standar kompetensi. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
23
Ujian Nasional (UN) diselenggarakan dengan tujuan antara lain untuk mengukur pencapaian komptensi lulusan peserta didik secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi serta untuk memetakan tingkat pencapaian hasil belajar siswa pada tingkat sekolah dan daerah. Pemerintah Indonesia telah menyelenggarakan Ujian Nasional (UN) sejak tahun 1945 sampai dengan 1971 dengan sebutan Ujian Negara. Mulai tahun 1972-1982 dirubah menjadi Ujian Sekolah dimana penentu kelulusan dan penyelenggara ujian adalah masing-masing sekolah. Dengan cara seperti ini, rerata kelulusannya adalah 100%. EBTANAS diberlakukan dari 1983-2002 dan sebagai penentu kelulusan adalah sekolah dengan menggunakan formula PQR (P: Nilai Semester Ganjil Tahun Terakhir, Q; Nilai Semester Genap Tahun Terakhir, dan R: Nilai EBTANAS Murni). Dengan formula seperti ini tingkat kelulusan nasional adalah 100% dengan rerata nilai 3.0-7.0. Pada perkembangan berikutnya, EBTANAS dirubah menjadi Ujian Akhir Nasional atau UAN (2002-2004) dengan batas lulus nasional 3.10 pada tahun 2003 dan 4.10 pada tahun 2004. Tingkat kelulusan nasional adalah 100% dengan rerata nilai 4.65. Seiring dengan dibentuknya Badan Standar Nasional Pendidikan (BSNP) pada tahun 2005 sampai sekarang, UAN dirubah menjadi Ujian Nasional (UN) dengan kriteria kelulusan yang selalu dinaikkan dari tahun ke tahun dan BSNP sebagai penyelenggara. Meskipun sudah lebih dari 40 tahun sistem UN diterapkan di Indonesia, namun sampai sekarang masih belum ditemukan manajemen, sistem, teknologi, dan metode ujian yang valid, reliable, dan kredibel. Konsekuensinya hasil UN tidak dapat dipercaya sebagai indikator meningkatnya mutu pendidikan nasional. Sebaliknya UN telah menggerogoti nilainilai kependidikan yang terkait dengan karakter bangsa. Kecurangan dalam UN, baik yang dilakukan oleh murid, guru, kepala sekolah, percetakan, atau oknum lainnya, merupakan bukti nyata bahwa UN telah menurunkan martabat bangsa sebagai bangsa yang berkarakter. Dengan demikian hasil UN belum atau tidak sama sekali mencerminkan mutu pendidikan nasional. Dengan kondisi tersebut di atas, cukup bagi kita untuk mengatakan bahwa sistem penyelenggaraan UN perlu diperbaiki dan ditingkatkan untuk memberikan hasil yang objektif, kredibel, dan akuntabel. Pihak pemerintah, dalam hal ini BSNP, meskipun selalu memperbaiki sistem penyelenggaraan UN dari tahun ke tahun, tetapi di sisi lain, masyarakat belum bisa menerima sistem UN yang ada sekarang ini dengan penuh kepercayaan. Sehingga ada komentar dari masyarakat, apapun yang dilakukan BSNP untuk meningkatkan kualitas penyelenggaraan UN, tetap ada cara untuk melakukan kecurangan. Makalah ini bertujuan untuk memberikan gambaran pelaksanaan UN dengan berbagai masalahnya serta memberikan alternatif solusi pemecahannya. Secara spesifik, tujuan kertas kerja ini untuk menjawab pertanyaan-pertanyaan sebagai berikut: (1) Bagaimana posisi UN dalam perspektif yuridis?, (2) Bagaimana posisi UN dalam perspektif empiris?, dan (3) Apa solusi yang ditawarkan untuk memperbaiki penyelenggaraan UN pada masa mendatang? Untuk mencapai tujuan tersebut, makalah ini disusun dengan menggunakan dua pendekatan, yaitu pendekatan kualitatif (telaah dokumen) dan pendekatan kuantitatif. Responden penelitian ini melibatkan 357 siswa SMP/MTs, 322 siswa SMA/MA, dan 225 guru yang tersebar di 33 provinsi pada pelaksaan UN tahun pelajaran 2010/2011.
24
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
UN Dalam Perspektif Yuridis Secara yuridis, ada tiga perundang-undangan yang dapat dijadikan payung hukum penyelenggaraan UN, yaitu (a) Undang-undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional, (b) Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan, dan (c) Peraturan Menteri Pendidikan Nasional Nomor 20 Tahun 2007 tentang Standar Penilaian Pendidikan. Penjelasan masing-masing perundang-undangan yang relevan dengan UN adalah sebagai berikut. 1. Undang-undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional Dalam Undang-undang Sisdiknas ini ada tiga pasal yang mengatur tentang UN dengan rincian sebagai berikut. Pasal 1 Angka 21: Evaluasi pendidikan Evaluasi pendidikan adalah kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan. Pasal 57 (1) Evaluasi dilakukan dalam rangka pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara pendidikan kepada pihak-pihak yang berkepentingan. (2) Evaluasi dilakukan terhadap peserta didik, lembaga, dan program pendidikan pada jalur formal dan nonformal untuk semua jenjang, satuan, dan jenis pendidikan. Pasal 58 (1) Evaluasi hasil belajar peserta didik dilakukan oleh pendidik untuk memantau proses, kemajuan, dan perbaikan hasil belajar peserta didik secara berkesinambungan. (2) Evaluasi peserta didik, satuan pendidikan, dan program pendidikan dilakukan oleh lembaga mandiri secara berkala, menyeluruh, transparan, dan sistemik untuk menilai pencapaian standar nasional pendidikan. 2. Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan Pasal 66 (1) Penilaian hasil belajar sebagaimana dimaksud dalam Pasal 63 ayat (1) butir c bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan teknologi dan dilakukan dalam bentuk ujian nasional. (2) Ujian nasional dilakukan secara obyektif, berkeadilan, dan akuntabel. (3) Ujian nasional diadakan sekurang-kurangnya satu kali dan sebanyak-banyaknya dua kali dalam satu tahun pelajaran. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
25
Pasal 67 (1) Pemerintah menugaskan BSNP untuk menyelenggarakan ujian nasional yang diikuti peserta didik pada setiap satuan pendidikan jalur formal pendidikan dasar dan menengah dan jalur nonformal kesetaraan. (2) Dalam penyelenggaraan ujian nasional BSNP bekerja sama dengan instansi terkait di lingkungan Pemerintah, Pemerintah Provinsi, Pemerintah Kabupaten/ Kota, dan satuan pendidikan. (3) Ketentuan mengenai ujian nasional diatur lebih lanjut dengan Peraturan Menteri. Pasal 68 Hasil ujian nasional digunakan sebagai salah satu pertimbangan untuk: a. pemetaan mutu program dan/atau satuan pendidikan; b. dasar seleksi masuk jenjang pendidikan berikutnya; c. penentuan kelulusan peserta didik dari program dan/atau satuan pendidikan; d. pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upayanya untuk meningkatkan mutu pendidikan. Pasal 69 (1) Setiap peserta didik jalur formal pendidikan dasar dan menengah dan pendidikan jalur nonformal kesetaraan berhak mengikuti ujian nasional dan berhak mengulanginya sepanjang belum dinyatakan lulus dari satuan pendidikan. (2) Setiap peserta didik sebagaimana dimaksud pada ayat (1) wajib mengikuti satu kali ujian nasional tanpa dipungut biaya. (3) Peserta didik pendidikan informal dapat mengikuti ujian nasional setelah memenuhi syarat yang ditetapkan oleh BSNP. (4) Peserta ujian nasional memperoleh surat keterangan hasil ujian nasional yang diterbitkan oleh satuan pendidikan penyelenggara Ujian Nasional. Pasal 70 (1) Pada jenjang SD/MI/SDLB, atau bentuk lain yang sederajat, Ujian Nasional mencakup mata pelajaran Bahasa Indonesia, Matematika, dan Ilmu Pengetahuan Alam (IPA). (2) Pada program paket A, Ujian Nasional mencakup mata pelajaran Bahasa Indonesia, Matematika, Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS) dan Pendidikan Kewarganegaraan. (3) Pada jenjang SMP/MTs/SMPLB, atau bentuk lain yang sederajat, Ujian Nasional mencakup pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, dan Ilmu Pengetahuan Alam (IPA). 26
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
(4) Pada program paket B, Ujian Nasional mencakup mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS) dan Pendidikan Kewarganegaraan. (5) Pada SMA/MA/SMALB atau bentuk lain yang sederajat, Ujian Nasional mencakup mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, dan mata pelajaran yang menjadi ciri khas program pendidikan. (6) Pada program paket C, Ujian Nasional mencakup mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, dan mata pelajaran yang menjadi ciri khas program pendidikan. (7) Pada jenjang SMK/MAK atau bentuk lain yang sederajat, Ujian Nasional mencakup pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, dan mata pelajaran kejuruan yang menjadi ciri khas program pendidikan. Pasal 71 Kriteria kelulusan ujian nasional dikembangkan oleh BSNP dan ditetapkan dengan Peraturan Menteri. Pasal 72 (1) Peserta didik dinyatakan lulus dari satuan pendidikan pada pendidikan dasar dan menengah setelah: a. menyelesaikan seluruh program pembelajaran; b. memperoleh nilai minimal baik pada penilaian akhir untuk seluruh mata pelajaran kelompok mata pelajaran agama dan akhlak mulia, kelompok mata pelajaran kewarganegaraan dan kepribadian, kelompok mata pelajaran estetika, dan kelompok mata pelajaran jasmani, olah raga, dan kesehatan ; c. lulus ujian sekolah/madrasah untuk kelompok mata pelajaran ilmu pengetahuan dan teknologi; dan d. lulus Ujian Nasional. (2) Kelulusan peserta didik dari satuan pendidikan ditetapkan oleh satuan pendidikan yang bersangkutan sesuai dengan kriteria yang dikembangkan oleh BSNP dan ditetapkan dengan Peraturan Menteri. Pasal 76 (3) Untuk melaksanakan tugas sebagaimana dimaksud pada ayat (1) BSNP berwenang: a. mengembangkan Standar Nasional Pendidikan; b. menyelenggarakan ujian nasional; memberikan rekomendasi kepada Pemerintah dan pemerintah daerah dalam penjaminan dan pengendalian mutu pendidikan. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
27
c. merumuskan kriteria kelulusan dari satuan pendidikan pada jenjang pendidikan dasar dan menengah. 3. Peraturan Menteri Pendidikan Nasional Nomor 20 Tahun 2007 tentang Standar Penilaian Pendidikan Pada bagian G dari peraturan Menteri ini ada sub judul tentang penilaian oleh pemerintah yang mengatur beberapa hal sebagai berikut: 1. Penilaian hasil belajar oleh pemerintah dilakukan dalam bentuk UN yang bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi. 2. UN didukung oleh suatu sistem yang menjamin mutu dan kerahasiaan soal serta pelaksanaan yang aman,jujur, dan adil. 3. Dalam rangka penggunaan hasil UN untuk pemetaan mutu program dan/atau satuan pendidikan, Pemerintah menganalisis dan membuat peta daya serap berdasarkan hasil UN dan menyampaikan ke pihak yang berkepentingan. 4. Hasil UN menjadi salah satu pertimbangan dalam pembinaan dan pemberian bantuan kepada satuanpendidikan dalam upaya meningkatkan mutu pendidikan. 5. Hasil UN digunakan sebagai salah satu pertimbangan dalam menentukan kelulusan peserta didik pada seleksi masuk jenjang pendidikan berikutnya. Hasil Hasil UN digunakan sebagai salah satu penentu kelulusan peserta didik dari satuan pendidikan yang kriteria kelulusannya ditetapkan setiap tahun oleh Menteri berdasarkan rekomendasi BSNP. 6. Hasil UN menjadi salah satu pertimbangan dalam pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya meningkatkan mutu pendidikan. 7. Hasil UN digunakan sebagai salah satu pertimbangan dalam menentukan kelulusan peserta didik pada seleksi masuk jenjang pendidikan berikutnya. 8. Hasil UN digunakan sebagai salah satu penentu kelulusan peserta didik dari satuan pendidikan yang kriteria kelulusannya ditetapkan setiap tahun oleh Menteri berdasarkan rekomendasi BSNP. Dari penjelasan dalam perundang-undangan di atas, dapat dipahami bahwa UN merupakan amanat perundang-undangan yang wajib dilaksanakan oleh pemerintah sebagai upaya untuk mengendalikan mutu lulusan dari satuan pendidikan. BSNP sebagai badan independen dan professional memiliki wewenang menyelenggarakan UN. Secara yuridis, penyelenggaraan UN sangat tepat sebagai instrumen peningkatan mutu pendidikan nasional. Namun selama ini terjadi misinterpretasi terhadap Pasal 72 ayat (1) di atas tentang kelulusan peserta didik dari satuan pendidikan. Empat unsur tersebut dipahami secara independen, padahal semestinya dipahami secara kumulatif. Akibat dari kesalahpahaman ini maka UN dianggap satu-satunya penentu kelulusan peserta didik dari satuan pendidikan. Karena UN dianggap satu-satunya penentu kelulusan, maka pada tahun 2005 telah terjadi gugatan oleh masyarakat (citizen lawsuit) di Pengadilan Negeri Jakarta Pusat, 28
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
yang pada akhirnya dimenangkan oleh pihak penggugat. Oleh karena itu yang harus diperhatikan oleh pemerintah terkait UN adalah kesalahpahaman interpretasi terhadap UU Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional. Amanat undang-undang tersebut jika dikaji secara mendalam, lembaga yang paling bertanggungjawab dalam penyelenggaraan UN adalah BSNP. Namun keberadaan, peran, dan fungsi BSNP saat ini tidak optimal. UN Dalam Perspektif Empiris Berbicara tentang UN dalam perspektif empiris banyak dimensi yang dapat dibahas. Pada bagian ini penulis membahas UN dalam perspektif empiris dari enam dimensi yang esensial, yaitu hasil UN, lembaga penyelenggara, manajemen pengelolaan, metode ujian, dan permasalahan. Masing-masing pembahasan diuraikan dengan memberikan gambaran kondisi yang ada (existing condition) dan kondisi yang diharapkan (expected condition) sebagai berikut. 1. Hasil Ujian Nasional Sebelum mengemukakan hasil UN, perlu dicermati kriteria kelulusan UN dari tahun ke tahun sebagai berikut ini. Tabel 1 Perkembangan Kriteria Kelulusan Ujian Nasional Tahun Pelajaran 2005/2006 2006/2007
2007/2008
2008/2009
2009/2010
Kriteria Kelulusan Rata-rata ≥ 4,50 Setiap nilai matapelajaran ≥ 4,25 Rata-rata ≥ 5,00 Setiap nilai matapelajaran ≥ 4.25, atau Nilai minimal 4,00 pada salah satu pelajaran dan lainnya minimal 6,00. Rata-rata ≥ 5,25 Setiap nilai matapelajaran ≥ 4.25, atau Nilai minimal 4,00 pada salah satu pelajaran dan Lainnya minimal 6,00 Rata-rata ≥ 5,50 Nilai minimal 4,00 pada paling banyak dua pelajaran Dan minimal 4,25 untuk pelajaran lainnya. Rata-rata nilai minimal 5,50 Nilai minimal 4,00 pada paling banyak dua pelajaran dan minimal 4,25 untuk pelajaran lainnya;
2010/2011
Gabungan nilai sekolah/madrasah dan nilai UN Nilai S/M: NS = 0,60 US + 0, 40 Rapor NA = 0,60 UN + 0,40 NS Kriteria kelulusan UN: rata-rata NA minimum 5,50 dan tidak ada nilai di bawah 4,00. Kelulusan dari satuan pendidikan memperhatikan nilai akhlak mulia dan dirapatkan dewan guru. Sumber: Diolah dari POS UN yang ditetapkan oleh BSNP Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
29
Kriteria kelulusan di atas ditetapkan oleh BSNP. Dari data di atas dapat diketahui bahwa ada peningkatan kriteria kelulusan dari tahun ke tahun. Namun pada tahun pelajaran 2010/2011 ditetapkan kriteria kelulusan yang menggabungkan antara nilai sekolah dan nilai UN sebagai hasil kesepakatan antara Komisi X DPR-RI, Menteri Pendidikan Nasional, dan BSNP. Dengan pengertian lain ini merupakan keputusan politis bukan akademis. Formula gabungan ini jika diamati tidak jauh dengan formula PQR dalam EBTANAS (1983-2002). Hal ini menunjukkan telah terjadi kemunduran (set back) dan pertimbangan politik lebih dominan daripada pertimbangan akademik dalam menentukan kebijakan kriteria kelulusan. Padahal penentuan kriteria kelulusan UN semestinya murni pertimbangan akademik. Kriteria kelulusan tersebut masih lebih rendah dibandingkan dengan kriteria kelulusan di Malaysia atau Singapura yang sudah mencapai 7,00. Permasalahannya adalah, apakah meningkatnya kriteria kelulusan tersebut menandakan naiknya mutu pendidikan nasional? Untuk menjawab pertanyaan ini perlu dilakukan analisis hasil UN yang akan dipaparkan pada bagian berikut ini. a. SMP/MTs Tabel berikut menyajikan hasil UN lima tahun terakhir, bila dibandingkan dua tahun terakhir hasil pencapaian UN secara nasional meningkat. Pada tahun pelajaran 2009/2010 misalnya ada kenaikan drastis karena ada UN Ulangan. Jika tidak ada UN Ulangan tingkat kelulusan secara nasional hanya 90,27 persen. Artinya UN Ulangan telah mendongkrak tingkat kelulusan UN secara nasional. Tabel 2: Hasil UN SMP/MTs untuk tahun 2007/2008 s/d 2009/2010 Tahun
% lulus
BIN
ING
MAT
IPA
TOTAL
2005/2006
92,10
7,46
6,62
7,13
-
21,21
2006/2007
94,34
7,39
6,72
6,96
-
21,07
2007/2008
92,76
6,96
6,81
6,69
7,00
27,46
2008/2009
95,08
7,35
7,15
7,59
7,30
29,30
2009/2010
99,42
7,39
6,98
7,31
7,16
28,84
Sumber: Laporan BSNP Tahun 2008, 2009, dan 2010 2. SMA/MA Sama halnya dengan hasil UN SMP, hasil UN SMA/MA juga mengalami kenaikan dari tahun ke tahun. Namun yang menjadi pertanyaan adalah apakah kenaikan nilai UN benar-benar menjadi indikator naiknya mutu pendidikan nasional. Analisis hasil UN berikut ini akan memberikan jawaban terhadap pertanyaan tersebut. Rata-rata nilai mata pelajaran UN SMA/MA untuk tahun pelajaran 2007/2008 sampai dengan 2009/2010 untuk program IPA sebagai berikut.
30
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Tabel 4: Rata-rata hasil UN SMA/MA untuk tahun pelajaran 2007/2008 sampai dengan 2009/2010 untuk program IPA Thn Pelajaran
BIN
ING
MAT
FIS
KIM
BIO
TOTAL
2007/2008
7,6
7,32
7,48
6,91
7,76
7,8
44,87
2008/2009
6,82
7,81
7,76
7,97
8,34
7,2
45,90
2009/2010
7,39
7,63
8,05
7,84
8,05
7,31
46,27
Sumber: Laporan BSNP Tahun 2008, 2009, dan 2010 Tabel 5: Rata-rata nilai matapelajaran UN SMA/MA untuk tahun pelajaran 2007/2008 sampai dengan 2009/2010 untuk program IPS Thn Pelajaran
BIN
ING
MAT
EKO
SOS
GEO
TOTAL
2007/2008
6,95
6,74
7,09
7,67
7,6
6,46
42,51
2008/2009
6,31
7,25
7,7
7,36
6,81
6,88
42,31
2009/2010
6,82
7,06
7,89
6,93
6,54
6,82
42,06
Sumber: Laporan BSNP Tahun 2008, 2009, dan 2010 Tabel 6: Rata-rata nilai matapelajaran UN SMA/MA untuk tahun pelajaran 2007/2008 sampai dengan 2009/2010 untuk program Bahasa SMA/MA Bhs
BIN
ING
MAT
SAS
ANTR
B.ASING TOTAL
2007/2008
6,56
6,71
6,88
6,95
7,45
7,59
42,14
2008/2009
6,78
7,16
6,77
6,73
5,83
7,91
41,18
2009/2010
5,76
6,83
6,94
6,72
6,18
7,84
40,27
Sumber: Laporan BSNP Tahun 2008, 2009, dan 2010 3. SMK Tabel berikut menyajikan nilai rata-rata siswa SMK tahun pelajaran 2007/2008 sampai dengan 2009/2010 per mata pelajaran.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
31
Tabel 10: Nilai hasil UN SMK tahun pelajaran 2007/2008 sampai dengan 2009/2010 per mata pelajaran Thn Pelajaran
BIN
ING
MAT
2007/2008
6,87
6,92
2008/2009
6,73
2009/2010
6,41
Teori
Produktif
TOTAL
6,63
7,97
28,39
7,4
7,47
8,36
29,96
6,59
7,26
8,49
35,17
6,42
Sumber: Laporan BSNP Tahun 2008, 2009, dan 2010 2. Permasalahan Ujian Nasional Pelaksanaan UN setiap tahun selalu menimbulkan kontroversi, gugatan secara hukum, terjadi ketidakadilan dan dampak psikologis siswa, serta kecurangan pelaksanaan yang menurunkan kredibilitas UN tersebut. Yang menyedihkan lagi kasus contek massal terjadi hampir di seluruh wilayah Indonesia. Menurut Rully Chairul Azwar (2010), Wakil Ketua Komisi X DPR RI (Ketua Panja UN) ada lima titik lemah UN sebagai berikut. 1. Standar mutu pendidikan belum sama antar satuan pendidikan, antar daerah dan antar wilayah, khususnya di luar perkotaan, di daerah tertinggal, dan perbatasan. Akibatnya ada kendala a) ruang kelas, b) sarana dan prasarana pendidikan serta, c) guru. Karenanya, tidak adil dilakukan UN pada kondisi belum seragamnya mutu pendidikan. 2. APBN Pendidikan 20% belum mampu mengatasi pembiayaan perbaikan mutu standar Satuan Pendidikan, karena Postur Anggaran Pendidikan tidak dikelola dengan tepat. 3. Penyelenggaraan UN yang serentak dalam jumlah yang besar dan tersebar di seluruh tanah air dengan geografis kepulauan dan pedalaman sangat berpengaruh pada faktor a) teknis penyelenggaraan serentak (pencetakan, pendistribusian soal), b) pengawasan terhadap kebocoran dan kecurangan, c) pengawasan terhadap mutu UN yg seragam, sehingga akan berpengaruh pada kredibilitas standar UN dan mutu pendidikan Nasional 4. Penentuan materi yang diuji yang tidak meliputi semua mata pelajaran serta model pembuatan soal dalam UN kebanyakan masih berupa soal multiple choice berpengaruh terhadap mutu pendidikan karena a) konsentrasi siswa pada semester terakhir hanya atas mata pelajaran yang diujikan (lebih memperhatikan Bimbingan Belajar/Bimbel), b) mata pelajaran semester akhir tersebut malah tidak dikuasai, c) menggiring siswa untuk menghafal dan untung-untungan, bukan memahami persoalan. Karenanya, kredibilitas siswa yang lulus UN masih diragukan, khususnya bagi kalangan perguruan tinggi. 5. Meski secara formal tidak ditetapkan sebagai satu-satunya syarat kelulusan bagi siswa, namun ketidaklulusan siswa dalam UN memiliki dampak signifikan terhadap kesempatan siswa melanjutkan ke jenjang pendidikan berikutnya. Hal ini membawa implikasi adanya dampak psikologis bagi siswa setiap akan menghadapi UN maupun siswa yang tidak lulus UN. Secara dejure BSNP telah menyusun Proses Operasional Standar (POS) UN sebagai acuran dalam penyelenggaraan UN, namun secara defacto kondisi di lapangan jauh dari apa yang diharapkan. Berdasarkan laporan hasil pemantauan oleh pengawas dari perguruan tinggi, 32
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Inspektorat Jenderal Kemdiknas, Puspendik, dan BSNP, telah terjadi penyimpangan POS UN. Diantaranya adalah sebagai berikut: 1. Sumber penyimpangan dan pelanggaran pelaksanaan UN berasal dari (1) Percetakan, (2) Kepala Sekolah, (3) Guru, (4) Pengawas ruang, (5) Murid, dan (6) Pengawas Satuan Pendidikan. (a) Penyimpangan dan pelanggaran percetakan diantaranya naskah soal tertukar, naskah soal kurang, kualitas kertas soal dan LJUN tidak sesuai dengan spesifikasi yang ditentukan, lokasi percetakan kurang kondusif, merubah format soal yang sudah ditetapkan oleh Puspendik. (b) Penyimpan dan dan pelanggaran oleh Kepala Sekolah: memperlakukan Pengawas Satuan Pendidikan dan Pengawas ruang ujian secara berlebihan sehingga tidak melaksanakan tugasnya dengan maksimal, adanya kerjasama antar sekolah untuk membantu siswa dengan membiarkan guru mata pelajaran yang diujikan di lingkungan sekolah. (c) Penyimpangan oleh guru: menjadi tim sukses UN, berada di lingkungan sekolah pada saat mata pelajarannya diujikan, memberikan kunci jawaban kepada siswa, dan merubah lembar jawaban siswa. Khusus dalam UN tahun 2011 banyak sekolah/madrasah -terutama swasta- yang mengatrol nilai rapor dengan membuat rapor baru sebagai dampak dari formula gabungan untuk kriteria kelulusan. (d) Penyimpangan pengawas ruang ujian: tidak tegas terhadap siswa saat terjadi indikasi kecurangan, ada kerjasama antar sekolah meskipun pengawas sudah dilakukan secara silang. (e) Penyimpangan dilakukan murid atau peserta UN diantaranya membawa handphone ke dalam ruang ujian, berdiskusi sesama kawan di ruang ujian, membaca contekan dan sebagainya. (f) Masalah Pengawas Satuan Pendidikan: hanya berada di ruang kepala sekolah, tidak melihat situasi sekolah. Tidak menegur pengawas ruang ujian, tidak menguasai POS UN. Tidak semua sekolah ada pengawas. Pengawas tidak boleh mengawal LJUN ke rayon. Pengawas tidak berani menyampaikan laporan apa adanya. 2. Terjadinya politisasi UN dan kepentingan berbagai pihak. Bagi Kepala Daerah Provinsi dan Kabupaten/Kota, hasil UN dapat dijadikan indikator keberhasilan dan kemajuan pendidikan di wilayahnya. Yang terjadi adalah adanya tekanan yang bersifat struktural. Kepala daerah memberikan target tertentu kepada Kepala Dinas Pendidikan. Selanjutnya Kepala Dinas Pendidikan memberikan target kepada Kepala Sekolah/Madrasah yang diteruskan kepada guru-guru. Jika target tidak terpenuhi, mutasi atau alih fungsi dari jabatan yang ada bisa dipastikan terjadi. Akibatnya para kepala sekolah/madrasah dan guru-guru berada di bawah tekanan. Maka muncullah tim sukses dengan berbagai modus. Hasil Exit Polling yang dilakukan Puspendik (2011) menunjukkan adanya penawaran kunci jawaban soal UN oleh pihak-pihak tertentu. Hasil polling menunjukkan bahwa 12% Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
33
responden siswa SMP/MTs, 14% responden siswa SMA/Ma, dan 6% responden siswa SMK menyatakan bahwa mereka ditawari kunci jawaban.
Apakah Siswa Ditawari Kunci Jawaban Soal UN? 88%
94%
86%
100% Persentase
80% 60% 14%
12%
40%
6%
20% 0% SMP/MTS
YA 12%
TIDAK 88%
SMA/MA
14%
86%
SMK
6%
94%
Sebagian besar responden SMP/MTs (48%) dan SMK (47%) ditawari kunci jawaban untuk semua mata pelajaran yang di ujikan dalam UN. Sedangkan untuk responden SMA/MA sebagian besar (55%) ditawari kunci jawaban satu mata pelajaran yang diujikan dalam UN (Gambar 1).
Jumlah Kunci Jawaban UN Yang Ditawarkan Kepada Siswa 100%
Persentase
80% 60%
55%
48%
47% 31%
40% 20%
32%
29% 21%
25%
13%
0% SMP/MTS
Semua 48%
Satu Pelajaran 31%
Beberapa 21%
SMA/MA
13%
55%
32%
SMK
47%
29%
25%
Gambar 1. Jumlah Kunci Jawaban Soal UN Yang Ditawarkan Kepada Siswa
Kunci jawaban soal UN ditawarkan kepada siswa terbanyak dilakukan oleh teman siswa itu sendiri (di atas 40%), dan pihak lain (41% - 51%). Responden siswa SMP/MTs (8%), SMA/MA (4%), dan SMK (1%) juga menyatakan bahwa tawaran kunci jawaban soal UN juga dilakukan oleh pihak Bimbingan Belajar. Bahkan sebanyak 7% responden siswa SMP/MTs, 3% responden siswa SMA/MA, dan 4% responden siswa SMK menyatakan bahwa penawaran kunci jawaban soal UN juga dilakukan oleh guru. Hasil polling selengkapnya tampak pada Gambar 2.
34
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Siapa Yang Menawarkan Kunci Soal UN? 100% Persentase
80% 51% 60%
44%
51%
42%
41%
44%
40% 20%
7%
3%
4%
8%
4%
1%
0% SMP/MTS
Guru 7%
Teman 44%
Bimbel 8%
Lain2 41%
SMA/MA
3%
42%
4%
51%
SMK
4%
51%
1%
44%
Gambar 2. Pihak yang Menawarkan Kunci Jawaban Soal UN
Penyimpangan POS UN tersebut diatas secara empiris membuktikan bahwa dalam penyelenggaraan UN masih tidak JUJUR. Akibatnya hasil UN tidak kredibel dan telah terjadi pemborosan dana, pikiran, energi, dan waktu. Menyadari bahwa penyelenggaraan UN masih sarat dengan permasalahan, maka BSNP melakukan monitoring atau pemantauan di provinsi. Hasil monitoring tersebut dapat dipaparkan sebagai berikut.
Tabel 11 Persiapan Siswa SMA/MA Menghadapi UN N = 481 No.
PERSIAPAN
1
Mengikuti pelajaran tambahan di sekolah/madrasah
2
Mengikuti bimbingan belajar
3
Membeli buku pelajaran yang diUNkan
4
Menambah jam belajar
JUMLAH 443 92% 373 78% 438 91% 449 93%
Data di atas menunjukkan bahwa para siswa SMA/MA melakukan berbagai persiapan untuk menghadi UN. Sebanyak 92% responden mengikuti pelajaran tambahan dai sekolah/madrasah, 91% membeli buku pelajaran yang di-UN-kan, dan 93% menambah jam belajar. Yang mengherangkan ternyata masih ada 78% siswa yang mengikuti bimbingan belajar. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
35
Table 12 Dampak UN Terhadap Siswa Dan Guru SMA/MA NO.
DAMPAK
1.
Semangat Belajar
2.
Kecemasan
3.
Semangat mengajar guru
1 4 1% 16 5% 0 0%
SKALA 2 3 38 156 10% 45% 81 114 25% 33% 19 70 5% 20%
4 124 37% 109 30% 136 39%
UN memiliki dampak terhadap siswa dan guru. Mayoritas responden (82%) menyatakan UN dapat meningkatkan semangat belajar. Namun tidak dipungkiri UN juga memberikan dampak kecemasan kepada siswa dengan persentase 63%. Sedangkan bagi guru, lebih dari separuh (59%) menyatakan UN dapat meningkatkan semangat mengajar guru. Tabel 13 Persiapan Siswa SMP/MTs Dalam Menghadapi UN N = 357 NO
PERSIAPAN
JUMLAH 353 1 Mengikuti pelajaran tambahan di sekolah/madrasah 99% 293 2 Mengikuti bimbingan belajar 82% 304 3 Membeli buku pelajaran yang diUNkan 85% 334 4 Menambah jam belajar 94% Responden dari siswa SMP/MTs juga melakukan persiapan UN dengan berbagai cara, yaitu mengikuti pelajaran tambahan di sekolah/madrtaah (99%), mengikuti bimbingan belajar (82%), membeli buku pelajaran yang di-UN-kan (85%), dan menambah jam belajar (94%). Tabel 14 Dampak UN Terhadap Siswa Dan Guru NO.
DAMPAK
1.
Semangat Belajar
2.
Kecemasan
3.
Semangat mengajar guru
1 2 1% 17 5% 0 0%
SKALA 2 3 9 116 3% 32% 140 127 39% 36% 8 71 2% 20%
4 198 55% 52 15% 173 48%
UN memiliki dampak terhadap siswa dan guru. Menurut siswa SMP/MTs, UN dapat meningkatkan semangat belajar sebagaimana dinyatakan oleh 87% responden. Namun di sisi lain UN juga menimbulkan kecemasan dengan persentase 51%. Sedangkan bagi guru-buru 36
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
SMP/MTs, dengan adanya UN semangat mereka dalam mengajar meningkat, sebagaimana diungkapkan oleh 68% dari responden. Pemikiran Untuk Perbaikan Penyelenggraan UN Di Masa Mendatang Pada bagian ini penulis ingin memberikan sumbangan pemikiran untuk perbaikan penyelenggaraan UN di masa mendatang ditinjau dari empat aspek yaitu lembaga penyelenggaran, metode ujian, manajemen, dan teknologi dengan penjelasan sebagai berikut. 1. Lembaga penyelenggara Sesuai dengan ketetapan dalam Pasal 76 PP Nomor 19/2005, sebagaimana disebutkan di atas, lembaga penyelenggara UN adalah BSNP. BSNP dibentuk dengan Surat Keputusan Menteri Pendidikan Nasional untuk pertama kali pada bulan Mei 2005 dengan masa jabatan empat tahun. Sesuai dengan PP 19 tahun2005, keanggotaan BSNP berjumlah gasal, sedikitnya 11 (sebelas) orang dan sebanyak-banyaknya berjumlah 15 (lima belas) orang. Keanggotaan BSNP terdiri atas berbagai pakar bidang keilmuan, yang antara lain, para ahli di bidang psikometri, evaluasi pendidikan, kurikulum, manajemen pendidikan, dan bidang lainnya yang relevan serta memiliki wawasan, pengalaman, dan komitmen untuk peningkatan mutu pendidikan. BSNP bertugas membantu Menteri dalam mengembangkan, memantau dan mengendalikan standar nasional pendidikan. Untuk melaksanakan tugas tersebut, BSNP memiliki wewenang untuk (a) mengembangkan standar nasional pendidikan, (b) menyelenggarakan ujian nasional, (c) memberikan rekomendasi kepada pemerintah dan pemerintah daerah dalam penjaminan dan pengendalian mutu pendidikan, (d) merumuskan kriteria kelulusan dari satuan pendidikan pada jenjang pendidikan dasar dan menengah, dan (e) menilai kelayakan isi, kelayakan penyajian, kelayakan bahasa, dan kelayakan kegrafikaan buku teks pelajaran. Menarik untuk diungkapkan disini bahwa BSNP dengan anggota 15 orang tersebut tidak mungkin mampu untuk melaksanakan tugas dan wewenang yang diemban. Oleh karena itu BSNP dapat membentuk tim ahli yang bersifat adhoc. Dalam menjalankan tugasnya, BSNP didukung dan berkoordinasi dengan Kementerian yang bertanggungjawab di bidang pendidikan dan Kementerian yang menangani urusan pemerintahan di bidang agama,serta dinas yang menangani pendidikan di provinsi/kabupaten/kota. Dalam penyelenggaraan UN, BSNP bekerjasama dengan Pusak Penilaian Pendidikan (Puspendik) Kementerian Pendidikan dan Kebudayaan, terutama dalam penyiapan soal ujian. Hal ini karena BSNP tidak memiliki tenaga ahli yang membuat soal ujian. Peran BSNP dalam penyiapan soal adalah untuk mengontrol mutu soal ujian. Secara legal formal BSNP memang sebagai penyelenggara UN, namun secara sumber daya (resources) baik biaya dan tenaga, BSNP tidak memilikinya sehingga semua tergantung pada institusi lain di luar BSNP. Hal-hal semacam inilah yang akan membebani seluruh anggota BSNP pada tahun-tahun yang akan datang, bila UN masih diselenggarakan oleh BSNP yang hanya 15 orang. Hal lain adalah pusaran politik yang melingkupi UN seperti tarik ulur eksekutif dengan legislatif dalam hal kebijakan dan pembiayaan. Ini semua sangat melelahkan dan banyak makan waktu serta tenaga dan pikiran. Menurut pengamatan penulis, waktu yang dimiliki anggota BSNP lebih banyak dipakai untuk membicarakan penyelenggaraan UN dibanding dengan pengembangan standar pendidikan Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
37
nasional. Padahal jika dicermati amanat Undang-Undang Sisdiknas Pasal 35, sangat jelas bahwa BSNP adalah lembaga yang paling bertanggungjawab dalam mengembangkan standar nasional pendidikan. Hal ini bisa terjadi karena untuk pengembangan standar BSNP memiliki wewenang untuk memberntuk tim ahli yang bersifat adhoc. Tim ahli inilah yang sebenarnya bekerja keras untuk menghasilkan standar dan peran BSNP lebih bersifat memberikan arahan dan petunjuk serta pengesahan di akhir kegiatan. Dengan keterbatasan anggota, jika BSNP masih menjadi pelaksana UN, maka di satu sisi permasalahan UN tidak akan selesai dan di sisi lain pengembangan dan monitoring standar nasional pendidikan juga tidak akan optimal karena tenaga, pikiran, dan energi yang ada tersedot untuk UN. Mengingat keterbatasan tenaga yang menangani UN, peran BSNP ke depan lebih tepat sebagai examination council bukan sebagai pelaksana. Sebagai examination council wewenang BSNP dalam UN bukan sebagai pelaksana seperti sekarang ini tetapi terbatas pada penentuan standar kelulusan dan mutu soal. Dengan demikian tenaga, pikiran, dan waktu anggota BSNP tidak terkuras untuk UN saja tapi untuk pendidikan nasional secara menyeluruh atau komprehensif. Peran kedua ini jauh lebih strategis daripada peran pertama (penyelenggaraan UN). Untuk perbaikan UN ke depan penyelenggaraan UN sebaiknya diserahkan kepada lembaga independen tetapi tetap di bawah kendali Menteri sebagaimana yang ada di Malaysia (Malaysian Examination Council) atau Hong Kong (Hong Kong Examination and Assessment Authority). Independensi disini diartikan bahwa lembaga tersebut tetap independen terhadap pihak yang berkepentingan dengan ujian, misalnya dinas pendidikan provinsi, kabupaten/kota, direktorat pembinaan SMP,SMA, dan SMK atau yang sederajat. Dengan pengertian lain independen dari segi profesi, tetapi tidak independen dari segi organisasi. 2. Metode Ujian UN saat ini dilaksanakan untuk seluruh siswa kelas akhir (SD,SMP/MTs, SMA/MA, SMK, SMALB, dan SMPLB). Selama ini metode skoring dilakukan dengan rentang nilai 1 sampai dengan 10 untuk semua mata pelajaran yang diujikan dengan jumlah soal 40 atau 50 item. Metode seperti ini sama dengan cara penulisan rapor hasil belajar yang memiliki asosiasi 10 proporsi. Jika ada murid mendapat jawaban benar sebanyak 20 dari 40 soal, maka nilainya adalah 20/40x10 sama dengan 5. Artinya metode skoring yang ada tidak memperhatikan tingkat kesulitan soal karena hanya mempertimbangkan jumlah item yang benar. Semestinya skoring dilakukan dengan membedakan item yang mudah, sedang, dan sulit. Jawaban yang benar untuk item yang sulit harus diberi bobot yang lebih tinggi daripada jawaban yang benar untuk item yang mudah. Metode penilaian yang diterapkan sekarang ini memiliki dua kekurangan. Pertama nilai yang ada tidak komparabel (comparable) antara paket satu dengan paket yang lain, antar sekolah/madrasah, antar kabupaten/kota bahkan antar provinsi. Kedua, nilai tersebut juga tidak komparabel antar tahun ke tahun. Sulit untuk membandingkan kelulusan tahun 2011 misalnya dengan kelulusan tahun-tahun sebelumnya. Seorang murid yang memiliki rata-rata nilai 7 untuk semua mata pelajaran yang diujikan pada tahun 2011, belum tentu memiliki kompetensi yang sama dengan murid yang memperoleh rata-rata nilai yang sama pada tahuntahun sebelumnya. Hal ini bisa terjadi karena nilai tersebut tidak komparabel. Jika nilai yang 38
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
ada tidak komparabel, maka hasil analisis yang ada tidak dapat dijadikan acuan dalam membuat kebijakan. Untuk ke depan semestinya rentang skor nilai dibuat dari 1 sampai dengan 100 atau 1 sampai dengan 500. Untuk melakukan metode seperti ini diperlukan konversi nilai. Sistem konversi nilai ini ditetapkan oleh BSNP dan tidak harus diketahui oleh semua pihak, tetapi hasilnya dapat dipercaya dan menggambarkan kemampuan peserta ujian. Hal ini telah dilakukan dalam metode ujian TEOFL. Skor yang diperoleh oleh peserta ujian TOEFL benar-benar menggambarkan kompetensi yang dimiliki dan dapat diterima secara internasional. 3. Manajemen Bagian manajemen yang sangat penting adalah masalah anggaran pembiayaan ujian. Selama ini ujian dibiayai oleh negara melalui APBN. Unit cost untuk setiap peserta adalah Rp. 50.000. Sebagai ilustrasi jumlah peserta UN tahun pelajaran 2010/2011 sebanyak 10.660.312 peserta dari 234.342 sekolah/madrasah untuk seluruh jenjang dengan perincian sebagai berikut. Tabel 18 Peserta Ujian Nasional Tahun Pelajaran 2010/2011 No 1 2 3
Jenjang Jumlah Sekolah/Madrasah Jumlah Peserta SMA/MA, SMK dan SMALB 25.656 2.488.757 SMP/MTs dan SMPLB 47.369 3.768.722 SD/MI dan SDLB 161.317 4.402.839 Total 234.342 10.660.312
Dengan jumlah tersebut jika unit cost setiap siswa adalah Rp. 50.000 maka total biaya UN tahun 2010/2011 adalah Rp. 533.015.600.000. Biaya ini dimanfaatkan untuk keperluan administrasi, pencetakan bahan ujian, distribusi, monitoring, pengawasan, dan pelaporan. Penganggaran UN melalui APBN cenderung kepada pelaksanaan yang bersifat proyek. Akibatnya penentuan percetakan bahan ujian harus melalui tender yang nota bene proses tender juga banyak yang bermasalah. Lebih parah lagi dengan sistem penganggaran UN melalui APBN, penyelenggara UN menjadi bersifat struktural, mulai dari penyelenggara tingkat pusat sampai ke tingkat provinsi, kabupaten/kota dan satuan pendidikan. Kondisi kerja seperti ini tidak kondusif karena hanya bagi-bagi tugas dan wewenang yang pada akhirnya berimplikasi pada alokasi keuangan. Karena biaya ujian masih disubsidi oleh pemerintah, maka pemerintah menanggung biaya untuk semua peserta ujian. Sangat tidak adil jika murid yang mampu disamakan dengan murid yang tidak mampu dengan diberikannya subsidi dari pemerintah. Akibatnya pemerintah mengeluarkan biaya yang sangat besar sementara hasilnya masih dipertanyakan karena tidak obyektif dan kredibel. Untuk perbaikan ke depan, semestinya pemerintah tidak perlu memberi subsidi kepada semua peserta ujian. Biaya ujian ditanggung oleh masing-masing peserta. Jika ada peserta yang tidak mampu, pemerintah wajib memberikan subsidi. Jika unit cost per peserta Rp. 50.000, penulis rasa biaya tersebut tidak memberatkan peserta ujian. Fakta yang ada murid-murid sekarang masih mampu membeli pulsa Rp. 50.000 setiap bulan. Manfaat yang dapat Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
39
dirasakan dengan cara seperti ini pemerintah dapat melakukan efisiensi dana yang luar biasa dan dana tersebut dapat dipergunakan untuk peningkatan mutu guru, sarana dan prasarana pendidikan, serta beasiswa pendidikan pada jenjang yang lebih tinggi. Selain itu, secara psikologis karena peserta ujian membiayai dirinya sendiri, dapat dipastikan mereka akan lebih sungguh-sungguh dalam belajar untuk dapat lulus UN. 4. Teknologi Saat ini UN diselenggarakan secara manual dengan bentuk pencil test. Dengan cara ini, seluruh peserta ujian mengikuti ujian pada hari dan waktu yang telah ditetapkan untuk materi ujian yang diujikan. Dengan kondisi geografis Indonesia yang sangat luas, dari Sabang sampai Merauke dengan perbedaan waktu sampai dua jam antara Indonesia bagian timur dan bagian barat, maka cara seperti ini sangat memberi peluang terjadinya kebocoran soal. Apalagi dengan kecanggihan alat telekomunikasi seperti sekarang ini, informasi dapat dikirimkan dalam waktu yang sangat cepat. Tidak mustahil seorang peserta UN di wilayah timur dapat memberikan informasi kepada rekan atau kerabatnya di wilayah barat tentang soal yang diujikan. BSNP telah mengantisipasi masalah tersebut di atas dengan menggunakan sistem paket. Sejak tahun 2011 di setiap kelas diberlakukan lima paket yang berbeda. Sebelum itu hanya dua paket saja untuk setiap ruang ujian. Namun jumlah paket ini tidak menutup peluang untuk melakukan kecurangan dengan memberikan kunci jawaban lewat SMS. Ketika masih ada dua paket soal ujian, kunci jawaban cukup diberikan kode paket, nomor soal dan jawabannya. Namun ketika jumlah paket menjadi lima, kunci jawaban dilengkapi dengan kata-kata awal dari setiap soal sebagai clue soal. Jika cara konvensional seperti ini masih dipertahankan, maka sampai kapanpun kecurangan dalam UN tidak dapat dihindari. Karena itu untuk perbaikan ke depan diperlukan sebuah teknologi khusus. Teknologi dimaksud adalah teknologi yang mengarah kepada teknologi yang efektif, efisien, dan ekonomis. Salah satu teknologi yang dapat diterapkan adalah Computerized Adaptive Testing (CAT). CAT adalah suatu bentuk tes berbasis komputer yang menyesuaikan dengan tingkat kemampuan peserta ujian itu. CAT juga disebut pengujian disesuaikan. Metode yang dipakai dalam proses CAT adalah menggunakan Model Item Response Theory (IRT). CAT memiliki beberapa kelebihan. Dalam CAT, peserta ujian menerima soal yang berbeda namun memiliki tingkat kesulitan yang sama sehingga hasilnya bersifat komparabel. Dengan teknologi CAT peserta ujian mengerjakan ujian tidak pada hari dan jam yang sama. Artinya mereka bisa mengikuti ujian pada hari dan jam yang berbeda sesuai dengan kesiapan masingmasing peserta. Untuk mengikuti ujian siswa cukup duduk di depan komputer yang sudah tersambung dengan internet. Kemudian mengakses situs tertentu yang telah ditetapkan dan mengikuti petunjuk yang disediakan, misalnya cara mengisi biodata, memilih paket soal, dan menjawab soal ujian. Skor tes juga dapat langsung diperoleh. Dengan menerapkan model CAT tersebut akan terjadi efisiensi waktu bagi peserta ujian dan penyelenggaran ujian. Yang lebih penting lagi, dengan cara seperti ini, kecurangan atau kebocoran soal dapat ditekan serendah-rendahnya sampai pada zero level. Untuk menerapkan sistem CAT ada kondisi tertentu yang perlu dipenuhi. Diantaranya adalah adanya komputer dan infrastruktur jaringan yang memadai (sekolah atau peserta didik) serta ketersediaan bank soal yang banyak, variatif, dan bagus karena sudah terkalibrasi. Sehingga didapatkan jumlah item, isi, dan tingkat kesulitan soal yang berbeda untuk setiap peserta ujian. 40
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Selain kelebihan tersebut, tidak dipungkiri CAT memiliki beberapa kelemahan. Diantaranya adalah biaya persiapan (pengadaan infrastruktur) yang relatif lebih mahal dan terbatas pada peserta yang sudah familiar dengan komputer. Selain itu adalah masalah kalibrasi dari item soal. Untuk melakukan kalibrasi dan dalam rangka untuk mendapatkan item soal yang bagus, semua item tes harus diujicobakan kepada sampel yang cukup besar dan kemudian dianalisa. Untuk melakukan hal ini tentu diperlukan anggaran atau biaya yang tinggi. Artinya, pemerintah perlu melakukan investasi untuk menkondisikan kejujuran kepada peserta didik dan meningkatkan kredibilitas hasil UN. Kesimpulan dan Rekomendasi Berdasarkan uraian di atas dapat ditarik kesimpulan dan rekomendasi sebagai berikut: 1. Secara yuridis penyelenggaraan UN memiliki payung hukum yang kuat dan penyelenggaraan UN merupakan amanat undang-undang. Namun masih terdapat kesalahpahaman terhadap interpresasi Undang-Undang Nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional yang berakibat pada munculnya dikotomi terhadap UN, yaitu sikap pro dan kontra. Untuk itu diperlukan kajian secara mendasar dan komprehensif terhadap Peraturan Pemerintah Nomor 19 tahun 2005 tentang Standar Nasional Pendidikan dan UndangUndang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional. Berdasarkan hasil kajian tersebut dapat dilakukan revisi perundang-udangan. Hal ini tentu memerlukan waktu yang lama dan biaya yang tinggi. Namun ini perlu segera dilakukan supaya kebijakan tentang UN menjadi kebijakan yang „bijak‟ dan populer sehingga mendapat dukungan penuh dari masyarakat. 2. Secara empiris, pemerintah telah melakukan berbagai upaya untuk meningkatkan mutu penyelenggaraan UN. Namun penyelenggaraan UN masih sarat dengan muatan politis dan kecurangan dengan modus yang variatif. Akibatnya hasil UN belum dapat menggambarkan secara obyektik kondisi dan mutu pendidikan nasional. Sebagai upaya untuk meningkatkan penyelenggaraan UN yang obyektif, kredibel, dan akuntabel diperlukan peninjauan kembali terhadap kebijakan yang ada pada empat aspek, yaitu penyelenggara UN, metode, manajemen, dan teknologi. a. BSNP sebagai penyelenggara UN perlu ditinjau kembali karena keterbatasan sumber daya manusia dan perangkat yang dimiliki. Peran BSNP ke depan lebih tepat sebagai examination council bukan sebagai pelaksana. Sebagai examination council wewenang BSNP dalam UN bukan sebagai pelaksana seperti sekarang ini tetapi terbatas pada penentuan standar kelulusan dan mutu soal. Dengan demikian tenaga, pikiran, dan waktu anggota BSNP tidak terkuras untuk UN saja tapi untuk pendidikan nasional secara menyeluruh atau komprehensif. Peran kedua ini jauh lebih strategis daripada peran pertama (penyelenggaraan UN). Atau BSNP tidak lagi menyelenggarakan UN dan menyerahkan penyelenggaraan UN kepada lembaga independen tetapi tetap di bawah kendali Menteri sebagaimana yang ada di Malaysia (Malaysian Examination Council) atau Hong Kong (Hong Kong Examination and Assessment Authority). Independensi disini diartikan bahwa lembaga tersebut tetap independen terhadap pihak yang berkepentingan dengan ujian, misalnya dinas pendidikan provinsi, kabupaten/kota, direktorat pembinaan SMP,SMA, dan SMK atau yang sederajat. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
41
b. Dari segi metode, rentang skor nilai selama ini dibuat dari 1 sampai 10 perlu dirubah dan dibuat dari 1 sampai dengan 100 atau 1 sampai dengan 500. Untuk melakukan metode seperti ini diperlukan konversi nilai. Sistem konversi nilai ini ditetapkan oleh BSNP. c. Terkait dengan anggaran atau biaya ujian, pemerintah tidak perlu memberi subsidi kepada semua peserta ujian. Biaya ujian ditanggung oleh masing-masing peserta. Khusus peserta yang tidak mampu, pemerintah wajib memberikan subsidi. Selain menciptakan efisiensi anggaran cara seperti ini juga dapat menumbuhkan keseriusan di kalangan peserta ujian karena mereka membiayai dirinya sendiri. d.
Untuk menekan perilaku kecurangan dan kebocoran soal, penyelenggaraan tes secara konvensional (pencil test) perlu dirubah dengan menerapkan Computerized Adaptive Test (CAT). CAT adalah suatu bentuk tes berbasis komputer yang menyesuaikan dengan tingkat kemampuan peserta ujian itu. Metode yang dipakai dalam proses CAT adalah menggunakan Model Item Response Theory (IRT). Dengan teknologi CAT seperti ini hasil UN akan lebih obyektif, akuntabel, kredibel, dan komparabel. Selain itu penyelenggaraan UN juga akan lebih efisien, efektif, dan ekonomis.
e.
Hasil UN yang ada hendaknya dijadikan peta (kewilayahan, mata pelajaran, dan sumberdaya pendidikan) dan pintu masuk perbaikan mutu pendidikan nasional melalui kebijakan di tingkat satuan pendidikan, misalnya dengan meningkatkan kemampuan/kompetensi guru bidang pelajaran, penambahan buku teks pelajaran dan sumber belajar lainnya di perpustakaan, penyediaan laboratorium, penungkatan disiplin kehadiran siswa dan sebagainya
DAFTAR PUSTAKA Azwar, Rully Chairul, 2010, Beberapa Catatan Tentang Ujian Nasional. Makalah disampaikan dalam lokakarya nasional tentang Ujian Nasional di Jakarta, 15 November 2010. Badan Standar Nasional Pendidikan (BSNP), Laporan BSNP Tahun 2008. Jakarta: BSNP. Badan Standar Nasional Pendidikan (BSNP), Laporan BSNP Tahun 2008. Jakarta: BSNP. Badan Standar Nasional Pendidikan (BSNP), Laporan BSNP Tahun 2009. Jakarta: BSNP. Nurudin, dkk. 2007, Ujian Nasional di Madrasah Persepsi dan Aspirasi Masyarakat. Jakarta: Gaung Persada Press. Peraturan Menteri Pendidikan Nasional Nomor 20 Tahun 2007 tentang Standar Penilaian Pendidikan. Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan. Puspendik. 2011. Laporan Hasil Exit Polling Ujian Nasional Tahun 2011. Undang-Undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional.
42
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
TEST OF ITEM VALIDITY OF ARTISTIC APTITUDE TEST ON VOCATIONAL HIGH SCHOOL STUDENTS (SMK) IN DENPASAR BALI Ni Ketut Widiartini University of Ganesha Education (UNDIKSHA) Singaraja-Bali Email:
[email protected] Abstract The study aimed to test the validity of test items of Artistic aptitude on vocational students in Denpasar Bali. Artistic aptitude test developed on the base of the theory of Guilford and Horn about artistic aptitude. According to the two theories, the general artistic aptitude are of two kinds, 1)assessment of the aesthetic (aesthetic judgment); the assessment of art or art criticism, and 2)the aesthetic production; the assessment of aesthetic production. The number of artistic aptitude test developed were 11 points. Test try-out was conducted in 2010. Subjects in this study were the class X of SMKN 3 and SMKN 4 Denpasar Bali; 40 students of SMK N 3 and 44 students at SMK N 4. Data analysis methods applied were: (1)validation of the concept in order to examine the provisions of the test items in light of three aspects; content, constructs, and language based on expert judgements, validation of the concept by 5 (five) experts, three were evaluation experts and two experts were from the fields of art, and (2) empirical validation carried out in order to test the accuracy and reliability of the items on the test instrument based on a sample of the study. The validity of artistic aptitude was calculated by using the product moment correlation, while for the reliability of artistic aptitude test was calculated with Cronbach Alpha. Based on the results of the validity testing of artistic aptitude, there are 10 valid items and there is only 1 invalid item, that is item number 4. Reliability coefficients obtained for R11 = 0.78. Degree of reliability tests, according to Guilford suggests that the artistic aptitude is of high reliability and can be used to measure the research data. Keywords: Test Validity, artistic aptitude,assessment, evaluation, expert judgements 1. Pendahuluan Setiap individu hendaknya mendapat kesempatan dan pelayanan untuk berkembang secara optimal sesuai dengan kemampuan, kecerdasan, bakat, minatnya, latar belakang dan lingkungan fisik serta sosial masing-masing siswa, maka kemajuan belajar siswa yang setingkat (sekelas) mungkin tidak sama. Setiap anak dipercaya memiliki bakat sendiri-sendiri. Namun bakat anak tidak bisa langsung terlihat begitu saja. Karenanya orang tua harus mengenali dan memahami bakat yang dimiliki anaknya. Dengan memahami bakat anak, orang tua akan lebih mudah dan terarah dalam mengembangkannya. Bakat merupakan talenta untuk membangun kekuatan pribadi anak di masa mendatang. Kesadaran akan sisi kekuatan seorang anak perlu digali dengan bantuan orang tua. Kesadaran akan pentingnya mengembangkan sisi kekuatan anak-anak ini harus disadari oleh orang tua dan pendidik yang membimbing siswa-siswa dalam mengolah pengetahuan dan ketrampilan mereka baik dalam bidang seni dan bidang olahraga. Terkait dalam bidang seni atau sering disebut dengan bidang artistic, Sekolah Menengah Kejuruan (SMK) dalam menjaring siswa yang sekolah di SMK, hendaknya memberikan tes bakat. Kegunaan Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
43
dari tes bakat adalah untuk mengetahui bakat yang dimiliki masing-masing siswa, sehingga guru dapat dengan mudah memberikan dan mengarahkan siswa untuk menekuni bidang apa di SMK. Selama ini, hal tersebut di atas belum dapat terealisasi. Guru membagi siswa berdasarkan pilihan siswa dan nilai raport SMP siswa. Tidak terealisasinya tes bakat ini disebabkan karena banyak faktor yang mempengaruhi, antara lain adalah biaya yang diperlukan untuk melakukan tes bakat relative mahal, tes bakat yang menjurus pada masing-masing bidang keahlian di SMK belum ada yang standar, SMK merupakan sekolah pilihan terakhir bagi siswa yang tidak mendapatkan sekolah di SMA. Biasanya siswa yang memiliki pengetahuan lebih tinggi dan sudah memiliki keahlian, akan memilih sekolah SMA dibandingkan SMK. Khusus untuk bidang keahlian busana salah satu tes bakat yang sesuai untuk mengukur kemampuan dalam dalam bidang busana adalah tes bakat artistic atau bakat seni. Tes bakat artistic ini diberikan kepada siswa agar siswanya dapat mengikuti pelajaran dengan baik, karena hampir semua mata pelajaran yang akan diterima oleh siswa merupakan pelajaran ketrampilan atau skill yang nantinya menuntut siswa untuk membuat produk benda nyata. Tes Bakat seni atau artistic ini juga perlu dilakukan karena bakat seni atau artistic yang dimiliki siswa SMK khusus untuk bidang keahlian tata busana sangat mempengaruhi hasil tes, baik tes formatif maupun sumatif. Dalam artian bahwa siswa yang memiliki bakat artistic yang lebih tinggi akan memiliki kemampuan lebih baik untuk menyelesaikan tugas yang berhubungan dengan nilai seni dibandingkan dengan siswa yang memiliki bakat artistic yang lebih rendah. 2. Kerangka Teori Utami Munadar (1999:71) mendefinisikan bakat pada umumnya diartikan sebagai kemampuan bawaan, sebagai potensi yang masih perlu dikembangkan dan dilatih agar dapat terwujud. Berbeda dengan bakat “kemampuan” merupakan daya untuk melakukan suatu tindakan sebagai hasil dari pembawaan dan latihan. Kemampuan menunjukan tindakan dapat dilakukan sekarang, sedangkan bakat memerlukan latihan dan pendidikan agar suatu tindakan dapat dilakukan dimasa yang akan datang. Bakat dan kemampuan menentukan prestasi seseorang. Orang berbakat matematika diperkirakan akan mampu mencapai prestasi tinggi dalam bidang matimatika. Jadi “prestasi”merupakan perwujudan bakat dan kemampuan. Presatasi yang menonjol dalam salah satu bidang mencerminkan bakat yang unggul dalam bidang tersebut, begitu juga sebaliknya. Berdasarkan pengertian bakat di atas, dapat ditarik kesimpulan sebagai berikut: (1). Bakat merupakan kemampuan bawaan, sebagai potensi yang masih perlu dikembangkan dan dilatih agar dapat terwujud, (2) Bakat tidaklah diturunkan semata, tetapi merupakan interaksi dari faktor keturunan dan faktor lingkungan, artinya dibawa sejak lahir berupa potensi dan berkembang melalui proses belajar, dan memiliki ciri khusus, (3) Orang yang berbakat dalam bidang tertentu diperkirakan akan mampu mencapai prestasi tinggi dalam bidang itu. Jadi prestasi sebagai perwujudan bakat dan kemampuan, dan (4) Bakat mencakup ciri-ciri lain yang dapat memberi kondisi atau suasana memungkinkan bakat tersebut terealisasi, termasuk intelegensi, kepribadian, interes, dan keterampilan khusus. Jadi Bakat merupakan suatu konsistensi kerakteristik yang menunjukkan kapasitas seseorang untuk menguasai suatu pengetahuan khusus, keterampilan atau serangkaian respon yang terorganisir atau kemampuan khusus yang berkembang secara istimewa atau menonjol dibandingkan dengan kemampuan-kemampuan yang lain. Bakat dikatakan sebagai kemampuan bawaan yang merupakan potensi (potential ability) yang masih perlu dikembangkan atau dilatih. Kemampuan adalah daya untuk melakukan suatu tindakan sebagai hasil dari pembawaan dan latihan. Kemampuan menunjukkan bahwa suatu tindakan dapat dilaksanakan sekarang, sedangkan “bakat” memerlukan latihan dan pendidikan agar dapat dilakukan di masa yang akan datang. Kapasitas sering digunakan sebagai sinonim untuk “kemampuan” dan biasanya diartikan sebagai kemampuan yang dapat dikembangkan sepenuhnya di masa mendatang apabila latihan dilakukan secara optimal. Jadi, bakat adalah kemampuan alamiah untuk memperoleh
44
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
pengetahuan atau keterampilan yang relative bersifat umum (misalnya bakat intelektual umum) atau khusus (bakat akademis khusus). Bakat khusus sering disebut dengan talen. Talen menunjuk pada hasil daripada sesuatu kegiatan manusia yang diwarnai oleh konteksnya, dan setelah dilatih dan dididik memperlihatkan aktualisasi (Semiawan, 1999:97). Setiap orang memiliki kemampuan yang berbeda sesuai dengan potensi yang ada pada dirinya. Potensi yang dimiliki individu ada yang bersifat umum dan ada yang khusus. Intelegensi termasuk kemampuan umum, sedangkan kemampuan khusus mengacu kepada bakat yang dimiliki individu yang biasanya disebut dengan bakat khusus. Bakat khusus adalah seperangkat nilai yang dianggap sebagai tanda kemampuan individu untuk menerima latihan atau respon, seperti kemampuan berbahasa, musik, berhitung, mekanik, olahraga, dan sebagainya. Bakat khusus seseorang dapat dikelompokkan menjadi: bakat pemahaman verbal, kemampuan numerical, skolastik, bakat kerani (kesekretariatan), pemahaman mekanik, tilikan (pandangan) ruang atau berpikir 3 dimensi, dan bakat bahasa. Selanjutnya ditinjau dari cara berfungsinya, bahwa bakat dapat dikelompokkan menjadi dua bagian, yaitu: (1) bakat kemahiran atau kemampuan mengenai bidang pekerjaan yang khusus seperti bakat musik, bakat menari, olahraga (sepakbola, senam), dan sebagainya, dan (2) bakat khusus tertentu yang diperlukan sebagai perantara untuk merealisir kemampuan tertentu, misalnya bakat melihat ruang (dimensi) yang diperlukan untuk merealisir bakat insinyur, bakat berhitung untuk merealisir bakat sebagai ahli statistik atau akuntansi, bakat verbal untuk merealisisr baakt sebagai wartawan atau penulis novel, bakat bahasa untuk merealisir bakat orator dan penceramah (Radili, 2010:2). Bakat bukanlah sifat tunggal, melainkan sekelompok sifat-sifat yang secara bertingkat membentuk bakat. Jenis-jenis bakat khusus dapat dibedakan berdasarkan atas bidang apa bakat tersebut berfungsi, seperti bakat matematika, bakat bahasa, bakat olahraga, bakat music, bakat klerikal, bakat guru, bakat dokter, dan sebagainya. Dengan demikian, maka macam bakat akan sangat tergantung pada konteks kebudayaan di mana seseorang individu hidup dan dibesarkan. Penamaan itu bersangkutan dengan bidang studi atau pula dalam bidang kerja. Bakat memungkinkan seseorang untuk mencapai prestasi dalam bidang tertentu, akan tetapi diperlukan latihan, pengetahuan, pengalaman, dan dorongan atau motivasi agar bakat itu dapat terwujud. Misalnya seseorang mempunyai bakat menggambar, jika ia tidak pernah diberi kesempatan untuk mengembangkan, maka bakat tersebut tidak akan tampak. Jika kedua orang tuanya menyadari bahwa anak mempunyai bakat menggambar, maka orang tua mengusahakan agar anak mendapat pengalaman yang sebaik-baiknya untuk mengembangkan bakatnya, dan anak dapat menunjukkan minat yang besar untuk mengikuti pendidikan menggambar, sehingga anak akan dapat mencapai prestasi yang unggul bahkan dapat menjadi pelukis terkenal. Sebaliknya, seorang anak yang mendapat pendidikan menggambar dengan baik, namun tidak memiliki bakat menggambar, maka tidak akan pernah mencapai prestasi unggul untuk bidang tersebut. Faktor-faktor yang mempengaruhi perkembangan bakat khusus, diantaranya adalah: (1) faktor dari anak itu sendiri, misalnya anak kurang berminat untuk mengembangkan bakat-bakat yang dimiliki, atau kurang termotivasi untuk mencapai prestasi yang tinggi, atau mungkin pula mempunyai kesulitan atau masalah pribadi sehingga ia mengalami hambatan dalam pengembangan diri serta berprestasi sesuai dengan bakatnya, (2) lingkungan anak, misalnya orang tuanya kurang mampu untuk menyediakan kesempatan dan sarana pendidikan yang ia butuhkan, atau ekonominya cukup tinggi tetapi kurang memberikan perhatian terhadap pendidikan anak (Muba, tt).
Untuk mengetahui apakah sesorang memiliki bakat pada bidang tertentu atau tidak, maka bakat seseorang dapat diukur dengan tes bakat. Tes bakat merupakan sebagai satu seri tugas-tugas yang dibakukan dan diberikan untuk membuat perkiraan kuantitatif kemampuan seseorang yang menguntungkan dirinya lewat latihan. Tes-tes bakat tersebut dipakai untuk Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
45
mengukur prestasi yang akan dicapai di kemudian harinya sedang tes prestasi (achievement tests) mengukur kemampuan yang dicapai pada saat sekarang. Tes bakat dilakukan dengan tujuan sebagai berikut, yaitu: 1) Diagnosis, tujuannya adalah untuk mengetahui bakat seseorang sehingga akan lebih mudah memahami potensi yang ada. Dengan demikian, dapat membantu untuk menganalisis permasalahan yang dihadapi testi di masa kini secara lebih cermat, dan 2) Prediksi, pada dasarnya prediksi adalah mempertemukan potensi seseorang dengan persyaratan yang dituntut oleh lembaga sehingga dapat diperkirakan atau diprediksikan kemungkinan kesuksesan atau kegagalan seseorang dalam bidang tertentu di masa depan. Prediksi meliputi seleksi, penempatan dan klasifikasi (dalam Suharmawan, 2011). Faktor-faktor yang diungkap dalam tes bakat antara lain: 1) kemampuan verbal, kemampuan memahami dan menggunakan bahasa baik secara lisan maupun tulisan, 2) kemampuan numerikal, kemampuan ketepatan dan ketelitian memecahkan problem aritmatik atau konsep dasar berhitung, 3) kemampuan spasial, kemampuan merancang suatu benda secara tepat, 4) kemampuan perseptual, kemampuan mengamati dan memahami gambar 2 dimensi menjadi bentuk 3 dimensi, 5) kemampuan reasoning, kemampuan memecahkan suatu masalah, 6) kemampuan mekanik, kemampuan memahami 2 konsep mekanik dan fisika, 7) kemampuan memori, kemampuan mengingat, 8) kemampuan klerikal, kemampuan bekerja di bidang administrasi, 9) kemampuan kreativitas, kemampuan menghasilkan sesuatu yang baru dan menunjukkan hal yang tidak biasa / istimewa, 10) kecepatan kerja, kemampuan bekerja secara cepat terutama untuk pekerjaaan yang rutin, 11) ketelitian, kemampuan bekerja secara teliti, dan 12) ketahanan, kemampuan bekerja secara konsisten (dalam Suharmawan, 2011). Guildford mengemukakan bahwa terdapat tiga dimensi yang terkandung dalam bakat, yaitu sebagai berikut: 1) Dimensi perseptual, yaitu kemampuan di dalam melakukan persepsi yang mencakup kepekaan indra, perhatian, orientasi ruang dan waktu serta kecepatan persepsi, 2) Dimensi psikomotor, mencakup kekuatan, impuls, kecepatan gerak, kecermatan dan kordinasi, dan 3) Dimensi intelektual, mencakup ingatan, pengenalan, berpikir dan evaluative (dalam Suharmawan, 2011). Tes bakat memiliki keterbatasan sebagai berikut, yaitu : tes bakat hanya mengukur sampel perilaku yang ditunjukkan atau sampel butir tes; standardisasi tes tergantung pada keadaan sampel standardisasi, dengan demikian perkembangan budaya dan kemajuan teknologi akan mempengaruhi validitas tes. Realibilitas tes jarang mempunyai koefisien reliabilitas sama, hal ini berarti testing lebih satu kali pada individu tidak akan menunjukkan hasil yang sama persis; dan dengan pengukuran bakat bukan berarti telah memahami kondisi psikologi seseorang secara komprehensif tetapi untuk tujuan diagnosis dan prediksi, akan lebih akurat jika dilakukan pengukuran aspek untuk secara komprehensif. Untuk mengetahui bakat individu siswa secara tepat, perlu dilaksanakan pengukuran psikologis dengan menggunakan beberapa instrumen tes bakat. Kelompok Single Test yaitu tes bakat yang terdiri dari satu jenis tes dan pada umumnya mengungkap kemampuan khusus yang dimiliki seseorang, antara lain: tes sensori, tes artistik, tes klerikal, tes kreativitas, tes Kraepelin dan tes Pauli. Kelompok Baterai Tes yaitu Tes bakat yang terdiri dari rangkaian bermacam-macam tes yang masing-masing tes dapat berdiri sendiri, artinya tidak harus digunakan secara keseluruhan. Misalnya: FACT, DAT dan GATB. 46
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3. Bakat Artistik dan Pengukurannya
Setelah dikaji mengenai bakat, selanjutnya akan dibahas mengenai bakat artistik itu sendiri. Artistik dapat diartikan sebagai kesenian atau rasa seni. Jadi bisa diartikan bahwa bakat artistik tersebut adalah kemampuan kesenian atau potensi kesenian yang dimiliki seseorang yang dapat diungkapkan atau diketahui setelah orang tersebut mengikuti tes bakat artistik itu sendiri. Secara garis besar bakat kesenian (artistik) ada dua macam, yaitu: 1) penilaian estetika (aesthetic judgment) yaitu penting untuk penilaian terhadap seni atau kritik seni, dan 2) aesthetic production yaitu produksi estetika. Pengukuran aesthetic judgment, menurut Guilford (tt) menyatakan bahwa banyak faktor yang mempengaruhi penilaian seni, karena menyangkut tentang suka atau tidak suka terhadap objek seni yang akan dinilai. Penilaian ini menyangkut hal membandingkan gambar yang lebih baik secara estetik. Untuk melihat hasil ketepatan dari peramalannya maka dapat dibandingkan dengan nilai seni yang diperoleh siswa dari instruktur. Untuk mengukur produksi estetika digunakan inventarisasi bakat seni Horn (Horn Art Aptitude Inventory). Tes ini terdiri dari dua bagian, yaitu latihan “gambar seenaknya dan tergesa-gesa” dan “perbandingan”. Pada bagian satu, pelaku tes diminta untuk mensketsa 20 benda biasa tetapi berlainan, seperti pohon, buku, dan garpu, masing-masing diselesaikan dengan waktu yang singkat (tiga sampai sepuluh detik). Bagian kedua yang merupakan perbandingan terdiri dari dua belas segi empat yang mempunyai beberapa garis yang menjadi dasar untuk menggambar. Kategori dari hasil gambar diklasifikasikan dalam gambar yang buruk, sedang, dan baik. Korelasi yang tinggi dapat terjadi manakala dua orang penilai memberikan hasil yang sama. Korelasi yang diperoleh antara skor-skor tes dan hasil lukisan yang dinilai instruktur adalah 0,50 (Sax, 1980:56) Dari pemaparan di atas, dalam penelitian ini akan dikembangkan tes bakat artistik yang termasuk ke dalam tes tunggal, dimana tes ini dapat mengungkap kemampuan khusus seseorang mengenai sesuatu hal yaitu bakat artistik atau bakat kesenian. Tes bakat artistic yang dikembangkan adalah penilaian estetika (aesthetic judgment) yaitu penting untuk penilaian terhadap seni atau kritik seni dengan menggunakan teori Guilford yaitu membandingkan nilai seni, dan 2) aesthetic production yaitu produksi estetika dengan menggunakan teori Horn yaitu membuat benda seni atau bentuk seni dengan kecepatan tertentu. 4. Metode Penelitian Penelitian ini bertujuan untuk menguji validitas butir Tes bakat artistik pada siswa SMK di Denpasar Bali. Pelaksanaan tes dilakukan pada tahun 2010 di semester ganjil. Subjek pada penelitian ini adalah siswa kelas X SMK N 3 dan SMK N 4 Denpasar Bali sebanyak 84 siswa, yang terdiri dari 40 orang siswa SMK N 3 Denpasar dan 44 orang siswa di SMK N 4 Denpasar. 4.1. Definisi Konseptual
Bakat artistik merupakan potensi kesenian yang dimiliki seseorang yang dapat diketahui setelah diberikan tes bakat artistik. 4.2.
Definisi Operasional
Bakat artistik merupakan kemampuan kesenian atau potensi kesenian yang dimiliki seseorang dalam menguasai sesuatu dalam bidang tata busana, yang dapat diukur melalui indikatorindikator: aesthetic judgment (penilaian estetik) dan aesthetic production (produk estetik). Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
47
4.3.
Kisi-kisi Tes untuk Mengukur Hasil Belajar Membuat Pola
Kisi-Kisi untuk mengukur bakat artistik, disajikan pada tabel berikut. Tabel 4.1. Kisi-kisi Variabel Bakat Artistik Variabel Bakat Artistik
Dimensi
Indikator
Nomor Butir
Jumlah
1,2,3,4,5
5 6
1. Aesthetic Judgment
a.
Kepekaan Indra
2. Aesthetic Production
a.
Kecepatan Persepsi
1,2,3
b.
Kecepatan gerak
4,5,6
Jumlah
11
Adapun kriteria penilaian yang digunakan untuk menilai bakat artistik adalah sebagai berikut: (1) Menyatakan kurang dari 2 hal tentang pertanyaan, (2) Menyatakan 2 hal tentang gambar, (3) Menyatakan 3 hal tentang gambar, (4) Menyatakan 4 hal tentang gambar, dan(5) Menyatakan lebih dari 4 hal tentang pertanyaan. 5. Validasi Instrumen Tes Hasil Belajar Membuat Pola
Butir instrument tes Bakat Artistik harus diujicobakan terlebih dahulu agar teruji tingkat kehandalannya. Proses validasi dilakukan sebanyak dua tahapan yaitu: (1) validasi konsep dengan tujuan untuk menelaah ketetapan butir-butir instrument ditinjau dari tiga aspek antara lain isi, konstruksi dan kebahasaan berdasarkan penilaian pakar, dan (2) validasi empirik dilakukan dengan tujuan untuk menguji ketepatan butir-butir dan kehandalan instrument berdasarkan ujicoba pada sampel dari kelompok populasi penelitian. 6.
Hasil Penelitian dan Pembahasan
6.1. Validasi Isi Tes Hasil Belajar Membuat Pola
Proses penilaian validasi konstruk tiap butir instrument Bakat Artistik dilakukan dengan teknik penilaian oleh pakar. Proses penilaian ini dilakukan oleh 5 orang pakar yang terdiri atas: 2 orang Guru Besar (pengukuran), dan 3 orang dosen Seni Rupa. Proses penilaian panelis didasarkan atas 3 (tiga) aspek, yaitu: aspek isi, aspek konstruksi dan aspek kebahasaan. Selanjutnya ketiga aspek tesebut dijabarkan menjadi 4 (empat) kriteria atau indikator yaitu: (1) (2) (3) (4)
Kesesuaian antara butir dengan indikator Kesesuaian antara indikator dan dimensi yang diukur Pernyataan soal tidak ambigius Kesesuaian penggunaan bahasa dan butir soal dengan responden
Pemberian bobot penilaian oleh panelis dilakukan dengan member penilaian terhadap setiap butir dengan rentang skor 1 sampai 3, dengan bobot penilaian sebagai berikut:
48
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Skor 1 = jika dalam butir pernyataan dua kriteria yang terpenuhi Skor 2= jika dalam butir pernyataan tiga kriteria yang terpenuhi Skor 3= jika dalam butir pernyataan semua kriteria terpenuhi
Berdasarkan hasil penilaian pakar terhadap instrument yang berjumlah 11 butir soal terdapat beberapa catatan mengenai kesesuaian butir dengan indikator, kesesuaian indikator dengan dimensi, penggunaan bahasa dan kesesuaian penggunaan bahasa serta kesesuaian butir soal dengan responden. Dari catatan tersebut, instrument diperbaiki berdasarkan catatan-catatan yang diberikan pakar. Selanjutnya hasil penilaian tersebut dianalisis dengan menggunakan analisis product moment untuk melihat valid tidaknya butir tes. Selanjutnya nilai rxy (rhitung) hasil penilaian pakar tersebut dibandingkan dengan rtabel pada taraf signifikansi 5% dan dk = n. Kriteria penilaian yaitu, butir dikatan valid apabila nilai rxy > rtabel, dan butir dikatakan tidak valid apabila nilai rxy < rtabel. Setelah dianalisis dengan bantuan program Microsoft Excel 2007, ternyata semua butir instrument Bakat Artistik dinyatakan Valid. 5.2.
Validasi Empirik Tes Hasil Belajar Membuat Pola
Ujicoba dilakukan dengan cara ujicoba instrument Bakat Artistik sejumlah sampel dari populasi penelitian. Ujicoba instrument Bakat Artistik diberikan pada 30 siswa. Cara menghitung validitas empiris (Validitas butir tes) dengan data yang berbentuk polytomi, sebaiknya menggunakan korelasi Product Moment dengan rumus berikut.
rxy Rumus:
N XY X Y
N X
2
X N Y 2 Y 2
2
Keterangan: N = banyaknya kasus atau sampel X = skor butir tes Y = skor total ∑X = jumlah X ∑Y = jumlah Y rxy = nilai koefisien korelasi product moment
Untuk menentukan suatu butir tes dinyatakan valid atau tidak, selanjutnya koefisien rxy = rhitung dikonsultasikan dengan rxy tabel. Kriteria pengujian validitas butir yaitu: butir dikatakan “valid” jika nilai rxy = rhitung lebih besar rxy tabel dengan taraf signifikansi atau taraf kekeliruan 5% (rxy-hit ≥ rxy-tab dengan t.s 5%), dan “tidak valid” jika nilai rxy = rhitung lebih besar rxy tabel dengan taraf signifikansi atau taraf kekeliruan 5% (rxy-hit < rxy-tab dengan t.s 5%). Sesuai hasil perhitungan koefisien korelasi product moment untuk mencari validitas butir ke1 diperoleh harga rxy = 0,658. Sedangkan rxy tabel pada taraf signifikansi 5% dan n = 30 Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
49
adalah 0,361. Ternyata harga rxy hitung lebih besar daripada harga rxy tabel, maka jumlah skor butir ke-1 mempunyai korelasi yang signifikan dengan jumlah skor total. Oleh karena itu dapat diinterpretasikan bahwa butir nomor 1 adalah valid. Untuk mencari validitas butir ke-6 dengan menggunakan rumus product moment diperoleh harga rxy = 0,480. Sedangkan rxy tabel pada taraf signifikansi 5% dan n = 30 adalah 0,361. Ternyata harga rxy hitung lebih besar daripada harga rxy tabel, maka jumlah skor butir ke-6 mempunyai korelasi yang signifikan dengan jumlah skor total. Oleh karena itu dapat diinterpretasikan bahwa butir nomor 6 adalah valid. Perhitungan data hasil ujicoba instrument Bakat Artistik menggunakan program Microsoft Excel 2007 diperoleh hasil bahwa dari 11 butir soal, 10 butir soal valid dan 1 butir soal yaitu butir ke-4 yang tidak valid atau drop. Sehingga dalam penelitian ini yang dijadikan instrument Bakat Artistik adalah sejumlah 10 butir pernyataan, yaitu butir 1,2,3,5,6,7,8,9,10, dan 11. 4.1. Reliabilitas Tes Hasil Belajar Membuat Pola
Setelah diperoleh instrument yang valid sebanyak 10 butir, kemudian dilakukan perhitungan koefisien reliabilitas instrument. Koefisien reliabilitas instrument dianalisis dengan menggunakan Alpha-Cronbach, sebagai berikut.
Rumus Alpha-Cronbach:
2 2 k SDt SDi r1.1 2 SDt k 1
Keterangan : r1.1
= koefisien reliabilitas perangkat tes
k
= banyak butir tes
SDi2 = varians skor tiap butir (item) 2 SDtot = varian skor total
Berdasarkan hasil perhitungan reliabilitas tes hasil belajar membuat pola menggunakan program Microsoft Excel 2007, diperoleh koefisien reliabilitas r1.1 = 0,78. Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria yang dikemukakan oleh Guilford. Dengan demikian, hasil uji coba menunjukkan koefisien reliabilitas instrument Bakat Artistik adalah tinggi dan dapat digunakan untuk mengukur data penelitian.
50
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
DAFTAR PUSTAKA Hadi, S.(1996). Statistik 2, Yogyakarta: Penerbit Andi Offset. Maulita, W. (2010), Macam-macam tes, http://Wahyumaulita./2010/04/17/tugas, diakses 10 Desember 2010. Muba, F., (2010), Bakat khusus, http://febryanmuba.blogspot.com/2010/10/bakatkhusus.html, diakses 10 Desember 2010. Utami Munandar, S.C., (1999). Pengembangan kreativitas anak berbakat, Jakarta: PT. Rineka Cipta. Radili, L., (2009). Bakat khusus, http://lenyradili89.blogspot.com/2009/12/bakat-khusus.html, diakses 10 Desember 2010. Rasyid, H. (2008). Penilaian hasil belajar, Bandung: Wacana Prima. Semiawan, C., (1997). Perspektif pendidikana anak berbakat, Jakarta: PT. Grasindo. Suharmawan, W., (2011). Tes bakat, (http://konselorindonesia.blogspot.com/2011/01/tesbakat.html, diakses 17 Maret 2011. Suryabrata, S. (2001). Psikologi pendidikan, Jakarta: PT. Grasindo Persada.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
51
52
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
PENGGUNAAN INSTRUMEN ASESMEN UNTUK MENDETEKSI ANAK SD KELAS RENDAH BERKEBUTUHAN KHUSUS Maria J. Wantah Universitas Negeri Manado Email:
[email protected] Abstrak Tujuan penelitian ini adalah untuk: (1) melakukan validasi instrumen asesmen dengan melibatkan expert; (2) melakukan uji reliabilitas instrument dengan menggunakan skala terbatas; dan (3) melakukan pengukuran dengan menggunakan instrumen asesmen untuk mendeteksi anak SD yang termasuk dalam kategori berkebutuhan khusus. Hasil penelitian menunjukkan bahwa: (1) melakukan validasi instrument dengan melibatkan expert tentang ketepatan isi dan kemenarikan insrumen asesmen sudah sesuai dengan perkembangan anak SD kelas rendah yaitu motorik kasar, halus, dan social emosional; (2) uji reliabilitas instrument dengan menggunakan cronbach alpha hasilnya: motorik kasar sebesar 0,78; motorik halus sebesar 0,82; dan social emosional sebesar 0,78; (3) terdapat 10 anak laki-laki atau 12,20 % memiliki ukuran lingkar kepala tidak nomal dan perlu mendapatkan pemeriksaan; (4) terdapat 52 anak atau 63,41% memiliki lingkaran kepala normal; dan (3) terdapat 20 anak atau 24,39% memiliki lingkaran kepala di atas normal; (4) terdapat 10 anak atau 11,63 % berada di atas garis putus-putus atas ataupun di bawah garis putus-putus bawah, maka ukuran lingkar kepala anak tidak nomal dan perlu mendapatkan pemeriksaan yang lebih lanjut; (6) terdapat 56 anak atau 65,12% lingkaran kepala normal; (7) terdapat 20 anak atau 23,56% memiliki lingkaran kepala di atas normal; (8) 3 (3,65%) anak laki-laki termasuk dalam kategori sangat kurus, dan 3 (3,49%) anak perempuan termasuk dalam kategori sangat kurus; (9) 7 (8,54%) anak laki-laki termasuk dalam kategori kurus, dan 7 (8,14%) anak perempuan termasuk dalam kategori kurus; (10) 66 (80,49%) anak lakilaki termasuk dalam kategori normal, dan 68 (79,07%) anak perempuan termasuk dalam kategori normal; dan (11) 6 (7,32%) anak laki-laki termasuk dalam kategori kegemukan, dan 8 (9,30%) anak perempuan termasuk dalam kategori kegemukan. Dari 20 anak yang termasuk dalam kategori berkebutuhan khusus, terdapat 14 (70%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) secara normal, 2 (10%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) yang kurus, dan 4 (20%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) yang sangat kurus. Selain itu, ukuran lingkar kepala anak, dari 20 anak terdapat 13 (65%) anak yang memiliki lingkar kepala yang normal, 3 (15%) anak laki-laki memiliki lingkar kepala yang tidak normal, dan 4 (20%) anak perempuan memiliki lingkar kepala yang tidak normal, Kata Kunci: Instrumen asesmen untuk mendeteksi anak SD berkebutuhan khusus.
Setiap anak yang sedang tumbuh dan berkembang tentu mengharapkan untuk menjadi anak normal. Namun realitas yang terjadi tidak demikian. Ada sebagian anak yang kurang beruntung atau mengalami kelainan tertentu. Anak seperti ini memiliki kecenderungan tertentu, kurang dapat berinteraksi dengan anak yang lain, sehingga mengalami kesulitan dalam pembelajaran di kelas. Sekolah mempunyai kewajiban untuk memberikan layanan khusus pada anak tersebut. Terkait dengan hal ini, guru perlu mendiagnosis layanan khusus Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
53
seperti apa yang diperlukan dan sesuai dengan siswa kebutuhan siswa, agar dapat mengikuti pembelajaran di kelas. Sistem pelayanan yang digunakan di SD yang menyelenggarakan program inklusif di kota Manado adalah dalam bentuk kelas regular dalam arti anak ABK dan non ABK belajar bersama-sama di kelas regular. Dalam kelas regular, dirancang untuk membantu ABK melalui suasana belajar yang kooperatif sehingga semua anak dapat menjalin kerjasama untuk mencapai tujuan belajar tersebut. Suasana belajar kompetitif dihindari agar ABK tidak putus asa. Program pengajaran individual diberikan pada semua anak yang membutuhkan, baik ABK maupun anak yang memiliki unggulan. Dalam kelas regular semacam ini, berbagai metode untuk berbagai jenis anak digunakan bersama. Namun kenyataan menunjukkan bahwa SD di Kota Manado Provinsi Sulawesi Utara yang menyelenggarakan program inklusif sistem pelayanan yang digunakan dalam bentuk kelas regular tetapi ABK belum mendapat layanan yang optimal seperti; dalam pembelajaran di kelas, belum ada model pembelajaran yang sesuai dengan kebutuhan untuk ABK, ABK mendapat label negative dati anak non ABK, ABK mungkin akan sering gagal karena sulitnya bahan pelajaran dan tugas-tugas, dan semangat juang guru kelas regular mungkin akan terpengaruh secara negative karena banyak diantara mereka tidak dipersiapkan untuk melayani mereka. Hal ini berpengaruh pada waktu guru merancang pembelajaran yang bersifat secara umum karena kurangnya pengetahuan guru tentang program layanan untuk ABK. Dengan demikian maka hasil belajar yang dicapai anak belum optimal. Pendidikan yang diselenggarakan di SD inklusif, difokuskan dalam upaya untuk merehabilitasi kemampuan ABK seperti: mengembangkan kemampuan komunikasi dan mengikuti pembelajaran yang sesuai dengan karakteristik ABK. Model layanan dapat disusun setelah mengetahui kebutuhan seperti apa yang sesuai dengan ABK. Terkait dengan hal ini, diperlukan model asesmen untuk dapat mengidentifikasi kebutuhan ABK. Dengan diidentifikasinya kebutuhan ini, permasalahan yang dihadapi ABK dalam pelaksanaan pembelajaran di kelas dapat diketahui, yang berdampak besar bagi keberhasilan proses pembelajaran di kelas. Namun instrumen asesmen untuk mengidentifikasi kebutuhan ABK belum ada, dan model layanan yang sesuai dengan kebutuhan ABK belum tersedia juga. Pelaksanaan program pendidikan inklusif di SD, ABK belajar bersama-sama dengan anak normal lainnya pada kelas yang sama. Terkait dengan hal ini, guru perlu memberikan perhatian kepada semua siswa, dan juga perlu memberikan perhatian yang cukup besar pada ABK yang ada di kelas tersebut. Selain itu, guru perlu merancang program pembelajaran yang sesuai dengan kebutuhan ABK yang biasa disebut dengan program pembelajaran individual (PPI). PPI ini, disusun berdasarkan hasil asesmen dan hanya diperuntukkan untuk anak tersebut, dan bukan untuk semua anak yang ada di kelas. Dengan demikian gambaran tentang kondisi awal ABK pada satuan pelajaran individual sangat penting untuk melihat kemajuan yang dicapai ABK setelah proses pembelajaran berlangsung. Namun kenyataan menunjukkan bahwa ABK belajar bersama dengan anak normal, dan selama di kelas dilakukan pembelajaran dengan menggunakan materi pelajaran dan strategi pelajaran yang sama. Padahal ABK membutuhkan layanan khusus sehingga mereka dapat mengembangkan kemampuan yang mereka miliki. Ada sebagian ABK memiliki kemampuan intelektual yang tinggi, tetapi karena permasalahan tertentu mereka mengalami kesulitan belajar seperti matematika, menulis, dan membaca. Kemampuan ABK dapat meningkat, jika guru dapat memberikan latihan-latihan tertentu. Namun guru belum bisa 54
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
mendeteksi kebutuhan ABK disebabkan oleh belum tersedianya model asesmen untuk mendeteksi ABK di SD inklusif. Amin (1995) mengemukakan bahwa pada umumnya anak tunagrahita ringan dapat berbicara namun perbendaharaan kata-kata mereka sangat kurang. Anak tersebut mengalami kesulitan dalam berpikir abstrak, tetapi mereka dapat mengikuti pelajaran akademik di sekolah khusus dalam hal ini sekolah luar biasa. Anak-anak tersebut di masukkan di sekolah khusus, hal ini disebabkan karena kecerdasan mereka berkembang tidak sesuai dengan umur kalender. Sebagai contoh anak yang berumur 16 tahun baru mencapai umur kecerdasan yang sama dengan anak umur 12 tahun. Namun hanya sebagian anak yang dapat mencapai hal tersebut di atas, sedangkan yang lain tidak dapat mencapai umur kecerdasan setinggi itu atau lebih rendah dari umur kecerdasan tersebut. Faison-Hodge & Porrettan (2004) mengemukakan bahwa kecacatan dapat merupakan faktor personal yang dapat mempengaruhi tingkahlaku aktivitas fisik juga. Siswa tunagrahita ringan mungkin mengalami kesulitan dengan instruksi verbal selama pelajaran olah raga. Jika instruksi tidak sederhana dan nyata siswa-siswa inimungkin tidak dapat menyelesaikan tugastugas, karena kurangnya kejelasan dan bukan karena tidak mampu melakukan. Kirk dan Gallagher (1986) mengemukakan bahwa kesulitan belajar spesifik ”berarti gangguan pada (atau lebih proses psikologis dasar yang mencakup pemahaman atau penggunaan bahasa baik lisan atau tulisan, yang dapat terlihat dari kemampuan yang kurang baik dalam memperhatikan orang lain, berpikir, berbicara, membaca, menulis, mengeja atau melakukan perhitungan matematika. Istilah ini tidak mencakup kecacatan perceptual, kerusakan otak. Disfungsi otak minimal, dislexia dan aphasia perkembangan. Istilah ini tidak mencakup anak-anak yang mempunyai masalah belajar yang terutama disebabkan oleh kecacatan penglihatan, pendengaran atau motorik, retardasi mental, gangguan emosional, lingkungan atau budaya. Anak berkesulitan belajar (learning disabilities) meskipun intelegensi mereka berada pada taraf rata-rata atau di atas rata-rata disebut anak luar biasa atau berkelainan karena memerlukan pelayanan pendidikan khusus atau pendidikan luar biasa untuk mengoptimalkan prestasi belajarnya. Anak yang termasuk dalam kategori berkesulitan belajar sangat banyak sehingga perlu mengklasifikasi dan menentukan karakteristik anak tersebut. Kirk dan Gallagher (1986) mengidentifikasi anak yang termasuk dalam kategori learning disabilities adalah : (1) listening comprehension (menangkap dan memahami bahasa lisan); (2) oral expression (mengemukakan gagasan secara lisan); (3) basic reading skills (ketrampilan membaca dasar); (4) reading comprehension (memahami bahasa tulis); (5) written expression (mengemukakan gagasan secara tertulis); (6) mathematics calculation (perhitungan matematika); dan (7) mathematics reasoning (daya nalar matematika). Selanjutnya anak yang termasuk dalam klasifikasi learning disabilities dibagi dalam 3 bidang yaitu: (1) reseptif dan bahasa lisan; (2) membaca dan menulis; dan (3) matematika. Selain itu, kesulitan belajar terbagi atas: (1) kesulitan belajar kognitif; adalah salah satu bentuk kesulitan belajar yang bersifat perkembangan. Kesulitan belajar jenis ini perlu mendapat perhatian, jika tidak diatasi maka dapat menimbulkan kesulitan dalam bidang akademik; (2) kesulitan belajar bahasa terdiri dari : (a) kesulitan memahami dan membedakan makna bunyi wicara, (b) kesulitan membentuk konsep dan mengembangkannya, (c) kesulitan mengklasifikasi kata, (d) kesulitan belajar relasi semantik, (e) kesulitan dalam memahami sistem semanti, (f) transformasi semantik, dan implikasi semantik; (3) kesulitan belajar membaca dapat dilihat pada kebiasaan membaca yang tidak wajar, dengan memperlihatkan Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
55
adanya gerakan-gerakan yang penuh dengan ketegangan ; (4) kesulitan belajar menulis merupakan suatu masalah bagi murid maupun guru. Learner dalam Abdurrahman (1996) mengemukakan bahwa ada beberapa faktor yang mempengaruhi kemampuan anak untuk menulis seperti: (a) motorik, (b) perilaku, (c) persepsi, (d) memori, (e) kemampuan melaksanakan cross modal, (6) penggunaan tangan yang domain, dan (7) kemampuan memahami instruksi; dan (5) kesulitan belajar matematika (Abdurrahman, 1996; Bowd, 1994). Bowd (1994) banyak anak berkesulitan belajar kesulitan memahami ketrampilan dasar berpikir dan menghafal maupun pada tingkah laku sosial dan emosional. Ada 6 karakteristik yang merupakan kesulitan umum anak berkesulitan belajar yaitu: a) Ketrampilan motorik; guru melihat anak berkesulitan belajar mempunyai keseimbangan yang buruk dan kurang mengikuti irama. Hal ini berhubungan dengan masalah ketrampilan motorik halus anak (terutama koordinasi mata dan tangan) dan pada motorik kasar terlihat pada kegiatan olah raga dan kegiatan bermain. b) Ketrampilan perseptual: beberapa anak berkesulitan belajar terutama dalam membaca cenderung menunjukkan kesulitan dalam organisasi dan interprelasi informasi visual. c) Atensi dan hiperaktif; banyak bukti yang menunjukkan bahwa anak berkesulitan belajar kurang bisa memperhatikan dan lebih mudah terganggu. Anak hiperaktif terlihat sedemikian aktif sehingga tingkah lakunya terus menerus mengganggu belajarnya. d) Menghafal dan berpikir; siswa berkesulitan belajar kekurangan atau tidak lengkap strategi untuk pemecahan masalah dibandingkan dengan anak lain. Ini berarti bahwa mereka kesulitan dalam pembentukan konsep dan urutan yang efektif dari tahap-tahap pemecahan masalah. Anak berkesulitan belajar memiliki masalah dalam mengingat informasi, terutama jenis verbal. e) Bahasa; Anak berkesulitan belajar sukar mengenal suara yang membentuk kata, masalah yang dapat menghasilkan kesulitan mengeja dan kosakata. Juga mengalami kesalahan tata bahasa waktu menggunakan bahasa, dan sukar mengingat kata-kata tertentu jika diminta. f) Ketrampilan sosial; penilaian/pengambil keputusan sosial muncul sebagai akibat dari bergaul dengan orang lain. Hal ini melibatkan sejumlah ketrampilan, mampu melakukan berbagai hal dengan orang lain dan merasa senang, menerima nilai-nilai dan standar yang umum dari kelompoknya. Tidak berperilaku yang dapat mengganggu kelompok secara keseluruhan. Berdasarkan uraian di atas karakteristik anak berkesulitan belajar mengalami kekurangan dalam ketrampilan motorik, anak mengalami kesulitan belajar membaca sehingga anak sulit konsentrasi dalam belajar, sedangkan anak hiperaktif terus menerus mengganggu belajarnya karena terlalu aktif. Selain itu, anak berkesulitan belajar kurang memiliki strategi pembelajaran yang baik dibandingkan dengan anak normal. Juga mengalami permasalahan dalam bahasa, dan memiliki ketrampilan sosial yang baik sehingga mudah bergaul dengan orang lain Di Indonesia, pendidikan inklusif ini baru diperkenalkan sekitar enam tahun terakhir. Dengan demikian, dapat dikatakan bahwa penyelenggaraan program pendidikan inklusif bagi sekolah yang menyelenggarakannya, perlu mengikuti petunjuk teknis tentang pelaksanaan pendidikan inklusif terutama dalam penempatan ABK di kelas. Nasichin (2002) mengemukakan bahwa model penempatan ABK di sekolah inklusif adalah: (1) kelas reguler atau integrasi penuh, peserta didik yang berkebutuhan khusus belajar bersama-sama dengan 56
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
peserta didik lainnya sepanjang hari; (2) kelas reguler dengan kelompok cluster dimana terdapat kelas reguler, namun di kelas tersebut terdapat juga kelompok khusus; (3) kelas reguler dengan full out ( ABK dari kelas reguler masuk kedalam kelas khusus dan belajar bermasa-sama dengan guru pembimbing khusus yang diselenggarakan pada waktu tertentu atau pada saat anak mengalami kesulitan dalam belajar); (4) kelas reguler dengan cluster dan full out (kelompok khusus dalam kelas reguler yang pada waktu-waktu tertentu dibimbing khusus di tempat tersendiri); (5) kelas khusus dengan beberapa pengintegrasian; dan (6) kelas khusus memberikan layanan pendidikan kepada beberapa ABK dalam waktu tertentu. Howard (1996) mengemukakan bahwa model full inclusion adalah pelayanan pendidikan dimana setiap ABK tidak hanya yang ringan, tetapi juga sedang ikut berpartisipasi aktif dalam semua kegiatan rutin anak normal. Mainstreaming adalah bentuk pelayanan dimana ABK belajar bersama-sama dengan anak normal atau berpartisipasi aktif dalam beberapa bidang studi di kelas normal. Self-contained ialah model pelayanan inklusi dimana ABK mendapat pelayanan di ruangan khusus di sekolah reguler. Mereka memiliki dan mengikuti waktu terbanyak di kelas khusus dari guru pendidikan khusus. Direktorat Pembinaan Sekolah Luar Biasa (2007) menguraikan mengenai penyelenggaraan pendidikan inklusif adalah sebagai berikut. Pertama, kriteria sekolah. Setiap satuan pendidikan formal, pada dasarnya dapat menyelenggarakan pendidikan inklusif sesuai dengan sumberdaya yang tersedia. Untuk menghindari kemungkinan terjadinya implementasi penyelenggaraan yang kurang sesuai, maka setiapsatuan pendidikan yang akan menyelenggarakan pendidikan inklusif perlu memenuhi beberapa kriteria seperti: (a) terdapat ABK; dan (b) kesiapan sekolah Kedua, layanan dalam pendidikan inklusif yang terdiri dari beberapa hal seperti berikut. a. Layanan pendidikan penuh dimana semua ABK belajar bersama-sama di dalamkomunitas kelas yang beragam dibawah bimbingan guru kelas. Peran guru pendamping khusus (GPK) bertanggung jawab dalam pembuatan program, monitor pelaksanaan program, dan mengevaluasi pelaksanaan program. b. Layanan pendidikan yang dimodifikasi adalah ABK belajar bersama-sama dengan anak pada umumnya dalamkomunitas kelas yang beragam dibawah bimbingan guru kelas, guru bidang studi, atau guru lainnya untuk mata pelajaran dan aktivitas yang dapat diikuti oleh ABK dengan baik. Sedangkan untuk GPK berperan dalam membimbing beberapa aktivitas tertentu yang tidak dapat diikuti oleh ABK dengan menggunakan PPI. c. Layanan pendidikan individualisasi dimana ABK mengikuti proses belajar bersamasama anak pada umumnya dalam komunitas kelas yang beragam dibawah bimbingan penuh GPK dengan menggunakan PPI. Ketiga, manajemen sekolah meliputi: (a) pengelolaan peserta didik; (b) pengelolaan kurikulum; (c) pengelolaan pembelajaran; (d) pengelolaan penilaian; (e) pengelolaan pendidik dan tenaga kependidikan; (f) pengelolaan sarana dan prasarana; (g) pengelolaan pembiayaan; dan (h) pengelolaan sumberdaya masyarakat. Keempat, identifikasi dan asesmen meliputi: (a) asesmen fungsional; dan (b) asesmen klinis. Kelima, kurikulum yang digunakan dalam penyelenggaraan program pendidikan inklusif pada dasarnya menggunakan kurikulum yang berlaku di sekolah umum. Bagi ABK, Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
57
kurikulum disesuaikan dengan dengan tingkat kebutuhan karena hambatan dan kemampuan sangat bervariasi. Penyesuaian kurikulum diimplementasikan dalam bentuk PPI. Keenam, sistem penilaian: (a) sistem penilaian yang digunakan; (b) sistem kenaikan kelas; dan (c) sistem laporan hasil belajar. Ketujuh, bimbingan dan konseling. Kedelapan pendidikan dan tenaga kependidikan: (a) pengertian dan ruang lingkup; dan (b) tugas pendidik. Kesembilan, sarana dan prasarana yang menunjang. Kesepuluh, pembiayaan. Kesebelas, pemberdayaan masyarakat, dan kedua belas, mekanisme penyelenggaraan. Berdasarkan uraian di atas dapat disimpulkan bahwa SD yang menyelenggarakan program pendidikan inklusif harus mengikuti pedoman penyelenggaraan yang dikeluarkan oleh direktorat PSLB. Jika belum mengikuti dengan pedoman seperti yang telah diuraikan di atas, maka sekolah perlu melengkapi persyaratan tersebut terutama yang menyangkut program layanan dan fasilitas yang dibutuhkan untuk meningkatkan kualitas layanan pendidikan tersebut.. Istilah asesmen digunakan dalam berbagai bidang. Dalam bidang pendidikan, asesmen diartikan sebagai suatu proses pengumpulan informasi. Dikatakan demikian karena pelaksanaan proses asesmen berlangsung terus menerus dan berkesinambungan. Lerner (1988) mengemukakan bahwa asesmen adalah suatu proses pengumpulan informasi tentang seorang anak yang akan digunakan untuk membuat pertimbangan dan keputusan yang berhubungan dengan anak tersebut. Tujuan utama dari suatu asesmen adalah untuk memperoleh informasi yang dapat digunakan sebagai bahan pertimbangan dalam merencanakan program pembelajaran. Hargrove dan Poteet (1984) asesmen merupakan salah satu dari tiga aktivitas evaluasi pendidikan. Ketiga aktivitas tersebut adalah (1) asesmen; (2) diagnostik; dan (3) preskriptif. Dengan demikian, asesmen dilakukan untuk menegakkan diagnosis, dan berdasarkan diagnosis tersebut dibuat preskripsi. Preskripsi tersebut dalam bentuk aktualnya adalah berupa program pendidikan yang diindividualkan. Meskipun asesmen pertama kali dilakukan sebelum kegiatan pembelajaran, tapi asesmen sesungguhnya berlangsung sepanjang proses pembelajaran. Hasil asesmen dengan menggunakan prinsip-prinsip yang ada, seperti yang telah diuraikan di atas, maka guru dapat menyusun suatu program pembelajaran yang sesuai dan model layanan sesuai dengan kebutuhan anak. Misalnya, anak memiliki permasalahan dalam motorik halus, maka guru perlu merancang pembelajaran yang berhubungan dengan motorik halus yang dilengkapi dengan model layanannya.
58
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Screening and identification Referral Assessment
Formal Decision Making
Informal
Program Design
Legal Evaluation
Instructional
Annual Review
Gambar 1. Model Program Assessment untuk Anak Berkebutuhan Khusus Asesmen pendidikan fokus pada banyak aspek belajar di sekolah maupun faktor lain yang dapat mempengaruhi prestasi sekolah. Bidang yang dikaji meliputi akademik, bahasa, sosial, dan ketrampilan lain. Secara khusus, sikap belajar yang teramati dan terukur serta gaya/cara belajar anak dianalisa. Sejumlah faktor lingkungan juga diperhatikan. Berikut ini akan digambarkan model program asesmen untuk anak berkebutuhan khusus (McLoughlin dan Lewis, 2008). Berbagai permasalahan yang dialami oleh anak SD kelas rendah, sehingga guru perlu memahami kemampuan, permasalahan dan kebutuhan anak berkebutuhan khusus, maka perlu dilakukan asesmen. Namun prosedur asesmen yang digunakan sering berbeda karena disesuaikan dengan tingkat kesulitan dalam belajar dan kebutuhan anak. Dengan demikian maka guru perlu mengetahui secara pasti mengenai gangguan yang dialami anak. Sebagaimana yang ditunjukkan dalam Gambar 1, ada sejumlah tahapan dalam mengembangkan program anak berkebutuhan khusus. Pertama, siswa diidentifikasi kemungkinan bermasalah melalui screening dan pengamatan. Guru kelas, orangtua dan pihak lain harus mengetahui ciri-ciri siswa yang mungkin mempunyai masalah belajar. Siswa-siswa ini disiapkan untuk asesmen yang mendalam. Kedua, petugas sekolah yang tepat mengkaji informasi yang ada tentang siswa tersebut untuk asesmen. Mereka harus membuat keputusan tentang apakah tes lebih lanjut Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
59
dibutuhkan. Catatan-catatan, nilai tes, dan informasi lainnya diperhatikan. Kadang-kadang masalahnya jelas hanya bersifat temporer atau dapat dengan mudah diatasi dengan perobahan dalam kurikulum, kondisi lingkungan dan teknik mengajar. Ketiga, suatu asesmen dilakukan untuk siswa-siswa yang menunjukkan kebutuhan khusus yang nyata, setelah mendapat izin dari orangtua. Asesmen mendalam melibatkan tes formal maupun prosedur informal. Hasilnya digunakan untuk menetapkan kelayakan mereka untuk pendidikan khusus dan untuk mengarahkan program pengajaran dengan mengidentifikasi tujuan dan sasaran. Keempat, Suatu tim ahli memutuskan apakah siswa layak mendapatkan layanan pendidikan khusus. Data asesmen harus memenuhi persyaratan kelayakan menurut peraturan yang ada. Keputusan pengajaran juga didasarkan atas data asesmen, yang meliputi tujuan tahunan, tujuan jangka pendek, orang yang bertanggung jawab dalam mencapai tujuan, dan lain-lain. Setelah siswa telah ditetapkan sebagai anak berkebutuhan khusus (membutuhkan layanan khusus), orangtua dilibatkan dalam menentukan tujuan pendidikannya. Kelima, sifat khusus dari rencana pengajaran untuk anak berkebutuhan khusus tersebut dikembangkan oleh sebuah tim. Tujuan dinyatakan secara lebih cermat, aktivitasnya ditentukan, dan bahan-bahan yang diperlukan ditentukan atau dibuat. Siswa mulai menerima layanan. Keenam, monitoring evaluasi terhadap kemajuan siswa dilakukan selama program. Hasilnya digunakan untuk memodifikasi rencana pengajaran sesuai kebutuhan, tetapi perubahan dalam rencana perlu disetujui orangtua. Ketujuh, review tahunan memperhatikan hasil dari program. Untuk memutuskan apakah layanan khusus perlu dilanjutkan, dan jika perlu modifikasi apa yang perlu dilakukan. Tambahan asesmen formal atau informal dapat dilakukan, keputusan sebelumnya dan rencananya dikaji. Dengan demikian dapat disimpulkan bahwa terdapat 7 langkah untuk melakukan asesmen pada berkebutuhan khusus seperti: mengidentifikasi kemungkinan masalah yang dihadapi siswa. Guru mengkaji tentang hasil identifikasi kemudian membuat keputusan tentang jenis tes yang akan digunakan. Asesmen bisa digunakan setelah mendapat izin dari orangtua. Hasil digunakan untuk menetapkan kelayakan mereka untuk pendidikan khusus, dan menyusun program pengajaran. Selain itu, tim ahli harus memutuskan apakah siswa layak untuk mendapatkan layanan pendidikan khusus. Rencana pembelajaran untuk anak berkebutuhan khusus perlu dikembangkan oleh suatu tim. Monitoring evaluasi terhadap kemajuan siswa selama mengikuti kegiatan. Hasilnya dapat digunakan untuk memodifikasi kegiatan. Dan perlu adanya review tahunan untuk menentukan apakah layanan perlu dilanjutkan. Dari tujuh langkah tersebut di atas, belum ada langkah yang menjelaskan tentang pelaksanaan pembelajaran. Untuk itu, perlu dilengkapi satu langkah yaitu pelaksanaan dan layanan pembelajaran yang digunakan guru untuk anak yang termasuk dalam kategori berkebutuhan khusus. Proses ini dapat menilai sifat psikologis, maupun ketrampilan akademik, sosial, vokasional, dan lain-lain. Kemampuan siswa dan hasil belajarnya maupun faktor lingkungan dapat dikaji tergantung pada sifat dari masalah siswa yang bersangkutan dan peraturan tentang kecacatan yang berlaku. 60
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Validitas suatu tes tidaklah berlaku umum untuk semua tujuan ukur. Sebuah tes biasanya hanya menghasilkan ukuran yang valid untuk satu tujuan tertentu. Suatu tes dikatakan reliabel apabila item-item instrumen konsisten menukur trait seseorang sehingga keaegan hasil pengukuran dilakukan pada subjek yang sama pada waktu berbeda (Djemari Mardapi, 2005). Untuk menentukan koefisien reliabilitas, Mehrens dan Lehmann (1973) mengemukakan bahwa walaupun tidak ada kesepakatan secara umum tentang hasil koefisien reliabilitas, namun agar tes itu dapat digunakan untuk membuat keputusan tentang siswa secara perorangan maka harus memiliki koefisien reliabilitas sebesar 0,85. Dengan demikian dapat dikatakan bahwa dalam penelitian ini tes seleksi yang digunakan untuk menentukan keputusan siswa secara perorangan, maka digunakan koefisien reliabilitas minimal 0,85.
METODE PENELITIAN Penelitian ini merupakan penelitian pengembangan (Borg, W.R., 1981). Penelitian ini termasuk dalam tahap pengembangan meliputi: validasi instrumen asesmen, uji coba kelompok terbatas, revisi, uji coba skala luas dan uji efektivitas instrumen asesmen. Tahapan penelitian pada tahun Kedua digambarkan sebagai berikut. Tahun II Validasi model asesmen Uji coba terbatas, revisi, ujicoba skala luas, revisi instrumen asesmen Menentukan anak SD berkebutuhan khusus
InstrumenAsesmen untuk Mendeteksi ABK di SD Inklusif
Sosialisasi dan Penyebarluasan Model
Gambar 2. Tahap Penelitian Tahun Kedua Penentuan lokasi ditentukan secara purposive atau dipilih dengan tujuan dan sengaja, karena karakteristik wilayah yang dipilih sesuai dengan tujuan penelitian yaitu Sekolah Dasar yang menyelenggarakan program inklusif di kota Manado propinsi Sulawesi Utara.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
61
Tabel 1. Jumlah Siswa SD Kelas Rendah dan Guru Khusus di SD Inklusif Kota Manado No.
Nama Sekolah
Jumlah Siswa
Jumlah Guru
1.
SD Negeri 8 Manado
52
1
2.
SD Negeri 17 Manado
56
1
3.
SD GMIM 35 Manado
32
2
4.
SD GMIM 16 Manado
28
-
Jumah
168
4
Metode Pengumpulan data Secara garis besar metode pengumpulan data dalam tahap kedua penelitian ini akan menggunakan 4 metode yang saling melengkapi yaitu :
Untuk menghitung validitas instrumen asesmen (motorik kasar, halus, dan sosial emosional), maka digunakan ekspert. Untuk menguji reliabilitas instrumen yang pengukurannya menggunakan skala Likert maka digunakan rumus Cronbach Alpha
Untuk mengetahui apakah anak termasuk dalam kategori di atas normal, normal, atau dibawah normal, maka digunakan kategorisasi. Tujuan kategorisasi ini adalah menempatkan individu kedalam kelompok-kelompok yang terpisah secara berjenjang menurut suatu kontinum berdasarkan atribut yang diukur, dengan menggunakan penggolongan subyek ke dalam 3 kategori (Azwar, 2001) seperti berikut ini.
Di atas Normal > Mi + SDi Normal Mi – SDi < skor ≤ Mi + SDi Di bawah Normal ≤ Mi – SDi
Pada tahap II, penelitian ini menggunakan penggolongan subyek ke dalam 3 kategori. Perhitungan untuk menentukan anak yang termasuk dalam kategori berkebutuhan khusus dan perhitungan statistik deskriptif menggunakan bantuan program SPSS for window. HASIL PENELITIAN Hasil Validasi Instrumen Asesmen Berikut ini akan diuraikan hasil validasi instrumen asesmen dengan melibatkan Expert dalam bidang PLB, PAUD, Psikolog dan Pengukuran Setelah uji ahli tentang model asesmen untuk anak SD kelas rendah yang dilengkapi dengan panduan guru selesai, peneliti merevisi masukan-masukan dari para ahli untuk melengkapi produk tersebut. Uji coba kelompok kecil atau kelompok terbatas (small group) pada pengguna dalam situasi nyata adalah untuk memperoleh informasi guna penyempurnaan model asesmen. Sasaran subjek coba untuk kelompok kecil adalah siswa SD GMIM 16. Jumlah anak yang terlibat dalam uji coba kelompok kecil sebanyak 30 (tiga puluh) anak SD kelas I.
62
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Tabel 2. Hasil Uji Reliabilitas Instrumen No.
Variabel
Hasil Perhitungan
Keterangan
1.
Motorik Kasar
0,78
Reliabel
2.
Motorik Halus
0,82
Reliabel
3.
Sosial emosional
0,78
Reliabel
Untuk mendapatkan ukuran lingkar kepala anak, maka digunakan grafik lingkar kepala dengan membandingkan antara usia anak dengan ukuran lingkar kepala anak. Ukuran lingkar kepala antara anak laki-laki dan perempuan berbeda. Cara menilai lingkar kepala adalah : bila ukuran lingkaran kepala anak berada diantara garis putus-putus maka lingkaran kepala anak digolongkan normal. Bila ukuran lingkar kepala anak berada di atas garis putusputus atas ataupun di bawah garis putus-putus bawah, maka ukuran lingkar kepala anak tidak nomal dan perlu mendapatkan pemeriksaan yang lebih lanjut. Berikut ini akan disajikan tabel tentang perbandingan usia anak dengan ukuran lingkar kepala dengan menggunakan grafik seperti berikut ini. Tabel 3. Klasifikasi Lingkar Kepala Anak Laki-laki Berdasarkan Kelompok Umur 5 - 6 Tahun No. 1. 2. 3. 4. 5. 6. 7.
Umur 7 tahun 6 tahun 7 tahun 6 tahun 7 tahun 7 tahun 6 tahun
8.
Jumlah
Lingkar Kepala 45 cm 47 cm 48 cm 49 cm 50 cm 51 cm 52 cm
Jumlah 2 4 4 14 27 10 21
82
Berdasarkan cara menilai lingkar kepala dengan membandingkan usia anak, dan memvisualisasikan dalam grafik lingkar kepala menurut jenis kelamin anak laki-laki berusia 6-7 tahun, maka: (1) terdapat 10 anak atau 12,20 % berada di atas garis putus-putus atas ataupun di bawah garis putus-putus bawah, maka ukuran lingkar kepala anak tidak nomal dan perlu mendapatkan pemeriksaan yang lebih lanjut; (2) terdapat 52 anak atau 63,41% berada diantara garis putus-putus di atas median, maka lingkaran kepala anak digolongkan normal; dan (3) terdapat 20 anak atau 24,39% berada di atas garis putus-putus atas, maka lingkaran kepala anak digolongkan di atas normal. Tabel 4. Klasifikasi Lingkar Kepala Anak Perempuan Berdasarkan Kelompok Umur 5 – 7 Tahun No. 1. 2. 3. 4. 5. 6. 7. 8.
Umur 6 tahun 6 tahun 7 tahun 6 tahun 7 tahun 7 tahun 6 tahun 6 tahun Jumlah
Lingkar Kepala 44cm 46 cm 47 cm 48 cm 49 cm 50 cm 51 cm 52 cm
Jumlah 3 3 4 15 7 34 9 11 86
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
63
Berdasarkan cara menilai lingkar kepala dengan membandingkan usia anak, dan memvisualisasikan dalam grafik lingkar kepala menurut jenis kelamin anak perempuan berusia 5 tahun, dengan membandingkan usia anak, maka: (1) terdapat 10 anak atau 11,63 % berada di atas garis putus-putus atas ataupun di bawah garis putus-putus bawah, maka ukuran lingkar kepala anak tidak nomal dan perlu mendapatkan pemeriksaan yang lebih lanjut; (2) terdapat 56 anak atau 65,12% berada diantara garis putus-putus di atas median, maka lingkaran kepala anak digolongkan normal; dan (3) terdapat 20 anak atau 23,56% berada di atas garis putus-putus atas, maka lingkaran kepala anak digolongkan di atas normal Untuk mengetahui apakah perkembangan fisik anak khususnya tinggi badan dan berat badan termasuk dalam kategori normal, maka digunakan standar pemantauan pertumbuhan balita. Dalam standar pemantauan pertumbuhan balita terdiri dari 4 kategori yaitu : sangat kurus, kurus, normal dan kegemukan. Untuk menentukan apakah anak termasuk dalam salah satu kategori seperti yang diuraikan di atas, maka perlu dibandingkan antara tinggi badan dengan berat badan. Berdasarkan hasil perbandingan tersebut, maka dapat menentukan perkembangan fisik anak khususnya tinggi badan dan berat termasuk dalam kategori normal atau tidak. Berikut ini akan disajikan tabel tentang perkembangan fisik anak. Tabel 5. Perkembangan Fisik Anak TK No.
Jenis Kelamin
1 Laki-laki 2 Perempuan Jumlah
Perkembangan Fisik Anak Sangat Kurus 3 3 6
Jumlah
Kurus
Normal
Kegemukan
7 7 14
66 68 134
6 8 14
82 86 168
Berdasarkan hasil perbandingan dengan menggunakan standar pertumbuhan balita, maka perkembangan fisik anak bervariasi menurut tingkatannya yaitu: (1) 3 (3,65%) anak laki-laki termasuk dalam kategori sangat kurus, dan 3 (3,49%) anak perempuan termasuk dalam kategori sangat kurus; (2) 7 (8,54%) anak laki-laki termasuk dalam kategori kurus, dan 7 (8,14%) anak perempuan termasuk dalam kategori kurus; (3) 66 (80,49%) anak laki-laki termasuk dalam kategori normal, dan 68 (79,07%) anak perempuan termasuk dalam kategori normal; dan (4) 6 (7,32%) anak laki-laki termasuk dalam kategori kegemukan, dan 8 (9,30%) anak perempuan termasuk dalam kategori kegemukan. Dari 20 anak yang termasuk dalam kategori berkebutuhan khusus, terdapat 14 (70%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) secara normal, 2 (10%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) yang kurus, dan 4 (20%) anak memiliki perkembangan fisik (tinggi badan dan berat badan) yang sangat kurus. Selain itu, ukuran lingkar kepala anak, dari 20 anak terdapat 13 (65%) anak yang memiliki lingkar kepala yang normal, 3 (15%) anak laki-laki memiliki lingkar kepala yang tidak normal, dan 4 (20%) anak perempuan memiliki lingkar kepala yang tidak normal. Untuk mengetahui apakah anak termasuk dalam kategori di atas normal, normal, atau dibawah normal, maka digunakan kategorisasi. Tujuan kategorisasi ini adalah menempatkan individu kedalam kelompok-kelompok yang terpisah secara berjenjang menurut suatu kontinum berdasarkan atribut yang diukur, dengan menggunakan penggolongan subyek ke dalam 3 kategori (Azwar, 2001) seperti berikut ini.
64
Di atas Normal > Mi + SDi Normal Mi – SDi < skor ≤ Mi + SDi Di bawah Normal ≤ Mi – SDi Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Untuk mengelompokkan anak dalam tiga kategori seperti yang telah diuraikan di atas, maka digunakan bantuan program SPSS for window yang hasilnya dapat dilihat pada tabel berikut ini. Tabel 6. Hasil Perhitungan Pengelompokan Anak dalam 3 Kelompok No 1. 2. 3.
Pengelompokkan Di atas Normal Normal Di bawa Normal Jumlah
Jumlah 64 84 20 168
PEMBAHASAN HASIL PENELITIAN Dalam penyelenggaraan pendidikan formal di Indonesia hanya mengenal dua bentuk yaitu sekolah biasa (regular) dan sekolah luar biasa (special school). Sekolah biasa secara eksklusif hanya diperuntukkan bagi siswa yang dikategorikan normal. Begitu juga dengan sekolah luar biasa yang secara eksklusif juga hanya diperuntukkan bagi siswa yang berkelainan atau luar biasa. Namun dengan meningkatnya kepedulian dan kesadaran masyarakat dunia untuk mewujudkan pendidikan yang holistik dan dapat diakses oleh semua individu, maka terciptalah komitmen yang berskala internasional untuk melaksanakan pendidikan inklusif di seluruh belahan dunia termasuk Indonesia. Program inklusif telah diselenggarakan pada beberapa SD yang ada di Provinsi Sulawesi Utara khususnya Kota Manado sejak beberapa tahun yang lalu. Banyak kegiatan yang telah diikuti oleh para guru di sekolah tersebut untuk meningkatkan kualitas guru untuk mengajar pada ABK seperti pelatihan yang diselenggarakan baik di tingkat regional maupun nasional. Namun kenyataan menunjukkan bahwa dalam pembelajaran di kelas anak normal belajar bersama-sama dengan ABK dengan menggunakan RPP yang sama. Padahal kemampuan antara anak normal dan ABK berbeda, sehingga hasil belajar yang dicapai ABK tidak sesuai dengan yang diinginkan. Pada umumnya anak kelas rendah yang sekolah di SD yang menyelenggarakan program inklusif termasuk dalam kategori berkesulitan belajar seperti: matematika, membaca, atau menulis. Melalui pengetahuan guru tentang ABK, maka guru yang mengajar di sekolah inklusif, seharusnya perlu mengidentifikasi serta memperhatikan ciri-ciri dari siswanya. Setelah memperhatikan ciri-ciri tersebut, maka guru perlu memperhatikan permasalahan yang dihadapi anak di kelas. Berdasarkan informasi tersebut, maka guru perlu melakukan asesmen untuk mengetahui kemampuan anak sehingga guru perlu menyusun RPP khusus untuk ABK dengan menggunakan PPI. Untuk mengetahui apakah PPI yang disusun guru telah berhasil, maka selanjutnya perlu dilakukan evaluasi sehingga dapat diketahui apakah anak telah menguasai materi yang diberikan guru. Apabila anak telah menguasai materi yang telah diberikan guru, maka anak akan belajar bersama-sama dengan anak normal pada umumnya. Apabila hasil yang dicapai anak belum mencapai tingkat penguasaan sebesar 70%, maka guru perlu mengulangi kembali pada bagian yang belum dikuasai anak. Namun di SD yang menyelenggarakan program inklusif, belum melakukan langkah-langkah seperti yang telah diuraikan di atas karena guru hanya mengetahui saja bahwa di kelasnya terdapat ABK tetapi dalam pembelajaran guru belum menggunakan strategi pembelajaran yang sesuai dengan kebutuhan ABK di kelas yaitu dengan menggunakan PPI. Untuk membantu guru agar program pembelajaran di kelas dapat berhasil dengan baik, maka dalam penelitian ini peneliti menyusun model asesmen yang terdiri dari motorik Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
65
kasar, halus dan sosial emosional untuk mendeteksi anak yang termasuk dalam kategori berkebutuhan khusus di SD kelas rendah. Skor tentang motorik kasar, halus dan sosial emosional yang diperoleh anak dijumlahkan kemudian ditransformasikan ke z skor. Jika hasil yang diperoleh anak termasuk dalam -3 dalam daerah kurva normal, maka anak dapat dikategorikan dalam kategori berkebutuhan khusus. Setelah menyusun model asesmen untuk mengetahui jenis kebutuhan khusus yang dihadapi anak, maka langkah selanjutnya adalah menyusun contoh model layanan khususnya untuk mata pelajaran matematika dengan menggunakan PPI. Selanjutnya, model layanan dapat disusun guru dengan melihat contoh yang disusun oleh peneliti berdasarkan materi pelajaran yang akan diajarkan. Model asesmen ini dapat digunakan guru pada waktu anak masuk kelas I (kira-kira 2 minggu) setelah anak masuk sekolah. Hal ini akan membantu guru untuk mengetahui kemampuan awal yang dimiliki anak. Apabila anak mengalami permasalahan, maka guru dapat menyusun model layanan tertentu dengan menggunakan PPI sehingga anak dapat mengembangkan kemampuan yang dimilikinya. KESIMPULAN DAN SARAN Kesimpulan 1. Sebelum model asesmen digunakan untuk penelitian, maka dilakukan validasi instrumen dengan melibatkan para ahli seperti : ahli PLB, PAUD, Psikolog, dan pengukuran. 2. Hasil validasi dengan melibatkan pakar menunjukkan bahwa hal-hal yang perlu diperhatikan dalam penyusunan asesmen adalah: ketepatan isi, ketepatan bahasa, ketepatan skala yang digunakan dan kemenarikan. 3. Analisis yang digunakan untuk mengetahui reliabilitas instrument adalah Cronbach Alpha dengan menggunakan bantuan program SPSS for window 4. Hasil reliabilitas instrument untuk motorik kasar sebesar 0,78, motorik halus sebesar 0,82, dan social emosional 0,78. 5. Model asesmen ini dikembangkan dari ketrampilan motorik kasar, motorik halus, dan sosial emosional digunakan dalam penelitian ini dengan melibatkan anak SD kelas rendah. Untuk menentukan apakah anak SD kelas rendah yang terlibat dalam penelitian ini termasuk dalam kategori berkebutuhan khusus, dengan menggunakan penggolongan subyek ke dalam 3 kategori 6. Hasil perhitungan asesmen fisik, motorik kasar, motorik halus dan social emosional dengan menggunakan menggunakan penggolongan subyek ke dalam 3 kategori menunjukkan bahwa dari sampel sebanyak 168 anak SD kelas rendah, terdapat 20 anak yang termasuk dalam kategori berkebutuhan khusus seperti: tunagrahita dan berkesulitan belajar. Saran-saran 1. Bagi guru yang mengajar di SD inklusif, penerapan model asesmen bisa dilaksanakan setelah anak mengikuti kegiatan di sekolag kurang lebih dua minggu sampai satu bulan, sehingga dapat membantu guru untuk menyusun RPP dalam bentuk tematik dan PPI dilanjutkan dengan analisis tugas. 2. Guru perlu menyusun PPI yang dilanjutkan dengan analisis tugas sesuai dengan kemampuan anak. 66
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3. Model asesmen sebagai salah satu pendekatan asesmen yang digunakan untuk mendeteksi anak SD kelas rendah yang termasuk dalam kategori berkebutuhan khusus. 4. Diharapkan, guru dapat mengembangkan model layanan untuk meningkatkan kemampuan anak khususnya untuk 4 mata pelajaran inovatif dengan menggunakan model pembelajaran tematik DAFTAR KEPUSTAKAN
Abdurrahman, Mulyono. 1996. Pendidikan bagi anak berkesulitan belajar. Jakarta: Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan Tinggi. Proyek Pendidikan Tenaga Guru Amin, Muh., 1995. Orthopedagogik unagrahita. Jakarta: Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan Tinggi. Proyek Pendidikan Tenaga Guru Azwar S., (2005). Dasar-dasar psikometri. Yogyakarta: Pustaka Pelajar. Bowd, A., (1994). Exceptional children in class. Australia: Hargreen Publishing company Borg, W.R (1981). Applying educational research, New York: Longman. Direktorat PSLB., 2007. Prosedur operasi standar pendidikan inklusi. Jakarta: Dirjen Mendikdasmen Depdiknas Djemari Mardapi (2005). Pengembangan instrumen penelitian pendidikan. Yogyakarta: Program Pascasarjana UNY Faison-Hodge, J., Porretta, D.L., (2004). Physical activity levels of students with mental retardation and student without disabilities. Journal of Adapted physical activity quarterly, 21, 139-152. Human kinetics publishers, Inc. Hargrove L.J., & Poteet J.A., (1984). Assessment in special education: the education evaluation. New Jersey: Prentice-Hall Howard, V.P., Williams B.F., & Eppert C., 1996. Very young children with special needs. A formation approach for the 21st century. New Jersey: upper source river prenticer-hall inc., Kirk S.A, & Gallagher J.J. (1986). Educating exceptional children. Boston: Houghton Miffin Company. MecLoughlin, J.A., Lewis, R.B., (2008). Assessing special students. Ohio Colombus: Charles Merril Publishing Company. Mehrens dan Lehman, 1973. Measurement and Evaluation in Education and Psychology. New York: Holt Rinehard and Winston Nasichin, 2002. Kebijakan Direktorat PLB tentang layanan pendidikan inklusi bagi anak berkebutuhan. Pendidikan khusus dan berkesulitan belajar. Makalah: disajikan pada seminar ilmiah UPI Porrette, D.L., (2004) Physical activity levels of students with mental retardation and students without disabilities. Adapted Physical Activity Quarterly: 2004, 21, 139 -152. Human Kinetics Publishers, Inc. Undang-undang Sisdiknas, 2003. Undang-undang sistem pendidikan nasional. Yogyakarta: Pustaka Pelajar
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
67
68
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
PENGARUH ORGANIZATION-BASED SELF-ESTEEM DAN KOMITMEN ORGANISASI TERHADAP ETOS KERJA Ferdian Satriawan dan Miftahuddin Fakultas Psikologi UIN Syarif Hidayatullah, Jakarta Email:
[email protected] Abstrak Penelitian ini bertujuan untuk mengetahui pengaruh organization-based self-esteem dan komitmen organisasi terhadap etos kerja. Penelitian ini menggunakan pendekatan kuantitatif dengan sampel anggota kepolisian pada salah satu Polres di Indonesia. Sampel yang diambil sebanyak 150 anggota yang ditentukan dengan menggunakan teknik non-probability sampling. Instrumen pengumpulan datanya menggunakan Occupational Work Ethic Inventory (OWEI) untuk mengukur etos kerja, Organization-Based Self-Esteem scale (OBSE), dan Organizational Commitment Qoestionairre (OCQ). Metode analisis data yang digunakan adalah analisis regresi multivariat dengan menggunakan program SPSS 16.0. Sedangkan untuk pengujian validitas konstruknya menggunakan program LISREL 8.7. Berdasarkan hasil perhitungan analisis regresi multivariate yang dilakukan atas kedelapan predictor variabel terhadap keempat outcome variabel didapatkan R square masing-masing sebesar 0.253 atau 25.3% untuk etos kerja considerate, 0.266 atau 26.6% untuk etos kerja ambition, 0.294 atau 29.4% untuk etos kerja dependable, dan 0.282 atau 28.2% untuk etos kerja cooperative dengan signifikansi sebesar 0.000 (p<0.05) pada masing-masing outcome variabel tersebut. Keywords: Etos kerja, organization-based self-esteem, komitmen organisasi PENDAHULUAN Globalisasi memaksa setiap perusahaan untuk dapat mengelola dan mengembangkan kualitas sumber daya manusia yang dimilikinya. Kualitas tenaga kerja, seperti indikatorindikator komitmen, tanggung jawab sosial, hati nurani, dan segala usaha yang dapat menjadi subset dari faktor umum yang dinamakan etos kerja (Akbar et.al., 2011). Pengusaha menganggap etos kerja sebagai salah satu atribut yang paling mereka inginkan untuk dimiliki oleh karyawannya, tetapi yang mereka katakan adalah seringkali sulit ditemukan (Hill & Petty, 1995). Flynn (dalam Miller et.al., 2001) menyatakan bahwa dalam suatu survei yang ditujukan kepada 150 manager di Amerika, hampir sekitar 60% diantaranya menempatkan etos kerja sebagai faktor yang paling penting sebagai karakteristik dari calon karyawan yang mereka kehendaki saat proses perekrutan, bahkan melebihi faktor-faktor lainnya seperti kecerdasan (23%), antusiasme (12%), dan pendidikan (4%). Hill dan Petty (dalam Pierson & Holmes, 2002) menemukan bahwa dari perspektif global, pengusaha di AS telah membandingkan pekerja di negeri mereka dengan para pesaingnya di luar negeri dan banyak yang merasa bahwa tenaga kerja Amerika kurang produktif dari rekan-rekan internasional mereka. Perspektif yang kurang lebih sama juga berkembang di Indonesia, Muttaqin (dalam Sajidah, 2009) mengatakan dalam sebuah situs di internet bahwa ada sebuah majalah Internasional Konservatif Reader Degest pernah menilai Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
69
bahwa Indonesia akan sulit keluar dari krisis multidimensi, khususnya yang berhubungan dengan persaingannya di dunia global dikarenakan lemahnya etos kerja dan korupsi yang sudah sangat akut (“Indonesian has lousy work ethic and serious corruption”), bahkan sebuah prediksi ilmiah mengatakan bahwa jika Indonesia tidak bisa mengatasi masalah etos kerja bangsanya, maka sekitar seperempat abad kemudian, di saat bangsa-bangsa Asia Tenggara lainnya telah menjadi negara maju atau tinggal landas dalam istilah orde baru– maka Indonesia hanya akan menjadi halaman belakang (backyard) kawasan ini. Pernyataan di atas didukung juga oleh data dari United Nations Development Programs (UNDP) pada tahun 2011. UNDP merilis peringkat pembangunan manusia atau HDI (Human Development Index) di 187 negara, dimana Indonesia hanya menempati peringkat ke 124 (dengan indeks sebesar 0.617) dalam HDI-nya. Walaupun data tersebut menunjukkan kenaikan dari HDI pada tahun sebelumnya, yakni sebesar 0.600. Akan tetapi, hal tersebut masih jauh dari kata memuaskan. Sebab, peringkat tersebut masih jauh di bawah negaranegara seperti Singapura (26), Brunei Darussalam (33), Malaysia (61), Thailand (103), dan Filipina (112) yang notabene merupakan negara-negara yang masih berada dalam satu wilayah regional yang sama dengan negara kita (situs resmi United Nations Development Programs atau UNDP, diakses pada tanggal 29 September 2011). Hal tersebut dapat menggambarkan bagaimana rendahnya etos kerja yang dimiliki oleh para pekerja di Tanah Air. Hal ini tidak terlepas dari kurangnya kesadaran individu terhadap tanggung jawabnya dalam bekerja. Sebab, etos kerja berkembang dari perasaan tanggung jawab moral dalam bekerja dan kepuasan yang dirasakan seseorang dari apa yang ia kerjakan (Timco, 2010). Para peneliti di bidang etika, mempertimbangkan etos kerja sebagai suatu variabel perilaku manusia, dan telah mempelajari korelasinya dengan faktor-faktor yang berbeda. Sekelompok ilmuwan telah mempertimbangkan efek faktor psikologis dalam etos kerja. Cherrington (dalam Akbar et.al., 2011) menemukan hubungan yang signifikan antara etos kerja dan karakteristik psikologis individu, seperti konservatif, motivasi, dan tingkat ambisi serta juga menemukan korelasi positif antara etos kerja dan sikap terhadap uang dan kesuksesan. Heller dan Ruiz-Quintanilla (1995) beranggapan bahwa orang yang menunjukkan nilai-nilai tinggi pada karakteristik seperti halnya etos kerja dan komitmen kerja atau kecintaan pada pekerjaan entah bagaimana lebih efektif atau produktif dan akibatnya lebih berharga sebagai manajer dan karyawan. Dari beberapa penelitian yang ada telah menunjukkan dengan jelas bahwa etos kerja menjadi perhatian para atasan atau pengusaha. Faktor-faktor yang diidentifikasi dalam penelitian tersebut dapat memandu mereka untuk mengevaluasi etos kerja sebagai bagian dari keterampilan kerja yang diperlukan untuk sukses di tempat kerja (Hill & Petty, 1995). Etos kerja diyakini berhubungan erat dengan beberapa variabel “individual differences” (Roth et.al., 1999). Salah satunya adalah self-esteem. Menurut Bryce, Haworth, Wang dan Biddle (dalam Timco, 2010) bahwa banyak manfaat dari keikutsertaan dalam berbagai aktifitas yang bersifat rekreasi yang juga merupakan faktor-faktor yang berkontribusi pada etos kerja positif atau “positive work ethic” seperti halnya self-esteem dan motivasi positif. Bagi orang yang tidak menganggur atau pensiun, bekerja dapat menyita sebagian besar dari akhir pekan mereka, ini adalah benar bahkan ketika pekerjaan itu tidak dibayar, seperti bagi sebagian besar wanita. Oleh karena itu, pekerjaan terkait erat dengan identitas diri dan perasaan harga diri atau self-esteem (Heller & Ruiz-Quintanilla, 1995). Korman dan Brockner (dalam Gardner et.al., 2004) mengemukakan bahwa self-esteem seorang karyawan merupakan pusat dari penjelasan mengenai prestasi kerja. Konsisten dengan ini, Judge dan Bono (dalam Gardner et.al., 2004) melaporkan “corrected mean” korelasi antara harga diri dan prestasi kerja. Hal itu menunjukkan bahwa harga diri atau self esteem dipandang sebagai salah satu “individual differences” terkuat yang berkorelasi dengan prestasi kerja. 70
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Harga diri atau self-esteem inilah yang seharusnya dimiliki oleh setiap individu dalam perusahaan dengan tujuan untuk meningkatkan prestasi kerja, namun prestasi kerja tidak akan pernah tercapai tanpa adanya etos kerja yang tinggi. Perusahaan sebagai sebuah organisasi tempat individu bekerja, memiliki peranan penting untuk dapat memberikan perasaan berharga dalam diri individu sebagai bagian dari organisasi. Sehingga, muncullah studi mengenai harga diri berbasis organisasi atau organization-based self-esteem yang selanjutnya disingkat dengan OBSE. OBSE mencerminkan evaluasi atau penilaian karyawan terhadap kemampuan dan keberartian pribadi sebagai anggota suatu organisasi (Gardner dan Pierce; dalam McAllister & Bigley, 2002). OBSE mempengaruhi beberapa aspek, antara lain harga diri secara keseluruhan (global self-esteem), motivasi intrinsik, kepuasan secara keseluruhan (general satisfaction), perilaku warga negara (citizenship behavior), komitmen dan kepuasan organisasi, serta prestasi kerja (Kreitner & Kinicki, 2001). OBSE inilah yang diduga ditanamkan oleh organisasi dengan tujuan utama, yaitu prestasi kerja. Tes yang secara ekstensif digunakan untuk mengukur etos kerja telah dikembangkan dan telah menunjukkan hubungan dengan prestasi kerja, motivasi, ambisi, dan faktor-faktor kepribadian lainnya dan sikap seperti konservatisme ekonomi, politik, dan sosial serta kontrol diri dan kemandirian diri (Heller & Ruiz-Quintanilla, 1995). Prestasi kerja dapat dicapai dengan etos kerja yang tinggi, maka organisasi secara “indirect” atau tidak langsung berusaha untuk meningkatkan etos kerja anggotanya. Studi mengenai OBSE sejauh ini masih sangat jarang sekali ditemukan di Indonesia, apalagi mengenai pengaruhnya terhadap etos kerja. Hal ini mungkin saja dikarenakan masih kurangnya referensi dari literatur-literatur yang memuat tentang studi ini atau bisa jadi belum adanya ketertarikan dari para peneliti lain untuk menguji tentang variabel tersebut, atau bahkan mungkin saja beberapa diantara mereka juga masih sangat asing mendengar tentang istilah OBSE ini. Atas dasar pertimbangan tersebut, maka peneliti tertarik untuk mencoba mengetahui apakah variabel OBSE tersebut dapat digunakan sebagai variabel prediktor untuk memprediksi etos kerja di dalam penelitian ini. Kemudian, faktor penting lain yang diyakini mempengaruhi etos kerja adalah komitmen organisasi. Etos kerja yang dikaitkan dengan komitmen organisasi karyawan telah banyak menerima perhatian dari para peneliti (Yousef; dalam Maksum dkk., 2006). Beberapa pendapat, seperti Mu‟ tasim Ab. Rahman et al., Yousef, Kidron, dan Peterson (dalam Yunus et.al., 2011) juga menyatakan bahwa terdapat hubungan yang positif antara komitmen organisasi dengan etos kerja. Pernyataan di atas juga didukung oleh data dari penelitian yang dilakukan oleh Miller et.al. (2001) yang mengungkapkan bahwa terdapat pengaruh yang signifikan komitmen organisasi terhadap etos kerja, yang ditunjukkan oleh koefisien multiple correlation sebesar 0.48. Komitmen dianggap sebagai suatu jaminan psikologis dimana karyawan berada dalam organisasi dan seringkali juga berhubungan dengan nilai-nilai dan tujuan, dan kemungkinan tetap di dalam perusahaan (Mowday et.al.; dalam Maksum dkk., 2006). Adapun menurut Meyer dan Allen (1991) komitmen organisasi terdiri atas komitmen yang melibatkan perasaan (affective commitment), komitmen yang melibatkan pertimbangan untung-rugi (continuance commitment), dan komitmen yang disadari sebagai suatu kewajiban (normative commitment) pada organisasi. Tingginya komitmen seorang karyawan terhadap perusahaan tempat ia bekerja, dapat memberikan suatu “affect” atau pengaruh terhadap tingkat etos kerja-nya pula. Sehingga, bisa dipahami bahwa komitmen organisasi dapat digunakan sebagai variabel prediktor untuk memprediksikan etos kerja di dalam penelitian ini.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
71
METODE PENELITIAN Sampel anggota kepolisianpada salah satu plres di Indonesia, dimana populasinya berjumlah 1937 anggota dengan jumlah sampel yang diambil sebanyak 150 anggota yang ditentukan dengan menggunakan teknik non-probability sampling. Instrumen pengumpulan datanya menggunakan Occupational Work Ethic Inventory (OWEI) untuk mengukur etos kerja, organization-baed self-esteem scale untuk mengukur OBSE, dan Organizational Commitment Qoestionairre (OCQ). Analisis data yang digunakan dalam penelitian ini menggunakan teknik multivariate regression analysis atau analisis regresi multivariat dengan menggunakan program SPSS versi 16.0. Sedangkan untuk pengujian validitas konstruknya menggunakan program LISREL 8.7. HASIL PENELITIAN Berdasarkan hasil perhitungan analisis regresi multivariate yang dilakukan atas kedelapan predictor variabel terhadap keempat outcome variabel didapatkan R square masing-masing sebesar 0.253 atau 25.3% untuk etos kerja considerate, 0.266 atau 26.6% untuk etos kerja ambition, 0.294 atau 29.4% untuk etos kerja dependable, dan 0.282 atau 28.2% untuk etos kerja cooperative dengan signifikansi sebesar 0.000 (p<0.05) pada masing-masing outcome variable tersebut. Sehingga dari keempat hipotesis nihil mayor yang ada, semuanya diterima. Berdasarkan koefisien regresi dari tiap-tiap predictor variable terhadap keempat outcome variable di atas, maka didapati bahwa dari 32 hipotesis minor yang ada, hanya 11 hipotesis minor saja yang diterima. KESIMPULAN Adapun hasilnya adalah sebagai berikut: 1) OBSE secara signifikan mempengaruhi etos kerja considerate; 2) Komitmen organisasi continuance commitment secara signifikan mempengaruhi etos kerja considerate; 3) Komitmen organisasi normative commitment secara signifikan mempengaruhi etos kerja considerate; 4) Status perkawinan secara signifikan mempengaruhi etos kerja considerate; 5) OBSE secara signifikan mempengaruhi etos kerja ambition; 6) OBSE secara signifikan mempengaruhi etos kerja dependable; 7) Komitmen organisasi affective commitment secara signifikan mempengaruhi etos kerja dependable; 8) Komitmen organisasi continuance commitment secara signifikan mempengaruhi etos kerja dependable; 9) OBSE secara signifikan mempengaruhi etos kerja cooperative; 10) Komitmen organisasi affective commitment secara signifikan mempengaruhi etos kerja cooperative; dan 11) Komitmen organisasi continuance commitment secara signifikan mempengaruhi etos kerja cooperative. DISKUSI Dari hasil penelitian ini menunjukkan bahwa hanya variabel organization-based self-esteem atau OBSE yang memiliki pengaruh terhadap keempat outcome variable, yaitu etos kerja– considerate, ambition, dependable, dan cooperative. Sedangkan dari variabel komitmen organisasi yang terdiri dari tiga aspek, yaitu affective commtment, continuance commitment, dan normative commitment memiliki pengaruh dengan dinamika yang berbeda-beda terhadap keempat outcome variable di atas. Sementara itu, dari variabel “individual differences” lainnya hanya variabel status perkawinan yang memiliki pengaruh yang signifikan, itu pun 72
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
hanya terhadap etos kerja considerate. Adapun diskusi mengenai hasil penelitian ini untuk lebih lengkapnya adalah sebagai berikut. Organization-based self-esteem atau OBSE memiliki pengaruh yang signifikan terhadap keempat outcome variable tersebut, dimana OBSE memiliki koefisien regresi sebesar 0.414 (p<0.05) terhadap etos kerja considerate, 0.477 (p<0.05) terhadap etos kerja ambition, 0.478 (p<0.05) terhadap etos kerja dependable, dan 0.402 (p<0.05) terhadap etos kerja cooperative. Adapun dari pengaruh OBSE terhadap keempat outcome variable tersebut seluruhnya bernilai positif. Artinya bahwa semakin tinggi OBSE, maka semakin tinggi pula keempat outcome variable tersebut. Hal ini menunjukkan bahwa individu yang merasa dirinya dipercaya, dihargai, berkontribusi, mampu, penting, berguna, berpengaruh, dan berarti bagi institusi atau organisasi tempat dia bekerja. Maka akan dapat meningkatkan etos kerjanya secara keseluruhan, baik itu etos kerja considerate-nya yang ditunjukkan dengan sikap yang lebih fokus dan memiliki perhatian penuh pada pekerjaannya serta menampilkan ciri-ciri seperti apresiatif, ceria, perhatian, sopan, ramah, membantu, disukai, sederhana, menyenangkan, dan rapih saat bekerja. Kemudian, etos kerja ambition-nya yang ditunjukkan dengan sikap yang lebih berorientasi pada tugas dengan segala macam tantangan dalam penyelesaian tugas-tugas tersebut dan berusaha bekerja dengan semaksimal mungkin demi mencapai harapan-harapan yang dibebankan pada tugas dalam pekerjaannya tersebut untuk mencapai jenjang karir atau prestasi yang diinginkan, serta menampilkan ciri-ciri seperti ambisius, teliti, antusias, bekerja keras, mandiri, inisiatif, tekun, dan gigih saat bekerja. Lalu, etos kerja dependable-nya yang ditunjukkan dengan sikap yang minimal mampu menyelesaikan tugas yang dibebankan sesuai target dan seminimal mungkin menghindarkan diri dari kesalahan-keselahan dasar dalam bekerja, serta menampilkan ciri-ciri seperti akurat, berhati-hati, berdedikasi, dapat diandalkan, memiliki pengabdian, efektif, efisien, emosional stabil, jujur, setia, sabar, produktif, tepat waktu, dan dapat dipercaya saat bekerja. Maupun etos kerja cooperative-nya yang ditunjukkan dengan sikap yang mampu bekerja sama dalam sebuah tim dan rekan seprofesi di tempat kerja untuk menyelesaikan tugas-tugas yang membutuhkan adanya teamwork yang baik dalam penyelesaiannya, serta menampilkan ciriciri seperti mudah beradaptasi, kooperatif, mengikuti aturan, mengikuti perintah, tertib, dan cepat mengerti dalam bekerja. Selanjutnya, komitmen organisasi yang terdiri dari tiga aspek, yaitu affective commtment, continuance commitment, dan normative commitment memiliki pengaruh terhadap keempat outcome variable di atas dengan penjelasan sebagai berikut. Sesungguhnya pada variabel komitmen organisasi dari hasil penelitian yang dilakukan oleh Miller et.al (2001) mengungkapkan bahwa terdapat pengaruh yang signifikan komitmen organisasi terhadap etos kerja, yang ditunjukkan oleh koefisien multiple correlation sebesar 0.48. Akan tetapi, dalam penelitiannya Miller et.al tidak melakukan penurunan variabel dari masing-masing aspeknya. Sedangkan, dalam penelitian ini peneliti meneliti komitmen organisasi dari masing-masing aspeknya, yaitu effective commitment, continuance commitment, dan normative commitment sehingga didapati dinamika dari hasil ketiga aspek tersebut dimana tidak semua aspek berkorelasi atau berpengaruh terhadap keempat outcome variable tersebut. Continuance dan normative commitment memiliki pengaruh yang signifikan terhadap etos kerja considerate dengan koefisien regresi sebesar –0.276 (p < 0.05) untuk continuance commitment dan 0.224 (p < 0.05) untuk normative commitment. Adapun pengaruh continuance commitment bernilai negatif dan normative commitment bernilai positif terhadap etos kerja considerate. Artinya bahwa semakin rendah continuance commitment dan semakin tinggi normative commitment, maka semakin tinggi etos kerja considerate. Hal ini Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
73
menunjukkan bahwa individu dengan continuance commitment atau komitmen yang terlalu didasari oleh adanya pertimbangan untung-rugi untuk tetap bertahan atau keluar dari organisasi atau institusi tempat ia bekerja, justru membuat etos kerja considerate-nya rendah yang membuat mereka hanya bersikap seadanya saat bekerja dan menampilkan ciri-ciri seperti kurangnya apresiasi terhadap rekan seprofesi, tidak adanya perhatian, kurang membantu, dan tidak rapih dalam bekerja. Sebab bagi individu tersebut mungkin untuk saat ini berada di institusi tersebut menguntungkan namun bisa jadi di lain waktu merugikan, sehingga ia akan bekerja dengan setengah hati karena adanya pertimbangan-pertimbangan tersebut yang melandasi komitmennya terhadap organisasi atau institusi tempat ia bekerja. Sedangkan pada individu yang memiliki normative commitment atau komitmen yang didasari oleh adanya perasaan tanggung jawab ataupun kewajiban yang harus dipenuhi sebagai bagian dari organisasi atau institusi tempat mereka bekerja saat ini, justru memberikan efek positif bagi etos kerja considerate-nya yang ditunjukkan dengan sikap yang lebih perhatian dan fokus dalam bekerja serta menampilkan ciri-ciri seperti apresiatif, ceria, perhatian, sopan, ramah, membantu, disukai, sederhana, menyenangkan, dan rapih saat bekerja. Sementara itu, hanya affective commitment saja yang tidak memiliki pengaruh signifikan terhadap etos kerja considerate. Hal ini mungkin saja dikarenakan bahwa ada tidaknya komitmen anggota polisi yang didasari oleh kedekatan secara emosionil atau pribadi, tidak memiliki dampak yang signifikan terhadap etos kerja considerate-nya. Sehingga walaupun seorang anggota polisi memiliki kebermaknaan sebagai anggota dari institusinya dan merasa bahwa institusinya tersebut sudah seperti keluarganya sendiri, hal ini tidak memberikan kontribusi yang signifikan terhadap etos kerja considerate-nya. Kemudian, pada etos kerja ambition tidak satu pun dari ketiga variabel dari komitmen organisasi, yaitu affective commitment, continuance commitment, dan normative commitment yang memiliki pengaruh terhadap outcome varible tersebut. Hal ini mungkin saja dikarenakan dari ketiga aspek komitmen organisasi tersebut memang tidak memberikan suatu dampak atau kontribusi signifikan terhadap etos kerja ambition yang dimaksud yang ditunjukkan dengan sikap yang lebih berorientasi pada tugas dengan segala macam tantangan dalam penyelesaian tugas-tugas tersebut dan berusaha bekerja dengan semaksimal mungkin demi mencapai harapan-harapan yang dibebankan pada tugas dalam pekerjaannya tersebut untuk mencapai jenjang karir atau prestasi yang diinginkan, serta menampilkan ciri-ciri seperti ambisius, teliti, antusias, bekerja keras, mandiri, inisiatif, tekun, dan gigih saat bekerja. Sementara itu pada etos kerja dependable dan cooperative hanya komitmen organisasi affective dan continuance commitment yang memiliki pengaruh terhadap keduanya. Dimana affective commitment memiliki koefisien regresi sebesar 0.191 (p < 0.05) dan continuance commitment memiliki koefisien regresi sebesar –0.251 (p < 0.05) terhadap etos kerja dependable. Adapun pengaruh affective commitment bernilai positif dan continuance commitment bernilai negatif terhadap etos kerja dependable. Artinya bahwa semakin tinggi affective commitment dan semakin rendah continuance commitment, maka semakin tinggi etos kerja dependable. Hal ini menunjukkan bahwa individu yang memiliki affective commitment atau komitmen yang dilandasi oleh adanya kedekatan pribadi dengan organisasinya yang tinggi, dapat membuat mereka merasa nyaman untuk bekerja dan tidak canggung untuk bekerja semaksimal mungkin dengan menampilkan ciri-ciri seperti akurat, berhati-hati, berdedikasi, dapat diandalkan, memiliki pengabdian, efektif, efisien, emosional stabil, jujur, setia, sabar, produktif, tepat waktu, dan dapat dipercaya saat bekerja. Sehingga semakin anggota polisi berkomitmen karena menganggap institusinya sudah seperti bagian dari keluarganya sendiri, maka mereka akan semakin mampu menunjukkan prestasi dan kehandalan mereka dalam bekerja. Sedangkan bagi individu yang memiliki continuance commitment atau komitmen yang didasari oleh pertimbangan akan untung-rugi untuk tetap 74
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
bertahan atau keluar dari organisasi tersebut, justru membuat mereka tidak dapat menunjukkan kemampuan dalam bekerja dengan semaksimal mungkin. Sehingga semakin anggota polisi berkomitmen hanya karena berdasarkan pertimbangan semata, justru mereka menunjukkan etos kerja dependable yang rendah dengan menampilkan ciri-ciri yang ceroboh, tidak dapat diandalkan, kurang efektif dan efisien, kurang produktif, dan tidak tepat waktu saat bekerja. Selanjutnya pada etos kerja cooperative, affective commitment memiliki koefisien regresi sebesar 0.205 (p < 0.05) dan continuance commitment memiliki koefisien regresi sebesar –0.300 (p < 0.05). Adapun pengaruh affective commitment bernilai positif dan continuance commitment bernilai negatif terhadap etos kerja dependable. Artinya bahwa semakin tinggi affective commitment dan semakin rendah continuance commitment, maka semakin tinggi etos kerja dependable. Hal ini menunjukkan bahwa individu yang memiliki affective commitment tinggi, maka ia berkomitmen karena merasa ada kedekatan pribadi dengan organisasinya, sehingga tidak akan merasa canggung apabila harus dituntut bekerja sama dengan rekan kerjanya. Jadi, semakin anggota polisi berkomitmen karena menganggap institusinya sudah seperti bagian dari keluarganya sendiri, maka mereka akan semakin mampu bersikap kooperatif dengan rekan seprofesinya di tempat kerja mereka dengan menampilkan ciri-ciri seperti mudah beradaptasi, bersifat kooperatif, dapat mengikuti aturan dan perintah, serta tertib saat bekerja. Sedangkan bagi individu yang memiliki continuance commitment yang tinggi, maka ia akan berkomitmen pada organisasi namun terlalu didasari oleh pertimbangan akan untung-rugi untuk tetap bertahan atau keluar dari organisasi atau institusinya, sehingga hal itu membuat ia tidak dapat menunjukkan sikap kooperatif dengan rekan seprofesinya yang menuntut adanya kerja sama dalam penyelesaian tugas di tempat kerja. Jadi, semakin anggota polisi berkomitmen hanya karena berdasarkan pertimbangan semata, maka justru mereka menunjukkan etos kerja cooperative yang rendah dengan menampilkan ciri-ciri yang sulit beradaptasi, tidak kooperatif, mudah melanggar aturan dan mengesampingkan perintah, serta tidak tertib saat bekerja. Sementara itu, hanya normative commitment yang tidak memiliki pengaruh terhadap kedua outcome variable tersebut. Hal ini mungkin dikarenakan bahwa seorang anggota polisi yang memiliki komitmen didasari oleh kewajiban atau tanggung jawab terhadap institusinya memang tidak memberikan dampak atau kontribusi signifikan terhadap etos kerja dependable dan cooperative-nya. Berikutnya, untuk hasil penelitian mengenai pengaruh variabel “individual differences” lainnya, maka hanya variabel status perkawinan yang memiliki pengaruh yang signifikan terhadap aspek etos kerja, yaitu etos kerja considerate. Berbeda dengan variabel lainnya yang menggunakan analisis regresi multivariat untuk mengetahui pengaruhnya terhadap outcome variable, namun pada variabel status perkawinan ini untuk mengetahui pengaruhnya terhadap etos kerja considerate, peneliti menggunakan analisis data berupa uji beda dengan independent samples test. Adapun hasil yang diperoleh adalah nilai t sebesar 2.200 (p=0.034 atau p<0.05), artinya adalah bahwa etos kerja considerate yang dihasilkan pada kedua kelompok (kawin dan belum kawin) berbeda secara signifikan. Dengan kata lain, terdapat pengaruh yang signifikan dari status perkawinan terhadap etos kerja considerate. Adapun diantara kedua kelompok tersebut (kawin dan belum kawin), maka kelompok yang sudah kawinlah yang memiliki etos kerja considerate yang lebih tinggi. Hasil penelitian ini bertolak belakang dengan hasil penelitian terdahulu yang dilakukan oleh Tang dan Tzeng (dalam Kim, 2007) yang menemukan bahwa justru orang yang masih lajang atau belum kawin yang menunjukkan komitmen terhadap etos kerja yang Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
75
lebih kuat daripada yang sudah menikah. ketidaksesuaian ini mungkin saja disebabkan oleh karakteristik subjek pada penelitian ini yang lebih banyak pada kelompok yang sudah kawin dengan perbandingan 79.3% untuk subjek yang sudah kawin dan hanya 20.7% untuk subjek yang belum kawin, sehingga tidak adanya proporsionalitas dari data mengenai subjek dengan latar belakang status perkawinan yang belum kawin. Sementara itu, status perkawinan tidak memiliki pengaruh signifikan terhadap ketiga outcome variable lainnya. Hal ini mungkin dikarenakan, bahwa status perkawinan memang tidak memiliki dampak dan kontribusi signifikan terhadap etos kerja ambition, dependable, dan cooperative. Selanjutnya, pada variabel “individual differences” lainnya seperti usia, jenjang kepangkatan, dan lama dinas tidak ditemukan adanya pengaruh yang signifikan terhadap keempat outcome variable di atas. Adapun pada variabel usia memiliki koefisien regresi sebesar –0.454 (p>0.05) terhadap etos kerja considerate, -0.017 (p>0.05) terhadap etos kerja ambition, 0.107 (p>0.05) terhadap etos kerja dependable, dan 0.153 (p>0.05) terhadap etos kerja cooperative. Adapun pengaruh usia terhadap etos kerja considerate dan ambition bernilai negatif. Sedangkan pengaruh usia terhadap etos kerja dependable dan cooperative bernilai positif. Artinya bahwa semakin tinggi usia, maka semakin rendah etos kerja considerate dan ambition dan semakin tinggi etos kerja dependable dan cooperative. Walaupun dari keempat koefisien regresi tersebut tidak satu pun yang menunjukkan adanya pengaruh yang signifikan terhadap keempat outcome variable di atas. Hal ini menunjukkan bahwa semakin tua usia seorang anggota polisi maka semakin tinggi pula etos kerja dependable-nya yang ditunjukkan dengan karakteristik-karakteristik seperti akurat, berhati-hati, berdedikasi, dapat diandalkan, memiliki pengabdian, efektif, efisien, emosional stabil, jujur, setia, sabar, produktif, tepat waktu, dan dapat dipercaya saat bekerja. Hal tersebut tidaklah mengherankan sebab orang yang lebih dewasa dari segi usia pasti akan memiliki jam terbang atau pengalaman yang lebih baik sehingga mereka mampu melakukan pekerjaan dengan tepat dan akurat. Sementara itu, semakin tinggi usia seorang anggota polisi maka semakin tinggi pula etos kerja cooperative yang ditunjukkan dengan karakteristik-karakteristik seperti mudah beradaptasi, kooperatif, mengikuti aturan, mengikuti perintah, tertib, dan cepat mengerti dalam bekerja. Hal ini sangatlah wajar sebab semakin tua usia seseorang pasti mereka akan lebih mampu untuk lebih taat terhadap aturan dan bekerja sama dengan rekan kerja dengan lebih baik. Hasil penelitian ini pun, sejalan dengan hasil penelitian dari Kim (2007) yang menemukan adanya perbedaan besarnya etos kerja pada pekerja korea yang berada di rentangan usia 45–64 tahun yang secara signifikan memiliki skor lebih tinggi daripada mereka yang berada pada rentangan usia 15–24 tahun untuk aspek efisiensi (efficiency) dalam etos kerja. Adapun aspek efisiensi (efficiency) yang dimaksud oleh Kim (2007) merupakan aspek yang ia kembangkan sendiri berdasarkan teori yang juga diungkapkan oleh Petty (dalam Tydings, 2003; Kegans, 2006) sama halnya dengan teori yang peneliti gunakan sebagai landasan teori dalam penelitian ini. Namun demikian, uniknya adalah bahwa walaupun variabel usia tidak memiliki pengaruh yang signifikan, namun variabel usia memiliki kontribusi yang signifikan terhadap salah satu outcome variable yaitu etos kerja cooperative. Hal ini dikarenakan sesungguhnya variabel usia memberikan peranan atau berkontribusi terhadap etos kerja cooperative yang ditunjukkan dengan sikap yang mampu bekerja sama dalam sebuah tim dan rekan seprofesi di tempat kerja untuk menyelesaikan tugas-tugas yang membutuhkan adanya teamwork yang baik dalam penyelesaiannya, serta menampilkan ciri-ciri seperti mudah beradaptasi, kooperatif, mengikuti aturan, mengikuti perintah, tertib, dan cepat mengerti dalam bekerja. Walaupun variabel usia tersebut tidak secara signifikan memberikan dampak terhadap etos kerja cooperative. 76
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Kemudian pada variabel lama dinas memiliki koefisien regresi sebesar 0.203 (p>0.05) terhadap etos kerja considerate, 0.942 (p>0.05) terhadap etos kerja ambition, 1.286 (p>0.05) terhadap etos kerja dependable, dan –0.435 (p>0.05) terhadap etos kerja cooperative. Adapun pengaruh lama dinas terhadap etos kerja considerate, ambition dan dependable bernilai positif. Sedangkan pengaruh lama dinas terhadap etos kerja cooperative bernilai negatif. Artinya bahwa semakin tinggi lama dinas, maka semakin tinggi etos kerja considerate, ambition, dependable dan semakin rendah etos kerja cooperative. Walaupun dari keempat koefisien regresi tersebut tidak satu pun yang menunjukkan adanya pengaruh yang signifikan terhadap keempat outcome variable di atas. Hal ini menunjukkan bahwa untuk etos kerja considerate, ambition dan dependable justru lebih baik pada anggota polisi yang sudah lebih lama berdinas di kepolisian, hasil penelitian ini sejalan dengan hasil penelitian Kim (2007) yang menemukan bahwa pekerja korea yang memiliki masa kerja yang lebih lama selama 6– 12 tahun secara signifikan memiliki skor yang lebih tinggi pada etos kerja daripada mereka yang hanya memiliki masa kerja kurang dari 2 tahun atau dari 2–5 tahun pada aspek etos kerja seperti efisiensi (efficiency). Sementara itu, pada aspek etos kerja seperti ketekunan (devotion), pekerja yang memiliki masa kerja selama lebih dari 12 tahun secara signifikan memiliki skor lebih tinggi pada etos kerja-nya daripada mereka yang hanya memiliki masa kerja kurang dari 2 tahun atau dalam kurun waktu 2–5 tahun. Sedangkan untuk etos kerja cooperative lebih baik ditunjukkan oleh anggota kepolisian yang belum lama bertugas atau berdinas di kepolisian, hal ini sesuai dengan hasil penelitian oleh Hill (dalam Kim, 2007) yang menemukan bahwa orang yang memiliki masa kerja/lama dinas yang lebih lama menunjukkan “mean score” terhadap etos kerja yang lebih rendah daripada orang yang masih baru masa kerja/lama dinas-nya. Dari hasil tersbut menunjukkan bahwa individu-individu dengan pengalaman lebih dalam pekerjaannya mampu menunjukkan sikap yang lebih peduli terhadap pekerjaannya, adanya keinginan peningkatan jenjang karir di dalam pekerjaannya, dan lebih handal dalam mengerjakan tugas-tugas yang dibebankan kepada mereka. Sedangkan pada individu-individu yang masih belum memiliki pengalaman lebih, tidak menunjukkan hal-hal demikian. Namun mereka mampu menunjukkan kerja sama yang baik dengan rekan seprofesi. Terakhir pada variabel jenjang kepangkatan memiliki koefisien regresi sebesar 0.780 (p>0.05) terhadap etos kerja considerate, -0.235 (p>0.05) terhadap etos kerja ambition, 0.703 (p>0.05) terhadap etos kerja dependable, dan –0.953 (p>0.05) terhadap etos kerja cooperative. Adapun pengaruh lama dinas terhadap etos kerja considerate bernilai positif. Sedangkan pengaruh lama dinas terhadap etos kerja ambition, dependable, dan cooperative bernilai negatif. Artinya bahwa semakin tinggi lama dinas, maka semakin tinggi etos kerja considerate dan semakin rendah etos kerja ambition, dependable dan cooperative. Walaupun dari keempat koefisien regresi tersebut tidak satu pun yang menunjukkan adanya pengaruh yang signifikan terhadap keempat outcome variable di atas. Bagaimanapun juga, bila terjadi banyaknya perbedaan dalam hasil penelitian terdahulu dengan hasil penelitian yang peneliti lakukan, itu semua kemungkinan disebabkan oleh beberapa faktor penting, yaitu penelitian terdahulu menggunakan subjek dari bidang atau lingkungan yang berbeda seperti manajemen, pendidikan, ataupun kesehatan. Sedangkan dalam penelitian ini, subjek yang digunakan adalah anggota polisi yang notabene merupakan bagian dari institusi pemerintahan yang bersifat birokratif. Sehingga bisa saja terjadi perbedaan antara organisasi yang bersifat mekanistik atau birokrasi dengan organisasi yang bersifat organik atau fleksibel. Selain itu perbedaan metode dalam menganalisis data yang digunakan dalam penelitian terdahulu lebih banyak menggunakan t-tes atau uji beda, sedangkan dalam penelitian ini metode analisis datanya menggunakan multivariate Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
77
regression analysis. Sementara itu, latar belakang kultur yang berbeda dari penelitian terdahulu juga menyebabkan terjadinya perbedaan dari hasil penelitian ini. Selain hal-hal mengenai hasil penelitian yang telah dipaparkan di atas, peneliti juga mengkritisi mengenai beberapa hal yang pada akhirnya memang menjadi kekurangan penelitian ini. Mengenai alat ukur etos kerja yang dipakai adalah OWEI yang dalam pengukurannya hanya menggunakan facet-facet atau deskriptor-deskriptor sehingga memungkinkan adanya bias, hal ini pun terbukti dalam bagian pengujian validitas kontruk pada bab metodologi penelitian dimana terdapat banyak sekali korelasi dari kesalahan pengukuran antar item satu dengan item lainnya. Hal ini menyebabkan item tersebut selain mengukur konstruk etos kerja, juga bisa jadi mengukur konstruk psikologis lainnya. SARAN Walaupun dalam hasil penelitian ini terdapat berbagai dinamika yang terjadi terkait dengan hasil penelitiannya, namun yang pasti bahwa organization-based self-esteem memiliki pengaruh dan kontribusi yang signifikan terhadap etos kerja secara keseluruhan. Etos kerja merupakan employability skill yang sangat diperlukan untuk sukses dalam pekerjaan, berdasarkan pertimbangan itulah pentingnya untuk melakukan penelitian selanjutnya untuk melihat faktor-faktor “individual differences” lainnya yang belum ada dalam penelitian ini, seperti personality atau kepribadian, manifest needs, job satisfaction, job involvement, dan lain sebagainya. Dari segi instrumen pengumpulan data untuk penelitian selanjutnya disarankan menggunakan MWEP (Multidimensional Work Ethic Profile) dari Miller et.al. (2001). Meneliti etos kerja menggunakan variabel moderator. REFERENSI Akbar, E., Saeid, S., & Saeid, A. (2011). An assessment of effective organizationaladministrative factors in strengthening the work‟s ethic. European Journal of Social Sciences, Vol. 22, No. 3, 320-337 Brown, B.B. (2003). Employee’s organizational commitment and their perception of supervisor’s relations-oriented and task-oriented leadership behaviors. Doctor of Philosophy Dissertation, The Virginia Polytechnic Institute and State University Davenport, J. (2010). Leadership style and organizational commitment: The moderating effect of locus of control. ASSBBS Annual Conference: Las Vegas, Vol. 17, No. 1, 277-290 Fouts, S.F. (2004). Differences in work ethic among jobseekers grouped by employment status and age and gender. Doctor of Education Dissertation, North Carolina State University Gardner, D.G., Dyne, L.V., & Pierce, J.L. (2004). The effects of pay level on organizationbased self-esteem and performance: A field study. Journal of Occupational and Organizational Psychology, 77, 307-322 Heller , F. & Ruiz-Quintanilla, S.A. (1995). The work ethic. CAHRS Working Papper Series of Cornell University, Paper 198 (95-08), 1-9 Hill, R.B. & Petty, G.C. (1995). A new look at selected employability skills: A factor analysis of the occupational work ethic. Journal of Vocational Education Research, Vol. 20, No. 4, 59-73 Hsu, Meng-Hsiang & Kuo, Feng-Yang (2003). The effect of organization-based self-esteem and deindividuation in protecting personal information privacy. Journal of Business Ethic, Vol. 42, No. 4, 305-320 78
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Kegans, L. (2006). A study of the relationship between work experience and occupational work ethic characteristics of baccalaureate nursing students. Doctor of Education Dissertation, University of North Texas Kim, Soo Jung (2007). Identifying work ethic constructs using a Korean translation of the OWEI. Doctor of Philosophy Dissertation, University of Georgia, Athens Kreitner, R. & Kinicki, A. (2001). Organizational behavior. 5th Ed. New York: McGraw Hill Maksum, M., Purwanto, W., & Chotidjah, G.S. (2006). Pengaruh etika kerja dan komitmen organisasi terhadap kepuasan kerja. Majalah Ilmu dan Teknologi Pertanian, Vol. 26, No. 2, 114-124 McAllister, D.J. & Bigley, G.A. (2002). Work context and the definition of self: How organizational care influences organization-based self-esteem. Academy of Management Journal, Vol. 45, No. 5, 894-904 Meyer, J.P. & Allen, N.J. (1991). A three-component conceptualization of organizational commitment. Human Resource Management Review, Vol. 1, No. 1, 61-89 Miller, M.J., Woehr, D.J., & Hudspeth, N. (2001). The meaning and measurement of work ethic: Construction and initial validation of a multidimensional inventory. Journal of Vocational Behavior, 59, 1-39 Pedhazur, E.J. (1982). Multiple regression in behavioral research, explanation and prediction. Second edition. New York: Holt, Renehart and Winston Inc. Pierce, J.L., Gardner, D.G., Cummings, L.L., & Dunham, R.B. (1989). Organization-based self-esteem: Construct definition, measurement and validation. The Academy of Management Journal, Vol. 32, No. 3, 622-648 Pierce, J.L., Gardner, D.G., Dunham, R.B., & Cummings, L.L. (1993). Moderation by organization-based self-esteem of role condition-employee response relationship. The Academy of Management Journal, Vol. 36, No. 2, 271-288 Pierson, P.N. & Holmes, G.H. (2002). Perceptions of work ethic among college seniors: A comparative study. Journal of College and Character, Article 1, Vol. 3, Issue 4, Rosseel, E. (1985). Work ethic and orientations to work of the young generations: The impact of educational level. Social Indicators Research, Vol. 17, No. 2, 171-187 Roth, P.L., Hearp, C., & Switzer, F.S. (1999). The effect of method variance on relationship between the work ethic and individual difference variables. Journal of Bussiness and Psychology. Vol. 14, No. 1, 173-186 Sajidah, Ida (2009). Hubungan antara tawakal dan percaya diri dengan etos kerja. Tesis Program Pascasarjana, Universitas Indonesia. Diambil pada tanggal 29 September 2011 dari http://www.digilib.ui.ac.id/opac/themes/libri2/digitalfiles.jsp?id=126032&lokasi=lo kal Timco, L.J. (2010). The relationship between participation in physical activity and work ethic in college student. Master of Science Thesis. Texas State University-San Marcos Tydings, F.W. (2003). A comparison of work ethic descriptors among technical college advisory committee members, instructors, and students. Doctor of Education Dissertation. The University of Georgia, Athens Umar, Jahja (2011). Personal communication Website Resmi United Nations Development Programs (2011). Human Development Index (HDI) - 2011 Rankings. Diambil pada tanggal 29 September 2011 dari http://hdr.undp.org/en/statistics/ Yunus, O.M., Rahim, A.R.A., Shabuddin, A.B., & Mazlan, M. (2011). Work ethic of Malaysian civil servants. 2nd International Conference on Business and Economic Research, 225-238. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
79
80
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
HUBUNGAN KEPRIBADIAN DAN PSYCHOLOGICAL WELL BEING DENGAN PENGGUNAAN FACEBOOK Vinaya Fakultas Psikologi Universitas Pancasila Email:
[email protected] Abstract This study examined the correlation between Big Five personality inventory (Costa & McCrae, 1992), psychological well-being scale (Ryff & Keyes, 1995), and Facebook usage scale. Those questionnaires were given to 36 respondents with age 20-25. The result showed that lower in openness to new experience and introvert personality correlated with tendency to complain about life and personal problem on Facebook‟s wall. The data revealed that people whose love to share motivational quotes for their selves and others on Facebook‟s wall were high in neurotic, agreeableness and conscientiousness. Five dimension of psychological well-being (autonomy, environmental mastery, purpose in life, personal growth and positive relations with others) correlated with the tendency to share motivational quotes for their selves and others on Facebook‟s wall. Whereas, respondents‟s tendency to write about ordinary activity in Facebook‟s status correlated with dimension of positive relations with others and environmental mastery. Keywords: personality, psychological well being, Big Five, Facebook usage
Sejak didirikan pada tahun 2004 oleh Mark Zuckerberg, Facebook telah digunakan oleh lebih dari 800 juta orang di dunia (“Facebook Factsheet”, 2012). Untuk Indonesia sendiri, pengguna Facebook sudah mencapai 5.949.740 pengguna dan menempati urutan ke7 di dunia pada tahun 2009 (Darmawan & Chandrataruna, 2009). Berselang 2 tahun (2011), Indonesia menempati urutan ke-3 yaitu mencapai lebih dari 35 juta pengguna dengan ratarata usia pengguna 20 tahun. Usia ini jauh lebih muda dibandingkan dengan data pengguna Facebook yang menempati urutan 1 dan ke 2 yaitu Amerika dan Inggris yang rata-rata penggunanya berusia 31 tahun (Wahono, 2011). Ketertarikan manusia di berbagai belahan dunia untuk menggunakan Facebook tidak terlepas dari keunggulan fitur yang disediakan oleh Facebook untuk menciptakan situs yang memungkinkan penggunanya berkomunikasi dengan lebih mudah dan efektif dengan teman, keluarga dan rekan kerja. Dengan membuat profil, pengguna Facebook bisa berbagi status (wall), tulisan, foto, links dan video dengan teman di dalam jejaring sosialnya, sebaliknya di halaman home (beranda) pengguna juga bisa melihat status (wall), tulisan, foto, link dan video yang diunggah dan dibagi (sharing) oleh teman di dalam jaringan pertemanannya. Facebook juga memungkinkan penggunanya untuk melakukan „chat‟ langsung dengan teman yang sedang online di waktu yang bersamaan. Salah satu fitur yang sering digunakan oleh pengguna Facebook adalah fitur status. Di dalam fitur ini, pengguna bebas untuk mengemukakan apapun termasuk pendapat, berbagi informasi, kata-kata semangat bahkan keluhan ataupun kritik terhadap orang lain. Peneliti tertarik untuk melihat faktor kepribadian dan psychological well being pengguna Facebook khususnya terkait dengan isi status pengguna (wall). Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
81
Jika kita perhatikan isi status teman di dalam jejaring sosial Facebook kita, akan ditemukan berbagai kecenderungan individu dalam menuliskan status Facebook-nya. Berdasarkan pengalaman pribadi penulis, ada sebagian teman di dalam jejaring sosial Facebook penulis yang cenderung lebih sering menuliskan status dibandingkan dengan teman yang lain. Status yang ditulis juga cukup beragam. Berdasarkan hasil observasi, meskipun isi status cukup beragam, namun terdapat kecenderungan seseorang menuliskan status dengan tema yang hampir serupa. Terdapat individu yang sebagian besar statusnya berisi kata-kata motivasi untuk orang lain, ada yang rata-rata isi statusnya mengeluhkan keadaan diri dan keluarga, atau pun hanya menceritakan aktifitas yang dilakukan saat ini. Penulis tertarik untuk melihat apakah perbedaan ini dipengaruhi oleh faktor kepribadian dan psychological well being. Mengingat penelitian sebelumnya memang menemukan adanya hubungan antara faktor kepribadian dengan intensitas penggunaan Facebook. Penelitian sebelumnya terkait dengan Facebook dan kepribadian telah dilakukan oleh Moore dan McElroy (2012). Penelitian tersebut menunjukkan hasil bahwa pengguna dengan kepribadian extrovert cenderung memiliki jumlah teman yang lebih banyak dibandingkan dengan pengguna yang introvert. Namun pengguna dengan kepribadian extrovert ditemukan lebih jarang menggunakan Facebook dibandingkan pengguna dengan kepribadian introvert. Hal ini menurut Moore dan McElroy (2012) dapat dijelaskan dengan teori social compensation yaitu kecenderungan seseorang dengan kepribadian introvert lebih sering memanfaatkan penggunaan jejaring sosial karena bentuk komunikasi tidak langsung (indirect communication) seperti melalui Facebook merupakan bentuk kompensasi dari keterbatasan mereka dalam keterampilan interpersonal (face to face interaction). Penelitian Moore dan McElroy (2012) juga menemukan bahwa pengguna yang tinggi di dalam conscientiousness lebih jarang menuliskan status sendiri atau menuliskan status di Facebook orang lain dibandingkan orang yang rendah dalam dimensi kepribadian conscientiousness. Sedangkan terkait dengan neurotic, pengguna yang tinggi dalam dimensi neurotic ditemukan lebih sering dan lebih banyak menghabiskan waktu dalam menggunakan Facebook dibandingkan dengan pengguna yang rendah di dalam dimensi neurotic (memiliki kestabilan emosi). Namun penelitian yang terkait dengan Facebook belum ada yang menghubungkan antara kepribadian dengan isi status. Terkait dengan well being, belum ada penelitian sebelumnya terkait dengan well being dan penggunaan Facebook. Namun berbagai penelitian terdahulu menemukan korelasi antara kepribadian dengan well being khususnya Subjective Well Being. Costa dan McCrae (1980 dalam Quevedo & Abella, 2011) menemukan bahwa afek positif berkorelasi dengan extraversion sedangkan afek negatif berhubungan dengan neuroticism. Berdasarkan meta analisis yang dilakukan oleh DeNeve dan Cooper (1998 dalam Vitterso, 2001), berdasarkan kepribadian Big 5, kestabilan emosional ditemukan sebagai prediktor paling baik terhadap kebahagiaan dan kepuasan hidup. Sedangkan extravert ditemukan dapat memprediksi afek positif. Sejalan dengan meta analisis tersebut, penelitian Gutie´rrez, Jime´nez, Herna´ndez dan Puente (2005) menemukan bahwa dimensi kepribadian yang paling berhubungan dengan subjective well being adalah extraversion dan neuroticism. Extraversion berhubungan dengan afek positif sedangkan neuroticism berhubungan dengan afek negatif. Berdasarkan hal tersebut, peneliti menduga kemungkinan besar perbedaan isi status juga terkait dengan well being individu, dalam penelitian ini khususnya terkait dengan psychological well being.
82
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Masalah Penelitian Masalah penelitian ini adalah 1. Apakah dimensi-dimensi di dalam kepribadian Big 5 berhubungan dengan penggunaan Facebook (isi status)? 2. Apakah dimensi- dimensi di dalam psychological well being berhubungan dengan penggunaan Facebook (isi status)? Tujuan dan Manfaat Penelitian Penelitian ini bertujuan untuk mencari tahu dimensi-dimensi kepribadian big 5 dan dimensi-dimensi apa saja di dalam psychological well being yang berhubungan dengan penggunaan Facebook terutama terkait dengan isi status pengguna. Sedangkan secara praktis penelitian ini dapat digunakan khususnya untuk kebutuhan marketing untuk membuat pemetaan produk berdasarkan kepribadian dan psychological well being yang bisa dilihat berdasarkan penggunaan Facebook. Kajian Literatur Kepribadian Big 5 Kepribadian Big 5 atau yang biasa dikenal dengan OCEAN, terdiri dari lima dimensi kepribadian (Costa & McCrae, 1992) yaitu Openness to New Experience, Conscientiousness, Extraversion, Agreeableness dan Neuroticism. Secara spesifik, Extraversion terkait dengan seberapa jauh individu suka bersosialisasi dan berhubungan dengan orang lain. Agreeableness terkait dengan seberapa jauh individu merasa terhubung dan senang menjalin kerjasama interpersonal. Openness to New Experience adalah keinginan individu untuk mengeksplorasi situasi baru. Conscientiousness berhubungan dengan individu yang terorganisir, hati-hati dan bisa mengendalikan diri. Sedangkan neuroticism berhubungan dengan seberapa besar tingkat kestabilan emosi individu. Psychological well being Psychological well being dari Ryff dan Keyes (1995), terdiri dari enam dimensi yaitu self-acceptance, positive relations with others, autonomy, environmental mastery, purpose in life dan personal growth. Secara spesifik, self-acceptance diartikan sebagai sikap positif terhadap diri, pengetahuan dan penerimaan diri termasuk kualitas baik dan buruk, merasa positif terhadap masa lalunya. Dimensi positive relations with others yaitu memiliki hubungan yang hangat, memuaskan dan saling percaya dengan orang lain; mempedulikan kesejahteraan orang lain; mampu memiliki hubungan yang penuh dengan empati, afeksi dan keintiman; memahami dibutuhkannya memberi dan menerima dalam hubungan antarmanusia. Autonomy diartikan sebagai mandiri dan bisa menentukan diri sendiri (selfdetermining); mampu mengatasi tekanan sosial untuk berpikir dan bertindak dengan cara tertentu; mengatur perilaku dari dalam; mengevaluasi diri sesuai dengan standar personal. Sedangkan environmental mastery adalah memiliki perasaan kompeten untuk mengelola lingkungan; mampu mengontrol aktivitas eksternal; menggunakan kesempatan yang ada di lingkungan secara efektif; mampu memilih / menciptakan konteks yang sesuai dengan kebutuhan dan nilai personal. Purpose in life adalah memiliki tujuan dan arah hidup; merasa bermakna di kehidupan saat ini dan masa lalu; memegang kepercayaan yang memberikan tujuan hidup. Personal growth diartikan sebagai memiliki perasaan akan keberlanjutan pertumbuhan; merasa diri tumbuh & berkembang; terbuka terhadap pengalaman baru; Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
83
memiliki keinginan untuk merealisasikan potensinya; selalu mengembangkan diri dan perilakunya; berkembang menuju ke arah yang lebih efektif dan self-knowledge. Metode Penelitian Partisipan Penelitian Penelitian ini menggunakan pendekatan kuantitatif dengan memberikan kuesioner kepada 36 responden. Kriteria responden dalam penelitian ini adalah individu dengan usia antara 20-25 tahun. Pemilihan kriteria disesuaikan dengan usia pengguna Facebook terbanyak di Indonesia pada tahun 2011 yaitu individu dengan usia 20 tahunan. Alat Ukur Alat ukur yang digunakan di dalam penelitian ini menggunakan skala Big 5 personality dari Costa dan McCrae (1992) dan skala psychological well being dari Ryff dan Keyes (1995). Kedua skala ini awalnya adalah alat ukur dalam bahasa Inggris. Alat ukur ini kemudian diterjemahkan ke dalam bahasa Indonesia oleh peneliti dan rekan sejawat yang dianggap mampu berbahasa Inggris dan bahasa Indonesia dengan baik. Sedangkan untuk alat ukur penggunaan Facebook, peneliti membuat sendiri alat ukurnya. Alat ukur big 5 personality dan psychological well being menggunakan skala Likert dengan pilihan Sangat Tidak Setuju (STS), Tidak Setuju (TS), Agak Tidak Setuju (ATS), Agak Setuju (AS) dan Sangat Setuju (SS), sedangkan untuk alat ukur penggunaan Facebook, hanya sebagian alat ukur yang menggunakan skala Likert dengan alternatif pilihan yang sama dengan skala big 5 personality dan skala psychological well being . Sebagian besar sisa dari alat ukur perilaku pengguna Facebook mengetahui frekuensi dan persentase. Alat ukur Big 5 personality dari Costa dan McCrae (1992) terdiri dari 43 items yang terbagi dalam lima dimensi, yaitu extraversion (9 items), conscientiousness (9 items), openness to new experience (8 items), agreeableness (7 items) dan neuroticism (10 items). Berdasarkan hasil pilot uji validitas items diperoleh 8 items gugur, sehingga yang tersisa hanya 35 items yang terdiri dari 7 items extraversion dengan skor reliabilitas 0,837; 9 items conscientiousness dengan reliabilitas 0,711; 5 items openness to new experience dengan skor reliabilitas 0,742; 4 items dengan skor reliabilitas 0,808 untuk agreeableness dan 10 items neuroticism dengan skor 0,902. Contoh items penelitian untuk masing-masing dimensi dari skala big 5 personality dapat dilihat di dalam tabel 1 berikut ini Tabel 1 Contoh item kuesioner Big 5 Personality Dimensi Extraversion Conscientiousness Openness to new experience Agreeableness Neuroticism
84
Contoh Item Saya berbicara dengan banyak orang di berbagai pesta/ acara Saya menyelesaikan pekerjaan dengan segera Saya memiliki ide-ide cemerlang Saya bersimpati terhadap perasaan orang lain Saya mengkhawatirkan berbagai hal
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Alat ukur psychological well being dari Ryff dan Keyes (1995) terdiri dari 42 items. Alat ukur ini terdiri dari 6 dimensi yaitu autonomy (7 items), environmental mastery (7 items), purpose in life (7 items), personal growth (7 items), self-acceptance (7 items), dan positive relations with others (7 items). Berdasarkan hasil uji validitas items didapat 19 items gugur, sehingga diperoleh 4 items autonomy dengan skor reliabilitas 0,836; 4 items environmental mastery dengan reliabilitas 0,815; 4 items dimensi purpose in life yang memiliki skor reliabilitas 0,788; 4 items personal growth dengan reliabilitas 0,617; 3 items self-acceptance dengan reliabilitas 0,780, dan 4 items positive relations with others yang mendapatkan skor reliabilitas 0,862. Contoh item kuesioner psychological well being dapat dilihat dalam tabel 2. Tabel 2 Contoh item kuesioner Psychological Well Being Dimensi Autonomy Environmental mastery Purpose in life Personal growth Self acceptance Positive relations with others
Contoh Item Saya percaya dengan pendapat saya sekalipun bertentangan dengan pendapat umum Saya mampu mengatur waktu dengan baik sehingga semua yang dibutuhkan dapat terlaksana dengan baik Saya cenderung fokus kepada masa kini karena masa kini selalu membawa permasalahan bagi saya (-) Saya merasa bahwa selama ini saya sudah berkembang seperti kebanyakan orang Secara keseluruhan, saya merasa percaya diri dan positif dengan diri saya Saya menikmati percakapan personal dengan anggota keluarga dan teman saya
Khusus untuk mengukur perilaku pengguna Facebook, peneliti membuat sendiri kuesionernya yang terdiri dari beberapa pertanyaan yang diantaranya mengenai cara mengakses Facebook, frekuensi menggunakan Facebook, jumlah teman dan beberapa sub item terkait dengan isi status di dalam Facebook. Contoh items terkait dengan isi status responden adalah “Saya sering menuliskan status terkait dengan keluhan saya terhadap hidup/ masalah pribadi saya.” Prosedur Penelitian Kuesioner disebarkan dengan bantuan rekan peneliti sesuai dengan kriteria responden yang ditetapkan. Peneliti menentukan batas pengembalian kuesioner selama 1 bulan. Tehnik sampling yang digunakan di dalam penelitian ini adalah tehnik accidental sampling yaitu pengambilan sampel yang dianggap paling tersedia sesuai dengan kriteria responden penelitian yang sudah ditetapkan. Hasil Penelitian Gambaran Partisipan Dari 40 kuesioner yang disebar, 36 kuesioner kembali ke peneliti. Berdasarkan usia, rata-rata responden penelitian ini berusia 21 tahun, dengan responden pria sebanyak 14 Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
85
orang (39 %) dan responden wanita sebanyak 22 orang (61 %). Seluruh responden berstatus mahasiswa dan semuanya belum menikah. Berdasarkan kebiasaan mengakses situs jejaring sosial, khususnya Facebook ditemukan bahwa sebagian besar responden penelitian ini mengakses Facebook melalui komputer, laptop, Ipad dan sejenisnya maupun melalui telepon genggam, BlackBerry, Iphone dan sejenisnya, yaitu sebanyak 24 orang (66,67 %). Sisanya mengakses Facebook hanya melalui komputer, laptop, Ipad dan sejenisnya (7 responden) atau hanya melalui telepon genggam, BlackBerry dan sejenis (5 responden). Dalam hal frekuensi mengakses Facebook, bagi responden yang mengaku mengakses Facebook melalui komputer, laptop, Ipad dan sejenisnya, sebanyak 10 orang (27,8%) mengaku setiap hari mengakses Facebook, 7 orang mengakses 2-3 kali per minggu (19,4%), 7 orang mengakses 2 minggu sekali, 3 orang kurang dari satu kali perbulan (8,3 %), dan 3 orang mengaku mengakses sekali seminggu. Rentang lama mereka mengakses sangat bervariasi antara kurang dari 1 jam sampai lebih dari 2 jam. Bagi responden yang mengakses Facebook melalui telepon genggam dan sejenisnya, mereka mengakses Facebook tidak tentu waktunya. Mayoritas mengaku mengakses Facebook melalui telepon genggam dan sejenisnya sangat bergantung pada mood (17 responden: 47,2 %). Sekali akses, bagi responden yang mengakses menggunakan telepon genggam dan sejenisnya, mayoritas mengaku mengakses dengan durasi lebih dari 10 menit (15 orang: 41,7 %). Lebih spesifik terkait dengan frekuensi meng-up date status, ditemukan bahwa kebanyakan responden meng-up date status kurang dari 1 kali per bulan (9 responden: 25%). Hanya 6 responden (16,7 %) yang meng-up date setiap hari, dan hanya 2 orang (5,6%) yang meng-up date status 2-3 kali sehari. Berdasarkan jumlah teman, mayoritas mengaku memiliki teman sebanyak 400-699 teman (11 orang: 30,6%) dan mayoritas mengaku bahwa mereka tidak mengenal 10-50% teman dalam jejaring Facebook-nya. Hasil Utama Penelitian Hasil penelitian menunjukkan bahwa kecenderungan responden mengeluhkan hidup atau masalah pribadinya di dalam status Facebook berkorelasi negatif dengan dimensi kepribadian extrovert, r (36) = -0,333, p<0,05 dan openness to new experience, r (36) = 0,366, p<0,05. Semakin extrovert responden dan semakin besar openness semakin rendah kecenderungan untuk mengeluhkan tentang hidup dan masalah pribadinya melalui Facebook. Penemuan lain menunjukkan kecenderungan responden berbagi video menarik dengan teman di dalam jejaring sosial Facebook berkorelasi positif dengan dimensi openness to new experience, r (36) = 0,475, p<0,01. Kecenderungan responden berbagi status tentang kata-kata yang mampu membangkitkan motivasi diri dan orang lain ditemukan berkorelasi positif dengan dimensi kepribadian conscientiousness, r (36) = 0,366, p<0,05, dimensi kepribadian agreeableness, r (36) = 0,332, p<0,05 dan neurotic, r (36) = 0,467, p<0,01. Hal ini menunjukkan bahwa individu yang cenderung kurang stabil secara emosional (tinggi di dalam dimensi neurotic), cenderung mempertimbangkan perasaan orang lain (tinggi dalam agreableness), dan cenderung hati-hati, mengendalikan diri dan menyukai keteraturan (tinggi dalam dimensi conscientiousness) memiliki kecenderungan lebih besar untuk berbagi status yang membangkitkan motivasi diri sendiri dan orang lain. Korelasi positif juga ditemukan di dalam korelasi antara dimensi kepribadian neurotic (kurang stabil secara emosional) dengan 86
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
kecenderungan memberikan kritik dan menyindir orang lain di dalam jejaring pertemanannya, r (36) = 0,386, p<0,05. Berhubungan dengan psychological well being, kecenderungan responden berbagi kata-kata motivasi yang mampu membangkitkan motivasi diri dan orang lain ditemukan berkorelasi positif dengan semua dimensi kecuali dimensi self-acceptance. Dimensi autonomy berkorelasi positif dengan kecenderungan berbagi kata-kata motivasi di dalam jejaring sosial dengan r (36) = 0,356, p<0,05, positive relations with others dan environmental mastery berkorelasi positif dengan r (36) = 0,381, p<0,05, dan r (36) = 0,337, p<0,05. Sedangkan personal growth, r (36) = 0,382, p<0,05 dan purpose in life, r (36) = 0,398, p<0,05. Kecenderungan berbagi status tentang kejadian sehari-hari di dalam hidup ditemukan berhubungan dengan dimensi positive relations with others, r (36) = 0,353, p<0,05 dan environmental mastery, r (36) = 0,340, p<0,05. Hal ini menandakan bahwa individu yang sering berbagi tentang kejadian sehari-hari di dalam hidup adalah individu yang mempercayai orang lain, dan mampu menjalin hubungan baik dengan orang lain (tinggi dalam dimensi positive relations with others) dan juga mampu mengelola lingkungan dengan baik (tinggi dalam dimensi environmental mastery). Diskusi Semakin extrovert responden dan semakin besar openness semakin rendah kecenderungan untuk mengeluhkan tentang hidup dan masalah pribadinya melalui Facebook. Hal ini kemungkinan besar karena individu yang extrovert dan tinggi di dalam openness to new experience cenderung senang bersosialisasi dan mengeksplorasi situasi baru. Hal ini membuat mereka memiliki saluran yang lebih banyak untuk mengungkapkan keluhan hidup dan masalahnya, sehingga jejaring sosial kemungkinan besar bukan merupakan pilihan utama untuk mengungkapkan keluhan hidup dan masalah-masalah pribadinya. Hal ini sejalan dengan penelitian dari Moore dan McElroy (2012) yang menemukan bahwa individu dengan kepribadian introvert lebih cenderung memanfaatkan jejaring sosial dibandingkan dengan individu dengan kepribadian extrovert karena bagi individu dengan kepribadian introvert Facebook merupakan salah satu bentuk kompensasi dari keterbatasan mereka dalam keterampilan interpersonal (face to face interaction). Di dalam Facebook seseorang dapat dengan mudah mengungkapkan keluhan hidupnya tanpa harus berhadapan langsung dengan orang lain. Hal ini menunjukkan bahwa individu yang cenderung kurang stabil secara emosional (tinggi di dalam dimensi neurotic), cenderung mempertimbangkan perasaan orang lain (tinggi dalam agreableness), dan cenderung hati-hati, mengendalikan diri dan menyukai keteraturan (tinggi dalam dimensi conscientiousness) memiliki kecenderungan lebih besar untuk berbagi status yang membangkitkan motivasi diri sendiri dan orang lain. Bagi individu yang tinggi di dalam dimensi neurotic, kecenderungan menuliskan kata-kata motivasi untuk diri dan orang lain kemungkinan besar merupakan cara individu untuk memberi semangat diri dan menstabilkan kembali suasana hati individu neurotic yang cenderung gampang berubah. Berbeda dengan individu yang tinggi di dalam dimensi neurotic, kecenderungan individu yang tinggi dalam dimensi agreeableness untuk menuliskan kata-kata yang mampu membangkitkan motivasi diri dan orang lain kemungkinan besar lebih terkait dengan keinginan individu untuk memberikan semangat dan membangkitkan motivasi orang lain. Sedangkan terkait dengan dimensi conscientiousness, seseorang yang tinggi di dalam dimensi Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
87
ini cenderung hati-hati dan mengendalikan diri, sehingga kecenderungan berbagi status terkait kata-kata motivasi kemungkinan besar terkait dengan sikap kehati-hatian, tidak ingin menuliskan status yang bisa memperlihatkan kurangnya kemampuan untuk mengendalikan diri. Meskipun berdasarkan hasil sebelumnya diketahui bahwa kepribadian neurotic juga berkorelasi positif dengan kecenderungan berbagi status yang berisi kata-kata yang membangkitkan motivasi diri dan orang lain, namun di sisi lain individu dengan kepribadian neurotic juga senang mengkritik dan menyindir orang lain di dalam jejaring pertemanannya (kemungkinan besar ketika individu sedang memiliki mood negatif). Hasil ini kemungkinan besar dapat dijelaskan dari ketidakstabilan individu yang tinggi pada dimensi neurotic. Berbagi kata-kata motivasi di dalam jejaring sosial memperlihatkan kesehatan mental individu (psychological well being yang baik). Individu yang senang berbagi kata-kata motivasi adalah individu yang cenderung mempercayai dan memiliki hubungan yang hangat dan peduli dengan orang lain (tinggi dalam dimensi positive relations with others), individu yang cenderung mandiri dan mampu mengatur sendiri perilakunya (tinggi dalam dimensi autonomy), mampu mengelola lingkungan dengan baik (tinggi dalam dimensi environmental mastery), memiliki tujuan dan arah hidup yang jelas (tinggi dalam dimensi purpose in life) dan selalu mengembangkan diri ke arah yang lebih baik (tinggi dalam dimensi personal growth). Selain menggunakan kuesioner seperti yang dilakukan di dalam penelitian ini, penelitian terhadap penggunaan Facebook juga dapat dilakukan secara online dengan melakukan observasi terhadap aktivitas penggunaan Facebook individu di dalam jejaring sosialnya, terutama terkait dengan isi status pengguna. Simpulan Berdasarkan hasil penelitian ini dapat disimpulkan bahwa individu yang cenderung senang mengeluhkan hidup atau masalah pribadinya di dalam status Facebook adalah individu yang cenderung introvert dan rendah dalam dimensi kepribadian openness to new experience. Individu yang senang berbagi link video yang dianggap menarik adalah individu yang tinggi di dalam dimensi openness to new experience. Individu yang cenderung suka berbagi status tentang kata-kata yang mampu membangkitkan motivasi diri dan orang lain adalah individu yang kurang stabil secara emosional (neurotic), memiliki kepedulian dan empati terhadap orang lain (tinggi dalam dimensi agreeableness) serta cenderung berhati-hati dan mengendalikan diri (tinggi dalam dimensi conscientiousness). Terkait dengan psychological well being dapat disimpulkan bahwa kecenderungan individu menuliskan status tentang kata-kata yang mampu membangkitkan motivasi diri dan orang lain memperlihatkan bahwa individu memiliki psychological well being yang baik. Sedangkan individu yang cenderung suka membagi status tentang kegiatan sehari-hari adalah individu yang mampu menjalin hubungan baik dengan orang lain (tinggi dalam dimensi positive relations with others) dan juga mampu mengelola lingkungan dengan baik (tinggi dalam dimensi environmental mastery)
88
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Daftar Pustaka Costa, P. T., & McCrae, R. R. (1992). Revised NEO Personality Inventory (NEO PI-R) and NEO Five-Factor Inventory professional manual. Odessa, FL: Psychological Assessment Resources. Darmawan, I. & Chandrataruna, M. (2009, Juni 16). Indonesia Pengguna Facebook ke-7 Terbesar. Diambil Februari 7, 2012 dari http://teknologi.vivanews.com/news/read/67129indonesia_pengguna_facebook_ke_7_terbesar. Gutie´rrez, J. G., Jime´nez, B. M., Herna´ndez, E., G., & Puente, C.P. (2005). Personality and subjective well-being: big five correlates and demographic variables. Personality and Individual Differences, 38 , 1561–1569. Moore, K., McElroy, J.C. (2012). The influence of personality on Facebook usage, wall postings, and regret. Computers in Human Behavior, 28, 267–274. Quevedo, R.J., Abella, M. C. (2011). Well-being and personality: Facet-level analyses. Personality and Individual Differences, 50 , 206–211. Ryff, C. D., & Keyes, C. L. (1995). The structure of psychological well-being revisited. Journal of Personality and Social Psychology, 69(4), 719–727. Vittersø, J. (2001). Personality traits and subjective well–being: Emotional stability, not extraversion, is probably the important predictor. Personality and Individual Differences, 31, 903–914.
Wahono, T. (2011, April 2011). Rata-rata Pengguna Facebook Indonesia Paling Muda di Dunia. Diambil Februari 8, 2012 dari http://tekno.kompas.com/read/2011/04/07/00274410/Ratarata.Pengguna.Facebook.Indo nesia.Paling.Muda.di.Dunia Facebook Factsheet. (2012). Diambil Februari 7, 2012 dari http://www.facebook.com/press/info.php?factsheet
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
89
90
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
RELATIONSHIP BETWEEN TIME PERSPECTIVE, PSYCHOLOGICAL WELLBEING, AND ACADEMIC ACHIEVEMENT Evanytha Faculty of Psychology, Pancasila University Jl. Srengseng Sawah, Jagakarsa, Jakarta Selatan 12640, Indonesia E-mail:
[email protected] Abstract One important aspect in human experience is achievement, especially in educational context, where Academic Achievement become an indicator of successful study. This research aimed to examine the relationship between time perspective, psychological well-being, and academic achievement. Participants were 93 psychology undergraduate students. They completed Zimbardo Time Perspective Inventory (ZTPI; Zimbardo & Boyd, 1999), Ryff‟s Psychological Well-Being Scale (PWB) and mentioned their GPA. The ZTPI consists of five subscales: Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic and Future TP. The PWB scales consists of six dimensions: Autonomy, Positive Relations with Others, Environmental Mastery, Personal Growth, Purpose in Life, and Self-Acceptance. Pearson‟s Product Moment correlation was used to analyze the data. The Future TP showed positive correlation with Academic Achievement. On the contrary, Past-Negative, Present-Fatalistic, and Present-Hedonistic TP negatively correlated with Academic Achievement. Environmental Mastery, Purpose in Life, and Self-Acceptance showed positive correlation with Academic Achievement. Higher orientation to the future (Future Time Perspective and Purpose in Life) positively correlated with higher Academic Achievement. Hedonistic and Fatalistic orientation toward the present and negative orientation toward the past showed negative correlation with Academic Achievement. Knowledge and understanding about the role of Time Perspective and Psychological Well-Being in psychological processes related to Academic Achievement is important for reaching optimal result in student‟s academic achievement. Key words: time perspective, psychological well-being, academic achievement Introduction One important aspect in human experience is achievement, especially in educational context, where academic achievement become an indicator of successful study. Success in study is very important for the students because it can help them to finish their study and win the tight competition in this globalization era, thus creating a better future for them. Although succeed in study is very important, the fact is that not all students have high academic achievement. There are a number of students who have low academic achievement. Therefore, it is important to have knowledge about variables related with academic achievement in order to increase student‟s academic achievement, especially for students with low GPA. According to Murray (1959), man is a „time-binding‟ organism; which by conserving some of the past and anticipating some of the future, a human being can make his or her behavior accord with events that have happened as well as those that are to come. Boniwell and Zimbardo (2004) also explained that time underlies and regulates our social behavior and Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
91
penetrate our consciousness. Therefore, time can shape individuals quality of life and influences their choice and actions (Boniwell & Zimbardo, 2004). Zimbardo, Keough, and Boyd (1997) defined time perspective as “the manner in which individuals, and cultures, partition the flow of human experience into the distinct temporal categories of past, present, and future”. Time perspective is a general psychological construct permeating much human motivation and decision making (Gonzalez & Zimbardo, 1985 in Zimbardo, Keough, & Boyd, 1997). Phillip Zimbardo has developed and validated the Zimbardo Time Perspective Inventory (ZTPI) as a measurement of temporal orientation. Time perspective (TP) consists of five dimensions: Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic, and Future (Zimbardo & Boyd, 1999). A number of research has found relationships between TP and certain attitudes, values, and status variables, such as educational achievement, health, sleep and dreaming patterns, and romantic partner choices (Boniwell & Zimbardo, 2004). Individuals with Present-Hedonistic TP tend to act with little concern about consequences of their actions by avoiding planning and cost-benefit analysis. They tend to see life as seeking pleasure and avoiding pain, which make them are at risk for addictions, for accidents and injuries, and for academic and career failure (Boniwell & Zimbardo, 2004). Nuttin and Lens (1985 in Abousselam, 2005) find that future time perspective is positively correlated to achievement motivation. Although time is experienced by every person, therefore it is an universal phenomenon, we should have to understand and not to ignore the fact that there are cultural differences between Western and Eastern view about time perspective. The Western view optimal functioning as a linear path to resolve problems, monitor progress, emphasized future orientation by making planning for the future, and placed value in time (Snyder & Lopez, 2007). The Western often does not consider the Eastern tendency to see the self and other people as interrelated in harmonious interdependence and their perspective toward time (Kim, Triandis, Kagitcibasi, Choi, & Yoon, 1994; Markus & Kitayama, 1991 in Snyder & Lopez, 2007). This emphasis on people apparently make the Eastern culture view temporal concerns less important than the Western (Snyder & Lopez, 2007). While the Western is oriented to the future with planning to achieve optimal result, the Eastern emphasized harmonious interdependence between self and other people. Temporal processes is important in our lives, but psychology actually give relatively little attention in systematic study of time perspective. For example, the study of time perspective has often focused on one temporal zone and the majority of studies have failed to provide a multidimensional picture of time perspective (Boniwell & Zimbardo, 2004). Regarding the possibility of cultural differences in time perspective between Western and Eastern view and limited examples of research focus on the combination of the three dominant time zones (Rappaport, 1990 in Boniwel & Zimbardo, 2004), therefore it is important to study about relationship between five dimensions of time perspective and academic achievement. Beside of time perspective, there is another factor which is assumed to relate with academic achievement. This factor is psychological well-being. Individual with higher psychological functioning is assumed have a higher achievement in certain areas in their life. Ryff (1989) explained six dimensions of psychological well-being: self-acceptance, positive relations with others, autonomy, environmental mastery, purpose in life, and personal growth. According to Ryff (1989) there are several central characteristic of psychological 92
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
functioning: acknowledges and accepts multiple aspects of self including good and bad qualities (self-acceptance); having warm and trusting interpersonal relation (positive relations with others); having qualities of self-determination, independence, and regulation of behavior within (autonomy); having ability to participate actively and mastering the environment (environmental mastery); having a clear comprehension of life‟s purpose, a sense of directedness, and intentionality (purpose in life); and continuing to develop one‟s potential, to grow and expand as a person (personal growth). One aspect of achievement is in educational context, where academic achievement become an indicator of successful study. Dimensions of PWB were assumed to have relation with academic achievement. Santrock (2008) explained that achievement problems can occur when students have low expectation of success, try to protect their self-worth by avoiding failure, procrastinate, are perfectionist, become overwhelmed with anxiety, or become uninterested and alienated from school. Individuals with low expectation of success may not acknowledge and accepts multiple aspects of self, especially good qualities (dimension of Self-Acceptance) and a sense of directedness in their life (dimension of Purpose in Life). If individuals try to protect their self-worth by avoiding failure as in those who have low achievement, this attitude can hamper their personal development (dimension of PersonalGrowth). Individuals with low achievement also tend to become overwhelmed with anxiety, which may reflect a lower sense of mastery and competence in managing the environment (dimension of Environmental Mastery) and a lower sense of self-determining (dimension of Autonomy). Students with low level of achievement uninterested or alienated from school. They may feel isolated and frustrated in their interpersonal relationship, especially with peers or teachers in school (dimension of Positive Relation with Others). Ryff (1989) explained that further research is needed from individuals at different locations in the social structure. This awareness of that culture, history, ethnicity, class, and other aspects, can give rise to different conceptions of well-being. Therefore, it is important to study about relationship between psychological-well being and academic achievement in different educational context dan culture of Indonesia.
Theoritical Overview Academic Achievement Achievement problems can occur when students have low expectation of success, try to protect their self-worth by avoiding failure, procrastinate, are perfectionist, become overwhelmed with anxiety, or become uninterested and alienated from school (Santrock, 2008).
Students with low expectations for success
They need to be consistently reassured that they can meet the goals and challenges that the teachers have set for them and that the teachers will give them the help and support they need to succeed (Brophy, 1998 in Santrock, 2008). Students who protect their self-worth by avoiding failure Some students tend to protect their self-worth and avoiding failure. They engage in ineffective strategies, like nonperformance, procrastination, and setting unreachable goals (Santrock, 2008).
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
93
Students who are procrastinate Students are procrastinate because of poor time management, difficulty concentrating, fear and anxiety, negative beliefs, personal problems, boredom, unrealistic expectation and perfectionism, and fear of failure (University of Buffallo Counceling Services in Santrock, 2008). Students who are perfectionist Individual who are perfectionists are never accept mistakes, and always want to achieve the highest level of performance. Perfectionsts are tend to experience decreased productivity, impaired health, relationship problem, low self-esteem, depression, anxiety, and eating disorder (Haring, Hewitt, & Flett, 2003; Sherry et al., 2003, 2004; in Santrock, 2008). Students with high anxiety Anxiety is a vague, high unpleasant feeling of fear and apprehension. A constantly high level of anxiety can impair students‟ ability to achieve. This anxiety are the result of parents‟ unrealistic achievement expectation and pressure (Wigfield et al., 2006 in Santrock, 2008). Students who are uninterested or alienated This type of students are the most difficult motivation problem. They are apathetic, uninterested in learning, or alienated from school learning, and do not consider that achieving in school as an important value (Brophy, 1998 in Santrock, 2008). Academic Achievement, Time Perspective, and Motivation Santrock (2008) explained that one important factor in academic achievement is motivation. Motivation involves the processes that energized, direct, and sustain behavior. Nuttin and Lens (1985 in Abousselam, 2005) find that future time perspective is positively correlated to achievement motivation. Students‟ perceptions of the future will influence their motivation to study, which will have a positive impact on their academic achievement. Time Perspective Time perspective is defined as “the manner in which individuals, and cultures, partition the flow of human experience into the distinct temporal categories of past, present, and future” (Zimbardo, Keough, & Boyd, 1997). There are five dimensions of time perspective (TP): Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic, and Future (Zimbardo & Boyd, 1999). Past Positive Past-Positive TP is characterized by a positive construction of the past (Zimbardo & Boyd, 1999). Individuals with Past-Positive TP have a warm, often sentimental and nostalgic view of the past with emphasis on maintaining relationship with family and friends (Boniwell & Zimbardo, 2004). They also have a healthy outlook on life, high sense of self-esteem and happiness. Past-Positive TP correlated negatively with aggression, depression, and anxiety (Zimbardo & Boyd, 1999). Past Negative Individuals with Past-Negative TP have negative attitude toward the past. They focus on aversive personal experiences, pain, and regret. This negative attitudes may be due to experiences of unpleasant or traumatic events in the past. Past-Negative TP was associated with depression, anxiety, self-reported unhappiness, low self-esteem, and aggression (Zimbardo & Boyd, 1999). 94
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Present-Hedonistic Present-Hedonistic TP is characterized by an orientation toward present enjoyment, pleasure and excitement, hedonistic, risk taking attitude toward time and life, and sensation seeking, without sacrifices today for rewards tomorrow (Zimbardo & Boyd, 1999). They are open to friendships and sexual adventures, and act with little concern about consequences of their actions by avoiding cost-benefit analysis and planning (Boniwell & Zimbardo, 2004). Present-Fatalistic Individuals with Present-Fatalistic TP perceived lack of control over the future events and had a belief that the future is predestined and uninfluenced by their actions, and humans are at the mercy of fate (Zimbardo & Boyd, 1999). The Present-Fatalistic orientation is associated with hopelessness and beliefs that outside forces control the person‟s life, like spiritual or governmental forces (Boniwell & Zimbardo, 2004). Present-Fatalistic scores correlated with aggression, anxiety, and depression, and correlated negatively with consideration of future consequences (Zimbardo & Boyd, 1999). Future Orientation Future orientation TP is characterized by planning and achievement of future goals. Futureoriented students were highly organized, ambitious goal seekers who were willing to sacrifice present enjoyment to achieve their objectives. They stood out from their peers on dimensions of organizational planning and efficiency, and reporting that they had more order and structure in their lives (Zimbardo & Boyd, 1999). They work for future goals, delay gratification, and avoid time-wasting activities (Boniwell & Zimbardo, 2004). They form a clear goals and create paths to reach those goals, engage in preventive behaviors to lessen the possibility of bad things in the future, and think about possible consequences of actions (Snyder & Lopez, 2007). Measurement of Time Perspective Phillip Zimbardo developed Zimbardo Time Perspective Inventory (ZTPI) to measure time perspective. ZTPI consists of five main factors: Future, Past-Positive, Past-Negative, PresentHedonistic, and Present-Fatalistic. Test-retest reliabilities over a 4-week period of the five subscales of the ZTPI were ranging from .70 to .80. The Future scale showed test-retest reliability .80; Present-Fatalistic .76; Past-Positive .76; Present-Hedonistic .72; and PastNegative .70 (Zimbardo & Boyd, 1999). Time Perspective and Academic Achievement This study examined relationship between dimensions of TP and academic achievement. Past- Positive Individuals with high score in Past-Positive factor have high score in self-esteem and happiness, low in depression and anxiety (Zimbardo & Boyd, 1999). Research showed that a constantly high level of anxiety can impair students‟ ability to achieve (Wigfieldet al., 2006 in Santrock, 2008). Students with Past-Positive TP will have higher academic achievement. In other words, it was assumed that Past Positive TP correlated with academic achievement. Past- Negative Past-Negative score was associated with depression, anxiety, unhappiness, and low selfesteem. Anxiety experienced by students could stem from unpleasant events in the past (Zimbardo & Boyd, 1999). A high level of anxiety which constantly experienced by students can lower their achievement (Wigfield et al., 2006 in Santrock, 2008). Therefore it was assumed that Past-Negative TP correlated with academic achievement. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
95
Present-Hedonistic Individuals with Present-Hedonistic TP tend to act with little consideration about consequences of their actions (Zimbardo & Boyd, 1999). They tend to seek pleasure and to avoid pain. This attitudes make them are at risk for academic and career failure (Boniwell & Zimbardo, 2004). This study assumed that Present-Hedonistic TP correlated with academic achievement. Present-Fatalistic Individuals with Present-Fatalistic TP tend to be dissatisfied with their present life and did not think that it would improve. They do not believe that anything they do, or will do, is likely to make a difference in their lives. This negative attitude have impact in their lower GPA (Zimbardo & Boyd, 1999). This study assumed that Present-Fatalistic TP correlated with academic achievement. Future Orientation to the future make individuals make plans, set goals, and delay gratifications. This behavior leads to positive consequences in their life, such as higher academic achievement. According to Santrock (2008) achievement problems can emerge when students don‟t set goals, don‟t plan how to reach them, and don‟t adequately monitor their progress toward goals. Therefore, it is assumed that Future TP correlated with academic achievement. Psychological Well-Being Ryff (1989) constructed scale to measure dimensions of psychological well-being (PWB). The PWB scale measure positive aspects of psychological functioning in six dimensions: self-acceptance, positive relations with others, autonomy, environmental mastery, purpose in life, and personal growth. Items of PWB scale were derived from theoretical formulations of positive functioning. The definitions of the PWB dimensions are presented below, in terms of high versus low scorers (Ryff; 1989, 1995). Self-acceptance High scorer: Possess a positive attitude toward the self; acknowledges and accepts multiple aspects of self including good and bad qualities; feels positive about past life. Low scorer: Feels dissatisfied with self; is disappointed with what has occurred in past life; is troubled about certain personal qualities; wishes to be different than what he or she is. Positive relations with others High scorer: Has warm, satisfying, trusting relationships with others; is concerned about the welfare of others; capable of strong empathy, affection, and intimacy; understands give and take of human relationships. Low scorer: Has few close, trusting relationships with others; finds it difficult to be warm, open, and concerned about others; is isolated and frustrated in interpersonal relationships; not willing to make compromises to sustain important ties with others. Autonomy High scorer: Is self-determining and independent; able to resist social pressures to think and act in certain ways; regulates behavior from within; evaluates self by personal standards. Low scorer: Is concerned about expectations and evaluations of others; relies on judgments of others to make important decisions; conforms to social pressures to think and act in certain ways. 96
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Environmental mastery High scorer: Has a sense of mastery and competence in managing the environment; controls complex array of external activities; makes effective use of surrounding opportunities; able to choose or create contexts suitable to personal needs and values. Low scorer: Has difficulty managing everyday affairs; feels unable to change or improve surrounding context; is unaware of surrounding opportunities; lacks sense of control over external world. Purpose in life High scorer: Has goals in life and sense of directedness; feels there is meaning to present and past life; holds beliefs that give life purposes; has aims and objectives for living. Low scorer: Lacks a sense of meaning in life; has few goals or aims; lacks sense of direction; does not see purpose of past life; has no outlook or beliefs that give life meaning. Personal growth High scorer: Has a feeling of continued development; sees self as growing and expanding; is open to new experiences; has sense of realizing his or her potential; sees improvement in self and behavior over time; is changing in ways that reflect more selfknowledge and effectiveness. Low scorer: Has a sense of personal stagnation; lacks sense of improvement or expansion over time; feels bored and uninterested with life; feels unable to develop new attitudes or behaviors. Psychological Well-Being and Academic Achievement Santrock (2008) explained that achievement problems can occur when students have low expectation of success, try to protect their self-worth by avoiding failure, procrastinate, are perfectionist, become overwhelmed with anxiety, or become uninterested and alienated from school. Self-Acceptance Individual with high score on Self-Acceptance possess a positive attitude toward the self; acknowledges and accepts multiple aspects of self including good and bad qualities (Ryff, 1989; 1995). Individuals with low expectation of success or achievement need to be consistently reassured that they can meet the goals and challenges. Their tendency not to acknowledge and accept multiple aspects of self, especially good qualities, may make them do not develop their potentials to get higher academic achievement. This study assumed that Self-Acceptance correlated with academic achievement. Positive Relations with Others Individual with high score on this dimension has warm, satisfying, trusting relationships with others, and is concerned about the welfare of others (Ryff, 1989; Ryff, 1995). Students who have unsatisfying relationship with other will uninterested or alienated from school. They may feel isolated and frustrated in their interpersonal relationship, especially with peers or teachers in school. This kind of students have motivation problem which can lower their academic achiement. It is assumed that Positive Relations with Others correlated with academic achievement. Autonomy Individual with a sense of Autonomy reflected higher tendency of self-determining and independent, able to resist social pressures to think and act in certain ways, and evaluates self Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
97
by personal standards (Ryff, 1989, 1995). High level of social pressure can influence a person‟s well-being if he or she does not have a sense of autonomy. Wigfield et al. (2006 in Santrock 2008) explained that parents‟ unrealistic expectation and pressure can make students experience high anxiety level. According to Santrock (2008), students with a constantly high level of anxiety can significantly impair their ability to achieve. This research assumed that Autonomy correlated with academic achievement. Environmental Mastery Individuals with high score on Environmental Mastery have a sense of mastery and competence in managing the environment (Ryff, 1989; Ryff, 1995). Students with low ability to manage their environment will experience difficulties in adjust with their environment. This difficulties can make them uninterested and alienated with the process of learning in their school environment (Santrock, 2008). On the other hand, individual with ability in mastering environment will make them able to adjust with the process of learning in environment, especially in the school. This will result in higher achievement in their study. It assumed that Environmental Mastery correlated with academic achievement. Purpose in Life High score in this dimension are reflected by individuals who has goals in life and sense of directedness (Ryff, 1989). Individuals ability to set a goal and plan to achieve it is important to get an optimal result of their action. It is assumed that Purpose in in Life correlated with academic achievement. Personal Growth Individual with high score in dimension of Personal Growth has a feeling of continued development, sees self as growing and expanding, is open to new experiences, and has sense of realizing his or her potential (Ryff, 1989; Ryff, 1995). Individuals who are open to experience will have a higher tendency to interest in process of learning, which may make them have higher level of achievement. This study assumed that Personal Growth correlated with academic achievement. Objective of the Present Study The first objective of present study was to examine relationship between dimensions of Time Perspective (Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic, Future) and academic achievement. The second objective was to examine relationship between dimensions of Psychological Well-Being (Self-Acceptance, Positive Relations with Others, Autonomy, Environmental Mastery, Purpose in Life, Personal Growth) and academic achievement. Hypothesis There were several hypotheses proposed in this study. First, Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic, and Future TP did not correlate with academic achievement. Second, Self-Acceptance, Positive Relations with Others, Autonomy, Environmental Mastery, Purpose in Life, and Personal Growth did not correlate with academic achievement. Benefits of the Study Knowledge and understanding of student‟s time perspective can be useful in academic intervention or counseling program, especially for students with low academic achievement. 98
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Method Participants Participants were 93 undergraduate psychology students. 32 participants were men and 61 were women. Ages ranged from 18 to 41 years (M = 20.24, SD = 2.85). Data Analysis Technique Pearson‟s Product Moment correlation was used to measure relationship between TP, PWB and academic achievement. Cronbach‟s alpha coefficient was used to test reliability. Data analysis used SPSS 14.0 for Windows. Materials and Procedure Academic achievement measure Grade Point Average (GPA) was used to measure academic achievement. Because GPA can be influenced by difference in background study of participants, this research involved undergraduate psychology students from Pancasila University only (M = 3.02, SD = 0.52). Time perspective measure The Zimbardo Time Perspective Inventory (ZTPI) was used for measuring Time Perspective (TP). TP consists of five main factors: Past-Positive, Past-Negative, Present-Hedonistic, Present-Fatalistic, and Future (Zimbardo & Boyd, 1999). 15 items from original ZTPI scale were removed because of low item-total correlation. Total of 41 items were used in data analysis. Participants were asked to rate on six-point Likert scale. Range of Cronbach‟s alpha coefficient for five dimensions of ZTPI scale are shown in Table 1. Sample items include: “It gives me pleasure to think about my past” (Past Positive), “Painful past experiences keep being replayed in my mind” (Past Negative), “I believe that getting together with one‟s friends to party is one of life‟s important pleasure” (PresentHedonistic), “Fate determines much in my life” (Present-Fatalistic), “When I want to achieve something, I set goals and consider specific means for reaching those goals” (Future). Table 1. Zimbardo Time Perspective Inventory (ZTPI) Dimensions
M
SD
Cronbach‟s Alpha Coefficient
Past-Positive
22.57
3.27
0.643
Past-Negative
30.39
6.13
0.802
Present-Hedonistic
45.78
5.85
0.683
Present-Fatalistic
28.60
6.09
0.804
Future
37.78
5.13
0.760
Psychological well-being measure This research used Ryff‟s Psychological Well-Being (PWB) scale to measure psychological well-being (Ryff, 1989; Ryff, 1995; Abbott et al., 2010). Total of 38 items were used in data analysis. Four items were removed because of low score on item-total correlation. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
99
Cronbach‟s alpha coefficient for each dimensions of PWB are shown in Table 2. The response format was in Likert scale with six ordered categories. Items on the PWB scale include, among others: “When I compare myself with friends and acquaintances, it makes me feel good about who I am” (Self-Acceptance), “I know that I can trust my friends and they know that they can trust me” (Positive Relations with Others), “My decisions are not usually influenced by what everyone else is doing” (Autonomy), “I am quite good at managing the many responsibilities of my daily life” (Environmental Mastery), “I am an active person in carrying out the plans I set for myself” (Purpose in Life), and “I have the sense that I have developed a lot as a person over time” (Personal Growth). Table 2. Ryff’s Psychological Well-Being Scale Dimensions
M
SD
Cronbach‟s Alpha Coefficient
Self-acceptance
19.2
3.94
.707
4.72
.720
4.62
.743
3.85
.738
4.23
.788
4.33
.680
9 Positive relations with
30.3
others
5
Autonomy
26.7 1
Environmental mastery
24.6 5
Purpose in life
26.0 8
Personal growth
29.8 1
100
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Result Correlation Calculation Table 3 Correlations between dimensions of Time Perspective, Psychological Well-Being and Academic Achievement
Dimensions
Academic Achievement (GPA)
Time Perspective Past-Positive
-.108
Past-Negative
-.264*
Present-Hedonistic
-.205*
Present-Fatalistic
-.261*
Future
.293**
Psychological Well-Being Autonomy Positive Relations with Others
.084 .. .113
Environmental Mastery
.303**
Personal Growth
.132
Purpose in Life Self-Acceptance
.311** .252*
*Correlation is significant at the .05 level (two tailed) **Correlation is significant at the .01.level (two tailed)
Present study showed that Future TP positively correlated with academic achievement (r = .293, p < . 01). Past-Negative (r = -.264, p < .05), Present-Hedonistic (r = -.205, p < .05), and Present-Fatalistic (r = -.261, p < . 05) negatively correlated with academic achievement. Past-Positive unrelated with academic achievement (r = -.108, p > .05). Environmental Mastery (r = .303, p < .01), Purpose in Life (r = .311, p < .01), and Self-Acceptance (r = .252, p < .05) positively correlated with academic achievement (GPA).
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
101
Autonomy (r = .084, p > .05), Positive Relation with Others (r = .113, p > .05), and Personal Growth (r = .132, p >. 05) was unrelated with academic achievement. Discussion The result of this research showed that Future TP positively correlated with academic achievement (GPA). Students with high academic achievement had higher orientation to the future than students with low GPA. This result supported studies which explained that future orientation related with higher academic achievement. According to Boniwell and Zimbardo (2004), individual with Future TP generally more successful than others in academics and careers. They make plan for their activity and achievement of future goals, dedicated to work for future goals, delay gratification, and avoid time-wasting activities (Boniwell & Zimbardo, 2004). They also form a clear goals and create paths to reach those goals, engage in preventive behaviors to lessen the possibility of bad things in the future, and think about possible consequences of actions (Snyder & Lopez, 2007). Researchers also have found that achievement improve when students set goals that are specific, proximal, and challenging (Bandura, 1997; Lapierre, 2005; Schunk, 2004; Schunk & Zimmerman, 2006‟ Zimmerman & Schunk, 2004; in Santrock, 2008). Present research showed that orientation to the present (Present-Hedonistic and PresentFatalistic) negatively correlated with academic achievement. This result is consistent with explanation from Boniwell and Zimbardo (2004) that individual with orientation to the present tend to see life as seeking pleasure and avoiding pain, which make them are at risk for addictions and for academic and career failure. Past-Negative TP negatively correlated with academic achievement. According to Zimbardo and Boyd (1999), individuals with Past-Negative TP tend to have a generally pessimistic, negative attitude toward the past, and to focus on aversive personal experiences. By focusing on negative experience in the past, individual will have lower tendency to see better opportunities in the future for achieving optimal result in their study. Result of present study showed that Environmental Mastery positively correlated with academic achievement. Students with high score on Environmental Mastery have a sense of mastery and competence in managing the environment (Ryff, 1989; 1995). Students with high ability to manage their environment will be able to adjust with their environment, especially with the process of learning in their school environment, thus result in higher academic achievement. Purpose in Life positively correlated with academic achievement. Individual with high score in this dimension had goals in life and sense of directedness (Ryff, 1989). Individual ability to set a goal is important for achieving an optimal result. Therefore, a higher sense of purpose in individual‟s life will create higher level of achievement in his or her study, as shown in present research. Self-Acceptance positively correlated with academic achievement. Individual with high score on Self-Acceptance possess a positive attitude toward the self; acknowledges and accepts multiple aspects of self (Ryff, 1989; 1995). Individuals ability to accept multiple aspects of self, especially good qualities, will make them eager to explore opportunities in their study to develop their potential, which result in higher academic achievement, as supported in this study. 102
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Further study can examine the role of psychological variables which may play a role as moderator in relationship between PWB and academic achievement.
Conclusions The result of present study showed that Future TP positively correlation with academic achievement. On the contrary, Past-Negative, Present-Fatalistic, and Present-Hedonistic TP negatively correlated with academic achievement. Environmental Mastery, Purpose in Life, and Self-Acceptance showed positive correlation with academic achievement. It was concluded that hedonistic and fatalistic orientation to the present and negative orientation to the past showed negative correlation with academic achievement. Orientation to the future, in dimensions of Time Perspective (Future TP) and PWB (Purpose in Life), positively correlated with higher academic achievement. Knowledge and understanding about the role of Time Perspective and Psychological Well-Being is important for reaching optimum result in student‟s academic achievement.
Bibliography Abbott, R. A., Ploubidis, G. B., Huppert, F. A., Kuh, D., & Croudace, T. J. (2010). An evaluation of the precision of measurement of Ryff’s psychological well-being scales in a population sample. Social Indicators Research, 97, 357-373. Abousselam, N. M. (2005). The moderator effect of future time perspective in the relationship between self-efficacy and risky sexual behavior. Unpublished Thesis: University of the Free State. Boniwell, I., & Zimbardo, P. G. (2004). Balancing time perspective in pursuit of optimal functioning. In Linley, P. A., & Joseph, S. (Eds). Positive psychology in practice. New Jersey: John Wiley & Sons. Murray, H. A. (1959). Explorations in personality. New York: Oxford University Press. Ryff, C. D. (1989). Happiness is everything, or is it? Explorations on the meaning of psychological-well being. Journal of Personality and Social Psychology, 57, 10691081. Ryff, C. D. (1995). The structure of psychological well-being revisited. Journal of Personality and Social Psychology, 69, 719-727. Santrock. J. W. (2008). Educational psychology (3rd ed.). New York: McGraw-Hill Companies, Inc. Snyder, C. R., & Lopez, S. L.(2007). Positive psychology. The scientific and practical explorations of human strength. California: Sage Publication, Inc. Zimbardo, P. G., Keough, K. A., & Boyd, J. N. (1997). Present time perspective as a predictor of risky driving. Personality and Individual Differences, 23, 1007-1023. Zimbardo, P. G., & Boyd, J. N. (1999). Putting time in perspective: A valid, reliable individual-differences metric. Journal of Personality and Social Psychology, 77, 1271-1288.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
103
104
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
UJI VALIDITAS KONSTRUK DEPENDENT PERSONALITY INVENTORY (ADAPTASI DARI NICOLE M HUBER) Fauziyati Junariyah dan Neneng Tati Sumiati Fakultas Psikologi Universitas Islam Negri Jakarta Email:
[email protected] Abstrak Dependent personality inventory menurut Nicole M. Huber adalah sebuah kuesioner berisi 81 item yang menggunakan jawaban skala dikotomis (Benar atau Salah). Kuesioner ini dirancang untuk menentukan dimensi ketergantungan tertinggi apa yang ada pada seorang individu. Penelitian ini bertujuan untuk mengetahui apakah seluruh item dalam setiap faktor DPI mengukur konstruk yang dimaksud, dan untuk mngetahui apakah delapan faktor DPI fit (sesuai) dengan model satu faktor. Metode analisis data yang digunakan adalah Confirmatory Factor Analysis (CFA) dengan menggunakan software Lisrel 8.70. Berdasarkan perhitungan dengan tekhnik CFA dapat disimpulkan bahwa tujuan dari penelitian diterima namun perlu dilakukan modifikasi terhadap model pengukuran dimana korelasi measurement error antar item dibebaskan. Namun dari hasil pengujian melalui analisis faktor dua tingkat (second order factor analysis) menunjukkan hanya enam dari delapan faktor pada DPI yang signifikan dalam mengukur Dependent personality, yaitu KMKS, KTOL, KMK, KMST, MTN, dan MHL. Kata kunci: Dependent personality inventory, validitas konstruk, confirmatory factor analysis A. Pendahuluan Selama limabelas tahun terakhir ini banyak penelitian sosial yang dilakukan di Indonesia menggunakan pendekatan kuantitatif. Apalagi dengan makin mudahnya orang menggunakan jasa komputer, penggunaan pendekatan kuantitatif ini cenderung makin meningkat. Hal yang demikian itu pada satu sisi merupakan hal yang menggembirakan, namun pada sisi lain, penggunaan pendekatan kuantitatif itu juga dapat menimbulkan rasa khawatir kalau si peneliti tidak menyadari akan kelemahan atau keterbatasan inherent yang terdapat dalam pendekatan itu. Oleh karena itu penggunaan pendekatan kuantitatif menuntut kehati-hatian yang tinggi dalam proses kuantifikasi, yaitu proses pengubahan data kualitatif menjadi data kuantitatif. Isu paling krusial dalam konstruksi tes adalah validitas. Bila reliabilitas menyangkut isu-isu konsistensi, validitas mengases akurasi tes. Sebuah tes psikologi tidak bisa dikatakan valid dalam pengertian abstrak maupun absolut, tetapi dalam pengertian yang lebih praktis, ia harus valid dalam konteks tertentu dan untuk kelompok tertentu (Messick, 1995, dalam Marnat, 2010). Meskipun sebuah tes bisa reliabel walaupun tidak valid, tetapi hal yang sebaliknya tidak mungkin terjadi; syarat yang harus dipenuhi untuk validitas adalah tes itu harus mencapai tingkat reliabilitas yang adekuat. Jadi, sebuah tes yang valid adalah tes yang mengukur dengan akurat variabel yang dimaksudkan untuk diukur. Dari berbagai alat ukur kepribadian yang telah berhasil diciptakan untuk melakukan sebuah pengukuran, salah satunya adalah skala dependent personality (kepribadian bergantung). Konsep dependent personality ini sangat menarik para peneliti diberbagai Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
105
negara dan dalam berbagai area yang luas juga, sehingga telah banyak sekali ukuran mengenai ketergantungan yang telah diciptakan dan dikembangkan. Di Indonesia penggunaan alat ukur dependent personality maupun pengembangannya masih belum populer. Apalagi penelitian dan pembahasan keberadaan alat ukur dependent personality secara psikometri juga belum ada yang melakukannya di Indonesia. Hal ini dimungkinkan terjadi dikarenakan sulitnya menetepkan validitas pada alat ukur dependent personality yang disebabkan variabel-variabel dependent personality biasanya adalah konsepkonsep abstrak yang tidak memiliki realitas konkret, sehingga eksistensinya harus diinferensi melalui sarana yang tidak langsung. Selain itu, konseptualisasi dan penelitian tentang konstrak mengalami perubahan seiring berjalannya waktu sehingga mengharuskan bahwa validitas dependent personality harus terus menerus disempurnakan. Oleh sebab itu juga beberapa alat ukur dependent personality standar dan yang telah terstandarkan kualitasnya belum dapat dikatakan sepenuhnya optimal. B. Gambaran Umum DPI Dependent personality inventory (DPI) peneliti adaptasi dari Nicole M. Huber (2005) dalam tesisnya. untuk menentukan apakah DPI adalah instrumen yang dapat diandalkan, Nicole melakukan analisis reliabilitas pada tes secara keseluruhan dan pada masing-masing subskala untuk memeriksa konsistensi internal. Teknik alpha cronbach digunakan untuk menilai derajat konsistensi di antara variabel-variabel dalam skala yang dijumlahkan (summated scale). Jika diperlukan, skala diubah untuk meningkatkan tingkat alpha dengan menganalisis korelasi bivariat semua item skala terhadap setiap subskala yang dibuat. Hal ini memungkinkan untuk setiap item subskala yang berkorelasi tinggi dan cocok dalam isi item dengan subskala lain, yang akan ditambahkan ke dalam subskala, sehingga meningkatkan konsistensi internal skala. Oleh karena itu, satu pertanyaan mungkin muncul pada lebih dari satu subskala bila memenuhi kriteria persyaratan pada setiap subskala itu. Selanjutnya analisis faktor menggunakan exploratory factor analysis (EFA) dilakukan untuk menentukan jumlah dimensi kriteria skala pengukuran dependent personality. Alat ukur dependent personality inventory menurut Nicole M. Huber adalah sebuah kuesioner berisi 81 item yang menggunakan jawaban skala dikotomis (Benar atau Salah). Tetapi seperti yang telah dijelaskan diatas bahwa satu pernyataan mungkin muncul pada lebih dari satu faktor. Maka pernyataan atau item yang akan dipergunakan dalam analisis data adalah pernyataan atau item yang tidak memberikan informasi kepada lebih dari satu faktor. Dari 81 item yang ada, 55 item yang tidak memberikan informasi kepada lebih dari satu faktor. Maka 55 itemlah yang akan dipergunakan dalam analisis data dalam penelitian ini. Kuesioner ini dirancang untuk menentukan dimensi ketergantungan tertinggi apa yang ada pada seorang individu. Subjek dalam penelitian ini diminta untuk menentukan pilihan yang menunjukkan seberapa sering mengalami keadaan-keadaan berdasarkan pada delapan dimensi dependent personality dalam DSM IV. Dimensi dan item tersebut dijelaskan sebagai berikut: Dimensi pertama yaitu kesulitan membuat keputusan sehari-hari tanpa nasehat dan kepastian diukur dengan 7 item, dimensi kedua yaitu Kebutuhan terhadap orang lain untuk mengambil alih tanggung jawab bagi sebagian besar area kehidupan diukur dengan 8 item, dimensi ketiga yaitu Kesulitan mengekspresikan ketidaksetujuan dengan orang lain karena takut kehilangan dukungan atau penerimaan diukur dengan 8 item, dimensi keempat yaitu kesulitan memulai suatu tugas atau proyek karena rendahnya kepercayaan diri dalam hal penilaian atau kemampuan diukur dengan 8 item, dimensi kelima yaitu kecendrungan untuk mendapatkan 106
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
dukungan dan pemeliharaan dari orang lain hingga tingkatan ketika ia bersedia melakukan sesuatu yang tidak menyenangkan diukur dengan 7 item, dimensi keenam yaitu merasa tidak nyaman atau tidak mampu ketika sendirian karena merasa takut tidak mampu merawat orang lain diukur dengan 4 item, dimensi ketujuh yaitu mencari hubungan lain sebagai sumber harapan dan dukungan segera setelah suatu hubungan berakhir diukur dengan 6 item, dimensi kedelapan yaitu terjebak dalam ketakutan untuk ditinggalkan dan harus mengurus dirinya sendiri diukur dengan 7 item. Selanjutnya ada beberapa item dalam skala dependent personality inventori yang memberikan informasi selain ke dimensinya sendiri juga memberikan ke dimensi lain, itemitem tersebut diantaranya adalah item nomer 2 memberikan informasi ke dimensi nomer 3, item nomer 3 memberikan informasi ke item dimensi 7 dan 8, item nomer 4 memberikan informasi ke dimensi nomer 6 dan 8, item nomer 5 memberikan informasi ke dimensi nomer 7, item nomer 6 memberikan informasi ke dimensi nomer 2 dan 5, item nomer 7 memberikan informasi ke item dimensi 3 dan 5, item nomer 9 memberikan informasi ke dimensi nomer 4, item nomer 10 memberikan informasi ke dimensi nomer 1 dan 4, item nomer 16 memberikan informasi ke dimensi nomer 6, item nomer 18 memberikan informasi ke dimensi nomer 1, item nomer 19 memberikan informasi ke dimensi nomer 2, dan 3, item nomer 25 memberikan informasi ke dimensi nomer 8, item nomer 33 memberikan informasi ke dimensi nomer 6, item nomer 37 memberikan informasi ke item dimensi 3, item nomer 39 memberikan informasi ke dimensi nomer 6, item nomer 41 memberikan informasi ke dimensi nomer 1, item nomer 43 memberikan informasi ke dimensi nomer 1, item nomer 45 memberikan informasi ke dimensi nomer 6 dan 7, item nomer 50 memberikan informasi ke dimensi nomer 6. Rating skala yang digunakan disesuaikan dengan kebutuhan penelitian, yaitu dengan bentuk pernyataan dengan pilihan jawaban disajikan dalam kalimat penyataan mengenai atribut yang diukur atau kalimat pernyataan mengenai situasi yang mengandung indikasi perilaku tertentu. Item yang disajikan merupakan pernyataan mengenai keadaan atau perasaan yang dialami oleh subjek dengan menggunakan jawaban dikotomi (benar atau salah). Setiap jawaban “benar” berarti mengindikasikan adanya dependent personality skoring diberikan nilai 1, sedangkan jawaban “tidak” mengindikasikan tidak adanya dependent personality skoring diberikan nilai 0. Alat ukur Dependent Personality Inventory ini dirancang untuk menentukan tinggi rendahnya dimensi ketergantungan pada seseorang. C. Metode Penelitian Teknik yang digunakan peneliti untuk menganalisis data adalah “Confirmatory Factor Analysis” (CFA). CFA sering digunakan dalam proses pengembangan skala untuk memeriksa struktur laten dari suatu alat tes (Brown, 2006). Dalam konteks ini, CFA digunakan untuk verifikasi jumlah dimensi yang mendasari instrumen (faktor) dan pola hubungan item dengan faktor (factor loading). Adapun subjek dalam penelitian ini yaitu, mahasiswa S1 Universitas Islam Negri Syarif Hidayatullah Jakarta yang tercatat aktif kuliah di tahun ajaran 2011/2012. Selanjutnya, jumlah sampel penelitian yang gunakan adalah sebanyak 234 responden. D. Hasil Penelitian Hasil penelitian ini dipaparkan berdasarkan dimensi (factor) yang mendasari intrumen, yaitu: 1. Validitas Konstruk Dari Faktor Kesulitan Membuat Keputusan Sehari-Hari Tanpa Nasehat Dan Kepastian (KMKS) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor KMKS, ternyata data tidak fit dengan model, Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
107
yaitu dengan Chi-Square = 87.84 , df = 14, P-value = 0.00000, RMSEA = 0.150. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu dengan lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 7.58, df = 8, Pvalue = 0.47560, RMSEA = 0.000. Ini menunjukkan bahwa nilai Chi-Square P-value > 0.05 (tidak signifikan), yang artinya model dengan satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu KMKS. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 6, 11 dan 28. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 1 berikut ini. Tabel 1 Muatan Faktor Item DPI Pada Dimensi KMKS No Standar Koefisien T-value Korelasi Keterangan Item Error 0.43 0.10 4.48 1 Signifikan 6 0.04 0.06 0.66 2 Dropped 11 0.39 0.09 4.30 Signifikan 17 -0.06 0.14 -o.47 2 Dropped 28 0.05 0.06 0.86 Dropped 40 1.06 0.19 5.66 Signifikan 46 0.03 0.08 3.70 Signifikan 51 Keterangan: signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 7 item yang mengukur dimensi KMKS, terdapat 3 item yang tidak signifikan, karena koefisien muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 11, 28, dan 40. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 6, 17, 46, dan 51. 2. Validitas Konstruk Dari Faktor Kebutuhan Terhadap Orang Lain Untuk Mengambil Alih Tanggung Jawab Bagi Sebagian Besar Area Kehidupan (KTOL) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor KTOL, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 88.18, df = 20, P-value = 0.00000, RMSEA = 0.121. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 22. 43, df = 15, P-value = 0.09693, RMSEA = 0.046. ini menunjukkan bahwa nilai Chi-Square P-value > 0.05 108
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
(tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu KTOL. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 12, 22, 29 dan 34. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 2 berikut ini. Tabel 2 Muatan Faktor Item DPI Pada Dimensi KTOL No Standar Koefisien T-value Korelasi Keterangan Item Error 0.68 0.06 11.36 Signifikan 7 -0.49 0.07 -7.45 2 Dropped 12 0.57 0.06 9.03 Signifikan 18 -0.60 0.07 -9.16 1 Dropped 22 0.56 0.07 8.41 1 Signifikan 29 0.70 0.06 11.09 1 Signifikan 34 0.68 0.06 11.32 Signifikan 41 0.71 0.07 10.62 Signifikan 47 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 8 item yang dalam hal ini mengukur dimensi KTOL, terdapat 2 item yang tidak signifikan, karena koefisin muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 12 dan 22. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 7, 18, 29, 34, 41, dan 47. 3. Validitas Konstruk dari Faktor Kesulitan Mengekspresikan Ketidaksetujuan Dengan Orang Lain Karena Takut Kehilangan Dukungan atau Penerimaan (KMK) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor KMK, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 151.12, df = 20, P-value = 0.00000, RMSEA = 0.168. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 12.43, df = 11, P-value = 0.33235, RMSEA = 0.024. ini menunjukkan bahwa nilai Chi-Square Pvalue > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu KMK. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
109
beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 1, 23, 30, dan 35. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 3 berikut ini. Tabel 3 Muatan Faktor Item DPI Pada Dimensi KMK No Standar Koefisien T-value Korelasi Keterangan Item Error 0.55 0.15 3.90 3 Signifikan 1 -0.29 0.07 -4.21 2 Dropped 23 0.10 0.06 1.76 2 Dropped 30 0.22 0.09 2.46 2 Signifikan 35 0.23 0.06 3.67 Signifikan 42 0.32 0.07 4.54 Signifikan 48 -1.15 0.16 -7.31 Dropped 52 -0.39 0.08 -4.99 Dropped 55 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 8 item yang dalam hal ini mengukur dimensi KMK, terdapat 4 item yang tidak signifikan, karena koefisin muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 23, 30, 52, dan 55. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 1, 35, 42, dan 48. 4. Validitas Konstruk Dari Faktor Kesulitan Memulai Suatu Tugas Atau Proyek Karena Rendahnya Kepercayaan Diri Dalam Hal Penilaian Atau Kemampuan (KMST) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor KMST, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 77.21, df = 20, P-value = 0.00000, RMSEA = 0.111. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 21.88, df = 14, P-value = 0.08121, RMSEA = 0.049. Ini menunjukkan bahwa nilai Chi-Square Pvalue > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu KMTS. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 8, 13, dan 19. 110
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 4 berikut ini. Tabel 4 Muatan Faktor Item DPI Pada Dimensi KMST No Koefisien Standar Error T-value Korelasi Keterangan Item 0.00 0.11 0.02 3 Dropped 8 0.41 0.09 4.37 2 Signifikan 13 0.33 0.10 3.37 1 Signifikan 19 0.46 0.09 4.93 Signifikan 24 0.28 0.09 3.20 Signifikan 31 0.44 0.09 4.71 Signifikan 36 0.25 0.09 2.79 Signifikan 43 0.50 0.10 5.10 Signifikan 53 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 8 item yang dalam hal ini mengukur dimensi KMST, terdapat 1 item yang tidak signifikan, karena koefisin muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 8. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 13, 19, 24, 31, 36, 43, dan 53. 5. Validitas Konstruk Dari Faktor Kecendrungan Untuk Mendapatkan Dukungan Dan Pemeliharaan Dari Orang Lain, Hingga Tingkatan Ketika Ia Bersedia Melakukan Sesuatu Yang Tidak Menyenangkan (KUMD) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor KUMD, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 109.22, df = 14, P-value = 0.00000, RMSEA = 0.171. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 11.90, df = 9, P-value = 0.21927, RMSEA = 0.037. ini menunjukkan bahwa nilai Chi-Square Pvalue > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu KUMD. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masingmasing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 9, 32, dan 44. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
111
Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 5 berikut ini. Tabel 5 Muatan Faktor Item DPI Pada Dimensi KUMD No Standar Koefisien T-value Korelasi Keterangan Item Error -0.13 0.08 -1.62 Dropped 2 0.00 0.09 0.02 3 Dropped 9 0.69 0.08 8.40 Signifikan 14 o.43 0.08 5.58 1 Signifikan 32 0.55 0.08 7.07 Signifikan 37 0.48 0.08 6.17 1 Signifikan 44 0.32 0.08 3.89 Signifikan 54 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 7 item yang dalam hal ini mengukur dimensi KUMD, terdapat 2 item yang tidak signifikan, karena koefisin muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 2 dan 9. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 14, 32, 37, 44, dan 54. 6. Validitas Konstruk Dari Faktor Merasa Tidak Nyaman Atau Tidak Mampu Ketika Sendirian Karena Merasa Takut Tidak Mampu Merawat Orang Lain (MTN) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor MTN, ternyata data tidak fit dengan model, dengan Chi-Square = 5.66, df = 2, P-value = 0.05896, RMSEA = 0.089. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, dengan Chi-Square = 5.66, df = 2, P-value = 0.05899, RMSEA = 0.089. Ini menunjukkan bahwa nilai Chi-Square P-value > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu MTN. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 15. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 6 berikut ini. 112
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Tabel 6 Muatan Faktor Item DPI Pada Dimensi MTN No Standar Koefisien T-value Korelasi Keterangan Item Error 0.05 0.07 0.77 Dropped 3 0.12 0.07 1.83 1 Dropped 15 -0.12 0.07 -1.83 Dropped 25 1.00 0.05 21.54 Signifikan 38 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dilihat dari model faktornya, dari 4 item yang dalam hal ini mengukur dimensi MTN, terdapat 3 item yang tidak signifikan, karena koefisin muatan faktor yang paling rendah dan nilai t lebih kecil dari 1.96 yaitu item nomor 3, 15, dan 25. Oleh sebab itu, item tersebut harus didrop. Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 38. 7. Validitas Dari Faktor Mencari Hubungan Lain Sebagai Sumber Harapan Dan Dukungan Segera Setelah Suatu Hubungan Berakhir (MHL) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor MHL, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 33.90, df = 9, P-value = 0.00009, RMSEA = 0.109. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 7.98, df = 7, P-value = 0.33448, RMSEA = 0.024. Ini menunjukkan bahwa nilai Chi-Square P-value > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu MTN. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 4 dan 33. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 7 berikut ini. Tabel 7 Muatan Faktor Item DPI Pada Dimensi MHL No Item Koefisien Standar Error T-value Korelasi Keterangan 0.11 0.08 1.42 Dropped 4 0.19 0.08 2.46 Signifikan 10 0.40 0.07 5.39 Signifikan 20 0.80 0.08 9.74 Signifikan 26 0.59 0.08 7.76 Signifikan 33 0.43 0.07 5.69 Signifikan 49 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
113
Dilihat dari model faktornya, dari 6 item yang dalam hal ini mengukur dimensi MHL, tidak terdapat item yang tidak signifikan, Sedangkan item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 4, 10, 20, 26, 33, dan 49. 8. Validitas Dari Faktor Terjebak Dalam Ketakutan Untuk Ditinggalkan Dan Harus Mengurus Dirinya Sendiri (TDK) Dari hasil analisis CFA yang dilakukan oleh peneliti dengan menggunakan model satu faktor (unidimensional) pada faktor MHL, ternyata data tidak fit dengan model, yaitu dengan Chi-Square = 202.04, df = 14, P-value = 0.00000, RMSEA = 0.240. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model, yaitu dengan Chi-Square = 10.90, df = 7, Pvalue = 0.14316, RMSEA = 0.049. Ini menunjukkan bahwa nilai Chi-Square P-value > 0.05 (tidak signifikan), yang artinya model dengan hanya satu faktor (unidimensional) dapat diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu TDK. Hanya saja pada model ini, terdapat kesalahan pengukuran pada beberapa item yang saling berkorelasi, sehingga dapat disimpulkan bahwa beberapa item tersebut sebenarnya bersifat multidimensi pada dirinya masing-masing. Pada faktor ini, item yang kesalahan pengukurannya saling berkorelasi (multidimensional) adalah item nomor 5, 16, dan 21. Selanjutnya, kualitas item dapat dilihat dari signifikan tidaknya item tersebut menghasilkan informasi tentang apa yang hendak diukur. Untuk mengetahuinya, maka dilakukan pengujian hipotesis nihil tentang koefisien muatan faktor pada item. Pengujiannya dilakukan dengan melihat nilai t bagi setiap koefisien muatan faktor, seperti pada tabel 8 berikut ini. Tabel 8 Muatan Faktor Item DPI Pada Dimensi TDK Standar T-value Korelasi Keterangan Error 0.30 0.07 4.19 3 Signifikan 5 0.47 0.07 6.59 1 Signifikan 16 0.95 0.14 7.01 3 Signifikan 21 0.35 0.07 4.82 Signifikan 27 0.94 0.10 9.83 Signifikan 39 0.29 0.07 4.01 Signifikan 45 0.55 0.08 7.25 Signifikan 50 Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan No Item
Koefisien
Dilihat dari model faktornya, dari 7 item yang dalam hal ini mengukur dimensi TDK, tidak terdapat item yang tidak signifikan, Item yang signifikan dalam arti item yang valid dengan koefisien muatan faktor yang paling tinggi dan nilai t lebih besar dari 1.96 adalah item nomor 5, 16, 21, 27, 39, 45, dan 50. 9. Validitas Konstruk Seluruh Faktor Dpi Dalam Mengukur Satu Konstruk Setelah melakukan analisis faktor konfirmatorik pada masing-masing faktor, kemudian peneliti melakukan analisis faktor konfirmatorik untruk konstruk dependent 114
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
personality inventory (DPI). Untuk menghitung second order peneliti menggunakan factor score dari setiap delapan dimensi. Factor score tersebut digunakan sebagai data untuk second order. Peneliti menguji CFA pada tiap masing-masing dimensi. Setelah diperoleh model fit, peneliti menentukan item valid dan tidak valid. Dari item valid tersebut peneliti menghitung factor score untuk masing-masing dimensi. Setelah diperoleh factor score pada tiap dimensi, maka data tersebut yang dijadikan sebagai data untuk second order. Peneliti menggunakan metode ini, karena lebih efisien yang artinya hanya melakukan satu kali analisis secara simultan dan dari sudut pandang statistik, analisis seperti ini lebih terpercaya. Dari hasil analisis CFA dengan second order factor analisis ternyata data tidak fit dengan model, karena diperoleh Chi-Square = 89.96, df = 20, P-value = 0,00000, RMSEA = 0.123. Oleh sebab itu, peneliti melakukan modifikasi terhadap model, di mana kesalahan pengukuran pada beberapa item dibebaskan berkorelasi satu sama lainnya, maka akhirnya diperoleh data fit dengan model seperti pada gambar 1 berikut ini.
Gambar 1 Second Order Factor Analisis Terlihat dari gambar 4.9, bahwa nilai Chi-Square P > 0.05 (tidak signifikan), yang artinya model dengan dua tingkatan faktor (second order Confirmatory Factor Analysis) fit dengan data. Sehingga artinya, teori yang mengatakan bahwa item-item mengukur delapan faktor dan delapan faktor mengukur dependent personality dapat diterima. Namun model fit ini dapat tercapai karena ada korelasi kesalahan antar faktor yang dibebaskan antara faktor KMKS dengan MTN dan TDK, KUMD dengan TDK, serta MTN dengan TDK. Dalam hal ini yang diuji adalah hipotesis nihil tentang koefisien muatan faktor. Pengujiannya dilakukan dengan melihat nilai t pada setiap koefisien muatan faktor. Ringkasan hasilnya dapat dilihat pada tabel 9. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
115
Tabel 9 Muatan Faktor DPI Pada Second Order Factor Analisis No Faktor Koefisien Error T-Value Keterangan 1 KMKS 0.25 0.08 3.32 Signifikan 2 KTOL 0.72 0.07 10.23 Signifikan 3 KMK 0.53 0.07 7..39 Signifikan 4 KMST 0.48 0.07 6.68 Signifikan 5 KUMD -0.61 0.07 -8.57 Dropped 6 MTN 0.27 0,08 3.53 Signifikan 7 MHL 0.42 0.07 5.77 Signifikan 8 TDK 0.00 0.08 -0.04 Dropped Keterangan : signifikan (t-value > 1.96) ; dropped = tidak signifikan Dari tabel dan gambar di atas ditemukan bahwa, faktor yang muatan faktornya tidak signifikan dalam mengukur dependent personality adalah faktor KUMD dan TDK. Sedangkan item yang signifikan adalah faktor KMKS, KTOL, KMK, KMST, MTN, MHL. Berdasarkan hasil tersebut, terdapat kemungkinan bahwa pengukuran terhadap dependent personality cukup dengan menggunakan faktor yang signifikan saja. E. Diskusi Hasil penelitian menunjukkan bahwa item-item dan faktor-faktor dalam dependent personality Inventory (DPI) tidak mengukur satu faktor (unidimensional) seperti yang diteorikan, karena terdapat beberapa kesalahan item yang saling berkorelasi. Ini menandakan bahwa sebenarnya item-item dalam dependent personality Inventory (DPI) tersebut selain mengukur faktor yang hendak diukur, juga mengukur faktor lain. Seperti temuan dalam penelitian ini, kedelapan faktor yang ada saling berkorelasi, artinya satu faktor juga mengukur faktor lain. Faktor-faktor yang saling berkorelasi tersebut adalah faktor KMKS ternyata juga mengukur faktor MTN dan TDK, faktor KUMD juga mengukur faktor TDK, faktor MTN juga mengukur faktor TDK. Namun model fit satu faktor pada hipotesis pertama dan kedua tetap dapat tercapai dengan catatan korelasi antar kesalahan item harus dibebaskan terlebih dahulu. Dari hasil penelitian ini sebenarnya tidak serta-merta ditarik kesimpulan yang menggugurkan teori yang ada. Oleh karena itu perlu dilakukan analisis terhadap sumber error yang menyebabkan terjadinya ketidaksesuaian antara hasil penelitian dengan teori yang sudah ada. Di antara sekian banyak faktor yang berpotensi menyebabkan terjadinya bias tersebut di antaranya adalah kesalahan dalam pengukuran (measurement error). Sebaiknya, agar penelitian terhindar dari bias dalam penyimpulan, sumber-sumber error ini sebaiknya dapat dikontrol oleh peneliti. Kesalahan dalam pengukuran (measurement error) ini terjadi dimungkinkan karena terdapat kesalahan terjemahan pada alat ukur, sehingga arti dan maksud dari apa yang hendak diukur tidak terukur. Yang akhimya berdampak pada arti dan maksud dari apa yang hendak diukur, alat ukur, orang yang membaca alat ukur tersebut, dan hasil penelitian. Hal ini peneliti asumsikan juga disebabkan karena pengaruh perbedaan budaya negara lain dengan budaya indonesia. Faktor budaya inilah yang peneliti asumsikan dapat menyebabkan perbedaan hasil penelitian. Beberapa item juga sebaiknya sebelumnya dikaji ulang, direvisi, atau bahkan diganti kerena beberapa diantarnya ternyata tidak memberikan kontribusi yang positif terhadap faktor yang seharusnya diukur. 116
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Hasil analisis data pada penelitian ini menunjukkan bahwa setiap faktor dalam dependent personality inventory (DPI) tidak mengukur satu faktor (unidimensional), maka disarankan bagi peneliti selanjutnya menggunakan Item Response Theory (IRT), agar parameter tingkat kesukaran dan daya pembeda untuk mengestimasi ability tidak berdasarkan group dependent dan menekankan pada tingkat butir item bukan tes. Dalam IRT dikenal tiga macam model logistik, dan untuk penelitian ini sebaiknya menggunakan model satu parameter yaitu, The Rasch Model karena dapat menggambarkan karakteristik item berdasarkan indeks kesukaran soal (threshold). Secara teoritis model ini adalah suatu formulasi matematika yang menghubungkan kemungkinan (probability) hasil (benar atau salah untuk butir soal berbentuk dikotomi) apabila seseorang menjawab suatu butir soal sesuai dengan karakteristik orang dan butir soal tersebut. Sedangkan bagi yang ingin menggunakan alat ukur dependent personality inventory (DPI), sebaiknya menggunakan yang telah peneliti uji validitasnya, sehingga alat ukur kepribadian ini dapat dipergunakan dengan melibatkan hasil penelitan dan usulan-usulan peneliti mengenai konstrak dependent personality Inventory ini. Yaitu dengan hanya melibatkan enam faktor dari delapan faktor yang ada, karena dua faktor KUMD dan TDK hasil analisisnya tidak signifikan, maka tidak perlu di ikut sertakan. Jadi hanya faktor KMKS, KTOL, KMK, KMST, MTN, dan MHL saja yang sebaiknya digunakan.
Referensi Brown, A. T. (2006). Confirmatory factor analysis for applied researc. New York : A Division of Guilford Publications, Inc. Groth G, Marnat. (2010). Handbook of psychological assessment. Edisi ke-5. Penerjemah; Helly P. S., dan Sri M. S. Yogyakarta: Pustaka Pelajar. Huber, M. N. (2005). Dependent personality inventory (dpi):a scale to assess dependent personality subtypes based on dsm-iv-tr criteria. United State America: Cleveland State University. Umar, J. (2012). Materi pelatihan analisis faktor. Jakarta
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
117
118
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
THE INFLUENCE OF TEST LENGTH ONRELIABILITY COEFFICIENT IN TERMS OF PROBABILITIES GUESSING Yusep Ridwan, Gaguk Margono, dan Wardani Rahayu Program Pascasarjana Universitas Negeri Jakarta Email:
[email protected],
[email protected], dan
[email protected]
Abstract The objective of this research was to look at the influence of test length and probability guessing towards reliability coefficient. Test length includes test length 30 items and test length 40 items. Probability guessing includes probability guessing 0,33 and probability guessing 0,25. The method used is an experimental method. While the design used is the design factorial of 2 x 2. Research hypotheses were tested using analysis of variance (ANAVA) two ways. The study concluded that: (1) means of reliability coefficient in probability of guessing 0,33 is lower than the means of reliability coefficient in probability guessing 0,25, (2) there is the influence interaction of probability guessing and test length, (3) special for test length 30 items, reliability coefficient in probability guessing 0,33 is lower than the means of reliability coefficient in probability of guessing 0,25, and (4) special for test length 40 items, reliability coefficient in probability of guessing 0,33 is lower than the means of reliability coefficient in probability guessing 0,25. Keywords: test length, probability guessing, reliability coefficient Pendahuluan Evaluasi merupakan hal yang sangat penting dalam proses pembelajaran, karena dengan dilaksanakannya evaluasi akan diketahui sampai sejauh mana tingkat kemampuan dan keberhasilan peserta didik dalam pencapaian standar kompetensi. Sebagaimana Nitko (2009: 7). yang memberikan pengertian evaluasi sebagai sebuah proses untuk membuat keputusan penting mengenai sejauhmana hasil belajar yang dicapai oleh peserta didik telah tercapai. Keputusan yang diambil adalah untuk mengukur sejauhmana peningkatan mutu peserta didik setelah dilakukan proses belajar. Proses evaluasi ini tidak lepas dari proses pengukuran, dan penilaian, karena evaluasi adalah hasil dari kegiatan pengukuran dan penilaian. Proses pengukuran merupakan proses pemberian angka atau bilangan kepada para peserta tes atas karakteristik-karakteristik yang melekatinya menurut aturan yang telah ditentukan (Silverius, 1991: 6). Proses pengukuran ini akan menghasilkan angka-angka yang kemudian akan dianalisis untuk keperluan evaluasi. Dalam pengukuran tidak membuahkan nilai baik atau buruknya sesuatu, tetapi hasil pengukuran dapat dipakai untuk membuat penilaian atau mengambil keputusan. Dalam bidang pendidikan, pengukuran memegang peranan yang sangat penting. Sebab data hasil pengukuran dalam bidang pendidikan memiliki arti penting baik bagi lembaga pendidikan, guru, peserta didik, orang tua, maupun masyarakat. Bagi guru pengukuran bermanfaat untuk membandingkan tingkat kemampuan peserta didik dengan peserta didik yang lain dalam kelompok yang diajarnya. Di sekolah pengukuran dilakukan guru untuk menaksir kemampuan atau prestasi peserta didik. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
119
Banyak prosedur evaluasi yang dapat dilakukan untuk mengukur informasi pembelajaran dan kemampuan peserta didik, salah satu diantaranya adalah tes, karena pengukuran dan tes saling berkaitan. Tes merupakan suatu alat atau prosedur yang dipergunakan untuk mengukur pengetahuan atau penguasaan peserta didik terhadap seperangkat materi atau konten. Senada dengan Anastasi (2007: 523) yang memberikan pendapatnya bahwa tes hasil belajar adalah suatu tes yang dirancang untuk mengukur hasil dari suatu program pengajaran atau pelatihan. Dengan demikian alat yang digunakan untuk evaluasi harus dibuat sedemikian rupa sehingga alat tersebut mampu mengungkapkan informasi seakurat mungkin, supaya keputusan yang diambil tidak keliru, karena dapat merugikan peserta tes. Membuat perangkat tes tidak mudah, sebab tes merupakan alat untuk melihat perubahan kemampuan dan tingkah laku peserta didik setelah ia menerima pengajaran dari guru di sekolah. Alat evaluasi yang salah akan menggambarkan kemampuan dan tingkah laku yang salah pula. Oleh karena itu teknik penyusunan alat evaluasi penting dipertimbangkan agar memperoleh hasil yang obyektif. Menurut Sudjana (2009: 35) tes adalah pertanyaan-pertanyaan yang diberikan kepada peserta didik untuk mendapat jawaban dari peserta didik dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tertulis), atau dalam bentuk perbuatan (tes tindakan). Banyak cara yang bisa dilakukan untuk tes, namun cara yang sering dilakukan adalah tes tertulis. Pengertian tes tertulis menurut Surapranata (2005: 9) adalah alat penilaian berbasis kelas yang penyajiannya maupun penggunaannya dalam bentuk tertulis.Peserta didik memberikan jawaban atas pertanyaan maupun pernyataan yang diberikan.Tes tertulis dapat diberikan pada ulangan harian dan ulangan umum.Adapaun bentuk tes tertulis dapat berupa pilihan ganda, menjodohkan (matching), jawaban singkat, isian singkat dan uraian. Tes pilihan ganda (PG) merupakan salah satu bentuk dari tes tertulis yang pada saat ini mendapat perhatian dan sering digunakan dalam evaluasi pendidikan.Tes ini dapat mengukur pengetahuan yang luas dan bervariasi. Item tes pilihan ganda mempunyai semua persyaratan sebagai tes yang baik, yakni dilihat dari segi obyektifitas, reliabilitas, dan daya beda antara peserta didik yang memiliki kemampuan tinggi dan rendah. Soal tes bentuk pilihan ganda dapat dipakai untuk mengukur hasil belajar yang lebih kompleks berkenaan dengan aspek ingatan, pemahaman, aplikasi, sintesis, analisis, dan evaluasi.Bentuk tes ini dapat mengukur berbagai macam kemampuan, mulai dari yang paling rendah sampai dengan yang tinggi. Soal pilihan ganda juga dapat digunakan untuk mengukur kemampuan yang secara umum tidak dapat diukur oleh bentuk soal lainnya. Soal bentuk pilihan ganda memiliki beberapa kelemahan yaitu mempunyai peluang terhadap perilaku spekulasi atau menebak (guessing). Karena peserta tes harus memilih jawaban dari beberapa alternatif jawaban. Mengenai berapa banyak alternatif jawaban pada model tes ini, belum ada aturan baku yang menentukan jumlah alternatif jawabannya. Pengurangan faktor penebak akan meningkatkan reliabilitas dan validitas, sepanjang alternatif jawaban itu bagus dan soalnya dibuat dengan baik. Pada format tes objektif dengan beberapa pilihan jawaban, sering timbul pertanyaan mengenai perlu tidaknya menerapkan cara pemberian sekor dengan hukuman (penalty) bagi peserta didik yang menjawab salah. Dasar pemikirannya adalah bahwa pada tes bentuk pilihan ganda terdapat peluang menjawab benar sekalipun jawaban itu dipilih hanya dengan cara menebak. Padahal seharusnya mereka yang memang tidak tahu jawaban yang benar 120
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
tidaklah berhak untuk mendapatkan angka. Jika peserta yang tidak tahu kemudian mendapatkan angka dan hasilnya sama dengan peserta yang tahu, maka hasil yang diperoleh bersifat tidak adil. Pada pelaksanaan tes, ketidakadilan ini sering muncul, Padahal menurut Azwar (1996: 14) hasil tes yang diperoleh dengan cara yang tidak adil, tidak dapat memberikan informasi untuk mengetahui prestasi peserta didik yang sebenarnya, dan hasil tes seperti itu dapat memberikan informasi yang keliru mengenai keberhasilan belajar peserta didik. Oleh karena itu, seorang pendidik harus mempersiapkan perangkat tes yang andal (reliabel), serta berlaku adil dalam mengevaluasi keberhasilan belajar para peserta didik. Adil disini mempunyai arti tidak terjadi kesalahan pengukuran kemampuan peserta didik yang diakibatkan oleh kesalahan alat ukur yang digunakan serta cara penyelenggaraannya. Untuk mendapatkan informasi yang adil bagi setiap peserta didik maka diperlukan alat ukur yang adil pula, sehingga peserta didik yang mempunyai kompetensi yang sama akan memperoleh sekor tes yang sama, pada skala ukur yang sama. Peserta didik yang pandai akan mempunyai sekor yang lebih tinggi daripada peserta didik yang kurang pandai. Dengan demikian variasi sekor yang diperoleh menggambarkan variasi kemampuan peserta didik dalam menguasai materi yang telah diajarkan. Salah satu penyebab peserta tes melakukan tebakkan dalam menjawab soal bentuk pilihan ganda karena soal tersebut tidak sesuai dengan kemampuan mereka, artinya soal terlalu sulit untuk level kemampuan mereka. padahal, perilaku menebak/guessing merupakan salah satu sumber kesalahan pengukuran dalam tes, khususnya bagi tes pencapaian. Kusaeri (2010: 209) menyatakan bahwa salah satu faktor yang harus dipertimbangkan dalam pengukuranmaximum performance adalah pengaruh perilaku guessing, karena guessingakan berkontribusi terhadap varians kesalahan pengukuran dan mengurangi reliabilitas tes. Jelas bahwa perilaku guessing mempengaruhi koefisien reliabilitas, dengan demikian perlu dilakukan upaya untuk meminimalisir perilaku guessing supaya didapat instrumen tes yang handal sehingga tujuan evaluasi dapat tercapai. Model pensekoran tes pilihan ganda yang cenderung digunakan dewasa ini adalah menjumlahkan skor jawaban yang benar saja (correct score) sebagai skor peserta tes. Akan tetapi model ini memberi peluang peserta tes untuk berspekulasi atau berperilaku menebak dalam menjawab tes, sehingga memunculkan alternatif model pensekoran untuk mengurangi perilaku menebak yang dilakukan peserta tes, yaitu model pensekoran hukuman atau penalti. Model penalti ini merupakan model pensekoran yang memperhitungkan jawaban salah yang direspon oleh peserta tes dengan jalan memeberi hukuman dalam bentuk mengurangi skor dengan menggunakan rumus tertentu. Selain perilaku guessing, faktor yang mempengaruhi koefisien reliabilitas adalah panjang tes, pada umumnya semakin banyak jumlah butir soal tes samakin tinggi pula reliabilitasnya.Hal ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak perilaku atau informasi yang terukur dengan lebih tepat. Pada saat ini, lembaga pendidikan menggunakan 3 alternatif jawaban untuk sekolah dasar, 4 alternatif jawaban untuk sekolah menengah pertama, dan 5 alternatif jawaban untuk sekolah menengah atas.Pada penelitian dilakukan di sekolah menengah pertama (SMP), dimana panjang tes untuk soal Matematika yaitu 40 butir dengan jumlah alternatif jawaban 4. Prosedur ini sudah lama dilaksanakan, namun belum banyak penelitian mengenai tingkat Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
121
perilaku guessingnya, khususnya untuk mata pelajaran Matematika, dengan demikian diperlukan suatu penelitian untuk mengetahui ”pengaruh panjang tes terhadap koefisien reliabilitas ditinjau dari probabilitas guesssing”. Metode Penelitian Metode penelitian ini termasuk dalam penelitian eksperimen, yang terdiri dari dua variabel, yaitu variabel bebas dan variabel terikat, pada penelitian ini, yang menjadi variabel bebas adalah panjang tes dan probabilitas guessing.Sedangkan variabel terikatnya adalah koefisien reliabilitas. Bentuk tes yang digunakan adalah tes pilihan ganda dengan panjang tes yang berbeda yaitu panjang tes 30 butir dan panjang tes 40 butir, masing-masing menggunakan bentuk tes pilihan ganda tiga alternatif jawaban (probabilitas guessing 0,33) dan empat alternatif jawaban (probabilitas guessing 0,25), pada mata pelajaran Matematika. Sebagai ilustrasi rancangan dari penelitian ini adalah sebagai berikut: Tabel 1. Rancangan Penelitian PROBABILITAS GUESSING 0,33 (A1) 0,25 (A2) A1B1 A2B1 A1B2 A2B2
PANJANG TES (B) 30 (B1) 40 (B2)
Karena objek penelitian adalah instrumen, yaitu membandingkan dua tes dengan panjang tes 30 butir dan 40 butir, dimana masing-masing diberi tes pilihan ganda namun alternatif jawabannya berbeda (probabilitas guessing 0,25 dan probabilitas guessing 0,33), maka populasi penelitian disini adalah peserta tes yaitu siswa SMPN di kabupaten Tasikmalaya. Pemilihan sampel dilakukan dengan teknik multistage random sampling, sampel yang diambil berjumlah 1037 peserta tes. Tabel 2. Distribusi Sampel Berdasarkan Rancangan Penelitian
PANJANG TES (B) 30 (B1) 40 (B2) JUMLAH SISWA
PROBABILITAS GUESSING (A) 0,33 (A1) 0,25 (A2) 242 280 243 272 485 552
JUMLAHSISWA 522 515 1037
Sampel penelitian mengambil 1037 orang siswa, dengan rincian untuk sampel dengan menggunakan panjang tes 30 sebanyak 522 siswa, dan panjang tes 40 sebanyak 515 siswa, dimana seluruh sampel mendapat mata pelajaran Matematika dan masing-masing sampel akan diambil dengan teknik random sampling sebanyak 75 responden dengan teknik pengembalian (replace randomized), pengembalian ini akan dilakukan sebanyak sepuluh kali. Perangkat tes yang berfungsi sebagai instrumen penelitian disusun oleh peneliti (tes buatan peneliti). Prosedur pengumpulan data melalui tahap-tahap sebagai berikut: (1) Perangkat tes yang dibuat adalah panjang tes 30 dan 40 yang diberi kode PT30, dan PT40. perangkat tes dengan menggunakan probabilitas guessing 0,33 dan 0,25 diberi kode PG0,33, dan PG0,25; 122
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
(2) Responden menjawab pada lembar jawaban yang telah disediakan. Dari delapan sekolah, 1037 responden sebagai sampel. Pengambilan sampel diambil dengan menggunakan teknik acak (random sampling); (3) Sampel responden di atas terdiri dari 4 kelompok masing-masing 242 responden yang menggunakan panjang tes 30 dengan probabilitas guessing 0,33 (PT30 PG0,33), 280 responden yang menggunakan (PT30 PG0,25), 243 responden yang menggunakan (PT40 PG0,33), dan 272 responden yang menggunakan (PT40 PG0,25); (4) Setelah diketahui nilainya pada setiap responden, maka dilakukan acak pada nomor urut responden pada masing-masing panjang tes, dimana diambil 75 responden dari setiap kelompok responden, kemudian dihitung kembali reliabilitasnya. Hal ini dilakukan sebanyak 10 kali dan didapat 10 koefisien reliabilitas; (5) Dari masing-masing instrument yang diteskan kepada siswa, maka terbentuk 4 kelompok data koefisien reliabilitas, 10 koefisien reliabilitas untuk PT30, PG0,33, 10 koefisien reliabilitas untuk PT30, PG0,25, 10 koefisien reliabilitas untuk PT40, PG0,33, 10 koefisien reliabilitas untuk PT30, PG0,25; dan (6) Setelah didapat koefisien reliabilitas untuk masing-masing kelompok, kemudian dianalisis untuk melihat adakah perbedaan tingkat reliabilitas dari keempat kelompok data tersebut. Teknik analisis data melalui beberapa tahap, yaitu: (1) melakukan uji persyaratan analisis, dimana uji persyaratan analisis meliputi uji normalitas dengan menggunakan uji Lilliefors dan uji homogenitas varian menggunakan uji Bartlett. Uji normalitas dan homogenitas ini dilakukan pada reliabilitas tes, karena nilai-nilai reliabilitas tes yang digunakan diperoleh dari pengambilan berulang kali secara acak terhadap responden penelitian; (2) menghitung koefisien reliabilitas tes, dalam hal ini adalah suatu nilai yang mampu menggambarkan sejauh mana konsistensi hasil ukur bila dilakukan pengukuran berulang-ulang terhadap responden yang memiliki gejala sama dengan menggunakan alat ukur yang sama pula.Rumus yang digunakan untuk menentukan koefisien reliabilitas pada masing-masing instrumen diperoleh dari analisis butir soal yakni dengan menggunakan rumus: [(1 p) 2 2 K ] xx [(1 p) 2 2 K ] [ p(1 p)( N K )] Dimana: ρxx = Koefisien reliabilitas p = Probabilitas Guessing 2 σK = Varian Skor K μK = Mean dari K N = Jumlah item K = Banyaknya item yang diketahui; (3) Selain melihat perbedaan reliabilitas tes, dalam penelitian ini juga dilakukan analisis perbedaan rerata kelompok koefisien reliabilitas pada panjang tes dan rerata kelompok koefisien reliabilitas pada probabilitas guessing, serta interaksi anatara keduanya. Jika terdapat interaksi maka dilanjutkan dengan uji lanjut yaitu uji Tukey, karena jumlah sampelnya sama. Uji perbedaan ini dengan menggunakan Analisis Varian Dua Jalan (Anava Dua Jalan).
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
123
Hasil Penelitian Koefisien reliabilitas tes Matematika terdiri dari empat kelompok yaitu probabilitas guessing 0.33 dengan panjang tes 30 A1 B1 , probabilitas guessing 0.33 dengan panjang tes
40 A1 B2 , probabilitas guessing 0.25 dengan panjang tes 30 A2 B1 dan probabilitas guessing 0.25 dengan panjang tes 40 A2 B2 dengan deskripsi sebaran datanya sebagai berikut:
Tabel 3. Deskripsi Sebaran Data Koefisien Reliabilitas pada Kelompok
A1B1 , A1B2 , A2 B1danA2 B2
SEBARAN DATA Sampel Jumlah Mean Median Standard Dev Variance Min Max
A1B1
A1B2
A2 B1
A2 B2
10 10 10 10 8,1387 7,4700 8,4377 8,2201 0,8139 0,7470 0,8438 0,8220 0,8126 0,7490 0,8377 0,8158 0,0131 0,0271 0,0233 0,0145 0,00017 0,00074 0,00054 0,00021 0,7970 0,7016 0,8138 0,8067 0,8387 0,7792 0,8806 0,8523
Secara teoretik, koefisien reliabilitas tes Matematika berada pada rentang terendah 0,00 dan sekor tertinggi 1,00. Harga rata-rata hitung (mean) tertinggi sebesar 0,8438 yaitu pada kelompok probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 sementara harga rata-rata hitung (mean) terendah sebesar 0,7470 yaitu pada kelompok probabilitas guessing 0,33 dengan panjang tes 40 A1 B2 , kelompok ini juga A1 B2 memiliki varians tertinggi sebesar 0,00074, sedangkan variansi terendah sebesar 0,00017 pada probabilitas guessing 0,33 dengan panjang tes 30 A1 B1 . Hasil empirik koefisien reliabilitas pada keempat kelompok data diperoleh koefisien reliabilitas tertinggi (Max) sebesar 0,8806 yaitu pada kelompok probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 dan koefisien reliabilitas terendah (Min) sebesar 0,7016 yaitu pada kelompok probabilitas guessing 0,33 dengan panjang tes 40 A1 B2 . Keempat kelompok data di atas, dapat juga dijelaskan dengan diagram kotak garis atau boxplot, dimana terlihat bahwa distribusi kemiringan (skewnes)pada probabilitas guessing 0,33 dengan panjang tes 30 A1 B1 adalah miring positif, dimana koefisien kemiringannya sebesar 0,30 berarti distribusi datanya miring positif atau landai kanan karena ekor kanan lebih panjang dari ekor kiri artinya data banyak mengumpul di nilai-nilai yang kecil. Sementara koefisien kemiringan pada probabilitas guessing 0,33 dengan panjang tes 40 A1B2 sebesar -0,22 berarti miring negatif, atau landai kiri karena ekor kiri lebih panjang dari ekor kanan artinya data banyak mengumpul di nilai-nilai yang besar. Distribusi kemiringan (skewnes)pada probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 adalah miring positif, dimana koefisien kemiringannya sebesar 0,78 berarti distribusi datanya miring positif atau landai kanan karena ekor kanan lebih panjang dari ekor kiri artinya data banyak mengumpul di nilai-nilai yang kecil. Distribusi kemiringan
124
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
(skewnes)pada probabilitas guessing 0,25 dengan panjang tes 40 A2 B2 adalah miring positif atau landai kanan karena ekor kanan lebih panjang dari ekor kiri artinya data banyak mengumpul di nilai-nilai yang kecil.
Gambar 1. BoxplotSebaran Sekor Tes Matematika Pada Siswa yang Diberikan Probabilitas Guessing Posisi boxplot probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 berada di atas
boxplot A1 B1 , A1 B2 dan A2 B2 , ini menunjukkan bahwa rata-rata koefisien reliabilitas
pada probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 lebih tinggi dari rata-rata koefisien reliabilitas A1 B1 , A1 B2 dan A2 B2 , sebagaimana yang tertera pada tabel 4 dimana rata-rata koefisien reliabilitas pada probabilitas guessing 0,25 dengan panjang tes 30 A2 B1 sebesar 0,8438.
Koefisien reliabilitas pada pada probabilitas guessing 0.33 dengan panjang tes 30 A1 B1 penyebaran datanya lebih homogin dibanding koefisien reliabilitas pada A1 B2 ,
A2 B1 , A2 B2 ini ditunjukkan dengan panjang kotak A1 B1 lebih pendek dari kotak A1B2 , A2 B1 , A2 B2 atau dengan kata lain, varians koefisien reliabilitas pada probabilitas guessing 0,33 dengan panjang tes 40 A1 B2 (0,00074) lebih besar dari varians koefisien reliabilitas pada A1 B1 sebesar (0,00017), A2 B1 sebesar (0,00054) dan A2 B2 sebesar (0,00021). Hipotesis yang diuji dalam penelitian ini adalah pengaruh faktor utama (main effect) dan pengaruh interaksi (interaction effect), yang diuji pada pengaruh faktor utama yaitu perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 A1 dengan probabilitas guessing 0,25 A 2 dan perbedaan koefisien reliabilitas antara panjang tes 30 B1 dengan panjang tes 40 B 2 . Sedangkan pengaruh interaksi (interaction effect) yaitu pengaruh interaksi antara probabilitas guessing dan panjang tes, kemudian jika terjadi interaksi antara probabilitas guessing dan panjang tes, maka dilanjutkan dengan uji simple effect, yaitu: (1) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas guessing 0,25 pada panjang tes 30, (2) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
125
probabilitas guessing 0,25 pada panjang tes 40, (3) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir, pada probabilitas guessing 0,33; dan (4) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir pada probabilitas guessing 0,25. Pengujian hipotesis dalam penelitian ini menggunakan analisis varian (ANAVA) dua jalan yang dilanjutkan dengan uji F. Ringkasan hasil perhitungan analisis data Uji ANAVA dua jalan dapat dilihat pada Tabel 4 berikut: Tabel 4. Hasil Perhitungan Analisi Varian (ANAVA) Dua Jalan
Sumber Variance
JK
db
RJK
Antar A Antar B Interaksi AB Dalam Total
0,0275 0,0196 0,0051 0,0150 0,0672
1 1 1 36 39
0,0275 0,0196 0,0051 0,0004
Ftabel α=0,05 α=0,01 66,1741** 4,1132 7,3956 47,2302** 12,2389** Fhit
Berdasarkan hasil perhitungan ANAVA dua jalan pada Tabel 4 di atas, maka dapat dilakukan pengujian hipotesis sebagai berikut: Hasil pengujian hipotesis pertama dengan menggunakan ANAVA dua jalan pada taraf signifikansi 0,01 , didapat nilai Fhitung = 66,1741 lebih besar dari Ftabel = 7,3956, maka Ho ditolak, sebagai konsekuensinya maka H1 diterima, artinya terdapat perbedaan rata-rata koefisien reliabilitas antara probabilitas guessing 0,33 A1 dengan probabilitas guessing 0,25 A 2 . Nilai rata-rata koefisien reliabilitas pada probabilitas guessing 0,333 sebesar 0,7804 lebih rendah dari nilai rata-rata koefisien reliabilitas pada probabilitas guessing 0,25 sebesar 0,8329. Dengan demikian dapat disimpulkan bahwa koefisien reliabilitas pada probabilitas guessing 0.25 lebih tinggi dari koefisien reliabilitas pada probabilitas guessing 0,333. Pengujian hipotesis kedua, berdasarkan analisis varians (ANAVA) di atas, didapat nilai Fhitung = 47,2302 lebih besar dari Ftabel = 7,3956, pada taraf signifikansi 0,01 maka Ho ditolak, sebagai konsekuensinya maka H1 diterima, artinya terdapat perbedaan rata-rata koefisien reliabilitas antara panjang tes 30 B1 dengan panjang tes 40 B 2 .Nilai rata-rata koefisien reliabilitas pada panjang tes 30 sebesar 0,8288 lebih tinggi dari nilai rata-rata koefisien reliabilitas pada panjang tes 40 sebesar 0,7845. Dengan demikian dapat disimpulkan bahwa koefisien reliabilitas pada panjang tes 30 lebih tinggi dari koefisien reliabilitas pada panjang tes 40. Berdasarkan hasil analisis varians (ANAVA) di atas diperoleh Fhitung efek interaksi A*B = 12,2389 lebih besar dari Ftabel = 7,3956, pada taraf signifikansi 0,01 , maka H0 ditolak. Dengan demikian dapat dikatakan bahwa hipotesis ketiga, terdapat pengaruh interaksi antara probabilitas guessing dengan panjang tes terhadap koefisien reliabilitas tes matematika.Dengan adanya interaksi antara probabilitas guessing dengan panjang tes, maka dilanjutkan dengan uji ANAVA satu jalan untuk melihat simple effect, yaitu untuk menguji:(1) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas 126
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
guessing 0,25 pada panjang tes 30, (2) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas guessing 0,25 pada panjang tes 40, (3) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir, pada probabilitas guessing 0,33; dan (4) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir pada probabilitas guessing 0,25, uji perbedaan akan menggunakan uji Tukey, karena penelitian ini dilakukan untuk membandingkan data dua kelompok yang memiliki jumlah sampel sama. Pengujian hipotesis keempat, dengan menggunakanujiTukey, didapatkan harga Qhitung = 4,9918 lebih besar dari Qtabel dengan α = 0,01 sebesar 4,48, maka Ho ditolak, atau H1 diterima. artinya terdapat perbedaan rata-rata koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas guessing 0,25 pada panjang tes 30.Dilihat dari rata-rata kedua kelompok menunjukan, bahwa rata-rata koefisien reliabilitasguessing 0,33 pada panjang tes 30 yaitu = 0,8139 lebih rendah dari rata-rata koefisien reliabilitasguessing 0,25 pada panjang tes 30 yaitu = 0,8438. Dengan demikian dapat disimpulkan bahwa khusus untuk panjang tes 30, rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari koefisien reliabilitas pada probabilitas guessing 0,25. Pengujian hipotesis kelima, dengan menggunakanujiTukey, didapatkan harga Qhitung = 10,9080 lebih besar dari Qtabel dengan α = 0,01 sebesar 4,48, maka Ho ditolak, atau H1 diterima, artinya terdapat perbedaan rata-rata koefisien reliabilitas antara probabilitas guessing 0,3333 dan probabilitas guessing 0,25 pada panjang tes 40. Dilihat dari rata-rata kedua kelompok menunjukan, bahwa rata-rata koefisien reliabilitasguessing 0,33 pada panjang tes 40 yaitu = 0,7470 lebih rendah dari rata-rata koefisien reliabilitasguessing 0,25 pada panjang tes 40 yaitu = 0,8220, dengan demikian untuk panjang tes 40, rata-rata koefisien reliabilitas pada probabilitas guessing 0,333 lebih rendah dari koefisien reliabilitas pada probabilitas guessing 0,25. Pengujian hipotesis keenam, dengan menggunakanujiTukey, didapatkan harga Qhitung = 9,9171 lebih besar dari Qtabel dengan α = 0,01 sebesar 4,48, maka Ho ditolak, atau H1 diterima, artinya terdapat perbedaan rata-rata koefisien reliabilitas antara panjang tes 30 dan panjang tes 40 pada probabilitas guessing 0,3333.Dilihat dari rata-rata kedua kelompok menunjukan, bahwa rata-rata koefisien reliabilitas pada panjang tes 30 pada probabilitas guessing 0,3333 yaitu = 0,8139 lebih rendah dari rata-rata koefisien panjang tes 40 pada probabilitas guessing 0,3333 yaitu = 0,7470, dengan demikian untuk probabilitas guessing 0,33, rata-rata koefisien reliabilitas pada panjang tes 30 butir lebih tinggi dari panjang tes 40 butir, berarti hipotesis ini tidak teruji. Pengujian Hipotesis ketujuh, dengan menggunakanuji-Tukey, didapatkan harga Qhitung = 3,5439 lebih kecil dari Qtabel dengan α = 0,01 sebesar 4,48, dan lebih besar dari
Qtabel dengan α = 0,05 sebesar 3,15, maka Ho ditolak, atau H1 diterima, artinya terdapat perbedaan rata-rata koefisien reliabilitas antara panjang tes 30 dan panjang tes 40 pada probabilitas guessing 0,25. Dilihat dari rata-rata kedua kelompok menunjukan, bahwa ratarata koefisien reliabilitas pada panjang tes 30 untuk probabilitas guessing 0,25 yaitu = 0.8438 lebih tinggi dari rata-rata koefisien reliabilitas pada panjang tes 40 untuk probabilitas
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
127
guessing 0,25 yaitu = 0,8220, dengan demikian untuk probabilitas guessing 0,25, rata-rata koefisien reliabilitas pada panjang tes 30 butir lebih tinggi dari panjang tes 40 butir. Pembahasan Hasil Penelitian Berdasarkan hasil analisis varian (ANAVA) dua jalan untuk sumber varians antar A sebagai hipotesis pertama ditemukan bahwa Fhitung = 66,1741 lebih besar dari Ftabel = 7,3956, ini menunjukkan bahwa probabilitas guessing0,33 A1 dengan probabilitas guessing 0,25 A2 adalah berbeda, perbedaan ini didukung dengan nilai rata-rata koefisien reliabilitas pada probabilitas guessing0,33 A1 sebesar 0,7804 dan rata-rata koefisien reliabilitas pada probabilitas guessing 0,25 A2 sebesar 0,8329, nampak dari deskripsi data pada kedua kelompok ini memiliki rerata yang berbeda. Hal ini mempunyai arti bahwa rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari koefisien reliabilitas pada probabilitas guessing 0,25, dengan demikian uji hipotesis pertama ini teruji.
Menurut pendapat Zimmerman “When guessing is present, reliability is an increasing function of the number of items as well as the number of item choices”, jadi semakin banyak opsi yang digunakan, probabilitas guessing akan semakin kecil dan koefisien reliabilitaspun akan meningkat. Dengan kata lain, jika probabilitas guessingnya besar maka koefisien reliabilitas akan besar pula, dan jika dibandingkan probabilitas yang besar dengan probabilitas yang kecil maka koefisien reliabilitas akan lebih tinggi probabilitas guessing yang besar.
Fhitung
Berdasarkan hasil analisis varians antar B sebagai hipotesis kedua ditemukan bahwa sebesar 47,2302 lebih besar dari Ftabel sebesar 7,3956, ini menunjukkan bahwa
koefisien reliabilitas pada panjang tes 30 B1 dengan panjang tes 40 B2 adalah berbeda, perbedaan ini didukung dengan nilai rata-rata koefisien reliabilitas pada panjang tes 30 B1
sebesar 0,8288 dan rata-rata koefisien reliabilitas pada panjang tes 40 B2 sebesar 0,7845, nampak dari deskripsi data pada kedua kelompok ini memiliki rerata yang berbeda. Hal ini mempunyai arti bahwa rata-rata koefisien reliabilitas pada panjang tes 30 B1 lebih tinggi dari koefisien reliabilitas pada panjang tes 40 B2 , dengan demikian uji hipotesis kedua ini ini tidak teruji, karena hipotesis yang di usulkan adalah koefisien reliabilitas pada panjang tes 30 lebih rendah dari panjang tes 40 butir. Panjang tes adalah banyaknya butir tes yang mencerminkan banyaknya informasi atau pengetahuan yang akan diukur pada peserta tes. Banyaknya respon betul yang diperoleh peserta tes berarti kompetensi yang dimiliki peserta tes mendekati kompetensi yang sebenarnya.Peserta tes yang banyak menjawab betul, berarti kompetensi yang dimiliki peserta tes mendekati yang sebenarnya.Semakin banyak butir yang diukur, dan semakin banyak pula peserta tes menjawab betul, maka kompetensi yang dimiliki peserta mendekati sempurna atau mendekati yang sebenarnya. Hal ini akan berkontribusi terhadap keandalan suatu instrumen yang diukur. Karena menurut pendapat Zimmerman “When guessing is present, reliability is an increasing function of the number of items ...”, semakin banyak butir yang digunakan maka reliabilitas akan meningkat maksudnya instrumen yang digunakan semakin handal.Dengan demikian akan menimbulkan perbedaan nilai koefisien reliabilitas. Dari teori di atas seharusnya koefisien reliabilitas pada panjang tes 30 B1 lebih
rendah dari panjang tes 40 B2 akan tetapi hipotesis dalam penelitian ini tidak teruji, hal ini 128
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
dikarenakan: (1) varians dari sekor K (sekor tes matematika) antara panjang tes 30 dan panjang tes 40 setara, sementara menurut Zimmerman, standar deviasi dari sekor K setara dengan N/5atau varians sekor K ( 2 K ) sebesar (N/5)2 (Zimmerman, 2003: 369), (2) menurut Dali, untuk meningkatkan koefisien reliabilitas, maka perlu dilakukan perpanjangan alat ukur (instrument) sampai kelipatan L paruh (L=1,2,3 dan seterusnya), dalam hal ini L sama dengan N atau banyaknya butir/panjang tes (Naga: 1992). Dengan demikian, koefisien reliabilitas pada panjang tes 30 akanberbeda dengan panjang tes 30 x L (panjang tes 60, 90 dan seterusnya). Berdasarkan hasil analisis varians untuk interaksi AB sebagai hipotesis ketiga, diperoleh Fhitung sebesar 12,2389 lebih besar dari Ftabel =7,3956, maka H0 ditolak, dengan demikian dapat dikatakan bahwa terdapat pengaruh interaksi antara probabilitas guessing dengan panjang tes terhadap koefisien reliabilitas tes matematika.Dengan adanya interaksi antara probabilitas guessing dengan panjang tes, maka harus dilanjutkan dengan uji ANAVA satu jalan, yaitu untuk menguji (1) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas guessing 0,25 pada panjang tes 30, (2) perbedaan koefisien reliabilitas antara probabilitas guessing 0,33 dan probabilitas guessing 0,25 pada panjang tes 40, (3) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir, pada probabilitas guessing 0,33 dan (4) perbedaan koefisien reliabilitas antara panjang tes 30 butir dengan panjang tes 40 butir pada probabilitas guessing 0,25, uji perbedaan ini akan menggunakan uji Tukey. Berdasarkan hasil uji Tukey, bahwa khusus untuk panjang tes 30, koefisien reliabilitas pada probabilitas guessing 0,33 dan probabilitas guessing 0,25 adalah berbeda, perbedaan ini didukung dengan nilai rata-rata koefisien reliabilitas probabilitas guessing0,33 A1 pada panjang tes 30 sebesar 0,8139 dan rata-rata koefisien reliabilitas probabilitas guessing 0,25 A2 pada panjang tes 30 sebesar 0,8438, artinya uji hipotesis keempat ini teruji, karena hipotesis yang diusulkan adalah khusus untuk panjang tes 30, koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari probabilitas guessing 0,25. Berdasarkan hasil uji Tukey, bahwa khusus untuk panjang tes 40, koefisien reliabilitas pada probabilitas guessing 0,33 dan probabilitas guessing 0,25 adalah berbeda, perbedaan ini didukung dengan nilai rata-rata rata-rata koefisien reliabilitas probabilitas guessing0,33 pada panjang tes 40 sebesar 0,7470 dan rata-rata koefisien reliabilitas probabilitas guessing 0,25 pada panjang tes 40 sebesar 0,8220, artinya khusus untuk panjang tes 40, rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari probabilitas guessing 0,25, dengan demikian uji hipotesis kelima ini teruji. Dengan panjang tes yang tetap atau konstan, namun jumlah opsi berbeda atau probabilitas guessingnya berbeda, maka koefisien reliabilitas yang tinggi akan dihasilkan oleh butir yang memiliki jumlah opsi yang banyak, karena peserta akan lebih sulit untuk melakukan tebakan, sehingga kompetensi yang diukur adalah kompetensi peserta tes yang sebenarnya, dengan demikian reliabilitas pun akan semakin tinggi. Berdasarkan hasil uji Tukey, bahwa khusus untuk probabilitas guessing0,33, rata-rata koefisien reliabilitas antara panjang tes 30 dan panjang tes 40 adalah berbeda, perbedaan ini juga terlihat dari nilai rata-rata koefisien reliabilitas panjang tes 30 pada probabilitas guessing 0,33 sebesar 0,8139 dan rata-rata koefisien reliabilitas panjang tes 40 pada probabilitas guessing0,33sebesar 0,7470, dari deskripsi data pada kedua kelompok ini menunjukkan
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
129
bahwa, khusus untuk probabilitas guessing 0,33, rata-rata koefisien reliabilitas pada panjang tes 30 lebih tinggi dari koefisien reliabilitas pada panjang tes 40, dengan demikian uji hipotesis keenam ini tidak teruji, karena hipotesis yang diusulkan adalah khusus untuk probabilitas guessing 0,33, koefisien reliabilitas pada panjang tes 30 butir lebih rendah dari panjang tes 40 butir. Berdasarkan hasil uji Tukey, bahwa khusus untuk probabilitas guessing0,25, rata-rata koefisien reliabilitas antara panjang tes 30 dan panjang tes 40 adalah berbeda, perbedaan ini didukung dengan nilai rata-rata koefisien reliabilitas panjang tes 30 pada probabilitas guessing 0,25 sebesar 0,8438 dan rata-rata koefisien reliabilitas panjang tes 40 pada probabilitas guessing 0,25 sebesar 0,8220, nampak dari deskripsi data pada kedua kelompok ini memiliki rerata yang relatif sama. Dengan kata lain, khusus untuk probabilitas guessing 0,25, rata-rata koefisien reliabilitas pada panjang tes 30 dan koefisien reliabilitas pada panjang tes 40 sama saja, dengan demikian uji hipotesis ketujuh ini tidak teruji, karena hipotesis yang diusulkan adalah khusus untuk probabilitas guessing 0,25, koefisien reliabilitas pada panjang tes 30 butir lebih rendah dari panjang tes 40 butir. Peserta tes yang tidak memiliki kemampuan untuk menjawab betul, akan berusaha menjawab dengan melakukan lokalisasi atau eliminasi terhadap opsi yang tersedia. Jika jumlah opsinya sedikit maka eliminasi opsi akan mudah dilakukan dan probabilitas untuk menebak benar adalah besar, akan tetapi jika jumlah opsinya bertambah banyak maka eliminasipun bertambah sulit sehingga probabilitas guessingnya kecil. Hal ini akan tetap terjadi meskipun panjang tes yang tersedia berbeda. Karena peserta tes yang tidak memiliki kemampuan untuk menjawab betul tetap saja akan melakukan eliminasi terhadap jumlah opsi yang ada, artinya setiap butir akan selalu ditebak oleh peserta yang tidak memiliki kemampuan untuk menjawab. Akan tetapi jika dilihat dari kehandalan atau reliabilitas yang diperoleh, maka koefisien reliabilitas yang tinggi akan dihasilkan oleh butir yang banyak, karena peserta akan lebih sulit untuk melakukan tebakan. Namun kenyataannya dalam penelitian ini justru terjadi sebaliknya, koefisien reliabilitas yang dihasilkan oleh panjang tes 30 lebih tinggi dari panjang tes 40. Hipotesis keenam dan ketujuh di atas tidak teruji, ini dikarenakan: (1) varians dari sekor K antara panjang tes 30 dan panjang tes 40 setara untuk masing-masing kelompok probabilitas guessing 0,33 dan 0,25 setara, (2) panjang tes seharusnya 30 x L atau panjang tes 60, 90. Simpulan Sesuai tujuan dan permasalahan yang telah dirumuskan bahwa tujuan dari penelitian ini adalah untuk mengetahui pengaruh probabilitas guessing dan panjang tes yang paling tepat digunakan dalam tes hasil belajar matematika agar diperoleh instrumen dengan tingkat koefisien reliabilitas yang baik. Berdasarkan hasil pengujian hipotesis, maka dikemukakan beberapa kesimpulan, sebagai berikut. 1. 2. 3.
Rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari rata-rata koefisien reliabilitas pada probabilitas guessing 0,25. Terdapat pengaruh interaksi antara panjang tes dan probabilitas guessing terhadap koefisien reliabilitas. Khusus untuk panjang tes 30, rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendah dari rata-rata koefisien reliabilitas pada probabilitas guessing 0,25.
130
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
4.
Khusus untuk panjang tes 40, rata-rata koefisien reliabilitas pada probabilitas guessing 0,33 lebih rendahdari rata-rata koefisien reliabilitas pada probabilitas guessing 0,25. DAFTAR PUSTAKA
Aiken, Lewis R.Psychological Testing Assessment.Massachusetts: Allyn and Bacon, 1994. Anastasi, Anne dan Susana Urbina.Psychological Testing, terjemahan Robertus Hariono. Jakarta: Indeks, 2007. Arikunto, Suharsimi. Dasar-Dasar Evaluasi Pendidikan.Jakarta: Bumi Aksara, 2007. Azwar,
Saifuddin.Tes Prestasi Fungsi dan Pengembangan Belajar.Yogyakarta: Pustaka Pelajar, 1996.
Pengukuran
Prestasi
Cronbach, Lee J.Essential of Psychological Testing.New York: Harper & Row Publisher, 1984. Djaali dan Pudji Mulyono.Pengukuran dalam Bidang Pendidikan.Jakarta: Grasindo, 2007. Fray, Robert B.“The Effect of Misinformation, Partial Information, and Guessing on Expected Multiple Choice Test Item Scores.” Applied Psychological Measurement, 1 (1980): 79-90. Gronlund, Norman E., dan Robert L. Linn.Measurement and Evaluation in Teaching.New York: Macmillan Publishing Company, 1999. Kusaeri. “Guessing dan Pengaruhnya Terhadap Reliabilitas Tes Pilihan Ganda.” http://jurnal.pdii.lipi.go.id, (diakses tanggal 17 Desember 2010). McMillan, James H.Assesment Essential for Standards-Based Education. California: Carwin Press, 2008. Mehrens, William A., dan Irvin J. Lehmann.Using Standardized Test in Education.New York: Longman Inc., 1987. Naga, Dali S.Pengantar Teori Sekor pada Pengukuran Pendidikan.Jakarta: Universitas Gunadarma,1992. Nitko, Anthony J.Educational Assessment of Studen.,New Jersey: Prentice Hall, Inc., 2009. Plake, Barbara S., dan Gerald J. Melican. “Prediction of Item Performance by Expert Judges: A Methodology for Examining the Impact of Correction for Guessing Instructions on Test Taking Behavior.” Research Report, ED 298-171, National Institute of Education, US Departement of Education: Educational Resources Information Center (ERIC), 1985. Reynolds, Cecil R., Ronald B. Livingston, dan Victor Willson.Measurement and Assesment in Education. Boston: Meril is an Inprint of Pearson, 2009. Rogers, H. J.Guessing in Multiple Choice Tests, Advances in Measurement in Educational Research and Assessment.Oxford: Elsevier Sciences, 1999. Silverius, Suke.Evaluasi Hasil Belajar dan Umpan Balik.Jakarta: Grasindo, 1991. Stamboel, Conny S.Prinsip dan Teknik Pengukuran dan Penilaian di Dalam Dunia Pendidikan.Jakarta: Mutiara Sumber Widya, 1991. Sudjana, Nana.Penilaian Hasil Proses Belajar Mengajar.Bandung: PT Remaja Rosdakarya, 2009. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
131
Sukardi.Evaluasi Pendidikan, Prinsip dan Operasionalnya.Jakarta: PT Bumi Aksara, 2009. Surapranata, Sumarna.Panduan Penulisan Tes Tertulis, 2004.Bandung: PT Remaja Rosdakarya, 2005.
Implementasi
Kurikulum
Tobroni.Teori-Teori Mengukur Mutu Sekolah. http://tobroni.staff.umm.ac.id, (diakses 29 April 2011). Wiersma, William dan Stephen G. Jurs.Educational Measurement Testing.Massachusetts: A division of Simon & Schuster, Inc., 2001.
and
Wilcox, Rand R. “Solving Measurement Problems With an Answer Until Correct Scoring Procedure.” Journal Applied Psychological Measurement, 3 (Summer 1981): 399414. Zimmerman, Donald W., danRichard H. Williams. “A New Look at the Influence of Guessing on the Reliability of Multiple-Choice Tests.” Journal Applied Psychological Measurem
132
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
PEMETAAN MATERI SULIT UJIAN NASIONAL BAHASA INDONESIA PADA SISWA SMA JURUSAN BAHASA DI KABUPATEN MINAHASA SELATAN DAN BOLAANGMONGONDOW UTARA PROVINSI SULAWESI UTARA Harol R. Lumapow Universitas Negeri Manado ABSTRAK Tujuan penelitian ini adalah untuk: (1) Mengidentifikasi materi UN apa saja yang dianggap sulit oleh siswa untuk mata ujian Bahasa Indonesia; (2) Pemetaan materi sulit UN untuk mata pelajaran Bahasa Indonesia di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara; dan (3) Untuk mengetahui apakah ada perbedaan jumlah materi sulit pada mata ujian Bahasa Indonesia ditinjau dari tahun penyelenggaraan UN 2007-2010. Hasil penelitian menunjukkan bahwa : (1) Materi sulit untuk mata ujian bahasa Indonesia untuk siswa SMA di Kabupaten Minahasa Selatan pada tahun 2007/2008, dari 50 butir soal terdapat sebanyak 22 butir (44,00%), 2008/2009 sebanyak 21 butir (42,00%), dan 2009/2010 paket A sebanyak 25 butir (50,00%) dan paket B sebanyak 20 butir (40,00%), dan materi sulit untuk mata ujian bahasa Indonesia untuk siswa SMA di Kabupaten Bolaangmongondow Utara pada tahun 2007/2008, dari 50 butir soal terdapat sebanyak 21 butir (42,00%), 2008/2009 sebanyak 21 butir (42,00%), dan 2009/2010 paket A sebanyak 25 butir (50,00%) dan paket B sebanyak 20 butir (40,00%); (2) Secara umum tingkat kesulitan soal UN mata ujian bahasa Indonesia selama 3 tahun terakhir di SMA Kabupaten Minahasa Selatan dan Bolaangmongondow Utara relatif merata; dan (3) Tingkat kemampuan siswa peserta UN dari tahun ke tahun relatif sama. Secara umum terdapat perbedaan jumlah materi sulit UN selama tiga tahun terakhir. Kata Kunci: Pemetaan materi sulit UN mata ujian Bahasa Indonesia PENDAHULUAN Kualitas pendidikan masih menjadi salah satu masalah pendidikan nasional Indonesia. Hal ini tercermin dalam kebijakan nasional pendidikan yaitu meningkatkan mutu dan relevansi pendidikan (butir misi kementerian pendidikan nasional 2011-2014). Artinya pemer8intah masih menempatkan upaya peningkatan mutu pendidikan ebagai agenda penting pembangunan pendidikan nasional. Dalam rangka peningkatan mutu pendidikan, maka telah dikeluarkan berbagai kebijakan strategis pendidikan nasional yang diharapkan akan memberi dampak peningkatan mutu pendidikan termasuk hasil belajar siswa. Salah satu kebijakan nasional pendidikan adalah ujian nasional. Ujian nasional menjadi instrument penting untuk mengendalikan dan sekaligus untuk meningkatkan mutu pendidikan. Melalui ujian nasional telah ditetapkan standar kompetensi dan kompetensi dasar yang harus dikuasai oleh setiap peserta didik. Badan Standar Nasional Pendidikan (BSNP) telah menetapkan standar kompetensi baik kompetensi lulusan maupun standar kompetensi dan kompetensi dasar yang harus dikuasai siswa unhtuk setiap mata pelajaran termasuk mata pelajatran ujian nasional. Standardisasi dalam pendidikan tidak dimaksudkan untuk menyeragamkan, melainkan lebih bermakna sebagai standar pelayanan minimal. Standar pelayanan minimal dimaksudkan untuk menjadi acuan bagi para penyelenggara, pengelola, Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
133
dan pelaksana pendidikan yang ada di kabupaten/kota sehingga bisa menyesuaikan dengan kebutuhan daerah tanpa mengurangi kualitas yang sudah ditentukan secara nasional. Dalam pelaksanaan ujian nasional dalam tiga tahun terakhir, sekolah-sekolah di Sulawesi Utara menunjukkan tingkat kelulusan yang sangat baik sekalipun terdapat kecenderungan yang menurun untuk ketiga bidang studi (grafik 1). Namun demikian hasil ujian nasional tersebut masih menjadi perdebatan pro dan kontra terutama terkait dengan kualitas lulusan. Sejauh mana kualitas pendidikan dengan tingkat kelulusan yang tinggi telah memenuhi standar minimal ataukah belum memenuhi standar minimal? Apakah terdapat konsistensi tingkat kelulusan dengan tingkat penguasaan standar kompetensi dan kompetensi dasar siswa? Apakah tingkat kelulusan yang tinggi diikuti dengan tingkat penguasaan standar kompetensi dan kompetensi dasar yang tinggi?
350 300
97.28
93.53
97.87
93.85
250 200 150 100
98.95
96.95
50
70.73
BHS
70.77
IPS
80.19
IPA
0 2009
2010
2011
Grafik 1. Persentase kelulusan SMA se Sulawesi Utara (Data diolah dari Dinas Diknas Provinsi Sulaweasi Utara) Masalah penguasaan standar minimal baik standar kompetensi maupun kompetensi dasar untuk setiap mata pelajaran ujian nasional menjadi sangat penting dibuatkan pemetaan termasuk pemetaan kompetensi lulusan di Sulawesi Utara. Fungsi pemetaan ini terkait dengan dua hal utama yaitu dalam rangka memperoleh peta penguasaan kompetensi dan kedua dalam rangka perumusan kebijakan peningkatan mutu.. Secara regional, berdasarkan hasil UN SMA jurusan Bahasa di Kabupaten Minahasa Selatan dan Bolaangmongdow Utara diperoleh rata-rata persentase penguasaan siswa untuk indikator tertentu dari Standar Kompetensi dan kompetensi dasar yang dicapai siswa SMA Jurusan Bahasa dalam UN tahun 2007-2010 untuk mata pelajaran Bahasa Indonesia belum optimal. Untuk menyikapi hal tersebut di atas, maka berbagai upaya yang telah dilakukan oleh pemerintah agar hasil UN bisa meningkat dari tahun ke tahun dengan cara mengidentifikasi materi sulit khususnya untuk mata ujian Bahasa Indonesia. Dengan mengetahui materi sulit yang belum dikuasai siswa, maka perlu dilakukan pembinaan dan pendampingan pada guru pengampu mata ujian tersebut. Berdasarkan latar belakang masalah yang diuraikan di atas, maka masalah dapat dirumuskan berikut ini. (1) Materi UN apa saja yang dianggap sulit oleh siswa untuk mata ujian Bahasa Indonesia? (2) Bagaimanakah peta materi sulit UN untuk mata pelajaran Bahasa Indonesia di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara? (3) Apakah ada perbedaan jumlah materi sulit pada mata ujian Bahasa Indonesia ditinjau dari tahun penyelenggaraan UN 2007-2010? 134
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Kompetensi menjadi ciri dan salah satu unsur penting kurikulum sekolah yang berlaku saat ini yaitu kurikulum tingkat satuan pendidikan (KTSP). Kompetensi yang dirumuskan merupakan tujuan yang akan dicapai melalui kegiatan pembelajaran siswa. Kompetensi tersebut terdiri dari dua yaitu standar kompetensi (SK) dan kompetensi dasar (KD). Kompetensi demikian menjadi unsur penting untuk mengukur mutu yang akan atau yang ingin dicapai siswa setelah melalui suatu proses pembelajaran atas suatu mata pelajaran atau suatu pokok bahasan. Kompetensi di dalam berbagai literatur dilihat dalam dua makna yang saling memaknai yaitu kompetensi sebagai suatu kemampuan atau kecakapan, dan kompetensi sebagai suatu kewenangan. Kompetensi sebagai suatu kemampuan dan atau kecakapan yang dimiliki akan menjadi dasar bagi seseorang untuk memiliki kewenangan dalam mengambil suatu tindakan profesional. Para ahli seperti Roe, R.A. (2001) merumuskan kompetensi sebagai berikut: a. Competence is defined as the ability to adequately perform a task, duty or role. b. Competence integrates knowledge, skills, personal values and attitudes. c. Competence builds on knowledge and skills and is acquired through work experience and learning by doing Definisi yang dikemukakan oleh Roe tersebut memberikan beberapa batasan mengenai kompetensi, yaitu kompetensi sebagai suatu kecakapan yang diperlukan oleh seseorang untuk dapat melaksanakan tugas, kewajiban atau perannya. Kompetensi itu merupakan integrasi dari berupa pengetahuan, keterampilan, nilai-nilai dan sikap personal seseorang. Kompetensi dalam pengertian kewenangan dibangun dari pengetahuan dan keterampilan yang diperlukan melalui suatu pengalaman kerja yaitu belajar sambil bekerja. Elemen-elemen penting dari suatu kompetensi adalah (1) pengetahuan yang melandasi kompetensi, (2) keterampilan melaksanakan tugas, (3) nilai-nilai-nilai dan sikap personal, dan (4) pengalaman dalam tugas. Oleh sebab itu setiap kompetensi memiliki tiga ranah utama yaitu (1) knowledge, (2) attitude, dan (3) skill. Ketiga ranah tersebut berada dalam satu kesatuan yang saling terkait, dan kompetensi harus mencakup isi ketiga ranah tersebut. Ranah kompetensi digambarkan sebagai berikut:
Knowledge
Attitude
Kompetensi
Skill
Gambar 1. Ranah kompetensi Tampak pada gambar 1 bahwa kompetensi merupakan irisan dan memiliki tiga kemampuan utama yaitu pengetahuan, keterampilan, dan sikap. Pengetahuan yang dimiliki seseorang tidak cukup kuat untuk seseorang itu dikatakan berkompeten. Demikian juga keterampilan tanpa pengetahuan spesifik yang melandasinya bukanlah suatu kompetensi Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
135
tetapi lebih merupakan “tukang”. Pengetahuan dan keterampilan yang dimiliki harus didukung oleh nilai dan sikap yang melandasi keseluruhan perilaku seseorang dalam mengimplementasikan pengetahuan dan keterampilan. Artinya nilai dan sikap ini akan menjadi kekuatan motivasional seseorang untuk melakukan suatu pekerjaan berdasarkan kompetensinya. Roe (1999) mengemukakan suatu model struktur kompetensi yang dibentuk melalui proses pendidikan. Model tersebut digambarkan sebagai berikut:
Competences
Attitudes
Skills
Knowledge
Basic Competences
Educational Process
Gambar 2. Proses pembentukan kompetensi Gambar 2 menunjukkan dua hal penting, yaitu pertama proses pembentukan kompetensi, dan kedua jenis kompetensi yang diperlukan. Pendidikan dalam hal ini pembelajaran mempunyai peran penting dalam rangka pembentukan pengetahuan, sikap, dan keterampilan. Pengetahuan, sikap, dan keterampilan itu dapat dilihat dalam dua kompetensi yaitu sebagai standar kompetensi (kompetensi), dan kompetensi dasar. Kompetensi dasar berisi kemampuan dan kecakapan yang diperlukan untuk mencapai suatu standar kompetensi. Sifatnya adalah imperative, oleh dan sebab itu pencapaian kompetensi dasar akan memungkinkan seseorang memiliki peluang yang yang lebih besar dalam menguasai atau dalam mencapai standar kompetensi. Kompetensi dasar menjadi prasyarat bagi pembentukan dan pencapaian standar kompetensi. Struktur kompetensi yang dikembangkan di sekolah-sekolah saat ini, terdiri dari standar kompetensi (SK), dan kompetensi dasar (KD). Standar kompetensi adalah kualifikasi kemampuan minimal peserta didik yang menggambarkan penguasaan sikap, pengetahuan, dan keterampilan yang diharapkan dicapai pada setiap tingkat dan/atau semester; standar kompetensi terdiri atas sejumlah kompetensi dasar sebagai acuan baku yang harus dicapai dan berlaku secara nasional.Standar kompetensi terdiri dari standar kompetensi lulusan (SKL), standar kompetensi kelompok mata pelajaran, dan standar kompetensi mata pelajaran. Kompetensi dasarmerupakan sejumlah kemampuan yang harus dimiliki peserta didik dalam mata pelajaran tertentu sebagai rujukan untuk menyusun indikator kompetensi. Keterkaitan standar kompetensi, kompetensi dasar, dan indicator kompetensi digambarkan sebagai berikut: 136
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Standar Kompetensi Standar kompetensi lulusan Standar kompetensi kelompok MP Standar kompetensi MP
Kompetensi Dasar
Indikator Kompetensi
Gambar 3. Keterkaitan antara standar kompetensi dan kompetensi dasar Pemetaan kompetensi di berbagai literatur merujuk pada upaya yang dilakukan untuk mendapatkan gambaran atau bangun kompetensi setiap mata pelajaran yang akan dibentuk atau yang harus dikuasai oleh setiap peserta didik. Robyn Namara (2004) menjelaskan hakikat pemetaan kometensi sebagai berikut: “Competency mapping originated as an attempt to empirically determine the cognitive structure underlying an introductory programming course (Namara, 2004:3). Pemetaan kompetensi atau competency mappingoleh Namara dilihat sebagai suatu sebagai suatu proses untuk memperoleh gambaran tentang kompetensi yang dikuasai dan yang belum dikuasai sehingga melalui pemataan ini akan diperoleh gambaran mengenai bangun kompetensi tentang kompetensi yang dimiliki siswa setelah menyelesaikan setiap mata pelajaran untuk satu semester pelajaran. Robyn Namara menjelaskannya sebagai berikut …”over the duration of any programming course, a lot of data is collected about students performance: pracmarks, assignment marks, test results, and axam results” (Robyn Namara, 2004:2).Pemetaan kompetensi senantiasa diawali dengan data yang dikumpulkan mengenai performans siswa melalui hasil belajar yang diperoleh melalui penugasan, praktikum ataupun hasil-hasil ujian. Dari analisis terhadap data yang dikumpulkan dapat disimpulkan tentang bangun komptensi yang dimiliki siswa. Pada gambar 3, ditunjukkan keterkaitan antara standar kompetensi (SK) dan kompetensi dasar (KD). Secara hirakhis, setiap standar kompetensi memuat sejumlah sejumlah tema atau di dalam KTSP dikenal dengan pokok bahasan. Dan setiap pokok bahasan akan memiliki kompetensi dasar yang harus dikuasai siswa dalam rangka terpenuhinya standar kompetensi. Gambar 4 berikut ini akan memberi gambaran mengenai studi pemetaan kompetensi terutama dalam melihat bangun kompetensi suatu mata pelajaran. Pemetaan SK dan KD memiliki beberapa fungsi (1) membantu untuk memahami makna setiap rumusan kompetensi, (2) memperkuat pemahaman secara menyeluruh dan komprehensif mengenai kompetensi yang akan dibangun baik SK maupun KD, (3) membantu dan memperkuat strategi implementasi dalam proses pembelajaran (4) membantu memperkuat strategi pengukuran dan evaluasi yang tepat mengenai penguasaan kompetensi oleh seorang siswa. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
137
Gambar 4. Peta standar kompetensi dan kompetensi dasar mata pelajaran Proses pembelajaran dalam rangka pembentukan kompetensi akan sangat dipengaruhi oleh banyak factor. Salah satu pendekatan dalam melakukan analisis terhadap factor-faktor determinan yang berpengaruh dalam proses pembelajaran adalah pendekatan sistemik. Salah satu model analisis yang dapat digunakan adalah model analisis yang dikemukakan Fishbone Diagram yang dikemukakan oleh Ishikawa Kaoru (1985). Diragram tersebut digambarkan sebagai berikut:
Ishikawa Fishbone Diagram Model Analysis
Gambar 5. Model analisis faktor penyebab diadaptasi dari Fishbone Diagram
138
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Fishbone diagram diharapkan akan sangat membantu analisis, dan dari digram tersebut dapat dianalisis sejumlah factor penyebab rendahnya penguasaan kompetensi oleh siswa. Faktor-faktor tersebut dapat terdiri dari (1) sumber daya manusia yaitu guru seperti kualitas, koordinasi, pemanfaatan, promosi, reward system, pengalaman, dan faktor lainnya. (2) fasilitas yang mencakup pendanaan, sarana dan prasarana pendidikan dan pembelajaran, (3) proses pembelajaran seperti delivery system, suasana akademik, (4) kepemimpinan yang terkait dengan masalah manajemen baik manajemen kelas maupun manajemen sekolah oleh guru dan kepala sekolah. Manajemen mutu terpadu, merupakan salah satu model manajemen mutu yang banyak diterapkan di dunia industri, yang kemudian diadopsi di bidang pendidikan. Salah satu model manajemen mutu terpadu adalah model yang dikemukakan oleh Juran yang terkenal dengan Trilogi Juran (Juran and Gryna, 1988). Trilogi Juran pertama adalah perencanaan mutu (quality planning), kedua pengendalian mutu (quality control), dan ketiga perbaikan mutu (quality control). Perencanaan mutu (quality planning) merupakan manajemen yang fokus pada penyusunan kebijakan dan atau tujuan mutu dan proses operasional untuk mencapai tujuan mutu. Setiap sekolah dan atau setiap guru harus memiliki perencanaan mutu berupa kebijakan mutu yang hendak dicapai bersama. Kebijakan mutu ini akan menjadi arah baik sekolah maupun guru dalam keseluruhan praksis pembelajaran di sekolah. Pengendalian mutu (quality control) merupakan manajemen yang tertuju pemenuhan persyaratan mutu pendidikan. Dua persyaratan yang sangat penting ialah persyaratan mutu input dan persyaratan mutu proses. Persyaratan mutu input terdiri dari ketersediaan dan terpenuhi rasio kecukupan dan mutu sarana prasarana seperti gedung sekolah, ruangan kelas, finansial, perpustakaan, laboratorium, fasilitas dan media pembelajaran, alat-alat pelajaran. Persyaratan mutu proses mencakup keseluruhan proses terutama terpenuhinya persyaratan mutu proses pembelajaran di kelas dan di sekolah. Perbaikan mutu (quality improvement) merupakan upaya yang teruju pada peningkatan kemampuan memenuhi persyaratan mutu dalam rangka efektivitas dan efisiensi. Dalam konteks ini menjadi sangat penting untuk secara berkelanjutan dilaksanakan upayaupaya perbaikan mutu. Upaya itu dapat mencakup penataan dan perbaikan baik input maupun proses seperti perbaikan sarana dan prasarana, peningkatan kemampuan dan profesionalitaas guru, dan atau perbaikan mutu pembelajaran di kelas. Model peningkatan mutu secara berkelanjutan dalam pengembangan strategi pembelajaran inovatif merupakan model yang dikembangkan oleh JoLaine R. Draugalis and Marion K. Slack (1999). Diagram model tersebut digambarkan dalam gambar 6. Model peningkatan kualitas secara berkelanjutan ini memiliki karakteristik utama yaitu peningkatan mutu yang dilakukan secara terencana dan berkelanjutan. Kelemahan selama ini ialah upaya peningkatan mutu yang dilakukan oleh guru pada tataran kelas atau sekolah bersifat temporal dan parsial. Dua aspek penting dalam model ini ialah aspek perencanaan dan aspek implementasi yang menggunakan prinsip-prinsip manajemen mutu terpadu melalui strategi Plan, Do, Check, Act (PDCA). Aspek perencanaan mencakup upaya-upaya perencanaan kegiatan ndalam rangka peningkatan mutu, pengorganisasian tim gurubidang studi di sekolah atau di suatu wilayah, mengkalirifikasi berbagai faktor dalam mengembangkan variasi proses pembelajaran, dan memilih strategi pembelajaran yang tepat. Di dalam implementasi keseluruhan langkah tersebut dirumuskan ke dalam Rencana Pelaksanaan Pembelajaran (RPP) guru yang mencakup keseluruhan PDCA dan bersifat sirkuler. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
139
Find a learning process to improve
Organize team that knows the learning process
Clarify current knowledge of the learning process Understanding causes of learning process variation Select the learning improvement process
Act To hold gain To continue improvement Data for Process improve. Student outcome Lesson learned
Plan Improvement Data collection
Improvement Data collection Data analysis
Do Check
Gambar 6. A Continuous Quality Improvement Model for Developing Innovative Instructional Strategies (JoLaire, 1999: 355) METODE PENELITIAN Penelitian ini termasuk kategori survey eksploratif, yang bertujaun untuk mengidentifikasi dan mendeskripsikan materi sulit UN bagi siswa SMA Jurusan Bahasa di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara pada mata ujian Bahasa Indonesia untuk UN 2007-2010. Data yang digunakan dalam penelitian ini adalah data sekunder, yakni data mengenai hasil ujian nasional tahun 2007-2010 yang dimiliki oleh Pusat penilaian Pendidikan (Puspendik), Balitbang Depdiknas. Data penelitian yang telah dikumpulkan selanjutnya dilakukan analisis untuk menentukan materi sulit berdasarkan hasil yang dicapai siswa SMA Jurusan Bahasa di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara pada mata 140
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
ujian Bahasa Indonesia untuk UN 2007-2010. Materi dianggap sulit jika hasil UN yang dicapai siswa kurang dari 60%. Teknik analisa data yang digunakan dalam penelitian ini adalah deskriptif kuanlitatif HASIL PENELITIAN DAN PEMBAHASAN A. Hasil UN 2007-2010 Siswa Jurusan Bahasa Tabel 1. Proporsi siswa menjawab Benar pada Materi Sulit UN 2007/2008 mata Ujian Bahasa Indonesia pada SMA Kabupaten Minahasa Selatan No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
Propinsi
1.
Susun Paragraf
Menusun berbagai paragraph/karangan
24,62
27,76
1
2.
Susun Paragraf
Menusun berbagai paragraph/karangan
29,10
35,07
2
3.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
30,37
47,63
3
4.
Pola Paragraf
Identifikasi berbagai pola pengembangan paragraph melalui membaca intensif
30,43
48,80
4
5.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
34,60
46,45
5
6.
Struktur Bahasa
Menggunakan struktur bahasa dlam berbagai bentuk tulisan
35,92
33,00
6
7.
Biografi
Menentukan isi teks bacaan
37,88
31,33
7
8.
Teks/nonteks
Menentukan isi teks bacaan
37,88
31,33
8
9.
Ide Pokok
Menentukan ide pokok teks bacaan nonsastra
42,55
59,70
9
10.
Biografi
Menentukan isi teks bacaan
44,63
50,82
10
11.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
45,45
39,19
11
12.
Susun Paragraf
Menyusun berbagai paragraph/karangan
50,19
44,00
12
13.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
50,44
57,24
13
14.
Struktur Bahasa
Menggunakan struktur bahasa dalam berbagai bentuk tulisan
51,83
49,20
14
15.
Pola Paragraf
Identifikasi berbagai pola pengembangan paragraph melalui membaca intensif
56,13
53,13
15
16.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
57,45
66,57
16
17.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
57,83
67,96
17
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Nasional
Peringkat
141
18.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
58,33
43,58
18
19.
Susun Paragraf
Menyusun berbagai paragraph/karangan
58,34
47,62
19
20.
Susun Paragraf
Menyusun berbagai paragraph/karangan
59,60
72,28
20
21.
Lengkapi Paragraf
Melengkapi berbagai paragraf
59,79
64,12
21
22.
Pola Paragraf
Identifikasi berbagai pola pengembangan paragraph melalui membaca intensif
61,36
58,40
22
Tabel 2. Proporsi siswa menjawab Benar pada Materi Sulit UN 2008/2009 mata Ujian Bahasa Indonesia pada SMA Kabupaten Minahasa Selatan No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
Propinsi
Nasional
Peringkat
1.
Disajikan kalimat menggunakan ragam yang tidak resmi, siswa dapat memperbaikinya dengan tepat
18,75
48,69
1
2.
Menentukan perbedaan focus sajian kedua teks tajuk rencana/editorial dengan topic yang sama dari sumber
18,99
42,70
2
3.
Disajikan teks bacaan dua/tiga paragraph, siswa dapat menentukan ide pokok paragraph pertama
31,13
55,30
3
4.
Menentukan kalimat yang menggunakan kata yang mengalami perluasan makna menyempit
33,99
48,96
4
5.
Disajikan teks bacaan dua/tiga paragraph siswa dapat menentukan opini dalam paragraf
37,56
46,27
5
6.
Menentukan hal yang dapat diteladani dari sebuah paragraph tentang biografi tokoh
38,57
64,34
6
7.
Disajikan sebuah paragraph eksposisi, siswa dapat menentukan kalimat yang tidak mendukung kalimat
39,52
55,05
7
8.
Melengkapi dengan kalimat yang tepat dari paragraph analogis yang simpulannya dirampungkan
41,90
52,92
8
9.
Disajikan grafik/tabel, siswa dapat menentukan simpulan isi grafik/tabel
42,02
70,80
9
10.
Disajikan sebuah paragraph berisi laporan, siswa dapat menentukan simpulan paragraf
43,27
75,65
10
11.
Menentukan masalah yang terdapat dalam tajuk rencana/editorial yang terdiri atas dua/tiga paragraf
44,76
47,72
11
142
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
12.
Disajikan kalimat rumpang, siswa dapat melengkapinya dengan kata bermakna kias yang tepat
50,12
61,40
12
13.
Menentukan rangkuman isi tajuk rencana/editorial yang terdiri atas dua/tiga paragraf
51,67
52,62
13
14.
Menentukan opini penulis dalam tajuk rencana/editorial yang terdiri atas dua/tia paragraf
52,02
51,06
14
15.
Disajikan teks bacaan dua/tiga paragraph, siswa dapat menentukan rangkuman isi paragraf
52,14
60,12
15
16.
Disajikan penutup surat lamaran pekerjaan yan tidak tepat, siswa dapat menentukan perbaikan yang tepat
53,16
57,98
16
17.
Disajikan sebuah paragraph eksposisi, siswa dapat menentukan kalimat utama paragraf
53,33
70,92
17
18.
Disajikan kata pengantar karya ilmiah yang kurang tepat, siswa dapat memperbaikinya
54,11
61,75
18
19.
Disajikan teks bacaan dua/tiga paragraph artikel, siswa dapat menentukan paragraph pertama
55,96
68,27
19
20.
Disajikan dialog, siswa dapat menentukan rangkuman dialog tersebut dengan tepat
56,19
66,87
20
21.
Disajikan beberapa kalimat acak, siswa dapat menyusunnya menjadi paragraph diduktif yang tepat
57,98
61,56
21
Tabel 3. Proporsi siswa menjawab Benar pada Materi Sulit UN 2009/2010 Paket A mata Ujian Bahasa Indonesia pada SMA Kabupaten Minahasa Selatan No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
Propinsi
Nasional
Peringkat
1.
Menentukan kalimat opini suatu paragraf
0,93
47,90
1
2.
Menentukan masalah yang dibicarakan dalam tajuk rencana
10,23
32,65
2
3.
Menyimpulkan secara generalisasi untuk melengkapi paragraph berisi data-data
14,48
61,12
3
4.
Menentukan simpulan isi diagram/grafik/tabel
14,87
43,90
4
5.
Melengkapi bagian paragraph argumentative yang dirumpangkan dengan alasan yang tepat
19,39
53,63
5
6.
Mengganti kalimat yang menggunakan kata bermakna kias dengan kata yang bermakna lugas
23,64
54,40
6
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
143
7.
Menentukan kalimat tanya sesuai isi paragraf
24,70
50,96
7
8.
Menentukan notulen yang tepat sebagai hasil rapat berdasarkan dialog
28,29
45,10
8
9.
Menjawab pertanyaan sesuai isi paragraf
28,82
46,79
9
10.
Menentukan kalimat sumbang yang terdapat dalam paragraph yang disajikan
32,27
36,60
10
11.
Menentukan jawaban pertanyaan sesuai dengan isi paragraf
34,40
42,01
11
12.
Menentukan kalimat berpola tertentu dalam paragraf
36,92
61,67
12
13.
Menentukan perbaikan kalimat yang menggunakan kata berkonfiksyang salah bentuknya
43,16
63,43
13
14.
Menentukan ringkasan isi kutipan artikel
43,43
62,83
14
15.
Melengkapi paragraph persuasi yang dirumpangkan dengan kalimat imbauan yang tepat
45,82
34,21
15
16.
Menentukan opini penulis berdasarkan beberapa paragraph teks tajuk rencana
49,54
46,07
16
17.
Memperbaiki paragraph yang mengandung kalimat tidak efektif menjadi kalimat efektif
53,12
54,40
17
18.
Menentukan rangkuman isi paragraf
54,05
50,78
18
19.
Menentukan kalimat fakta dalam paragraf
56,04
63,66
19
20.
Menentukan kalimat yang menggunakan kata umum & kata khusus pada paragraf
56,04
64,43
20
21.
Menentukan kata berimbuhan yang tepat untuk melengkapi kalimat yang dirumpangkan
56,97
57,39
21
22.
Menyusun beberapa kalimat tentang hasil pengamatan menjadi paragraph yang padu
57,77
66,50
22
23.
Menyusun kalimat pembuka surat lamaran pekerjaan dari info lowongan pekerjaan
58,03
59,54
23
24.
Menentukan persamaan topic dari dua teks
59,63
34,56
24
25.
Melengkapi kalimat yang dirumpangkan frase konstruksinya dengan tepat
59,63
55,27
25
144
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Tabel 4. Proporsi siswa menjawab Benar pada Materi Sulit UN 2009/2010 Paket B mata Ujian Bahasa Indonesia pada SMA Kabupaten Minahasa Selatan No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
Propinsi
Nasional
Peringkat
1.
Menentukan opini penulis berdasarkan beberapa paragraph tekstajuk rencana
10,61
34,67
1
2.
Menyimpulkan secara generalisasi untuk melengkapi paragraph berisi data-data
15,92
58,61
2
3.
Menentukan hal yang dapat diteladani dari tokoh berdasarkan kutipan
24,44
63,09
3
4.
Menentukan arti istilah dalam paragraf
27,51
45,74
4
5.
Melengkapi paragraph yang salah satu klausanyadirumpangkan dengan klausa yang tepat
28,91
75,45
5
6.
Melengkapi paragraph rumpang dengan frase ajektif yang tepat
30,59
62,22
6
7.
Menyusun kalimat pembuka surat lamaran pekerjaan dari info lowongan pekerjaan
34,36
55,29
7
8.
Menentukan simpulan isi diagram/grafik/tabel
38,83
50,21
8
9.
Menentukan kalimat berpola tertentu dalam paragraf
39,25
54,33
9
Menjawab pertanyaan yang sesuai isi paragraph
39,39
51,18
10
11.
Menentukan kalimat yang menggunakan kata umum & kata khusus pada paragraf
39,81
65,99
11
12.
Menentukan perbaikan kalimat yang menggunakan kata berkonfiksyang salah bentuknya
39,94
63,24
12
13.
Menentukan jawaban pertanyaan sesuai dengan isi paragraf
40,78
46,28
13
14.
Melengkapi paragraph persuasi yang dirumpangkan dengan kalimat imbauan yang tepat
42,46
48,33
14
15.
Menentukan penggabungan ketiga kalimat tunggal menjadi kalimat majemuk yang tepat
44,69
58,20
15
16.
Menentukan rangkuman isi paragraf
45,53
39,80
16
17.
Menentukan rangkuman kutipan dengan tepat
46,37
63,52
17
18.
Menentukan kalimat tanya sesuai isi paragraf
50,28
44,19
18
19.
Melengkapi kalimat yang dirumpangkan frase konstruksinya dengan tepat
55,17
58,06
19
20.
Menentukan persamaan topic dalam dua teks
57,96
27,86
20
10.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
145
Tabel 5. Proporsi siswa menjawab Benar pada Materi Sulit UN 2007/2008 mata Ujian Bahasa Indonesia pada SMA Kabupaten Bolaangmongondow Utara No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
1.
Susun Paragraf
Menusun berbagai paragraph/karangan
24,62
27,76
1
2.
Susun Paragraf
Menusun berbagai paragraph/karangan
29,10
35,07
2
3.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
30,37
47,63
3
4.
Pola Paragraf
Identifikasi berbagai pola pengembangan paragraph melalui membaca intensif
30,43
48,80
4
5.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
34,60
46,45
5
6.
Struktur Bahasa
Menggunakan struktur bahasa dalam berbagai bentuk tulisan
35,92
33,00
6
7.
Biografi
Menentukan isi teks bacaan
37,88
31,33
7
8.
Ide Pokok
Menentukan ide pokok teks bacaan nonsastra
42,55
59,70
8
9.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
42,87
44,93
9
10.
Biografi
Menentukan isi teks bacaan
44,63
50,82
10
11.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
45,45
39,19
11
12.
Susun Paragraf
Menyusun berbagai paragraph/karangan
50,19
44,00
12
13.
Teks/Nonteks
Memahami informasi berbagai ragam teks bacaan dengan berbagai teknik membaca
50,44
57,24
13
14.
Struktur Bahasa
Menggunakan struktur bahasa dalam berbagai bentuk tulisan
51,83
49,20
14
15.
Pola Paragraf
Identifikasi berbagai pola pengembangan paragraph melalui membaca intensif
56,13
53,13
15
16.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
57,45
66,57
16
17.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
57,83
67,96
17
18.
Relasi Makna
Menggunakan relasi makna dalam berbagai bentuk tulisan
58,33
43,58
18
19.
Susun Paragraf
Menyusun berbagai paragraph/karangan
58,34
47,62
19
20.
Susun Paragraf
Menyusun berbagai paragraph/karangan
59,60
72,28
20
21.
Lengkapi Paragraf
Melengkapi berbagai paragraf
59,79
64,12
21
146
Propinsi
Nasional
Peringkat
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Tabel 6. Proporsi siswa menjawab Benar pada Materi Sulit UN 2008/2009 mata Ujian Bahasa Indonesia pada SMA Kabupaten Bolaangmongondow Utara No.
Pb/SPB/Tema/Sub
Kemampuan yang diuji
Propinsi
Nasional
Peringkat
1.
Disajikan kalimat menggunakan ragam yang tidak resmi, siswa dapat memperbaikinya dengan tepat
18,75
48,69
1
2.
Menentukan perbedaan focus sajian kedua teks tajuk rencana/editorial dengan topic yang sama dari sumber
18,99
42,70
2
3.
Disajikan teks bacaan dua/tiga paragraph, siswa dapat menentukan ide pokok paragraph pertama
31,13
55,30
3
4.
Menentukan kalimat yang menggunakan kata yang mengalami perluasan makna menyempit
33,99
48,96
4
5.
Disajikan teks bacaan dua/tiga paragraph siswa dapat menentukan opini dalam paragraf
37,56
46,27
5
6.
Menentukan hal yang dapat diteladani dari sebuah paragraph tentang biografi tokoh
38,57
64,34
6
7.
Disajikan sebuah paragraph eksposisi, siswa dapat menentukan kalimat yang tidak mendukung kalimat
39,52
55,05
7
8.
Melengkapi dengan kalimat yang tepat dari paragraph analogis yang simpulannya dirampungkan
41,90
52,92
8
9.
Disajikan grafik/tabel, siswa dapat menentukan simpulan isi grafik/tabel
42,02
70,80
9
10.
Disajikan sebuah paragraph berisi laporan, siswa dapat menentukan simpulan paragraf
43,27
75,65
10
11.
Menentukan masalah yang terdapat dalam tajuk rencana/editorial yang terdiri atas dua/tiga paragraf
44,76
47,72
11
12.
Disajikan kalimat rumpang, siswa dapat melengkapinya dengan kata bermakna kias yang tepat
50,12
61,40
12
13.
Menentukan rangkuman isi tajuk rencana/editorial yang terdiri atas dua/tiga paragraf
51,67
52,62
13
14.
Menentukan opini penulis dalam tajuk rencana/editorial yang terdiri atas dua/tia paragraf
52,02
51,06
14
15.
Disajikan teks bacaan dua/tiga paragraph, siswa dapat menentukan rangkuman isi paragraf
52,14
60,12
15
16.
Disajikan penutup surat lamaran
53,16
57,98
16
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
147
pekerjaan yan tidak tepat, siswa dapat menentukan perbaikan yang tepat 17.
Disajikan sebuah paragraph eksposisi, siswa dapat menentukan kalimat utama paragraf
53,33
70,92
17
18.
Disajikan kata pengantar karya ilmiah yang kurang tepat, siswa dapat memperbaikinya
54,11
61,75
18
19.
Disajikan teks bacaan dua/tiga paragraph artikel, siswa dapat menentukan paragraph pertama
55,96
68,27
19
20.
Disajikan dialog, siswa dapat menentukan rangkuman dialog tersebut dengan tepat
56,19
66,87
20
21.
Disajikan beberapa kalimat acak, siswa dapat menyusunnya menjadi paragraph diduktif yang tepat
57,98
61,56
21
Tabel 7. Proporsi siswa menjawab Benar pada Materi Sulit UN 2009/2010 Paket A mata Ujian Bahasa Indonesia pada SMA Kabupaten Bolaangmongondow Utara No. Pb/SPB/Tema/Sub Kemampuan yang diuji
Propinsi
Nasional Peringkat
1.
Menentukan kalimat opini suatu paragraf
0,93
47,90
1
2.
Menentukan masalah yang dibicarakan dalam tajuk rencana
10,23
32,65
2
3.
Menyimpulkan secara generalisasi untuk melengkapi paragraph berisi data-data
14,48
61,12
3
4.
Menentukan simpulan isi diagram/grafik/tabel
14,87
43,90
4
5.
Melengkapi bagian paragraph argumentative yang dirumpangkan dengan alasan yang tepat
19,39
53,63
5
6.
Mengganti kalimat yang menggunakan kata bermakna kias dengan kata yang bermakna lugas
23,64
54,40
6
7.
Menentukan kalimat tanya sesuai isi paragraf
24,70
50,96
7
8.
Menentukan notulen yang tepat sebagai hasil rapat berdasarkan dialog
28,29
45,10
8
9.
Menjawab pertanyaan sesuai isi paragraf
28,82
46,79
9
10.
Menentukan kalimat sumbang yang terdapat dalam paragraph yang disajikan
32,27
36,60
10
11.
Menentukan jawaban pertanyaan sesuai dengan isi paragraf
34,40
42,01
11
148
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
12.
Menentukan kalimat berpola tertentu dalam paragraf
36,92
61,67
12
13.
Menentukan perbaikan kalimat yang menggunakan kata berkonfiksyang salah bentuknya
43,16
63,43
13
14.
Menentukan ringkasan isi kutipan artikel
43,43
62,83
14
15.
Melengkapi paragraph persuasi yang dirumpangkan dengan kalimat imbauan yang tepat
45,82
34,21
15
16.
Menentukan opini penulis berdasarkan beberapa paragraph teks tajuk rencana
49,54
46,07
16
17.
Memperbaiki paragraph yang mengandung kalimat tidak efektif menjadi kalimat efektif
53,12
54,40
17
18.
Menentukan rangkuman isi paragraf
54,05
50,78
18
19.
Menentukan kalimat fakta dalam paragraf
56,04
63,66
19
20.
Menentukan kalimat yang menggunakan kata umum & kata khusus pada paragraf
56,04
64,43
20
21.
Menentukan kata berimbuhan yang tepat untuk melengkapi kalimat yang dirumpangkan
56,97
57,39
21
22.
Menyusun beberapa kalimat tentang hasil pengamatan menjadi paragraph yang padu
57,77
66,50
22
23.
Menyusun kalimat pembuka surat lamaran pekerjaan dari info lowongan pekerjaan
58,03
59,54
23
24.
Menentukan persamaan topic dari dua teks
59,63
34,56
24
25.
Melengkapi kalimat yang dirumpangkan frase konstruksinya dengan tepat
59,63
55,27
25
Tabel 8. Proporsi siswa menjawab Benar pada Materi Sulit UN 2009/2010 Paket B mata Ujian Bahasa Indonesia pada SMA Kabupaten Bolaangmongondow Utara No. Pb/SPB/Tema/Sub Kemampuan yang diuji
Propinsi
Nasional Peringkat
1.
Menentukan opini penulis berdasarkan beberapa paragraph teks tajuk rencana
10,61
34,67
1
2.
Menyimpulkan secara generalisasi untuk melengkapi paragraph berisi data-data
15,92
58,61
2
3.
Menentukan hal yang dapat diteladani dari tokoh berdasarkan kutipan
24,44
63,09
3
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
149
4.
Menentukan arti istilah dalam paragraf
27,51
45,74
4
5.
Melengkapi paragraph yang salah satu klausanyadirumpangkan dengan klausa yang tepat
28,91
75,45
5
6.
Melengkapi paragraph rumpang dengan frase ajektif yang tepat
30,59
62,22
6
7.
Menyusun kalimat pembuka surat lamaran pekerjaan dari info lowongan pekerjaan
34,36
55,29
7
8.
Menentukan simpulan isi diagram/grafik/tabel
38,83
50,21
8
9.
Menentukan kalimat berpola tertentu dalam paragraf
39,25
54,33
9
10.
Menjawab pertanyaan yang sesuai isi paragraph
39,39
51,18
10
11.
Menentukan kalimat yang menggunakan kata umum & kata khusus pada paragraf
39,81
65,99
11
12.
Menentukan perbaikan kalimat yang menggunakan kata berkonfiksyang salah bentuknya
39,94
63,24
12
13.
Menentukan jawaban pertanyaan sesuai dengan isi paragraf
40,78
46,28
13
14.
Melengkapi paragraph persuasi yang dirumpangkan dengan kalimat imbauan yang tepat
42,46
48,33
14
15.
Menentukan penggabungan ketiga kalimat tunggal menjadi kalimat majemuk yang tepat
44,69
58,20
15
16.
Menentukan rangkuman isi paragraf
45,53
39,80
16
17.
Menentukan rangkuman kutipan dengan tepat
46,37
63,52
17
18.
Menentukan kalimat tanya sesuai isi paragraf
50,28
44,19
18
19.
Melengkapi kalimat yang dirumpangkan frase konstruksinya dengan tepat
55,17
58,06
19
20.
Menentukan persamaan topic dalam dua teks
57,96
27,86
20
150
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
B. Banyaknya Materi Sulit antar Kabupaten
Tabel 9. Banyaknya Materi Sulit Bahasa Inggris antar Kabupaten berdasarkan hasil UN 2007-2010 Pelaksanaan
Butir Sulit
UN
menurut
Kabupaten
Persentase Tahun Pelajaran 2007/2008
Kabupaten Minahasa
Kabupaten
Selatan
Bolaangmongondow Utara
Jumlah Butir Sulit Persentase Tahun Pelajaran Jumlah Butir Sulit 2008/2009
Persentase
Tahun Pelajaran Jumlah Butir Sulit 2009/2010 Paket Persentase
22
21
44,00
42,00
21
21
42,00
42,00
25
25
50,00
50,00
20
20
40,00
40,00
A Tahun Pelajaran Jumlah Butir Sulit 2009/2010 Paket Persentase B
C. Banyaknya Materi Sulit UN antar Tahun di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara Jika dilihat berdasarkan banyaknya materi sulit mata ujian Bahasa Inggris selama 3 tahun terakhir penyelenggaraan UN di Kabupaten Minahasa Selatan dan Bolaangmongondow Utara tahun 2007/2008 yaitu masing-masing Kabupaten sebanyak 22 butir (44,00%) adalah lebih banyak jika dibandingkan dengan hasil UN 2008/2009 yaitu sebanyak 21 butir (42,00%). Sedangkan pada tahun 2009/2010 BSNP telah membuat 2 paket soal yaitu paket A dan paket B. Hasilnya materi sulit untuk Kabupaten Minahasa Selatan untuk paket A sebanyak 25 butir (50%), paket B sebanyak 25 butir (50%), dan Kabupaten Bolaangmongondow Utara paket A sebanyak 20 butir (40%) dan paket B sebanyak 20 butir (40%) Berdasarkan hasil di atas dapat diasumsikan bahwa tingkat kemampuan siswa untuk menguasai materi UN dari tahun ke tahun relatif sama. Materi ujian yang belum bisa dikuasai siswa hanya berbentuk pemahaman saja, maka dapat dikatakan bahwa faktor guru dalam hal ini penguasaan materi, fasilitas belajar seperti buku teks dan penggunaan laboratorium sangat menunjang untuk meningkatkan kemampuan siswa dalam menguasai materi UN. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
151
KESIMPULAN Berdasarkan hasil penelitian seperti yang telah diuraikan di atas, maka dapat disimpulkan sebagai berikut: 1. Materi sulit untuk mata ujian bahasa Indonesia untuk siswa SMA di Kabupaten Minahasa Selatan pada tahun 2007/2008 sebanyak 22 butir (44,00%), 2008/2009 sebanyak 21 butir (42,00%), dan 2009/2010 paket A sebanyak 25 butir (50,00%) dan paket B sebanyak 20 butir (40,00%), dan materi sulit untuk mata ujian bahasa Indonesia untuk siswa SMA di Kabupaten Bolaangmongondow Utara pada tahun 2007/2008 sebanyak 21 butir (42,00%), 2008/2009 sebanyak 21 butir (42,00%), dan 2009/2010 paket A sebanyak 25 butir (50,00%) dan paket B sebanyak 20 butir (40,00%). 2. Secara umum tingkat kesulitan soal UN mata ujian bahasa Indonesia selama 3 tahun terakhir di SMA Kabupaten Minahasa Selatan dan Bolaangmongondow Utara relatif merata. 3. Tingkat kemampuan siswa peserta UN dari tahun ke tahun relatif sama. Secara umum terdapat perbedaan jumlah materi sulit UN selama tiga tahun terakhir. SARAN 1. Perlu pelatihan bagi guru penguasaan materi sulit, penggunaan model pembelajaran yang sesuai dengan materi yang akan diajarkan. 2. Perlu penambahan fasilitas belajar seperti buku teks dan pengembangan laboratorium bahasa
DAFTAR PUSTAKA Badan Standar Nasional Pendidikan. (2009). Prosedur Operasi Standar (POS) Ujian Nasional SMP, MTs, SMPLB, SMALB, dan SMK Tahun Pelajaran 2009/2010. Ishikawa Kaoru, 1985, What Is The Total Quality? , Prenctice Hall. New York JoLaine R. Draugalis and Marion K. Slack, 1999, A Continuous Quality Improvement Model for Developing Innovative Instructional Strategies, The University of Arizona Juran, J.M., 1989, Juran on Leadership for Quality, New York, MacMilan. Juran and Gryna, Frank M, Eds., 1988, Juran‟s Quality Control Handbook, 4th edition, New Yrok Mc GrawHill Namara Robyn., 2004, Evaluating Assesment With Comptency Mapping, Monash University, Australia. Roe, R.A. 2001, Competencies and competence management. Paper European Congress for W&O Psychology, Prague, May 16-19, 2001.
152
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Ahmad Dahlan University Belongingness Scale: Measurement and Construct Development Triantoro Safaria Faculty of Psychology Ahmad Dahlan University Yogyakarta Email:
[email protected] ABSTRACT Sense of belonging is the extent to which person feels attach, related and belong in organization system. If, person feels accepted, comfortable, congruence and get recognition from organization, this condition will motivate the person to share positive contribution to their organization. The problem in Ahmad Dahlan University, is low student sense of belonging with their university. This condition will cause negative effect for university in the future, with increasing several student‟s negative behaviors such as apathy, unresponsiveness, untill higher study drop out. It is needed to evaluate and understand student‟s sense of belongingness to their universisty, in order to take preventive action related to low sense of belongingness of students. The aim of this study is to create and develop a sense of belongingness measurement for Ahmad Dahlan University Belongingness Scale (ADUBS), that it will be used to evaluate how high the student sense of belonging to their university. The result of exploratory factor analysis (EFA) showed two dimension the sense of belongingness constract that represent the sense of belongingness of student to their university namely University belongingness and Community belongingness. The next result from confirmatory factor analysis (CFA) using structural equation modeling (SEM) confirm that measurement model of ADUBs was fit with empirical data (Chi-square = 39.054, with p > .001, degree of freedom = 36, CMIN = 1.085, RMSEA =.022, NFI = .918, TLI = .989, GFI= .961, and CFI= .993.
Key words: Ahmad Dahlan University belongingness scale, exploratory factor analysis, confirmatory factor analysis, and structural equation modeling.
INTRODUCTION One factor that contributed to students‟ achievement and positive behavior is how strong their sense of belongingness to university where they are studying (Light, 2001; Chin, Salisbury, Pearson, & Stollak, 1999). According to Beck and Malley (1998) psychological atmosphere in which people feel attached, connected and accepted in the classroom or campus community is an important antecedent for success experience in students‟ future learning. According to Beck and Malley (1998) a low sense of belongingness of students, especially for those who are experiencing emotional problems (depression, feeling isolated and lonely) will increase their risk of engaging in negative activities such as high absenteeism, drop-out, low academic score or involved in drug abused (Rostoskya, et al., 2003). A high sense of belongingness will also directly benefit for university. Students who have a high sense of belongingness will be actively involved in any activity sponsored by university such as student executive board and actively become university ambassador. They will also tend to evaluate positively the university, more satisfied with the university, and they also show a high motivation to be active in any campus activities (Light, 2001; Chin, Salisbury, Pearson, & Stollak, 1999). Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
153
Several previous studies showed that the high sense of belongingness of students toward their university had positive correlation with attendance, motivation, and academic achievement (GPA) (Anderman & Anderman, 1999; Goodenow, 1993a, 1993b; Goodenow & Grady, 1993; Furrer & Skinner, 2003). Other research suggests that belongingness is positively correlated with academic self-efficacy, intrinsic motivation, the value of academic tasks, social acceptance and the quality of faculty-student relationships (Freeman et al., 2007). Present study adapted the theoretical construct proposed by Prentice et al. (1994). They operationalized sense of belongingness become two dimensions, namely: belongingness to the university and belongingness to the group (student community) within the university. Prentice et al. (1994) adopted the theoretical concept from Karasawa (1991). Karasawa (1991) developed six aitems representing four aitem for school belongingness (school attachment) and two aitem for sense of belongingness to the school community (attachment to people at the school). The six aitem was tested on 192 vocational students in Japan. The factor analysis with varimax rotation led to two factors. Karasawa then fix the six aitem become seven, with one additional aitem related to school belongingness. Revised scale was then tested on 287 students at the same school. The implementation and testing of sense of belongingness has not been done before in the context and situation in Indonesia. This study is a new development that present concept and measuring instrument that can be used as a guide for the university. The results of this study will also be a reference to other fields such as psychology, guidance and counseling, and education, with particular regard to the handling of a sense of belongingness to the student. As stated by Freeman et al. (2007) that required further study of this belongingness at the University level. Freeman et al (2007) said that'' little is known about the importance of the sense of belongingness for college-level students or about the conditions that might support the perceptions of belongingness''. According to Freeman et al. (2007) the gap of knowledge is probably due to a lack of operational measurement quality of university belongingness. Furthermore, Freeman et al. (2007) noted that there are fundamental questions about'' the conceptual definition of school (or university) belongingness and the extent to which it represents a unidimensional or multidimensional construct.'' So this study will contribute to the development of science, particularly in the fields of psychology and education. METHOD Participants Participant of this study were students of the Faculty of Psychology, Ahmad Dahlan University (UAD). They are representation of all the existing semester, in order to capable for representing population of the Faculty of Psychology. Students of this study has the following characteristics, namely: at least have attended college for 1 year, male and female and still active as a student of UAD. As many as 32.6% or 59 respondents are male students and 67.4% or 122 respondents were female students. Of this amount also showed 47% or 85 respondents were second semester student, then 13.3% or 24 respondents were four semesters student, the next 24.9% or 45 respondents were sixth semester, then 11% or 20 respondents were eight semesters, and last number of 3.9% or 7 respondents were ten semesters student. 154
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
From 181 students, 61 respondents, or approximately 33.7% stated that he/she involved in one of the following student activity unit (UKM) in the UAD, and 120 respondents, or 66.3% did not follow any unit of student activity (UKM). In addition, from 181 students, 64 respondents, or 35.4% said as a committee or a member of the Student Executive Board (BEM) on the faculty. While 117 respondents, or 64.6% did not become members of the BEM. Table 1 showed demographic data of students.
Table 1. Participants demographic background Variable
Categories Number Percent
Gender
Male
59
32.6%
Female II IV VI VII X
122 85 24 45 20 7
67.4% 47% 13.3% 24.9% 11% 3.9%
in Yes
61
33.7%
No in Yes
120 64
66.3% 35.4%
No
117
64.6%
Semester
Involved UKM Involved BEM
Questionnaire Development Development of Ahmad Dahlan University belongingness scale based on the theoretical construct proposed by Prentice et al. (1994), they operationalized two dimensions of sense of belongingness, namely: belongingness to the university and belongingness to the group (student community). Table 2 presented the blue-print and construct of Ahmad Dahlan University belongingness scale. Table 2. Blue-print of Ahmad Dahlan University Belongingness scale No Dimension 1 University belongingnes 2 Community belongingness Total
Items 1, 2,3,4,5,6, 11 7,8,9,10
11
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
155
This scale contains eleven items that are divided into two dimensions. Likert scale was used in scoring with ranging from 1, 2, 3, 4, and 5. The response variation depending on the type of item, is favourable item or not. Seven items are part of university belongingness diemnsion and four items are part of community belongingness dimension.
DISCUSSION Bartlett's test of sphericity and Kaiser-Meyer-Olkin (KMO) measure of sampling adequacy (KMO) was used prior to factors analysis. Bartlett's test of sphericity is a chi-square tests and the determinants of the correlation matrix to test whether the variations of the same group and the dependent variables are not interconnected, this then indicates that the factor model does not fit (null hypothesis assumes that the variables are non-colinier). If Bartlett's test of sphericity rejected null hypothesis, then it means that the correlation matrix forms an unity matrix, and this indicates that a significant correlation is present between some variables (Hair et al., 2005). KMO ratio represents the squared correlation between variables toward the squared partial correlation between variables (Field, 2005). KMO statistic varies between 0 and 1; value of 0 indicates that the factor analysis is not appropriate, while values close to 1 indicates that the correlation pattern is relatively compact, this shows that the differences are valid and indicate reliable factors (Field, 2005, p . 640). "Kaiser (1974) recommends a standard values for factor analysis can be done. the values of .50 as quite acceptable (barely acceptable), values between .50 to .70 being declared acceptance (mediocre), while values between .70 so. 80 is good (good), and values between .80 and .90 is very good (great), lastly the values above .90 is expressed as an incredible (superb) (Field, 2005). The results of factor analysis will show the solution factors, based on the criteria of Cattell's scree-plot test. Items will be retained if they showed satisfactory convergent validity and discriminant validity. Convergent validity portraits that item is strongly loaded to correlated factors compared with other factors. While a construct has good disciminant validity if the first highest loading construct show greater than ≥ .15 for second highest construct (Hair et al., 2005). Some experts assert, factor loadings below .30 or .40 expressed as low, while the factor loading of .40 or more expressed as high (Morgan, Gliner, & Robert, 2005; Leech, Barrett, & Morgan, 2008). Other opinions expressed on different criteria, which the factor loading of .50 or more considered high (Hair et al., 2005). Prior to test the construct validity of ADUBS through factor analysis and structural equation model, the internal consistency approach using Cronbach‟s alpha test for reliability testing was conducted. The results of Cronbach „alpha is .770. From these results it can be concluded that the ADUB scale have a high reliability values. It is based on the opinion of some experts that the reliability of Cronbach 'alpha must satisfy the criteria above .70 (Leech, Barrett, & Morgan, 2008). Meanwhile, the discrimination index of item showed correlation from .330 to .588. It also shows that each of the different item met satisfactory level. Principal axis factor analysis with varimax rotation method was conducted to examine the basic structure of eleven aitem Ahmad Dahlan University belongingness scale. Results from the Kaiser-Meyer-Olkin (KMO) was .783, indicating that each items can be predicted by each factors and the Bartlett test showed a significant level (p = .000). This means that the variables correlated high enough to provide basic satisfactory for factor analysis testing. Using the Kaiser-Guttman retention criteria of eigenvalues over 1.0, then resulting two-factor solution from the extraction. 156
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
The first factor emerged (eigenvalue = 3.5) and accounted for approximately 31.9% of the variance. The first factor represents the university belongingness construct (item1, item2, item3, item4, item5, item6, item7 and item11). While, the second factors with eigenvalue = 1.5 and accounted for approximately 13.4% which represents the community belonginess construct (item8, item9 and item10). Table 2 portray item and loading factor, with loading under less than .30 omitted to improve clarity construct. Convergence and discriminant validity was achieved for all item, because its have a factor loading greater than .30, and also was loaded strongly on associated factor and did not correlate with factors that is not it‟s construct (≥ .15). Table 3 portray the results of factor analysis and loading factors. The results of confirmatory factor analysis (CFA) showed a satisfactory result. It can be seen from the resulting of model fit, where all of the criteria met a satisfactory score. The confirmatory factor analysis produced a Chi-square = 39 054, with a value of p> .001, for degree of freedom = 36, Cmin = 1085 is smaller than 2, RMSEA = .022 indicate a good fit model, NFI = .918, TLI = .989, GFI = .961, and CFI = .993 all scores are above the .90 criteria it indicate the ADUB scale is empirically fit with data. Table 4 describes the results of CFA tests through structural equation model. Based on several test that was conducted previously ADUB scale shows a satisfactory results. The Cronbach alpha reliability values are high. The result of construct validity through exploratory factor analysis resulted two dimensions where it accordance with the theory of belongingness from Prentice et al (1994). The result of CFA also showed that the ADUB measurement model is theoretically fit with data. It could be argued that the ADUB scale meet the criteria as a good fit model empirically. Tabel 3: Factor loading for rotated factors Skala ADUBS Items
Factor Loading 1 2
(item 1) Seberapa sering Anda mengakui .407 kenyataan/fakta bahwa Anda adalah mahasiswa Universitas Ahmad Dahlan Yogyakarta (UAD)? (item 2) Seberapa akuratkah kepribadian/perilaku .345 Anda untuk menggambarkan Anda sebagai tipikal mahasiswa UAD? (item 3) Seberapa pentingkah menjadi bagian dari .479 civitas akademika UAD bagi anda? (item 4) Seberapa senangkah perasaan Anda jika .748 Anda digambarkan sebagai typikal seorang mahasiswa UAD? (item 5) Seberapa banggakah perasaan Anda jika .922 Anda digambarkan sebagai typikal seorang mahasiswa UAD? (item 6) Ketika anda pertama kali bertemu dengan .516 Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Communa lity
.260
.172
.267
.538
.633 .342 157
orang lain, seberapa besar kemungkinan Anda menyebutkan bahwa Anda mahasiswa UAD? (item 7) Bagaimana perasaan keterikatan atau .472 kelekatan Anda sebagai mahasiswa UAD?
.299
(Aitem 8) Seberapa dekat perasaan Anda dengan komunitas mahasiswa UAD lainnya?
.491
(item 9) Sejauhmana komunitas kawan-kawan mahasiswa UAD mempengaruhi pikiran dan perilaku Anda sehari-hari?
.634
(item 10) Seberapa banyak teman dekat Anda berasal dari atau merupakan mahasiswa UAD?
.370
.215
.248
.116
(item 11) Seberapa besar kebangaan Anda .430 menjadi bagian dari salah satu Unit Kegiatan Mahasiswa (UKM) di UAD? Eigenvalues % of variance Bartlett’s test of Sphericity Kaiser-Meyer-Olkin measure of sampling
.297
3.5 31.9 .000 .783
1.5 13.4
Table 4: the result of CFA test of Ahmad Dahlan University Belongingness Scale Items item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 Fit measurement
158
Standardized Factor t-Values Loadings .3782 2.378 .821 2.543 .465 2.484 .911 2.683 .770 2.638 .512 3.011 .492 3.043 .523 2.623 .604 2.328 .341 2.523 .417 2.483
Skewness Kurtosis -.723 -.934 -.881 -.923 -.920 -1.380 -1.164 -.976 -.800 -.495 -.576
-.274 1.995 .297 2.015 1.305 .953 2.807 1.310 .354 .521 -.404
Chi-square= 39.054, RMSEA df=36 =.022 CMIN= 1.085, p<.001 NFI = .918
TLI= .989 GFI= .961
CFI= .993 *p>.001
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
The next research objective was to examine differences in the level of university belongingness based on gender, semester of studying, and participation in the Student Activity Unit (UKM) or the organization's Student Executive Board (BEM). The ANOVA test showed that there was no difference in the level of belongingness among male and female student with F (1.154) = 3706, p = .56, partial eta = .022. This suggests that gender does not have a significant influence on the level of university belongingness. While, the university belongingness based on semester of studying showed a significant results. Second semester students have higher degree of university belongingness compared with the more advanced semester students (four, six, eight and ten) with F (4.176) = 4169, p = .003, and partial eta = .087. These results indicate that in the beginning students have a higher belongingness to UAD, compared with senior students. There is a possibility senior student during studying in college less got maximum service, so this makes the level of attachment to UAD has declined progressively. Many senior students dissatisfy with the services from faculty or university, and it directly declines the sense of belongingness to the university. If they still get unsatisfaction service from university, then most likely they will be apathetic to campus. Meanwhile, the ANOVA test also showed that students who participated in UKM has higher level of university belongingness than students who do not follow the activities in UKM with F (1.179) = 13 433, p = .000, partial eta = .070. This is reasonable, because the involvement of students in UKM is an indication of the high level of their attachment to the university. So students that are actively involved in UKM, will have a high level of belongingness compared to students who do not follow any UKM activities. Other results showed that there were significant differences between students that is involved in the BEM with student who is not actively involved in the BEM, with F (1.179) = .972, p = .002, partial eta = .052. These results indicate that involvement in the BEM organization will increase the attachment of students to the university. Just as the involvement of UKM, the involvement in the BEM organization is also one indicator of the high level of students belongingness towards their university. CONCLUSION The results indicated that the scale of Ahmad Dahlan University belongingness meet high internal consistency reliability. It also meets the criteria of satisfactory construct validity. Through confirmatory analysis test it found that the measurements model of ADUB scale meet the good fit and the model shows that the measurement model fit the data empirically. Second, the study examined the levels of belongingness through ANOVA based on participants demographic variable, such as gender,semester of studying, UKM involvement and involvement in BEM organization. First, gender has no significant differences effect on the level of university belongingness. In other words, there was no difference in the level of belongingness among male and female students. While, there is a significant difference of belongingness level among the yunior students with senior students, second semester student have higher belongingness level compared to the senior students (four, six, eight, and ten semester). It was also found differences in levels of belongingness among the students who participated in UKM activities and BEM, with students who did not participate. Students who participate in the activities of UKM and BEM have higher belongingness level than students who do not participate. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
159
RECOMMENDATION Based on the results above, there are two suggestions that may be mentioned here. First, the reliability test, factor analysis and structural equation model showed that Ahmad Dahlan University belongingness scale is a valid and reliable measurement tool, to be used in measuring the sense of belongingness of students to their university. Further research could develop this scale to describe the sense of belongingness of employees (academic and nonacademic) Ahmad Dahlan University. Second, based on ANOVA test, it found that senior psychology students (4-8 semester) show lower sense of belongingness than yunior students. This is likely due to the senior students did not get satisfactory service from the faculty, thus it cause their sense of belongingness decline in progressively. Third, more research needs to be done to involve more sample of students from various faculties at UAD. So it can be representative and will be able to portray the real situation as a whole for students UAD. Because one of the weaknesses of this study is the use of a limited sample. REFERENCES Anant, A., 1967. Belongingness and mental health: Some research findings. Acta Psychologia, 26, 391–396. Anant, A., 1969. A cross-cultural study of belongingness, anxiety and self-sufficiency. Acta Psychologia, 31, 385–393. Anderman, L. H., & Anderman, E. M. (1999). Social predictors of changes in students‟achievement goal orientations. Contemporary Educational Psychology, 25, 21-37. Astin, A. W. (1993). What matters in college? Four critical years revisited. San Francisco: Jossey-Bass. Baumeister, R., Leary, M., 1995. The need to belong: Desire for interpersonal attachments as a fundamental human motivation. Psychological Bulletin, 117 (3), 497–529. Beck, M., & Malley, J. (1998). A pedagogy of belongingness. Reclaiming Children and Youth, Vol.7 No.3, pp133-137 Chin, W., Salisbury, W., Pearson, A., & Stollak, M. (1999). Perceived cohesion in small groups: Adapting and testing the Perceived Cohesion Scale in a small-group setting. Small Group Research, 30, 751-766. Freeman, T. M., Anderman, L. H., & Jensen, J. M. (2007). Sense of belongingness in college freshmen at the classroom and campus levels. Journal of Experimental Education, 75, 203-220. Furrer, C., & Skinner, E. (2003). Sense of relatedness as a factor in children‟s academic engagement and performance. Journal of Educational Psychology, 95, 148-162. Goodenow, C. (1993a). Classroom belongingness among early adolescent students: Relationships to motivation and achievement. Journal of Early Adolescents, 13, 21-43.
160
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Goodenow, C. (1993b). The psychological sense of school membership among adolescents: Scale development and educational correlates. Psychology in the Schools, 30, 79-90. Goodenow, C.,& Grady, K. E. (1993). The relationship of school belongingness and friends‟ values to academic motivation among urban adolescent students. Journal of Experimental Education, 62, 60-71. Hagerty, B., Patusky, K., 1995. Developing a measure of sense of belongingness. Nursing Research, 44 (1). Hagerty, B., Williams, R., 1999. The effects of sense of belongingness, social support, conflict and loneliness on depression. Nursing Research, 48 (4), 215–219. Hagerty, B., Lynch-Sauer, J., Patusky, K., Bouwsema, M., Collier, P., 1992. Sense of belongingness: A vital mental health concept. Archives of Psychiatric Nursing, 6 (3), 172–177. Imam Ghozali. (2008). Konsep dan aplikasi dengan program AMOS 16.0. Semarang: Penerbit UNDIP. Karasawa, M. (1991). Toward an assessment of social identity: The structure of group identification and its effects on in-group evaluations. British Journal of Social Psychology, 30, 293-307. Light, R. J. (2001). Making the most of college. Cambridge, MA: Harvard University Press. Osterman, K. F. (2000). Students‟ need for belongingness in the school community. Review of Educational Research, 70, 323-368. Prentice, D. A., Miller, D. T., & Lightdale, J. R. (1994). Asymmetries in attachments to groups and to their members: Distinguishing between common-identity and commonbond groups. Personality and Social Psychology Bulletin, 20, 484-493. Resnick, M. D., Bearman, P. S., Blum, R. W., Bauman, K. E., Harris, K. M., Jones, J., et al. (1997). Protecting adolescents from harm: Findings from the National Longitudinal Study on adolescent health. Journal of the American Medical Association, 278, 823-832. Rostoskya, S.S., Owensa, G.P., Zimmermanb, R.S., & Rigglec, E.D.B. (2003). Associations among sexual attraction status, school belongingness, and alcohol and marijuana use in rural high school students. Journal of Adolescence, 26, 741–751. doi:10.1016 Somers, M., 1999. Development and preliminary validation of a measure of belongingness. Unpublished Ph.D., Temple University, Philadelphia. Utz, S. (2003). Social identification and interpersonal attraction in MUDs. Swiss Journal of Psychology, 62, 91-101. Utz, S., & Sassenberg, K. (2002). Distributive justice in common-bond and commonidentitygroups. Group Processes & Intergroup Relations, 5, 151-162
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
161
162
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Persepsi Terhadap Theraupetic Community dengan Self-efficacy terhadap Resiliensi pada Recovery Addict Pasca Perawatan Di UPT-T&R BNN Lido Sukabumi Sitti Evangeline Imelda Suaidy Fakultas Psikologi, UIN Syarif Hidayatullah Jakarta E-mail:
[email protected] Abstrak Recovery addict adalah pecandu yang sudah selesai menjalani perawatan dan mengikuti program Theraupetic Community di UPT-T&R BNN Lido Sukabumi. Permasalahannya, penghayatan terhadap kegiatan-kegiatan dalam Theraupetic Community dapat memberikan pengaruh pada keyakinan akan kemampuan bertahan bersih dari Napza dan kemampuan untuk bertahan pada situasi sulit yang rentan akan kekambuhan pada Recovery Addict. Oleh karenanya, penelitian ini bertujuan untuk mengetahui seberapa besar pengaruh persepsi terhadap Theraupetic Community dengan Self-efficacy terhadap Resiliensi pada Recovery Addict Pasca Perawatan (Aftercare) DI UPT-T&R BNN Lido Sukabumi. Penelitian ini menggunakan pendekatan kuantitatif dengan analisis regresi berganda, dengan sampel sebanyak 31 orang yang terdiri dari 29 orang pria dan 2 orang perempuan. Penelitian ini dilaksanakan di BNN Lido dengan teknik pengambilan sampel bersifat non-probablity sampling. Alat ukur resiliensi yang digunakan berdasarkan teori Grotberg (2003), sedangkan Alat ukur persepsi terhadap theraupetic community diadaptasi dari Therapeutic Community Scale Elemen of Essensial dari George DeLeon dan Gerald Melnick (1993). Sementara alat ukur self-efficacy diadaptasi dari Drug Avoidance Self-efficacy dari Martin (1991). Hasil penelitian menunjukkan bahwa tidak ada pengaruh yang signifikan dari persepsi tentang Theraupetic Community dan self-efficacy terhadap resiliensi pada recovery addict Pasca Perawatan (Aftercare) BNN. Kata Kunci : Persepsi, Theraupetic Community, Self-Efficacy, Resiliensi, Recovery Addict
PENDAHULUAN 1.1 Permasalahan dalam Recovery Addict Penelitian ini berdasarkan pengalaman penulis selama menjadi pembimbing Kuliah Kerja Lapangan (KKL) Mahasiswa Fakultas Psikologi UIN Syarif Hidayatulah Jakarta. Hasil observasi dalam kegiatan seminar psikologi hasil KKL menunjukkan, bahwa para pecandu yang sedang mengalami perawatan masih meragukan dukungan dari lingkungan dan kemampuan dalam mengatasi persoalan yang ada (Laporan KKL, 2011). Padahal untuk bisa mempertahankan diri agar tetap bersih dari Napza dibutuhkan kemampuan yang kuat dalam mengatasi situasi yang sulit. Ketidakyakinan akan kemampuan para pecandu yang sedang menjalani perawatan membuat mereka rentan terhadap kekambuhan. Kondisi ini sesuai dengan data penelitian BNN (2011) yang menyatakan, bahwa angka kekambuhan dari pecandu yang pernah dirawat pada berbagai pusat terapi dan rehabilitasi di Jakarta mencapai 60-80%. Sebagai tambahan informasi, data penelitian itu juga Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
163
menunjukkan, bahwa jumlah pengguna napza mencapai 3,8 juta orang. Jumlah ini setara dengan 2,2 persen penduduk Indonesia (Tempo, 2012). Dari data penelitian BNN sebelumnya (2010), ada peningkatan penyebaran penyalahgunaan dari 1,5% pada 2004 menjadi 1,99% pada 2008, atau sekitar 3,2 juta sampai 3,6 juta jiwa. Jumlah tersebut terdiri dari 26 % kelompok coba pakai, 27 % kelompok teratur pakai, dan 47% pecandu. Dengan perkembangan ini menunjukkan selama kurun waktu 4 tahun terjadi peningkatan sebesar 2 juta jiwa penyalahgunaan Napza. Peran UPT-R BNN tidak hanya untuk mencegah penyalahgunaan Napza di masyarakat, tapi yang terpenting untuk memulihkan para pecandu sehingga mereka bersih dari narkoba dan dapat menjalani hidup yang berkualitas. UPT-R BNN membuat langkahlangkah untuk mengatasi kecanduan yang disusun dalam One Stop Center, yaitu, tahapan layanan yang dilakukan selama 6 bulan dengan tujuan untuk membangun kesiapan para pecandu dalam menghadapi masa kembali ke masyarakat (BNN, 2010). Ini dikarenakan tantangan yang terbesar dari para pecandu adalah untuk mempertahankan diri mereka agar tetap bersih dari narkoba, selama mereka berada di luar masyarakat. Dari hasil wawancara dengan para pecandu diketahui bahwa tantangan setelah fase pasca perawatan (aftercare) adalah sangat berat, karena mereka harus menjalankan peran sebagai recovery addict, yaitu, pecandu yang terus memulihkan dirinya setelah pasca perawatan. Untuk itu dibutuhkan kemampuan untuk bertahan dari situasi yang sulit, yang memungkinkan mereka untuk kembali memakai Napza. Kemampuan ini yang disebut sebagai resiliensi. Menurut Gortberg (2000), resiliensi adalah kapasitas yang bersifat universal, dan, dengan kapasitas tersebut, individu, kelompok ataupun komunitas mampu mencegah, meminimalisir ataupun melawan pengaruh yang bisa merusak saat mereka mengalami musibah atau kemalangan (dalam Parinyaphol & Chongruksa, 2008). Pengaruh yang dapat merusak pada kehidupan pecandu adalah narkoba itu sendiri, saat dorongandorongan atau situasi yang dapat membawa mereka kembali memakai narkoba. Untuk membangun ketahanan dalam diri sendiri serta peran kelompok dalam pemulihan pecandu sudah diberikan dalam tahapan pembinaan dan bimbingan di UPT-R BNN, yaitu pada tahapan primary. Tahapan ini menjadi penting berkaitan dengan tujuannya untuk mengubah perilaku adiktif klien menjadi perilaku yang normal dengan pembinaan meliputi fisik, psikologis, spiritual dan sosial (Materi BNN, 2011). Dasar dari pembinaan menggunakan konsep Theraupetic Community, adalah berlandaskan pada filosofi dan slogan-slogan tertentu, baik yang tertulis maupun yang tidak tertulis (unwritten philosophy). Filosofi Therapeutic Community (TC) yang tertulis merupakan suatu hal yang harus dihayati, dianggap sakral, tidak boleh diubah dan harus dibaca setiap hari. Sementara filosofi tidak tertulis (unwritten philosophy) adalah merupakan nilai-nilai yang harus diterapkan dalam proses pemulihan yang maknanya mengandung nilainilai kehidupan yang yang universal, artinya filosofi ini tidak mengacu kepada kultur, agama dan golongan tertentu (BNN Bekerjasama Dengan Departemen Sosial R.I, 2004). Pengalaman pecandu selama mengikuti TC akan dihayati pecandu sehingga akan memberikan makna pada pemulihannya terhadap Napza. Seperti yang diungkapkan oleh Robbins (2010), istilah persepsi biasanya digunakan untuk mengungkapkan tentang pengalaman terhadap sesuatu benda ataupun sesuatu kejadian yang dialami. Definisi ini menjelaskan bahwa persepsi merupakan suatu proses dimana setiap individu mengorganisir dan menginterpretasikan apa yang ditangkap inderanya untuk memberikan arti pada lingkungannya. Pada penelitian ini persepsi yang dimaksud adalah persepsi pecandu terhadap kegiatan yang diikutinya di TC dan memberikan makna terhadap pemulihan Napza 164
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
yang dilakukannya. Pengalaman serta pengetahuan, keterampilan atau hasil yang telah dicapainya selama TC akan memberikan prediksi terhadap perilaku selanjutnya bersamaan dengan keyakinan yang dimiliki individu mengenai kemampuan dan hasil usahanya untuk bisa bertahan bersih dari Napza. Penghayatan positif terhadap pengalamannya di TC akan mengembangkan keyakinan dalam diri pecandu akan kemampuan mengorganisir dan melakukan tindakan yang diperlukan untuk bertahan bersih dari Napza. Keyakinan akan kemampuan ini dapat dijelaskan melalui teori Self-Efficacy yang didefinisikan sebagai keyakinan seseorang tentang kemampuan untuk menghasilkan tingkat kinerja yang mempunyai pengaruh terhadap peristiwa yang mempengaruhi kehidupan mereka (Bandura, 1977). Secara umum, keyakinan yang dimaksud adalah keyakinan akan kemampuan mengatasi situasi stress atau tuntutan yang menantang. Sedangkan pada para pecandu secara spesifik adalah keyakinan akan kemampuan para pecandu untuk tetap bersih dari Napza. Ini sesuai dengan teori yang diungkapkan oleh Luszczynska, Scholz, & Schwarzer, (2005) mengenai general self-efficacy yaitu kepercayaan seseorang akan kompetensi untuk mengatasi berbagai situasi stres atau tuntutan-tuntutan yang menantang, sedangkan specific self-efficacy dibatasi untuk suatu tugas tertentu yang ditangani. Selfefficacy juga diyakini sebagai hal yang menentukan bagaimana seseorang merasa, berfikir, memotivasi diri, dan berperilaku. keyakinan tersebut menghasilkan efek-efek beragam melalui empat proses utama, yaitu termasuk proses kognitif, motivasi, afektif dan seleksi (Bandura, 1994). Oleh karenanya menjadi penting mengetahui self-efficacy dalam diri pecandu, dimana kekuatan self-efficacy memberikan pengaruh besar terhadap berkembangnya resiliensi dalam diri mereka. Sedangkan self-efficacy sendiri dapat berkembang dari pengaruh persepsi yang diberikan pecandu terhadap program TC sendiri. Berdasarkan pemaparan diatas, peneliti berpendapat bahwa persepsi terhadap Theraupetic Community dan Self Efficacy berpengaruh terhadap Resiliensi pada Recovery Addict Pasca Perawatan (Aftercare) UPT-R BNN. 1.2 Kajian Teori Resiliensi Resiliensi menurut Gortberg (2000), resiliensi merupakan kapasitas yang bersifat universal dan dengan kapasitas tersebut, individu, kelompok ataupun komunitas mampu mencegah, meminimalisir ataupun melawan pengaruh yang bisa merusak saat mereka mengalami musibah atau kemalangan (dalam Parinyaphol & Chongruksa, 2008). Resiliensi adalah kapasitas manusia untuk menghadapi, mengatasi, mempelajari kesulitan dalam hidup dan bahkan ditransformasi oleh kesulitan dalam hidup tersebut (Grotberg, 2003). Resiliensi adalah kemampuan manusia untuk, menghadapi, mengatasi dan bahkan diperkuat oleh kemalangan dalam hidup (Grotberg, 1996) Menurut Benard (1991) faktor resiliensi dinamakan protective factor. Istilah protective factor sendiri sampai saat ini belum memiliki definisi secara terang (Norman, dalam McCubbin, 2001). Faktor protektif dibagi dalam dua kategori, yakni faktor protektif internal, seperti self-esteem dan self-efficacy. Serta faktor protektif eksternal, seperti dukungan keluarga juga keterlibatan komunitas (Scalaes & Leffert, dalam McCubbin, 2001). Sedangkan Benard sendiri membagi faktor protektif ke dalam tiga domain, yakni atribut kepribadian individu, karakteristik keluarga dan pengaruh lingkungan seperti, teman sebaya, sekolah, dan masyarakat (dalam Benard, 1991). Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
165
Benard menjelaskan faktor-faktor resiliensi dan inter pengaruh diantara kesemua faktor yang ada dalam suatu model konseptual, yang tercakup di dalamnya ada aset lingkungan dan asetinternal resiliensi serta kebutuhan pribadi individu (dalam Hanson dan Kim, 2007).
Berikut model konseptual Benard: Sekolah (dalam hal ini tempat rehabilitasi) Pengaruh yang penuh kepedulian Harapan yang tinggi Partisipasi yang bermakna
Kebutuhan Individu Keamanan
reliensi Cinta Kerjasama dan Komunikasi
Rumah Pengaruh yang penuh kepedulian Harapan yang tinggi Partisipasi yang bermakna
Masyarakat Pengaruh yang penuh kepedulian Harapan yang tinggi Partisipasi yang bermakna
Teman sebaya Pengaruh yang penuh kepedulian Harapan yang tinggi
Aset internal
Rasa Memiliki
Rasa Hormat
Empati
Pemecahan Masalah
Meningkatkan hasil
Self-efficacy
kesehatan, sosial, dan
Kemahiran
Tantangan
Self-Awareness
akademik
Tujuan dan Cita-cita
Kekuatan
Aset lingkungan resiliensi
Makna
Bagan 1. Model konseptual Benard
166
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Aset lingkungan menunjukan ikatan prososial dan ikatan yang bermakna terhadap masyarakat, sekolah (dalam hal ini panti rehabilitasi), keluarga dan teman sebaya. Aset internal adalah trait resiliens individu, seperti self–efficacy, keterampilan memecahkan masalah, serta lainnya (dalam Hanson dan Kim, 2007). Model konseptual ini dirancang untuk mengukur 11 aset lingkungan, menanyakan tentang persepsi individu, mengenai harapan orang lain terhadap dirinya, persepsi individu terhadap pengaruh yang penuh kepedulian dengan orang lain, dan kesempatan individu untuk berpartisipasi secara bermakna di sekolah, rumah, dan lingkungan masyarakat. Model ini juga menilai pengaruh yang penuh kepedulian dan harapan yang tinggi dengan teman sebaya. Dukung eksternal ini mempromosikan hasil positif, mengecilkan perilaku berisiko dan merangsang keberhasilan akademik. (Benard, 2004; Constantine et al., 1999; Hawkins, Catalano, & Miller, 1992; Masten & Coatsworth, 1998; Resnick et al., 2000; Rutter, 1987; Werner & Smith, 1982, 1992, dalam Hanson dan Kim, 2007). Aset internal resiliensi mencakup kompetensi sosial, pemecahan masalah, otonomi, dan tujuan, yang masing-masing dapat dipecah lebih lanjut (Benard, 1991, 2004, dalam Hanson dan Kim, 2007). Kompetensi Sosial, misalnya, memerlukan ketrampilan komunikasi sosial, empati dan kepedulian, serta kemampuan untuk memperoleh tanggapan positif dari orang lain (responsiveness) (Benard, 2004; Masten, 2001, dalam Hanson dan Kim, 2007). Pemecahan masalah meliputi perencanaan, fleksibilitas, dan kepanjangan akal daya (resourcefulness). Otonomi mencakup self-efficacy, self-awareness, kesadaran (mindfulness). Tujuan meliputi arah tujuan, motivasi berprestasi, optimisme, dan harapan (Benard, 2004, dalam Hanson dan Kim, 2007). Aset internal resiliensi mengembangkan baik secara alami dan sebagai respons terhadap aset resiliensi yang berpengaruh dengan lingkungan. Aset internal resiliensi mengembangkan respon terhadap aset lingkungan resiliensi secara alami. Resiliensi dan modul perkembangan pemuda (youth) dirancang untuk mengukur enam aset internal seperti, empati, pemecahan masalah, self-efficacy, kesadaran diri (self-awareness), kerjasama dan komunikasi, serta tujuan dan aspirasi (dalam Hanson dan Kim, 2007). Menurut Grotberg, ada tiga karakteristik resiliensi, yakni “I HAVE”, “I AM”, dan “I CAN” (dalam Grotberg, 1996) Tabel 1 Karakteristik gesiliensi menurut Grotberg
“I HAVE” (External Support)
“I AM” (Inner Strength)
Orang-orang disekitarku yang aku percaya dan yang sayang padaku, apa pun yang terjadi. Orang-orang yang menetapkan batas untukku jadi aku tahu kapan harus berhenti sebelum terjadi bahaya atau masalah. Orang-orang yang menunjukkan bagaimana melakukan hal yang benar sebagaimana cara yang mereka lakukan. Orang-orang yang menginginkan aku untuk mempelajari sendiri mengenai sesuatu. Orang-orang yang menolongku ketika aku sakit, di dalam bahaya atau ketika perlu pembelajaran. Seseorang yang dapat menyukai dan menyayangi. Senang melakukan hal-hal yang baik untuk orang lain dan senang menunjukkan perhatianku. Menghargai diriku dan orang lain.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
167
“I CAN” (Interpersonal and Problem-Solving-Skills)
Bersedia bertanggung jawab atas apa yang aku lakukan. Yakin keadaan akan baik-baik saja. Berbicara kepada orang lain mengenai hal-hal yang menggangguku dan menakutkan bagiku. Mencari jalan keluar atas persoalan yang aku hadapi. Mengendalikan diriku ketika aku merasa melakukan sesuatu yang salah atau berbahaya. Mengetahui kapan waktu yang tepat untuk berbicara atau mengambil tindakan kepada orang lain. Mencari seseorang untuk menolongku ketika aku membutuhkan.
Seseorang mungkin dicintai (I HAVE), tetapi jika ia tidak memiliki kekuatan dari dalam dirinya (I AM)) atau tidak memiliki kecakapan sosial (I CAN), maka ia tidak memiliki resiliensi. Seseorang mungkin memiliki harga diri yang bagus (I AM), tetapi ia tidak mengetahui bagaimana berkomunikasi dengan orang lain atau bagaimana menyelesaikan masalahnya (I CAN) dan tidak memiliki seseorang untuk menolongnya (I HAVE), maka orang ini tidak memiliki resiliensi. Seseorang mungkin bisa berbicara dengan sangat bagus dan lancar (I CAN), namun ia tidak memiliki rasa empati (I AM) atau tidak memliki orang yang dicontoh/ role model (I HAVE), maka orang itu tidak memiliki resiliensi. Resiliensi terwujud dari kombinasi ketiga ciri ini (dalam Parinyaphol & Chongruksa, 2008). Self-efficacy Self-efficacy telah didefinisikan sebagai keyakinan seseorang tentang kemampuan untuk menghasilkan tingkat kinerja yang mempunyai pengaruh terhadap peristiwa yang mempengaruhi kehidupan mereka (Bandura dalam Suaidy, 2002). Self-efficacy juga diyakini sebagai hal yang menentukan bagaimana seseorang merasa, berfikir, memotivasi diri, dan berperilaku. keyakinan tersebut menghasilkan efek-efek beragam melalui empat proses utama, yaitu termasuk proses kognitif, motivasi, afektif dan seleksi. (Bandura dalam Suaidy, 2002). Dalam beberapa tahun terakhir, general self-efficacy telah muncul sebagai penjelasan mengenai self-efficacy secara umum, Luszczynska, Schwarzer & Scholz (2005) menyebutkan General self-efficacy sebagai: “The belief in one's competence to cope with a broad range of stressful or challenging demands.” Dalam portofolio RCMAR Measurement Tools Generalized Self-Efficacy Scale (GSE), self-efficacy disebut sebagai: Optimistic self-beliefs used to cope with a variety of demands in life yaitu Optimisme dan kepercayaan diri yang digunakan untuk mengatasi berbagai tuntutan dalam kehidupan (Schwarzer & Jerusalem, 1995). General self-efficacy adalah kepercayaan seseorang akan kompetensi untuk mengatasi berbagai situasi stres atau tuntutan-tuntutan yang menantang, sedangkan specific self-efficacy dibatasi untuk suatu tugas tertentu yang ditangani (Luszczynska, Scholz, & Schwarzer, 2005). Spesifik self-efficacy berkaitan akan adiksi napza adalah Drug Avoidance Self-efficacy yaitu keyakinan akan kemampuan individu untuk berhasil mengatasi berbagai situasi yang menantang tanpa menggunakan Napza. 168
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
Self-efficacy diukur dengan spesifik self-efficacy yaitu dengan Drug Avoidance Selfefficacy (Martin, 1991). Skala ini menunjukkan validitas prediktif, yaitu nilai pada skala telah terbukti untuk memprediksi perilaku pecandu napza. Ini sebagai pengukuran terhadap kemajuan rehabilitasi dalam hal mengatasi situasi beresiko. Ada bukti yang mendukung reliabilitas dan validitas skala, walaupun penggunaannya telah dibatasi pada pengguna narkoba dengan usia (16-30 tahun). Sumber-sumber informasi yang paling berpengaruh terhadap self-efficacy (Cloninger, 2000) adalah: 1.
2.
3.
4.
Performance Accomplishments Hasil dari pengalaman pribadi langsung dari seseorang dalam bertindak menghadapi suatu hal, baik yang merupakan keberhasilan ataupun yang merupakan kegagalan yang dialaminya. Vicarious Experience Pengalaman yang dialami orang lain. Orang tersebut dapat berupa orang dalam lingkungan sehari-hari yang dapat dilihat secara langsung ataupun seseorang tokoh masyarakat, public figure yang dikaguminya. Verbal Persuasion Persuasi verbal meliputi nasehat atau anjuran, peringatan yang dilakukan oleh orang lain ataupun diri sendiri. Emotional Arousal Bentuk-bentuk reaksi emosional dan fisiologis seperti keputusasan, ketenangan, kepuasan, kekecewaan, tertawa, kemarahan, menangis, kebahagiaan, keletihan secara fisik maupun emosional juga akan memberikan informasi mengenai keyakinan efficacy.
Self-efficacy akan mempengaruhi proses pengaturan diri (self-regulator) dan motivasi dalam beberapa cara. Self-efficacy akan mempengaruhi pilihan individu dan tindakantindakan yang ingin dicapai. Keyakinan akan kompetensi inidividu akan membantu menentukan berapa banyak usaha (effort) yang diperlukan untuk suatu aktifitas, berapa lama ketekunan (persevere) yang dibutuhkan individu ketika menghadapi rintangan dan berapa besar keuletan (resiliensi) yang ditunjukkan pada saat menghadapi situasi yang tidak diinginkan. Individu yang mempunyai self-efficacy yang tinggi akan mempunyai usaha, ketekunan dan keuletan yang lebih besar pula (Pajares, 2002). Persepsi terhadap Therapeutic Community Persepsi terhadap Therapeutic Community (TC) merupakan penghayatan tentang pengalaman terhadap program Therapeutic Community yang sudah pernah dijalani oleh para recovery addict. Saat para recovery addict mengikuti seluruh proses kegiatan TC, secara langsung mereka mengorganisir dan menginterpretasikan apa yang ditangkap oleh inderanya serta memberikan arti pada lingkungannya. Sesuai dengan yang diungkapkan oleh Rice (1998) persepsi adalah interpretasi dan organisasi dari informasi yang diteruskan ke otak oleh indera. Dalam mempersepsikan suatu informasi terdapat dua proses penting, yaitu interpretasi dan organisasi. Pada saat recovery addict melakukan interpretasi, ia berusaha untuk mengartikan dan membuat penilaian terhadap suatu informasi dari kegiatan TC . Informasi tersebut dapat dinilai sebagai sesuatu yang positif ataupun negatif. Setelah melakukan proses interpretasi, individu kemudian melakukan proses organisasi dimana ia memilah-milah informasi baru dan menghubungkan informasi tersebut dengan informasi serupa yang telah disimpan di long-term memory. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
169
Berdasarkan penjelasan sebelumnya maka disimpulkan bahwa persepsi terhadap Therapeutic Community merupakan penghayatan positif atau negatif tentang pengalaman terhadap program Therapeutic Community yang sudah dijalani oleh para recovery addict. Pengalaman terhadap program Therapeutic Community diukur dengan adaptasi alat ukur Therapeutic Community Scale Elemen of Essensial dari George DeLeon dan Gerald Melnick (1993) dimana mengembangkan sebuah tipologi program pengobatan komunitas terapi untuk penyalahgunaan zat adiktif dan obat-obatan. Hal ini didasarkan kerangka teoritis dari komponen pemulihan Therapeutic Community dan menjelaskan filosofi khas modalitas dan elemen pemulihan. Adapun dimensi persepsi terhadap Therapeutic Community terdiri dari Perspektif Therapeutic Community; Institusi: Pendekatan dan Struktur Pemulihan; Komunitas sebagai Agen Theraupetic; Aktifitas Pendidikan dan Kerja; Elemen-elemen Theraupetic Forma; Proses Rehabilitasi.
Oleh karenanya, model penelitian ini dapat digambarkan sebagai berikut:
Persepsi TC
Perspektif TC Program dalam Institusi Komunitas
Self Efficacy Performance Accomplishment Vicarious Experience
sebagai agen Pendidikan therapeutik Formal &
Resiliensi
Verbal
Informal dalam Elemen utama TC dalam TC Proses
Persuasion Emotional Arrousal
Rehabilitasi dalam TC Bagan 2. Skema kerangka berpikir penelitian Berdasarkan asumsi-asumsi yang telah diuraikan di atas, maka dapat dibuat: Hipotesis Mayor H1: Ada pengaruh yang signifikan persepsi Therapeutic Community dengan Self Efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. Hipotesis Minor H1.1: Ada pengaruh yang signifikan persepsi positif terhadap Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido.
170
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
H1.2: Ada pengaruh yang signifikan persepsi negatif terhadap Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. H1.3: Ada pengaruh yang signifikan pengalaman rehabilitasi terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. H1.4: Ada pengaruh yang signifikan usia terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. H1.5: Ada pengaruh yang signifikan status pekerjaan terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. 1.3 Metode Penelitian Populasi dan Sampel Populasi dalam penelitian ini adalah recovery addict, yaitu para pecandu yang sudah menunjukkan perbaikan dalam dirinya untuk bertahan bersih dari Napza, dan sedang menjalankan perannya dalam membantu para pecandu lainnya yang masih dalam perawatan di rehabilitasi. Peran tugasnya adalah sebagai on job training (ojt), mayor, dan konselor pada program Therapeutic Community di UPT-T&R BNN Lido dengan jumlah keseluruhan populasi 40 orang pria dan 4 orang perempuan. Teknik pengambilan sampel yang peneliti gunakan non probability purposive sampling adalah teknik penentuan sampel dengan pertimbangan tertentu (Sugiyono, 2008). Kriteria tertentu yang telah ditetapkan, yakni tercatat sebagai staff adiksi (tercatat mengikuti program aftercare) UPT-T&R BNN Lido. Sampel sejumlah 31 orang, yang terdiri dari 29 orang male dan 2 orang female. Karakteristik sampel dengan status pekerjaan staff adiksi dibedakan dalam beberapa kelompok, yaitu staff adiksi yang sedang menjalani on the job training (ojt), staff adiksi sebagai mayor, dan staff adiksi sebagai mayor dan konselor. Selain itu, jumlah masuk rehabilitasi pun diklasifikasikan dan yang terakhir adalah pengkategorian berdasarkan usia. Teknik Pengumpulan Data Dalam penelitian ini peneliti menggunakan skala model Likert. Peneliti menyebar langsung skala kepada subjek penelitian. Skala Resiliensi Skala resiliensi mengacu karakteristik resiliensi dalam Grotberg, (1996) dengan indikator yakni External Support (I HAVE), Inner Strengths (I AM), dan Interpersonal and Problem-Solving Skills (I CAN). Pengukuran dengan menggunakan skala Likert yang terdiri dari 4 kategori jawaban yang mewakili dirinya yaitu, “sangat sesuai” (SS), “sesuai” (S), “tidak sesuai” (TS), dan “sangat tidak sesuai” (STS). Pada resiliensi yang terdiri dari 55 item, dengan pernyataan positif (favorable) dan pernyataan negatif (unfavorable). Subjek diminta untuk memilih salah satu kategori dari 4 kategori jawaban yang mewakili dirinya yaitu, “sangat sesuai” (SS), “sesuai” (S), “tidak Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
171
sesuai” (TS), dan “sangat tidak sesuai” (STS). Penskoran tertinggi diberikan pada pilihan sangat setuju dan terendah untuk pernyataan sangat tidak setuju untuk pernyataan favorable. selanjutnya penskoran tertinggi untuk pernyataan unfavorable diberikan pada pilihan jawaban sangat tidak setuju dan skor terendah diberikan untuk pilihan sangat setuju. Skala Self-Efficacy Skala self-efficacy mengacu pada skala Drug Avoidance Self-efficacy (Martin, 1991) yaitu keyakinan akan kemampuan individu untuk berhasil mengatasi berbagai situasi yang menantang tanpa menggunakan Napza. Skala Drug Avoidance Self-efficacy (Martin, 1991) terdiri dari 16 item, dengan pernyataan positif (favorable) dan pernyataan negatif (unfavorable). Subjek diminta untuk memilih salah satu kategori dari 7 kategori jawaban yang mewakili dirinya yaitu, “tentu iya”, “mungkin iya”, “sepertinya iya”, “tidak tahu”, “mungkin tidak”, “sepertinya tidak”, dan “tentu tidak”. Penskoran tertinggi diberikan pada pilihan tentu iya dan terendah untuk pernyataan tentu tidak untuk pernyataan favorable. Selanjutnya penskoran tertinggi untuk pernyataan unfavorable diberikan pada pilihan jawaban tentu tidak dan skor terendah diberikan untuk pilihan tentu iya. Skala Persepsi Theraupetic Community (TC) Skala Persepsi Therapeutic Community mengacu pada alat ukur Therapeutic Community Scale Elemen of Essensial dari George DeLeon dan Gerald Melnick (1993). Untuk variabel persepsi TC bentuk alat ukur berupa skala Likert yang terdiri dari 26 item yang keseluruhannya berbentuk pernyataan favorable. Subjek diminta untuk memilih salah satu kategori dari 6 kategori jawaban yang mewakili dirinya yaitu, “tidak dapat disetujui”, “hampir tidak setuju”, “kurang setuju”, “cukup setuju”, “setuju”, “sangat setuju”. Penskoran tertinggi diberikan pada pilihan sangat setuju dengan nilai 6, setuju dengan nilai 5, cukup setuju dengan nilai 4, kurang setuju dengan nilai 3, hampir tidak setuju dengan nilai 2, dan tidak dapat disetujui dengan nilai 1. Tidak ada item yang berbentuk unfavorable, sehingga tidak ada item yang diberi penilaian secara terbalik. Teknik Analisis Data Uji Reliabilitas Berdasarkan uji reliabilitas dan uji validitas melalui SPSS 17.0 didapatkan nilai koefisien cronbach alpha pada skala persepsi terhadap Theraupetic Community (TC) didapatkan nilai koefisien cronbach alpha sebesar 0.903. Dengan begitu alat ukur ini dapat dikatakan cukup reliabel untuk mengukur variabel persepsi terhadap TC. Dan uji reliabilitas untuk skala self-efficacy didapatkan nilai koefisien cronbach alpha sebesar 0.975. Dengan begitu alat ukur ini juga reliabel untuk mengukur variabel self-efficacy. Sedangkan uji reliabilitas untuk skala resiliensi, didapatkan nilai koefisien cronbach alpha sebesar 0.981. Dengan begitu alat ukur ini juga reliabel untuk mengukur variabel resiliensi. Uji Validitas Berdasarkan uji validitas yang dilakukan ditemukan semua item baik pada skala persepsi terhadap TC, self-efficacy, maupun resiliensi menunjukkan semua valid. Hasil Pembahasan Penelitian ini bertujuan untuk melihat pengaruh Persepsi Theraupetic Community dengan Self-efficacy terhadap Resiliensi pada Recovery Addict pasca perawatan di UPT-T&R 172
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
BNN Lido. Gambaran umum responden penelitian berdasarkan status pekerjaan staff adiksi menunjukkan recovery addict sebanyak 31 orang terdiri recovery addict dengan status pekerjaan sebagai on job training (OJT) sebanyak 7 orang (22,58%), sebagai mayor sebanyak 4 orang 12,90%), sebagai mayor dan konselor sebanyak 18 orang (58,06%) dan tidak mengisi data lengkap sebanyak 2 orang (6,45%). Ini menunjukkan recovery addict yang memiliki tugas sebagai mayor dan memiliki kompetensi sebagai konselor, artinya recovery addict memiliki pengetahuan dan keterampilan yang memadai yang dapat menunjang dirinya untuk bertahan dari Napza. Gambaran hasil kelompok persepsi menunjukkan bahwa persepsi positif terhadap TC sebesar 64, 52% dibandingkan persepsi negatif terhadap TC yang sebesar 35,48%. Dengan demikian, kegiatan Theraupetic Community yang dilakukan UPT-T&R BNN lebih banyak diterima oleh para recovery addict, dan dihayati dengan positif sehingga mampu dijalankan sesuai programnya. Pengaruh Persepsi TC dengan Self-efficacy terhadap Resiliensi Tabel 2.
1
Anova Persepsi TC dengan Self-efficacy terhadap Resiliensi Sum of Model Squares Df Mean Square F Regression 3.388 2 1.694 1.783 Residual 26.612 28 .950 Total 30.000 30
Sig. .187a
a. Predictors: (Constant), Persepsi TC, SE b. Dependent Variable: Resiliensi
Berdasarkan hasil dari tabel 2, signifikansi yang didapatkan adalah 0,187 (p > 0,05), yang artinya tidak terdapat pengaruh yang signifikan dari persepsi TC dengan self-efficacy terhadap resiliensi (H0 diterima). Sedangkan besar sumbangan dari persepsi TC dengan self-efficacy terhadap resiliensi, menunjukkan perolehan R square sebesar 0,113 atau 11,3%. Artinya 11,3% variasi dari resiliensi dapat dijelaskan oleh variasi dari persepsi TC dengan self-efficacy sedangkan 88,7% sisanya dipengaruhi oleh variabel lain di luar penelitian ini. Untuk melihat perbedaan resiliensi pada persepsi terhadap TC positif dan negatif di UPTT&R BNN Lido, maka dilakukan analisis uji beda resiliensi berdasarkan persepsi positif dan negatif. Hasilnya menunjukkan F hitung sebesar 1,188 dengan taraf signifikansi 0,031 (p < 0,05), maka terdapat perbedaan yang signifikan pada mean skor variabel resiliensi antara tingkatan persepsi terhadap TC. Dengan demikian dapat dikatakan bahwa terdapat perbedaan resiliensi yang signifikan antara recovery addict dengan persepsi TC yang positif dan recovery addict dengan persepsi TC yang negatif. Selain itu, pengalaman rehabilitasi diperoleh nilai koefisien regresi sebesar 0,024 dengan nilai sig. 0,759 (p > 0,05), yang berarti bahwa pengalaman rehabilitasi recovery addict tidak memberikan pengaruh yang signifikan terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPTT&R BNN Lido. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
173
Sedangkan usia recovery addict diperoleh nilai koefisien regresi sebesar 0,056 dengan nilai sig. 0,315 (p > 0,05), yang berarti bahwa usia recovery addict tidak memberikan pengaruh yang signifikan terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. Demikian juga dengan status pekerjaan diperoleh nilai koefisien regresi sebesar 0,155 dengan nilai sig. 0,571 (p > 0,05), yang berarti bahwa status pekerjaan recovery addict (dalam hal ini terbagi menjadi OJT, mayor, mayor & konselor) tidak memberikan pengaruh yang signifikan terhadap persepsi Therapeutic Community dengan Self-efficacy terhadap resiliensi pada recovery addict pasca perawatan (Aftercare) di UPT-T&R BNN Lido. Kesimpulan Berdasarkan hasil pengolahan data dan pembahasan tentang Pengaruh Persepsi Theraupetic Community dengan Self-efficacy terhadap Resiliensi pada Recovery Addict pasca perawatan di UPT-T&R BNN Lido, maka ditarik kesimpulan yaitu : 1.
2.
Banyak faktor-faktor lainnya yang memberikan pengaruh terhadap resiliensi, dibandingkan persepsi terhadap program Theraupetic Community. Padahal program ini merupakan bagian dari fase primary yaitu fase penting dalam menyiapkan recovery addict untuk menjalani kehidupan sehari-hari di masyarakat setelah perawatan di UPTR BNN. Untuk itu dibutuhkan penelitian mengenai faktor-faktor psikologis lainnya yang dapat memberikan pengaruh terhadap resiliensi. Secara umum recovery addict memiliki penghayatan terhadap Theraupetic Community positif sebesar 61.29%. Ini menunjukkan bahwa para recovery addict mengartikan dan membuat penilaian positif terhadap suatu informasi dari kegiatan Theraupetic Community. Dengan proses penghayatan yang positif, ia mampu memilah-milah informasi baru yang ada dalam rehabilitasi UPT-T&R BNN Lido, mampu menghubungkan informasi tersebut dengan apa yang mereka sudah dapatkan sebelumnya, menyimpan dalam waktu yang lama, serta mengeluarkan dengan mudah saat dibutuhkan. Sedangkan 38,7% recovery addict memiliki penghayatan terhadap TC negatif, seperti yang diungkapkan oleh Rice (1998) bahwa saat individu mempersepsikan sesuatu, dapat terjadi bias yang dipengaruhi oleh karakteristik emosi individu tersebut. Oleh karenanya, bias dapat terjadi saat proses pengambilan data 12 orang recovery addict sedang mengalami kondisi kelelahan bekerja yang mempengaruhi kondisi emosi. Selain itu juga dapat dipengaruhi oleh efek kumulatif dari pengalaman-pengalaman yang dialami sebelumnya oleh recovery addict.
Saran Tentunya peneliti menyadari adanya banyak kekurangan dalam penelitian ini. Oleh sebab itu peneliti akan membagi saran yang dapat dipertimbangkan untuk penelitian selanjutnya, sebagai berikut: Saran Teoritis: 1.
Memperluas populasi recovery addict dimana tidak hanya terbatas di lingkungan UPTT&R BNN, sehingga mendapatkan gambaran lebih luas berkaitan hasil dari program pasca perawatan serta meningkatkan kualitas penelitian lebih lanjut.
2.
Persepsi terhadap Theraupetic Community dapat diteliti lebih lanjut dengan melibatkan variabel dimensi dalam persepsi terhadap TC sehingga semakin jelas variabel dari persepsi TC yang memberikan pengaruh terhadap self-efficacy.
174
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
3.
Pengembangan alat ukur dari drug avoidance self-efficacy dapat diberikan pada setiap fase sehingga dapat digunakan sebagai prediksi kemajuan dari keyakinan akan kemampuan bertahan bersih dari Napza.
4.
Alat ukur yang digunakan dalam persepsi terhadap Theraupetic Community masih termasuk kuesioner yang singkat. Jika tertarik untuk meneliti lebih lanjut berkaitan dengan efektifitas program TC dibutuhkan alat ukur dengan format kuesioner yang lebih mendalam.
5.
Sedangkan yang tertarik mengenai resiliensi, diharapkan melibatkan variabel lain yang dapat memberikan pengaruh terhadap resiliensi. Misalnya dengan melibatkan faktor internal lainnya yang memberikan pengaruh terhadap resiliensi, seperti kemampuan kerjasama dan komunikasi, kemampuan empati, pemecahan masalah, self-awareness, dan orientasi terhadap masa depan, juga asset lingkungan seperti lingkungan sekolah, pekerjaan, keluarga dan teman sebaya.
6.
Untuk penelitian selanjutnya mengenai tema yang mengangkat mengenai pecandu napza, diharapkan peneliti dapat menfokuskan pada potensi-potensi keberhasilan berdasarkan pengalaman recovery addict dalam mengatasi situasi sulit dalam penggunaan Napza.
Saran praktis 1.
Bagi lembaga UPT-T&R Badan Narkotika Nasional Lido, agar dapat mengembangkan treatment dan therapy, salah satunya dengan lebih menekankan performance accomplishment yang positif, yaitu menggali pengalaman keberhasilan-keberhasilan dari pengalaman mereka sendiri dalam mengatasi situasi sulit, baik berkaitan dengan Napza maupun dalam kehidupan kesehariannya. Berikan umpan balik, kepada mereka sehingga mereka menyadari kekuatan yang mendasari keberhasilannya dalam bertindak.
2.
Pengembangan “Role Model” merupakan hal penting dari seorang konselor, Mayor dan OJT sehingga setiap tindakan menjadi perhatian bagi para pecandu yang sedang dalam perawatan. Perlu dikembangkan pengetahuan dan keterampilan dalam mengembangkan diri sebagai role model, sehingga recovery addict mampu terus mempertahankan dirinya untuk tetap bersih dari Napza.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
175
DAFTAR PUSTAKA
Allegheny County Coalition for Recovery Child and Family Committee. (2006). Guidelines for developing resiliency and recovery oriented behavioral health systems for children and families. Diambil pada tanggal 25 Juni 2010 dari http://www.coalitionforrecovery.org/Documents/ACCR/Guidelines%20for%20Develop ing%20Resiliency%20For%20Children.pdf. Bandura, A. (1977). Social learning theory. Englewood Cliffs: Prentice Hall, inc. Benard, B. (1991). Fostering resiliency in kids: protective factors in the family, school, and community. Western Center For Drug Free Schools And Communities Montana Board Of Crime Control: Montana Office Of Public Instruction. Volume 1991? (6-19 page) BNN R.I. & Departemen Sosial R.I. (2004). Metode therapeutic community (komunitas terapeutik) dalam rehabilitasi sosial penyalahgunaan Napza. Jakarta. Badan Narkotika Nasional RI Pusat Terapi Dan Rehabilitasi BNN. (2009). Hasil penelitian bnn dan puslitkes ui tentang penyalahgunaan Napza di indonesia. Diambil pada tanggal 14 April dari www.bnn.go.id/portalbaru/portal/konten.php?nama=ArtikelLitbang&op=dl_artikel_litb ang&namafile=HASIL%20PENELITIAN%20BNN%20Jurnal%202009.pdf BNN R.I (2009). Panduan pelayanan psikologi di OSC-ORC-CBU. Jakarta: Badan Narkotika Nasional RI Pusat Terapi dan Rehabilitasi. Cloninger, S., C. (2000). Theories of personality: Understanding person. 3rd edition. New Jersey: Prentice Hall. Chung, Hsiu-feng. (2008). Resiliency and character strengths among college students. Disertasi. The University of Arizona. Conference Report. (2005). National summit on recovery. Washington, D.C: U.S. Department of health and human services. Diambil pada tanggal 21 November 2010 dari http://www.ireta.org/ireta_main/recoveryCD/CSAT Summit-Rpt2007.pdf De Leon, G. (2000). The therapeutic community, theory, model, and method. New York: Springer De Leon, G., & Melnick, G. (1993). Therapeutic community scale of essential elements questionnaire (SEEQ). Diambil dalam http://www.emcdda.europa.eu/html.cfm/index3627EN.html Firanti (2010). Hubungan antara kekuatan karakter dengan resiliensi residen narkoba di unit pelaksana teknis (UPT) Terapi dan Rehabilitasi BNN Lido. Skripsi Fakultas Psikologi, Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta. Garnasih, N.H. (2010). Hubungan antara persepsi tentang Theraupetic Community dengan harapan untuk pulih dari Napza pada residen di unit pelaksana teknis (UPT) terapi dan rehabilitasi BNN Lido. Skripsi Fakultas Psikologi, Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta Grotberg, E. H. (1996). The international resilience project findings from the research and the effectiveness of interventions. journal pdf. Paper presented at the Annual Convention of the International Council of Psychologists (54th, Banff, Canada, July 2428, 1996). Diambil pada tanggal 3 Mei 2010 dari http://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearch_ SearchValue_0=ED419584&ERICExtSearch_SearchType_0=no&accno=ED419584
176
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
. Grotberg, E. H. (2006). Implications of the shift from diagnosis and treatment to recovery and resiliency for research and practice. Georgetown University. Washington, D. C. USA. Diambil pada tanggal 21 Juli 2010 dari http://resilnet.uiuc.edu/library/grotberg2006_implications-diagnosis-recoverygeorgetown.pdf Grotberg, E.H.. (2003). Resilience for today: gaining strength from adversity. Westport: Praeger. Martin, G. (1991).Drug avoidance self-efficacy scale (DASES). Diambil pada tanggal 3 September 2011 dari http://www.emcdda.europa.eu/html.cfm/index3627EN.html McCubbin, L. (2001). Challenges to the definition of resilience. Paper presented at the Annual Meeting of the American Psychological Association (109th, San Francisco, CA, August 24-28, 2001). Diambil pada tanggal 3 Mei 2010 dari http://www.eric.ed.gov/ERICWebPortal/search/simpleSearch.jsp?newSearch=true&eric_sortF ield=&searchtype=keyword&pageSize=10&ERICExtSearch_SearchValue_0=
O‟Neal, M.R. (1999). Measuring resilience. Paper presented at the Annual Meeting of the Mid-South Educational Research Association (Point Clear, AL, November 17-19,1999) Diambil pada tanggal 4 Mei 2010 dari http://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearch_ SearchValue_0=ED436574&ERICExtSearch_SearchType_0=no&accno=ED436574
Oshio A, Hitoshi K, Nagamine S, & Nakaya M. (2003). Construct validity oh the adolescent resilience scale. Psychological reports, vol 93. Diambil pada tanggal 8 Juli 2010 dari http://psy.isc.chubu.ac.jp/~oshiolab/research/pages/scanned/2003ConValofARS.pdf Parinyaphol, P., & Doungmani, C.. (2008). Resilience of higher educational students, the human spirit among thai and muslim students. journal pdf. Diambil pada tanggal 4 Mei 2010 dari http://www.eric.ed.gov/ERICWebPortal/search/recordDetails.jsp?ERICExtSearch_SearchValue _0=ED502103&searchtype=keyword&ERICExtSearch_SearchType_0=no&_pageLabel=RecordD etails&accno=ED502103&_nfls=false&source=ae
Pertiwi, M,.A. (2011). Dimensi religiusitas dan resiliensi pada residen narkoba di BNN Lido. Skripsi. Fakultas Psikologi, Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta Suaidy, S.,E.,I. (2002). Hubungan antara Self-efficacy dengan Dependency Terhadap Narcotics Anonymous Pada Pria Pecandu Napza Pasca Perawatan di Yayasan Kita Cipayung Jawa Barat. Skripsi. Fakultas Psikologi Universitas Islam Bandung UPT Terapi dan Rehabilitasi BNN, Walking paper.(2009) Winanti, S.Psi, (2008). Therapeutic Community (TC), Lapas Klas IIA Narkotika Jakarta. Artikel. Diambil tanggal 5 Juni 2010 dari http://lapasnarkotika.files.wordpress.com/2008/07/therapeutic-community-rev1_1doc.pdf
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
177
178
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
PENGARUH MOTIVASI, SIKAP DAN KEBIASAAN BELAJAR, SERTA FAKTOR DEMOGRAFIS TERHADAP HASIL BELAJAR MAHASISWA Yunita Deskariani Lestari dan Solicha
[email protected] Fakultas Psikologi UIN Syarif Hidayatullah Jakarta Abstrak Penelitian ini bertujuan untuk mengetahui seberapa besar pengaruh motivasi, sikap dan kebiasaan belajar, jenis kelamin, latar belakang sekolah, dan lama belajar terhadap hasil belajar mahasiswa. Penelitian melibatkan 350 sampel pada mahasiswa/i yang masih aktif kuliah di Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta). Alat ukur motivasi yang digunakan adalah hasil adaptasi dari alat ukur yang dikembangkan oleh Cote dan Levine (1997). Sedangkan alat ukur sikap dan kebiasaan belajar yang digunakan adalah hasil adaptasi dari alat ukur yang dikembangkan oleh Brown dan Holtzman. Hasil penelitian ini menunjukkan bahwa secara bersamaan motivasi, sikap dan kebiasaan belajar, jenis kelamin, latar belakang sekolah, dan lama belajar secara signifikan mempengaruhi hasil belajar mahasiswa. Sedangkan variabel yang berpengaruh secara signifikan terhadap hasil belajar mahasiswa, yaitu work methods dan lama belajar. Kata kunci: motivasi, sikap dan kebiasaan belajar A. Pendahuluan Hasil belajar atau yang sering disebut dengan prestasi belajar pada mahasiswa dipengaruhi oleh banyak hal, salah satunya adalah motivasi yang ada di dalam diri mahasiswa itu sendiri. Motivasi ini yang biasanya menjadi penggerak mahasiswa untuk dapat menghasilkan hasil belajar yang lebih baik. Menurut Cote dan Levine (1997), siswa yang masuk perguruan tinggi tidak seperti tabularasa (kertas kosong). Mereka telah dipengaruhi oleh pengalaman sebelumnya, dengan keluarga, situasi pendidikan sebelumnya, dan tempat kerja. Beberapa pengalaman ini akan mempengaruhi motivasi mahasiswa masuk perguruan tinggi, yang juga seharusnya mempengaruhi kesiapan mahasiswa untuk mendapat manfaat dari apa yang ditawarkan perguruan tinggi. Oleh karena itu, pengalaman sebelumnya merupakan faktor-faktor input utama yang membuat perbedaan bentuk kesiapan motivasi. Akibatnya, jika para mahasiswa termotivasi untuk terlibat aktif dalam proses belajar, mereka cenderung siap bertemu dengan lingkungan perguruan tinggi dan membentuk hubungan bilateral. Jika bentuk kesiapan untuk berpartisipasi dalam hubungan bilateral ini diidentifikasi dengan benar, hal ini mungkin berguna untuk memprediksi kinerja di perguruan tinggi seperti input kemampuan dan keterampilan mahasiswa (Cote & Levine, 1997). Tidak semua mahasiswa yang mendaftar ke perguruan tinggi memiliki kesiapan motivasi yang sama, lingkungan perguruan tinggi pun tidak semua memiliki kesiapan yang Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
179
sama untuk membina perkembangan mahasiswa. Cote dan Levine (1997) membangun suatu tipologi, yang bisa diterapkan secara empiris berdasarkan motivasi mahasiswa masuk perguruan tinggi. Tipologi ini mengindentifikasi lima motivasi mahasiswa masuk perguruan tinggi yaitu motivasi karir-materialis (CAR), motivasi pengembangan intelektual pribadi (PER), motivasi kemanusiaan (HUM), motivasi berdasarkan harapan (EXP), dan motivasi terakhir adalah motivasi tak ada pilihan atau default (DEF). Menurut penelitian Cote dan Levine (1997) bahwa sebagian besar mahasiswa dianggap mempunyai tipe campuran, skornya tinggi pada lebih dari satu motivasi. Hanya sepertiga dari mahasiswa yang dapat digolongkan sebagai tipe murni. Faktor lain yang mempengaruhi hasil belajar mahasiswa adalah sikap dan kebiasaan belajar. Studi Sutadji (1993) menyatakan bahwa ada hubungan yang positif antara sikap dan kebiasaan belajar dengan prestasi belajar. Objek sikap akan dipersepsi oleh mahasiswa dan hasil persepsi akan dicerminkan dalam sikap yang diambil oleh mahasiswa tersebut. Hasil proses persepsi merupakan pendapat atau keyakinan mahasiswa mengenai objek sikap dan ini terkait dengan segi kognisi. Sedangkan afeksi akan mengiringi hasil kognisi terhadap objek sikap sebagai evaluatif, yang dapat bersifat positif atau negative (Walgito, 2010). Faktor demografis yang mempengaruhi hasil belajar mahasiswa ialah jenis kelamin latar belakang sekolah dan lama belajar. Berdasarkan latar belakang tersebut peneliti merumuskan masalah sebagai berikut: 1. Apakah ada pengaruh yang signifikan motivasi, sikap dan kebiasaan belajar, jenis kelamin, latar belakang sekolah dan lama belajar terhadap hasil belajar mahasiswa? 2. Variabel manakah yang paling berpengaruh terhadap hasil belajar mahasiswa? B. Metode Penelitian
Penelitian ini menggunakan pendekatan kuantitatif dengan analisis regresi berganda. Populasi penelitian ini adalah mahasiswa/i S1 semester 3 yang tercatat aktif kuliah di tahun ajaran 2011/2012 Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta, berjumlah 4344 orang, yang tersebar di sebelas Fakultas (PUSKOM UIN Jakarta, 2011). Sedangkan sampel dalam penelitian ini sebanyak 350, dengan komposisi perempuan berjumlah 226 (64,6 %), dan laki-laki 124 (35,4%) mahasiswa, dengan teknik non probability sampling. Dalam penelitian ini peneliti menggunakan alat ukur skala motivasi, Skala sikap dan kebiasaan belajar, kuesioner jenis kelamin, latar belakang sekolah dan lama belajar serta hasil belajar mahasiswa yang diukur dengan menggunakan IPK (Indeks Prestasi Kumulatif) semester 1 dan 2. Untuk menguji validitas dan reliabilitas alat ukur peneliti menggunakan Confirmatory Factor Analysis (CFA). C. Hasil Penelitian dan Pembahasan
Hasil penelitian ini menunjukkan bahwa secara bersamaan motivasi, sikap dan kebiasaan belajar, jenis kelamin, latar belakang sekolah, dan lama belajar secara signifikan mempengaruhi hasil belajar mahasiswa. Meskipun begitu proporsi varians dari hasil belajar mahasiswa yang dijelaskan oleh semua independen variabel tersebut sebesar 7,2%, sedangkan 92,8% sisanya dipengaruhi oleh variabel lain diluar penelitian ini. Sedangkan jika 180
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
dilihat perdimensi, variabel yang berpengaruh secara signifikan terhadap hasil belajar mahasiswa, yaitu work methods dan lama belajar. Diskusi Kelima aspek dari motivasi mahasiswa ini tidak memiliki pengaruh yang signifikan terhadap hasil belajar mahasiswa. Hal ini tidak sejalan dengan penelitian Cote dan Levine (2007) yang menyatakan bahwa faktor dari motivasi pengembangan intelektual pribadi dan motivasi karirmaterialis mempunyai pengaruh yang paling kuat terhadap hasil belajar mahasiswa. Menurut peneliti, tidak adanya pengaruh yang signifikan antara motivasi mahasiswa terhadap hasil belajar mahasiswa mungkin dikarenakan adanya Social desirability yaitu memberikan jawaban yang dirasa benar sesuai dengan norma standart masyarakat yang berlaku. Apabila dilihat dari perhitungan statistika, terlihat jelas dari nilai varians yang kecil pada skor setiap item, ini berarti tidak terdapat skor variasi jawaban yang beragam. Hal ini karena kebanyakan responden menjawab skor hanya pada rentang 3 sampai 5, dari rentang 0 sampai 6 yang disediakan peneliti, sehingga secara otomatis skor tersebut akan mendekati konstan, yang berarti tidak signifikan. Kemungkinan lainnya, mengapa tidak signifikan ialah karena IV berkorelasi tinggi terhadap IV lainnya, sedangkan IV yang baik adalah IV yang berkorelasi rendah terhadap IV lainnya. Selanjutnya, untuk hasil penelitian mengenai pengaruh variabel sikap dan kebiasaan belajar terhadap hasil belajar, hanya ada satu variabel yang mempengaruhi secara signifikan yaitu variable work methods, dengan nilai koefisien regresi sebesar 0,006, artinya variabel work methods secara positif mempengaruhi hasil belajar mahasiswa dan signifikan karena 0,010 < 0,05. Semakin tinggi work methods maka semakin tinggi hasil belajar mahasiswa. Hal ini sesuai dengan hasil penelitian terdahulu yang dilakukan oleh Sukadji (1996), Sutadji (1993), yang menyimpulkan bahwa ada pengaruh yang signifikan variabel work methods terhadap hasil belajar mahasiswa. Adapun variabel lain dari sikap dan kebiasaan belajar yang tidak signifikan namun mempunyai sumbangan yang signifikan adalah variabel delay avoidance. Variabel delay avoidance memberikan sumbangan sebesar 1,5% dalam varians hasil belajar mahasiswa. Sumbangan tersebut signifikan secara statistik karena Sig F Change = 0,022 < 0,05. Hal ini juga sejalan dengan penelitian Sukadji (1996) yang dalam penelitiannya menyebutkan bahwa hanya variabel delay avoidance dan work methods yang mempunyai sumbangan signifikan terhadap hasil belajar mahasiswa. Sedangkan variabel yang tidak signifikan terhadap hasil belajar mahasiswa adalah teacher approval dan education acceptance, ini sesuai dengan penelitian Sukadji (1996). Teacher approval dalam penelitian ini tidak signifikan dengan nilai koefisien sebesar -0,003, artinya variabel teacher approval secara negatif mempengaruhi hasil belajar mahasiswa tetapi tidak signifikan karena 0,217 > 0,05. Jadi, semakin tinggi teacher approval semakin rendah hasil belajar mahasiswa. Ini mungkin dikarenakan banyak mahasiswa yang mempunyai pandangan negatif terhadap kepengajaran dosen, terlihat dari item no 7, yang berbunyi “Para dosen saya berhasil membuat materi kuliah lebih menarik dan bermakna bagi saya”. Dari 350 responden, hanya 41 orang yang menjawab sangat sering (SS), dan 18 responden yang menjawab hampir selalu (HS), dan sisanya sebanyak 291 responden menjawab jarang (J), kadang-kadang (K), dan sering (S) yang pilihan tersebut tidak mempunyai nilai atau 0, yang berarti bahwa hanya 16,8% responden yang mempunyai pandangan positif terhadap kepengajaran dosen. Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
181
Variabel Education acceptance dalam penelitian ini tidak berpengaruh secara signifikan. Jadi, semakin tinggi education acceptance maka semakin tinggi hasil belajar mahasiswa. Apabila dilihat dari item no. 12 yang berbunyi “Walau saya tidak menyukai mata kuliah tertentu, saya berusaha untuk tidak mengabaikannya”. Dari 350 responden yang ada, hanya 121 responden yang memiliki sikap seperti item di atas, namun sisanya sebanyak 229 responden menjawab jarang (J), kadang-kadang (K), dan sering (S). Jadi kesimpulannya mengapa variabel education acceptance tidak signifikan, mungkin dikarenakan banyak mahasiswa yang mempunyai sikap negatif terhadap pendidikan. Variabel selanjutnya yang mempunyai pengaruh signifikan terhadap hasil belajar mahasiswa adalah lama belajar, dengan koefisien regresi 0,047, artinya variabel lama belajar secara positif mempengaruhi hasil belajar mahasiswa dan signifikan, karena 0,023 < 0,05 yang menyatakan, semakin lama mahasiswa belajar, maka semakin tinggi hasil belajarnya. Ini sesuai dengan pendapat Dalyono (2007) yang mengatakan bahwa salah satu faktor yang menentukan berhasil atau tidaknya seseorang dalam belajar adalah cara belajarnya, cara belajar yang dimaksud salah satunya adalah berapa lama waktu belajarnya. Adapun variabel demografis lainnya yang tidak signifikan adalah jenis kelamin. Ini sesuai dengan teori Ahmadi dan Supriyono (1991) yang mengatakan bahwa dari sekian banyak faktor yang mempengaruhi belajar, salah satunya adalah perbedaan jenis kelamin, namun dalam teorinya mengatakan ada bukti bahwa perbedaan tingkah laku antara laki-laki dan wanita merupakan hasil daripada perbedaan tradisi kehidupan, dan bukan semata-mata karena perbedaan jenis kelamin dan hingga pada saat ini belum ada petunjuk yang menguatkan tentang adanya perbedaan skill, sikap-sikap, minat, tempramen, bakat dan pola-pola tingkah laku sebagai akibat dari perbedaan jenis kelamin. Faktor demografis lainnya yang tidak signifikan adalah latar belakang sekolah, yang dalam penelitian ini menyimpulkan bahwa, mahasiswa/i yang berlatar belakang sekolah SMA/MA-IPA = SMA/MA-IPS = SMK = Bahasa = MA+Pesantren, yang berarti tidak terdapat perbedaan latar belakang sekolah terhadap hasil belajar mahasiswa. Keterbatasan peneliti dalam penelitian hasil belajar mahasiswa yang dipengaruhi independent variabel (motivasi mahasiswa, sikap dan kebiasaan belajar, dan faktor demografis) dalam penelitian ini adalah hanya memberikan sumbangan sebesar 7,2%, dengan yang paling besar sumbangannya serta signifikan secara statistik ialah pada variabel work methods sebesar 2%, dan terakhir lama belajar sebesar 1,4%, sedangkan sisanya sebesar 92,8% disumbangkan oleh variabel lain diluar penelitian ini seperti IQ, minat, persepsi mahasiswa terhadap kepengajaran dosen, motivasi berprestasi, latar belakang dosen dan variabel-variabel lainnya yang mempunyai pengaruh terhadap hasil belajar mahasiswa.
182
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
DAFTAR PUSTAKA
Ahmadi, A. & Supriyono, W. (1991). Psikologi belajar. Jakarta: PT Rineka Cipta. Anastasi, A. & Urbina, S. (2007). Tes psikologi. Jakarta: PT Indeks. Azwar, S. (1995). Sikap manusia teori dan pengukurannya. Yogyakarta: Pustaka Pelajar. Azwar, S. (1998). Tes prestasi fungsi dan perkembangan pengukuran prestasi belajar. Yogyakarta: Pustaka Pelajar. Chaplin, J.P. (2006). Kamus lengkap psikologi. Jakarta: PT Raja Grafindo Persada. Cote, J.E. & Levine, C. (1997). Student motivations, learning environments, and human capital acquisition: toward an integrated paradigm of student development. Journal of college student development. Vol. 38 No. 3 229-242. Crede, M. dan Kuncel, N.R. (2008). Study habits, skill, and attitudes. Journal Association for Psychological Science. Vol. 3 No. 6 425-434. Dalyono, M. (2007). Psikologi pendidikan. Jakarta: Rineka Cipta. Djamarah, S.B. & Zain, A. (2006). Strategi belajar mengajar. Jakarta: Rineka Cipta Febriany, R.E. (2011). Pengaruh gaya resolusi konflik dan tipe kepribadian big five terhadap kepuasan istri. Skripsi: UIN Syarif Hidayatullah Jakarta. Hakim, L. (2008). Perencanaan pembelajaran. Bandung: CV Wacana Prima. Hariyono. (2004). Studi tentang pengaruh motivasi berprestasi dan cara belajar terhadap hasil belajar siswa. Jurnal Cakrawala Pendidikan Vol. 6 No. 1 77-84. Mangkunegara, A.P. (2006). Evaluasi kinerja SDM. Bandung: PT Refika Aditama. Purwanto, M.N. (2007). Psikologi pendidikan. Bandung: PT Remaja Rosdakarya. Rasyid, H. & Mansur. (2008). Penilaian hasil belajar. Bandung: CV Wacana Prima. Saleh, A.R. (2008). Psikologi suatu pengantar dalam perspektif islam. Jakarta: Kencana. Santrock, J.W. (2008). Psikologi pendidikan. Jakarta: Kencana. Santrock, J.W. (2009). Psikologi Pendidikan. Jakarta: Salemba Humanika. Sevilla, C.G. dkk. (2006). Pengantar metode penelitian. Jakarta: UI-Press. Sukadji, S. (1996). Survei sikap dan kebiasaan belajar pada mahasiswa Psikologi Universitas Indonesia. Laporan penelitian Tahun Anggaran 1996/1997.
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012
183
Suralaga, F. & Solicha. (2010). Psikologi pendidikan. Ciputat: Lembaga Penelitian, UIN Syarif Hidayatullah Jakarta. Suryabrata, S. (2008). Psikologi pendidikan. Jakarta: PT Raja Grafindo Persada. Sutadji. (1993). Hubungan antara persepsi mahasiswa terhadap kepengajaran dosen, motivasi berprestasi, sikap dan kebiasaan belajar dengan prestasi belajar. Tesis: Universitas Indonesia. Syah, M. (2008). Psikologi pendidikan dengan pendekatan baru. Bandung: PT Remaja Rosdakarya. Tim Penyusun. (2010). Pedoaman akademik program strata 1 2010/2011. Ciputat: Uin Syarif Hidayatullah Jakarta. Uno, H.B. (2008). Teori motivasi dan pengukurannya. Jakarta: Bumi Aksara. Walgito, B. (2010). Bimbingan dan konseling (studi dan karier). Yogyakarta: CV Andi. Yufiarti. (2009). Buku ajar psikologi pendidikan. Jakarta: Fakultas Ilmu Pendidikan UNJ. Zulfiani, dkk. (2009). Strategi pembelajaran sains. Ciputat: Lembaga Penelitian UIN Jakarta.
184
Workshop and International Conference on Measurement and Evaluation in Education, September, 20th-22nd 2012