Psikometri Modul ke:
NORMA 2 Fakultas
Psikologi
Program Studi
Psikologi
www.mercubuana.ac.id
Arie Suciyana S., S.Si., M.Si.
Norma • Posisi/kedudukan seseorang dalam kelompok Æ patokan, acuan • Unit skala yang sama atau tidak, kasar-halus • Penggunaan norma tergantung tujuan tes. Misal: T-score untuk melihat perbedaan yang cukup halus (kecuali skor maksimal tes tidak terlalu besar, contoh:RS 0-30)
• Didasarkan pada suatu kelompok yang representatif mewakili populasi
2
NORMA • Hasil pengukuran psikologis = data (skor) / skor mentah / Raw score : • Raw score bisa berupa: • Jumlah soal yang dijawab benar • Jumlah waktu untuk mengerjakan soal • Jumlah jawaban yang mengindikasikan suatu ciri (jawaban “ya”) Æ tes kepribadian
3
Mengapa diperlukan Norma? • Raw Score (RS) yang dihasilkan dari pengukuran tidak mempunyai arti apa-apa karena masih harus dihubungkan dengan jumlah soal dan derajat kesulitan soal Contoh:Bambang • Pada tes Arithmatik 1, dapat RS 15 dari 60 soal • Pada tes Arithmatik 2, dapat RS 30 dari 40 soal • Pada tes Arithmatik 3, dapat RS 8 dari 10 soal Apa arti raw score di atas? Æ Tidak bisa langsung diinterpretasi karena tidak ada patokan nilai
4
Mengapa diperlukan Norma? • Pengukuran psikologis tidak mempunyai titik nol mutlak. Seseorang yang mendapat skor 80 tidak berarti 2 kali kemampuan skor 40 Æ selalu skala interval • Perbedaan raw score tidak mencerminkan jarak yang sesungguhnya antarindividu yang sesungguhnya • Untuk dapat dimaknai, raw score individu harus diubah ke dalam bentuk Norma Æ (raw score harus dikonversi menjadi scaled score/derived score)
5
PENGERTIAN NORMA • ‘… performance by defined group on particular test ‘ (Kaplan & Saccuzzo) • ‘……a set of values descriptive of the performance on a test on some specified group. Usually showed as a table giving equivalent values on some derived score for each raw score on a test’ (Lyman, 1971) • ‘…the test performance data of a particular group of testtakers that are designed for use as a reference when evaluating or interpreting individual test scores.’ (Cohen & Swerdlik)
6
PENGERTIAN NORMA • Penyebaran skor dari suatu kelompok standar yang dirancang sebagai acuan untuk mengevaluasi atau menginterpretasi skor yang diperoleh individu dalam suatu pengukuran. • Patokan yang dipakai untuk menilai hasil tes (raw score) seseorang. • Tidak harus dari kelompok peserta tes; bisa jadi dari teori yang digunakan. • Jika norma didapatkan dari jumlah sampel yang besar dan representatif, norma tersebut bisa digunakan untuk tes serupa.
7
Sampel harus merepresentasikan populasi Æ distribusi normal, tidak boleh skewed
Contoh tabel norma (tes Weschler)
9
FUNGSI NORMA • Menginterpretasikan skor yang diperoleh dari alat ukur • Membandingkan posisi individu dengan individu lain • Memaknai skor yang diperoleh individu dan membandingkannya dengan skor kelompok dalam tes yang sama • Mengambarkan kinerja individu di beberapa tes (intraindividu) • Menggambarkan kinerja tes dari sampel yang sudah terstandardisasi • Acuan untuk interpretasi/evaluasi skor
KELOMPOK STANDAR/NORMATIF • Representatif mewakili populasi • N cukup besar Æ semakin besar N, semakin stabil norma; karena penyebaran mendekati normal dan tidak dipengaruhi oleh faktor kebetulan • Sesuai dengan tujuan pengukuran 11
SCALED /CONVERTED SCORE • Untuk mengetahui posisi individu, Raw Score (RS) diubah ke dalam skor relatif / Scaled Score/Converted Score/Derived Score • Tujuannya: o Untuk menunjukkan posisi relatif individu dalam kelompok normatif, sehingga performa (skor) dapat dibandingkan dengan orang lain (Antar-individu) o Untuk memberikan ukuran yang memungkinkan perbandingan langsung performa (skor) individu pada berbagai tes yang berbeda( Intraindividu)
12
Cara umum untuk mengonversi RS • Norma perkembangan (Developmental norms) Æ bagaimana perkembangan individu dibandingkan dengan kelompok sampel tertentu • Norma Kelompok (Within Group Norms) Æ membandingkan skor tes dengan performa kelompok subyek pada tes 13
Cara umum mengkonversikan RS • Norma perkembangan (Developmental norms) Ada 3 macam : • Mental AgeÆ Umur • Grade Equivalents Æ Kelas • Ordinal Scale Æ Tahap perkembangan (Gesell, Piaget) • Norma Kelompok (Within Group Norm) 14
Cara umum mengkonversikan RS • Norma perkembangan (Developmental norms) • Norma Kelompok (Within Group Norm) Prestasi kelompok standardisasi ini dinyatakan dalam skala : • Persentil • Standard score: • Transformasi linear • Transformasi non linear Æ Normalized standard score; T-score, Stanine score, C score
15
DEVELOPMENTAL NORMS • Suatu cara untuk menafsirkan skor tes berdasarkan tingkat perkembangan pada domain tertentu. • Skor mentah yang dihubungkan dengan suatu norma perkembangan memperlihatkan sejauh mana perkembangan seseorang pada domain tersebut • Terdiri dari 3 macam: i. Mental Age, ii. Grade Equivalent, dan iii. Ordinal Scales
16
Mental Age • Yang menjadi norma adalah nilai rata-rata yang diperoleh kelompok umur sampel standar pada tes tersebut • Contoh terdapat pada skala Binet Simon o Item-item dikelompokkan menurut tingkat umur o Dalam tingkat umur 8 tahun terdapat item-item yang dapat dikerjakan oleh sebagian besar anakanak berusia 8 tahun pada sampel standar • Skor yang dicapai seseorang anak memperlihatkan tingkat umur perkembangannya
17
Mental Age • Skor yang dicapai seorang anak memperlihatkan tingkat umur perkembangannya • misal nilai rata-rata umur 8 tahun pada tes X = 23 • Jika seorang anak mendapat skor 23 maka MAnya = 8 →Kemampuan subyek setara dengan kemampuan anak usia 8 tahun 18
Mental Age Bentuk test • Soal soal dikelompokkan menurut tingkat umur. • Test Binet - Simon (1908): 3 th – 13 th • Soal soal untuk tingkat umur 7 th, adalah soal soal yang dapat dibuat oleh sebagian besar kelompok anak berumur 7 th (kelompok standardisasi) 19
Mental Age Cara menghitung MA • Hitung Basal Age (BA), yaitu usia tertinggi di mana pada usia itu dan di bawah usia tsb semua item tes dapat dijawab dengan benar • Hitung kredit tambahan, yaitu jumlah item yang dapat dijawab betul di atas Basal Age • MA = Basal age + Kredit tambahan • IQ = MA / CA x 100
20
Contoh Perhitungan MA Soal Umur Soal 2 Soal 3 Soal 4 1 6 + + + + 7 + + 8 + + 9 + + + 10 + + + 11 + + 12 -
Basal Age 6 tahun Setiap tanda + dihitung sebagai ¼ thn (3 bln)
Jadi MA = 6 + 12/4 = 9 Æ (12=jawaban benar setelah BA) Jika CA = 10.5 maka Æ IQ = 9 / 10.5 x 100 = 85,7 Æ 86 21
Kelemahan Mental Age • Satuan MA tidak konstan, cenderung mengecil / menyusut dengan meningkatnya usia Contoh : Anak usia 4 tahun IQ 75 = anak 12 tahun IQ 75 o Usia 4 tahun Æ 1 tahun keterbelakang mental o Usia 12 tahun Æ 3 tahun keterbelakang mental MA CA
= 3 = 4
IQ = 3/4 x 100 = 75
MA CA
= 9 = 12
IQ = 9/12 x 100 = 75
22
Grade Equivalents • Dipakai pada Educational Achievement Test • Skor subyek pada test ini ditafsirkan menurut kelas • Yang menjadi norma adalah nilai rata-rata yang diperoleh sampel standar dalam pelajaran tertentu Contoh: • Skor subyek pada test membaca setara dengan ratarata anak kelas 2 SD (skor 48) • Kemampuan membaca anak ini setara dengan kemampuan anak kelas 2 SD (GE 2) • Bentuk test : Soal-soal tidak dikelompokkan menurut kelas (hanya rata-rata skor di kelas tertentu)
Hal hal yang perlu diperhatikan dalam menginterpretasikan skor subyek : • Guru yang mengajar di setiap kelas berlainan; kecepatan dan mutu pengajaran juga berbeda • Yang menjadi norma untuk setiap kelas adalah nilai rata rata dalam kelas Æ Ada anak yang berprestasi di bawah dan di atas rata rata (outliers). • Jadi subyek yang mendapat skor lebih tinggi dari rata rata kelas belum berarti ia telah menguasai pelajaran kelas yang lebih tinggi • Kelompok standardisasi : murid murid dalam setiap kelas • Yang dijadikan norma kelas : Skor rata rata dari kelas pada test tersebut
24
Kelemahan Grade Equivalents Dapat terjadi salah interpretasi Contoh Grade Equivalent matematika seorang anak kelas V = 6,3 Ætidak berarti ia menguasai materi matematika kelas VI, karena belum menguasai proses aritmatika yang dipelajari di kelas VI. ÆNamun, kemampuannya lebih baik daripada kemampuan anak kelas V
25
Ordinal Scales • Tidak sama pengertiannya dengan skala ordinal dalam statistika yang merupakan salah satu skala pengukuran • Ordinal scale dibuat dengan tujuan menentukan fase/ tahapan perkembangan yang telah dicapai subyek pada suatu fungsi tingkah laku tertentu (locomotion, diskriminasi sensoris, bahasa, kognisi) 26
Ordinal Scales • Dibuat berdasarkan penelitian bahwa perkembangan fungsi-fungsi tingkah laku memperlihatkan pola urutan yang seragam dalam kebudayaan yang berbeda • Menjadi norma adalah perilaku yang khas (typical) dalam suatu fase Test Gesell , Test Piaget
27
ORDINAL SCALES CONTOH Gessel Development Schedules • Mengukur fungsi motorik, adaptif, dan bahasa • Usia 3 bulan Æ tengkurap • Usia 6 bulan Æ duduk • Usia 1 tahun Æ berjalan Piaget • Proses-proses kognitif • Object Permanence • Conservation
28
WITHIN GROUP NORMS • Suatu cara menafsirkan skor tes dengan membandingkannya dengan performa sekelompok subyek pada tes tersebut • Kelompok subyek = kelompok terstandardisasi • Subyek yang hendak dinilai dan kelompok standarisasi berasal dari populasi yang sama; kelompok standarisasi mewakili populasi 29
WITHIN GROUP NORMS (2) • Penilaian dilakukan dengan melihat kedudukan subyek dalam penyebaran skor kelompok • Kedudukan subyek dalam penyebaran kelompok standar menggambarkan kedudukan subyek dalam penyebaran populasi
30
WITHIN GROUP NORMS (3) • Contoh: Tes Wechsler Adult Intelligence Scale • Populasi : orang dewasa usia 16 s.d. 79 tahun • Norma : 16-19 thn, 20-24 thn, 25-34 thn, dst. • Buat norma warga Jakarta Æ harus Jakarta juga (tidak boleh dari pedalaman Papua, misalnya) • Sampel usia 16-19 tahun Æ harus proporsional mewakili populasi • Diberikan 11 subtest Æ cari penyebaran skor, mean, SD, dll
31
PERSENTIL • A percentile is a point on the measurement scale below which specified percentage of the cases in the distribution falls contoh: P50 = 23 Æ • The rank or percentile rank of a particular score is defined as the percentage of individuals n the distribution with scores at or below the particular value contoh: PR23 = 50 Æ skor 23 atau di bawahnya dicapai oleh 50 orang
32
PERSENTIL (1) • Menunjukkan posisi relatif seseorang dalam sampel standarisasi • Dianggap sebagai urutan dalam kedudukan suatu kelompok yang terdiri dari 100 orang, di mana yang lebih baik adalah subyek dengan nilai persentil yang lebih besar • Skor persentil adalah persentase dari jumlah orang yang berada di bawah skor mentah (raw score) tertentu
33
PERSENTIL (2) • Contoh: • 28% orang dari suatu kelompok berhasil mengerjakan lebih dari 15 soal dengan benar • Maka skor 15 berhubungan dengan persentil 28 • Persentil = % jumlah orang • Persentase skor = % jumlah item yang benar
34
PERSENTIL • Kelebihan • Mudah dihitung dan dimengerti oleh awam (hanya butuh data mentah, persentase, • Dapat digunakan secara universal • Sesuai untuk semua jenis tes dan kelompok sampel • Kekurangan • Tidak memiliki satuan/unit yang sama Æ cth: perbedaan skor di persentil 50 dan 45 belum tentu sama dengan skor di persentil 15 dan 20
35
STANDAR SCORE (SS) • Mengungkapkan jarak individu dari nilai mean dalam satuan standar deviasi (SD) distribusi skor tes • SS atau z-Score diperoleh dengan transformasi dari raw score 36
Linear/Nonlinear SS • Linear SS: bentuk distribusi SS sama dengan distribusi raw score • Nonlinear SS: bentuk distribusi SS berbeda dengan distribusi raw score karena distribusi RS diubah ke dalam distribusi normal (normalized) Æ ketika jumlah sampel besar dan mewakili populasi secara representatif Æ caranya bisa jadi dengan menambah item yang sulit/mudah (tergantung skewed ke arah mana)
CARA MENGHITUNG Z-SCORE • Buat distribusi frekuensi raw score • Hitung mean dan SD • Hitung z-Score dengan rumus:
z=
x-x SD 38
Evaluasi Standard Score • Kelebihan • Memiliki unit pengukuran yang sama • Kedudukan subyek dalam suatu kelompok standar tetap • Dapat memperbandingkan kemampuan subyek pada beberapa tes, atau kemampuan antarsubyek pada satu tes • Kekurangan • Memiliki nilai yang + dan – • Satuan ukurannya terlalu besar
39
STANDARD SCORES • Untuk mengatasi kelemahan tersebut: • Setiap nilai z dikalikan dengan suatu bilangan konstan • Kemudian tambahkan dengan bilangan tertentu • Misal z = -1 • Dikalikan dengan 10, ditambah dengan 50 • Maka z = (-1 x 10) + 50 = 40 Æ tidak akan ada nilai yang negatif
40
TRANSFER LANGSUNG Raw Score Æ Scaled Score
Xs =
(
Ss So
)Xo - [(
Xs = Standard Score Xo = Raw Score Xo = Mean RS Xs = Mean SS So = SD RS Ss = SD SS
Ss So
) Xo – Xs ]
41
T-SCALE • Diperkenalkan oleh W.A.McCall • Dipergunakan untuk mengatasi kelemahan dari standard score scale • Tanpa angka -, jangkauan skor/daerah populasi diperluas, distribusi normal • Mean = 50, SD = 10
42
CARA MENGHITUNG T-SCORE • Dengan menggunakan Tabel T 1. tentukan kelas interval 2. tentukan batas atas kelas 3. tentukan frekuensi 4. tentukan frekuensi kumulatif 5. tentukan proporsi kumulatif 6. cari nilai T melalui proporsi kumulatif dari masingmasing kelas pada table T 7. gambarkan titik-titik untuk merepresentasikan setiap nilai T 8. cari nilai T untuk masing-masing raw score 9. buat tabel yang memuat raw score dan T-Score
43
CARA MENGHITUNG T-SCORE •
Tanpa menggunakan Tabel T 1. s.d 5 sama dengan cara dengan menggunakan Tabel T 6. menentukan z-Score pada table B-Guilford berdasarkan proporsi kumulatif yang diperoleh 7. masukkan z-Score ke rumus z = (skor-mean)/SD dengan mean = 50, SD = 10
•
untuk pembuktian, cocokkan dengan tabel T
44
DOMAIN CRITERION-REFERENCED TESTING (CRT) • Yang menjadi patokan untuk menginterpretasikan adalah suatu content domain tertentu • Skor mengindikasikan seberapa jauh seserang menguasai keterampilan-keterampilan tertentu misalnya berhitung dan membaca • Content domain yang hendak diukur ditentukan oleh tujuan instruksional pendidikan, yaitu pengetahuan dan keterampialn apa yang harus dikuasai 45
SIFAT-SIFAT CRT • Content meaning • Apa yang dapat dilakukan subyek, apa yang mereka ketahui • Bukan bagaimana mereka jika dibandingkan dengan orang lain • Mastery Testing • Apakah individu/subyek dapat atau tidak mencapai derajat penguasaan tertentu • All or None
46
SIFAT RELATIF DARI NORMA • Skor tes tidak dapat diinterpretasikan terlepas dari nama tes (mengukur aspek/dimensi apa) serta skala dan sample yang dipakai dalam pembuatan norma • Tes Æ isi dari macam-macam tes berbeda-beda. Bahkan tes dengan nama yang sama isinya dapat berbeda • Skala Æ Skor IQ yang dipakai menggunakan skala apa? Ratio IQ? Deviatin IQ? Standard Score? Mean? SD? • Sampel Æ karakteristik sample? Tingkat pendidikan? Tempat tinggal?
47
SIFAT RELATIF DARI NORMA • Dapatkah derived score (misal IQ, Scaled Sore, TScore) dari tes yang berbeda saling diperbandingkan? • TIDAK Æ jika sample standarisasi dari tes-tes tersebut berlainan
48
Lowest 4%
Next 7% Next 12%
Stanine 1
Stanine 2
Next 17%
Middle 20%
Next 17%
Next 12%
Next 7%
Stanine Stanine Stanine Stanine Stanine Stanine 3 4 5 6 7 8
Highest 4%
Stanine 9
49
Lowest Next Next Next Next Middl 1% 3% 7% 12% 17% e 20%
Nex Next 12% t 17%
C=0
C= 6
C=1 C=2 C=3 C=4 C=5
Next 7%
Next 3&
Highest 1%
C = 7 C = 8 C = 9 C = 10
50
NORM REFERENCED vs CRITERION REFERENCE Norm: untuk memberikan perbedaan perfomrna antar dividu; performa individu tergantung performa orang lain Criterion-referenced: tidak bergantung pada orang lain, independen Æ Lengkapin dari Friedenberg!!!!
Norm-Referenced • Menghitung total skor penempuh tes • Mengonversi total skor
Criterion-Referenced Score • Disebut juga: content-, domain-, objective referenced • Skor individu mengindikasikan performa individu dalam domain tesnya dengan menggunakan kriteria perfect performance • Dalam dunia pendidikan digunakan untuk mengetahui materi yang telah dikuasai oleh siswa
Criterion-Reference Score • Proses Æ penyusun tes mengidentifikasi kriteria yang akan digunakan untuk membandingkan performa individu • Kriteria bisa berupa: • Optimum performance Æ penguasaan isi tes ( berapa yang dijawab dengan benar), fakta khusus, prinsip, keterampilan • Typical performance test --> Berdasarkan teori dan hypothetical mean
Criterion-Referenced Norm pada Optimum Performance Test Terdiri dari tiga tipe: • content-referenced score • objective-referenced score • pass/fail atau mastery score
1. Content-Referenced Score • Kriteria: Penguasaan individu terhadap keseluruhan materi • Cara hitung: persentase jawaban yang dijawab dengan benar (benar : seluruhnya x 100%)
Interpretasi skor individu dengan menghitung content-referenced score dipengaruhi oleh: 1. Representativeness dari item terhadap domain tingkah laku (content validity) 2. Tingkat kesukaran item
2. Objective Referenced Score • Menggunakan tujuan (objective) sebagai kriteria • Skor yang diperoleh: persentase objective yang dikuasi oleh individu • Individu dianggap menguasai objective ketika bisa menjawab item dengan benar dalam jumlah yang ditentukan • Rumit, namun secara teoritis dapat mengukur • Contoh: Ujian sekolah jaman sekarang (per indikator/TIU)
3. Pass/Fail or Mastery Scores • C-r score dapat digunakan untuk membagi penempuh tes menjadi dua kelompok: lulus atau tidak lulus • Ada batasan tertentu (ditentukan oleh penyusun tes) sebagai batasan kriteria kelulusan • Skor awal bisa berupa content-referenced atau objectivereferenced scores
Criterion-Referenced Norm pada Typical Performance Test 1.
Berdasarkan teori Æ misalnya berdasarkan kriteria diagnosis pada DSM-IV-TR
2.
Berdasarkan hypothetical mean Æ Menggunakan mean dari skala yang digunakan
Hypothetical Mean Misalnya: Pada tes empati • Menggunakan skala lichert (misalnya 1-6) • Tentukan median dari range skor item (misalnya 3) • Tentukan median dari range total skor atau all possible scores (misalnya 25)
Jika Budi mendapatkan skor 50 (hypothetical mean = 25), maka: Budi cenderung memiliki empati yang tinggi jika dibandingkan dengan ÆBisa juga dibagi dengan jumlah item (50:10 = 5), dia cenderung menjawab ‘setuju’ ÆPerolehan individu tidak lagi dibandingkan berdasarkan SD
Daftar Pustaka Cohen, R. J., & Swerdlik, M. E. (2010). Psychological testing and assessment: An introduction to test and measurement. (7th ed.). Boston: McGraw Hill. Field, A. (2009). Discovering statistics using SPSS. (3rd ed.). New York: SAGE Publications, Ltd. Kaplan, R.M. & Saccuzzp, D.P. (2009). Psychological testing: Principles, applications, and issues. California: Wadsworth Cengage Learning Urbina, S. (2004). Essentials of psychological testing. New York: John Wiley & Sons, Inc.
Terima Kasih Arie Suciyana S., S.Si., M.Si.