STATISTIKA DASAR
Oleh : Y. BAGUS WISMANTO
FAKULTAS PSIKOLOGI UNIVERSITAS KATOLIK SOEGIJAPRANATA SEMARANG 2007
DAFTAR ISI
I. PENDAHULUAN A. Apa Statistika Itu ? B. Pentingnya Penguasaan terhadap Statistika C. Konsep-konsep Dasar. 1. Variabel 2. Klasifikasi Variabel 3. Pengukuran 4. Kolom dan Baris 5. Pembulatan Bilangan 6. Notasi Statistika Soal Latihan
Halaman 1 1 2 2 3 4 7 8 9 9 14
II. DISTRIBUSI FREKUENSI A. Distribusi Frekuensi Tunggal B. Distribusi Frekuensi Bergolong C. Klas Interval, Batas Klas, Batas Nyata dan Titik Tengah D. Frekuensi Meningkat dan Menurun Soal Latihan
16 16 18 20 22 24
III. GRAFIK A. Histogram B. Poligon C. Ogive D. Grafik Model Lain Soal Latihan
25 25 27 27 28 30
IV. KECENDERUNGAN KE PUSAT A. Mode atau Modus B. Nilai Rata-rata C. Median D. Kurve dan Letak Nilai Rata-rata, Modus dan Median Soal Latihan
32 32 34 36 38 40
V. KUARTIL, DESIL DAN PERSENTIL A. Kuartil B. Desil dan Persentil C. Pemanfaatan Desil dan Persentil
42 42 43 48
VI. PENGUKURAN KERAGAMAN (VARIABILITAS) A. Rentang B. Simpangan
50 50 51
C. Rata-rata Simpangan D. Simpangan Baku dan Varians E. Angka Baku F. Angka Skala
52 53 55 57
VII. TEORI PROBABILITAS DAN DISTRIBUSI NORMAL A. Probabilitas B. Distribusi Normal
59 59 63
VIII. KORELASI DAN REGRESI A. Pengantar B. Model-model Relasi C. Persamaan Garis Lurus D. Korelasi E. Korelasi Jenjang F. Analisis Regresi G. Uji Signifikansi nilai r
65 65 66 68 69 73 76 78
IX. SAMPLING DAN DISTRIBUSI SAMPLING A. Cara-cara Penarikan Sampel B. Kesalahan Sampling C. Distribusi Rata-rata D. Kesalahan Baku
80 81 82 83 84
X. UJI HIPOTESIS : RATA-RATA DAN STATISTIK LAIN XI. KAI KUADRAT DAFTAR PUSTAKA LAMPIRAN
I. PENDAHULUAN
A. Apa Statistika itu ? Ada banyak ilmuwan yang mencoba mendefinisikan statistika. John W. Best dalam bukunya Research in Education (1983, 219) menyatakan : “statistics is a body of mathematical techniques or processes for gathering, organizing, analyzing and interpreting numerical data. Since research yields such quantitative data, statistics is a basic tool of measurement, evaluation and research”. Ferguson dan Takane (1989, 4) menyatakan “statistics is a branch of scientific methodology. It deals with the collections, classification, description and interpretion of data obtained by the conduct of survey and experiments. Its essential purpose is to describe and draw inferences about the numerical properties of populations . . . “. Kata statistik juga dipakai untuk menyatakan kumpulan fakta, umumnya berbentuk angka yang disusun dalam tabel dan atau diagram, yang menggambarkan suatu persoalan, seperti misalnya dalam kata-kata : statistik kelahiran, statistik pendidikan, statistik kesehatan maupun yang lainnya. Kata statistik juga mengandung pengertian lain, yakni dipakai untuk menyatakan ukuran sebagai wakil dari kumpulan data mengenai sesuatu hal, seperti misalnya penggunaan kata-kata persen dan rata-rata (Sudjana, 1986, 2). Harap dibedakan antara kata statistik seperti tersebut di muka dan statistika. Statistika adalah pengetahuan yang berhubungan dengan caracara pengumpulan fakta, pengolahan serta penganalisisan, penarikan kesimpulan serta pembuatan keputusan yang cukup beralasan berdasarkan fakta dan penganalisisan yang dilakukan. Tidak jauh berbeda dengan pengertian yang telah disebutkan di atas, adalah pendapat Hadi (1995, 1) yang menyatakan bahwa statistika adalah cara-cara ilmiah untuk mengumpulkan, menyusun, meringkas dan menyajikan data penyelidikan untuk kemudian menarik kesimpulan yang teliti dan keputusan-keputusan yang logik. Dari berbagai pendapat tersebut di atas maka dapat dirangkum pengertian bahwa statistika adalah : cara ilmiah untuk mengumpulkan, menyusun, meringkas, menyajikan data dan menarik kesimpulan.
2
B. Pentingnya Penguasaan terhadap statistika. Pengetahuan tentang statistika merupakan kemampuan yang disyaratkan untuk mahasiswa di berbagai disiplin ilmu seperti Ekonomi, Biologi, Pertanian, Kedokteran maupun Psikologi. Disiplin-disiplin ilmu yang pada awalnya merasa tidak memerlukan penguasaan terhadap statistikapun pada akhirnya mengharuskan mahasiswanya untuk paling tidak menguasai statistika yang sederhana seperti statistika deskriptif (rata-rata; rentang; median; persentil atau distribusi frekuensi dsb.), agar mahasiswanya kelak dapat membaca dan memahami kajian ilmiah. Pemahaman tentang statistika dirasakan lebih terasa penting di dalam masyarakat akademik, karena : 1. Pembicaraan-pembicaraan di dalam rapat-rapat, seminar maupun pertemuan lain banyak berkaitan dengan data dan menginterpretasikan data. 2. Banyak buku, artikel, journal maupun serial lain dalam penulisan dan laporan penelitiannya mempergunakan statistika, sehingga jika pembaca tidak menguasai statistika maka pemahamannyapun tidak optimal. 3. Bagi seorang mahasiswa, penguasaan terhadap statistika akan sangat membantu dalam kelancaran penyusunan tugas akhir atau skripsinya. C. Konsep-konsep Dasar. 1. Variabel Banyak kegiatan yang terjadi setiap hari, seperti misalnya seorang guru mengukur kemampuan bahasa murid-muridnya; seorang pelatih loncat jauh mencatat loncatan anak asuhnya; peternak ayam setiap hari mencatat produksi telur ayam-ayamnya; dan seorang manajer mengamati produktivitas karyawannya adalah kejadian atau aktivitas yang berlangsung setiap hari. Kemampuan bahasa, jauhnya loncatan, banyaknya telur tiap hari, produktivitas karyawan, itu semua disebut variabel. Ferguson dan Takane (1989) menyatakan “the term variabel refers to a property whereby the members of a group or set differ one from another” (variabel menunjuk pada suatu sifat/hal dimana anggota-anggota kelompoknya berbeda satu dengan yang lainnya). Anggota suatu kelompok mungkin adalah individual seperti pada contoh : kemampuan bahasa, jauhnya loncatan, produktivitas karyawan, dimana hasil yang diperoleh antara satu individu dengan yang lainnya adalah berbeda; dan mungkin pula Statistika. Y. Bagus Wismanto
2
3
berbeda secara kelompok seperti pada catatan produksi telur setiap hari dari sekelompok ayam yang berbeda dari hari ke hari. Produktivitas karyawan sendiri dapat dipandang sebagai variabel yang mempunyai perbedaan secara individual, tetapi juga dapat dipandang sebagai variabel yang mempunyai perbedaan secara kelompok, misalkan saja perbedaan produktivitas antara kelompok laki-laki dan perempuan. Contoh lain yang menunjukkan perbedaan kelompok adalah tingkatan sekolah (klas I, II dan III), usia (remaja dan dewasa), warna ruangan (biru, putih, ungu dsb), maupun suku bangsa (Jawa, Sunda, Batak dsb). Jika mengambil salah satu contoh, misalkan diambil dari catatan guru tentang kemampuan bahasa, maka dapat diperoleh : Tabel I.1. Kemampuan Bahasa Lima Orang Siswa Nama
Kemampuan bahasa
Amir
74
Badut
65
Choirul
82
Dugel
76 60
Endri
Dari contoh tersebut di atas maka kemampuan bahasa disebut sebagai variabel, akan tetapi angka 74, 65, 82, 76, dan 60 adalah skor atau nilai variabel, dan skor variabel yang dimiliki masing-masing individu adalah berbeda satu dengan yang lainnya. Skor-skor dari suatu variabel yang dimiliki sekelompok subyek ini biasa pula disebut sebagai data. Apabila data yang diperoleh kemudian dijadikan data untuk penelitian, maka disebut data penelitian. Dengan demikian dapat disimpulkan bahwa variabel adalah suatu substansi yang di dalamnya mengandung adanya perbedaan nilai (ada variasi) antara anggota-anggota substansi tersebut, baik secara individual maupun secara kelompok.
Statistika. Y. Bagus Wismanto
3
4
2. Klasifikasi Variabel. a. Diskrit dan Kontinyu (discrete/discontinuous dan continuous). Suatu variabel kontinyu dapat diambil dari nilai-nilai yang mempunyai rentang (range). Variabel kontinyu memiliki nilai yang berseri secara terus menerus. Antara dua nilai dalam variabel kontinyu tidak dapat ditentukan berapa banyak nilai-nilai yang mungkin ada (tergantung pada satuannya). Berat, tinggi, catatan waktu adalah contoh-contoh dari variabel kontinyu. Antara tinggi badan 160 dan 170 Cm. banyak sekali kemungkinan nilai-nilai diantaranya. Variabel diskrit hanya dapat diambil dari nilai-nilai spesifik saja, dan pasti. Jenis kelamin adalah laki-laki dan perempuan, dan tidak ada jenis kelamin lain diantara dua jenis kelamin tersebut. Jumlah anak dalam keluarga mungkin adalah 1, 2 atau 3 tetapi diantara nilai-nilai tersebut adalah tidak mungkin lagi. Tidak ada jumlah anak adalah dua setengah (2,5). Antara keluarga dengan anak 2 dan 8, kemungkinan yang ada adalah keluarga dengan jumlah anak 3, 4, 5, 6, atau 7. b. Nominal, Ordinal, Interval dan Rasio. 1) Variabel nominal. Variabel ini sama seperti variabel diskrit, yang ditunjukkan dari sifat anggota-anggotanya yang hanya dapat dikelompokkan sama atau berbeda (diklasifikasi), dan kalau berbeda dapat dimasukkan kedalam kategori secara pasti. Ciri-ciri khusus dari variabel nominal adalah : a) Nilai-nilai variabelnya berfungsi untuk pemberian “cap” atau “labelling” atau “identifikasi”, seperti pemberian nilai 0 pada jenis kelamin laki-laki dan 1 pada jenis kelamin perempuan. Pemberian nilai 0 dan 1 hanya untuk memberikan cap bahwa nilai 0 untuk mereka-mereka dengan jenis kelamin laki-laki dan nilai 1 untuk mereka-mereka dengan jenis kelamin perempuan. Dalam contoh suku bangsa maka dapat diberikan cap/label atau identifikasi : Suku Sunda = 1; Suku Batak = 2; Suku Ambon = 3 dst. b) Berkaitan dengan pemberian angka/nilai sebagai cap tersebut di atas, maka pemberian nilai tidak mempunyai perbedaan kualitatif maupun kuantitatif. Jenis kelamin lakilaki = 0 bukan berarti laki-laki lebih rendah kualitas maupun kuantitasnya bila dibandingkan Statistika. Y. Bagus Wismanto
4
5
dengan jenis kelamin perempuan yang diberi nilai 1, yang tampaknya mempunyai nilai lebih tinggi. Oleh karena itu pemberian nilai sebagai cap dapat dibalik, sehingga laki-laki = 1 dan perempuan = 0, dan artinya sama saja. c) Oleh karena pemberian nilai hanya bersifat cap/label saja, maka nilai-nilai tersebut tidak dapat dijumlahkan, dibagi, dikurangkan ataupun dikalikan. Berkaitan dengan contoh suku bangsa, maka tidak dapat dijumlahkan 1 + 2 = 3 atau 1 (Suku Sunda) + 2 (Suku Batak) = 3 (Suku Ambon). d) Dari pemberian cap tersebut, maka dipergunakan untuk mengelom-pokkan dan menghitung berapa jumlah yang bertanda nilai 0 dan berapa yang bertanda 1. Banyaknya subyek dengan cap 0 menunjukkan banyaknya subyek laki-laki dan jumlah subyek dengan cap 1 menunjukkan banyaknya subyek perempuan. 2) Variabel Ordinal. Dalam suatu lomba lari disebutkan bahwa juara 1 adalah Ali, juara ke 2 adalah Badut dan juara ke 3 adalah Codet. Dari contoh tersebut diketahui bahwa 1, 2, dan 3 adalah urutannya (ordernya), tetapi selisih kecepatan lari antara juara ke 1 dengan juara ke 2 maupun selisih kecepatan lari antara juara ke 2 dengan juara ke 3 adalah tidak diketahui. Ada kemungkinan selisih antara juara ke 1 dengan juara ke 2 adalah hanya 0,4 detik, akan tetapi selisih antara juara ke 2 dengan juara ke 3 kemungkinan adalah 10 detik. Namun demikian, bagaimanapun juga orang ke tiga yang masuk finish tetap menduduki urutan atau ranking ke 3. Pada kenyataanya Ali, Badut dan Codet adalah juara I, II, dan III. Oleh karena itulah kita sadari bahwa nilai variabel ordinal berfungsi untuk penjenjangan (ranking) dan pengurutan (ordering). Ali di jenjang/diurutan pertama karena mencapai garis finish yang tercepat, Badut di jenjang kedua dan Codet dijenjang ketiga karena mencapai garis finish setelah Ali dan Badut. Contoh lain misalnya ada seorang pengamat yang mengukur tinggi badan memperoleh hasil : si A = 158, si B = 182, si C = 165, dan si D = 150. Telah diketahui bersama bahwa tinggi badan adalah variabel kontinyu, akan tetapi pengamat tersebut dapat juga mengadakan modifikasi dengan membuat pengurutan (ordering) atau penjenjangan (ranking), sehingga hasilnya adalah sebagai berikut :
Statistika. Y. Bagus Wismanto
5
6
Tabel I.2. Tabel Tinggi Badan Subyek si A Si B Si C Si D
Tinggi Badan 158 182 165 150
Urutan 3 1 2 4
Dari contoh tersebut di atas maka diketahui bahwa perbedaan nilai ordinalnya menunjukkan ada perbedaan urutan atau jenjang saja, akan tetapi perbedaan besaran kuantitatif antar nilai adalah tidak diketahui (jika tidak melihat nilai originalnya) dan tidak sama besar. Perbedaan kuantitatif urutan 1 (satu) dan 2 (dua) (182 dengan 165) adalah tidak sama dengan perbedaan kuantitatif urutan 2 (dua) dan 3 (tiga) (165 dengan 158). Oleh karena itu terhadap nilai-nilai variabel ordinal hanya dapat diterapkan notasi “sama” (=); “lebih besar” (>); atau “lebih kecil” (<). 3) Variabel interval. Variabel ini mempunyai kemungkinan untuk menyatakan perbedaan angka yang mempunyai perbedaan kuantitatif secara konstan. Jarak antara nilai 2 dan 5 sama persis dengan jarak antara 14 dan 17. Oleh karena itu dapat dikatakan bahwa jarak/interval antara dua angka yang berturutan adalah konstan/tetap besarnya. Namun perlu disadari bahwa dalam variabel interval tidak dimiliki “true zero point”. Variabel ini dapat pula dikenai operasi hitung “penambahan” (+); maupun “pengurangan” (-). Sebagai contoh, seorang siswa yang memperoleh nilai 0 dalam suatu ulangan mata pelajaran tertentu, maka tidak dapat diartikan bahwa siswa tersebut sama sekali tidak memiliki pengetahuan tentang pelajaran yang diujikan. 4) Variabel rasio. Nilai rasio adalah nilai yang memiliki kualitas yang paling tinggi yang mungkin dimiliki oleh suatu variabel, karena nilai rasio memiliki semua kualitas yang dimiliki oleh nominal, ordinal dan interval, bahkan nilai rasio memiliki nilai nol mutlak dan dapat dikenai semua operasi hitung. Hal ini memungkinkan bahwa nilai suatu substansi mungkin adalah dua kali atau tiga kali yang lain secara persis. Banyak pengukuran Statistika. Y. Bagus Wismanto
6
7
terhadap variabel-variabel pisik yang memiliki nilai rasio, seperti panjang atau berat. Penggaris yang mempunyai panjang 20 Cm benar-benar dua kali lipat dari penggaris yang panjangnya 10 Cm. Seseorang yang diberi Rp 0,- maka orang tersebut benar-benar tidak mendapat uang sama sekali. 3. Pengukuran Untuk mengetahui kemampuan berhitung seorang anak maka tidak dapat diketahui hanya dengan mengamati, dengan melihat orangnya saja. Untuk mengetahui kecepatan lari seseorang, juga tidak dapat hanya dengan mengamati saja. Apalagi bila ingin mengetahui kestabilan emosi, sikap, bakat atau tingkat empati, itu semua tidak dapat diketahui hanya dengan melihat. Akan tetapi diyakini bahwa emosi, sikap, bakat maupun empati adalah “ada”, dan segala yang ada tentu ada pula dalam “kuantitas” atau “besaran” tertentu, dan sesuatu yang ada dalam kuantitas tertentu, tentu “dapat diukur”. Kemampuan berhitung seorang anak dapat diketahui setelah diberikan soal-soal berhitung pada anak tersebut, diminta untuk menyelesaikannya dan mengetahui berapa soal yang betul dan seberapa cepat dia menyelesaikan persoalan yang diberikan. Untuk mengetahui kecepatan lari seseorang, dapat dengan cara meminta orang tersebut untuk berlari dari satu titik ke titik lain (misalkan berjarak 100 meter) dan dicatat kecepatan atau waktu yang dibutuhkan untuk menempuh jarak tersebut. Dari contoh tersebut di atas disadari bahwa pengukuran dalam bidang psikologi tidak bersifat langsung, karena substansi yang hendak diukur adalah “tidak kasat mata” atau tidak dapat dilihat oleh mata secara langsung. Karakteristik manusia yang tidak kasat mata inilah yang disebut sebagai construct. Oleh karena tidak kasat mata, maka dibutuhkan stimulus agar seseorang bereaksi terhadap stimulus, dan reaksinyalah yang menjadi informasi untuk ditafsirkan. Dalam hal tersebut di atas stimulus yang dimaksud adalah soal berhitung, dan titik start serta titik finish berlari. Setelah diketahui reaksi atau respon seseorang terhadap stimulus, maka dicoba untuk dikuantifikasikan, dan pada umumnya dengan sistem skala. Sistem skala ini sebenarnya tidak diketahui secara pasti satuan Statistika. Y. Bagus Wismanto
7
8
ukurannya. Oleh karena itu ketika si Abas mendapat skor 25 dan si Badu mendapat skor 50 bukan berarti kemampuan si Badu adalah dua kali lipat kemampuan si Abas dalam substansi yang diukur tersebut (kemampuan berhitung). Penting untuk dicatat adalah : a. Perlu diasadari adanya variasi stabilitas terhadap constructconstruct psikologi yang ada. Anak yang mendapat skor 25 dalam kemampuan berhitung, kemampuan berhitungnya dapat berkurang karena proses lupa dan kurangnya latihan, atau sebaliknya kemampuannya dapat bertambah karena adanya proses belajar dan latihan. Ada construct psikologi yang relatif lama berubah (sikap misalnya), akan tetapi ada pula construct psikologi yang cepat berubah, misalnya emosi manusia. b. Perlu disadari bahwa setiap hasil pengukuran psikologi selalu mengandung adanya kesalahan hasil pengukuran (error). Teori tes klasik (True Score Classical Theory) menyebutkan bahwa obtained score (raw score) atau skor yang diperoleh dari pengukuran sebenarnya terdiri dari true score dan error score. Akan tetapi error score selalu diusahakan untuk dikontrol, atau diketahui besarannya yaitu dengan estimasi validitas dan reliabilitas. 4. Kolom dan Baris. Berikut ini adalah skema garis besar untuk sebuah tabel dengan nama-nama bagiannya : Tabel I.3 Penunjukan Kolom dan Baris Judul Kolom I (B1) Judul Baris I (A1) Judul Baris II (A2) Judul Baris III (A3)
Judul Kolom II (B2)
Sel A1, B1 (Baris 2, Kolom 2)
Judul Kolom III (B3) Sel A1, B3 (Baris 2, Kolom 4)
Sel A1, B2 (Baris 3, Kolom 3) Sel A3, B3 Baris 4, Kolom 4)
Keterangan :
Statistika. Y. Bagus Wismanto
8
9
Keterangan tabel pada umumnya diletakkan di bagian bawah tabel. Pada Umumnya memberikan keterangan terhadap kolom dan baris. 5. Pembulatan Bilangan. Ada beberapa aturan dalam pembulatan bilangan yang harus diketahui : a. Jika angka terkiri yang hendak dihilangkan adalah lebih kecil dari angka lima (<5) maka angka didepan angka tersebut atau angka terkanan yang mendahuluinya tidak berubah. Sebagai contoh, angka 4024 jika hendak dibulatkan ke angka terkecil puluhan, maka angkanya setelah dibulatkan menjadi 4020. Uang sebesar Rp 55423,- jika dibulatkan sampai ke nilai ribuan rupiah, maka menjadi Rp 55000,b. Jika angka terkiri yang hendak dihilangkan lebih dari angka lima atau angka lima tetapi diikuti angka satu atau lebih, maka angka didepan angka yang hendak dihilangkan atau angka terkanan yang mendahuluinya bertambah satu. Sebagai contoh, angka 5,662 jika dibulatkan ke satuan menjadi 6. Berat 70,51 Kg jika dibulatkan ke satuan Kilogram menjadi 71 Kg. c. Jika angka terkiri dari angka yang hendak dihilangkan hanya angka 5 atau angka 5 tetapi diikuti angka nol, maka angka terkanan dari angka yang mendahuluinya tetap, jika ia adalah angka genap, akan tetapi bertambah satu jika ia adalah angka ganjil. Sebagai contoh, angka 6,5 jika dibulatkan tetap 6; demikian pula 8,50 jika dibulatkan menjadi 8. Akan tetapi angka 75 jika dibulatkan menjadi 80. 6. Notasi Statistika Di dalam buku-buku statistika banyak dipergunakan simbol-simbol atau notasi yang mewakili suatu bilangan, kelompok bilangan atau pengertian tertentu. Kemampuan mempergunakan notasi atau simbolsimbol statistik dan kemampuan melakukan operasi aljabar sederhana akan sangat membantu di dalam usaha untuk mempelajari statistik. a. Simbol variabel.
Statistika. Y. Bagus Wismanto
9
10
Suatu kelompok skor, nilai, hasil pengukuran atau hasil observasi dari suatu variabel disimbolkan X1; X2; X3; . . . ; XN atau Y1; Y2; Y3; . . . ; YN, dimana “N” menunjukkan jumlah subyek. Perlu dicatat, bahwa terkadang untuk menunjukkan jumlah subyek, ada pula dalam buku yang berbeda dipergunakan simbol “s” (huruf kecil). Huruf-huruf lain sebagai simbol ada kalanya juga dipergunakan
sebagai pengganti “X” atau “Y”.
Sebagai
contoh diperoleh skor hasil lompat tinggi siswa/i klas 3 sebuah SMP, maka simbol X1 menunjukkan tinggi lompatan subyek yang pertama, X 2 menunjukkan tinggi lompatan subyek yang ke dua, X 3 menunjukkan tinggi lompatan subyek yang ke tiga dan seterusnya hingga XN yang menunjukkan tinggi lompatan yang ke N, dan jika jumlah subyek adalah 40, maka XN adalah X40 yang menunjukkan tinggi lompatan subyek yang ke 40. Contoh dengan data : diandaikan ada lima orang yang dicatat tinggi lompatannya yaitu 140, 145, 142, 150 dan 146 maka X1 = 140; X2 = 145; X3 = 142; X4 = 150 dan X5 = 146. Untuk menyimbolkan skor suatu variabel ditulis X i dimana “I” mewakili suatu subyek dari 1 sampai dengan N, Simbol-simbol “J” dan “K’ juga sering dipergunakan untuk menggantikan simbol “N” sebagai subskrip (simbol yang dicetak agak kebawah). b. Penjumlahan suatu variabel. Penjumlahan sekelompok data, misalkan X1 + X2 + X3 + . . . + XN N
dapat diwakili dengan notasi ∑ X i i =1
N
maka
∑ X i = X 1 + X 2 + X 3 +...+ X N
i =1
Dari persamaan tersebut dapat dijelaskan sebagai berikut : Σ adalah huruf Yunani (baca : sigma) dan menunjukkan pada operasi penjumlahan. Ruas sebelah kiri tanda “=“ dari persamaan tersebut di atas dapat dibaca : “ sigma Xi dimana I dari 1 sampai dengan N, yaitu penjumlahan dari X yang pertama sampai dengan X yang terakhir (ke N). 5
∑ Xi
berarti penjumlahan Xi dari X yang pertama sampai dengan X ke
i=1
5. 10
∑ Xi
berarti penjumlahan Xi dari X yang ke 6 sampai dengan X ke 10.
i= 6
Statistika. Y. Bagus Wismanto
10
11
Jika 140, 145, 142, 150 dan 146 adalah hasil pengukuran tinggi lompatan dari lima orang subyek, maka jumlah dari lima pengukuran tersebut adalah 140 + 145 + 142 + 150 + 146 = 723 atau dapat dinotasikan
5
∑ X i = 723 i=1
Meskipun sudah ada notasi yang jelas, namun pada prakteknya notasi tersebut tidak ditulis secara lengkap dan hanya ditulis ΣXi atau ΣX saja.
Statistika. Y. Bagus Wismanto
11
12
c. Peraturan-peraturan Notasi Penjumlahan. Terdapat tiga peraturan baku/prinsip yang biasa digunakan untuk notasi penjumlahan, yaitu : 1). Prinsip I : “Penjumlahan dari perkalian suatu bilangan tetap/konstan (constant number = c) dengan suatu variabel, adalah sama dengan perkalian antara bilangan tetap itu dengan penjumlahan skor atau nilai-nilai variabel itu”. N
∑ cX i = cX 1 + cX 2 + cX 3 +...+ cX N
i =1
= c( X 1 + X 2 + X 3 +...+ X N ) N
= c∑ X i i =1
Contoh : Misalkan terdapat lima buah skor hasil suatu observasi : 20, 21, 18, 19 22 dikalikan dengan bilangan tetap/konstan 6 maka hasilnya adalah : 5
∑ 6 X i =(6 X 20) + (6 X 21) + (6 X 18) + (6 X 19) + (6 X 22)
i =1
= 6(20 + 21 + 18 + 19 + 22) = 6 X 100 = 600 5
sedangkan ∑ X i sendiri adalah 100. i =1
2). Prinsip II : “Penjumlahan bilangan tetap (c) sebanyak N buah, adalah sama dengan Nc”. N
∑ ci = c1 + c2 + c3 +...+ c N = Nc
i =1
Contoh : Misalkan bilangan tetapnya adalah 6 dan sebanyak 5 buah, maka : 5
∑ 6 = 5 X 6 = 30
i =1
3). Prinsip III : “Penjumlahan dari jumlah beberapa variabel adalah sama dengan penjumlahan dari jumlah itu secara sendiri-sendiri”.
Statistika. Y. Bagus Wismanto
12
13
N
∑ ( X i + Yi + Z i ) = X 1 + Y1 + Z 1 + X 2 + Y2 + Z 2 +...+ X N + YN + Z N
i =1
N
N
N
i =1
i =1
i =1
= ∑ X i + ∑ Yi + ∑ Z i
Contoh : Misalkan empat subyek dites pada dua variabel yang berbeda dan dihasilkan skor : 5, 6,12, 15 untuk variabel X dan 2, 3, 7, 10 untuk variabel Y, maka hasilnya adalah : 4
∑ X i Yi = (5 X 2) + (6 X 3) + (12 X 7) + (15 X 10) = 262
i =1
d. Notasi untuk Distribusi Frekuensi. Distribusi frekuensi pada umumnya digambarkan dalam tabel sebagai berikut : Xi
fi
X1
f1
X2 X3
f2 f3 . . . fk
. . . Xk
Simbol k menunjuk pada jumlah skor/nilai-nilai yang berbeda dari Xi da fi dimana “i” bergerak dari 1 sampai dengan k. Penjumlahan variabel ditulis : N
k
i =1
i =1
∑ X i = ∑ f i X i = f 1 X 1 + f 2 X 2 + f 3 X 3 +...+ f k X k
Meskipun data dikumpulkan dari “N” subyek akan tetapi skor subyek digolongkan ke dalam “k” kelompok/klas interval, dengan frekuensinya f 1, f2, f3, . . . , fk.
Statistika. Y. Bagus Wismanto
13
14
Untuk mendapatkan gambaran yang lebih jelas dapat diambil contoh dari skor-skor sebagai berikut : 1, 1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 5. Dari skorskor tersebut di atas, N=15 dan
15
∑ X i = 47 .
i =1
Data tersebut dapat disusun ke dalam distribusi frekuensi sebagai berikut : Xi
fi
fiXi
1 2 3 4 5
3 2 4 2 5
3 4 12 8
15
47
20
Tabel tersebut di atas menunjukkan bahwa skor 1 ada 3 buah; skor 2 ada 2 buah; skor 3 ada 4 buah; skor 4 ada 2 buah dan skor 5 ada 5 buah. Jumlah subyek ada 15, sedangkan jumlah hasil perkalian antara skor dengan frekuensi adalah 47.
Statistika. Y. Bagus Wismanto
14
15
Soal-soal Latihan : 1. Tulislah soal berikut ke dalam notasi penjumlahan : a. Y1 + Y2 + Y3 + . . . + YN b. (X1 + Y1) + ( X2+ Y2) + (X3 + Y3) + . . . + (X7 + Y7) c. X1Y1 + X2Y2 + X3Y3 + . . . + XNYN d. (Y1 + c) +_ (Y2 + c) + (Y3 + c) + . . . + (Y8 + c) e. X1/c + X2/c + X3/c + . . . + XN/c 2. Tulislah notasi berikut ini secara lengkap : 9
a.
5
∑ Xi
b.
i =1
∑ ( X i + Yi ) i =1
i
i
i =1
4
c.
∑X Y
6
d.
∑X
i
+ 4c
i =1
3. Jawablah beberapa pertanyaan berikut ini dengan pilihan jawaban : a. Nominal b. Ordinal c. Interval d. Rasio 1) Kecepatan mobil per jam 2) Banyaknya jumlah mahasiswa pada suatu perguruan tinggi. 3) Banyaknya kecelakaan setiap hari 4) Angka meteran listrik di rumah 5) Penilaian dosen dalam huruf 6) Nomor punggung pemain sepakbola
Statistika. Y. Bagus Wismanto
15
II. DISTRIBUSI FREKUENSI.
Data yang dikumpulkan dari suatu penelitian, baik itu suatu eksperimen maupun survey, kemungkinannya dalam bentuk angka-angka dan kemungkinan lain adalah dalam bentuk suatu uraian. Untuk lebih memudahkan dalam memahami data yang diperoleh maka kumpulan data tersebut perlu disusun, diringkas, diklasifikasikan yaitu dalam bentuk distribusi frekuensi (ingat : diantara tugas statistik adalah meringkas dan menyusun). A. Distribusi Frekuensi Tunggal. Jika dilemparkan sebuah mata uang sebanyak sepuluh kali dan dicatat hasilnya (singkatan G = Gambar pada mata uang dan singkatan A = Angka yang menunjukkan nilai rupiahnya), diperoleh : G, A, G, G, G, A, A, G, G, A. Cukup sulitlah untuk ditarik suatu kesimpulan dari undian tersebut. Hal ini terjadi karena belum diolah, diringkas dan disajikan secara baik. Bandingkan jika data telah disusun sebagai berikut : Tabel II.1. Distribusi Frekuensi Undian Mata Uang Variabel (X) G A Jumlah
Jari-jari/Tally IIIII I IIII -
Frekuensi (f) 6 4 10
Contoh yang berikutnya, misalkan dari hasil ujian matematika klas 3 suatu sekolah lanjutan diperoleh hasil sebagai berikut : 9 8 7 8 5
6 5 4 6 5
4 7 8 6 6
7 6 6 7 6
4 8 6 8 5
9 7 9 7 5
Seperti halnya pada contoh kasus undian mata uang tersebut di atas, maka cukup sulitlah bagi seorang guru untuk menarik kesimpulan dari hasil ujian matematuka tersebut. Dari sebaran data cukup sulit untuk melihat
17
berapa siswakah yang tidak lulus dan perlu perhatian secara khusus, berapa orang yang memperoleh nilai memuaskan dan sebagainya. Untuk membantu guru, maka dapat disusun ke dalam sebuah distribusi frekuensi dengan nilai tunggal atau distribusi frekuensi tunggal. Untuk proses penyusunannya maka ditempuh dengan cara : 1. Temukan rentangnya, yaitu selisih nilai/skor terendah dengan nilai/skor tertingginya. Nilai terrendah adalah 4 dan nilai tertinggi adalah 9, dan nilainilai diantara keduanya adalah 5, 6, 7, dan 8. Dengan mengetahui rentang, maka diketahui pula batas paling atas dan batas paling bawah nilainya, dan pastilah tidak akan ada nilai yang tidak tercakup dalam tabel yang disusun nanti. Pada umumnya nilai tertinggi diletakkan di bagian atas, akan tetapi dalam hal-hal tertentu ada pula yang meletakkan nilai rendah di bagian atas. 2. Setelah nilai disusun dari atas ke bawah maka dapat dihitunglah anggota setiap nilai dengan perhitungan jari-jari/tally. 3. Dengan terhitungnya seluruh anggota kelompok, maka dapat diketahui jumlah anggota setiap nilai atau frekuensi setiap nilai. Tabel II.2. Hasil Ujian Matematika Klas III SMU Nilai (X) Jari-jari/Tally 9 8 7 6 5 4 Jumlah
III IIIII IIIII I IIIII III IIIII III -
Frekuensi (f) 3 5 6 8 5 3 30
Setelah di susun dalam suatu distribusi frekuensi tunggal seperti tersebut di atas, maka sangat memudahkan bagi guru untuk mengambil keputusan dan sikap. Guru akan mengetahui bahwa ada 3 siswa yang masih harus diperhatikan kemampuannya yaitu mereka yang mendapat nilai 4, sedangkan mereka yang berada dibawah nilai 6 ada 8 siswa. Lebih jauh lagi guru tersebut juga dapat menarik kesimpulan bahwa sebagian besar Statistika. Y. Bagus Wismanto
17
18
siswa menguasai matematika, karena 22 siswa dari 30 siswa dapat dinyatakan lulus atau menguasai matematika. Dalam penyajiannya secara resmi, distribusi frekuensi tidak menyertakan kolom jari-jari, karena kolom itu sebenarnya hanya pertolongan untuk menghitung frekuensi agar lebih teliti. Dengan demikian, pada akhirnya kolom nilai langsung diikuti kolom frekuensi. B. Distribusi Frekuensi Bergolong. Distribusi frekuensi tersebut di atas oleh karena kolom nilai hanya berisi 1 (satu) nilai saja, maka umum menyebut sebagai distribusi frekuensi tunggal. Distribusi frekuensi ini sangat sulit untuk diterapkan pada suatu distribusi dengan sebaran nilai (range) yang begitu lebar. Sebagai contoh dapat diambil dari hasil pengukuran tinggi badan 50 siswa dari sebuah Sekolah Menengah Umum, yang hasilnya adalah sebagai berikut: 170 168 183 158 165
138 165 149 162 170
186 166 156 166 169
150 145 131 174 159
152 136 135 138 168
162 143 134 149 165
154 167 161 168 135
147 163 178 173 146
159 155 148 172 154
158 172 157 158 168
Dari sebaran mentah tersebut di atas maka diketahui bahwa rentang (range) nya adalah sangat lebar yaitu R = 186 - 131 = 55. Dengan demikian bila distribusi frekuensi yang dibuat adalah distribusi frekuensi tunggal, maka dibutuhkan paling tidak 55 baris dengan konsekuensi diantara nilai yang ditulis terdapat beberapa nilai yang tidak memiliki frekuensi, seperti tergambarkan di bawah ini :
Statistika. Y. Bagus Wismanto
18
19
Tabel II.3 Distribusi Frekuensi Tunggal Siswa/i SMU Nilai (X) 186 185 184 183 182 181 180 179 178 177 176 175 174 173 172
f
Nilai (X)
f
1 0 0 1 0 0 0 0 1 0 0 0 1 1 2
171 170 169 168 167 166 165 164 163 162 161 160 159 158 157
0 2 1 4 1 2 3 0 1 2 1 0 2 3 1
Nilai (X) 156 155 154 153 152 151 150 149 148 147 146 145 144 143 142
f 1 1 2 0 1 0 1 1 1 2 1 1 1 1 0
Nilai (X) 141 140 139 138 137 136 135 134 133 132 131 ---------Jumlah
f 0 0 0 2 0 1 2 0 0 0 1 ---50
Untuk mengatasi hal tersebut di atas, maka untuk penyusunan dan peringkasan data digunakanlah suatu distribusi dengan penggolongan, yang biasa disebut sebagai distribusi frekuensi bergolong, karena menggunakan klas-klas interval sebagai penggolongan. penyusunannya sebagai berikut :
Sedangkan
tata
cara
1. Tentukan jumlah klas intervalnya. Klas interval pada umumnya antara 5 sampai dengan 20 klas. Yang penting adalah klas interval harus mencakup seluruh rentang nilai. Sebagai contoh, jika nilai terrendah dalam suatu kelompok data adalah 2 dan nilai tertinggi adalah 38, maka jumlah klas intervalnya dapat ditentukan 13 dengan pengandaian lebar klas interval adalah 3. Seandainya dihitung rentangnya maka didapatkan R = 38 - 2 = 36, sedangkan cakupan intervalnya adalah 3 kali 13 = 39. Dengan demikian tidak ada nilai atau skor yang tidak tercakup dalam klas interval. 2. Lebar klas interval yang umum dipakai adalah 1, 3, 5, 10 atau 20 nilai. 3. Klas interval dengan nilai tinggi pada umumnya diletakkan di bagian atas. Mulailah penyusunan klas interval, dimana nilai teratas menjadi nilai Statistika. Y. Bagus Wismanto
19
20
tertinggi. Cara lain adalah dengan pertimbangan penggunaan bilangan kelipatan lebar klas intervalnya. Sebagai contoh, jika ditentukan lebar klas intervalnya adalah 5 (lima), maka klas intervalnya dapat dimulai dengan 5, 10, 15, 20, 25 dan selanjutnya. Jika lebar klas intervalnya adalah 10, maka klas interval dapat dimulai dengan bilangan 10, 20, 30, 40, dst. atau 11, 21, 31, 41 dst. 4. Setelah klas-klas interval tersusun, teliti sekali lagi apakah nilai terrendah dan nilai tertingginya tercakup dalam seluruh klas interval. 5. Mulailah menghitung frekuensi setiap klas interval. Dengan cara tersebut di atas, maka data tentang tinggi badan siswa/i SMU tersebut di atas dapat disusun distribusi frekuensi bergolong. Dari data yang ada dapat diperoleh rentang (R = 186 - 131 = 55). Jika ditentukan lebar klas interval 10, maka dapat disusun 6 klas interval, dan klas-klas interval ini dapat mencakup 6 kali 10 = 60 nilai. Dengan demikian sebaran seluruh data dapat tercakup dalam klas interval. Hasilnya adalah sebagai berikut : Tabel II.4 Distribusi Frekuensi Bergolong Siswa/i SMU Klas Interval 180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139
Jarijari/Tally II IIIII II IIIII IIIII IIIII IIIII IIIII II IIIII III IIIII I
Jumlah
Frekuensi (f) 2 7 15 12 8 6 50
C. Klas Interval, Batas Klas, Batas Nyata dan Titik Tengah. Setiap kelompok nilai variabel disebut sebagai klas interval. Dalam tabel di atas didapatkan adanya enam klas interval. Klas interval 180 - 189 berarti merupakan kelompok nilai-nilai 180; 181; 182; 183; 184; 185; 186; Statistika. Y. Bagus Wismanto
20
21
187; 188; dan 189. Meskipun yang ditulis hanya 180 - 189 akan tetapi kelompok tersebut mencakup nilai-nilai dari 180 sampai dengan 189. Perlu diketahui bahwa ada beberapa ahli statistik yang menyebut klas interval hanya dengan istilah klas atau interval saja. Dalam distribusi frekuensi bergolong di kenal adanya batas klas, yaitu batas klas atas dan batas klas bawah. Batas klas atas adalah nilai tertinggi yang ada di dalam klas interval, sedangkan batas klas bawah adalah nilai terrendah yang ada dalam klas interval tertentu. Setiap klas interval mempunyai batas atas dan batas bawahnya masing-masing. Dari klas interval 180 - 189, maka batas atas klas intervalnya adalah 189, sedangkan batas bawah klas intervalnya adalah 180. Distribusi frekuensi bergolong umumnya dipergunakan pada data yang kontinyu. Apabila dalam pencatatan datanya dilakukan dalam bentuk diskrit/pilah, maka data kontinyu yang ada diperlakukan secara pilah. Dengan demikian data yang dicatat harus tergolong dalam batas-batas nyata. Batas nyata ini pada umumnya
ditentukan dengan : Batas atas
suatu klas interval ditambah batas bawah klas interval di atasnya di bagi dua. Oleh karena itu, batas nyata selalu menghasilkan satuan/kalibrasi yang lebih rendah dari data-data yang dibatasinya. Setiap klas interval memiliki titik tengahnya masing-masing. Titik tengah yaitu suatu nilai yang berada di tengah-tengah klas interval. Titik tengah ini pada umumnya dipergunakan sebagai suatu nilai yang mewakili klas interval. Jika suatu klas interval terdiri dari angka 20; 21; 22; 23; 24, maka dapat ditentukan bahwa titik tengahnya adalah 22. Jika suatu interval terdiri dari angka 10; 11; 12; 13; 14; 15; 16; 17; 18; 19, maka titik tengah dapat ditentukan dengan cara menambahkan batas bawah dengan batas atas dari klas interval yang sama, kemudian di bagi dua. Dengan demikian titik tengah dari klas interval tersebut adalah : 10 ditambah 19 di bagi dua sama dengan 14,5. Berdasar distribusi frekuensi yang telah dibuat tersebut di atas, maka dapat ditentukan batas atas, batas bawah, batas nyata dan titik tengahnya sebagai berikut :
Statistika. Y. Bagus Wismanto
21
22
Tabel II.5 Contoh Batas Atas, Batas Bawah, Batas Nyata dan Titik Tengah Klas Interval
Batas Atas
Batas Bawah
Batas Nyata
Titik Tengah
f
180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139
189 179 169 159 149 139
180 170 160 150 140 130
179,5 - 189,5 169,5 - 179,5 159,5 - 169,5 149,5 - 159,5 139,5 - 159,5 129,5 - 139,5
184,5 174,5 164,5 154,5 144,5 134,5
2 7 15 12 8 6 50
Jumlah
D. Distribusi Frekuensi Meningkat dan Menurun. Distribusi frekuensi meningkat atau menurun dikerjakan dengan menambah satu kolom lagi setelah kolom frekuensi, yaitu kolom yang diperuntukkan frekuensi meningkat/frekuensi kumulatif (fK) atau frekuensi menurun (fT). Frekuensi kumulatif dapat ditentukan dengan menjumlahkan secara meningkat terhadap frekuensi yang ada. dalam frekuensi meningkat pada akhirnya ditemukan bahwa frekuensi paling tinggi adalah sama dengan jumlah selkuruh frekuensi. Tabel II.6 Contoh Frekuensi Meningkat dan Frekuensi Menurun Klas Interval
f
Frekuensi Meningkat (fK)
Frekuensi Menurun (fT)
180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139
2 7 15 12 8 6
50 48 41 26 14 6
2 9 24 36 44 50
Jumlah
50
-
-
Dari contoh tersebut di atas, maka dapat dijelaskan bahwa di dalam frekuensi meningkat, frekuensi terrendahnya adalah sama dengan frekuensi Statistika. Y. Bagus Wismanto
22
23
yang sesungguhnya, akan tetapi semakin ke atas/semakin ke arah nilai yang lebih tinggi frekuensinya semakin meningkat. Hal tersebut di atas dapat diperoleh dengan menambahkan frekuensi dari klas interval di atasnya. Frekuensi meningkat 14 diperoleh dengan menambahkan 6 (frekuensi terrendah) dengan 8 (frekuensi klas interval di atasnya). Frekuensi meningkat 26 diperoleh dengan menambahkan frekuensi yang telah diperoleh yaitu 14 dengan frekuensi klas interval di atasnya yaitu 12. Demikianlah seterusnya sehingga akhirnya diperoleh frekuensi meningkat paling atas adalah sama dengan jumlah frekuensi keseluruhan. Di samping frekuensi meningkat kadang-kadang suatu tabel juga menyajikan frekuensi menurun. Frekuensi menurun dapat diperoleh dengan penentuan frekuensi yang berlawanan dengan proses frekuensi meningkat. Di dalam frekuensi menurun jumlah frekuensi tertinggi (sama dengan jumlah frekuensi keseluruhan/total) malah berada pada klas interval yang paling rendah. Penambahan frekuensi dimulai dari nilai paling tinggi, menuju ke nilai terrendah. Baik frekuensi meningkat maupun frekuensi menurun, ke duanya dapat pula disajikan dalam bentuk prosentase. Hal ini dapat ditempuh dengan membandingkan antara frekuensi yang ada pada setiap klas interval dengan jumlah frekuensi secara total.
Statistika. Y. Bagus Wismanto
23
24
SOAL-SOAL LATIHAN. 1. Berikut ini adalah nilai yang dihasilkan dari 40 siswa/i dalam ujian bahasa Inggris. 42 96 83 52 44
88 80 62 65 71
37 52 53 49 72
75 76 79 80 87
98 66 69 67 91
93 54 56 59 82
73 73 81 88 89
62 69 75 80 79
Buatlah suatu distribusi frekuensi dan frekuensi meningkat dari data tersebut di atasdengan menggunakan lebar klas interval 5. 2. Tuliskanlah batas nyatanya dan titik tengah pada setiap klas interval, dari distribusi frekuensi yang dihasilkan tersebut di atas. 3. Berikut ini adalah nilai yang dihasilkan dari 50 siswa/i dari suatu ujian. 31 51 37 41 68
50 52 38 44 72
32 60 53 45 64
54 61 54 55 64
53 83 52 55 73
65 83 56 58 74
66 75 57 59 48
70 76 62 46 49
71 40 63 47 48
36 41 76 67 49
Susunlah ke dalam suatu distribusi frekuensi dengan lebar klas interval 5 dan padukankanlah dengan frekuensi meningkat. Tunjukkan pula frekuensi meningkat dalam bentuk prosentase. 4. Tuliskanlah a. Nilai titik tengahnya b. Batas nyata dari distribusi frekuensi tersebut di atas. 5. Tuliskanlah batas nyata dan titik tengah untuk klas interval seperti tersebut di bawah ini : a. 90 - 99 b. 3 - 5 c. 300 -349 d. 50 74 e. 800 - 899
Statistika. Y. Bagus Wismanto
24
III. GRAFIK
Grafik adalah tampilan visual dari suatu kelompok data, yang telah diolah (diringkas dan disusun), oleh karena itu grafik pada umumnya merupakan pelaporan dari tabel yang telah disusun, baik itu distribusi frekuensi tunggal maupun distribusi frekuensi bergolong. Orang bahwa dengan tampilan grafik akan lebih mudah dipahami dan kesimpulannya. Untuk menyusun grafik harus dikenal terlebih dahulu yang absis yang biasa disimbolkan dengan sumbu “X”
menilai diambil disebut (sumbu
mendatar/horizontal) yang mewakili nilai-nilai variabel dan ordinat yang disimbolkan dengan sumbu “Y” (sumbu tegak/vertikal) yang mewakili frekuensi nilai. Seperti telah diketahui bahwa huruf “X” didalam distribusi frekuensi memang untuk mewakili nilai-nilai variabel, akan tetapi huruf “Y” didalam distribusi frekuensi diwakili oleh huruf “f”. Oleh karena itu disamping kiri sumbu Y dapat ditambahkan kata frekuensi, dan dibawah sumbu X dapat pula dituliskan nama variabelnya, hal ini adalah untuk memudahkan pembaca. Panjang sumbu X dan Y secara proporsional adalah 3 : 2, namun bila dikehendaki berbeda adalah boleh saja, sejauh penampilannya tidak membingungkan pembaca. Ada berbagai macam grafik, akan tetapi dalam hal ini hanya akan dibicarakan tiga model yang paling pokok, yaitu Histogram, poligon/frekuensi poligon dan ogive atau poligon dengan frekuensi meningkat. A. Histogram. Histogram adalah grafik dimana tampilannya dalam bentuk balokbalok atau segi empat-segi empat yang didirikan tegak diatas nilai-nilai variabelnya atau selebar klas intervalnya pada sumbu absisnya (sumbu X). Nilai-nilai variabel ini dapat berupa batas klas interval, dapat pula diwakili oleh titik tengahnya. Ada pula beberapa penyaji grafik yang mempergunakan batas nyata klas interval sebagai tempat berpijak balok atau segi empat, dengan tujuan agar dalam tampilannya tidak ada jarak antara balok yang satu dengan yang lainnya. Untuk melengkapi histogram, dapat ditambahkan pula keterangan grafik yang diletakkan di bawah
26
gambar. Sedangkan sumbu tegaknya (sumbu Y) mencerminkan besar kecilnya frekuensi. Sebagai contoh kita pergunakan tabel distribusi frekuensi tinggi badan siswa/i SMU pada bab 3 diatas, yaitu sebagai berikut : Tabel III. 1 Distribusi Tinggi Badan Siswa/i SMU Klas Interval 180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139
Batas nyata
Titik Tengah 184,5 174,5 164,5 154,5 145,5 134,5
179,5 - 189,5 169,5 - 179,5 159,5 - 169,5 149,5 - 159,5 139,5 - 149,5 129,5 - 139,5 Jumlah
Frekuensi (f) 2 7 15 12 8 6 50
Dari tabel tersebut di atas dapat disajikan ke dalam bentuk grafik seperti yang ada di bawah ini : t
f 16 14 12 10 8 6 4 2 0 129.5
139.5
149.5
159.5
169.5
179.5
189.5
Tinggi Badan
Gam bar III.1. Histogram Tinggi Badan 50 siswa siswi SMU.
Penting untuk diperhatikan bahwa nama tabel pada umumnya diletakkan di atas tabel yang dibuat dan tanpa diakhiri dengan tanda titik, sedangkan nama gambar pada umumnya diletakkan di bagian bawah gambar, dan diakhiri dengan tanda titik. Hal-hal tersebut adalah ketentuan yang bersifat umum, namun apabila ada yang menyajkan dengan cara yang berbeda, hal itu adalah hak pembuat tabel atau gambar, karena yang terpenting adalah dapat dipahaminya tabel atau gambar oleh pembaca. Apabila diperlukan,
Statistika. Y. Bagus Wismanto
26
27
tabel atau gambar dapat dilengkapi dengan keterangan untuk memperjelas, dan biasanya diletakkan dibawah tabel atau gambar. B. Poligon. Secara prinsip perbedaan antara histogram dan poligon adalah pada penampilannya. Histogram penampilannya mempergunakan balok-balok atau kotak-kotak yang berdiri di atas titik tengah atau batas klas, maka poligon penampilannya berbentuk garis yang mengikuti tinggi rendahnya frekuensi. Garis frekuensi ini umumnya mengikuti titik-titik pertemuan antara frekuensi klas dan titik tengahnya. Lebih jauh lagi histogram dalam penampilannya tampak bahwa seolah-olah frekuensi klas interval adalah merata diseluruh nilai-nilai klasnya, sedangkan poligon menunjuk titik tengah sebagai wakil dari klas interval. Awal garis poligon sebaiknya dihubungkan dengan titk tengah klas interval dibawahnya yang frekuensinya adalah nol, demikian pula akhir garis poligon juga dihubungkan dengan titik tengah klas interval di atasnya, yang juga mempunyai frekuensi nol. f 16 14 12 10 8 6 4 2 0 129.5
139.5
149.5
159.5
169.5
179.5
189.5 199.5
Tinggi Badan
Gam bar III.2. Poligon Tinggi Badan 50 siswa sisw i SM U.
C. Ogive. Sesuai dengan judulnya, ogive adalah tidak jauh berbeda dengan poligon, akan tetapi frekuensi yang dipergunakan adalah frekuensi meningkatnya. Dengan kata lain, ogive adalah grafik dengan tampilan garis, dimana garis tersebut dibentuk berdasarkan titik-titik pertemuan antara frekuensi meningkatnya dengan batas nyata klas interval. Statistika. Y. Bagus Wismanto
27
28
Ada dua pokok yang membedakan antara poligon dan ogive, yaitu : a. Poligon disusun berdasarkan pada frekuensi tiap klas intervalnya, sedangkan ogive disusun berdasarkan frekuensi meningkat/kumulatifnya, b. Poligon berdasar disusun berdasar titik tengah tiap klas interval, sedangkan ogive disusun berdasar batas nyata klas interval. Hal ini disebabkan karena frekuensi meningkat berakhir di setiap akhir klas interval, seperti yang terlihat pada tabel . Sebagai contoh frekuensi 14 adalah frekuensi maksimal yang diperoleh sampai dengan batas klas 149. Jika yang dipergunakan adalah titik tengahnya (yaitu 144,5) maka masih ada kemungkinan diketemukannya nilai-nilai di atas nilai 144,5, yaitu nilai 145, 146, 147, 148 dan 149. Dalam kenyataannya ada satu nilai 145; ada satu nilai 146; ada dua nilai 147; ada satu nilai 148 dan ada satu nilai 149. Dengan demikian jika frekuensi meningkat yang dipergunakan adalah 144,5 maka berarti ada enam frekuensi yang tidak tercakup. Untuk jelasnya, perhatikan gambar ogive di bawah ini.
fk
50 48 41
30 26 20 14 6 0 129.5
139.5
149.5
159.5
169.5
179.5
189.5
Tinggi Badan
G am bar III.3. Ogive Tinggi Badan 50 siswa siswi SM U.
4. Grafik model lain. Grafik yang sering pula dipergunakan oleh para statistikawan adalah grafik dalam bentuk serabi atau pie. Grafik ini mengasumsikan bahwa serabi yang utuh bulat mewakili jumlah seluruh subyek. Oleh karena itu pembagian serabi tergantung prosentase masing-masing bagian.
Statistika. Y. Bagus Wismanto
28
29
calon I calon II calon III calon IV
Gambar III.4. Grafik Serabi Komposisi Suara Pemilihan Calon Kepala Desa
Statistika. Y. Bagus Wismanto
29
30
SOAL-SOAL : 1. Di bawah ini adalah angka-angka yang menunjukkan prosentase pendapatan keluarga di kota Ungaran yang mereka belanjakan untuk bahan makanan. 24 20 45 59 36 41
34 39 42 42 53 48
46 43 35 51 56 38
44 46 32 45 52 25
22 47 57 26 24 46
52 17 32 46 43 35
22 39 24 41 47 48
28 42 60 48 54 30
37 43 59 41 31 45
39 41 55 25 28 32
a. Susunlah angka-angka tersebut ke dalam sebuah distribusi frekuensi yang paling tepat/sesuai menurut Saudara. b. Gambarkanlah Histogram, dan poligonnya. 2. Seorang guru menyusun distribusi frekuensi dari angka-angka ujian yang diperoleh dari pengamatan 100 orang murid. Guru tersebut memperoleh pencaran sebagai berikut : Angka Ujian 0,0 - 9,9 10,0 - 19,9 20,0 - 29,9 30,0 - 39,9 40,0 - 49,9 50,0 - 59,9 60,0 - 69,9 70,0 - 79,9 80,0 - 89,9 90,0 - 99,9
Jumlah Murid 0 0 1 1 0 17 52 25 3 2 100
a. Bagaimanakah pendapat Saudara mengenai susunan distribusi frekuensi itu . b. Jika Saudara ingin mendapat keterangan yang lebih banyak dari data yang tersusun di dalam distribusi frekuensi itu, perubahan-perubahan apakah yang Saudara lakukan ? c. Bandingkanlah histogram dari distribusi frekuensi di atas dengan distribusi frekuensi yang Saudara peroleh sesudah melakukan perubahan yang tersebut pada (b).
Statistika. Y. Bagus Wismanto
30
31
3. Misalkan terdapat sebuah distribusi frekuensi sebagai berikut : Kelas ke : 1 Frekuensi
2 : 5
3 13
4 40
5 2
6 11
7 20
8 13
9 13
1
Kelas-kelas tersebut mempunyai interval yang sama. Jelas kelihatan bahwa distribusi itu tidak baik bentuknya. Anjuran apakah yang dapat diberikan untuk memperbaikinya ?
Statistika. Y. Bagus Wismanto
31
32
IV. KECENDERUNGAN KE PUSAT Kecenderungan ke pusat biasa pula disebut kecenderungan pemusatan yaitu beberapa teknik pengukuran terhadap sekelompok data untuk diketahui pemusatannya. Untuk mengetahui gambaran dari sekelompok data dapat dicari suatu bilangan yang dapat mewakili kelompok data tersebut. Sebagai contoh telah dijelaskan dimuka bahwa titik tengah klas interval dapat dianggap sebagai suatu angka yang mewakili klas intervalnya. Pada pembahasan kali ini angka yang dimaksudkan bukan untuk mewakili suatu klas interval tapi dapat mewakili satu kelompok data atau suatu sebaran data. Angka-angka yang dapat mewakili sekelompok data tersebut diantaranya adalah nilai Mode, nilai rata-rata, dan nilai median. A. Mode atau Modus. Pada tahun 1960 an banyak remaja yang memakai celana, sepatu dan potongan rambut seperti yang dikenakan para pemain band “the beatles” ; pada tahun 1980 an banyak remaja putri yang meniru potongan rambut Putri Diana dari Kerajaan Inggris (Lady Di) atau pada tahun 1990 an para remaja putri meniru potongan rambut Demi moore (aktris dari film “Ghost”). Itu semua dikatakan sebagai mode, karena begitu banyak remaja yang berpenampilan sama. Jika terdapat sepuluh siswa mendapat nilai bahasa indonesia sebagai berikut : 5, 6, 7, 7, 6, 7, 8, 7, 7, 6. Maka dapat dilihat bahwa nilai 7 adalah yang paling banyak diperoleh oleh siswa, maka dapat dikatakan bahwa modenya adalah nilai 7. Mode atau modus adalah suatu nilai atau suatu golongan gejala yang paling banyak terjadi, atau paling besar frekuensinya. Kadang-kadang juga dikatakan bahwa mode adalah nilai yang paling populer. Mode sangat mudah ditentukan. Periksa dan teliti saja distribusi frekuensinya (baik tunggal maupun bergolong) dan lihat nilai atau klas interval yang paling tinggi frekuensinya. Nilai atau atau titik tengah dari klas interval itulah yang modenya. Mode adalah alat yang paling cepat untuk menaksir kecenderungan pemusatan nilai dalam distribusi, namun sifatnya sangat kasar, meskipun masih lebih baik dari sekedar terkaan yang sembarangan. Mode sangat Statistika. Y. Bagus Wismanto
32
33
cocok untuk menggambarkan kasus-kasus yang tipikal. Keuntungan dari mode adalah tidak terpengaruh oleh nilai-nilai yang ekstrem. Ada pula yang mengusulkan modus harus disampaikan dalam nilai atau skor yang pasti. Untuk nilai yang pasti ini, mode dapat ditentukan dengan rumus sebagai berikut : f1 Mod = Bb + i f 1+ f 2 dimana : Bb = Batas bawah nyata pada klas interval yang memuat mode f 1 = Frekuensi klas interval yang memuat mode dikurangi frekuensi klas
interval di bawahnya f 2 = Frekuensi klas interval yang memuat mode dikurangi frekuensi klas i
interval di atasnya = lebar klas interval.
Sebagai contoh akan dipergunakan tabel tinggi badan siswa siswi sebuah SMU di bawah ini : Tabel IV.1 Distribusi Tinggi Badan Siswa/I SMU Klas Interval (X) 180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139 Jumlah
f
2 7 15 12 8 6 50
Berdasarkan data tersebut di atas maka modus nya dapat dihitung dengan langkah-langkah sebagai berikut : 1. Klas interval yang memuat mode adalah klas interval 160 – 169. 2. Batas bawah nyata klas interval tersebut adalah 159,5 3. f 1 = 15 – 12 = 3 Statistika. Y. Bagus Wismanto
33
34
4. f 2 = 15 – 7 = 8 5. i = 10 3 sehingga akan diperoleh hasil : Mod = 159,5 + 10 = 162,2273. 3 + 8
Dari perhitungan tersebut di atas diperoleh bahwa modus dari distribusi frekuensi adalah 162,23. Sedangkan secara kasar dari distribusi frekuensi yang ada dapat pula dinyatakan bahwa modusnya adalah titik tengah pada klas interval yang memiliki frekuensi yang terbanyak, yaitu 164,5 yang diperoleh dari 160 + 169 dibagi 2. B. Nilai Rata-rata. Seandainya ada tiga orang memiliki uang, misalnya Abi mempunyai uang Rp 100,-; Badut memiliki Rp 200,- dan Codet memiliki Rp 300,-, maka secara mudah dapat ditentukan bahwa mereka rata-rata mereka memiliki uang Rp 200,-. Dalam hal ini dapat diandaikan Abi sebagai X1 = Rp 100,-; Badut sebagai X2 = Rp 200,- dan Codet sebagai X3 = Rp 300,- . Maka Nilai rata-rata dalam kasus ini diperoleh dari X1 + X2 + X3 dibagi jumlah subyek (n) yaitu tiga orang. Uang rata-rata mereka = Rp 100,- + Rp 200,- + Rp 300,- : 3 = Rp 200,-
Rata − rata = X =
X1+ X 2 + X 3 = n
∑X n
1. Mencari nilai rata-rata pada distribusi frekuensi tunggal. Untuk pencarian nilai rata-rata yang sudah tersusun dalam suatu distribusi frekuensi tunggal, maka penghitungannya dapat dilakukan dengan cara : a. Setiap nilai tunggal yang ada dalam kolom nilai (X) harus dikalikan terlebih dahulu dengan jumlah frekuensinya. Pada tebel III di muka, nilai 9 mempunyai jumlah frekuensi 3, yang berarti pula bahwa nilai 9 ditemui sebanyak 3 kali dengan demikian jumlah nilai 9 adalah 27 (9 kali 3). b. Mengkalikan semua nilai dengan frekuensinya masing-masing. c. Menjumlahkan hasil perkalian (antara nilai dan frekuensi)tersebut diatas.
Statistika. Y. Bagus Wismanto
34
35
d. Membagi hasil perkalian nilai dan frekuensinya masing-masing dengan jumlah seluruh subyek (n). Jumlah n sama dengan jumlah f. Hasilnya adalah sebagai berikut : Tabel IV.2 Perkalian Nilai variabel dan Frekuensinya X
f
fX
9 8 7 6 5 4
3 5 6 8 5 3
27 40 42 48 25 12
30
194
2. Mencari nilai rata-rata pada distribusi frekuensi bergolong. Untuk distribusi frekuensi bergolong cara penghitungan nilai rataratanya tidak jauh berbeda dengan cara penghitungan nilai rata-rata pada distribusi frekuensi tunggal. Hanya saja dalam distribusi bergolong harus ditentukan terlebih dahulu titik tengahnya sebagai nilai yang mewakili klas interval. Cara penentuan titik tengah telah dibahas di bab yang mendahului. Setiap titik tengah yang mewakili klas interval kemudian dikalikan dengan masing-masing frekuensi setiap klas intervalnya. Jumlah dari perkalian titik tengah dengan frekuensinya masing-masing kemudian dibagi dengan banyaknya subyek (n). Nilai yang dihasilkan adalah nilai rata-rata. Seandainya di ambil tabel III.4 sebagai contoh, maka nilai rata-rata akan diperoleh sebagai berikut :
Statistika. Y. Bagus Wismanto
35
36
Tabel IV.3 Perkalian Titik Tengah Klas Interval dan Frekuensi Klas Interval (X)
Titik Tengah
f
180 - 189 170 - 179 160 - 169 150 - 159 140 - 149 130 - 139
184,5 174,5 164,5 154,5 144,5 134,5
2 7 15 12 8 6
369 1221.5 2467.5 1854 1156 807
50
7875
Jumlah
fX
Maka nilai rata-rata yang diperoleh dari distribusi bergolong tersebut di atas adalah:
X=
∑ fX n
Dengan demikian dapat diperoleh nilai rata-rata = 7875 : 50 = 1575. C. Median. Median adalah suatu nilai atau bilangan yang membatasi setengah (50 %) frekuensi berada dibagian bawah nilai median dan separuh lagi (50 %) berada di bagian atas dari nilai median. Jika seandainya ada 5 orang mempunyai berat badan : 40; 42; 72; 60 dan 54 maka untuk menentukan mediannya, nilai-nilai tersebut harus disusun dalam urutan yang benar, yaitu : X (nilai) : 40 Urutan :
42 1
54 2
60 3
72. 4
5
Maka nilai mediannya adalah 54, karena ada dua orang dibawah nilai median (54) dan ada dua orang pula diatas nilai tersebut. Lain halnya jika ada enam orang yang mempunyai berat badan : X: Urutan :
40 1
42 2
54 3
60 4
72 5
73 6
Statistika. Y. Bagus Wismanto
36
37
maka nilai mediannya adalah nilai yang berada di pertengahan antara nilai 54 dan 60, atau 54 + 60 / 2 = 57. Untuk menentukan nilai median dari suatu distribusi frekuensi bergolong, maka langkah-langkah yang garus diambil dalam penghitungannya adalah seperti di bawah ini : Seandainya diperoleh distribusi bergolong inteligensi dari 60 orang adalah : Tabel IV. 4 Distribusi Inteligensi 60 Orang Klas Interval
Frekuensi (f)
Frekuensi Meningkat (fK)
Frekuensi Menurun (fT)
125 - 129 120 - 124 115 - 119 110 - 114 105 - 109 100 - 104 95 - 99
3 7 12 20 11 5 2
60 57 50 38 18 7 2
3 10 22 42 53 58 60
Jumlah
60
-
-
a. Telah diketahui bahwa jumlah seluruh subyek adalah 60 orang. Separuh dari jumlah tersebut adalah 30 orang (50 % X 60). b. Nilai median dapat dipastikan berada dalam klas interval 110 - 114, karena jika dihitung baik dari frekuensi meningkat maupun frekuensi menurun, subyek sejumlah 30 (50%) berada didalam klas interval tersebut. c. Jika dihitung dari klas interval yang terrendah, maka sampai dengan batas nyata 109,5 sudah terdapat 18 subyek, maka untuk mencapai jumlah subyek 30 orang diperlukan 12 orang lagi dari jumlah 20 subyek yang berada dalam klas interval 110 - 114 (yang mempunyai 5 nilai klas). d. Seandainya ke 20 orang anggota klas interval tersebut tersebar merata ke dalam 5 nilai klas, maka tiap nilai mempunyai jumlah subyek sebanyak 20 : 5 = 4 orang. Oleh karena itu untuk 12 orang yang dibutuhkan maka diperoleh dari 3 nilai klas interval yaitu 110; 111; Statistika. Y. Bagus Wismanto
37
38
dan 112. Dengan demikian nilai mediannya adalah 112,5 (pertengahan/titik tengah antara nilai 112 dan 113). Dapat pula diperoleh dari 109,5 (batas atas nyata dari 18 subyek) ditambah 3 nilai (jumlah 12 orang subyek yang dibutuhkan), sehingga 109,5 + 3 = 112,5. Dengan demikian median dapat ditemukan dengan rumus :
N / 2 − fkb i Median= Med = Bb + fm dimana : Bb = batas bawah nyata dari klas interval yang memuat median fkb = frekuensi meningkat sampai dengan klas interval dibawah Bb fm = frekuensi di dalam klas interval yang memuat median. i = lebar klas interval. Hasil perhitungannya adalah :
60 2 − 18 Med = 109,5 + 5 = 112,5 20 D. Kurve dan letak Nilai Rata-rata, Mode dan Mediannya. Telah dibicarakan di muka bahwa kurve pada hakekatnya adalah poligon, akan tetapi garis poligonnya telah dihaluskan sehingga tidak tampak terpatah-patah. Garis kurve tentu saja akan mengikuti tinggi rendahnya frekuensi nilai. Oleh karena itu antara sumbu “X” dan tingginya garis kurve mencerminkan banyaknya frekuensi. Berdasarkan pengertian tersebut di atas, maka macam-macam bentuk kurve ditentukan oleh (1) lebar-sempitnya rentang nilai (selisih nilai tertinggi dan nilai terrendah) yang akan menentukan lebar-sempitnya kaki kurve dan (2) frekuensi masing-masing nilai yang akan menentukan tinggi-rendahnya garis kurve.
Statistika. Y. Bagus Wismanto
38
39
Ada beberapa macam kurve, antara lain : 1. Kurve mesokurtik,
Mean Median Modus 2. Kurve Platikurtik
Mean Median Modus
3. Kurve Leptokurtik
Mean Median Modus
Statistika. Y. Bagus Wismanto
39
40
Soal-soal latihan : 1. Dari data-data berikut ini hitunglah nilai rata-rata dan mediannya : a. 1, 4, 5, 7, 9. b. 3, 7, 15, 26, 45. c. 4, 23, 28, 35, 41, 54. d. 0, 0 , 0, 7, 9, 25 ,126. 2. Dibawah ini adalah suatu distribusi frekuensi dari suatu penelitian : Klas Interval
Frekuensi
90 - 99 80 - 89 70 - 79 60 - 69 50 - 59 40 - 49 30 - 39
6 12 20 26 15 13 8
Jumlah
100
Tentukanlah nilai mode; rata-rata dan mediannya. 3. Dari 140 orang mahasiswa yang diamati, terdapat distribusi frekuensi dari uang saku mingguannya sebagai berikut : Uang Saku
Frekuensi
Rp 600,- - 699,700,- - 799,-
3 16
800,- - 899,-
25
900,- - 999,1000,- - 1099,-
46
1100,- - 1199,-
13 2
1200,- - 1299,-
35
Statistika. Y. Bagus Wismanto
40
41
a. Gambarkanlah poligon dan Histogram dari distribusi frekuensi tersebut dalam suatu koordinat. b. Berapakah uang saku rata-rata (hitung) dari seratus 140 orang mahasiswa tersebut. c. Berapakah median dan modus dari uang saku tersebut ? 4. Dua buah perusahaan menghasilkan bola lampu, yaitu perusahaan “X” dan “Y”. Ke dua perusahaan tersebut menyatakan bahwa masing-masing menghasilkan bola lampu yang lebih tahan dipakai dari yang lain. Berhubung dengan itu, seorang mencoba memeriksa kebenaran dari pernyataan ke dua perusahaan itu. Orang tersebut mengambil lima buah bola lampu masing-masing dari kedua perusahaan itu untuk pemeriksaan. Bola dari perusahaan “X” tahan menyala terus menerus selama 536; 446; 548; 480; dan 470 jam, sedang bola yang dihasilkan perusahaan “Y” tahan menyala terus menerus selama 512; 468; 420; 520; dan 500 jam. Pernyataan perusahaan yang manakah yang benar ?
Statistika. Y. Bagus Wismanto
41
V. KUARTIL, DESIL, DAN PERSENTIL A. Kuartil. Seperti halnya median, kuartil mempunyai prinsip yang relatif sama. Perbedaannya terletak pada prosentase pembagian frekuensi / jumlah subyeknya. Pada median jumlah subyek dibagi dua bagian sama besar, yaitu masing-masing bagian 50 %. Pada kuartil pembagian subyek dibagi kedalam empat bagian yang sama besar/sama banyak, yaitu masing-masing 25 % (kwartaal, bahasa Belanda berarti tiga bulan atau 1/4 tahun). Pada median hanya terdapat satu nilai median (yang membagi frekuensi / subyek menjadi dua bagian sama besar), sedangkan pada kuartil terdapat tiga nilai kuartil (K1; K2 dan K3) yang membagi distribusi nilai menjadi empat bagian yang besar. Dengan demikian dapat di gambarkan : Kuartil 1 (K1) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 1/4 (25 %) berada di bawah nilai K1 dan 3/4 (75%) berada di atas nilai K1. Kuartil 2 (K2) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi 2/4 (50%) berada di bawah nilai K2 dan 2/4 (50%) berada di atas nilai K2. Kuartil 2 sama dengan Median. Kuartil 3 (K3) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi 3/4 (75%) berada di bawah nilai K3 dan 1/4 (25%) berada diatas nilai K3. Langkah-langkah untuk menemukan nilai kuartil pun sama dengan langkah-langkah yang dilakukan dalam penentuan median, yaitu : 1. Susunlah nilai frekuensi meningkatnya (fk). 2. Hitunglah untuk K1 :
1 4
X jumlah subyek
2 X jumlah subyek 4 3 K3 : X jumlah subyek 4 Penghitungan tersebut di atas dimaksudkan untuk menentukan pada
K2 :
klas interval manakah letak K1, K2, K3. 3. Tentukanlah kelas interval yang memuat K1, K2 atau K3 nya.
43
4. Tentukan batas bawah nyata klas interval yang memuat K1, K2 atau K3. 5. Tentukan : fkb : frekuensi meningkat sampai dengan kelas interval dibawah kelas interval yang memuat K1, K2 atau K3, atau sampai dengan di bawah Bb fK : frekuensi di dalam kelas interval yang memuat K1, K2 atau K3 i : lebar kelas intervalnya. Rumusnyapun sebenarnya merupakan perubahan dari rumus median (ingat bahwa K2 sama persis dengan median), yaitu : 1 / 4 N − fkb K1 = Bb + i fK
2 / 4 N − fkb K 2 = Bb + i fK
3 / 4 N − fkb K 3 = Bb + i fK
dimana : Bb adalah batas bawah nyata klas interval yang memuat K1, K2 atau K3 fkb adalah frekuensi meningkat sampai dengan klas interval dibawah Bb fK adalah frekuensi di dalam klas interval yang memuat K1, K2 atau K3 i adalah lebar klas interval. B. Desil dan Persentil. Kuartil, Desil dan Persentil sebenarnya merupakan satu kesatuan dalam pengertian. Hal yang membedakan antara ketiganya hanya pada jumlah pembagian subyek atau frekuensinya saja. Telah diketahui bahwa dalam kuartil distribusi data/subyek dibagi ke dalam empat bagian yang sama banyak/sama besar, maka pada desil distribusi data di bagi ke dalam sepuluh bagian yang sama besar, dimana masing-masing bagian mendapat 1/10 (10%) dan pada persentil distribusinya dibagi kedalam seratus bagian yang sama besar, dimana msing-masing bagian mendapat 1/100 atau 1 % saja. Apabila diformulasikan, maka pengertian desil adalah : Desil 1 (D1) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 1/10 (10%) berada di bawah nilai D1 dan 9/10 (90%) berada di atas nilai D1.
Statistika. Y. Bagus Wismanto
43
44
Desil 2 (D2) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 2/10 (20%) berada di bawah nilai D2 dan 8/10 (80%) berada di atas nilai D2. Desil 5 (D5) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 5/10 (50%) berada di bawah nilai D5 dan 5/10 (50%) berada di atas nilai D5. Desil 7 (D7) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 7/10 (70%) berada di bawah nilai D7 dan 3/10 (30%) berada di atas nilai D7. maka secara umum dapat dinyatakan “Desil ke k (Dk)” adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, k/10 berada di bawah Dk dan 10-k/10 berada di atas nilai Dk. Sedangkan pengertian persentil adalah : Persentil 1 (P1) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 1/100 (1%) berada di bawah nilai P1 dan 99/100 (99%) berada di atas nilai P1. Persentil 27 (P27) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 27/100 (27%) berada dibawah nilai P27 dan 73/100 (73 %) berada di atas nilai P27. Persentil 50 (P50) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 50/100 (50%) berada bi bawah nilai P50 dan 50/100 (50%) berada di atas nilai P50. Persentil 99 (P99) adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, 99/100 (99%) berada di bawah nilai P99 dan 1/100 (1%) berada di atas nilai P99. maka secara umum dapat dinyatakan “Persentil ke k (Pk)” adalah suatu nilai yang membagi frekuensi/subyek di dalam suatu distribusi, k/100 berada dibawah Pk dan 100-k/100 berada di atas nilai Pk. Proses mendapatkan nilai-nilai desil dan persentilpun tidak berbeda dengan proses mendapatkan nilai median maupun kuartil. Demikian pula rumusnya, hanya merupakan perluasan atau perubahan dari rumus median maupun kuartil. Rumus Desil :
Statistika. Y. Bagus Wismanto
44
45
1 / 10 N − fkb D1 = Bb + i fD
3 / 10 N − fkb D3 = Bb + i fD
8 / 10 N − fkb D8 = Bb + i fD
Secara umum rumus desil dapat ditulis :
k / 10 N − fkb Dk = Bb + i fDk
Rumus Persentil :
4 / 100 N − fkb P 4 = Bb + i fP
47 / 100 N − fkb P 47 = Bb + i fP
73 / 100 N − fkb P 73 = Bb + i fP
92 / 100 N − fkb P 92 = Bb + i fP
k / 100 N − fkb secara umum : Pk = Bb + i fPk dimana : Bb adalah batas bawah nyata dari klas interval yang memuat Desil atau Persentil fkb adalah frekuensi meningkat sampai dengan klas interval di bawah Bb fD atau fP adalah frekuensi di dalam klas interval yang memuat Desil atau Persentil I adalah lebar klas interval. Dari penjelasan di atas, maka tampaklah bahwa Median (Med) = K2 = D5 = P50. Sebagai contoh proses penghitungan, dapat diambil dari suatu kumpulan data pengukuran ketelitian menghitung huruf, yang distribusi frekuensinya tergambar di bawah ini :
Statistika. Y. Bagus Wismanto
45
46
Tabel V.1. Ketelitian Menghitung Huruf Klas interval 65 - 69 60 - 64 55 - 59 50 - 54 45 - 49 40 - 44 35 - 39 30 - 34 25 - 29 20 - 24 15 - 19 10 - 14 Jumlah
frekuen si 1 6 11 13 17 33 32 32 23 24 7 1 200
frekuensi meningkat 200 199 193 182 169 152 119 87 55 32 8 1
Dari data tersebut dapat dihitung : Desil 1 : 1. 1/10 N = 1/10 dari 200 = 20 2. Dilihat dari frekuensi meningkatnya, maka D1 terletak di dalam klas interval 20 - 24. 3. Batas bawah nyata (Bb) klas interval 20 - 24 adalah 19.5 4. Frekuensi di dalam klas interval yang memuat Desil 1 (fD) adalah 24 5. Frekuensi meningkat sampai dengan Bb (fkb) adalah 8 6. Lebar klas interval adalah 5 20 − 8 Dengan demikian, D1 = 19.5 + 5 = 22 24
Desil 4 : 1. 4/10 N = 4/10 dari 200 = 80 2. D4 terletak dalam klas interval 30 - 34 (lihat frekuensi meningkatnya !!) 3. Batas bawah nyata klas interval 30 - 34 adalah 29.5 4. Frekuensi di dalam klas interval yang memuat Desil 4 (fD) adalah 32 5. Frekuensi meningkat sampai dengan Bb (fkb) adalah 55 6. Lebar klas interval adalah 5.
Statistika. Y. Bagus Wismanto
46
47
Dengan demikian,
80 − 55 D4 = 29.5 + 5 = 33.406 32
Persentil 9 : 1. 9/100 N = 9/100 dari 200 = 18 2. P9 terletak di dalam klas interval 20 - 24 3. Batas bawah nyata klas interval 20 - 24 adalah 19.5 4. Frekuensi di dalam klas interval yang memuat P9 (fP) adalah 24 5. Frekuensi meningkat sampai dengan Bb (fkb) adalah 8 6. Lebar klas interval adalah 5 18 − 8 Dengan demikian, P9 = 19.5 + . 5 = 2158 24 176 − 169 P83 = 49.5 + 5 = 52.19 13
Telah disebutkan bahwa Median = K2 = D5 = P50, dapat dibuktikan : Median = 1/2 N = 1/2 X 200 = 100 Kuartil 2 = 2/4 N = 2/4 X 200 = 100 Desil 5 = 5/10 N = 5/10 X 200 = 100 Persentil 50 = 50/100 N = 50/100 X 200 = 100 Dengan demikian letak Median, kuartil 2, Desil5 maupun Persentil 50 adalah di klas interval yang sama, yaitu klas interval 35 - 39. Mempunyai Batas bawah nyata (Bb) klas interval yang sama yaitu 34.5 Mempunyai frekuensi meningkat sampai dengan Bb yang sama pula, yaitu 87 Mempunyai frekuensi di dalam klas interval yang memuat med., K2, D5 dan P50 (fm; fK; fD maupun fP) yang sama pula yaitu 32 Dan mempunyai lebar klas interval yang sama pula yaitu 5. Dengan denikian, maka : 100 − 87 Med = K 2 = D5 = P 50 = 34.5 + 5 = 36.531 32
Statistika. Y. Bagus Wismanto
47
48
C. Pemanfaat Desil dan Persentil : Desil dan persentil telah diketahui bersama bermanfaat sebagai pembagi frekuensi subyek dalam suatu kelompok ke dalam sepuluh atau seratus bagian yang sama besar. Berkaitan dengan fungsi tersebut maka baik desil maupun persentil umumnya dimanfaatkan untuk pembagian kelompok kedalam kelompok yang lebih kecil dan kemudian diberikan sebutan atau kualifikasi yang berbeda antara kelompok. Salah satu pemanfaatannya adalah dalam pemberian penilaian normatif dalam tes-tes prestasi yang diberikan oleh guru. Pemberian nilai normatif ini adalah pemberian nilai yang relatif, karena pemberian nilai didasarkan atas norma kelompok dengan melihat posisi relatif seorang siswa terhadap siswa yang lainnya. Penilaian ini biasa pula disebut sebagai normreferenced. Pemberian nilai normatif ini dapat digunakan desil, dapat pula digunakan persentil yang dihitung dari distribusi skor klas. Misalkan saja seorang guru menghendaki pemberian nilai huruf yang terdiri dari nilai A, B, C, D, dan E, maka penguji dapat menentukan lebih dahulu prosentase masing-masing nilai, misalkan saja nilai A hendak diberikan kepada 10 % dari jumlah subyek, B 20 % dari jumlah subyek, C kepada 40 % dari jumlah subyek, D kepada 20 % dari subyek dan nilai E 10 % subyek. Maka dapat digambarkan : 10%
20%
40%
20%
10%
E D C B -----------------------------------------------------------------D1 D7 P10 P70 D3 P30
A
D9 P90
Statistika. Y. Bagus Wismanto
48
49
SOAL-SOAL LATIHAN. 1. Berikut ini adalah alokasi dana (dalam ribuan) dalam setiap bulan yang dikeluarkan ibu rumah tangga untuk keperluan pengembangan pendidikan bagi anak-anaknya. Hasilnya adalah sebagai berikut : 30 40 35 25 35 50 30 40 40 45 40 20 45 45 40 45 20 35 45 25 40 30 35 45 25 33 20 20 20 45 25 35 35 34 15 30 25 40 25 35 a. Hitunglah rata-rata pengeluaran ibu-ibu rumah tangga tersebut ? b. Berapa besarnya median ? c. Berapa modusnya ? 2. Nilai ujian matematika 120 mahasiswa/i fakultas ekonomi Unika Soegijapranata adalah sebagai berikut : Nilai Ujian
Frekuensi
31 - 40 41 - 50 51 - 60 61 - 70 71 - 80 81 - 90 91 - 100
9 32 43 21 11 3 1
a. Hitunglah kuartil pertama dan ke tiga ! b. Hitunglah Desil pertama, ke 4, ke 5 dan ke 7 ! c. Hitunglah persentil yang pertama, ke 25, ke 50 dan ke 76 d. Jika dosen yang bersangkutan menentukan bahwa 15% teratas dari jumlah mahasiswa akan diberi nilai A, 20 % akan diberi nilai B, 50% akan diberi nilai C, 10 % akan diberi nilai D, dan 5 % akan diberi nilai E. Berapakah batas-batas nilai tersebut ?
Statistika. Y. Bagus Wismanto
49
VI. PENGUKURAN KERAGAMAN (VARIABILITAS) Hal yang sangat diperhatikan oleh statistikawan adalah variasi dari kejadian alami. Pengukuran yang dilakukan oleh para ahli biasanya dilakukan terhadap suatu sampel. Pengukuran-pengukuran misalnya saja terhadap inteligensi, waktu reaksi, locus of control, panjangnya leher, kebisingan lingkungan menunjukkan variasi individu dalam suatu sampel. Oleh karena itu statistik dapat dikatakan pula sebagai ilmu yang mempelajari variasi. Sampel dapat diartikan sebagai sebagian dari populasi yang masih mempunyai karakteristik yang sama dengan populasinya. Sampel dapat pula diartikan sebagai miniatur dari populasi. Apabila kita mencicipi air teh dari suatu gelas dengan sendok, maka air teh yang ada di dalam gelas dapat dianggap sebagai populasi sedangkan air teh yang ada di dalam sendok dapat dianggap sebagai sampelnya. Kesimpulan rasa manis yang dirasakan dari satu sendok air teh dapat digunakan untuk menyimpulkan rasa manis air teh yang ada di dalam gelas. Ukuran-ukuran yang dihasilkan dari penghitungan terhadap sampel dikatakan sebagai statistik, sedangkan ukuran-ukuran yang dihasilkan dari penghitungan terhadap populasi dikatakan sebagai parameter. Oleh karena itu ukuran yang sama dapat bernama statistik dapat pula bernama parameter, tergantung pada apakah ukuran tersebu diambil dari sampel atau populasi. Pengukuran terhadap suatu sampel akan ditemukan pula variasi di dalamnya. Apabila dilakukan pengukuran berat badan terhadap sekelompok orang (sekelompok orang ini adalah sampel), maka akan diperoleh hasil pengukuran yang menyebar dari berat badan yang paling ringan sampai dengan ke berat badan yang paling berat dari kelompok orang tersebut. Dari hasil pengukuran berat badan, maka dapat dihitung rata-rata berat badan dari kelompok. Perlu disadari bahwa berat badan yang paling banyak dijumpai dalam pengukuran adalah berat badan yang berada di sekitar nilai rata-rata. Sebagai contoh dari suatu Fakultas dilakukan pengukuran berat badan mahasiswanya, ternyata pertama kali yang diperoleh adalah subyek dengan berat badan 85 kg., kedua 40 kg., ketiga 54 kg., dan seterusnya,
51 yang akhirya diketahui bahwa semakin lama akan semakin sering dijumpai mereka-mereka yang mempunyai berat badan disekitar nilai rata-rata dalam pengukuran berat badan tersebut. Di samping itu di dalam pengukuran akan ditemukan pula nilai-nilai berat badan yang jauh dari nilai rata-rata. Nilai-nilai yang jauh dari rata-rata inilah yang akan menentukan variasi dari suatu kelompok data. Beberapa ukuran variabilitas yang perlu dibicarakan dalam statistik adalah rentang (range); simpangan (deviation); rata-rata simpangan (mean deviation) , simpangan baku (standard deviation), angka baku (standard score) serta angka skala (T score). A. Rentang. Apabila kita memiliki dua kelompok pemain bola basket dan tercatat tinggi badan mereka adalah : Group I : 170 Group II : 160
180 175
190 190
200 205
210 220
Dari kedua sampel tersebut (baik group I maupun diperoleh nilai rata-rata yang sama yaitu 190, akan tetapi teliti maka diketahui bahwa group II lebih bervariasi dari tersebut terjadi karena group II mempunyai rentang
group II) memang bila ditengok lebih pada group I. Hal yang lebih lebar
daripada group I. Secara sederhana, rentang atau range dapat diformulasikan sebagai selisih antara skor/nilai tertinggi dengan skor/nilai terrendah, atau R (rentang/range) = Skor tertinggi - skor terrendah. Sebagai ilustrasi dari manfaat rentang adalah ketika pelatih bola basket Tim Negara Phillipina datang ke Indonesia, untuk menggambarkan tinggi pemain-pemainnya, pelatih hanya menyatakan bahwa tinggi pemainnya antara 178 sampai 201 Cm. Dari pernyataan pelatih tersebut dapat dipahami bahwa pemain bola basket tim tersebut memiliki tinggi badan yang sangat tinggi karena tinggi badan paling rendah adalah 178 Cm.
Statistika. Y. Bagus Wismanto
51
52 B. Simpangan . Simpangan atau deviation (“x” huruf kecil) diartikan sebagai seberapa jauh/banyak nilai suatu subyek menyimpang dari nilai rata-rata kelompoknya. Seandainya kembali ke hasil pengukuran berat badan mahasiswa tersebut di atas, dan diperoleh nilai rata-rata 48 kg., maka Fredi yang mempunyai berat badan 74 kg. dapat dinyatakan mempunyai penyimpangan berat badan dari rata-ratanya sebesar = 74 - 48 = 26. Sedangkan Astuti yang memiliki berat badan 42 kg. dapat dinyatakan mempunyai penyimpangan = 42 - 48 = - 6. Maka simpangan dapat dirumuskan : x = X− X
dimana x adalah nilai simpangan X adalah nilai yang dimiliki seorang subyek X adalah mean atau nilai rata-rata atau X.
Contoh lain, seandainya diambil dari hasil pengukuran enam subyek diperoleh hasil sebagai berikut : Subyek Lingkar Kepala Ukuran Kaki Tinggi Badan
1 50 36 153
2 52 36 170
3 54 37 160
4 56 37 168
5 56 37 172
terhadap
6 56 36 170
Ketika diperhitungkan penyimpangannya (dengan rata-rata masing masing pengukuran adalah 54 untuk lingkar kepala; 36,5 untuk ukuran kaki dan 165,5 untuk tinggi badan) maka akan diperoleh :
Subyek Lingkar kepala Ukuran Kaki Tinggi Badan
1 -4 - 0,5 - 12,5
2 -2 - 0,5 + 4,5
3 0 + 0,5 - 5,5
4 +2 + 0,5 + 2,5
5 +2 + 0,5 + 6,5
6 +2 - 0,5 + 4,5
Dari ketiga pengukuran tersebut di atas tampak bahwa hasil pengukuran ukuran kaki kurang bervariasi bila dibandingkan dengan hasil
Statistika. Y. Bagus Wismanto
52
53
pengukuran lingkar kepala, dan hasil pengukuran lingkar kepala kurang bervariasi bila dibandingkan dengan hasil pengukuran tinggi badan. C. Rata-rata simpangan (Mean Deviation). Apabila dari suatu mata kuliah yang diikuti sepuluh mahasiswa, dan mereka mempunyai berat badan : 50; 77; 46; 44; 49; 47; 42; 45; 46 dan 60, maka dari kelompok ini dapat dihitung rata-rata berat badan, yaitu 48 dan penyimpangan berat badan masing-masing subyek, dan dapat pula dihitung rata-rata dari penyimpangan-penyimpangan, atau biasa disebut sebagai rata-rata simpangan atau mean deviation. Berat Badan Subyek 50 Berat Badan Rata- 48 rata Simpangan +2
77 48
46 48
44 48
49 48
47 48
42 48
45 48
46 48
60 48
+29 -2
-4
+1
-1
-6
-3
-2
+12
Dari pengertian dasarnya dapat dimengerti bahwa sebenarnya penyimpangan nilai tidak memperhatikan negatip atau positipnya penyimpangan. Oleh karena itu simpangan dalam penghitungan rata-rata simpangan tidak memperhatikan positip dan negatip simpangan. Dengan demikian dari contoh tersebut di atas dapat dihitung rata-rata simpangan nya adalah : 2 + 29 + 2 + 4 + 1 + 1 + 6 + 3 + 2 + 12 dibagi banyaknya
subyek (n) yaitu RS =
2 + 29 + 2 + 4 + 1 + 1 + 6 + 3 + 2 + 12 = 6,2 10
Rata-rata simpangan dengan demikian dapat dirumuskan : RS =
∑x n
D. Simpangan Baku dan Varians ( Standard Deviation and Variance ). Penghitungan terhadap simpangan di bawah nilai rata-rata akan diperoleh hasil negatip sedangkan di atas nilai rata-rata akan diperoleh hasil positip. Jumlah simpangan adalah nol. Di dalam penghitungan rata-rata simpangan, simpangan baik negatip maupun positip ke duanya dianggap positip (diperhatikan harga mutlaknya) karena yang dipentingkan dalam hal ini adalah jarak antara nilai rata-rata
Statistika. Y. Bagus Wismanto
53
54
dengan suatu nilai tertentu. Oleh karena itu |X - X | diartikan sebagai jarak antara X dengan
X.
Simpangan baku biasa pula dikatakan standard deviation atau deviasi standar atau simpangan standar, adalah ukuran variabilitas yang terpenting. Simpangan baku untuk statistik diberi simbol “s” atau “SD”, sedangkan untuk populasi diberi simbol δ (baca : sigma). Dalam pengertiannya simpangan baku biasa diartikan sebagai akar pangkat dua dari jumlah kuadrat simpangan dibagi banyaknya frekuensi atau banyaknya subyek. Sedangkan dalam rumus statistiknya biasa ditulis :
1. s =
∑x
2
2. s =
atau
N −1
∑ (X − X )
2
N −1
Rumus tersebut di atas pada umumnya dipergunakan untuk data yang belum tersusun ke dalam distribusi frekuensi. Simpangan baku untuk distribusi frekuensi tunggal rumusnya adalah :
3. s =
∑ fx
2
N −1
atau s =
∑ f (X − X )
2
N −1
Rumus simpangan baku untuk distribusi bergolong adalah : 4. s =
∑ f (X − X ) N −1
2
atau
5. s =
N .∑ fX 2 − (∑ fX )
2
N ( N − 1)
di mana simbol-simbol yang digunakan dalam rumus 1 sampai dengan 5 tersebut adalah : s = simpangan baku x = simpangan X = nilai variabel atau titik tengah klas interval. f = frekuensi tiap nilai atau frekuensi klas interval N = jumlah subyek Untuk simpangan baku pada populasi, rumusnya adalah : 6. δ =
∑ (X − µ)
2
N
Statistika. Y. Bagus Wismanto
54
55
Varians (variance) pada hakekatnya adalah kuadrat dari simpangan baku. Berdasarkan hal tersebut maka rumusnya adalah :
7. Varians sampel :
s2 =
8. Varians populasi : δ
∑ (X − X ) N
∑ (X − µ) =
2
2
2
N
dimana : s 2 = varians sampel δ 2 = varians populasi µ = Rata-rata populasi. Sebagai contoh, diambil lima buah nilai, misalkan : 7, 8, 10, 12, dan 13 maka nilai rata-ratanya adalah : 10, sedangkan simpangan dan kuadrat simpangan masing-masing subyek adalah : X 13 12 10 8 7 Jumlah
x (X − X ) 3 2 0 -2 -3 0
(X − X )2 9 4 0 4 9 26
maka dari data tersebut di atas, dapat dicari simpangan bakunya adalah : s=
∑ (X − X ) N −1
2
=
26 = 2.5495097 5−1
sedangkan variansnya dapat dihitung dengan mengkuadratkan nilai simpangan bakunya saja, dan diperoleh : s2 = 2.54950972 = 6,4999997 E. Angka Baku (Standard Score). Angka baku biasa dikatakan pula sebagai standar skor atau nilai standar, dan disimbolkan dengan huruf “z”. Oleh karena diberi simbol “z” maka banyak pula yang menyebut “z score” atau z skor atau angka z. Angka baku (z skor) adalah suatu nilai atau suatu angka yang menunjukkan seberapa jauh atau seberapa banyak suatu angka atau nilai Statistika. Y. Bagus Wismanto
55
56
yang dimiliki individu menyimpang dari nilai rata-ratanya, dengan satuan simpangan bakunya. seandainya terdapat dua orang yaitu si Abu dan si Bento dari klas yang berbeda mendapat nilai Bhs Inggris 65 dan 70, maka kurang bijaksanalah apabila segera diambil kesimpulan bahwa nilai Bento lebih baik daripada nilai Abu, tanpa melihat nilai rata-rata dan simpangan baku dari masing-masing kelasnya. Seandainya nilai rata-rata kelas adalah sama, yaitu 55, itupun belum dapat disimpulkan nilai si Bento lebih baik daripada si Abu tanpa melihat simpangan bakunya. Hal tersebut dapat terjadi karena simpangan baku menentukan seberapa lebar sebaran nilai dari masing-masing kelas. Apabila simpangan baku dari kelas Abu adalah 5, sedangkan simpangan baku dari kelas Bento adalah 15, maka tampaklah bahwa Abu lebih baik daripada Bento, karena : z=
X−X s
sehingga nilai Abu dan Bento masing-masing menyimpang dari nilai ratarata dengan ukuran simpangan baku sebesar :
z Abu =
65 − 55 =2 5
dan
z Bento =
70 − 55 =1 15
Dari hasil perhitungan tersebut di atas dapat diyakinkan bahwa nilai Abu lebih baik daripada nilai Bento ketika dibandingkan dengan masingmasing kelompoknya. Kelompok Bento lebih besar variasinya dari pada kelompok Abu, karena kelompok Bento memiliki simpangan baku sebesar 15. Jika dilihat dalam prosentase, maka Abu menyimpang dari nilai rataratanya sejauh 2 s atau 47,72 % sedangkan Bento 1 s atau 34,13% Contoh lain, ketika dibandingkan nilai yang diperoleh Abu dalam mata uji bahasa Inggris dan Matematika masing-masing adalah 65 dan 75, maka meskipun diperoleh dari kelompok atau klas yang sama akan tetapi tidak dapat langsung dinyatakan bahwa nilai matematika lebih baik daripada nilai bahasa Inggris tanpa melihat nilai rata-rata dan simpangan bakunya. Ketika dilihat nilai rata-rata dan simpangan bakunya, diperoleh sebagai berikut : Statistika. Y. Bagus Wismanto
56
57
Mata Uji Bahasa Inggris Matematika
Nilai 65 75
Rata-rata 55 70
S 5 8
z (angka baku) 2 0,625
angka baku matematika Abu diperoleh dengan jalan :
z=
75 − 70 = 0,625 8
Dapat disimpulkan bahwa nilai matematika Abu meskipun nilai hanya 65, akan tetapi posisi dalam kelasnya lebih baik daripada nilai matematikanya. Contoh lain dari angka baku yaitu seandainya dari suatu distribusi hasil ujian statistik diperoleh hasil sebagai berikut : Tabel VII. 1. Hasil Ujian Statistik Mahasiswa Klas Interval 91 - 100 81 - 90 71 - 80 61 - 70 51 - 60 41 - 50 31 - 40 21 - 30 11 - 20 -
F 4 9 12 28 31 25 16 10 5 140
Dari hasil di atas muncul beberapa pertanyaan : a. Nilai berapakah pembatas bagi mereka yang mendapat 10% nilai terbaik ? b. Berapa orangkah yang mendapat nilai antara 60 sampai dengan 75 ? c. Seandainya kelulusan minimal adalah 50, berapa mahasiswa yang tidak lulus ? Maka dari beberapa pertanyaan tersebut di atas, kesemuanya dapat diselesaikan dengan metode angka baku.
Statistika. Y. Bagus Wismanto
57
58
Catatan : Apabila angka baku (z skor) yang diperoleh adalah 0, maka berarti nilai yang dihitung tersebut terletak persis di nilai rata-ratanya. F. Angka Skala (T-Score) Sebagaimana z-skor, T-skor didasarkan pula atas penyimpangan angka atau nilai tertentu dari nilai rata-ratanya, akan tetapi T-skor mempergunakan nilai rata-rata = 50 dan s = 10. T-skor merupakan tindak lanjut dari z-skor, karena untuk menemukan T-skor, z-skor yang diperoleh dikalikan 10, kemudian ditambah 50. Persamaan untuk T-skor adalah : X − X T = 50 + 10 s
Bila ditindak lanjuti contoh si Abu di atas, maka diperoleh T-skor : 65 − 60 Bahasa Inggris : T = 50 + 10 = 60 5
Matematika
75 − 70 : T = 50 + 10 = 56,25 8
Baik dengan z-skor maupun dengan T-skor, maka dapat dibandingkan nilai si Abu pada ke dua mata uji tersebut. Sebagaimana disebutkan terdahulu bahwa nilai si Abu lebih baik dalam bahasa Inggris dibandingkan matematikanya. Seandainya tidak untuk membandingkan antara dua atau lebih nilai, angka baku secara langsung juga dapat digunakan untuk melihat kedudukan relatif seseorang jika dibandingkan dengan nilai-nilai didalam kelompoknya sendiri. Nilai suatu mata uji misalkan saja Fisika, jika hanya dikatakan 80, tidak akan berarti apa-apa kalau tidak disertai dengan indikator yang lain (rata-rata dan simpangan baku), akan tetapi jika dinyatakan dalam angka baku, misalkan saja z-skor Fisika si Bento adalah 2 (negatip dua), maka kita dapat mengerti bahwa nilai tersebut jauh di bawah rata-rata, dan dianggap sebagai prestasi yang jelek.
Statistika. Y. Bagus Wismanto
58
59
SOAL-SOAL LATIHAN 1. Hitunglah rentang dari data berikut ini : a. 30; 27; 3; 5; 18; 27; 46; 13; 49; 14 b. 8; 8; 9; 9; 9; 3; 3; 25; 2; 5; 10 c. –2; -4; -5; -6; -8; -1; 3; -7 2. Terdapat 10 orang yang dihitung berat badanya, dan hasilnya adalah sebagai berikut : 64; 46; 50; 48; 56; 70; 82; 65; 62; dan 50. Berapakah simpangan baku dari data tersebut ? 3. Di bawah ini adalah sebuah distribusi frekuensi tentang penghasilan sebuah RT di sebuah desa : Kelas interval (000) 600 700 800 900
– – – –
699 799 899 999
1000 – 1099 1100 – 1199 1200 -1299
Frekuensi 3 16 25 46 35 13 2 140
a. Hitunglah nilai rentang; rata-rata; dan simpangan baku b. Jika Abu memiliki penghasilan 700.000 rupiah per bulan, berapa banyak orang lain yang berpenghasilan di bawahnya ? c. Jika Zaenudin memiliki penghasilan 980.000 rupiah, berapa jumlah orang yang berpenghasilan di atasnya ? d. Jika Ali berpenghasilan 825.000 dan Bagyo berpenghasilan 1.125.000, berapa orang yang berpenghasilan di antra keduanya ?
Statistika. Y. Bagus Wismanto
59
60
VII. TEORI PROBABILITAS PADA DISTRIBUSI NORMAL A. Probabilitas. Probabilitas atau peluang secara umum diartikan sebagai peluang terjadinya suatu peristiwa, dan secara khusus diartikan sebagai perbandingan antara kemungkinan munculnya suatu kejadian dibandingkan dengan semua kemungkinan kejadian yang dapat terjadi. Apabila sebuah mata uang yang masih bagus (belum melengkung), dan dilemparkan ke atas seperti pada pengundian, maka kemungkinan yang ada adalah muncul gambar (G) dan angka (A). Kemungkinan muncul disebut sebagai sukses dan kemungkinan tidak muncul disebut sebagai gagal. Apabila peluang sukses diberi simbol “p” dan peluang gagal diberi simbol q, dan kemungkinan munculnya p dan q adalah sama, maka dapat dibatasi bahwa p = q. Dari semua kejadian yang mungkin maka dapat disimpulkan : ps = p = 1 - q = pg = q = 1 - p dimana ps adalah kemungkinan sukses pg adalah kemungkinan gagal. Sebagai contoh apabila sebuah mata uang dilemparkan secara bebas sebanyak sepuluh kali, maka apabila tidak ada unsur kebetulan atau tidak ada “kekuatan yang khusus” yang mengendalikan pelemparan uang, maka kemungkinan atau probabilitas atau peluang muncul gambar (G) adalah lima kali dan maupun angka (A) juga sebanyak lima kali. Dengan demikian kemungkinan atau peluang munculnya “G” adalah setengah (5 dari 10 kemungkinan) dan kemungkinan atau peluang munculnya “A” juga setengah (5 dari 10 kemungkinan). Jika ditulis dengan simbul : p = 1/2 dan q = 1/2 atau p = 0,5 dan q = 0,5. 1. Probabilitas Teoritis dan Probabilitas Empiris. Perbandingan kemungkinan atau peluang munculnya sukses dan gagal yang telah dijelaskan di atas adalah probabilitas teoritis. Pada kenyataannya, jika dilemparkan sebuah mata uang sebanyak sepuluh kali, maka yang muncul kemungkinan adalah 3 G dan 7 A atau 4 G dan 6 A atau Statistika. Y. Bagus Wismanto
60
61
6 G dan 4 A. Jarang sekali ditemukan muncul 5 G dan 5 A. Apabila kenyataannya diperoleh 5 G dan 5A maka hal ini dapat dikatakan sebagai unsur kebetulan belaka. Apabila pelemparan mata uang tersebut dilanjutkan lagi, misalkan saja sampai 50 kali, maka kemungkinan akan diperoleh muncul 22 G dan 28 A. Seandainya pelemparan mata uang ditambah lagi sebanyak 50 kali lagi, mungkin diperoleh muncul 26 G dan 24 A, dan seandainya ditambah pelemparan mata uang lagi sebanyak 50 kali, akan diperoleh muncul 28 G dan 23 A. Dengan demikian jika ditambahkan maka probabilitas munculnya “G” adalah : 22 26 28 76 MunculG = + + = = 0,5066 50 50 50 150
maka tampaklah bahwa dari probabilitas empiris, semakin banyak jumlah kasusnya akan semakin mendekati probabilitas teoritisnya. Oleh karena itu, yang dikatakan sebagai probabilitas empirik adalah probabilitas munculnya kejadian dari sejumlah besar percobaan/pengamatan/observasi. Jika percobaan ditambah semakin banyak lagi, maka jarak antara probabilitas teoritis dengan probabilitas empirik semakin dekat dan akhirnya sama. 2. Distribusi Gejala Diskrit. Apabila dua buah mata uang yang baik dilemparkan dengan bebas bersama-sama, maka akan diperoleh kemungkinan muncul : Mata uang I Mata uang II Perbandingan
: : :
G G G A 1 : 1
A G : 1
A A : 1
atau jika dilihat peluang muncul GG : GA : AG : AA adalah
1 1 1 1 : : : 4 4 4 4
dan jumlah keseluruhannya adalah 1. Jika diamati lebih lanjut, maka tampaklah bahwa baik GA maupun AG sebenarnya adalah sama kombinasinya. Dengan demikian perbandingannya menjadi :
Statistika. Y. Bagus Wismanto
61
62
Gejala 2G 1G1A 2A Jumlah probabilitas
Peluang/probabilitas 0,25 0,50 0,25 1
Apabila ditambahkan lagi sebuah mata uang sehingga jumlah mata uang menjadi tiga buah, maka peluang yang mungkin muncul adalah : Mata uang I Mata uang II Mata uang III Peluangnya
G G G 1/8
G G A 1/8
G A G 1/8
A G G 1/8
G A A 1/8
A G A 1/8
A A G 1/8
A A A 1/8
Jika kombinasinya dikumpulkan maka akan diperoleh : Gejala 3G 2G1A 1G2A 3A Jumlah probabilitas
Peluang/probabilitas 1/8 3/8 3/8 1/8 1
Distribusi peluang tersebut di atas disebut sebagai distribusi peluang/probabilitas diskrit. Distribusi probabilitas diskrit adalah suatu distribusi dari gejala G (dari singkatan Gejala, bukannya gambar mata uang) yang mempunyai pemunculan/penampakan G 1, G2, G3, . . . , Gn dengan peluang masing-masing p1, p2, p3, . . . , pn atau p = 1. Apabila pengamatan terhadap distribusi diskrit tersebut di atas dilakukan sebanyak N kali, maka frekuensi dari G 1, G2, G3, . . . , Gn akan mempunyai peluang Np1, Np2, Np3, . . . , Npn dengan jumlah frekuensi = N. Jumlah tersebut secara mudah dapat dilihat : Np 1, + Np2 + Np3 + . . . + Npn = N (p1 + p2 + p3 + . . . + pn) = N (1) = N, karena p1 + p2 + p3 + . . . + Pn =1. Seandainya ditindak lanjuti contoh tersebut di atas (tentang tiga mata uang, dan dilemparkan sebanyak 1000 kali, maka distribusi probabilitas/peluang dan distribusi frekuensi dari 100 pelemparan tersebut adalah :
Statistika. Y. Bagus Wismanto
62
63
Gejala (G) Probabilitas (p) Np
3G 3A 1/8 1/8 125 125
2G1A
2A1G Total 3/8 8/8 (=1) 375 1000
3/8 375
apabila digambarkan dalam histogram :
400 350 300 250 200 150 100 50 0
Prob
3G
2G1A
1G2A
3A
Gambar Histogram VII.1. Probabilitas munculnya Gambar (G) dan Angka (A) 1000 kali pelemparan 3. Distribusi Probabilitas Gejala Kontinum. Di dalam pembahasan distribusi probabilitas seperti di atas dapat diperluas untuk pembicaraan gejala kontinum, dimana G1, G2, G3, . . . , Gn diganti X1, X2, X3, . . . , Xn yang diletakkan di absis (sumbu X), dan p1, p2, p3, . . . , pn diganti f1, f2, f3, . . . , fn diletakkan di ordinat (sumbu Y).
--------------------------------------------------------------------------X1 X2 Gambar VII.2. Gambar Poligon Distribusi Probabilitas Gejala Kontinum
Statistika. Y. Bagus Wismanto
63
64
Dalam poligon atau kurve (kurve adalah poligon yang telah dilicinkan), frekuensi X1 sampai X2 ditampilkan dalam luas daerah antara sumbu X dari X1 ke X2 naik ke atas sampai ke garis kurvenya. B. Distribusi Normal Distribusi probabilitas gejala kontinum yang paling banyak diharapkan akan muncul adalah distribusi normal. Distribusi normal adalah distribusi yang paling banyak dipergunakan dalam statistika, karena berbagai eksperimen maupun data penelitian, mengikuti distribusi probabilitas yang normal atau yang sangat mendekati distribusi normal. Di samping itu, distribusi normal adalah distribusi yang sangat baik dipergunakan untuk menghampiri berbagai distribusi yang lain. Gambar VII.3 menunjukan kurve berbentuk lonceng (bell shaped kurva) yang nampaknya seperti sebuah bukit. Kurve yang menjadi grafik dari distribusi normal itu dinamakan kurve normal (normal curve) yang merupakan sebuah kurve simetrik terhadap garis vertikal melalui X = µ . Ordinat dari titik-titik kurve normal menunjukkan probailitas-probabilitas dari nilai-nilai X yang bersangkutan. Oleh karena X adalah suatu variabel yang kontinu, maka setiap garis vertikal yang menghubungkan titik dari kurve normal itu dengan sumbu mendatar (sumbu X), demikian juga luas daerah di bawah kurve normal itu dan di atas sumbu X dapat diasosiasikan dengan nilai probilitas. Sebagai contoh, apabila diukur tinggi badan 250 manusia laki-laki dewasa yang diambil secara acak, maka akan diperoleh data yang kemungkinan pada awalnya akan diperoleh tinggi badan yang jauh dari tinggi badan rata-rata, atau justru jauh lebih pendek daripada tinggi ratarata. Pada pengukuran terhadap subyek-subyek yang berikutnya akan diperoleh bahwa tingi badan yang didapatkan semakin lama semakin banyak subyek-subyek yang memiliki tingi badan disekitar tinggi badan ratarata, dan semakin sedikit subyek yang memiliki tinggi badan yang jauh menyimpang dari rata-ratanya. Semakin banyak dilakukan pengukuran maka akan semakin banyak diperoleh tinggi badan manusia yang berada disekitar rata-rata, dan kemungkinan hanya akan diperoleh satu orang saja yang memiliki tinggi badan di bawah 1 meter, atau bahkan mungkin tidak diperoleh sama sekali dari ke 250 orang tersebut, karena tinggi badan yang paling rendah ternyata Statistika. Y. Bagus Wismanto
64
65
adalah 128 Cm. Demikian pula sebaliknya mungkin hanya 1 orang saja atau bahkan tidak ada sama sekali subyek yang memiliki tinggi badan 190 Cm. Semakin banyak dilakukan pengukuran maka akan semakin banyak pula diketahui bahwa tinggi badan subyek disekitar 160-an Cm. Apabila ternyata diketahui bahwa tinggi badan laki-laki dewasa Indonesia adalah 165 Cm dan simpangan bakunya adalah 10 maka probabilitas akan diperoleh laki-laki dewasa yang diambil secara acak memiliki tinggi badan antara 155 hingga 175 Cm adalah 68,27 %, atau 7 diantara 10 laki-laki yang diukur tinggi badan probabilitasnya memiliki tinggi antara 155 hingga 175 Cm. Secara umum distribusi normal memiliki sifat-sifat penting antara lain : 1. Grafiknya selalu berada di atas sumbu X, dan dimulai dari X = X − 3S kekanan dan X = X + 3S ke kiri. 2. Bentuknya simetrik kekanan dan kekiri, 3. Bentuknya unimodal atau memiliki satu modus 4. Luas daerah grafik selalu sama dengan satu unit persegi. Distribusi normal akan membentuk kurve normal, yang dapat digambarkan sebagai berikut :
------|------------|------------|------------|------------|------------|------------|----3 -2 -1 0 +1 +2 +3 |<------68,27%----->| |<------------------95,45%----------------->| |<--------------------------------99,73%----------------------------->| Gambar VII.3. Gambar Kurve Normal. Keterangan : Dari gambar tersebut jelaslah bahwa luas daerah-daerah : diantara -1 s sampai dengan +1 s meliputi 68,27 % dari luas seluruhnya, diantara -2 s sampai dengan +2 s meliputi 95,45 % dari luas seluruhnya, diantara -3 s sampai dengan + 3 s meliputi 99,73 % dari luas seluruhnya.
Statistika. Y. Bagus Wismanto
65
VIII. KORELASI DAN REGRESI
A. Pengantar. Dalam pembahasan-pembahasan terdahulu, analisis yang dibicarakan adalah analisis untuk satu variabel. Akan tetapi sebagian penelitian-penelitian melibatkan dua atau lebih variabel, dengan tujuan untuk diketahui seberapa jauh hubungan dan kualitas hubungan antar variabel maupun untuk mengetahui apakah ada perbedaan antar kategori dalam suatu variabel pada variabel yang lainnya . Sebagai contoh, dalam penelitian ingin diketahui hubungan antara banyaknya merokok dengan tingkat kebugaran tubuh; adakah hubungan antara lamanya menganggur dengan situasi ekonomi suatu keluarga, apakah ada hubungan antara tingkat kecerdasan, dan adakah hubungan jumlah jam belajar dengan prestasi belajar, dsb. Dalam kasus yang sederhana data dikumpulkan dari dua observasi/hasil pengukuran terhadap sekelompok subyek. Dalam pengukuran tersebut, maka dari tiap individu dilakukan dua kali pengukuran, yaitu terhadap ke dua variabel yang diselidiki tersebut. Untuk mendapat gambaran dapat dilihat dari contoh dibawah ini : Tabel VIII. 1. Nilai Statistika dan Metodologi Penelitian Lima orang Subyek Subyek A B C D E
Nilai Statistika 76 95 80 65 70
Nilai Metodologi penelitian 60 84 78 50 58
Dari tabel tersebut diatas tampaklah bahwa masing-masing subyek (A, B, C, D, dan E) diukur sebanyak dua kali, yaitu pengukuran terhadap mata kuliah statistika dan mata kuliah metodologi penelitian. Oleh karena itu sering dikatakan bahwa ke dua pengukuran adalah berpasangan. Secara umum dikatakan bahwa metode korelasi hanya dapat diterapkan pada pasangan data yang dikumpulkan dari subyek (basis) yang sama. Di samping dapat dikumpulkan dua pasangan data, dapat dikumpulkan pula
67
tiga, empat data atau bahkan lebih dari subyek yang sama. Jika dimiliki N subyek dan k variabel, maka harus dilakukan k pengukuran terhadap masing-masing subyek dari N tersebut. Tujuan metode korelasi adalah untuk mengetahui seberapa besar keterkaitan (seberapa besar hubungan/relasi) antara suatu variabel dengan variabel yang lainnya, atau dapat pula dikatakan seberapa besar suatu variabel dapat dijelaskan dari variabel yang lainnya. Sebagai misal diambil dua variabel yaitu Tinggi badan sebagai “X” dan variabel berat badan sebagai “Y”. Maka dapat dilihat bahwa semakin tinggi, tinggi badan seseorang dapat diperkirakan semakin berat pula berat badan orang tersebut. Demikian pula semakin pendek seseorang biasanya beratnya juga semakin sedikit. Dari hal-hal tersebut dapat diperkirakan berat badan seseorang dari pengetahuan kita tentang tinggi badannya, atau sebaliknya. Jelaslah bahwa untuk mengetahui keterkaitan dua variabel tersebut digunakan analisis korelasi. Nilai statistik yang menggambarkan tingkatan hubungan antar dua variabel tersebut disebut koefisien korelasi. Analisis regresi sedikit lebih kompleks daripada korelasi. Contoh pengertian regresi yang jelas adalah seandainya diambil variabel pertama adalah tes masuk keperguruan tinggi dan variabel lainnya yaitu prestasi belajar, maka disadari bahwa disini tidak hanya sekedar ada keterkaitan, tetapi arahnya lebih jelas. Dapat diprediksikan bahwa mereka yang mendapat skor tinggi dalam tes masuk perguruan tinggi dapat diharapkan lebih mampu menguasai materi-materi perkuliahan diperguruan tinggi, atau dengan perkataan lain dapat diharapkan akan memiliki indeks prestasi yang tinggi pula. Dalam hal ini bukan hanya diketahui keterkaitan antara dua variabel akan tetapi dapat diprediksikan satu variabel dari variabel yang lainnya. Lebih lanjut lagi, apabila ingin diketahui hubungan antara lebih dari dua variabel, maka statistik yang digunakan untuk mengujinya adalah staistik multivariate. B. Model-model Relasi. Ada beberapa model hubungan atau relasi antara dua variabel yang menghasilkan data berpasangan. Diambil sebagai contoh suatu kelompok dengan N subyek yang diwakili angka 1, 2, 3, . . . , n sebagai subyek ke 1, subyek ke 2, subyek ke 3, dan seterusnya sampai dengan subyek yang Statistika. Y. Bagus Wismanto
67
68
ke n. Pengukuran dilakukan terhadap setiap subyek untuk variabel X dan Y, yang menghasilkan X1, X2, X3, . . . , Xn; serta Y1, Y2, Y3, . . . , Yn. Untuk jelasnya dapat dilihat dari tabel di bawah ini : Tabel VIII. 2. Dua Pengukuran Berpasagan Subyek
Pengukuran X Y
1 2 3 . . . n
X1 X2 X3 . . . Xn
Y1 Y2 Y3 . . . Yn
1. Relasi yang positif : Relasi positif akan diperoleh jika pasangan data X dan Y menunjukkan hubungan yang searah, yaitu anggota kelompok yang memiliki nilai yang tinggi pada variabel X, subyek tersebut juga memiliki nilai yang tinggi pada variabel Y, demikian pula anggota kelompok yang memiliki nilai rendah pada variabel X memiliki nilai rendah pula pada variabel Y. Untuk jelasnya dapat dilihat pada gambar (a) dibawah. 2. Relasi yang negatif : Relasi yang negatif akan dihasilkan jika pasangan data X dan Y menunjukkan hubungan yang berbanding terbalik, yaitu anggota kelompok yang memiliki nilai tinggi pada variabel X, subyek tersebut malah memiliki nilai yang rendah pada variabel Y nya. Demikian pula anggota kelompok yang memiliki nilai rendah pada variabel X malah memiliki nilai yang tinggi pada variabel Y nya. Untuk jelasnya dapat dilihat pada gambar (b) di bawah. 3. Relasi rendah dan Tidak ada relasi :
Statistika. Y. Bagus Wismanto
68
69
Relasi yang rendah atau bahkan tidak ada relasi antara X dan Y menunjukkan bahwa baik X dan Y tidak mempunyai hubungan yang pasti, dimana anggota kelompok yang memiliki nilai rendah pada variabel X, memiliki nilai yang tinggi pada variabel Y, anggota kelompok yang memiliki nilai yang sama rendahnya pada variabel X, akan tetapi subyek tersebut memiliki nilai yang rendah pula pada variabel Y, bahkan subyek yang lain memiliki nilai yang menengah di variabel Y nya. Demikian pula sebaliknya. Untuk jelasnya lihat pada gambar (c) dan (d) dibawah.
Y
.
.
.
Y
. ... .
.
..
. .
.
.
. .
.
.
.
.
.
. .
.
.
.
.
. .
.
.
.
.
.. 0
X
0
X Gambar VIII.1. Relasi positif (a) (b)
. .
.
. .
. .
. .
Y .
.
. . .
. .
. .
.
.
. .
.
.
. .
.
. .
.
Y .
Gambar VIII.2. Relasi Negatif
.
.
.
.
. .
Statistika. Y. Bagus Wismanto
69
70
.
.
. . .
.
.
.
0
.
X
0
X Gambar VIII.4 Relasi yang (d) Rendah (c)
Gambar VIII.5 Tidak ada relasi.
C. Persamaan Garis Lurus. Persamaan garis lurus adalah :
Y=bX+a
dimana : a adalah besaran konstanta, yaitu jarak pada sumbu Y dari titik nol sampai dengan titik dimana sumbu Y terpotong oleh garis persamaan. a adalah suatu nilai dimana ketika X = 0, maka dalam persamaan garis lurus akan diperoleh bahwa Y = a. b adalah slope dari garis lurus. Slope adalah tingkat kemiringan garis lurus. Kemiringan garis lurus ini diperoleh dari perdandingan antara jarak vertikal dan horisontalnya atau perbandingan pertambahan antara Y dan X. Jika dua titk diketahui maka garis lurus dapat dipastikan. Untuk jelasnya dapat dilihat dari gambar dibawah ini :
Y B BC A
C AC
0
X Gambar VIII.6. Persamaan garis lurus. Statistika. Y. Bagus Wismanto
70
71
Dari persamaan slope tersebut di atas maka dapat disimpulkan bahwa semakin kecil jarak BC akan diperoleh hasil persamaan yang semakin kecil pula yang berarti semakin kecil nilai slopenya, sehingga garis lurus yang dihasilkan semakin miring atau semakin menuju ke horisontal. Demikian pula sebaliknya, semakin besar jarak BC maka semakin besar pula hasil persamaannya, yang berarti semakin tegal letak garis lurusnya. D. Korelasi. Analisis korelasi membahas tentang derajat hubungan antara variabel-variabel, terutama untuk data yang kuantitatif. Simbol yang dipakai untuk korelasi adalah r. Derajat hubungannya (hasil “r” nya) dinamakan koefisien korelasi. Ada beberapa teknik korelasi, akan tetapi pertama-tama yang hendak dibahas adalah teknik Korelasi Product Moment dari Karl Pearson. Analisis Korelasi Product Moment umumnya layak dilakukan apabila : 1. Datanya dalam bentuk data interval atau rasio. 2. Distribusi X dan Y mempunyai hubungan yang linier (membentuk garis lurus) 3. Kedua varians dari distribusinya hampir sama 4. Distribusinya masing-masing tidak memiliki mode lebih dari dua. 5. Sampel diambil secara random/acak. Hal ini sebenarnya terkait dengan prasarat nomor 3 dan 4 di atas, di mana jika sampel diambil secara acak pada umumnya akan menghasilkan distribusi yang normal, variansnya kemungkinan sama dan modenyapun hanya satu. Cara pengambilan sampel secara acak juga menjadi sarat bagi kelayakan generalisasi. Generalisasi adalah penerapan hasil yang diperoleh dari sampel, kepada populasinya. Koefisien korelasi adalah suatu nilai yang berkisar dari − 1 sampai dengan +1. Nilai negatif menunjukkan bahwa arah relasinya adalah negatif (skor-skor X yang menurun sedangkan skor-skor Y naik), sedangkan nilai positif menunjukkan arah relasinya yang positif (X naik diikuti kenaikkan pula pada nilai-nilai Y).
Statistika. Y. Bagus Wismanto
71
72
Pada masa kini penghitungan korelasi dapat dengan mudah dihitung dengan computer. Meskipun begitu pengetahuan penghitungan korelasi secara manual perlu diketahui pula. Rumusnya adalah sebagai berikut : 1, Rumus dengan mempergunakan nilai simpangan/deviasi :
rXY =
∑ ( X − X )(Y − Y ) ∑ ( X − X ) ∑ (Y − Y ) 2
2
=
∑ xy ∑x ∑y 2
2
Dalam beberapa hal ada pula yang cenderung lebih senang menemukan koefisien korelasinya dengan mempergunakan skor mentah atau data asli dari hasil pengukurannya (tidak mempergunakan simpangan). Rumus yang digunakan sebenarnya adalah perpanjangan dari rumus deviasi, sebagai berikut :
∑ xy = ∑ XY −
(∑ X )(∑ Y ) N
(∑ X ) −
2
∑x
2
=∑X
maka :
2
rXY =
2
dan
N
(∑ Y ) ∑ y = ∑Y − N 2
2
(∑ X )(∑ Y ) ∑ XY − N (∑ X ) (∑ Y ) ∑ X − Y − ∑ N N 2
2
2
2
2. Rumus dengan angka mentah : Telah disebutkan di atas bahwa rumus korelasi perpanjangan dari rumus deviasi, sebenarnya juga disebut sebagai rumus skor mentah, namun terdapat modifikasi tergadap rumus tersebut dan menghasilkan rumus sebagai berikut :
Statistika. Y. Bagus Wismanto
72
73
rXY =
{N ∑ X
N ∑ XY − ∑ X ∑ Y 2
− (∑ X ) 2
}{ N ∑ Y
2
− (∑ Y ) 2
}
Baik rumus skor mentah sebagai hasil perpanjangan rumus deviasi maupun rumus dengan skor mentah yang kedua, keduanya akan menghasilkan koefisien korelasi yang sama besar. Sebagai ilustrasi dipergunakan data tentang nilai 10 subyek dalam mata kuliah statistik (X) dan mata kuliah metodologi penelitian (Y). Kedua variabel tersebut diduga memiliki keterkaitan satu dengan yang lainnya. Data dan penghitungannya adalah sebagaisebagai berikut :
Statistika. Y. Bagus Wismanto
73
74
Tabel VIII. 3. Nilai Statistik dan Metodologi Penelitian
S
X
Y
x
y
x
2
y2
xy
X2
Y2
XY
1 2 3 4 5 6 7 8 9 10
60 70 50 80 80 90 70 70 60 70
50 60 50 70 70 80 80 60 50 70
-10 0 -20 +10 +10 +20 0 0 -10 0
-14 -4 -14 +6 +6 +16 +16 -4 -14 +6
100 0 400 100 100 400 0 0 100 0
196 16 196 36 36 256 256 16 196 36
140 0 280 60 60 320 0 0 140 0
3600 4900 2500 6400 6400 8100 4900 4900 3600 4900
2500 3600 2500 4900 4900 6400 6400 3600 2500 4900
3000 4200 2500 5600 5600 7200 5600 4200 3000 4900
10
700
640
0
0
1200
1240
1000
50200
42200
45800
Dari data tersebut ditemukan : X =
rXY =
∑X N
=
700 = 70 10
∑ xy ∑x ∑y 2
2
dan
Y =
∑ Y = 640 = 64 N
rXY =
atau
10
1000 (1200)(1240)
= 0,819782294
atau dengan rumus angka mentah diperoleh : rXY =
{N ∑ X
N ∑ XY − ∑ X ∑ Y 2
− (∑ X ) 2
}{ N ∑ Y
2
− (∑ Y ) 2
}
atau hasilnya adalah :
rXY =
10(45800) − (700)(640)
{10(50200) − (700) }{10(42200) − (640) } 2
= 0,819782294
2
Dengan demikian besar korelasi antara X dan Y adalah 0,8198 Apabila dihitung dengan menggunakan rumus skor mentah yang lain akan diperoleh :
Statistika. Y. Bagus Wismanto
74
75
rXY =
(∑ X )(∑ Y ) ∑ XY − N ( X ) (∑ Y ) ∑ X − ∑ Y − ∑ N N
2
2
2
2
Dari rumus tersebut di atas, maka angka-angka dalam tabel VIII.3 dapat dimasukan ke dalam persamaan sesuai pada notasinya, dan hasilnya adalah sebagai berikut :
45800 − rXY =
(700)(640) 10
(700)2 42200 − (640)2 − 50200 10 10
= 0,81978
Hasil yang diperoleh menunjukkan bahwa tidak ada perbedaan hasil antara ke duanya. Dengan demikian ke dua rumus dapat dipergunakan, rumus mana yang hendak dipergunakan tergantung kepada selera pemakai. E. Korelasi Jenjang (Rank Order Correlation). Korelasi urutan jenjang dari Spearman adalah salah satu teknik statistik non parametrik, dengan simbol ρ (rho). Statistik non parametrik biasa pula dikatakan sebagai distribution free (bebas distribusi atau mengabaikan bentuk distribusi datanya), yaitu tidak mempersoalkan apakah distribusi datanya normal atau tidak. Dalam teknik analisis ini data kedua variabel dalam bentuk ordinal, yaitu data dalam bentuk urutan atau jenjang dari yang paling tinggi sampai yang paling rendah. Seandainya ada lima orang subyek (A, B, C, D dan E), maka tentu saja mereka akan menempati urutan ke 1, ke 2, ke 3, ke 4 dan ke 5. Seandainya lima orang tersebut diukur inteligensi dan prestasi mathematikanya, maka dapat disusun dalam tabel sebagai berikut :
Statistika. Y. Bagus Wismanto
75
76
Tabel VIII. 4. Jenjang Inteligensi dan Mathematika dari Lima Orang Subyek Subyek
Jenjang Inteligen si
Jenjang Mathematika
Subyek
Jenjang Inteligen si
Jenjang Mathematika
A B C D E
1 2 3 4 5
1 2 3 4 5
A B C D E
1 2 3 4 5
5 4 3 2 1
Dari gambaran tabel data sebelah kiri tersebut di atas maka akan dihasilkan koefisien korelasi rho yang positif sempurna yaitu ρ = + 1,00 . Dalam contoh ini subyek urutan pertama pada satu variabel menempati urutan pertama pula pada variabel yang lain; subyek urutan ke dua menempati pula urutan ke dua pada variabel yang lainnya, demikian seterusnya pada seluruh subyek. Sedangkan pada tabel data sebelah kanan akan diperoleh koefisien korelasi rho yang negatif sempurna, yaitu ρ = - 1,00. Dalam contoh yang ke dua, merupakan kebalikan dari contoh yang pertama, yaitu subyek yang menempati urutan pertama pada salah satu variabel malah menempati urutan paling akhir pada variabel yang ke dua. Untuk menghitung korelasi rho dapat dilakukan dengan rumus :
ρ = 1−
6∑ B 2
N ( N 2 − 1)
dimana : B adalah beda antara pasangan N
adalah
jumlah
subyek.
Beda antar pasangan pada beberapa buku dipergunakan juga huruf “d” yang berarti different, namun pada prinsipnya adalah sama. Contoh selengkapnya, seandainya ditemukan data sebagai berikut :
Statistika. Y. Bagus Wismanto
76
77
Tabel VIII. 5. Jenjang Inteligensi dan Mathematika Sepuluh Subyek Subyek
Jenjang Inteligensi
Jenjang Mathematika
B
B
A B C D E F G H I J
1 3 4 7 6 9 8 10 2 5
1 2 5 9 6 8 10 7 4 3
0 1 1 2 0 1 2 3 2 2
0 1 1 4 0 1 4 9 4 4
10
-
-
-
28
2
Dari contoh soal tersebut di atas dapat dihitung :
ρ = 1−
6∑ B 2
N ( N − 1) 2
Maka
ρ = 1−
6( 28) = 0,83 10(100 − 1)
Berdasarkan perhitungan tersebut di atas, tampaklah bahwa penghitungan korelasi jenjang rho sangatlah mudah. Akan tetapi sekali lagi perlu diingat bahwa teknik ini hanya diperuntukkan data ordinal, dengan jumlah pasangan subyek lebih dari 9 (sembilan) dan maksimal berjumlah 30, dengan sedikit jenjang kembar. Jenjang kembar : Jenjang kembar terjadi apabila ada dua subyek yang memiliki nilai sama besar sehingga mereka menempati jenjang yang sama. Dalam hal demikian, maka cara yang terbaik adalah menjumlahkan jenjang yang seharusnya mereka berdua tempati dan membagi dua. Sebagai misal, subyek D dan E mempunyai skor inteligensi yang sama yaitu 110 dan 110, sehingga mereka seharusnya menempati jenjang 6 dan 7, maka jenjang mereka berdua dijumlahkan, dibagi dua dan hasil baginya (yang sama besar) menjadi jenjang mereka berdua, sehingga diperoleh 6+7:2 adalah 6,5. Dengan demikian baik D maupun E masing-masing menempati jenjang yang sama yaitu 6,5.
Statistika. Y. Bagus Wismanto
77
78
F. Analisis Regresi. Analisis regresi yang dibicarakan pada saat ini hanya analisis regresi dengan satu prediktor saja. Analisis regresi dengan dua prediktor atau lebih hendak dibicarakan dalam statistik II. Analisis regresi akan bermanfaat dalam : 1. Memberi pengetahuan dasar untuk melakukan prediksi, dan perbedaannya dengan analisis korelasi. 2. Pembeciraan analisis regresi memberikan pengetahuan dasar untuk analisis yang lebih rumit, yaitu analisis kovarians. Fungsi pokok analisis regresi dengan satu prediktor adalah : 1. Menemukan korelasi antara kriterium dan prediktornya. 2. Menguji apakah korelasi tersebut signifikan atau tidak. 3. Menemukan persamaan garis regresinya. Pada analisis regresi lebih dari satu prediktor dapat pula ditemukan sumbangan relatif antara masing-masing prediktor. Setiap pasang hasil pengukuran dapat dijelaskan dengan suatu penggambaran berupa titik-titik pertemuan antara sumbu “X” dan sumbu “Y” (kuadran I). Seperti pada tabel korelasi statistik dan metodologi penelitian di atas, kolom 2 dan kolom 3 merupakan hasil pengukuran terhadap penguasaan statistik dan metodologi penelitian dari 10 orang subyek. Tentu saja dari perolehan data dapat digambarkan dalam sebuah sebaran titik-titik data dan dapat pula digambar garis lurusnya yang merupakan best fit (garis yang paling cocok) untuk sebaran data tersebut. Persamaan garis lurusnya adalah : Y = bX + a Telah dijelaskan dimuka bahwa kelebihan dari analisis regresi adalah kemampuannya dalam memprediksikan variabel akibat (dependent variable) dari variabel sebabnya (independent variable), setelah diketahui persamaan garis lurusnya. Dapat pula dikatakan variabel yang diramalkan/diprediksi dikatakan sebagai kriterium (Y), sedangkan variabel yang digunakan untuk memperkirakan disebut sebagai prediktor (X). Disebutkan pula dimuka bahwa slope disimbolkan oleh “b”, dan dimana garis persamaan memotong sumbu Y adalah “a”. Nilai “b” dan “a” dapat dihitung dengan persamaan sebagai berikut : Statistika. Y. Bagus Wismanto
78
79
b XY =
a XY =
N ∑ XY − ∑ X ∑ Y N ∑ X 2 − (∑ X ) 2
=
∑ XY − NXY ∑ X − NX
∑Y − b ∑ X = Y − b
2
XY
N
XY
2
dan
X
Di mana : ΣX dan ΣY adalah jumlah nilai X dan Y ΣXY merupakan jumlah dari perkalian antara X dan Y 2 ΣX adalah jumlah kuadrat X Sedangkan X dan Y adalah nilai rata-rata X dan Y. Dari contoh data 10 orang yang diukur kemampuan statistik dan metodologi penelitiannya tersebut di muka, maka dapat dihitung nilai “b” dan “a” nya sebagai berikut : b XY =
10( 45800) − ( 700)( 640) = 0,833333 10(50200) − ( 700) 2
a XY =
640 − ( 0,8333333)( 700) = 5,666666669 10
Dari hasil perhitungan tersebut di atas, maka dapat ditentukan persamaan garis lurusnya adalah : Y = bX + a,
maka :
Y = 0,833333 X + 5,666666669 Dengan ditemukannya persamaan garis tersebut maka dapat dilakukan prediksi terhadap nilai-nilai Y (metodologi penelitian) dengan mempergunakan nilai-nilai X (statistik) yang diketahui. Hal tersebut dapat dijelaskan secara teoritis bahwa penguasaan terhadap statistik merupakan dasar dan fondasi yang penting bagi penguasaan materi metodologi penelitian, karena di dalam metodologi penelitian banyak mempergunakan penerapan-penerapan teknik-teknik statistik, sehingga kekurangan dalam penguasaan teknik statistik akan berpengaruh pada kemampuannya dalam menerapkannya di metodologi penelitian. Seandainya dalam mata kuliah
Statistika. Y. Bagus Wismanto
79
80
statistik diperoleh nilai 100, maka subyek tersebut dapat diperkirakan akan memperoleh nilai metodologi penelitian : Y (metodologi penelitian) = (0,8333333) (100) + 5,666666669 = 89. Dengan demikian seorang subyek yang mendapat nilai 100 untuk statistik, diperkirakan akan memperoleh nilai 89 untuk metodologi penelitian. Cara lain untuk mendapatkan nilai slope, adalah dengan metode simpangan, yaitu dengan rumus : Persamaan garis regresinya adalah : y = bXYx b XY =
dimana :
y=Y −Y
dan
x=X −X
∑ xy ∑x 2
Oleh karena itu maka persamaannya menjadi : (Y − Y ) = b XY ( X − X ) G. Uji Signifikansi nilai r. Untuk menguji apakah nilai “r” yang diperoleh dalam penghitungan terhadap data sampel tidak berbeda dengan nilai “r” dalam populasi atas dasar pokok pikiran bahwa nilai “r” dari populasi adalah nol, adalah mudah yaitu dengan membandingkan nilai “r” yang diperoleh dengan nilai “r” tabel yang tersedia dalam lampiran baik untuk taraf signifikansi 5 % maupun taraf signifikansi 1 %. Tabel r mencantumkan batas-batas nilai r yang signifikan pada taraf 5 % dan 1 %. Apabila nilai r yang diperoleh adalah sama dengan atau lebih besar daripada nilai r (dengan “N” yang sama) pada tabel, maka nilai r hasil penghitungan dinyatakan signifikan. Dengan nilai r yang signifikan, maka ditolaklah hipotesis yang menyatakan bahwa korelasi antara X dan Y dalam populasi adalah nol, atas dasar taraf signifikansi yang digunakan (5 % atau 1 %). Hal ini sama saja dikatakan bahwa tidak mungkin diperoleh nilai r tertentu dari sampel yang diambil secara random kalau nilai r nya dalam populasi adalah nol, sebab batas-batas nilai yang disebab oleh kesalahan sampling (cara pengambilan sampel) sudah dilewati. Statistika. Y. Bagus Wismanto
80
81
Kalau tabel r dicermati, maka tampaklah bahwa bilangan-bilangan yang membatasi signifikansi yidak semua nilai r nya tergantung kepada jumlah subyek (N) yang diselidiki dalam sampel. Makin besar N makin rendahlah batas signifikansinya. Dalam perhitungan korelasi tersebut di muka diperoleh rXY = 0,819782294 atau jika dibulatkan rXY = 0,820 dan dari hasil ini diadakan pengujian apakah nilai itu signifikan atau tidak atas dasar taraf signifikansi 5 %. Jumlah subyek (N) yang diperhitungkan adalah 10, dengan melihat jumlah N=10 pada tabel kemudian ditarik ke kanan dan diperoleh nilai di bawah taraf signifikansi 5 % adalah 0,632. Oleh karena nilai r yang diperoleh dari penghitungan adalah lebih besar daripada nilai r tabel (rXY > rt) maka nilai r yang diperoleh dari penghitungan dikatakan signifikan. Apabila dibandingkan dengan nilai dibawah taraf signifikansi 1 % pun (0,765) nilai yang diperoleh dari penghitungan masih lebih besar, maka nilai r hasil penghitungan tersebut dapat dinyatakan sangat signifikan. Dengan demikian ditolaklah hipotesis nihil yang menyatakan bahwa nilai r dalam populasi adalah nol/nihil (tidak ada korelasi antara X dan Y, dalam contoh ini adalah tidak ada korelasi antara pengetahuan statistik dan metodologi pengetahuan). Oleh karena hipotesis nihil ditolak, maka yang diterima adalah hipotesis alternatifnya, yaitu ada korelasi/hubungan antara X dan Y Perlu diingat dalam prasarat umum terhadap korelasi, adalah bahwa sampel yang dianalisis dalam penghitungan
haruslah sampel yang
diambil secara random/acak dari populasinya. Hal ini terkait dengan keabsahan generalisasi (penerapan) hasil penghitungan, yaitu bila sampel diambil secara random maka dapat digeneralisasikan kepada populasinya.
Statistika. Y. Bagus Wismanto
81
82
SOAL-SOAL : 1. Berikut ini adalah pasangan data : X Y
2 3
5 6
8 7
7 7
1 4
9 8
3 2
8 7
8 8
4 3
Hitunglah (a) korelasi antara X dan Y; (b) Slope garis regresi untuk memprediksi Y dari X dan (c) persamaan garis regresinya. 2. Berikut ini adalah data tentang Tinggi Badan dan jauhnya loncatan pada beberapa subyek, sebagai berikut : Tinggi Badan Jauh Loncat a. b. c. d.
156
172
166
148
180
165
160
155
165 160
3,6
4,0
3,8
3,4
4,2
3,8
3,7
3,5
3,8
3,5
Nyatakanlah hipotesisnya Ujil;ah hipotesis yang Saudara nyatakan tersebut di atas. Ubahlah data tersebut di atas ke dalam data ordinal Ujilah korelasi data ordinal tersebut
3. Berikut ini adalah data hasil pengukuran IQ (X) untuk anak sekolah tertentu dan prestasi pengetahuan umum (Y), sebagai berikut : X
Y
X
Y
X
Y
114 110 112 134 115 132 90 121 107 121 124
28 41 48 74 56 80 40.
128
70 66 67 64 38 78 49 59 66 67 46 48
96
44 32 50 56 58 48 56 44 47 59 47 48
98
75 42 65 53 31
140 136 140 125 134 104 122 112 126 96 106
89 104 126 107 98 136 106 98 96 116 100
a. buatlah distribusi frekuensinya Carilah regresi liniernya dan gambarkan c. Jelaskan koefisien arah yang diperoleh b.
Statistika. Y. Bagus Wismanto
82
83
Berapa rata-rata prestasi belajar dan IQ e. Dengan IQ 120, berapakah kemungkinan prestasi belajarnya ? f. Jika Andi mendapat nilai pengetahuan umum = 74, berapa orangkah yang mendapat bnilai di atasnya ? d.
4. Andaikan saja data X = prosentase normal haemoglobin darah dan Y = sel-sel darah merah (dalam juta) per mm kubik. Datanya adalah sebagai berikut : X
82
88
94
100
106
109
Y
5,2 6,5
5,4
6,4
7,0
7,8
7,8
6,6
7,1
7,4
7,6
8,4
6,4
6.6
6,9
7,6
7,6
6,0
7,6
7,6
8,5
6,6 Analisislah dengan analisis regresi terhadap data tersebut secara lengkap.
Statistika. Y. Bagus Wismanto
83
IX. Sampling dan Distribusi Sampel Sampling
diartikan
sebagai
cara
pengambilan
sampel
dari
populasinya. Populasi didefinisikan sebagai keseluruhan obyek, manusia, skor hasil pengukuran atau kejadian-kejadian yang diselidiki. Sampel adalah sebagian yang diambil dari populasi yang diambil dengan cara-cara tertentu. Sampel adalah sejumlah subyek yang mencerminkan populasinya atau memiliki karakteristik yang dimiliki populasinya. Oleh karena itu sampel biasa pula dikatakan sebagai miniatur dari populasi. Kegiatan sehari-hari yang mengilustrasikan sebagai sampel dan populasi adalah ketika seseorang memberi sejumlah gula kedalam air teh yang dibuat, maka untuk mencicipi teh tersebut sudah cukup manis atau belum, orang mengambil satu sendok air teh dan mencicipinya. Ketika dirasakan bahwa air teh yang diambil dengan sendok sudah manis, maka orang tersebut menyimpulkan bahwa air teh yang ada dalam seluruh gelas adalah manis. Dari contoh tersebut dapat diambil kesepadanan bahwa air teh di dalam gelas adalah populasi (yang diselidiki manis atau tidak), sedang air teh yang diambil dengan sendok adalah sampelnya, yang merupakan wakil dari air teh seluruh gelas. Meskipun yang dirasakan manis adalah air teh yang ada di dalam sendok, akan tetapi kesimpulannya diterapkan kepada seluruh air teh yang ada di dalam gelas. Demikian pula ketika seseorang ingin mengetahui golongan darahnya, maka pihak Palang Merah Indonesia yang berusaha menentukan golongan darah mengambil dua-tiga tetes darah. Dari dua atau tiga tetes darah tersebut diselidiki dan diketahui golongan darah orang tersebut. Dua atau tiga tetes darah yang diselidiki tersebut dikatakan sebagai sampel sedangkan darah yang ada di dalam seluruh tubuh dikatakan sebagai populas. Penelitian golongan darah dari dua-tiga tetes darah yang diambil digunakan untuk mengambil kesimpulan darah di seluruh tubuh. Penerapan kesimpulan penelitian dari sampel kepada populasinya ini disebut sebagai generalisasi. Sebagian besar pengetahuan manusia tentang dunia sekitarnya adalah hasil dari sampel. Ketika seseorang makan di suatu restaurant, orang tersebut akan memperoleh pengetahuan kualitas masakan dan pelayanan dari restaurant tersebut, sehingga orang tersebut dapat mengajukan pendapatnya tentang restaurant itu. Ilustrasi lain, ketika seseorang berjumpa
dan berbincang-bincang dengan sekelompok turis dari Inggris maka orang tersebut akan memperoleh pengetahuan dan mengenal bagaimana sikap orang Inggris, dan orang tersebutpun dapat mengajukan pendapatnya tentang orang Inggris. Memang sangat sering pengetahuan yang diperoleh adalah kurang akurat, sehingga pendapatnyapun kurang tepat. Akan tetapi pengetahuan yang diperoleh dan pendapat yang disimpulkan dari suatu kejadian jauh lebih akurat daripada orang tersebut tidak mempunyai pengalaman sama sekali tentang hal yang dibicarakan. Semakin banyak pengalaman orang, maka semakin akuratlah pendapatnya. Proses dalam pembentukan pendapat memang bisa di samakan dengan pola kerja penelitian. Untuk meneliti kualitas sebuah restaurant kita makan direstaurant itu paling tidak satu kali. Untuk berpendapat tentang sikap orang Inggris, dapat diingat pengalaman tentang orang Inggris. Pengalaman sekali makan di restaurant, dan pengalaman berjumpa dengan orang Inggris sebagai sampel diterapkan kepada seluruh restaurant dan bangsa Inggris sebagai suatu populasi. Perlu disadari bahwa sampel yang digunakan untuk mengetahui golongan darah adalah cukup dua atau tiga tetes darah saja, namun untuk mengetahui kualitas masakan sup yang ada dalam sebuah panci dengan dua atau tiga tetes saja adalah tidak cukup. Dua atau tiga tetes kuah sup hanya dapat dipergunakan untuk mengetahui enak tidaknya kuah, sedang empuk tidaknya daging, wortel, brokoli, kacang kapri, makaroni dsb belum diketahui atau belum terwakili. Oleh karena itu untuk sampel sup yang ada dalam sebuah panci membutuhkan setengah mangkuk sup yang berisi semua komponen yang ada dalam sup tersebut. Berdasar contoh-contoh tersebut di atas, maka dapat ditarik pengertian bahwa semakin heterogen karakteristik populasi, maka semakin besar jumlah sampel yang dibutuhkan agar sampel tersebut representatif sedangkan semakin homogen populasinya semakin kecil jumlah sampelnya. Sebagian besar statistik berbicara masalah penghitungan terhadap sampel yang digunakan untuk mengestimasikan keadaan populasinya. A. Cara-cara Penarikan Sampel. Tuntutan statistik inferensial adalah adanya penarikan sampel secara random / acak dari populasinya. Sampel yang dihasilkan disebut sampel random. Disamping sampel random, dikenal pula sampel non random.
Statistik 1. Y. Bagus Wismanto
84
Pembicaraan terperinci dan lanjut tentang cara-cara penarikan sampel dibicarakan dalam metode penelitian. Secara sederhana pemahaman sampel random dan sampel non random adalah sebagai berikut : 1. Sampel random. Suatu sampel dapat disebut sebagai sampel random apabila setiap anggota populasi mempunyai peluang yang sama untuk terpilih sebagai anggota sampel. Ada beberapa cara penarikan sampel secara random, diantaranya yang paling banyak digunakan adalah cara “lotere” atau cara arisan. Penarikan sampel secara lotere atau arisan dilakukan dengan langkah : a. Setiap anggota populasi diberi nomor urut. Untuk melaksanakan hal ini tentu saja jumlah anggota populasi harus diketahui (definite population). b. Setiap nomor ditulis dalam secarik kertas dan digulung. c. Gulungan dimasukkan ke dalam suatu tempat, dikocok dan dikeluarkan satu demi satu d. Nomor-nomor yang keluar, dijadikan nomor yang menjadi anggota sampel. Cara tersebut di atas jika dikaitkan dengan definisi sampel random, maka konsekuensinya adalah setiap kali gulungan kertas/nomor dikeluarkan, maka gulungan kertas yang telah keluar harus dikembalikan lagi (replacement), agar peluang setiap anggota populasi tetap sama. Apabila tidak dikembalikan lagi maka peluang anggota populasi semakin lama semakin besar, karena jumlah anggota populasi semakin lama semakin berkurang sebagai akibat dikeluarkan dari keanggotaan populasi. Beberapa peneliti mempunyai pendapat bahwa sampel random tidak perlu replacement, karena yang penting adalah pengambilan anggota sampel secara acak, tidak pilih-pilih. Hal ini terkait dengan perbedaan pemahaman tentang random dan arbitrary selection (pemilihan secara sembarang). Didalam arbitrary selection orang tidak perlu sama sekali menghubungkannya dengan dengan probability, karena setiap pemilihan yang tidak teratur atau tidak mengikuti aturan tertentu dapat dianggap merupakan
arbitrary
selection.
Sedangkan
dalam
random
selection
pemilihan dengan mempertimbangkan probality-lah yang diperhatikan. Dalam random selection dapat dianggap bahwa ada aturan yang harus
Statistik 1. Y. Bagus Wismanto
85
diikuti yaitu setiap anggota golongan/populasi harus memiliki kesempatan yang sama untuk mewakili golongan/populasinya. Pentingnya pengambilan sampel dengan memasukkan unsur random selection
adalah
karena
menjadi
syarat
mutlak
untuk
dapat
mengestimasi/menaksir standard error. Semestinya suatu sampel yang tidak didasarkan pada random selection tidak dapat dianalisis secara statistik. 2. Sampel non random. Disamping penarikan sampel secara random dikenal pula beberapa cara penarikan sampel secara non random. Cara penarikan sampel non random ini secara panjang lebar dapat dibaca dan dipelajari dalam bukubuku metodologi penelitian, oleh karena itu tidak dibahas di dalam buku ini. B. Manfaat Sampel. Ada tiga tujuan penarikan sampel, yaitu (a) estimasi atau penaksiran, (b) pengujian hipotesis dan (c) prediksi atau peramalan. Di samping tujuantujuan yang lain, seperti agar penelitian lebih murah, lebih mudah, lebih hemat, dsb. a. Tujuan untuk estimasi pada sampel adalah usaha untuk menentukan setepat mungkin nilai dari parameter suatu populasi. Untuk mencoba menentukan nilai tersebut dipergunakanlah sampel. Proses penaksiran itu pada umumnya dilakukan dengan menghitung terlebih dahulu statistik sampel, yaitu bilangan hasil hitungan yang menunjukkan atai menerangkan sifat suatu sampel. Telah disinggung sebelumnya bahwa kedudukan statistik sampel adalah sama dengan kedudukan parameter bagi populasi. Dengan demikian didalam estimasi, dipergunakan statistik sampel yang berfungsi sama atau sebagai penaksir parameter. Tentu di dalam estimasi terkandung juga kemungkinan kesalahan yang mungkin terjadi, yang mungkin besar yang mungkin pula sangat kecil. b. Permasalahan yang diajukan dalam suatu penelitian pada umumnya diusahakan untuk dijawab secara teoritis. Berdasarkan teori-teori yang ada dapat diperoleh jawaban terhadap permasalahan yang dihadapi secara nyata dalam permasalahan aktual, namun jawaban tersebut dinilai masih teoritis saja, jawaban teoritis itulah yang disebut hipotesis. Oleh karena jawaban masih dianggap teoritis maka dibutuhkan pengujian secara empiris, berdasarkan kenyataan yang ada di lapangan. Kenyataan di
Statistik 1. Y. Bagus Wismanto
86
lapangan itulah yang pada umumnya mempergunakan sampel. Mengenai perihal ini hendak dibahas lebih lanjut pada bab selanjutnya. c. Tujuan peramalan adalah usaha untuk menentukan suatu atau beberapa nilai yang belum terobservasi/teramati berdasarkan data yang sudah dimiliki atau sudah diobservasi. Data-data yang sudah terobservasi itulah yang menjadi sampel untuk peramalan atau prediksi. Sebagai contoh analisis terhadap sampel yang dipergunakan untuk prediksi atau peramalan adalah analisis regresi. Sudah barang tentu, peramalan tersebut masih memiliki kemungkinan adanya kesalahan. C. Kesalahan Sampling. Apabila diketahui sebuah populasi dengan jumlah subyek N, seandainya dari populasi dapat di tentukan nilai rata-ratanya maka akan diperoleh µ. Apabila dari populasi tersebut ditarik sebuah sampel, dan dari sampel tersebut dihitung nilai rata-ratanya maka diperoleh X . Apabila sampel yang diambil tersebut benar-benar baik yaitu benar-benar mewakili populasinya, maka seharusnya tidak ada perbedaan antara µ dan X . Akan tetapi pada kenyataannya ada perbedaan antara nilai rata-rata populasi dan nilai rata-rata dari sampel yang diambil dari populasi tersebut. Ketidak samaan ini disebabkan karena pengambilan sampel atau biasa disebut sampling error ( µ − X = e) . Apabila dari populasi yang sama ditarik pula sampel-sampel yang lain secara random maka akan diperoleh pula nilai nilai rata-rata yang lain, sehingga akan diperoleh X 2 ; X 3 ; X 4 ;... X n . Apabila masing-masing nilai rata-rata sampel yang diperoleh tersebut dibandingkan dengan nilai rata-rata populasinya, ternyata ada perbedaan pula antara nilai rata-rata populasi dengan nilai rata-rata dari sampel, meskipun sampelnya telah ditarik secara random. Perbedaan nilai rata-rata sampel ini mungkin lebih besar akan tetapi mungkin pula lebih kecil dari rata-rata populasinya. Perbedaan nilai rata-rata ini disebabkan kesalahan pengambilan sampel (error sampling) dan umumnya diberi simbol e. Apabila digambarkan adalah sebagai berikut :
Statistik 1. Y. Bagus Wismanto
87
µ − X 1 = e1 µ − X 2 = e2 µ − X 3 = e3 µ − X 4 = e4 .................
µ − X n = en Dari persamaan-persamaan di atas, apabila nilai-nilai rata-rata dari berbagai sampel tersebut dikumpulkan, maka akan diperoleh suatu distribusi, yang disebut sebagai distribusi nilai rata-rata. Demikian pula apabila data-data kesalahan-kesalahan sampling dikumpulkan juga akan membentuk suatu distribusi yang disebut sebagai distribusi kesalahan sampling (sampling errors). Lebih jauh lagi, dari masing-masing distribusi dapat dicari nilai simpangan baku dan nilai rata-rata, maka simpangan baku dari distribusi nilai rata-rata ( S X ) adalah sama dengan simpangan baku distribusi kesalahan sampling ( S e ) .
Sedangkan nilai rata-rata distribusi
nilai rata ( X X ) sama dengan nilai rata-rata populasi (µ). D. Distribusi Skor Rata-rata. Distribusi skor rata-rata biasa pula disebut distibusi rata-rata. Sebagai ilustrasi, diandaikan terdapat sebuah populasi (diasumsikan sebagai populasi) yang terdiri dari enam orang (meskipun jumlahnya kecil namun anggap saja sebagai sebuah populasi), yang diukur pada variabel tinggi badannya, dan hasilnya sebagai berikut : Subyek
Tinggi Badan
A
160
B
166
C
164
D
162
E
168
F
170
Rata-rata
165
Statistik 1. Y. Bagus Wismanto
88
Dari keenam subyek tersebut diperoleh Tinggi badan rata-rata populasi,
µ = 165 Cm. Dari populasi tersebut hendak diambil sampel
masing-masing terdiri dari dua subyek. Sebagai sebuah sampel, apalagi sebuah sampel dari populasi yang heterogen, jumlah tersebut adalah terlalu kecil, namun hal ini adalah sebuah ilustrasi. Seandainya dari populasi tersebut diambil sampel sampel dengan dua orang subyek (n=2), maka dengan mempergunakan teori kombinasi akan diperoleh 45 buah sampel. Cr =
n! dimana Cr adalah kombinasi dengan 2 subyek; n adalah r! (n − r )!
jumlah subyek diperoleh
:
dan C2 =
r
adalah jumlah setiap kombinasi, maka akan
6! 1 .2 .3 .4 .5 .6 = = 15 2!(6 − 2 )! (1.2)(1.2.3.4)
pasang
sampel.
Dari
penarikan sampel diperoleh pasangan data sebagai berikut : Sampel 1. A = 160 B = 166 2. A = 160 C = 164 3. A = 160 D = 162 4. A = 160 E = 168 5. A = 160 F = 170 6. B = 166 C = 164
Nilai Rata-rata dari sampel X = 163
Sampel 9. B = 166 F = 170
Nilai Rata-rata dari sampel X = 168
10. C = 164 D = 162
X = 163
11. C = 164 E = 168
X = 166
X = 161 X = 164
12. C = 164
X
= 162
F =170 X = 165
13. D = 162 E = 168
X 167
=
X = 165
X = 165
14. D = 162 F = 170
7. B = 166 D = 162
X
8. B = 166 E = 168
X = 167
X = 166
= 164 15. E = 168 F = 170
X = 169
Dari 15 sampel yang diambil untuk kemudian dihitung nilai rata-ratanya, ternyata hanya diperoleh tiga buah sampel (sampel ke 5, 6 dan 13) yang Statistik 1. Y. Bagus Wismanto
89
menghasilkan nilai rata-rata yang sama persis dengan nilai rata-rata populasinya atau X = µ. Sampel-sampel lain diperoleh nilai rata-rata di bawah atau di atas rata-rata populasinya. Dengan demikian sampel-sampel yang lain tidak mencerminkan keadaan populasi sepenuhnya atau tidak representatif, dan inilah yang disebut sebagai kesalahan sebagai akibat pengambilan sampel (sampling error). Apabila nilai rata-rata tersebut dijadikan satu di dalam suatu distribusi, dan kemudian dari distribusi terbentuk tersebut dihitung rata-ratanya, maka nilai rata-rata dari distribusi rata-rata tersebut akan sama dengan nilai rata-rata populasinya. Seandainya nilai rata-rata dari distribusi rata-rata tersebut diberi nama “M”, maka akan diperoleh M = µ. M atau X X =
∑X N
=
2475 = 165. Tampaklah bahwa nilai rata-rata populasi 15
sama dengan nilai rata-rata dari distribusi nilai rata-rata. Apabila dari distribusi nilai rata-rata tersebut juga dihitung simpangan bakunya, maka akan diperoleh simpangan baku dari distribusi rata-rata s s atau X . Namun secara singkat X dapat dihitung dari sebuah sampel saja, dengan formula sebagai berikut : sX =
s n −1 ,
dimana : sX
= simpangan baku dari distribusi rata-rata atau disebut pula standard error
s = simpangan baku sampel yang diambil n = jumlah subyek sampel. E. Kesalahan Baku (Standard Error). Pada pembicaraan kesalahan sampling tersebut di atas diketahui bahwa terdapat nilai-nilai kesalahan yang didapat dari perbedaan nilai ratarata sampel yang diambil dengan nilai rata-rata populasinya. Jika nilai-nilai kesalahan ini dikumpulkan, maka akan terbentuklah distribusi kesalahan. Dari distribusi kesalahan tersebut di atas. maka dapat dihitung nilai simpangan bakunya, yang biasa disebut sebagai simpangan baku kesalahan atau keslahan baku. Kesalahan baku tersebut dapat pula diperkirakan dari
Statistik 1. Y. Bagus Wismanto
90
satu sampel. Persamaan yang dipakai untuk memperkirakan Kesalahan baku adalah : S X2 =
S2 N
dimana :
atau sama saja
SX =
S N
S X adalah kesalahan baku
S adalah simpangan baku sampel yang berukuran " N"
F. Distribusi Proporsi. Distribusi proporsi adalah sejalan dengan distribusi rata-rata. Pada sampel dengan sejumlah N dimana terdapat peristiwa sejumlah Y diantara N. Maka terdapat parameter proporsi peristiwa A sebesar π =
Y . N
Dari populasi tersebut jika diambil sampel berukuran n dan seandainya di dalamnya terdapat peristiwa A sebanyak x, sampel tersebut memberi statistik proporsi peristiwa A =
x . Jika semua sampel yang n
mungkin diambil dari populasi tersebut maka terdapat sekelompok skor statistik proporsi. Dari kelompok tersebut dapat dihitung rata-ratanya, diberi simbul µ x dan simpangan baku diberi simbul σ x . n
n
Jika ukuran populasinya kecil, dibandingkan dengan ukuran sampel, yaitu
π (1 − π ) N − n n > 5% , maka : µ x = π dan σ x = n N −1 N n n
Jika ukuran populasi besar dibandingkan dengan ukuran sampel, yaitu n ≤ 5% maka : µ x = π N n
dan σ x = n
π (1 − π ) n
σ x disebut kekeliruan baku proporsi. n
G. Distribusi Perbedaan Rata-rata Diandaikan terdapat dua buah populasi, populasi pertama dengan jumlah subyek N1 dan simpangan baku σ 1 , sedangkan populasi kedua dengan jumlah subyek N2 dan simpangan baku σ 2 . Dari masing-masing
Statistik 1. Y. Bagus Wismanto
91
populasi diambil sampel misalkan saja dengan subyek n1 dan n2 dan diukur pada variabel X, maka dari masing-masing sampel akan diperoleh rata-rata : dan
X I 1 ; X I 2 ; X I 3 ; X I 4 ; X I 5 ;...; X Ik
X II 1 ; X II 2 ; X II 3 ; X II 4 ; X II 5 ;...; X IIr
dimana “k” adalah banyaknya sampel yang dapat diambil dari populasi pertama dan “r” adalah banyaknya sampel yang dapat diambil dari populasi kedua. Dari pembandingan rata-rata setiap sampel dari kedua populasi akan diperoleh :
X I 1 − X II 1 = bm1 X I 2 − X II 2 = bm2 X I 3 − X II 3 = bm3 X I 4 − X II 4 = bm4 X I 5 − X II 5 = bm5 . . .
. . .
. . .
X Ik − X IIr = bmk − r
Skor-skor bm1 sampai dengan bmkr dapat dibentuk sebuah distribusi, dan distribusi tersebut disebut distribusi beda rata-rata atau distribusi selisih ratarata. Dari distribusi beda rata dapat dihitung skor rata-ratanya dan diberi simbul
µ bm
dan dapat dihitung pula simpangan bakunya dan diberi simbul
σ bm . Ternyata bahwa untuk N1 dan N2, cukup besar dan sampel-sampel diambil secara independent satu dengan yang lain, terdapat hubungan :
µ bm = µ1 − µ 2 dan σ bm =
σ 12 n1
+
σ 22 n2
.
σ bm disebut sebagai simpang kesalahan beda rata-rata. Untuk ukuran-ukuran sampel dalam jumlah besar, maka selisih atau perbedaan rata-rata tersebut akan mendekati distribusi normal dengan skor rata-rata dan simpangan baku seperti tertera dalam rumus tersebut di atas.
Statistik 1. Y. Bagus Wismanto
92
X. UJI HIPOTESIS : UNTUK NILAI RATA-RATA A hypothesis (from Greek πόθεσις) consists either of a suggested explanation for a phenomenon or of a reasoned proposal suggesting a possible correlation between multiple phenomena. The term derives from the ancient Greek, hypotithenai meaning "to put under" or "to suppose." The scientific method requires that one can test a scientific hypothesis. Scientists generally base such hypotheses on previous observations or on extensions of scientific theories (http://en.wikipedia.org; 22/02/2007). Dalam English Dictionary, hypothesis berarti (1) proposition or theory assumed as a basis for reasoning, argument, or investigation or to explain certain phenomena; (2) supposition conjecture. Dalam Kamus Besar Bahasa Indonesia (2002), hipotesis berarti (1) sesuatu yang dianggap benar untuk alasan atau pengutaraan pendapat (teori, proposisi, dsb) meskipun kebenarannya masih harus dibuktikan, (2) anggapan dasar. Hipotesis berasal dari kata yaitu hypotithenai yang berarti di bawah, kurang atau lemah dan thesis yang berarti pernyataan, teori, atau proposisi yang disajikan sebagai bukti. Hipotesis diartikan sebagai kesimpulan yang sifatnya sementara karena masih perlu diuji kebenarannya secara empiris. Hipotesis merupakan kesimpulan dari dasar-dasar teori yang diajukan sebagai jawaban atas permasalahan yang ada (dalam penelitian). Dengan demikian dugaan atau kesimpulannya mungkin benar mungkin pula salah. Jika perumusan atau pernyataan hipotesis dikhususkan mengenai sampel yang diambil dari suatu populasi maka hipotesis itu disebut sebagai hipotesis statistik. Hipotesis statistik umumnya dinyatakan dalam null hypothesis atau hipotesis nihil (Ho), yaitu pernyataan tidak ada perbedaan antara dua hal (atau lebih). Sebagai contoh dari suatu sampel diperoleh nilai rata-rata ( X ) dan untuk populasi µ. maka hipotesis nihil dinyatakan :
Ho :
µ − X = 0 , yang berarti pula
Ho : µ = X
92 Hipotesis tersebut di atas berarti tidak ada perbedaan antara parameter populasi dan suatu sampel tertentu. Hipotesis nihil juga dapat dipergunakan untuk menyatakan dugaan adanya kesamaan (tidak ada perbedaan) dari dua buah nilai rata-rata, simpangan baku atau varians dari dua buah sampel. Dalam pengujian hipotesis nihil, penting pula untuk menetapkan hipotesis alternatif. Hipotesis alternatif (Ha) merupakan alternatif dari hipotesis nihil. Apabila hipotesis nihil menyatakan tidak ada perbedaan, maka hipotesis alternatif menyatakan ada perbedaan antara dua hal. Perbedaan dalam hipotesis alternatif dapat berupa lebih besar atau lebih kecil satu dengan yang lainnya. Hipotesis alternatif akan diterima jika hipotesis nihilnya ditolak. Maka dalam tes hipotesis akan diformulasikan sebagai berikut : H o : µ1 − µ 2 = 0
dan
H a : µ1 − µ 2 =/ 0
arti lebih lanjut dari hipotesis alternatif adalah kemungkinan µ1 > µ2 (rata-rata pertama lebih besar daripada rata-rata ke dua) atau µ1 < µ2 (rata-rata pertama lebih kecil daripada rata-rata ke dua). Hipotesis dapat juga menyatakan
suatu
hubungan
(bukannya
perbedaan). Sebagai contoh adalah “Tidak ada hubungan antara kecepatan lari dengan prestasi belajar” (Ho), atau “Ada hubungan antara taraf kecerdasan dengan prestasi belajar” (Ha). Oleh karena hipotesis merupakan pernyataan yang masih perlu diuji kebenarannya, maka ada beberapa macam pengujian terhadap hipotesis. Untuk melakukan pengujian hipotesis (sebagai kesimpulan yang masih teoritis), maka sampel penelitian diambil, penelitian lapangan dilakukan, pengukuran dilaksanakan untuk memperoleh data dan analisis terhadap data yang diperoleh dijalankan. Hasil penghitungan terhadap data yang diperoleh dibandingkan dengan norma atau tabelnya. Jika hasil yang diperoleh dari analisis itu (peluangnya) jauh berbeda dari hasil yang diharapkan terjadi berdasarkan hipotesis, maka hipotesis ditolak. Jika hasil analisis yang diperoleh peluangnya sama dengan hasil yang diharapkan terjadi berdasar hipotesis, maka hipotesis diterima. Dalam penerimaan dan penolakan terhadap hipotesis, ada dua Statistika. Y.Bagus Wismanto
92
93 kemungkinan kesalahan yang terjadi, yaitu :
Menerima Ha Menerima Ho
Ho benar Kesalahan tipe I (peluang α) Keputusan benar
Ha benar Keputusan yang benar Kesalahan tipe II (peluang β)
Kesalahan tipe I yaitu peluang α (alpha) adalah menerima hipotesis alternatif yang seharusnya ditolak , atau menolak hipotesis nihil yang seharusnya diterima. Kesalahan tipe II yaitu peluang β (beta) adalah menerima hipotesis nihil yang seharusnya ditolak, atau menolak hipotesis alternatif yang seharusnya diterima. Oleh karena namanya kesalahan, maka harus diusahakan untuk terjadi yang sekecil mungkin terhadap kesalahan tersebut. Peluang membuat kesalahan tipe I dinamakan peluang α, dan peluang membuat kesalahan tipe II disebut sebagai peluang β, tetapi ada pula yang menamakan sebagai kesalahan α dan kesalahan β. Peluang α dalam prakteknya disebut sebagai taraf signifikansi atau taraf kebermaknaan (seberapa tinggi makna). Besar kecilnya α dan β yang dapat diterima dalam pengambilan keputusan bergantung kepada akibat-akibat atas diperbuatnya kesalahan-kesalahan tersebut. Jika akibat yang ditimbulkan atas kesalahan yang diperbuat adalah fatal bagi kehidupan manusia atau obyek penarikan kesimpulan, maka pengambilan keputusan harus sangat hati-hati, akan tetapi pengambilan keputusan dapat lebih longgar apabila keputusan yang diambil tidak fatal atau tidak ada alternatif lain. Sebagai contoh adalah ditemukannya suatu terapi bagi suatu penyakit yang sangat cepat menuju kematian, akan diambil sebagai tindakan terapi bagi seseorang yang mengidap penyakit tersebut, meskipun probabilitas kesembuhannya hanya 50 % (α = 0,50), karena belum ada terapi yang lain yang dapat menyembuhkan. Kedua kesalahan α dan β di atas adalah saling berkaitan. Jika α diperkecil maka β menjadi besar dan demikian sebaliknya. Pada dasarnya harus dicapai hasil pengujian hipotesis yang baik yaitu pengujian dengan
Statistika. Y.Bagus Wismanto
93
94 memilih nilai α yang kecil. Sebagai praktisnya, nilai α biasanya diambil α = 0,01 (1 %) atau α = 0,05 (5 %). α = 0,01 artinya kira-kira ada 1 (satu) kemungkinan dari tiap 100 kesimpulan bahwa hipotesis akan ditolak yang seharusnya diterima. atau ada 99 % dapat diyakini bahwa telah diambil kesimpulan yang benar. Dengan demikian dikatakan bahwa hipotesis telah ditolak pada taraf signifikansi 1% yang berarti diambil resiko kesalahan dengan peluang 1 %. A. Langkah Pengujian Hipotesis. Sudah disebutkan di atas bahwa hipotesis adalah kesimpulan yang bersifat sementara, karena disimpulkan berdasarkan telaah teoritis saja, dan masih perlu diuji kebenarannya berdasarkan data empiris atau fakta di lapangan. Hasil penghitungan statistik terhadap data empiris akan membawa ke kesimpulan bahwa hipotesis diterima atau ditolak. Hipotesis nihil biasa dinyatakan H o : µ1 − µ 2 = 0 dan hipotesis alternatif biasa dinyatakan H a : µ1 − µ 2 =/ 0 . Apabila apabila hipotesis alternatif ditolak maka berarti hipotesis nihillah yang diterima, yang berarti tidak ada perbedaan antara dua nilai rata-rata. Demikian pula sebaliknya apabila hipotesis nihil ditolak, maka hipotesis alternatiflah yang diterima, yang berarti ada perbedaan antara dua nilai rata-rata. Dalam hal ini tidak ada pernyataan tentang arah perbedaan apakah µ1 atau µ2 yang lebih besar atau lebih kecil. Pengujian semacam ini disebut sebagai nondirectional test atau pengujian tanpa menunjukkan arah. Pengujian semacam ini juga disebut pengujian dua sisi (two-tailed atau two-sided test), sebab jika distribusi normal digunakan, dua sisi dari distribusi adalah estimasi terhadap probailitas. Seandainya di ambil 5% taraf signifikansinya, jika distribusi sampel adalah normal, 2,5% dari area kurve akan berada di 1,96 simpangan baku di atas nilai rata-rata dan 2,5% dari area kurve akan berada di 1,96 simpangan baku di bawah nilai rata-rata. Area di luar batas tersebut secara keseluruhan adalah 5 %. Jadi dalam taraf signifikansi 5% untuk uji tanpa arah, terhadap distribusi sampling yang normal perbedaan hasil observasi harus sama dengan atau lebih besar dari 1,96 kali simpangan baku dari distribusi. Untuk taraf signifikansi 1%, untuk pengujian tanpa arah adalah 2,58 simpangan baku di atas dan di bawah nilai rata-rata.
Statistika. Y.Bagus Wismanto
94
95 Pengujian tanpa menunjukkan arah terutama diperuntukkan pada pengujian-pengujian tanpa kepastian arah. Pada dugaan-dugaan yang lebih pasti, sebaiknya dinyatakan hipotesis yang mengarah, yaitu suatu keputusan tentang arah perbedaan. Uji dua sisi :
Daerah Penolakan Ho (1/2 α) 2,5%
Daerah Penolakan Ho (1/2 α) 2,5%
Daerah Penerimaan Ho
- 1,96
+ 1,96
X
jumlah ke dua daerah penolakan = 5% Apabila arah perbedaan sudah pasti maka hipotesis yang disampaikan adalah H o : µ1 − µ 2 ≤ 0 dan H a : µ1 − µ 2 > 0 atau
H o : µ1 − µ 2 ≥ 0 dan
H a : µ1 − µ 2 < 0 . Dalam hal ini hipotesis nihil dipergunakan untuk menyatakan tiga hal yaitu hipotesis tidak ada perbedaan, hipotesis tidak ada perbedaan atau lebih kecil daripada serta hipotesis tidak ada perbedaan atau hipotesis nihil melulu hanya untuk menyatakan tidak ada perbedaan, namun hal ini kurang tepat untuk mencakup pengertian yang lebih luas di luar hipotesis alternatif. Pengujian hipotesis semacam ini disebut pengujian satu sisi. Sebagai contoh apabila dinyataka hipotesis alternatif bahwa “ada perbedaan tinggi badan antara pria dan wanita” dan hipotesis mengarah bahwa “pria lebih tinggi daripada wanita” maka hipotesis nihilnya sebagai lawab hipotesis alternatif adalah tidak ada perbedaan tinggi badan antara pria dan wanita; atau wanita lebih tinggi daripada pria. H o : µ1 − µ 2 ≤ 0 dimana µ1 adalah rata-rata tinggi badan pria dan µ2 adalah rata-rata tinggi badan wanita. Apabila distribusi normal digunakan, untuk menolak H o : µ1 − µ 2 ≤ 0 dan
Statistika. Y.Bagus Wismanto
95
96 menerima H a : µ1 − µ 2 > 0 , suatu penyimpangan lebih besar dari + 1,64 simpangan baku di atas nilai rata-rata disyaratkan untuk tingkat signifkansi 0,05 (5%).
Demikian
pula
untuk
menolak
H o : µ1 − µ 2 ≥ 0
dan
menerima
H a : µ1 − µ 2 < 0 disyaratkan suatu penyimpangan sejauh – 1,64 simpangan baku di bawah rata. Besaran 1,64 menunjukkan pada distribusi normal, area sebesar 5% berada 1,64 simpangan baku di atas dan di bawah nilai rata-rata, sedangkan untuk area sebesar 1% berada pada 2,33 di atas dan di bawah nilai rata-rata. B. Uji Signifikansi pada Nilai rata-rata tunggal. Suatu pengujian dapat dilakukan apakah sebuah rata-rata hasil pengukuran dari suatu sampel dengan jumlah subyek tertentu berbeda dengan rata-rata populasinya (µ). Dalam hal ini terdapat dua situasi yang berbeda. Pertama adalah diketahuinya rata-rata populasi, dan kemungkinan tidak diketahui simpangan bakunya. Kedua adalah populasi dimana diketahui nilai rata-rata maupun simpangan bakunya. Beberapa kasus ada yang diketahui rata-rata maupun simpangan bakunya, sebagai contoh adalah untuk inteligensi telah diketahui rata-rata dan simpangan baku dari populasinya yaitu µ = 110 dan δ = 15. Sebagian besar data populasi hanya diketahui nilai rata-ratanya saja, sebagai contoh adalah pada bungkus sabun cuci tertera isi bersih 1 kg, pada bungkus sampo tertera isi bersih 100 ml, berat 1 kaleng margarine adalah 2 kg, isi satu plastik permen adalah 100 biji, isi botol soft drink adalah 230 ml. Contoh-contoh tersebut adalah isi atau berat rata-rata, namun tidak diketahui simpangan bakunya. Pernyataan kuantitas tersebut di atas adalah pernyataan produsen tentang isi bersih rata-rata produksinya, namun dalam kenyataannya ada kemungkinan kurang dari yang dinyatakan atau bahkan lebih banyak dari yang dinyatakan pada bungkus produksinya. Sebagai contoh, jika diamati tinggi permukaan minuman soft drink di dalam botol pada 1 krat (crate / box), maka akan terlihat bahwa tinggi permukaannya tidaklah sama. Hal ini menyiratkan bahwa rata-rata sampel belum tentu sama dengan rata-rata populasinya.
Statistika. Y.Bagus Wismanto
96
97 Di pembahasan telah dijelaskan bahwa nilai rata-rata dari distribusi rata adalah sama persis dengan nilai rata-rata populasinya atau X = µ. Apabila dari distribusi nilai rata-rata tersebut juga dihitung simpangan bakunya, maka akan diperoleh simpangan baku dari distribusi
rata-rata atau
sX
. Namun
s secara singkat X dapat dihitung dari sebuah sampel saja, dengan formula sebagai berikut : sX =
s n −1 ,
dimana : sX
= simpangan baku dari distribusi rata-rata atau disebut pula standard error s = simpangan baku sampel yang diambil n = jumlah subyek sampel. Nilai rata-rata sebuah populasi dapat diuji kebenarannya berdasarkan sebuah sampel yang diambil dari populasinya. Persamaan antara nilai rata-rata populasi ( µ ) dan rata-rata sampel ( X ) adalah sebagai berikut : Untuk taraf kepercayaan 95% : µ = X ± 1,96( S X ) Untuk taraf Kepercayaan 99% : µ = X ± 2,58( S X ) Contoh : Dari 10 botol alkohol 70% yang dijual disebuah apotik, diukur isi bersih masing-masing botol dan diperoleh data sebagai berikut : Botol ke Isi :
1
2
3
4
5
6
7
8
9
10
92
96
96
94
92
92
90
92
95
93
Pada kemasan botol dicantumkan bahwa isi bersih setiap botol adalah 100 ml. Ujilah berdasar sampel 10 botol tersebut apakah pernyataan bahwa isi bersih 100 ml dapat diterima.
Statistika. Y.Bagus Wismanto
97
98 Dari 10 botol tersebut diperoleh rata-rata sampel X = 93,2 dan simpangan baku
s = 1,98886 maka s = X
s 1,98886 = = 0,66295 n −1 10 − 1
Dengan demikian persoalan tersebut di atas seandainya diselesaikan dengan taraf kepercayaan 95% adalah :
µ = X ± 1,96( S X ) 100 = 93,2 ± 1,96(0,66295)
100 = antara 91,9 sampai dengan 94,499
Daerah penerimaan µ = X 91,9
93,2 rata-rata
94,49 100
Tampaklah bahwa skor 100 terletak di luar batas penerimaan, yang berarti pula pernyataan pabrik bahwa isi bersih alkohol setiap botolnya adalah 100 ml tidak dapat diterima. B. Uji Hipotesis : Dua nilai rata-rata. Terdapat dua cara uji hipotesis dua rata-rata, yaitu uji dua rata-rata dari dua kelompok yang saling tidak terikat / bebas satu dengan yang lain serta uji dua rata antar dua kelompok yang saling memiliki hubungan satu dengan yang lain. 1. Uji dua rata-rata dua kelompok tidak berhubungan (independent). Misalkan terdapat dua kelompok yang menghasilkan X 1 dan X 2 dengan jumlah subyek N1 dan N2, serta ke duanya diambil dari sebuah populasi dengan rata-rata populasi µ1 dan µ 2 dan variansnya adalah σ 1 dan σ 2 . Hipotesisnya adalah H 0 = µ1 − µ 2 = 0 . Asumsinya adalah sampel diambil dari populasinya dengan varians yang sama, oleh karena itu σ 12 = σ 22 = σ 2 . Inilah yang disebut sebagai asumsi adanya homogenitas varians antar kelompok. Statistika. Y.Bagus Wismanto
98
99 Jika asumsi tersebut dapat dijamin, maka data dari dua sampel dapat dikombinasikan untuk mendapatkan estimasi yang tidak bias terhadap varians populasi ( σ 2 ). Estimasi ini dapat dihasilkan dengan menambahkan dua jumlah kuadrat deviasi dari rata-rata dua sampel dan membaginya dengan derajat kebebasan total, sehingga diperoleh sebagai berikut :
∑ (X − X ) + ∑ (X − X 2
S2 =
1
N1 + N 2 − 2
2
)2
=
S12 ( N1 − 1) + S 22 ( N 2 − 1) N1 + N 2 − 2
Jumlah derajat kebebasan tersebut di atas adalah penjumlahan dari dua derajat kebebasan yaitu N1 − 1 dan N 2 − 1 atau sama saja dengan N1 + N 2 − 2 , maka estimasi standard error perbedaan dua rata-rata adalah : S X1 − X 2 =
S2 S2 + = N1 N 2
N + N2 S 2 1 N1 N 2
Kemudian perbedaan rata-rata dibagi dengan estimasi standard error perbedaan rata-rata tersebut di atas, sehingga hasilnya adalah : t=
X1 − X 2 = S X1 − X 2
X1 − X 2 S2 S2 + N1 N 2
Rumus tersebut di atas dipergunakan untuk distribusi t dengan derajad kebebasan N1+N2 – 2, dan taraf signifikansinya disarankan mempergunakan 0,05 atau 0,01. Untuk pengujian taraf signifikansi t hasil hitung (to), dapat dilihat berdasar tabel t, seperti yang ada pada lampiran. Contoh : Seseorang ingin membuktikan bahwa ada perbedaan kecenderungan berat badan antara pria dan wanita. Dalam hal ini tampaklah bahwa antara kelompok pria maupun wanita adalah tidak saling berhubungan. Diambillah sampel 40 pria dan 40 wanita untuk menguji dugaan tersebut. Setelah dihitung diperoleh bahwa rata-rata berat badan pria adalah 62 dan deviasi standard = 4,8 sedangkan wanita rata rata berat badan = 48, deviasi standard = 3,2. Maka : Dapat dinyatakan Ho nya adalah “Tidak ada perbedaan berat badan antara pria Statistika. Y.Bagus Wismanto
99
100 dan Wanita” dan Ha adalah “Ada perbedaan berat badan antara pria dan wanita. Kedua sampel tersebut di atas adalah independent satu dengan yang lainnya. t=
X1 − X 2 = S X1 − X 2
X1 − X 2 S2 S2 + N1 N 2
=
62 − 48
(4,8)2 + (3,2)2 40
= 15,3485
40
Dari tabel t diperoleh bahwa dengan degree of freedom = 60 (karena merupakan df yang terdekat dengan 78 yang berasal dari 40+40 - 2) dan α pada taraf 0,01 = 2,660. Dengan demikian t 0 = 15,3485 > t t (α =0,01) = 2,660 maka t hasil hitung dinyatakan sangat signifikan, sehingga H0 ditolak dan Ha diterima, dan dapat disimpulkan bahwa ada perbedaan antara berat badan pria dan wanita. 2. Uji rata-rata saling Berhubungan Dapat diambil sebagai contoh uji rata-rata pada dua kelompok data yang saling berhubungan, apabila terdapat suatu situasi dimana sekelompok orang diteliti dalam dua kondisi yang berbeda, misalkan diteliti tekanan darahnya pada saat sebelum dan setelah menjalani suatu proses pengobatan atau terapi. Data yang dikumpulkan dari dua kali pengukuran tekanan darah tersebut mungkin berkorelasi. Suatu prosedur untuk menguji taraf signifikansi dapat dilakukan tanpa menghitung tingkat korelasi antar kedua set data tersebut, yaitu dengan metode yang berbeda dengan metode korelasi. Metode tersebut biasa disebut sebagai uji t pada kelompok data yang saling berhubungan. Misalkan data tersebut dikumpulkan pada sejumlah subyek N tertentu, perbedaan skor dari 2 data yang berpasangan tersebut dapat dihitung. Dua data yang berpasangan misalkan X 1 dan X 2 , dan perbedaan setiap pasang data adalah X 1 − X 2 = D (D = difference). Nilai rata-rata perbedaan dari semua pasang data adalah
∑D = D N
. Perbedaan dua nilai rata-rata dari kedua
Statistika. Y.Bagus Wismanto
100
101 kelompok adalah sama dengan rata-rata perbedaan. Perbedaan tiap pasang
X1 − X 2 = D ,
adalah
dengan
pasangan), maka akan dihasilkan
mempertimbangkan
∑X −∑X 1
2
jumlah
subyek
(N
= ∑ D . Dibagi dengan N maka
akan diperoleh X 1 − X 2 = D . Oleh karena rata-rata perbedaan adalah perbedaan antar dua rata-rata, maka dapat diuji signifikansi perbedaan antar 2 rata-rata dengan menguji apakah D secara signifikan berbeda dari 0. Besaran 0 (nol) akan diperoleh jika antara dua set data adalah sama persis atau tidak ada perbedaan sama sekali, pada contoh tersebut di atas : jika tidak ada efek dari terapi maka tidak ada perbedaan tekanan darah sebelum dan setelah terapi, atau sama dengan 0 (nol). Estimasi terhadap varians D adalah :
∑ (D − D ) =
2
S
2 D
N −1
Sedangkan
, dimana N adalah jumlah pasangan.
∑ (D − D )
2
adalah jumlah kuadrat dari deviasi (sum of squared
deviates) dapat diperoleh pula dengan persamaan :
∑ (D − D ) = ∑ D 2
(∑ D ) −
2
2
N
Menggunakan estimasi varians tersebut di atas, maka varians sampel D adalah : S D2 =
S D2 N
Untuk menguji apakah D berbeda dengan 0 secara signifikan, adalah dengan membagi D dengan standard error, sehingga diperoleh :
t0 =
D SD
Derajat kebebasan yang dipergunakan untuk menguji t 0 adalah N − 1 . Perlu dicatat bahwa D pada rumus tersebut di atas berasal dari D − 0 yang tentu saja hasilnya sama dengan D .
Statistika. Y.Bagus Wismanto
101
102 Jika simpangan baku untuk kelompok 1 ( S1 ) dan kelompok 2 ( S 2 ) telah diketahui serta koefisien korelasi ( r12 ) juga telah diketahui, maka varians perbedaan ( S D2 ) dapat dihitung dengan :
S D2 = S12 + S 22 − 2(r12 )(S1 )(S 2 ) Cara lain untuk menguji t0 adalah :
t0 =
∑D
[N (∑ D ) − (∑ D) ] 2
2
N −1 Contoh : Seorang peneliti menghipotesiskan bahwa orang-orang cenderung tampak lebih tinggi pada saat mereka mengenakan sepatu daripada saat mereka tidak mengenakan sepatu. Untuk menguji hipotesis, diambil sampel sebanyak 15 orang dewasa, dan diukur tinggi badannya pada saat mengenakan sepatu hariannya (sampel A) dan pada saat mereka melepaskan sepatu (sampel B), seperti pada tabel di bawah ini (Lowry, 2007) :
Statistika. Y.Bagus Wismanto
102
103 Tabel X.1. : Data Tinggi Badan pada Subyek yang mengenakan Sepatu dan Melepas Sepatu
No urut subyek
Tinggi Badan (inch) pada Sampel A. Sepatu dikenakan
Tinggi Badan (inch) pada Sampel B. Sepatu dilepas.
D
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
64,8 70,5 69,3 55,5 61,4 69,7 68,8 64,6 63,8 61,9 69,4 63,0 75,5 69,4 59,1
63,5 68,8 67,6 54,1 59,9 68,6 66,7 63,0 61,8 59,4 68,4 61,1 73,9 68,2 58,1
1,3 1,7 1,7 1,4 1,5 1,1 2,1 1,6 2,0 2,5 1,0 1,9 1,6 1,2 1,0
N Jumlah skor Jumlah dari skor kuadrat Rata-rata (Mean) Simpangan baku Jumlah Kuadrat (Sum Square) Varians
15 986,7 65283,51
15 963,1 62221,55
15 23,6 39,72
65,78
64,21
1,57
5,1988
5,2379
0,4301
378,384
384,1093
2,5893
27,0274
27,4364
0,1849
Dari tabel tersebut di atas tampaklah bahwa tinggi badan subyek selalu lebih tinggi pada saat mengenakan sepatu. Tinggi rata-rata sepatu adalah 1,57 Inch, hal ini dapat dilihat dari rata-rata D-nya. D dapat diartikan sebagai penyebab perbedaan, dalam hal ini adalah tinggi rendahnya sepatu yang dikenakan pada masing-masing subyek. Statistika. Y.Bagus Wismanto
103
104
Tinggi dalam inchi Gambar : Distribusi Data Sampel A dan Sampel B. Gambar lingkaran kecil di atas garis data pada gambar di atas menunjukkan distribusi tinggi badan subyek individual dengan sepatu yang dikenakan (sampel A) dan sepatu yang dilepas (sampel B). Apabila dperhatikan maka tampaklah bahwa terdapat perbedaan yang sangat kecil pada variabilitas sebaran data antara kedua sampel, akan tetapi variabilitas internal pada masing-masing sampel adalah besar. Dengan demikian terdapat perbedaan nilai rata-rata yang kecil, namun variabilitas internal sangat besar. Variabelitas yang ada di dalam sampel A dan B dalam situasi tersebut di atas menunjukan bahwa ada perbedaan individual di antara orang dalam hal variabel tinggi badan. Variabilitas yang sedikit berbeda dari ke dua set data tersebut hanya disebabkan oleh perbedaan tinggi sepatu yang dikenakan, dan jika semua orang mengenakan sepatu yang memiliki tinggi yang sama, maka variabelitas antara ke dua set data tersebut adalah sama. Telah disebutkan di muka bahwa jumlah kuadrat (sum of squared) dapat dhitung dengan persamaan :
∑ (D − D ) = ∑ D 2
Dengan
data
∑ (D − D )
2
= 39,72 −
∑ (D − D ) =
S
S D2 =
N −1
N tersedia,
yang
2
2 D
(∑ D ) −
2
2
=
(23,6) 15
telah
dihitung
dan
diperoleh
2
= 2,5893
2,5893 = 0,18495 14
S D2 0,18495 = = 0,01233 maka S D = S D2 = 0,01233 = 0,11104 N 15 Statistika. Y.Bagus Wismanto
104
105 Dengan demikian t 0 =
D 1,57 = = 14,14 S D 0,11104
Dengan persamaan yang kedua akan diperoleh :
t0 =
∑D
=
23,6
[N (∑ D ) − (∑ D) ] [15(39,72) − (23,6) ] 2
2
N −1
2
= 14,1689
15 − 1
Dari penghitungan dengan dua cara tersebut di atas ternyata diperoleh hasil yang relatif sama besar.
Gambar : Distribusi sampling untuk t, dengan derajat kebebasan 14
Statistika. Y.Bagus Wismanto
105
XI. Kai Kuadrat (Chi Square) 1. Prinsip Kai Kuadrat Apabila diambil sebuah mata uang/koin, maka akan terlihat dua sisi mata uang yang berbeda yaitu sisi angka (A) dan sisi gambar (G). Apabila mata uang tersebut dipergunakan untuk mengundi dengan cara melemparkan ke atas sebanyak 10 kali, kemudian dilihat sisi manakah yang berada di atas ketika jatuh, dan apabila mata uang tersebut masih dalam keadaan baik, secara teoritis akan menunjukkan 5 kali A dan 5 kali G. Dalam kenyataannya pada saat pengundian dilakukan, yang diperoleh tidak seperti apa yang diharapkan secara teoritis. Misalkan diperoleh 6 kali A dan 4 kali G atau 3 kali A dan 7 kali G, dsb. Frekuensi secara teoritis tersebut di atas biasa disebut sebagai frekuensi teoritis atau frekuensi yang diharapkan (E atau Fh, Fe), dan frekuensi yang terjadi pada kenyataan biasa disebut sebagai frekuensi observasi (O atau Fo). Secara teoritik probabilitas bayi lahir dengan jenis kelamin perempuan dan laki-laki berdasarkan perbandingan populasi adalah 55 : 45, dengan demikian dapat dinyatakan frekuensi yang diharapkan setiap 10 bayi yang lahir adalah 5,5 : 4,5. Disebuah rumah sakit dicatat jenis kelamin bayi yang lahir pada bulan tertentu ternyata perbandingan jenis kelamin perempuan dan laki-laki adalah 7 : 3. Maka dari data tersebut tampaklah bahwa ada perbedaan antara E (ekspektasi) dan O (Observasi). Dalam kenyataan jarang sekali O sama dengan E, walaupun hipotesis yang dinyatakan adalah benar. Namun dapat dibuktikan bahwa apabila hipotesisnya benar, maka apabila jumlah observasi diperbanyak, perbedaan antara O dan E semakin lama akan semakin kecil, dan jika observasi diperbanyak hingga mencapai populasinya, maka O akan sama dengan E. Untuk menguji signifikan atau tidaknya perbedaan antara O dan E (atau antara Fo dan Fe) dalam sebuah observasi yang terbatas, analisis yang digunakan adalah uji kai kuadrat atau chi square. Perbedaan O dan E dikatakan signifikan jika dalam perhitungan dari observasi (O) yang tak terbatas masih tetap tidak sama dengan ekspektasinya (E), demikian pula sebaliknya. Untuk menguji digunakan formula :
χ2 = ∑
(O − E )2 E
Contoh bayi yang lahir di sebuah rumah sakit tersebut di atas, maka dapat dianalisis dengan kai kuadrat : Tabel XI.1. Tabel Analisis Kai Kuadrat. Jenis Kelamin Perempuan
O
E
(O – E)
(O – E)2
7
5,5
1,5
2,25
(O – E)2 E 0,409
Laki-laki
3
4,5
- 1,5
2,25
0,5
10
10
0
5,50
χ 0 2 = 0,909
2
Dari hasil perhitungan tersebut di atas diperoleh χ 0 = 0,909 . Untuk menguji signifikansi terhadap hasil hitung yang diperoleh, dilakukan dengan cara membandingkan antara χ 2 hasil hitung dengan harga kritik χ 2 yang ditetapkan pada suatu taraf siginifikansi tertentu. (1)Apabila χ 2 hasil hitung ternyata sama atau lebih besar dari nilai
χ 2 t (α =0, 01) , χ 2 hasil hitung dinyatakan sangat signifikan, maka Ho ditolak dan Ha diterima. (2) Apabila χ 2 hasil hitung ternyata lebih kecil dari χ 2 t (α =0, 01) namun sama dengan atau lebih besar dari χ 2 t (α =0, 05 ) , χ 2 hasil hitung dinyatakan signifikan, maka Ho ditolak dan Ha diterima. (3) Apabila χ 2 hasil hitung lebih kecil dari χ 2 t (α =0, 05 ) , χ 2 dinyatakan tidak signifikan, maka Ho diterima dan Ha ditolak. Kebebasan yang dimiliki dalam mengisi kolom E disebut sebagai derajat kebebasan (degree of freedom) kai kuadrat. Batasannya adalah bahwa jumlah frekuensi pada kolom E harus sama dengan jumlah frekuensi pada O, atau jumlah subyek pada kolom E harus sama dengan jumlah subyek pada kolom O. Pada contoh diatas, Kolom E hanya memiliki dua baris, yaitu E pada perempuan dan E pada laki-laki. Oleh karena itu derajad kebebasan hanya 1, karena pada saat salah satu baris pada kolom E sudah tertentukan, maka baris yang ke dua sudah tidak bebas lagi. Berdasarkan derajat kebebasan tersebut di atas maka dapat dicari berapakah harga kritik kai kuadrat pada tabel. Dari tabel kai kuadrat tampak bahwa dengan derajat kebebasan 1 dan probability 0,01 ( α = 0,01 ) nilainya adalah 6,635 dan ditulis 1; χ t (α =0, 01) = 6,635 , sedangkan dengan Statistika. Y.Bagus Wismanto
111
probability 0,05 α = 0,05 nilainya adalah 3,811 dan ditulis 1; χ t ( 0,05) = 3,811 . Dengan
demikian
χ 0 2 = 0,909 < 1; χ t ( 0,05) = 3,811 , dan dinyatakan
χ 0 2 = 0,909 adalah tidak signifikan, Ho diterima dan Ha ditolak, maka kesimpulannya adalah tidak ada perbedaan antara probabilitas bayi lahir laki-laki dengan probabilitas bayi lahir perempuan (frekuensi observasi dan frekuensi ekspekstasinya). 2. Kai kuadrat untuk Tabel 2X2. Frekuensi yang terjadi pada tipe tabel kontingensi (contingency table) adalah 2X2 atau tabel empat bidang. Pada data semacam ini kai kuadrat dapat dihitung secara langsung tanpa melalui penghitungan frekuensi ekspektasi terlebih dahulu. Formulanya adalah sebagai berikut : Tabel XI.2. Tabel kongensi A
B
A+B
C
D
C+D
A+C
B+D
N
Kai Kuadrat dapat diperoleh dengan cara : N ( AD − BC ) ( A + B )(C + D )( A + C )(B + D ) 2
χ2 =
Sebagai contoh adalah data tentang sekelompok orang yang mengikuti tes seleksi karyawan disuatu perusahaan serta kesuksesan kerjanya setelah diterima bekerja. Diduga ada hubungan antara kesuksesan maupun ketidak suksesan/kegagalan kerja dengan hasil tes seleksi pada awal lamaran kerja. Datanya adalah sebagai berikut : Tabel XI.3. Hasil Tes Seleksi dan Kesuksesan Kerja Hasil Tes Gagal
Lulus
Sukses
20
40
60
Tidak Sukses
25
15
40
46
55
100
Statistika. Y.Bagus Wismanto
112
Hasil penghitungan kai kuadratnya adalah sebagai berikut : 100(20 X 15 − 40 X 25) = 8,25 (60)(40)(45)(55) 2
χ2 =
dengan df =1, χ t (α = 0, 01) = 6,64. Kai kuadrat hasil hitung lebih besar daripada kai kuadrat tabel, maka kai kuadrat hasil hitung dinyatakan sangat signifikan sehingga Ho ditolak dan Ha diterima. Kesimpulan yang dapat ditarik dari kasus tersebut di atas adalah ada hubungan antara hasil tes seleksi dengan kesuksesan kerja, dapat pula dikatakan bahwa mereka yang lulus tes dapat diperkirakan akan mendapatkan kesuksesan. 3. Kai Kuadrat pada Data Berkategori Banyak. Kai kuadrat juga dapat dipergunakan untuk menguji frekuensi harapan dan kenyataan pada kategori data yang lebih banyak. Sebagai misal dilakukan pengumpulan data tentang minat baca cerita fiksi pada 90 remaja laki-laki dan 110 perempuan, dan datanya adalah sebagai berikut : Tabel XI.4. Data Frekuensi hasil observasi Horor
Roman
Detektif
Total
Laki-laki
48
16
26
90
Perempuan
24
54
32
110
Total
72
70
58
200
Hipotesis yang diajukan adalah Ho “tidak ada hubungan antara minat baca buku fiksi dan jenis kelamin”, sedangkan Ha nya adalah “ ada hubungan antara minat baca buku fiksi dengan jenis kelamin”. Dari tabel data frekuensi observasi tersebut di atas maka dapat dihitung data frekuensi ekspektasinya sebagai berikut :
Statistika. Y.Bagus Wismanto
113
Tabel XI.3. Data frekuensi harapan (Ekspektasi) dapat diperoleh dengan : Jenis kelamin
Jenis Bacaan
Frekuensi ekspektasi
Laki-laki
Horor
Laki-laki
Roman
Laki-laki
Detektif
Perempuan
Horor
Perempuan
Roman
Perempuan
Detektif
(72 X 90) : 200 = 32,4 (70 X 90) : 200 = 31,5 (58 X 90) : 200 = 26,1 (72 X 110) : 200 = 39,6 (79 X 110) : 200 = 38,5 (58 X 110) : 200 = 31,9
Berdasar hasil perhitungan frekuensi ekspektasi tersebut, maka dapat dilakukan analisis Kai kuadrat sebagai berikut : Tabel XI.4. Perhitungan Kai Kuadrat Jenis Kelamin
Jenis Bacaan
O
E
O-E
(O − E )2
(O − E )2
Laki-laki
Horor Roman Detektif
48 16 26
32,4 31,5 26,1
15,6 - 15,5 - 0,1
243,36 240,25 0,01
E 7,5111 7,6269 0,000383
Horor Roman Detektif
24 54 32
39,6 38,5 31,9
- 15,6 15,5 0,1
243,36 240,25 0,001
6,1455 6,2403 0,00031
-
200
200
-
-
χ 2 = 27,5245
Perempuan -
Degree of freedom untuk pengujian hasil perhitungan
tersebut diatas
adalah (R-1)(C-1) maka diperoleh (2-1)(3-1) = 2. χ t (α = 0, 01) = 9.21 . Dengan demikian χ 2 = 27,5245 > χ t (α = 0, 01) = 9,21 , dan kai kuadrat dinyatakan sangat signifikan, sehingga Ho ditolak dan Ha diterima. Kesimpulannya adalah ada hubungan antara jenis kelamin dengan minat baca buku fiksi.
Statistika. Y.Bagus Wismanto
114
SOAL LATIHAN : 1. Sebuah dadu diputarkan sebanyak 20 kali, dan hasil yang diperoleh adalah sebagai berikut : Biji 1 muncul sebanyak 2 kali Biji 2 muncul sebanyak 6 kali Biji 3 muncul sebanyak 0 kali Biji 4 muncul sebanyak 0 kali Biji 5 muncul sebanyak 10 kali Biji 6 muncul sebanyak 2 kali Apakah pemunculan biji-biji tersebut signifikan ? 2. Sebuah penelitian membandingkan kelompok remaja yang diberi hadiah karena keberhasilanya dalam melaksanakan tugas tertentu. Hasilnya adalah sebagai berikut : Hadiah uang
Hadiah barang
Pujian
Total
Kota
18
16
46
80
Pinggir Kota
12
58
10
80
Desa
44
14
22
80
Total
200
Nyatakanlah hipotesisnya dan ujilah hipotesis tersebut. 3. Berikut ini adalah data tentang sikap antara ibu-ibu dan bapak-bapak di DKI berkaitan dengan pengalihan penggunaan kompor minyak tanah ke kompor gas LPG : Setuju
Tidak Setuju
Jummlah
Ibu
43
77
120
Bapak
84
36
120
Bagaimanakah penyelesaian data tersebut di atas ?
Statistika. Y.Bagus Wismanto
115
DAFTAR TABEL Area between 0 and z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 To index
Tabel Z : lanjutan 0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
t table with right tail probabilities
df\p
0.40
0.25
0.10
0.05
0.025
0.01
0.005
0.0005
1
0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192
2
0.288675 0.816497 1.885618 2.919986 4.30265
6.96456
9.92484
31.5991
3
0.276671 0.764892 1.637744 2.353363 3.18245
4.54070
5.84091
12.9240
4
0.270722 0.740697 1.533206 2.131847 2.77645
3.74695
4.60409
8.6103
5
0.267181 0.726687 1.475884 2.015048 2.57058
3.36493
4.03214
6.8688
6
0.264835 0.717558 1.439756 1.943180 2.44691
3.14267
3.70743
5.9588
7
0.263167 0.711142 1.414924 1.894579 2.36462
2.99795
3.49948
5.4079
8
0.261921 0.706387 1.396815 1.859548 2.30600
2.89646
3.35539
5.0413
9
0.260955 0.702722 1.383029 1.833113 2.26216
2.82144
3.24984
4.7809
10
0.260185 0.699812 1.372184 1.812461 2.22814
2.76377
3.16927
4.5869
11
0.259556 0.697445 1.363430 1.795885 2.20099
2.71808
3.10581
4.4370
12
0.259033 0.695483 1.356217 1.782288 2.17881
2.68100
3.05454
4.3178
13
0.258591 0.693829 1.350171 1.770933 2.16037
2.65031
3.01228
4.2208
14
0.258213 0.692417 1.345030 1.761310 2.14479
2.62449
2.97684
4.1405
15
0.257885 0.691197 1.340606 1.753050 2.13145
2.60248
2.94671
4.0728
16
0.257599 0.690132 1.336757 1.745884 2.11991
2.58349
2.92078
4.0150
17
0.257347 0.689195 1.333379 1.739607 2.10982
2.56693
2.89823
3.9651
18
0.257123 0.688364 1.330391 1.734064 2.10092
2.55238
2.87844
3.9216
19
0.256923 0.687621 1.327728 1.729133 2.09302
2.53948
2.86093
3.8834
20
0.256743 0.686954 1.325341 1.724718 2.08596
2.52798
2.84534
3.8495
0.01
0.005
df\p
0.40
0.25
0.10
0.05
0.025
0.0005
21
0.256580 0.686352 1.323188 1.720743 2.07961
2.51765
2.83136
3.8193
22
0.256432 0.685805 1.321237 1.717144 2.07387
2.50832
2.81876
3.7921
23
0.256297 0.685306 1.319460 1.713872 2.06866
2.49987
2.80734
3.7676
24
0.256173 0.684850 1.317836 1.710882 2.06390
2.49216
2.79694
3.7454
25
0.256060 0.684430 1.316345 1.708141 2.05954
2.48511
2.78744
3.7251
26
0.255955 0.684043 1.314972 1.705618 2.05553
2.47863
2.77871
3.7066
27
0.255858 0.683685 1.313703 1.703288 2.05183
2.47266
2.77068
3.6896
28
0.255768 0.683353 1.312527 1.701131 2.04841
2.46714
2.76326
3.6739
29
0.255684 0.683044 1.311434 1.699127 2.04523
2.46202
2.75639
3.6594
30
0.255605 0.682756 1.310415 1.697261 2.04227
2.45726
2.75000
3.6460
inf
0.253347 0.674490 1.281552 1.644854 1.95996
2.32635
2.57583
3.2905
Tabel
0,10 N-2 df
0,20
Nilai-nilai t.
Taraf Signifikansi untuk Uji Satu Sisi 0,05 0,025 0,01 0,005 Taraf Siginifikansi untuk Uji Dua Sisi 0,10 0,05 0,02 0,01
0,0005 0,001
1 2 3 4 5
3,078 1,886 1,638 1,533 1,476
6,314 2,920 2,353 2,132 2,015
12,706 4,303 3,182 2,776 2,571
31,821 6,965 4,541 3,747 3,365
63,657 9,925 5,841 4,604 4,032
636,619 31,598 12,941 8,610 6,859
6 7 8 9 10
1,440 1,415 1,397 1,383 1,372
1,943 1,895 1,860 1,833 1,812
2,447 2,365 2,306 2,262 2,228
3,143 2,998 2,896 2,821 2,764
3,707 3,499 3,355 3,250 3,169
5,959 5,405 5,041 4,781 4,587
11 12 13 14 15
1,363 1,356 1,350 1,345 1,341
1,796 1,782 1,771 1,761 1,753
2,201 2,179 2,160 2,145 2,131
2,718 2,681 2,650 2,624 2,602
3,106 3,055 3,012 2,977 2,947
4,437 4,318 4,221 4,140 4,073
16 17 18 19 20
1,337 1,333 1,330 1,328 1,325
1,746 1,740 1,734 1,729 1,725
2,120 2,110 2,101 2,093 2,086
2,583 2,567 2,552 2,539 2,528
2,921 2,898 2,878 2,861 2,845
4,015 3,965 3,922 3,883 3,850
21 22 23 24 25
1,323 1,321 1,319 1,318 1,316
1,721 1,717 1,714 1,711 1,708
2,080 2,074 2,069 2,064 2,060
2,518 2,508 2,500 2,492 2,485
2,831 2,819 2,807 2,797 2,787
3,819 3,792 3,767 3,745 3,725
26 27 28 29 30
1,315 1,314 1,313 1,311 1,310
1,706 1,703 1,701 1,699 1,697
2,056 2,062 2,048 2,045 2,042
2,479 2,473 2,467 2,462 2,457
2,779 2,771 2,763 2,756 2,750
3,707 3,690 3,674 3,659 3,646
40 60 120 ∞
1,303 1,296 1.289 1,282
1,684 1,671 1,658 1,645
2,021 2,000 1,980 1,960
2,423 2,390 2,358 2,326
2,704 2,660 2,617 2,576
3,551 3,460 3,373 3,291
Tabel II. Nilai-nilai kritik koefisien korelasi ( r ).
df
(N2)
Taraf signifikansi untuk tes satu sisi 0,05 0,025 0,01 0,005 Taraf signifikansi untuk tes dua sisi 0,10 0,05 0,02 0,01
1 2 3 4 5 6 7 8 9 10
0,988 0,900 0,805 0,729 0,669 0,622 0,582 0,549 0,521 0,497
0,997 0,950 0,878 0,811 0,754 0,707 0,666 0,632 0,602 0,576
0,9995 0,980 0,934 0,882 0,833 0,789 0,750 0,716 0,685 0,658
0,9999 0,990 0,959 0,917 0,874 0,834 0,798 0,765 0,735 0,708
11 12 13 14 15 16 17 18 19 20
0,476 0,458 0,441 0,426 0,412 0,400 0,389 0,378 0,369 0,360
0,553 0,532 0,514 0,497 0,482 0,468 0,456 0,444 0,433 0,423
0,634 0,612 0,592 0,574 0,558 0,542 0,528 0,516 0,503 0,492
0,684 0,661 0,641 0,623 0,606 0,590 0,575 0,561 0,549 0,537
21 22 23 24 25 26 27 28 29 30
0,352 0,344 0,337 0,330 0,323 0,317 0,311 0,306 0,301 0,296
0,413 0,404 0,396 0,388 0,381 0,374 0,367 0,361 0,355 0,343
0,482 0,472 0,462 0,453 0,445 0,437 0,430 0,423 0,416 0,409
0,526 0,515 0,505 0,496 0,487 0,479 0,471 0,463 0,456 0,449
35 40 45 50 60 70 80 90 100
0,275 0,257 0,243 0,231 0,211 0,195 0,183 0,173 0,164
0,325 0,304 0,288 0,273 0,250 0,232 0,217 0,205 0,195
0,381 0,358 0,338 0,322 0,295 0,274 0,256 0,242 0,230
0,418 0,393 0,372 0,354 0,325 0,303 0,283 0,267 0,254
125 150 200 300 400 500 1.000
0,147 0,134 0,116 0,095 0,082 0,073 0,052
0,174 0,159 0,138 0,113 0,098 0,088 0,062
0,206 0,189 0,164 0,134 0,116 0,104 0,073
0,228 0,208 0,181 0,148 0,128 0,115 0,081
Tabel Nilai kritis ρ , Koefisien Korelasi jenjang dari Spearman
N
Taraf Signifikansi 0,05 0,01
4 5 6 7 8
1,000 0,900 0,829 0,714 0,643
1,000 0,943 0,893 0,833
9 10 12 14 16
0,600 0,564 0,506 0,456 0,425
0,783 0,746 0,712 0,645 0,601
18 20 22 24 26
0,399 0,377 0,359 0,343 0,329
0,564 0,534 0,508 0,485 0,465
28 30
0,317 0,306
0,448 0,432
z 0,00 0,01 0,20 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
Area 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59 03,98
z 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60
Area 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24 22,57
z 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10
Area 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21 36,43
z 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59 1,60
Area 43,32 43,45 43,57 43,70 43,82 43,94 44,06 44,18 44,29 44,41 44,52
0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20
04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53 07,93
0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70
22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49 25,80
1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20
36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30 38,49
1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70
44,63 44,74 44,84 44,95 45,05 45,15 45,25 45,35 45,45 45,54
0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30
08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41 11,79
0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80
26,11 26,42 26,73 27,03 27,34 27,04 27,94 28,23 28,52 28,81
1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30
38,69 38,88 39,07 39,25 39,44 39,62 39,80 39,97 40,15 40,32
1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80
45,64 45,73 45,82 45,91 45,99 46,08 46,16 46,25 46,33 46,41
0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40
12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17 15,54
0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90
29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33 31,59
1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40
40,49 40,66 40,82 40,99 41,15 41,31 41,47 41,62 41,77 41,92
1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90
46,49 46,56 46,64 46,71 46,78 46,86 46,93 46,99 47,06 47,13
0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50
15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79 19,15
0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00
31,86 32,12 32,38 32,64 32,89 33,15 33,40 33,65 33,89 34,13
1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50
42,07 42,22 42,36 42,51 42,65 42,79 42,92 43,06 43,19 43,32
1,91 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00
47,19 47,26 47,32 47,38 47,44 47,50 47,56 47,61 47,67 47,72
z
Area
z
Area
z
Area
z
Area
Statistik 1. Y. Bagus Wismanto
30
2,00 2,01 2,02 2,03 2,04 2,05
47,72 47,78 47,83 47,88 47,93 47,98
2,25 2,26 2,27 2,28 2,29 2,30
48,78 48,81 48,84 48,87 48,90 48,93
2,50 2,51 2,52 2,53 2,54 2,55
49,38 49,40 49,41 49,43 49,45 49,46
2,75 2,76 2,77 2,78 2,79 2,80
49,70 49,71 49,72 49,73 49,74 49,74
2,06 2,07 2,08 2,09 2,10
48,03 48,08 48,12 48,17 48,21
2,31 2,32 2,33 2,34 2,35
48,96 48,98 49,01 49,04 49,06
2,56 2,57 2,58 2,59 2,60
49,48 49,49 49,51 49,52 49,53
2,81 2,82 2,83 2,84 2,85
49,75 49,76 49,77 49,77 49,78
2,11 2,12 2,13 2,14 2,15
48,26 48,30 48,34 48,38 48,42
2,36 2,37 2,38 2,39 2,40
49,09 49,11 49,13 49,16 49,18
2,61 2,62 2,63 2,64 2,65
49,55 49,56 49,57 49,59 49,60
2,86 2,87 2,88 2,89 2,90
49,79 49,79 49,80 49,81 49.81
2,16 2,17 2,18 2,19 2,20
48,46 48,50 48,54 48,57 48,61
2,41 2,42 2,43 2,44 2,45
49,20 49,22 49,25 49,27 49,29
2,66 2,67 2,68 2,69 2,70
49,61 49,62 49,63 49,64 49,65
2,91 2,92 2,93 2,94 2,95
49,82 49,82 49,83 49,84 49.84
2,21 2,22 2,23 2,24 2,25
48,64 48,68 48,71 48,75 48,78
2,46 2,47 2,48 2,49 2,50
49,31 49,32 49,34 49,36 49,38
2,71 2,72 2,73 2,74 2,75
49,66 49,67 49,68 49,69 49,70
2,96 2,97 2,98 2,99 3,00
49,85 49,85 49,86 49,86 49,87
Statistik 1. Y. Bagus Wismanto
31
DAFTAR PUSTAKA Anastasi, A., 1988. Psychological Testing (6th.ed). New York : Macmillan. Diekhoff, G., 1992. Statistics for The Social and Behavioral Sciences : Univariate, Bivariate, Multivariate. Dubuque : Wm.C.Brown Publishers. WWW.abs.gov.au/websitedbs/ 28/02/2007 Ferguson, G.A., and Takane, Y. 1989. Statistical Analysis in Psychology and Education. Singapore : McGraw Hill Book Co. Http://en.wikipedia.org , 22/02/07. Routio, P; 2007. Sampling. www2.uiah.fi/projects/metodi. Keppel, G. 1982. Design and Analysis : A Researcher’s Handbook. New Jersey : Prentice Hall, Inc. Murphy, K.R., 1998. Statistical Power Analysis : A Simple and General Model for Traditional and Modern Hypothesis Tests. Mahwah, New York : L. Erlbaum Associates. Pedhazur, E,J. 1982. Multiple Regression in Behavioral Research : Explanation and Prediction. New York : Holt, Rinehart and Winston. Sudjana. 1986. Metoda Statistiks. Bandung : Tarsito.