Pengolahaan Data Dr. Herman, M.A.
P EN D AH U LU A N
P
ada modul ini Anda dapat mempelajari pokok bahasan "pengolahan data". Ada beberapa sub-pokok bahasan yang akan disajikan, yaitu mempersiapkan data termasuk memeriksa kelengkapan data dan kebersihan data, pengkodean (coding), penyajian singkat tentang statistik deskriptif dan statistik inferensi, dan penyajian data. Oleh karena itu, setelah mempelajari modul ini Anda diharapkan dapat: 1. memeriksa kelengkapan dan kebersihan data; 2. melakukan pengkodean dan penyajian data; 3. menjelaskan perbedaan statistika deskriptif dan inferensi; serta 4. menyajikan data yang informatif dan mudah dimengerti oleh pembaca.
4.2
Metodologi Penelitian
Kegiatan Belajar 1
Mempersiapkan Data
S
ebelum melakukan analisis data Anda harus melakukan beberapa hal, antara lain mempersiapkan data. Dalam mempersiapkan data tersebut yang pertama sekali Anda lakukan adalah memeriksa kelengkapan data. Seandainya Anda langsung memasukkan data Anda ke komputer kemudian Anda menemukan bahwa data yang Anda masukkan ternyata masih belum lengkap maka pekerjaan untuk data tersebut akan sia-sia. Kalau data Anda sudah lengkap maka Anda sudah siap memasukkannya ke komputer. Adapun langkah-langkah yang dapat Anda jalankan akan dijelaskan berikut ini. 1.
Memeriksa Kelengkapan dan Kebersihan Data Setelah Anda berhasil mengumpulkan data (dari kuesioner ataupun pengamatan laboratorium) maka data tersebut harus Anda periksa dulu. Pada umumnya data dari kuesioner banyak tidak lengkap isinya. Sering kali juga, ada responden yang menjawab kuesioner asal isi saja. Hal ini dapat dilihat pada pertanyaan-pertanyaan yang sifatnya paralel di mana isinya sangat berlawanan. Data seperti ini kalau Anda olah akan membuat kesimpulan yang nantinya akan Anda buat menjadi salah. Kalau Anda menemukan isian kuesioner seperti itu, sebaiknya kuesioner tersebut Anda singkirkan saja (tetapi syaratnya alat ukur yang Anda gunakan sudah melalui tahapantahapan pembuatan kuesioner yang benar). Tetapi dalam hal responden tidak menjawab pertanyaan pada kuesioner maka kuesioner tersebut jangan Anda buang, sebab informasi lainnya yang mungkin Anda butuhkan ada pada kuesioner itu. Pada teknik pengolahan data nanti, data yang tidak diisi bisa tidak diperhitungkan oleh perangkat lunak yang ada. Satu hal yang harus Anda ingat ialah jangan sekali-kali mengubah data yang sudah didapat. Karena hal ini merupakan penipuan. Oleh karena itu, sebelum mengumpulkan data, Anda harus betul-betul yakin bahwa instrumen yang Anda gunakan mempunyai nilai validitas dan reliabilitas yang memenuhi standar. Demikian juga instruksi yang harus diikuti oleh responden harus jelas sehingga tidak membingungkan responden pada waktu mengisi kuesioner.
4.3
Setelah data Anda dapatkan maka data tersebut biasanya akan disimpan pada suatu berkas (file) pada komputer. Salah satu cara memasukan data ke dalam komputer adalah melalui entri (entry) melalui keyboard. Entri data ini pun bisa membuka peluang untuk salah entri. Oleh karena itu nanti setelah data selesai di entri maka sebaiknya Anda melakukan beberapa hal untuk melihat secara sekilas apakah data Anda tidak ada yang "aneh". Hal-hal yang dapat Anda lakukan adalah membuat tabel frekuensi, bar-chart ataupun histogram. Dengan tabel frekuensi Anda dapat melihat kode-kode yang mungkin tidak Anda harapkan. Misalnya, nilai yang Anda tentukan adalah berkisar antara 1 dan 7, tetapi karena sesuatu hal maka muncul angka 8. Dengan tabel frekuensi tersebut, angka 8 tadi akan tampak. Dengan demikian, Anda dapat memperbaiki data Anda tersebut. Sudah tentu tidak semua kesalahan entri data dapat Anda lacak. 2.
Pengkodean dan Tabulasi Data Pada kuesioner yang dijawab oleh para responden, informasi yang Anda tanyakan biasanya berbentuk kata-kata. Jawaban ini sebaiknya Anda ubah menjadi angka. Misalnya, terang Anda beri notasi 1, sedangkan gelap Anda beri notasi 0. Sehingga bentuk penulisan data akan menjadi lebih sederhana. Demikian juga kalau jawaban yang Anda dapatkan bisa diurutkan, seperti dari selalu sampai dengan tidak pernah maka Anda dapat memberi kode angka yang juga terurut. Contoh, respons yang disediakan adalah "selalu, sering, kadang-kadang, jarang, dan tidak pernah". Respons ini dapat Anda beri kode sebagai 5, 4, 3, 2 dan 1. Pengkodean seperti ini banyak mempunyai keuntungan. Yang pertama adalah menghemat pemakaian tempat karena membutuhkan ruang yang lebih, sedikit. Keuntungan kedua adalah lebih sederhana. Sedangkan keuntungan yang ketiga, yaitu pemberian pengkodean secara numerik memberikan kesempatan kepada Anda untuk melakukan operasi jumlah, atau mendapatkan nilai rata-rata, nilai standard deviasi dan lainnya. Dulu, pada saat belum ada komputer yang menawarkan perangkat lunak semacam "spreadsheet", data yang dihasilkan harus dituliskan dalam bentuk tabel. Gunanya adalah untuk memudahkan membaca data serta memudahkan orang membuat perhitungan-perhitungan. Tabel tersebut biasanya berbentuk seperti matriks, yaitu ada baris dan ada kolomnya. Pada ujung baris ataupun
4.4
Metodologi Penelitian
ujung kolom orang dapat membuat jumlah total data pada masing-masing kolom atau baris. Untuk itu, Anda harus tetapkan satu kolom untuk satu variabel. Kalau Anda mempunyai 5 variabel maka Anda harus membuat 5 kolom. Pada setiap kolom tersebut Anda isikan data yang Anda peroleh. Sebagai contoh misalkan Anda mempunyai 3 variabel yang sedang diteliti. Masingmasing variabel mempunyai n buah data. Variabel I memiliki data xll, x12, x13, ..., xln. Variabel II memiliki data x21, x22, x23, ..., x2n serta variabel III mempunyai data x31, x32, x33, ..., x3n. Adapun bentuk tabel data tersebut adalah
Variabel I
Variabel II
Variabel III
X11
X21
X22
X22
:
:
:
:
:
:
:
:
:
X1n
X2n
X3n
X31
Dengan semakin berkembangnya bentuk-bentuk perangkat lunak maka pekerjaan tabulasi data dapat langsung Anda lakukan pada komputer. Demikian juga dengan perhitungan-perhitungan statistiknya, dapat langsung Anda lakukan dengan menggunakan perangkat lunak yang sesuai. Ada banyak macam paket perangkat lunak untuk statistik, antara lain adalah minitab, SAS, S-Plus dan SPSS. Pada modul ini, paket yang akan diperkenalkan adalah SPSS.
4.5
L AT IH AN Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! 1) Menurut pendapat Anda mengapa data harus diperiksa kelengkapannya terlebih dahulu sebelum Anda menganalisisnya dengan menggunakan statistik? 2) Mengapa kita perlu memeriksa kebersihan data sebelum menggunakannya untuk dihitung secara statistik? 3) Anda juga dianjurkan untuk membuat pengkodean pada data, apakah gunanya menurut Anda? Petunjuk Jawaban Latihan Agar Anda dapat menjawab latihan di atas. Anda harus membaca kembali mengenai kelengkapan dan kebersihan data serta coding dan tabulasi.
RA NG K UM A N
1. 2. 3.
Dalam mempersiapkan data, lakukan langkah-langkah berikut ini. Periksa kelengkapan dan keberhasilan data. Lakukan coding (pengkodean). Lakukan tabulassi data.
T ES FO R M AT IF 1 Pilihlah satu jawaban yang paling tepat!
4.6
Metodologi Penelitian
1) Seandainya Anda mempunyai data yang berasal dari kuesioner, lalu data tersebut langsung Anda masukkan ke komputer. Sebutkan apakah kirakira kerugian yang mungkin timbul bila Anda melakukan hal tersebut. 2) Menurut pendapat pribadi Anda, dengan kemajuan teknologi komputer yang sedemikian cepat, apakah masih dibutuhkan pemindahan data dari kuesioner ke dalam bentuk-bentuk tabel sebelum data tersebut Anda masukkan ke komputer? Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang belum dikuasai.
4.7
Kegiatan Belajar 2
Menyajikan Data
K
oleksi data mentah dapat tidak mempunyai arti apa-apa kalau tidak memberikan informasi yang berarti. Bagaimanapun baiknya data mentah dituliskan, data mungkin tidak dapat memberikan informasi yang berarti karena yang tampak hanyalah tumpukan angka-angka. Bagaimana data mentah ini dapat disajikan sehingga data dapat memberikan informasi yang berarti? Salah satu caranya adalah dengan mengorganisasikan data tersebut sedemikian rupa sehingga dapat memberikan informasi yang berarti. A. MEMPLOT DATA Salah satu cara yang sederhana dalam menyajikan data yang informatif adalah memplot data ke dalam bentuk grafik. Ada beberapa cara yang biasanya digunakan untuk memplot data dengan grafik, antara lain adalah distribusi frekuensi dan histogram. 1.
Distribusi Frekuensi Langkah pertama sebelum memplot data adalah membuat distribusi frekuensi dari data yang ada. Sebagai contoh adalah data rating tentang keinginan pelajar mengenai usulan adanya student center. Data ini didapat dari hasil survei terhadap tanggapan mereka mengenai usulan diadakannya student center.
4.8
Metodologi Penelitian
Tabel 6.1. Distribusi frekuensi dari tingkat keinginan siswa terhadap usulan adanya student center.
Rating (X) 0 1 2 3 4 5 6 7 8 9 10
Frekuensi(F) 0 0 0 6 19 40 49 45 30 11 0
Data dikumpulkan dengan memberikan rating 0 sampai 10 kepada siswa, lalu mereka memilih salah satu dari rating yang diberikan. Rating 0 sampai 10 menunjukkan tingkat sangat tidak ingin sampai tingkat sangat ingin. Data lalu dikelompokkan seperti di atas yang berisikan jumlah siswa yang memilih rating 0 sampai 10.
Gambar 6.1. Distribusi Frekuensi dari 200 siswa tentang rating usulan adanya student center. Sumbu tegak adalah frekuensi, sedangkan sumbu datar adalah rating.
4.9
Gambar 6.2. Frekuensi poligon untuk rating dari 200 pelajar terhadap usulan pendirian student center. Sumbu tegak adalah frekuensi dan sumbu datar adalah rating.
Distribusi frekuensi dari studi ini adalah seperti yang ditunjukkan oleh Tabel 6.1. Tabel frekuensi ini disajikan secara grafik pada Gambar 6.1. Dari distribusi yang ditunjukkan oleh Gambar 6.1 tampak jelas bahwa ada pendapat yang sangat lebar tentang usulan didirikannya student center. Ada 3 siswa yang mempunyai rating 3 dan 11 siswa memiliki rating 9. Tampak bahwa ada kecenderungan data mengumpul sedikit di atas titik tengah. Nilai rating yang paling banyak dimiliki siswa adalah nilai 6, di mana nilai ini dipilih oleh 49 siswa. Alternatif lain untuk menyajikan distribusi frekuensi adalah menghubungkan titik-titik ujung atas dari garis-garis tegak yang ada pada Gambar 6.1. Anda kemudian dapat menghapus garis- garis tegak tersebut. Bentuk grafik seperti ini disebut sebagai frekuensi poligon. Contoh frekuensi poligon dari data yang sama dapat dilihat pada Gambar 6.2. 2.
Histogram Rating yang diberikan oleh peneliti tidak memungkinkan seseorang memilih rating di luar bilangan bulat yang sudah disediakan. Artinya seseorang tidak dapat memilih rating 3,7 karena pilihan itu tidak tersedia. Sehingga orang yang memiliki rating antara 5,5 dan 6,5 akan terpaksa memilih rating 6. Menyadari hal ini, kita mencoba membuat suatu grafik yang dapat mencerminkan keadaan tersebut. Gambar tersebut adalah gambar
4.10
Metodologi Penelitian
kotak yang tersusun sedemikian rupa. Lebar kotak sama yang menunjukkan lebar interval untuk masing-masing bilangan bulat, sedangkan tinggi menunjukkan frekuensi dari bilangan bulat. Grafik seperti ini disebut Histogram. Contoh histogram untuk data pada Tabel 6.1 adalah Gambar 6.3.
Gambar 6.3. Histogram untuk data rating (200 siswa) terhadap usulan pendirian student center. Sumbu tegak adalah frekuensi dan sumbu datar adalah rating.
B. MENGELOMPOKKAN DATA Dalam penjelasan mengenai distribusi frekuensi dan histogram sebelum ini, data ditampilkan dalam bentuk diskrit dengan sedikit saja perbedaan. Akan tetapi, bagaimana kalau kita terlibat dengan data dalam bentuk satuan waktu (menit), misalnya waktu yang digunakan oleh masing-masing dari 100 pelajar dalam memainkan permainan elektronik (electronic games) pada hari yang ditentukan. Nilai nol akan sangat jarang terjadi, kecuali untuk pelajar yang tidak menggunakan waktu untuk memainkan mainan tersebut.
4.11
1.
Data Mentah (Partial) Tabel 6.2. Distribusi grup dari waktu yang digunakan untuk memainkan mainan elektronik Menit (X) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Frekuensi (f) 11 0 1 2 0 1 3 1 1 0 0 0 3 1 0 4 0
Menit (X) 17 18 19 : 40 41 42 43 44 45 46 47 48 49 50 : :
Frekuensi (f) 1 0 1 : 1 2 1 2 1 0 3 1 1 2 0 : :
Grup Data Interval Menit (X) 0-9 10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 100 - 109 110 - 119 120+
Ttk tengah (Menit) 4,5 14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5 104,5 114,5 124,5
Frekuensi (f) 20 10 5 8 14 8 2 7 5 3 5 4 9
Frekuensi Komulatif 20 30 35 43 57 65 67 74 79 82 87 91 100
4.12
Metodologi Penelitian
Dengan demikian, seseorang mungkin menggunakan waktunya selama 18 menit, yang lainnya menggunakan waktu 20 menit, tetapi tak seorangpun yang menggunakan waktu persis 19 menit. Dengan data yang bentuknya seperti ini akan sulit sekali bagi kita untuk menyajikan distribusi frekuensi menggunakan ide histogram. Mungkin akan sangat membantu bilamana kita membuat grup-grup dalam interval-interval dengan interval waktu 10 menit. Kemudian, distribusinya kita plot. Sebagai contoh adalah data pada Tabel 6.2. Pada bagian bawah Tabel 6.2 interval tertera pada bagian paling kiri. Batas atas dan batas bawah interval yang sebenarnya adalah bilangan yang jatuh pada tengah-tengah antara ujung atas interval dan ujung bawah interval berikutnya. Jadi, interval 10-19 sebenarnya mempunyai interval 9,5 - 19,5. Selain itu tampak pula istilah titik tengah interval. Titik tengah interval adalah nilai rata-rata dari batas atas dan batas bawah interval tersebut. Tampak juga ada kolom yang berjudul frekuensi. Di sini tampak 8 orang menggunakan waktu 30 - 39 menit untuk bermain mainan elektronik. Mungkin muncul pertanyaan tentang "berapa banyak interval yang harus dibuat bila membuat grup?”. Tidak ada jawaban yang pasti tentang banyaknya interval yang harus dibuat. Tetapi sekitar 10 buah interval rasanya cukup bagus untuk menyajikan data dengan cara membuat grup ini. Bentuk distribusi frekuensi dalam grup dari Tabel 6.2 dapat Anda lihat pada Gambar 6.4.
Gambar 6.4
4.13
2.
Distribusi Kumulatif Semua distribusi yang didiskusikan sebelum ini menitikberatkan pada frekuensi observasi untuk tiap skor atau untuk tiap interval, akan tetapi ada cara lain untuk melihat data dalam bentuk distribusi, tetapi distribusi dari frekuensi skor yang jatuh pada atau lebih kecil dari skor/interval tertentu. Sebagai contoh, perhatikan Tabel 6.2. Tampak bahwa terdapat 20 siswa yang memakai waktu mereka selama 0 - 9 menit, serta 10 siswa yang memakai waktu 10 - 19 menit untuk bermain mainan elektronik. Dari sini dikatakan bahwa jumlah siswa yang menggunakan waktu bermain 19 menit atau kurang adalah 20 + 10 siswa = 30 siswa. Distribusi yang menggambarkan frekuensi kumulatif disebut distribusi kumulatif Contoh frekuensi kumulatif adalah pada Tabel 6.2 bagian paling kanan. Sedangkan plot datanya ada pada Gambar 6.5.
Gambar 6.5. Distribusi kumulatif dari data waktu yang dipakai untuk bermain mainan elektronik.
L AT IH AN Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! Anak-anak berbeda dengan orang dewasa dalam hal menceritakan kembali apa yang sudah diberikan. Anak-anak cenderung menceritakan sesuatu dengan mengingat-ingat cerita berdasarkan urutan. Sedangkan orang tua lebih ke cerita secara menyeluruh. Oleh karena itu, pada anak-anak bila menceritakan kisah dari film, kata-kata seperti "dan kemudian ..." sering
4.14
Metodologi Penelitian
sekali terdengar. Suatu eksperimen lalu dibuat, di mana 50 orang anak-anak disuguhi tontonan film. Setelah itu mereka diminta untuk menceritakan kembali kisah dari film tersebut. Si peneliti dalam salah satu variabel penelitiannya menghitung kata-kata "dan kemudian ..." . Hasil catatannya adalah sebagai berikut. 18 17 20 11 19
15 21 23 19 16
22 23 22 31
19 18 10 16
18 20 17 17
17 21 19 15
18 20 19 19
20 20 21 20
17 15 20 18
12 18 18 18
16 17 18 40
16 19 24 18
1) Plot distribusi frekuensi (bukan yang digrupkan) dari data di atas. 2) Buatlah histogramnya. 3) Buatlah distribusi frekuensi kumulatifnya. Petunjuk Jawaban Latihan Lihat contoh-contoh yang diberikan
RA NG K UM A N
Untuk mengajukan data agar informasinya dapat dengan mudah dimengerti maka plotlah data tersebut, atau buatlah histogramnya. Sajian data dalam bentuk seperti ini akan lebih mudah di mengerti oleh pembaca.
T ES FO R M AT IF 2 Pilihlah satu jawaban yang paling tepat! Untuk penelitian yang sama, peneliti meminta 50 orang dewasa untuk menonton film yang disuguhkan dan meminta mereka menceritakan kembali
4.15
kisah film tersebut. Peneliti juga mencatat berapa banyak kata-kata "dan kemudian ..." disebut oleh mereka. Datanya adalah: 10 9 10 3 15
12 9 14 11 9
5 11 7 14
8 15 16 8
13 12 9 12
10 17 1 5
12 14 4 10
8 10 11 9
7 9 12 7
11 8 7 11
11 15 9 14
10 16 10 10
1) Dengan hanya melihat ke dua macam data di atas dapatkah Anda melihat perbedaan antara anak-anak dan orang dewasa dalam menceritakan kembali cerita film yang mereka tonton? 2) Plotlah distribusi frekuensinya (bukan yang digrupkan). 3) Buatlah histogramnya! 4) Buatlah frekuensi kumulatifnya! Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 2.
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan Kegiatan Belajar 3. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang belum dikuasai.
4.16
Metodologi Penelitian
Kegiatan Belajar 3
Statistik Deskriptif dan Statistik Inferensi
P
rosedur statistik secara kasar dapat dibagi menjadi dua bagian, yaitu statistik deskriptif dan statistik inferensi. Perbedaan kedua prosedur ini akan dibahas secara ringkas berikut ini. 1.
Statistik Deskriptif Bila maksud penelitian yang Anda buat adalah hanya untuk menerangkan keadaan suatu set data, maka Anda hanya terlibat dengan statistik deskriptif. Sebagai contoh adalah nilai rata-rata untuk pelajaran Matematika di suatu kelas atau jumlah korban pembunuhan setiap bulannya di DKI. Pada statistik deskriptif teknik-teknik yang paling sering adalah memplot data, mencari nilai rata-rata beserta nilai standar deviasinya, menghitung nilai percentile, mencari nilai median, modus dan sebagainya. Teknik-teknik dasar ini juga akan dipakai pada statistik inferensi. Oleh karena itu, setiap orang yang mempelajari statistik harus tahu tentang teknik-teknik dasar tersebut. 2.
Statistik Inferensi Keputusan yang diambil dari data yang sangat terbatas untuk menaksir keadaan di populasi biasanya merupakan kesimpulan yang tidak tepat. Hal ini karena data yang diambil biasanya tidak representatif atau tidak mewakili keadaan di populasi. Sebagai contoh, Anda mendengar bahwa orang yang jangkung cenderung lebih sopan dari orang yang lebih pendek. Anda lalu setuju dengan pendapat itu karena salah seorang teman Anda yang jangkung memang sangat sopan. Dalam kasus ini Anda hanya melihat contoh untuk satu orang saja, bagaimana dengan orang-orang lainnya. Oleh karena itu, sebelum menyetujui pendapat di atas Anda harus menelitinya dengan lebih banyak orang yang mempunyai tinggi yang berbeda-beda. Pendapat dari seseorang bahwa anak wanita lebih cepat dapat berbicara daripada anak lakilaki karena orang tersebut mempunyai anak wanita yang lebih cepat berbicara dibandingkan dengan anak laki-lakinya, belum tentu benar. Observasi tunggal yang hasilnya digeneralisasi mungkin dapat dibenarkan bilamana
4.17
observasi dilakukan pada "sesuatu" yang memiliki variabilitas yang sangat kecil. Untuk mengetahui berapa jumlah kaki sapi, kita hanya perlu mengambil seekor sapi dan menghitung jumlah kakinya. Kita tidak membutuhkan jumlah sapi yang besar untuk sekadar mengetahui jumlah kakinya. Hal ini dapat dibenarkan karena variasi jumlah kaki sapi sangat kecil. Memang ada sapi yang cacat yang memiliki kaki yang tidak sama dengan empat, tetapi jumlahnya tidaklah banyak sehingga variabilitas jumlah kaki sapi akan sangat kecil. Kebanyakan bidang psikologi dan ilmu sosial lainnya menggunakan statistika inferensi. Untuk mengulas sedikit tentang konsep statistik akan dibahas sedikit konsep mengenai populasi, sampel, parameter dan statistik. Selain itu juga akan dibahas pula statistika parametrik dan statistika nonparametrik. 3.
Populasi, Sampel, Parameter, dan Statistika Populasi dapat didefinisikan sebagai seluruh koleksi kejadian yang Anda teliti (seperti nilai IPK seluruh mahasiswa FMIPA UT, nilai NEM siswa SD seluruh Indonesia). Jadi, kalau kita tertarik untuk meneliti NEM siswa SD sepuluh tahun terakhir di Indonesia maka seluruh siswa SD yang mengikuti Ebtanas sepuluh tahun terakhir ini adalah merupakan populasi penelitian kita. Besar atau kecilnya populasi tergantung dari niat penelitian. Kalau kita ingin menyelidiki tinggi badan rata-rata rakyat Indonesia maka populasinya adalah seluruh rakyat Indonesia. Tetapi kalau yang diinginkan adalah tinggi rata-rata rakyat Indonesia yang berusia 17 - 24 tahun maka populasinya adalah rakyat Indonesia yang berusia 17- 24 tahun. Tampak bahwa kedua populasi di atas besarnya berbeda walaupun sama-sama mengukur tinggi badan. Populasi dapat bergerak dalam range sangat kecil sampai tak terbatas. Dari sisi teori, populasi juga bisa terbilang dan tak terbilang. Dalam penelitian, meneliti populasi hampir tidak mungkin. Banyak sebabnya, antara lain waktu dan biaya. Oleh karena itu, peneliti mencoba menaksir keadaan populasi dengan meneliti sebagian saja dari populasi tersebut. Bagian populasi yang diteliti inilah yang dikenal dengan istilah sampel. Untuk lebih jelasnya, sampel didefinisikan sebagai observasi aktual yang merupakan subset dari populasi. Bilamana kita mengambil sampel, biasanya kita menghitung nilai-nilai numerik (seperti mean dan standard deviasi) yang menerangkan tentang
4.18
Metodologi Penelitian
keadaan data yang kita miliki. Bila nilai-nilai ini dihitung berdasarkan sampel yang kita ambil maka nilai-nilai ini disebut dengan istilah statistik. Nilainilai statistik yang kita hitung mempunyai kaitan dengan nilai pada populasi. Nilai populasi yang berkaitan dengan nilai statistik disebut dengan parameter. Jadi, populasi juga mempunyai nilai rata-rata, tetapi nilainya tidak diketahui. Sedangkan sampel mempunyai nilai rata-rata yang bisa dihitung. Nilai rata-rata pada populasi adalah salah satu contoh dari parameter. 4.
Memilih Prosedur Statistik Di atas sudah dijelaskan perbedaan antara statistik deskriptif dan statistik inferensi. Tapi pertama-tama yang harus dikuasai adalah statistik deskriptif karena berguna untuk mendeskripsikan data dan juga berguna untuk menginferensi keadaan data di populasi. Bila menggunakan statistik inferensi maka diperlukan alat bantu untuk memilih prosedur statistik yang akan digunakan. Alat bantu pemilihan prosedur statistik ini kita sebut saja dengan pohon keputusan (decision tree), yang bentuknya adalah sebagai berikut:
Gambar 6.6
4.19
Dengan pohon keputusan ini Anda dapat lebih mudah melihat (secara kasar) prosedur statistik yang mana yang cocok dengan kebutuhan Anda. Sudah tentu diagram tree di atas tidak menunjukkan semua prosedur statistik yang tersedia. Karena di samping statistik univariat terdapat pula statistik multivariat. 5. Jenis-jenis Data Data numerik biasanya berasal dari dua jenis, yaitu data pengukuran (measurement) data dan data katagorikal (catagorical data). Data pengukuran atau yang juga dikenal dengan data kuantitatif adalah data yang dihasilkan dari mengukur variabel yang diteliti. Sebagai contoh adalah IPK mahasiswa UT, tinggi atau berat murid SD kelas 6, kecepatan membaca seseorang. Data jenis ini diukur dengan suatu alat ukur. Sedangkan data katagorikal, juga dikenal sebagai data frekuensi adalah terdiri dari pernyataan-pernyataan seperti "seratus tiga puluh orang menyukai cokelat batangan yang berisi kacang" sedangkan "dua puluh tiga orang menyukai cokelat batangan tanpa isi". Pada data jenis ini kita menghitung sesuatu dan data tersebut terdiri dari jumlah total atau frekuensi dari masingmasing katagori (karena itu disebut data katagorikal). Beberapa ratus anggota fakultas mungkin memilih kurikulum baru dalam suatu voting, tetapi data yang dihasilkan nantinya akan terdiri dari dua macam bilangan saja, yaitu yang setuju dan yang tidak setuju dengan kurikulum baru. Berbeda dengan data katagorikal, pada data pengukuran bilamana terdapat 120 objek yang diukur maka akan dihasilkan sejumlah persis 120 data. Kadangkala kita dapat mengukur variabel yang sama dengan dua macam data. Misalnya, variabel tinggi dapat diukur dengan sentimeter sehingga kalau terdapat 100 orang yang akan diukur tingginya maka akan terdapat 100 data tentang tinggi badan orang-orang yang diukur. Tetapi kita juga dapat menggunakan klasifikasi tinggi, sedang dan pendek untuk mengukur tinggi orang. Yang terakhir ini adalah katagorikal. Kedua jenis data ini akan diperlakukan secara berbeda nantinya. 6.
Perbedaan (differences) dan Keterhubungan (relationship) Pada umumnya pernyataan statistik, akan jatuh ke dalam salah satu katagori perbedaan atau keterhubungan. Sebagai contoh, seorang peneliti tertarik untuk meneliti apakah ada perbedaan kinerja terhadap tugas tertentu yang dilakukan oleh perokok dan oleh bukan perokok. Tetapi peneliti yang
4.20
Metodologi Penelitian
lainnya tertarik untuk mengetahui apakah ada hubungan antara jumlah rokok yang dihisap dengan skor kinerja terhadap tugas tertentu tadi. Walaupun kedua pertanyaan itu tampaknya saling tumpang tindih, tetapi mereka berdua akan diperlakukan secara berbeda.
7.
Banyak Grup atau Variabel Banyak grup atau variabel juga menentukan teknik statistik yang mana yang akan dipakai. Seperti yang dapat dilihat pada decision tree, jumlah grup (variabel) yang berbeda akan menggunakan teknik statistik yang berbeda. Uji mean dengan hanya 2 grup akan lain tekniknya dengan uji mean untuk lebih dari 2 grup. Demikian juga jumlah variabel yang berbeda dapat memakai teknik statistik yang berbeda pula. Kalau uji mean untuk tiga grup tapi dengan satu variabel bebas akan memakai oneway ANOVA, tetapi uji mean untuk tiga grup dengan dua variabel bebas akan menggunakan factorial ANOVA. Untuk tingkat yang lebih rumit Anda dapat juga membuat penelitian dengan lebih dari satu variabel tak bebas (Anda dapat mempelajarinya pada statistika multivariat). 8.
Skala Pengukuran Topik skala pengukuran ini walaupun tampaknya sederhana, tetapi cukup memainkan peranannya dalam penelitian. Banyak orang yang masih melakukan kesalahan mendasar karena salah mengerti dalam memahami skala pengukuran ini. Contohnya, masih ada peneliti yang membuat korelasi antara variabel nominal. Katakanlah seorang peneliti mempunyai data IPK dari 10 SMU (sebut sebagai SMU I sampai dengan SMU X). Pemberian angka I sampai X ini adalah penamaan secara nominal. Kalau teknik statistik yang digunakan adalah teknik korelasi maka apa artinya ini? Pengukuran (measurement) biasanya didefinisikan sebagai pemberian bilangan-bilangan ke objek-objek. Kata bilangan dan objek di sini biasanya sering tercampur. Misalnya kita akan mengukur pengetahuan pelajar tentang IPA. Kita mengukur pengetahuan pelajar (melalui tes) dengan memberikan bilangan (hasil tes) kepada pelajar (objek) yang diuji.
4.21
9.
Skala Nominal Skala Nominal adalah bilangan yang digunakan hanya untuk membedakan objek-objek yang diteliti. Pada dasarnya skala ini bukanlah merupakan skala karena ia tidak mengukur sesuatu, tetapi hanya memberi label saja. Contoh skala nominal adalah nomor punggung pemain bola, nomor telepon dan jenis kelamin pria = 1, wanita = 2. Biasanya penomoran ini tidak mempunyai arti lain kecuali untuk membedakan satu dengan yang lainnya. Skala nominal juga dapat menggunakan huruf. Skala nominal biasanya digunakan untuk klasifikasi. Data katagori yang sudah dijelaskan sebelum ini memakai skala nominal, sebab dalam observasi mereka biasanya menunjukkan sesuatu seperti pria/wanita, setuju/tidak setuju. 10. Skala Ordinal Skala Ordinal adalah bilangan yang digunakan untuk menempatkan objek-objek di dalam suatu urutan. Skala ordinal akan mengurutkan objek penelitian pada suatu kontinum. Salah satu contohnya adalah besar, sedang, kecil dapat Anda beri skala 3, 2, dan 1. Di sini urutan objek dapat dibuat. Yaitu 3 > 2 > 1. Sedangkan pada skala nominal kita tidak dapat membuat urutan seperti ini sebab pemberian angkanya hanya untuk membedakan objek penelitian semata-mata. Contoh lainnya adalah ranking di suatu kelas yang dihitung berdasarkan IPK misalnya. Di sini rangking tersebut dapat di urutkan. Apakah kita bisa mengatakan bahwa perbedaan IPK antara ranking I dan ranking II sama dengan perbedaan IPK antara ranking IX dan ranking X?. Kita tidak bisa mengatakan bahwa perbedaan mereka adalah sama besarnya. Jadi pada skala ordinal yang dapat dikatakan hanya perbedaan urutannya saja. Kita tidak mempunyai informasi tentang perbedaan di antara mereka. 11. Skala Interval Skala Interval adalah skala di mana interval-interval yang sama besarnya di antara objek-objek, menunjukkan perbedaan yang sama pula, sehingga perbedaan mempunyai arti. Dengan skala interval kita tidak hanya bisa mengurutkan objek-objek, tetapi juga dapat melihat perbedaan di antara mereka. Contoh skala ini adalah temperatur yang diukur dalam derajat Fahrenheit. Perbedaan antara temperatur 10°F dan 20°F dengan 80°F dan 90°F adalah sama. Akan tetapi, pada skala interval ini yang tidak bisa
4.22
Metodologi Penelitian
dilakukan adalah membuat ratio. Sehingga kita tidak bisa mengatakan bahwa panas dengan temperatur 40°F adalah setengah dari panas dengan temperatur 80°F, atau dua kali panas dengan temperatur 20°F. Hal ini karena titik 0 pada skala itu letaknya tidak tetap. Contohnya 20°F and 40°F ekivalen dengan 7°C dan 4°C. Jadi, 0°F dan 0°C tidak terletak pada titik yang sama. Sehingga pada temperatur, titik 0 nya tergantung pada skala mana yang digunakan. Oleh karena itu, titik 0 pada skala temperatur bukanlah titik 0 yang sebenarnya.
12. Skala Ratio Skala ratio adalah skala yang memiliki titik 0 yang sebenarnya. Oleh karena itu, pada skala ini kata ratio benar-benar memiliki arti. Titik ini letaknya tetap, dan tidak pernah berubah seperti titik 0 pada skala temmperatur. Titik 0 adalah titik yang berkaitan dengan tidak adanya (absence) sesuatu yang diukur. Karena 0°F dan 0°C bukanlah merupakan ketidak beradaan sesuatu yang diukur maka mereka bukanlah titik 0 yang sebenarnya. Dengan skala rasio ini sifat-sifat yang ada pada skala sebelumnya tercakup di dalamnya. Juga, dengan skala ini kita dapat mengatakan bahwa 10 detik adalah 2 kalinya 5 detik dan 7 kg adalah seperduanya 14 kg. Tampak bahwa skala rasio ini tidak sulit diterima bila diukur untuk pemakaian pada fisika, tetapi bagaimana kalau dilakukan pengukuran pada daerah sosial? Misalkan di suatu kelas diadakan ujian untuk mata pelajaran tententu. Nilai minimum adalah 0 dan nilai maksimum adalah 100. Seseorang yang tidak belajar atau cukup bodoh katakanlah menerima nilai 0. Apakah dapat kita katakan ia tidak berpengetahuan? Orang yang lain lagi mendapat nilai 40 dan 80. Dapatkah kita katakan bahwa yang bernilai 80 pengetahuannya adalah 2 kali yang bernilai 40? Jawabannya tidak. 13. Variabel-variabel Dalam penelitian istilah variabel akan sering sekali Anda gunakan. Oleh karena itu, istilah ini perlu Anda pahami. Variabel adalah sifat-sifat dari objek-objek atau kejadian-kejadian yang dapat mengambil nilai-nilai yang berbeda (Howell, 1989). Warna rambut adalah contoh variabel karena ia merupakan sifat dari objek (rambut), dan ia dapat mengambil beberapa warna
4.23
seperti cokelat, pirang, putih, merah ataupun hitam. Sesuatu seperti panjang, lebar, isi adalah juga variabel (karena alasan yang sama). Variabel dapat dibedakan berdasarkan banyaknya nilai yang dimiliki menjadi dua macam, yaitu variabel diskrit dan variabel kontinu. Variabel diskrit hanya mempunyai sejumlah kecil nilai yang mungkin. Contohnya adalah jenis kelamin, status perkawinan, jumlah TV yang dimiliki oleh suatu keluarga. Sedangkan variabel kontinu dapat mempunyai tak terbilang banyaknya nilai yang mungkin. Contohnya adalah, ukuran panjang, volume, tinggi manusia. Tinggi manusia, misalnya bergerak dari 0 m sampai 3 m. Di antara bilangan 0 dan 3 m ini terdapat tak terbilang banyaknya bilangan yang mungkin. Di dalam statistik variabel juga dapat dibagi menjadi 2 macam, yaitu variabel bebas dan variabel tak bebas. Menurut Howell (1989), variabel bebas adalah variabel yang dapat dimanipulasi oleh peneliti atau dapat dikontrol. Sedangkan variabel tak bebas adalah variabel yang tidak dapat dikontrol oleh peneliti. Sebagai contoh misalnya pada eksperimen di bidang pertanian. Seorang peneliti ingin melihat pengaruh temperatur dan pupuk terhadap pertumbuhan suatu tanaman (diukur dari tinggi dan lingkar batang). Peneliti di sini dapat mengatur jenis-jenis pupuk yang akan dipakai. Ia juga dapat mengatur ukuran temperatur pada eksperimen yang akan dilakukan. Variabel temperatur dan pupuk di sini adalah variabel bebas. Sedangkan pertumbuhan tanaman yang diukur dengan tinggi dan diameter batang adalah variabel tak bebas (nilai variabel ini bergantung dari nilai variabel bebas sehingga ia dikatakan variabel tak bebas). 14. Ukuran keterpusatan Ukuran keterpusatan adalah bilangan yang menunjukkan pusat dari distribusi data. Sebelum ini sudah kita diskusikan cara menyajikan data sehingga kita bisa dengan mudah melihat keadaan data tersebut. Plotting data memudahkan kita melihat bentuk distribusi data. Sedangkan pada ukuran keterpusatan akan memberikan informasi tentang pusat dari data. Ada tiga macam bentuk ukuran keterpusatan yaitu mode, median dan mean. Mode dapat didefinisikan sebagai nilai (skor) yang paling banyak muncul. Sebagai contoh, lihat Tabel 6.1. Pada Tabel ini modenya adalah 6, karena nilai 6 muncul sebanyak 49 kali. Sedangkan nilai lainnya muncul tetapi lebih kecil dari 49 kali. Bagaimana kalau nilai terbesar yang muncul
4.24
Metodologi Penelitian
ada lebih dari satu? Untuk itu kita katakan bahwa modenya ada lebih dari satu buah. Median didefinisikan sebagai nilai (skor) yang berkaitan dengan suatu titik di mana (bila data diurutkan) 50% dari data akan berada di bawah skor median ini. Kalau data 5, 8, 3, 7, 15 diurutkan akan didapat 3, 5, 7, 8, 15 yang memiliki nilai median = 7. Tampak bahwa separuh data berada di bawah nilai 7. Kalau banyak data katakanlah ada N buah, bagaimana cara menentukan letak mediannya? Cara menentukan lokasi median (setelah data diurutkan) adalah N + 1 Lokasi Median = 2 Seperti contoh di atas lokasi mediannya adalah data ke (5 +1)/2 = 3. Tampak bahwa data yang ke-3 adalah 7. Bagaimana kalau banyak data genap (misalnya 12)? Kalau banyak data 12 maka mediannya terletak pada data ke 6,5. Artinya nilai mediannya adalah data ke 6 ditambah data ke tujuh lalu dibagi 2. Untuk data pada Tabel 6.1 maka mediannya adalah data ke (200 + 1)/2 = 100, 5. Ini artinya data ke 100 + data ke 101 lalu dibagi 2 di mana hasilnya adalah 6. Mean adalah nilai ukuran keterpusatan yang paling sering digunakan orang. Nilai mean adalah jumlah skor total dibagi dengan banyaknya data. Nilai ini biasanya diberi Notasi X , N
∑
dengan X =
i = 1
X
i
N
15. Ukuran Variabiliti Di atas sudah dibahas konsep tentang pusat distribusi. Akan tetapi, informasi tersebut masih belum lengkap untuk menjelaskan keadaan suatu distribusi. Untuk melengkapi informasi tentang keadaan suatu distribusi haruslah ada ukuran lain yang digunakan yaitu tentang bagaimana "sebaran" nilai-nilai observasi yang dimiliki terhadap pusat distribusi. Ukuran yang mengacu terhadap sebaran nilai-nilai observasi dengan nilai dari pusat distribusi disebut dengan istilah dispersi atau variabiliti. Ada beberapa
4.25
macam ukuran dispersi, tetapi yang dibahas di sini adalah variansi dan standar deviasi. Secara matematik variansi adalah jumlah kuadrat dari perbedaan antara nilai-nilai observasi dengan nilai mean dibagi (N-1). Kalau perbedaan tersebut tidak dikuadratkan, maka jumlah total dari perbedaan-perbedaan adalah nol. Pembagian dengan (N-1) adalah agar nilai variansi yang didapat adalah merupakan taksiran yang unbiased untuk nilai parameter di populasi. Mengenai sifat-sifat taksiran dapat Anda pelajari pada mata kuliah statistik lainnya. Formula matematik untuk variansi adalah: N
∑
S
2
=
i = 1
( xi − x )
2
N − 1
Sedangkan standar deviasi secara matematik adalah akar dari variansi. Simbol untuk standar deviasi adalah s atau sd, yang formulanya adalah: N
∑(
sd =
i = 1
x1 − x )
N
2
− 1
L AT IH AN Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! 1) Kalau seandainya Anda mempunyai data yang berasal dari skala nominal, apakah ada artinya kalau seandainya data tersebut Anda urutkan? 2) Sebutkanlah definisi mean, median, dan mode! 3) 5 ekor tikus disuruh berlari. Peneliti mencatat jumlah tikus yang mampu menjalani sejumlah putaran tertentu. Data yang diperoleh adalah: Jumlah putaran lari Jumlah tikus
18 1
19 0
20 4
21 3
22 3
23 3
24 1
4.26
Metodologi Penelitian
Hitunglah nilai mean, median dan mode dari jumlah putaran lari yang diperoleh tikus-tikus di atas. 4) Diberikan data: 8 7 12 14 3 dan 7. a) Hitung mean, median dan modenya. b) Kurangi masing-masing data dengan 5, lalu hitung mean, median dan modenya Perhatikan perbedaan nilai mereka dengan nilai dari data asli. c) Kalikan masing-masing data dengan 2, lalu hitung mean, median dan modenya. Perhatikan perbedaan nilai mereka dengan nilai dari data yang asli. 5) Hitunglah nilai variansi dan standar deviasi dari soal no. 4 a), b), dan c) di atas. Petunjuk Jawaban Latihan Perhatikan contoh-contoh yang diberikan.
RA NG K UM A N 1. 2.
Statistik deskriptif digunakan bila peneliti ingin menerangkan keadaan suatu data seperti nilai rata-rata atau sebarannya. Statistik inferensi digunakan untuk menerangkan keadaan suatu data "besar" dari data “kecil” yang diambil dari data “besar” tadi. Di sini akan terkait sampel, populasi, uji kode, uji keterhubungan (korelasi).
T ES FO R M AT IF 3 Pilihlah satu jawaban yang paling tepat! Diberikan data: 5 8 9 4 6 3 Hitunglah a) nilai mean, median dan modenya; b) nilai variansi dan standar deviasinya.
7
8
7
3
4.27
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 3 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 3.
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang
Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang belum dikuasai.
4.28
Metodologi Penelitian
Kunci Jawaban Tes Formatif Tes Formatif 1 1) Seandainya banyak terdapat informasi yang dapat diberi kode dan Anda tidak melakukan pengkodean maka akan banyak sekali waktu yang Anda butuhkan untuk memasukkan data ke komputer. Lagi pula ruang yang dibutuhkan akan besar sekali bila dibandingkan dengan informasi yang sudah diberi kode. Di samping itu, kalau Anda tidak melakukan pengkodean maka Anda akan menemui kesulitan sewaktu akan melakukan analisis data. 2) Kita tidak harus memindahkan data dari kuesioner ke suatu tabel terlebih dahulu. Kalau kita sudah memberi kode untuk informasi di kuesioner, dan setelah kita periksa kuesioner tersebut maka kita dapat langsung menuliskan informasi dari kuesioner langsung ke komputer. Kalau sudah selesai memasukkan data tersebut maka kita dapat membuat tabel-tabel yang kita inginkan dengan mudah. Walaupun tidak ada larangan untuk memindahkan data dari kuesioner ke kertas dalam bentuk tabel, tetapi hal ini akan menyita waktu yang tidak sedikit. Dengan sudah sedemikian majunya perangkat lunak yang ada maka kita tidak perlu melakukan pemindahan ke kertas dulu. Tes Formatif 2 1) Tampak selintas bahwa anak-anak lebih banyak memakai kata-kata "dan kemudian ..:". Kelihatan angka-angka yang ada pada orang dewasa banyak yang lebih kecil dari angka-angka yang muncul pada anak-anak. 2)
4.29
3)
4)
Tes Formatif 3 a) mean = 6 ; median = 6,5 ; mode = 3, 7, dan 8 di mana masing-masing mempunyai frekuensi yang sama besar yaitu 2. b) Variansi = 4,67 dan standar deviasi = 2,16
4.30
Metodologi Penelitian
Daftar Pustaka Howel. D.C. (1989). Fundamental Statistics for the Behavioral Sciences. Boston: PWS-KENT Publishing Company. Norusia. M.J. (1990). SPSS: SPSS/PC+ 4.0. Base Manual. USA: SPSS Inc.