Modul 7
Estimasi dan Uji Hipotesis Bambang Prastyo, S.Sos.
PE N D A HU L UA N
A
pa yang akan Anda lakukan setelah Anda selesai melakukan penelitian? Tentunya Anda akan mengambil suatu kesimpulan. Nah seperti Anda ketahui bahwa dalam melakukan penelitian, biasanya kita hanya memakai sampel dan data dari sampel tersebut akan kita pakai untuk mewakili populasi. Lalu bagaimana data yang ada di sampel tersebut bisa menggambarkan keadaan di populasi? Untuk itu kita akan mencoba melakukan suatu inferensi (menarik kesimpulan). Dalam ilmu statistik ada dua konsep berkaitan dengan inferensia. Pertama, apa yang kita kenal sebagai estimasi atau secara sederhana kita katakan sebagai pendugaan. Dalam hal ini kita akan menduga keadaan di populasi dengan memakai data yang ada di tingkat sampel. Kedua, yang disebut sebagai pengujian hipotesis, yaitu apabila kita ingin memeriksa apakah data yang ada di tingkat sampel mendukung atau berlawanan dengan dugaan peneliti. Kedua hal tersebut akan kita coba bahas di dalam Modul 7 ini. Setelah mempelajari Modul 7 ini, Anda diharapkan dapat memanfaatkan statistika dalam penyusunan inferensi melalui estimasi terhadap data dari suatu sampel. Secara khusus, setelah mempelajari Modul 7 ini, Anda dapat: 1. menjelaskan pengertian estimasi parameter dan uji hipotesis; 2. melakukan perhitungan dan interpretasi; 3. menetapkan besaran sampel.
7.2
Pengantar Statistik Sosial
Kegiatan Belajar 1
Estimasi Parameter dan uji Hipotesis
P
engertian estimasi, sesungguhnya bukan merupakan satu hal yang asing dalam kehidupan manusia, termasuk Anda. Dalam kehidupan seharihari, pasti kita akan melakukan estimasi. Coba Anda ingat lagi. Apakah Anda pernah melakukan estimasi? Baik, saya akan coba membantu Anda untuk mengingat. Pernahkah Anda menduga siapa yang akan memenangkan pertandingan final sepak bola antara Prancis dan Italia? Pernahkah Anda menduga apakah Anda akan lulus mata kuliah pengantar statistik sosial? Masih banyak lagi contoh pendugaan, yang tentunya Anda lebih tahu. Nah sesungguhnya, Anda sudah melakukan suatu estimasi. Dengan demikian, secara sederhana kita dapat mengatakan bahwa estimasi adalah pendugaan. Estimasi akan kita pakai sebagai dasar untuk kita melakukan suatu keputusan. Dalam statistik, estimasi dikatakan sebagai salah satu cara untuk mengemukakan pernyataan induktif (menyatakan karakteristik populasi dengan menggunakan karakteristik yang didapat dari sampel ) Coba Anda perhatikan Gambar 7.1 mengenai estimasi.
Gambar 7.1.
Gambar 7.1 menunjukkan bagaimana kita melakukan pendugaan terhadap parameter populasi yang belum kita ketahui, dengan memakai data statistik di sampel yang sudah kita ketahui dengan melakukan penelitian. Nah, dalam melakukan estimasi, kita memakai beberapa estimator. Estimator adalah statistik yang digunakan untuk melakukan estimasi parameter
ISIP4215/MODUL 7
7.3
populasi. Contohnya, Seorang peneliti ingin meneliti tingkat kesejahteraan buruh yang ada di kompleks buruh Coca cola. Tercatat ada 1554 buruh yang ada di kompleks tersebut. Untuk itu, peneliti tersebut mengambil sampel sebanyak 250 buruh dan dari hasil penelitian diketahui bahwa rata-rata pendapatan responden per bulan sebesar Rp600.000,00. Berdasarkan data di tingkat sampel tersebut itu, peneliti bertanya lebih jauh lagi, apakah memang di tingkat populasi (dari 1554 buruh tersebut) memang memiliki pendapatan sebesar Rp600.000,00? Untuk menjawab pertanyaan tersebut maka peneliti tersebut akan melakukan estimasi terhadap rata-rata penghasilan buruh di tingkat populasi dengan memakai data rata-rata penghasilan buruh di tingkat sampel. Lalu apa yang dimaksud dengan uji hipotesis? Apa perbedaan antara uji hipotesis dengan estimasi? Memang benar bahwa baik estimasi maupun uji hipotesis adalah sama-sama pendugaan terhadap parameter populasi. Namun demikian, ada perbedaan yang mendasar antara estimasi dan uji hipotesis. Apabila dalam estimasi, kita menduga kenyataan yang ada di tingkat populasi dengan memakai data di sampel maka uji hipotesis lebih ditujukan untuk membuat suatu pertimbangan tentang perbedaan antara nilai statistik di sampel dengan nilai parameter populasi. Dengan adanya perbedaan nilai tersebut maka dalam pengujian hipotesis, kita akan diperkenalkan dengan suatu hipotesis, yang disebut sebagai hipotesis nul (Ho) dan hipotesis alternatif (Ha). Sebagai contoh, seorang peneliti yang sedang melakukan penelitian di suatu desa menanyakan mengenai rata-rata usia responden. di mana ternyata rata-rata usia responden adalah 32. Sebelum peneliti tersebut melakukan penelitian maka ia mengumpulkan data sekunder di kelurahan. Dari data sekunder tersebut, peneliti menemukan bahwa rata-rata usia penduduk yang masuk dalam karakteristik sampel adalah 30. Nah tentunya timbul pertanyaan dalam diri peneliti, mengapa terdapat perbedaan data, antara data yang ada di tingkat sampel (32), dengan data yang ada di tingkat populasi (30)? Untuk menjawab keingintahuan tersebut maka si peneliti akan melakukan suatu pengujian. yang kita kenal dengan pengujian hipotesis. Nah, apakah Anda melihat dengan jelas perbedaan antara estimasi dan uji hipotesis? Apabila kita simpulkan, estimasi adalah suatu langkah untuk melakukan pendugaan terhadap parameter populasi yang belum diketahui, dengan memakai data statistik yang ada di tingkat sampel. Uji hipotesis adalah suatu langkah pendugaan terhadap nilai parameter yang sudah
7.4
Pengantar Statistik Sosial
diketahui, dengan membandingkan pada data statistik yang ada di tingkat sampel. Untuk materi mengenai pengujian hipotesis ini akan kita bahas lebih jauh dalam modul delapan. Untuk saat ini, ada baiknya kita membahas terlebih dahulu mengenai estimasi parameter populasi secara lebih mendalam. A. ESTIMASI TITIK Di awal modul ini kita sudah mencoba melihat pengertian dari estimasi. Ternyata dalam statistik dikenal ada dua jenis estimasi, yaitu estimasi titik dan estimasi interval. Nah kita coba bahas satu per satu mengenai jenis estimasi tersebut. Estimasi titik adalah suatu nilai tunggal yang dihitung berdasar pengukuran sampel yang akan dipakai untuk menduga nilai tunggal yang ada di tingkat populasi, yang belum kita ketahui. Kita bisa, memakai nilai ratarata atau mean sebagai estimator, standar deviasi maupun variance. Ketiga pengukuran tersebut merupakan estimator yang baik karena cara pembentukan mean sampel dari nilai-nilai sampel sama dengan cara pembentukan mean populasi. Secara sederhana bisa kita katakan bahwa ratarata dari rata-rata sejumlah sampel akan sama nilainya dengan rata-rata di populasi (distribusi sampling). Masih bingung? Baiklah kita lihat dalam contoh berikut ini. Katakanlah ada seorang peneliti yang melakukan penelitian terhadap 100 orang yang mengikuti tes ujian masuk kursus komputer. Ke-100 orang tersebut dibagi dalam 5 kelompok. Ternyata dari hasil penelitian tersebut didapat data sebagai berikut: Tabel 7.1. Rata-rata Nilai yang Didapat Kelompok (Sampel) I II III IV V
Nilai Rata-rata 9 8 9 8 6
7.5
ISIP4215/MODUL 7
Berdasar Tabel 7.1 kita tahu bahwa kelompok I terdiri dari 20 orang, demikian pula kelompok lainnya. Dari 20 orang dalam tiap kelompok dihitung rata-rata nilai yang didapat. Kemudian, kita coba menghitung ratarata yang didapat oleh setiap kelompok. Nah rata-rata dari kelima kelompok itu, cenderung akan menyamai rata-rata dari 100 orang peserta tersebut (populasinya). Dengan demikian, kita dapat menduga bahwa rata-rata di tingkat populasi adalah (9+8+9+8+6):5 =8. Dengan demikian, kita bisa merumuskan sebagai berikut: Estimasi Populasi: ∑ (X) =µ Keterangan : - ∑ sigma (total jumlah) - X bar (rata-rata sampel) - µ Miu (rata-rata populasi) Demikian pula halnya untuk variance, rumusnya: Variance:
(X − X) 2 n −1 keterangan: S2 variance n sampel S2 =
∑
Apabila kita mencoba menghitung contoh kasus dari peneliti tadi maka kita dapat menghitung bahwa nilai variance dari populasi tersebut adalah: Nilai Rata-rata
(X − X) 2
9 8 9 8 6
(9-8)2 = 1 (8-8)2 = 0 (9-8)2 = 1 (8-8)2 = 0 (6-8)2 = 4
1+ 0 +1+ 0 + 4 6 = =1,5 5 −1 4 Standar deviasi, rumusnya: Standard Deviasi: S= S2
7.6
Pengantar Statistik Sosial
Dalam contoh kasus dari peneliti tadi maka nilai standar deviasi dari populasi tersebut adalah 1,5 = 1,22225. Dari hasil perhitungan nilai rata-rata, dan standar deviasi maka kita dapat mengambil kesimpulan bahwa estimasi titik untuk rata-rata nilai ujian masuk peserta adalah 8, dengan standar deviasi 1,22225. B. ESTIMASI TITIK TERHADAP PROPORSI POPULASI Pada bagian sebelumnya kita sudah mempelajari cara menghitung estimasi titik untuk nilai tertentu yang nilainya sudah kita ketahui (sudah pasti). Namun, sering kali kita juga melakukan pendugaan terhadap sesuatu hal yang proporsi populasinya tidak kita ketahui. Contohnya, apabila suatu ketika Anda ingin menduga berapa banyak pemirsa televisi yang menonton acara pertandingan final sepak bola piala Eropa tahun 2000. Nah, untuk mewakili proporsi pemirsa televisi yang menonton pertandingan final sepak bola itu kita gunakan rumus Variance proporsi: S2 = npq Keterangan :
S2 n p q
= = = =
variance proporsi Jumlah percobaan (sampel) Proporsi sampel sukses x Proporsi sampel gagal (I -p)
Standard deviasi proporsi: S = S2 Standard error proporsi: pq Sp = ( ) n Kita coba terapkan rumus-rumus proporsi tersebut dalam contoh. Dari data suatu biro penelitian, diketahui ada sebanyak 900 mahasiswa UT yang ingin menonton pertandingan final sepak bola. Ternyata setelah dilakukan penelitian, hanya ada 576 warga yang bisa menonton final sepak bola tersebut. Dengan demikian, estimasi titik terhadap proporsi jumlah pemirsa yang menonton pertandingan final adalah:
ISIP4215/MODUL 7
P=
7.7
x 576 = = 0, 64 n 900
q = 1-p= 1-0,64 = 0,36 Estimasi terhadap variance, standar deviasi proporsi dan standard error proporsi S2 = npq = 900 (0,64) (0,36) = 207,36 S = S2 = 207,36 = 14,4 pq (0, 64) (0,36) Sp = ( = 0, 016 )= n 900 LAT IH A N Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! 1) Buat bagan perbedaan estimasi dan uji hipotesis! 2) Buat bagan perbedaan estimasi titik terhadap nilai populasi dan estimasi titik terhadap proporsi populasi! Petunjuk Jawaban Latihan l)
Lihat lagi penjelasan tentang estimasi dan uji hipotesis. Buat berdasar pengertian, fungsi, serta persyaratan untuk masing-masing. 2) Lihat lagi penjelasan tentang masing-masing estimasi, buat berdasar pengertian, fungsinya, serta rumus yang digunakan. R A NG KU M AN Secara sederhana kita dapat mengatakan bahwa estimasi adalah pendugaan. Estimasi akan kita pakai sebagai dasar untuk kita melakukan suatu keputusan. Dalam melakukan estimasi, kita memakai beberapa estimator. Estimator adalah statistik yang digunakan untuk melakukan estimasi parameter populasi. Seorang peneliti melakukan estimasi ratarata di tingkat populasi dengan memakai data rata-rata di tingkat sampel.
7.8
Pengantar Statistik Sosial
Dalam statistik, dikenal ada 2 jenis estimasi, yaitu estimasi titik dan estimasi interval. Estimasi titik adalah suatu nilai tunggal yang dihitung berdasar pengukuran sampel yang akan dipakai untuk menduga nilai tunggal yang ada di tingkat populasi, yang belum kita ketahui. Kita bisa memakai nilai rata-rata atau mean sebagai estimator, standar deviasi maupun variance. Estimasi titik terhadap proporsi adalah pendugaan terhadap sesuatu hal yang proporsi populasinya tidak kita ketahui. Selain estimasi kita juga memiliki uji hipotesis yang juga merupakan pendugaan terhadap parameter populasi. Namun demikian, ada perbedaan yang mendasar antara estimasi dan uji hipotesis. Apabila dalam estimasi, kita menduga kenyataan yang ada di tingkat populasi dengan memakai data di sampel maka uji hipotesis lebih ditujukan untuk membuat suatu pertimbangan tentang perbedaan antara nilai statistik di sampel dengan nilai parameter populasi. Dalam pengujian hipotesis, kita diperkenalkan dengan suatu perumusan hipotesis, yang disebut sebagai hipotesis nul (Ho) dan hipotesis alternatif (Ha). TE S F OR M AT IF 1 Pilihlah satu jawaban yang paling tepat! 1) Estimasi adalah salah satu cara untuk .... A. menyatakan karakteristik populasi B. menyatakan karakteristik sampel C. menyatakan pernyataan deduktif dari populasi D. menyatakan pernyataan induktif terhadap sampel 2) Pernyataan yang benar adalah .... A. dalam estimasi, kita menduga kenyataan yang ada di tingkat populasi dengan memakai data di sampel B. dalam estimasi, kita menduga kenyataan yang ada di tingkat sampel dengan memakai data di populasi C. dalam estimasi kita membuat suatu pertimbangan tentang perbedaan antara nilai statistik di sampel dengan nilai parameter populasi D. dalam estimasi kita membuat suatu pertimbangan tentang persamaan antara nilai statistik di sampel dengan nilai parameter populasi 3) Distribusi sampling mengandung pengertian bahwa .... A. rata-rata sampel, akan sama nilainya dengan rata-rata di populasi B. rata-rata sejumlah populasi dibagi dengan rata-rata sejumlah sampel, akan sama nilainya dengan rata-rata di populasi
7.9
ISIP4215/MODUL 7
C. rata-rata sampel akan sama nilainya dengan rata-rata dari rata-rata sejumlah populasi D. rata-rata dari rata-rata sejumlah sampel, akan sama nilainya dengan rata-rata di populasi 4) Pendugaan terhadap proporsi populasi yang tidak diketahui, disebut sebagai .... A. estimasi titik B. estimasi proporsi C. estimasi sampel D. estimasi populasi 5) Notasi untuk rata-rata populasi adalah .... A. µ B. X C. Σ D. Mo
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang belum dikuasai.
7.10
Pengantar Statistik Sosial
Kegiatan Belajar 2
Estimasi Interval dan Penetapan Besar Sampel A. ESTIMASI INTERVAL Estimasi interval adalah suatu estimasi terhadap parameter populasi dengan memakai range (interval nilai). Berbeda dengan estimasi titik yang hasilnya merupakan suatu angka mutlak (angka pasti) maka estimasi interval merupakan sekumpulan angka, yang kita duga salah satunya adalah nilai yang kita duga. Dengan demikian, sesungguhnya estimasi titik merupakan hasil pendugaan yang lebih akurat. Pertanyaan sekarang adalah mengapa kita melakukan estimasi interval? Jawabnya adalah apabila kita melakukan estimasi interval maka hasil pendugaan kita akan lebih objektif. Kita juga dapat menyatakan berapa besar tingkat kepercayaan kita bahwa interval yang terbentuk memang mengandung nilai parameter yang kita duga. Tingkat kepercayaan tersebut ditunjukkan dengan peluang membuat kesalahan dalam menentukan interval dan dinyatakan dalam bentuk persentase. Bicara tentang interval kepercayaan (confidence interval) maka dalam ilmu sosial, interval kepercayaan yang sering dipergunakan adalah 90%, 95% atau 99%. Pada dasarnya seorang peneliti bebas menentukan berapa besar interval kepercayaan yang akan dipergunakan. Pertimbangannya adalah dengan semakin tingkat kepercayaan yang diberikan maka semakin tinggi pula tingkat kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval yang terbentuk, namun penelitian itu menjadi semakin tidak teliti. Gambar 7.2 berikut akan membantu Anda memahami penjelasan mengenai keterkaitan besarnya interval kepercayaan dengan ketelitian.
7.11
ISIP4215/MODUL 7
Gambar 7.2.
Gambar 7.2 menunjukkan bahwa dengan semakin besar interval kepercayaan yang diberikan maka interval yang terbentuk akan semakin besar, dengan demikian ketepatan estimasi semakin besar, namun ketelitiannya semakin kecil. Ketika peneliti menetapkan interval kepercayaan sebesar 99% maka interval yang terbentuk mulai dari titik 10 hingga titik 100 (range sebesar 90), dengan demikian kemungkinan bahwa parameter populasi (misalkan parameter populasi 50) akan berada pada interval yang terbentuk besar. Namun, ketika peneliti menetapkan interval kepercayaan sebesar 95% maka interval yang terbentuk mengecil (25-75) dengan range 50. Demikian pula ketika peneliti menetapkan interval kepercayaan 90% maka intervalnya semakin mengecil (40-60) dengan range sebesar 20. Nah dengan semakin mengecilnya interval yang terbentuk maka kemungkinan bahwa parameter akan berada pada interval yang terbentuk akan semakin kecil (ditunjukkan dengan range yang semakin mengecil), namun ketelitiannya semakin tinggi. Bicara mengenai ketelitian, kita bisa mengaitkan dengan pengertian alpha (daerah penolakan). Apabila kita menetapkan interval kepercayaan sebesar 95% maka dengan kata lain kita menetapkan alpha sebesar 5 % (10095). Pengertiannya adalah kita memberikan toleransi untuk melakukan kesalahan sebanyak 5 kali dalam 100 kali percobaan. Nah demikian pula kita
7.12
Pengantar Statistik Sosial
menetapkan interval kepercayaan sebesar 90% (alpha 10%) maka kita memberikan toleransi untuk melakukan kesalahan sebanyak 10 kali dalam 100 kali percobaan. Jelas bukan bahwa dengan kita memberikan toleransi kesalahan 5 kali, tentunya akan lebih baik (teliti) dibandingkan 10 kali. Dengan demikian, interval kepercayaan 95% (alpha 0.05) akan lebih teliti dibandingkan interval 90% (alpha 0.10). Penjelasan mengenai alpha ini akan kita bahas lebih lanjut pada modul sembilan. Sekarang kita kembali pada materi mengenai estimasi interval. Kita langsung saja dengan memakai sebuah contoh. Apabila di desa Tegalarang, diketahui bahwa rata-rata usia penduduk berdasarkan data di kelurahan adalah 35,3. (untuk informasi ini, anggaplah bahwa peneliti tidak tahu mengenai data rata-rata usia penduduk tersebut). Seorang peneliti yang sedang melakukan penelitian di desa Tegalarang itu, menemukan dari hasil penelitian bahwa rata-rata usia penduduk di desa Tegalarang adalah 36.3 tahun, dengan standar deviasi sebesar 13.3 yang didapat dengan menggunakan sampel sebanyak 120 orang, dari keseluruhan penduduk (populasi) sebesar 400 orang. Nah dengan mengetahui rata-rata usia di sampel, peneliti ingin melakukan estimasi terhadap rata-rata usia penduduk di populasi, (ingat bahwa yang mengetahui rata-rata usia penduduk desa Tegalarang adalah hanya kita saja. si peneliti tidak tahu. dan tidak perlu kita beri tahu). Kemudian, peneliti menggunakan interval kepercayaan sebesar 95%. Dengan interval kepercayaan itu maka peneliti memiliki kepercayaan bahwa nilai parameter di tingkat populasi akan berada pada interval ± Z standard error dari rata-rata populasi. Kita coba tinggalkan dulu kebingungan peneliti terhadap usaha estimasinya, kita coba bahas dulu apa maksud kalimat ± Z standard error dari rata-rata populasi. Sebelum kita melangkah lebih jauh, ada baiknya kita melihat beberapa penjelasan berikut. Masih ingat ketika kita membahas mengenai estimasi titik? Kita tahu bahwa rata-rata dari rata sampel akan sama dengan rata-rata populasi. Nah, sesungguhnya kita sudah bicara mengenai distribusi sampling. Distribusi sampling adalah sejumlah nilai yang didapatkan dari hasil sejumlah pengamatan atau sampel, yang menggambarkan penyebaran dan pemusatan data di tingkat populasi, yang cenderung akan membentuk kurva normal. Nah, apabila kita mengenal standar deviasi di tingkat sampel dan populasi maka dalam distribusi sampling standar deviasi disebut sebagai standard error. Standard deviasi ini sangat dipengaruhi oleh besar kecilnya sampel.
7.13
ISIP4215/MODUL 7
Apabila jumlah sampel semakin besar maka standard error akan semakin kecil, demikian pula sebaliknya. Rumus dari standard error adalah: σ X= n keterangan: X = standard error σ = standard deviasi di tingkat populasi n = jumlah sampel Apabila nilai σ tidak diketahui maka kita bisa gunakan nilai s, dengan S rumus: σ x = di mana s: standar deviasi di tingkat sampel. n −1 Kalimat ± Z standard error dari rata-rata populasi, apabila digambarkan dalam kurva, akan tampak seperti Gambar 7.3.
x
µ
x+Z σ
x–Z σ
Gambar 7.3.
Untuk nilai Z maka kita perlu melihat pada tabel Z berapa nilai yang ada. yang tentunya dipengaruhi oleh besar kecilnya interval kepercayaan yang diberikan. Kita lihat 3 nilai yang umum dipakai oleh ahli ilmu sosial. Interval kepercayaan 90% 95% 99%
Nilai Z pada tabel Z 1,645 1,96 2,58
Nah, kini kita kembali pada peneliti yang sedang melakukan estimasi di desa Tegalarang. Diketahui: X = 36,3 n = 120 s = 13,3 Ditanya: estimasi interval dengan kepercayaan 95%
7.14
Jawab
Pengantar Statistik Sosial
:
S X+ZS n −1 13,3 = 36,3 ± 1,96 120 − 1 X±Z
13,3 13,3 = 36,3 ± 1,96 < µ < 36,3 ± 1,96 120 − 1 120 − 1 = 33,95 < µ < 38,65 Dengan demikian, kita menginterpretasikan hasil estimasi peneliti tersebut dengan mengatakan bahwa peneliti memiliki 95% kemungkinan bahwa nilai rata-rata di populasi akan berada pada interval 33,95 sampai 38,65. Bisa juga disimpulkan bahwa peneliti memiliki kepercayaan 95% bahwa interval 33,95 sampai 38,65 akan mencakup nilai rata-rata di populasi. Dalam bentuk kurva akan terlihat seperti Gambar 7.4.
Gambar 7.4.
Nah kita sama-sama tahu bahwa berdasar data kelurahan, memang benar bahwa rata-rata populasi (35,3) memang berada pada interval 33,95 sampai 38,65. Dengan demikian, peneliti sudah benar dalam melakukan estimasi terhadap nilai parameter populasi dengan memakai data statistik yang ia miliki di tingkat sampel. B. PENETAPAN BESAR SAMPEL Dalam penelitian kuantitatif, jumlah sampel sering kali menjadi suatu permasalahan yang tidak habis-habisnya diperdebatkan. Mengapa? Kita mengambil hanya sebagian dari populasi yang ada maka selalu timbul pertanyaan apakah sampel yang sudah kita ambil benar-benar dapat mewakili
7.15
ISIP4215/MODUL 7
populasi yang ada. Apakah poling yang sering dilakukan oleh Kompas dapat mewakili seluruh penduduk Indonesia? Nah, untuk menjamin bahwa data yang sudah kita dapatkan di tingkat sampel mewakili populasinya maka kita harus menetapkan jumlah (besaran) sampel yang memang dapat dikatakan mewakili populasi. Tentu tidak mungkin kita hanya mengambil sampel sebanyak 100 orang untuk mewakili populasi yang berjumlah 100.000 orang. Lalu berapa jumlah sampel yang bisa kita ambil? Dalam hal besaran sampel yang ideal. memang masih banyak diperdebatkan oleh ahli sosial. Ada yang mengatakan bahwa kita bisa mengambil 10% dari seluruh populasi yang ada. Ada juga yang mengatakan bahwa minimal 25% dari populasi. Terlepas dari perdebatan ahli sosial, setidaknya kita dapat mempertimbangkan untuk menentukan besaran sampel dengan mengingat bahwa semakin besar sampel. atau semakin jumlah sampel mendekati jumlah populasi maka penelitian kita akan akurat. Dalam Tabel 7.2 berikut Anda akan melihat bagaimana besaran sampel akan mempengaruhi pada besarnya range interval sehingga ketepatan data lebih akurat. Tabel 7.2. Perubahan Besaran Sampel terhadap Range Interval dengan Alpha 0.05 Besaran sampel 100 200 500 1000 10000
Range interval $1970 $1390 $877 $620 $196
Sumber: George Argyrous, (130).
Tabel 7.2 menunjukkan bahwa apabila kita menggunakan jumlah sampel sebanyak 100 maka range interval berjarak $1970, sedangkan apabila kita menambah jumlah sampel menjadi 200 maka range menjadi semakin kecil. sehingga ketepatan data menjadi semakin akurat. Apabila Anda perhatikan dengan cermat, terlihat bahwa perubahan besaran sampel dari 100 ke 200 membuat perubahan range sebesar $580 (dari $1970 hingga $1390), sementara perubahan sampel dari 1000 hingga 10000 hanya membuat perubahan range interval sebesar $424 (dari $620 hingga $196). Dengan pertimbangan inilah maka banyak survei-survei sosial dan polling atau jajak
7.16
Pengantar Statistik Sosial
pendapat menetapkan jumlah sampel 1200-1400 sekalipun mereka mencoba melakukan generalisasi data terhadap populasi. Kita tidak perlu memperdebatkan berapa besar sampel yang ideal. Sebaiknya kita menetapkan besaran sampel yang sebesar mungkin, dengan mempertimbangkan faktor-faktor, seperti besaran interval kepercayaan yang kita gunakan, heterogenitas populasi, serta faktor-faktor teknis, seperti masalah tenaga pengumpul data, waktu, serta dana. LAT IH A N Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! 1) Buktikan bahwa dengan memakai interval kepercayaan yang berbeda, maka range interval akan berbeda! 2) Buktikan bahwa dengan memakai jumlah sampel yang berbeda, dalam interval kepercayaan yang sama, hasilnya akan berbeda! Petunjuk Jawaban Latihan 1) Gunakan rumus estimasi interval. Pakai interval kepercayaan 90%, 95%, 99%. Lihat lagi penjelasannya dalam materi. 2) Gunakan rumus estimasi interval. Pakai interval kepercayaan 95%, dengan sampel 100, 200, serta 300. Lihat lagi penjelasannya dalam materi.
R A NG KU M AN Estimasi interval adalah suatu estimasi terhadap parameter populasi dengan memakai range (interval nilai). Estimasi interval merupakan sekumpulan angka, yang kita duga salah satunya adalah nilai yang kita duga. Dengan melakukan estimasi interval maka hasil pendugaan kita akan lebih objektif. Kita juga dapat menyatakan berapa besar tingkat kepercayaan kita. bahwa interval yang terbentuk memang mengandung nilai parameter yang kita duga. Dalam ilmu sosial, interval kepercayaan yang sering digunakan adalah 90 %, 95 % atau 99 %.
ISIP4215/MODUL 7
7.17
Pada dasarnya seorang peneliti bebas menentukan berapa besar interval kepercayaan yang akan dipergunakan. Pertimbangannya adalah dengan semakin besar tingkat kepercayaan yang diberikan maka semakin tinggi pula tingkat kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval yang terbentuk, namun penelitian itu menjadi semakin tidak teliti. Apabila kita menetapkan interval kepercayaan sebesar 95% maka dengan kata lain kita menetapkan alpha sebesar 5% (100-95). Pengertiannya adalah kita memberikan toleransi untuk melakukan kesalahan sebanyak 5 kali dalam 100 kali percobaan. Dengan interval kepercayaan itu maka peneliti memiliki kepercayaan bahwa nilai parameter di tingkat populasi akan berada pada interval ± Z standard error dari rata-rata populasi. Terlepas dari perdebatan ahli sosial, setidaknya kita dapat mempertimbangkan untuk menentukan besaran sampel dengan mengingat bahwa semakin besar sampel. atau semakin jumlah sampel mendekati jumlah populasi maka penelitian kita akan akurat. Sebaiknya kita menetapkan besaran sampel yang sebesar mungkin, dengan mempertimbangkan faktor-faktor, seperti besaran interval kepercayaan yang kita gunakan, heterogenitas populasi, serta faktor-faktor teknis, seperti masalah tenaga surveier, waktu, serta dana. TE S F OR M AT IF 2 Pilihlah satu jawaban yang paling tepat! 1) Pernyataan yang benar adalah .... A. estimasi interval merupakan hasil pendugaan yang lebih akurat dibanding estimasi titik B. estimasi interval lebih objektif dibanding estimasi titik C. estimasi titik lebih akurat dibanding estimasi interval, namun memiliki objektivitas yang sama D. estimasi interval lebih akurat dibanding estimasi titik, namun memiliki objektivitas yang sama 2) Dalam menentukan besarnya interval kepercayaan, didasarkan pada .... A. semakin besar tingkat kepercayaan yang diberikan maka semakin tinggi pula tingkat kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval yang terbentuk, namun penelitian itu menjadi semakin tidak teliti B. semakin besar tingkat kepercayaan yang diberikan maka semakin tinggi pula tingkat kepercayaan bahwa parameter populasi yang
7.18
Pengantar Statistik Sosial
diestimasi terletak dalam interval yang terbentuk dan penelitian itu menjadi semakin teliti C. semakin besar tingkat kepercayaan yang diberikan maka semakin rendah tingkat kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval yang terbentuk, namun penelitian itu menjadi semakin tidak teliti D. semakin besar tingkat kepercayaan yang diberikan maka semakin rendah tingkat kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval yang terbentuk dan penelitian itu menjadi semakin teliti 3) σ X merupakan notasi dari standar deviasi .... A. sampel B. distribusi sampling C. dari rata-rata D. populasi 4) Apabila diketahui: X = 36,3; n = 120; s = 13,3; interval kepercayaan 95%. Setelah dilakukan perhitungan dengan memakai rumus estimasi interval, didapat nilai 33,95 dan 38,65. Maka, interpretasi hasil estimasi tersebut adalah .... A. peneliti memiliki 95% kemungkinan bahwa nilai rata-rata di populasi akan berada pada interval 33,95 sampai 38,65 B. peneliti memiliki 95% kemungkinan bahwa nilai rata-rata di populasi adalah 33,95 atau 38,65 C. peneliti memiliki 95% kepastian bahwa nilai rata-rata di populasi mencakup nilai 33,95 dan 38,65 D. memiliki 95% kepastian bahwa nilai rata-rata di populasi akan berada pada interval 33,95 sampai 38,65
σ digunakan apabila .... n nilai s tidak diketahui nilai s diketahui nilai σ tidak diketahui nilai σ diketahui
5) Rumus σ X = A. B. C. D.
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 2.
7.19
ISIP4215/MODUL 7
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang belum dikuasai.
7.20
Pengantar Statistik Sosial
Kunci Jawaban Tes Formatif Tes Formatif 1 1) A. Estimasi adalah salah satu cara untuk mengemukakan pernyataan induktif (menyatakan karakteristik populasi dengan menggunakan karakteristik yang didapat dari sampel) Kita menduga data populasi dengan memakai data sampel. 2) A. Dalam estimasi, kita menduga kenyataan yang ada di tingkat populasi dengan memakai data di sampel, dan bukan sebaliknya, sedangkan untuk melihat perbedaan nilai antara populasi dan sampel memakai uji statistik, dan bukan estimasi. 3) D. Pengertian dari distribusi sampling adalah rata-rata dari rata-rata sejumlah sampel, akan sama nilainya dengan rata-rata populasi. Dengan demikian, ada beberapa sampel yang diambil dari satu populasi. 4) B. Estimasi titik terhadap proporsi adalah pendugaan terhadap sesuatu hal yang proporsi populasinya tidak kita ketahui. 5) A. Notasi untuk rata-rata populasi adalah µ. X adalah notasi untuk ratarata di sampel, 1: merupakan notasi untuk total penjumlahan, sedangkan merupakan notasi untuk daerah penolakan Ho. Tes Formatif 2 1) B. Estimasi interval lebih objektif dibanding estimasi titik, namun implikasinya estimasi titik lebih akurat. 2) A. Dengan semakin tinggi interval kepercayaan yang diberikan maka range interval akan semakin besar, dengan demikian ketepatan estimasi semakin besar, namun penelitian menjadi semakin tidak teliti. 3) B. X merupakan notasi untuk standar deviasi distribusi sampling, merupakan notasi untuk standar deviasi sampel merupakan notasi untuk standar deviasi populasi, sedangkan standar deviasi dari ratarata tidak ada dalam statistik. 4) A. Dalam estimasi. kita selalu bicara mengenai probabilita atau kemungkinan, bukan bicara mengenai suatu nilai yang pasti. Dalam estimasi interval kita selalu bicara mengenai interval atau range, misalnya mulai dari 33,95 sampai 38,65. 5) C. Apabila nilai σ tidak diketahui maka kita bisa gunakan nilai s, S dengan rumus: σ X = . n −1
Kembali Ke Daftar isi