BAB I PENDAHULUAN
1.1 Latar Belakang Masalah Kebutuhan akan informasi yang cepat, tepat dan akurat sangatlah mutlak, terutama dalam era globalisasi dalam skala luas maupun era otonomi daerah dalam lingkup yang lebih sempit. Dalam era otonomi daerah sekarang ini sangat disyaratkan bagi suatu daerah untuk mampu bersaing dengan daerah yang lain, sehingga perlu bagi suatu daerah untuk memaksimalkan kelebihan yang dimilikinya. Bidang
statistika
kesehatan,
seperti
halnya
bidang-bidang
lainnya
membutuhkan tersedianya informasi yang cepat dan akurat, guna melakukan pengambilan keputusan dalam menghadapi era globalisasi yang penuh persaingan. Pengambilan suatu keputusan terkadang membutuhkan ketersediaan informasi yang mendukung, yang mana informasi tersebut berasal dari data yang diperoleh dan telah diolah. Untuk itu perlu dilakukan suatu usaha memperoleh data yang mampu memberikan informasi yang cepat dan akurat. Dalam hal ini diperlukan suatu penelitian, terhadap obyek yang ingin diambil informasinya, dimana populasi mengenai informasi yang diinginkan memang terbatas dan ditentukan batasnya (finite and delimited). Karena apabila permasalahan penggalian informasi yang berhubungan dengan kumpulan besar unit-unit populasi yang ada, maka suatu survei sampel dilakukan terhadap suatu populasi dengan melakukan penarikan sampel unit-unit populasi tersebut. Hal ini dilakukan untuk memperoleh hasil ketepatan informasi yang diinginkan dengan mengeluarkan biaya yang relatif rendah, karena jika dibandingkan dengan melakukan suatu pencacahan lengkap akan memerlukan biaya yang besar dan waktu yang lama. Informasi yang diperoleh dari hasil suatu survei kadang-kadang mempunyai ketepatan yang rendah, sehingga perlu ditentukan tingkat ketepatan yang mencukupi. Dapat
1
2
dikatakan suatu survei pada populasi tertentu dilakukan untuk memperoleh infomasi maksimum per unit biaya. Setelah diputuskan untuk melakukan suatu survei maka diperlukan suatu perencanaan
survei
dengan
mempertimbangkan
hal-hal
sebagai
berikut
(Hansen,1953): 1.
Populasi hendaknya digali informasinya. Informasi yang dibutuhkan pada survei ini berhubungan dengan pemakaian kontrasepsi dalam upaya KB yang mana peserta dari tiap-tiap kecamatan, kelurahan/desa merupakan unit-unit elementer dari populasi.
2.
Informasi yang dibutuhkan dari unit-unit populasi. Informasi yang dibutuhkan berupa data yang terdiri dari angka-angka yang merupakan nilai sesungguhnya dari populasi dan biasanya merupakan suatu kumpulan atau rata-rata nilai dari individu-individu anggota populasi.
3.
Ketepatan hasil yang diinginkan. Perkiraan atau estimasi dari suatu sampel umumnya akan berbeda dari nilai yang sesungguhnya (nilai dari populasi yang diestimasi) tetapi diharapkan perbedaan yang ditimbulkan cukup kecil sehingga tujuan yang hendak dicapai dari penelitian tersebut terpenuhi.
Untuk itu diperlukan suatu metode penarikan sampel (Sampling Method) yang benar-benar sesuai, yang dengan sampel relatif kecil mampu memberikan hasil yang mendekati karakteristik dari suatu populasi yang besar. Yang artinya mampu memberikan ketepatan (precision) yang tinggi terhadap karakteristik suatu populasi, akan tetapi ketepatan hasil yang diperoleh dari suatu survei sampel tidak hanya tergantung pada ukuran dari sampel tetapi juga pada hal-hal lain yang terkait pada rancangan sampel, seperti bagaimana sampel dipilih dan cara bagaimana hasil survei sampel diestimasi. Rancangan sampel yang efisien dalam hal ini adalah yang mampu memanfaatkan sumber-sumber informasi statistik dan pengetahuan lain yang berkenaan dengan populasi secara efektif bersama dengan teori dan metode sampling.
3
Pada umumya ada banyak alternatif pilihan rancangan sampel serta teknik penarikan sampel yang dapat diterapkan pada suatu permasalahn survei tertentu. Dengan memahami serta membandingkan efisiensi dari masing-masing alternatif rancangan sampel yang akan didapat pilihan rancangan sampel yang tepat. Dalam memahami dan membandingkan alternatif rancangan yang ada diperlukan kriteria pemilihan sampel yang sesuai dengan permasalahan yang dihadapi. Kriteria yang digunakan adalah untuk merancang sampel sehingga akan memberikan hasil dengan ketepatan yang diperlukan pada biaya yang minimal atau sebaliknya dengan biaya terbatas diperoleh hasil yang mampu mengestimasi karakteristik populasi yang diinginkan dengan ketepatan maksimal. Oleh karena itu dipilih sebuah metode penarikan sampel yang sesuai dengan kriteria pemilihan rancangan sampel yang tepat, seperti telah disebutkan diatas bahwa perbedaan rancangan sampel beserta metode estimasinya tanpa ada perubahan ukuran sampel dapat memberikan hasil dengan ketepatan yang berbeda. Rancangan atau teknik ini dipilih karena berdasarkan teori memiliki keunggulan dalam meminimumkan biaya, sebab biaya perunit sampel yang dikeluarkan akan berkurang dengan dilakukannya penggelompokkan unit-unit sampel. Akan tetapi penerapan suatu metode sampling tertentu tidak sepenuhnya dapat dilakukan sama persis dengan teori yang ada. Keadaan obyek penelitian akan sangat menentukan pelaksanaan penelitian dilapangan. Metode sampling yang digunakan dapat berubah untuk menyesuaikan keadaan obyek penelitian. Penggunaan teknik klaster dua tahap di DIY ini juga dilakukan penyesuaian dengan keadaan dilapangan, antara lain sub penarikan sampel dimana unit-unitnya bervariansi dalam ukuran. Pengelompokan data populasi ini juga masih dirasa akan sangat menyulitkan dalam pengambilan sampel, sehingga dikembangkan pengambilan sampel kluster hingga dua tahap. Dengan pengambilan sampel klaster dua tahap ini, maka bias yang ada tidak terlalu besar dan sampel yang harus diambil juga tidak besar.
4
Dalam hal ini, akan dipaparkan mengenai teknik pengambilan sampel klaster dua tahap dengan pendekatan estimator HH dan HT . Estimator HH dan HT ini bisa digunakan untuk berbagai jumlah tahapan dalam pengambilan sampel klaster.
1.2 Perumusan Batasan Masalah Berdasarkan uraian diatas, kita mengenal berbagai macam metode pengambilan sampel untuk memperoleh data dan informasi yang akuntable. Semua metode yang kita kenal memiliki kelebihan dan kekurangan masingmasing. Dalam skripsi ini, pembahasan akan dibatasi pada Perbandingan antara Estimator Hansen-Hurwitz dan Horvitz-Thompson pada klaster dua tahap pps dengan pengembalian sampling untuk mengestimasi total dan rata-rata populasi dari pengambilan sampling
1.3 Tujuan Penelitian Skripsi ini di susun sebagai salah satu syarat untuk memperoleh gelar sarjana sains di Program Studi Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Gadjah Mada. Tujuan yang ingin dicapai dari penulisan skripsi ini adalah : 1.
Mempelajari konsep metode pengambilan sampel klaster dua tahap sebagai metode survei yang efektif dan efisien untuk karakteristik populasi yang heterogen.
2.
Menentukan estimator populasi dalam pengambilan sampel klaster dua tahap menggunakan pendekatan estimator Hurvitz-Thompson dan Hansen-Hurwitz.
3.
Mengaplikasikan metode pengambilan sampel klaster dua tahap untuk mengestimasi rata-rata dan jumlah data.
4.
Mengaplikasikan metode sampling pada data real.
5
1.4 Manfaat Penulisan 1.
Menambah keilmuan statistika terutama pada bidang survei sampel.
2.
Mempopulerkan salah satu metode survei sampel dalam statistika untuk mengefisienkan proses survei.
1.5 Tinjauan Pustaka Penulisan skripsi ini berangkat dari banyak penulisan skripsi dengan tema pengambilan sampel klaster yang telah dilakukan. Karya tulis tersebut adalah sebagi berikut : 1.
Nurvianto (2005) dengan judul “Penarikan Sampel Berkelompok Satu Tahap dengan kelompok Berukuran Tidak Sama”
2.
Adi (2005) dengan judul “Penarikan Sampel Klaster Tiga tahap dalam Survei Produktivitas Padi di Kabupaten Bantul” Karya tulis ini lebih membahas mengenai metode pengambilan sampel
dalam dunia pertanian. Metode tiga tahap yang digunakan pun menggunakan estimator pengambilan sampel sederhana.
Perbedaan skripsi ini dengan karya tulis lainnya yang ditemui pada tema pengambilan sampel klaster sebelumnya adalah karya tulis ini membahas pengambilan sampel klaster dua tahap dengan pendekatan Estimator Hansen-Hurwitz dan Hurwitz-Thompson dengan pps sampling pengembalian. Literatur yang digunakan dalam skripsi ini adalah tulisan Mohammad Salehi M (2002) dengan judul “Comparison beetween Hansen-Hurwitz and Horvitz-Thompson Estimator for Adaptive Cluster Sampling” dan tulisan George A.F.Seber (1997) dengan judul “Two Stage Adaptive Cluster Sampling” sebagai tinjauan pustaka dalam teknik pengambilan sampel klaster dua tahap.
6
1.6 Metode Penulisan Metode Penulisan dalam skripsi ini adalah berdasarkan studi literatur yang didapat dari perpustakaan serta jurnal-jurnal dan buku-buku yang berhubungan dengan tema skripsi ini. Sumber lainnya juga diperoleh melalui situs-situs pendukung yang tersedia di internet. Pengerjaan skripsi ini juga ditunjang dengan beberapa perangkat lunak diantaranya R versi 3.2.2 dan Microsoft Office Excel.
1.7 Sistematika Penulisan Agar penulisan skripsi ini terarah dan sistematis, maka secara garis besar skripsi ini disusun dengan sistematika sebagai berikut : BAB I
PENDAHULUAN Bab ini membahas Latar Belakang Masalah, Perumusan dan Batasan Masalah, Tujuan Penulisan, Manfaat Penelitian, Tinjauan Pustaka, Metode Penulisan dan Sistematika Penulisan.
BAB II
LANDASAN TEORI Bab ini membahas mengenai konsep-konsep dasar yang berkaitan dengan skripsi. Diantaranya adalah konsep dasar tentang metode survei sampel yang berkaitan dengan pembahasan pokok permasalahan.
BAB III
PEMBAHASAN Bagian ini menguraikan tentang konsep pengambilan sampel klaster dua tahap dalam meningkatkan efektifitas dan efisiensi survei. Di sini juga akan dibahas bagaimana membentuk klaster data populasi sehingga diperoleh klaster yang homogen. Lebih jauh akan dibahas mengenai kelebihan estimator Hansen Hurwitz dan Horvitz-Thompson dengan pps pengembalian.
7
BAB IV
STUDI KASUS Bab ini menguraikan tentang penerapan metode pengambilan sampel klaster dua tahap pada data
BAB V
PENUTUP Bab ini berisi beberapa kesimpulan yang diperoleh dari hasil pembahasan pada bab-bab sebelumnya dan juga saran-saran atas permasalahan yang dihadapi.
BAB II LANDASAN TEORI 2.1 Populasi dan Sampel
Gambar 2.1 Populasi dan Sampel
2.1.1 Populasi Definisi 2.1.1 (Walpole, 1995) Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita. Di waktu lampau, istilah “populasi” mengandung pengamatan yang diperoleh dari penelitian statistik yang berhubungan dengan orang banyak. Di masa kini, statistikawan menggunakan istilah itu bagi sembarang pengamatan yang menarik perhatian kita, misalnya sekelompok orang, binatang atau benda apa saja dimana sifat-sifat yang ada padanya dapat diukur atau diamati. Banyaknya pengamatan atau anggota suatu populasi disebut ukuran populasi. Populasi yang tidak pernah diketahui dengan pasti jumlahnya disebut populasi tak hingga, sedangkan populasi yang jumlahnya diketahui dengan pasti disebut populasi terhingga.
8
9
Dalam inferensi statistika, kita ingin memperoleh kesimpulan mengenai populasi, meskipun kita mungkin atau tidak praktis untuk mengamati keseluruhan individu yang menyusun populasi. Misalnya saja dalam usaha menentukan umur rata-rata suatu mesin jenis tertentu, adalah tidak mungkin untuk menguji semua mesin yang ada kalau kita masih ingin menjualnya. Biaya yang besar lebih sering menjadi faktor penghalang untuk mengamati semua anggota populasi. Oleh karena itu, kita terpaksa menggantungkan pada sebagian anggota populasi untu membantu kita menarik kesimpulan mengenai populasi tersebut.
2.1.2 Sampel Definisi 2.1.2 (Walpole,1995) Sampel adalah suatu himpunan bagian dari populasi. Jika kita menginginkan kesimpulan dari sampel terhadap populasi, maka kita harus mempunyai sampel yang dapat mewakili populasi. Seringkali kita tergoda untuk mengambil anggota populasi yang memudahkan kita. Cara demikian ini dapat membawa pada kesimpulan yang salah mengenai populasi. Prosedur pengambilan sampel yang menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai suatu ciri populasi dikatakan berbias. Untuk menghilangkan bias ini, muncullah berbagai jenis metode pengambilan sampel dari populasi.
2.2 Variabel Random Istilah percobaan statistika telah digunakan untuk menjelaskan sembarang proses/aktivitas yang menghasilkan data/hasil yang dikumpulkan dalam ruang sampel. Seringkali, kita tidak tertarik pada keterangan rinci tentang titik sampel, tetapi hanya pada suati keterangan numerik hasi percobaan, sehingga kita membutuhkan variabel random.
10
2.2.1 Variabel Random Definisi 2.2.1 (Bain dan Engelhardt,1992) “Variabel Random X adalah fungsi yang didefinisikan pada ruang sampel yang dipetakan ke bilangan riil; ( )
, untuk setiap hasil
yang
mungkin pada S”. Huruf kapital X, Y, Z digunakan untuk menotasikan suatu variabel random dan huruf kecilnya x,y,z untuk menyatakan nilai yang mungkin dari setiap hasil observasi pada ruang sampel.
2.2.2 Variabel Random Diskrit Definisi 2.2.2 (Bain dan Engelhardt,1992) Variabel random X disebut variabel random diskrit jika himpunan semua nilai yang mungkin muncul dari X merupakan himpunan terhitung (countable) Fungsi : (2.1) ( )
dimana
Disebut fungsi kepadatan probabilitas diskrit (discrete pdf) Fungsi distribusi kumulatif dan variabel random X didefinisikan sebagai : ( )
(2.2)
2.2.3 Variabel Random Kontinu Definisi 2.2.3 (Bain dan Engelhardt,1992) Variabel random X disebut variabel random kontinu jika terdapat fungsi ( ) yang merupakan fungsi kepadatan probabilitas dari X, dimana fungsi distribusi kumulatifnya dapat ditunjukkan sebagai : ( )
∫
( )
(2.3)
11
2.3 Ekspektasi dan Variansi 2.3.1 Ekspektasi Definisi 2.3.1 Ekspektasi Jika X adalah variabel random dengan fungsi kepadatan probabilitas ( ) maka nilai ekspektasi dari X didefinisikan sebagai : ( )
∑
( )
∫
( )
(2.4)
( )
(2.5)
( ) seringkali ditulis dengan notasi
dan ̅ .
2.3.2 Variansi Definisi 2.3.2 Variansi Variansi dari variabel random X ditunjukkan oleh : ( )
̅)
(
(
Notasi untuk variansi adalah (
)
̅
(2.6)
, sehingga didapatkan: ̅
)
(2.7)
2.4 Distribusi Normal Distribusi normal pertama kali diperkenalkan oleh Abraham de Moivre pada tahun 1733 sebagai pendekatan untuk distribusi dari jumlahan variabel random binomial. Distribusi normal merupakan distribusi terpenting dalam probabilitas dan statistika Definisi 2.9 (Bain dan Engelhardt,1992:118). Suatu variabel random X mengikuti distribusi normal dengan mean variansi
(
, dinotasikan (
dan
), dengan pdf )
√
(
(
)
)
(2.8)
12
2.5 Teori Dasar Pengambilan Sampel 2.5.1 Kegunaan metode pengambilan sampel Berikut adalah keuntungan dari pengambilan sampel sebagai perbandingan dalam pencacahan lengkap. a. Mengurangi Biaya Jika data yang telah diperoleh berasal dari sebagian kecil populasi, maka pengeluaran atau biaya akan lebih murah daripada melakukan sensus lengkap. Dengan populasi besar, hasil yang cukup akurat dapat diperoleh dari sampel yang didapatkan dengan fraksi yang kecil dari populasi. b. Kecepatan Lebih Besar Data dapat dikumpulkan dan diringkas lebih cepat dengan sebuah sampel daripada dengan perhitungan lengkap. Hal ini merupakan sebuah pertimbangan yang penting bila membutuhkan informasi yang lebih cepat. c. Cakupan Lebih Besar Survei-survei yang bertumpu pada pengembalian sampel haruslah lebih besar cakupannya dan fleksibel mengenai jenis informasi yang dapat diperoleh. d. Tingat Ketelitian Lebih Besar Sebuah sampel mungkin memberikan hasil yang lebih teliti daripada pencacahan lengkap, jika dipakai tenaga-tenaga yang berkualitas baik dan diberi latihan yang intensif, serta pengawasan terhadap pekerjaan lapangan diperketat.
2.5.2 Tahap-tahap dalam survei sampel Tahap dalam pengambilan sampel merupakan metode dalam memilih sampel dari populasi yang digunakan untuk suatu penelitian atau studi kasus tertentu. Berikut adalah tahap-tahap dalam sebuah survei
13
a. Memilih populasi Proses awal adalah menentukan populasi yang menarik untuk dipelajari. Suatu populasi yang baik adalah yang mencakup rancangan eksplisit semua elemen yang terlibat, biasanya meliputi beberapa komponen diantaranya yaitu, elemen, unit sampling, keluasan skop dan waktu. b. Memilih unit-unit sampling Unit-unit sampling adalah unit analisa dari sampel yang diambil atau berasal, karena kompleksitas penelitian dan banyaknya desain sampel, maka pemilihan unit-unit sampling harus dilakukan dengan seksama. c. Memilih Kerangka Sampling Pemilihan kerangka sampling merupakan tahap yang penting karena jika kerangka sampling dipilih secara memadai tidak mewakili populasi, maka generalisasi hasil penelitian meragukan. Kerangka sampling dapat berupa daftar nama populasi seperti buku telepon atau database nama lainnya. d. Memilih Desain Sampel Desain sampel merupakan tipe metode atau pendekatan yang digunakan untuk memilih unit-unit analisa studi. Desain sampel sebaiknya dipilih sesuai dengan tujuan penelitian. e. Memilih Ukuran Sampel Ukuran sampel tergantung beberapa faktor yang mempengaruhi diantaranya adalah : - Homogenitas unit-unit sampel Secara umum semakin mirip unit-unit sampel. Dalam suatu populasi semakin kecil sampel yang dibutuhkan untuk memperkirakan parameter-parameter populasi. - Kepercayaan Kepercayaan mengacu pada suatu tingkat dimana peneliti merasa yakin bahwa yang bersangkutan memperkirakan secara nyata parameter populasi yang benar. Semakin tinggi tingkat kepercayaan yang diinginkan, maka semakin besar ukuran sampel yang diperlukan.
14
- Presisi Presisi mengacu pada ukuran kesalahan standar estimasi. Untuk mendapatkan presisi yang besar dibutuhkan ukuran sampel yang besar pula. - Kekuatan Statistik Istilah ini mengacu pada adanya kemampuan mendeteksi perbedaan dalam istilah pengujian hipotesis. Untuk mendapatkan kekuatan yang tinggi, peneliti memerlukan sampel yang besar - Prosedur Analisa Tipe prosedur analisa yang dipilih untuk menganalisa data dapat juga mempengaruhi seleksi ukuran sampel. - Biaya, waktu dan Personil Pemilihan ukuran sampel juga harus mempertimbangkan biaya, waktu dan personil. Sampel besar akan menuntut biaya besar, waktu banyak dan personil besar juga. f. Memilih Rancangan Sampling Rancangan sampling menentukan prosedur operasional dan metode untuk mendapatkan sampel yang diinginkan. Jika dirancang dengan baik, rancangan sampling akan menuntun peneliti dalam memilih sampel yang digunakan dalam studi, sehingga kesalahan yang akan muncul dapat ditekan sekecil mungkin g. Memilih Sampel Tahap akhir dalam proses ini adalah penentuan sampel untuk digunakan pada proses penelitian berikutnya, yaitu koleksi data
2.5.3 Bias dan pengaruhnya Dalam teori survei sampel, estimator bias perlu dipertimbangkan untuk dua alasan yaitu : a. Pada beberapa masalah yang sangat umum, khususnya dalam estimasi rasio, estimator yang disenangi dan cocok didapat ternyata menjadi bias.
15
b. Dalam estimator yang tak bias dalam pengambilan sampel berpeluang, kesalahan pengukuran dan kesalahan non respons menghasilkan bias yang jumlahnya dapat dihitung dari data. Syarat-syarat estimator yang sebaik-baiknya adalah : 1. Estimator Tak Bias Suatu estimator ( ̂ ) dikatakan tidak bias bagi parameternya ( ) apabila nilai
estimator
tersebut
sama
dengan
nilai
yang
diduganya
(parameternya). Jadi, penduga tersebut secara tepat dapat mengestimasi nilai dari parameternya. 2. Estimator Efisien Suatu estimator dikatakan efisien bagi parameternya
( )
apabila
estimator tersebut memiliki variansi yang kecil. Apabila terdapat lebih dari satu estimator, estimator yang efisien adalah estimator yang memiliki variansi terkecil. Dua buah estimator dapat dibandingkan efisiensinya dengan menggunakan efisiensi relatif (relative efficiency) 3. Estimator Konsisten Suatu estimator dikatakan konsisten apabila memenuhi syarat berikut : a. Jika ukuran sampel semakin bertambah maka estimator akan mendekati parameternya. Jika besarnya sampel menjadi tak terhingga maka estimatornya konsisten harus dapat memberi suatu estimator titik yang sempurna terhadap parameternya. b. Jika ukuran sampel bertambah tak terhingga maka distribusi sampling estimator akan mengecil menjadi suatu garis tegak lurus diatas parameter yang sebenarnya dengan probabilitas sama dengan satu. Estimator ( ̂ ) adalah suatu estimasi untuk suatu nilai populasi ( ) . Misalkan nilai ekspektasi dari ̂ adalah sebagai
, maka bias didefinisikan
. Pengaruh bias terhadap ketelitian suatu estimasi
diabaikan jika biasnya kurang dari sepersepuluh simpangan baku
16
estimasinya. Jika kita mempunyai metode bias dimana
dan B
merupakan nilai absolut dari biasnya, ini dapat dinyatakan bahwa bias tidak merugikan metode tersebut. Karena kesulitan dalam menjamin bahwa bias masuk dalam estimasi tanpa diduga, biasanya lebih menyatakan ketepatan (precision) suatu estimasi daripada ketelitiannya (accuracy). Ketelitian menunjukkan besar simpangan dibanding dengan parameter sebenarnya ( ) , sedangkan ketepatan menunjukkan besar simpangan dari ekspektasi atau nilai angka harapan yang diperoleh dengan melakukan pengulangan dari prosedur pengambilan sampel. 2.5.4 Rata-rata kesalahan kuadrat Untuk membandingkan sebuah estimator bias dengan estimator tak bias, atau dua estimator dengan jumlah bias yang berbeda, maka suatu kriteria yang berguna adalah dengan menghitung rata-rata kesalahan kuadrat (Mean Square Error) pada estimator yang diukur dari nilai populasi yang diperkirakan. Secara umum, ( )
(̂
)
[( ̂ (̂
) )
( ̂)
(
)] (
) (̂
( ̂)
)
(
) (2.9)
2.6 Pengambilan Sampel Acak Sederhana Pengambilan sampel acak sederhana (simple random sampling) adalah sebuah metode untuk memilih n unit dari N sehingga setiap elemen dari NCn sampel yang berbeda mempunyai kesempatan yang sama untuk dipilih.
17
Pada sampel acak sederhana (simple random sampling) N menyatakan ukuran unit populasi dan n menyatakan ukuran unit sampel. Dalam praktek, pengambilan sampel yang berbeda mempunyai kesempatan yang sama untuk dipilih. Dalam praktek, pengambilan sampel acak sederhana dipilih unit per unit. Unit-unit dalam populasi diberi nomor dari 1 sampai N. Serangkaian bilangan acak antara 1 sampai N kemudian dipilih, dengan cara menggunakan sebuah tabel bilangan acak atau dengan cara menggunakan sebuah program komputer yang menghasilkan tabel bilangan acak. Pada setiap pengambilan proses, proses yang digunakan harus memberikan kesempatan dipilih yang sama untuk setiap bilangan dalam populasi. Unit-unit yang terpilih ini sebanyak n yang merupakan sampel. Untuk membuktikan bahwa seluruh NCn sampel yang berbeda mempunyai kesempatan yang sama untuk terpilih dengan metode berikut. Dengan memperhatikan sampel yang berbeda, yaitu himpunanan
unit-unit tertentu.
Pada pengambilan pertama, probabilitas bahwa satu dari n unit-unit tertentu akan terpilih adalah . Pada pengambilan kedua, probabilitas bahwa satu dari ( unit-unit sisanya yang akan terpilih adalah (
) (
)
), dan seterusnya.
Sehingga probabilitas seluruh n unit-unit tertentu yang terpilih dalam n pengambilan adalah : ( (
) ( ) (
) )
( (
)
)
(2.10)
Karena untuk bilangan yang telah diambil / dipindahkan dari populasinya untuk seluruh pengambilan berikutnya, metode ini disebut metode pengambilan sampel acak tanpa pengembalian (without replacement). Pengambilan sampel acak dengan pengembalian (with replacement) secara keseluruhan dapat dilakukan pada setiap pengambilan, seluruh anggota
dari populasi memberikan
kesempatan yang sama untuk dipilih, tanpa melihat sudah berapa kali unit-unit telah dipilih.
18
2.6.1 Penarikan Sampel Acak dengan Pengembalian Pendekatan yang sama diterapkan bila penarikan sampel dengan pengembalian. Dalam kejadian ini, unit ke-i dapat muncul 0,1,2,3,..., dalam sampel. Misalkan
kali
merupakan jumlah unit ke-i muncul dalam
sampel. Maka,
̅
∑
(2.11)
Karena probabilitas bahwa unit ke-i terambil adalah
, variansi
berdistribusi binomial dengan jumlah sukses dari n percobaan dengan . Karenanya ( )
( )
Secara bersamaan, variansi
( )(
)
(2.12)
mengikuti distribusi multinomial. Untuk ini, (
)
(2.13)
Dengan menggunakana (2.11),(2.12) dan (2.13), untuk penarikan sampel dengan pengembalian, kita peroleh, ( ̅)
[∑
(
(
∑
]
̂)
∑(
Akibatnya,
)
(2.14)
( ̅) dalam penarikan sampel tanpa pengembalian adalah
) (
) kali nilainya dalam penarikan sampel dengan
pengembalian. Jika bukan ̅ tetapi rata-rata ̅
dari unit-unit yang
berbeda dalam sampel yang digunakan sebagai perkiraan, dan seandainya penarikan sampelnya dengan pengembalian, Murthy (1967) menunjukkan bahwa suku yang penting dalam rata-rata varians dari ̅ adalah (
)
.
19
2.6.2 Sifat-sifat Perkiraan/Estimasi Ketelitian setiap estimasi yang dibuat berdasarkan sebuah sampel tergantung pada metode estimasinya yang dihitung dari data sampel dan rencana pengambilan sampelnya. Sebuah metode estimasi dikatakan tidak bias (unbiased) jika nilai rata-rata estimasinya yang diambil dari seluruh sampel yang mungkin berukuran
sama dengan nilai populasi sebenarnya.
Bila metode tersebut menjadi tidak bias tanpa adanya syarat tertentu, hasil ini harus berlaku untuk setiap nilai populasi terbatas
dan untuk setiap n.
Untuk mengetahui apakah ̅ tidak bias dalam pengambilan sampel acak sederhana, maka kita menghitung nilai ̅ untuk NCn sampel dan menetukan rata-ratanya. Teorema 2.1 Rata rata ̅ adalah estimasi yang tidak bias dari ̅ . Dibuktikan menurut definisi :
( ̅)
∑ ̅ ( ̅)
∑
̅
∑
(
) [
( (
(
̅
]
) )(
(2.15)
(
)
(
)
)
)
20
Dimana jumlahnya ada sebanyak
NCn
sampel. Untuk menghitung
jumlah ini, kita menentukan berapa banyak nilai-nilai yang muncul dari sampel
. Karena ada (
) unit sampel lainnya yang tersedia untuk sisa
sampel, dan di sisi lain ada ( yang berisi
) untuk mengisi sampel, jumlah sampel
adalah: (
N-1Cn-1
(
) )(
(2.16) )
Sehingga (
)
∑(
)
(
) (
)
(
)
(2.17)
Dari persamaan (2.15) memberikan hasil (
( ̅)
(
) )(
(
)
(
)
(
)
) (2.18)
̅ Kesimpulan yang didapat ̅
̅ adalah estimasi yang tidak bias
dari jumlah populasi Y. Pembuktian dari teorema 2.1 dapat juga diperoleh sebagai berikut. Karena setiap unit muncul dalam jumlah sampel yang sama, maka (
) merupakan perkalian dari ( Pengalinya adalah
, karena ruas kiri mempunyai
)
(2.19)
suku dan ruas
kanan mempunyai N suku.
2.6.3 Variansi Perkiraan/Estimasi Variansi
dalam sebuah populasi terbatas biasanya ditetapkan sebagai ∑
(
̅)
(2.20)
21
Dengan adanya sedikit perubahan pada notasi yang memakai teori pengambilan sampel dengan maksud menganalisis variansi, pembagian N diganti menjadi (
) jika didapatkan variansi tidak diketahui dari suatu
populasi. Dan diperoleh ∑
̅)
(
(2.21)
Keuntungan yang diperoleh adalah hasilnya di dapat dari bentuk yang lebih sederhana. Sekarang dengan memperhatikan variansi ̅, yang dimaksud ̅ ) yang diperoleh untuk seluruh NCn sampel.
adalah ( ̅
Teorema 2.2 Variansi dari ̅ dari sampel acak sederhana adalah ( ̅) Di mana
(
̅)
(̅
)
(
)
(2.22)
adalah fraksi pengambilan sampel.
Bukti : (̅
̅)
̅)
(
̅)
(
(
̅)
(2.23)
Dengan alasan yang sama digunakan dalam (2.19), maka ̅)
(
(
̅)
(
̅ )(
(
̅)
̅)
(
̅)
(
(2.24)
Dan juga bahwa (
( (
̅ )(
) ( [ )
̅)
̅ )(
̅)
̅ )(
(
̅)
̅ )(
(
̅)
̅ )(
̅) ]
(2.25)
Pada (2.25) jumlahnya terdiri dari seluruh pasangan unit-unit dalam sampel dan populasi. Penjumlahan dari kiri terdiri atas ( dikanan terdiri atas
(
)
suku.
)
suku, dan
22
Kemudian dengan mengkuadratkan (2.23) dan rata-ratakan seluruh sampel acak sederhana. Dengan menggunakan rumus (2.24) serta (2.25) maka diperoleh ̅)
(̅
̅)
{(
(
̅)
(
)
̅ )(
(
[
̅) ̅ )(
(
̅)
]}
(2.26)
Kuadrat selengkapnya atas perkalian silangnya, maka didapatkan
(̅
̅)
̅)
) (
{(
̅)
(
̅)
(
(2.27)
̅) }
(
Suku kedua dalam tanda kurung akan hilang dikarenakan jumlah dari dengan ( ̅)
̅ . Setelah dibagi (̅
sama
menjadi
̅)
(
)
̅)
∑( ̅
(2.28)
Kesimpulan 1. Kesalahan baku (standard error) ̅ adalah
̅
Kesimpulan Variansi ̂
√
√
√
(2.29)
√
̅ merupakan estimasi jumlah populasi
dengan
variansi adalah ( )
(̂
)
(
)
(2.30)
23
Kesimpulan 3. Kesalahan baku (standard error) dari ̂ adalah ̂
√
√
√
(2.31)
√
2.6.4 Koreksi Populasi terbatas Untuk sebuah sampel yang berukuran n yang diambil secara acak dari populasi tidak terbatas, kita mengetahui bahwa variansi dari rata-ratanya adalah
. Hasil ini akan berubah jika populasi terbatas dengan
menambahkan faktor ( )
√(
) . Faktor (
)
untuk variansi dari
untuk kesalahan baku disebut koreksi populasi terbatas (kpt).
Untuk estimasi variansi proporsi kpt-nya adalah (
) (
).
Teorema 2.3 Jika
adalah sebuah pasangan yang bervariansi ditetapkan pada
unit dalam populasi dan ̅ ̅ adalah rata-rata dari sampel acak sederhana berukuran n, maka kovariansinya ̅ )( ̅
(̅
̅)
̅ )(
∑(
̅)
(2.32)
Teorema ini dikurangkan ke teorema 2.2 untuk variansinya adalah ̅
. Rata-rata populasi dari
̅)
(̅
∑
(
̅
̅ dan teorema 2.2 memberikan
̅)
(2.33)
yaitu (̅
̅)
( ̅
̅)
∑ (̅
̅)
( ̅
̅)
(2.34)
Suku-suku yang dikuadratkan dan disederhanakan pada kedua ruas. dengan teorema 2.2 (̅
̅)
∑( ̅
̅)
(2.35)
24
Dengan sebuah hubungan yang sama untuk ( ̅
̅ ) . Karenanya dua
suku saling menghilangkan pada ruas kiri dan kanan dari (2.34). Hasil persamaan (2.32) mengikuti dari hasil sukunya.
2.6.5 Perkiraan/Estimasi Kesalahan Baku dari Sampel Rumus kesalahan baku dari estimasi rata-rata populasi dan jumlah populasi dipergunakan untuk tujuan : a.
Membandingkan ketelitian yang diperoleh dari pengembalian sampel acak sederhana dengan metode pengambilan sampel lainnya.
b.
Untuk memperkirakan ukuran sampel yang dibutuhkan dalam suatu survei yang telah direncanakan, dan
c.
Untuk memperkirakan ketelitian sebenarnya yang didapat dalam suatu survei yang dilaksanakan. Rumus-rumusnya mencakup
variansi populasi. Dalam praktek hal ini
tidak dapat diketahui, tetapi dapat diperkirakan dari data sampel. Hasil yang relevan dapat dinyatakan sebagai teorema berikut. Teorema 2.4 Untuk sebuah sampel acak sederhana ∑
(
̅)
(2.36)
adalah sebuah estimasi yang tak bias dari ∑
(
̅)
(2.37)
Dibuktikan : ∑
(
̅)
adalah sebuah estimasi yang tak bias dari
∑
(
̅)
25
[∑( ̅
∑(
̅)
[∑(
̅)
̅) ]
∑( ̅
̅) ]
(̅
(
( )
̅)
(̅
̅)
)
(
)
(
)
(
)
dapat dituliskan
∑(
̅)
[∑(
̅)
̅)
(̅
(̅
(2.38)
̅) ]
Sekarang merata-ratakan seluruh sampel acak sederhana berukuran n. Dengan menggunakan alasan yang sama dalam teorema 2.2 ̅) ]
[∑( ̅
Dengan definisi (̅
∑( ̅
̅)
(
. Selanjutnya, dengan teorema 2.2, ̅)
, maka
)
(2.39)
26
( )
(
(
)
)
(
) (2.40)
Kesimpulan estimasi yang tidak bias dari variansi ̅ dan ̂ ( ̅)
̅
( ̂)
̂
(
(
)
̅ adalah (2.41)
)
(
)
(2.41)
Untuk kesalahan bakunya diperoleh ̅
√
√
,
(2.42)
dan
̂
√
√
(2.43)
2.6.6 Perkiraan/Estimasi Ukuran Sampel Keputusan dalam menentukan besarnya jumlah sampel sangat penting dalam perencanaan sampel survei. Jika sampel yang diambil terlalu besar, maka merupakan pemborosan sumber-sumber dan jika yang diambil terlalu kecil akan mengurangi manfaat hasilnya. Ukuran sampel n dalam sampel random sederhana dapat ditentukan kaitannya dengan batas-batas kesalahan dalam estimasi. Menentukan besarnya ukuran sampel juga dipertimbangkan besarnya tingkat ketelitian yang diinginkan peneliti. Dalam meperkirakan total populasi atau rata-rata,
27
biasanya inigin mengontrol kesalahan relatif r dengan tingkat konfidensi (
) Dengan acak sederhana didapatkan rata-rata ̅, akan mendapatkan (|
̅
̅ ̅
|
(| ̅
)
̅
̅
̅|
̅)
(2.44)
√
√
Penyelesaian untuk n memberikan
( ̅) [
(2.45)
( ̅) ]
Perlu diperhatikan bahwa karakteristik populasi tempat n tergantung adalah koefisien variansi
̅ . Sebagai pendekatan pertama diambil
(
Jika
̅
(2.46)
)
cukup besar maka rumus untuk n seperti (2.47)
2.7 Sampling Klaster Sampling
klaster
adalah
pengambilan
sampel
dari
populasi
yang
dikelompokkan menjadi sub-sub populasi secara bergerombol (klaster), dari sub populasi selanjutnya dirinci lagi menjadi sub-populasi yang lebih kecil. Anggota dari sub populasi terakhir dipilih secara acak sebagai sampel penelitian.
28
Dalam pembentukan klaster seperti ini, maka keadaan didalam klaster relatif heterogen dan antar klaster relatif homogen. Oleh karena itu, dalam pembentukan klaster didasarkan pada area atau daerah administratif. Tujuan penggunaan sampling klaster adalah untuk mengurangi biaya dengan meningkatkan efisensi penarikan sampel. Selain itu sampling klaster memiliki beberapa keuntungan diantaranya adalah paling murah biayanya dibandingkan dengan metode lainnya serta kerangka sampel yang hanya diperlukan untuk klaster-klaster yang dipilih, bukan untuk semua populasi. Suatu klaster dikatakan baik jika mempunyai heterogenitas yang tinggi antar anggota dalam satu klaster (within cluster) dan juga homogenitas yang tinggi antara klaster yang satu dengan klaster yang lainnya (between cluster). Sebelum melakukan studi lebih lanjut ada baiknya memperhatikan segi asumsi yang harus dipenuhi dalam analisis klaster ini yaitu 1.
Data yang representatif, sampel yang diambil benar-benar mewakili populasi yang ada.
2.
Multikolinearitas, yaitu kemungkinan adanya korelasi antar objek, sebaiknya tidak ada. Tapi jika ada, besarnya multikolinearitas tersebut tidaklah tinggi. Proses sampling klaster : a.
Membuat klaster. Proses ini adalah proses pengelompokkan data yaitu populasi keseluruhan dibagi ke dalam beberapa kelompok atau klaster berdasarkan area atau daerah administratif.
b.
Setelah klaster terbentuk maka selanjutnya melakukan interpretasi terhadap klaster yang telah terbentuk, yang pada intinya adalah memberi nama spesifik untuk menggambarkan isi klaster.
c.
Melakukan validasi dan profiling klaster. Klaster yang terbentuk kemudian diuji apakah valid atau tidak, kemudian dilakukan proses profiling untuk menjelaskan karakteristik tiap klaster berdasarkan profil tertentu.
BAB III ESTIMASI KLASTER DUA TAHAP DENGAN ESTIMATOR HANSEN-HURWITZ DAN HORVITZ-THOMPSON: PPS SAMPLING DENGAN PENGEMBALIAN
3.1 Deskripsi Pengambilan Sampel Klaster Dua Tahap Pada penarikan acak sederhana hanya didasarkan pada nomor unit dalam populasi. Penarikan acak ini menjadi kurang baik jika unit dalam populasi ukurannya bervariansi. Oleh karena itu digunakan variansi pendukung (auxiliary variable) sebagai pertimbangan di dalam penarikan sampel agar diperoleh estimator yang lebih efisien. Variabel pendukung yang digunakan sebagai dasar penarikan sampel adalah variabel yang memiliki korelasi yang erat dengan variabel yang diteliti. Variabel pendukung yang dipertimbangkan sebagai dasar penarikan sampel selanjutnya disebut ukuran(size). Prosedur penarikan sampel dimana peluang terpilihnya suatu unit sampel sebanding dengan ukuran disebut sebagai sampling berpeluang sebanding dengan ukuran atau sampling with probability proportional to size (pps). Pengambilan sampel klaster adalah pengambilan sampel random sederhana dimana setiap pengambilan sampel unit terdiri dari klaster atau kelompok. Pada metode pengambilan sampling klaster satu tahap ini, populasi dikelompokkan dalam beberapa klaster. Klaster yang ada kemudian dipilih untuk dijadikan sampel klaster. Selanjutnya, semua elemen dalam klaster yang terpilih akan diteliti. Pada metode ini memiliki elemen yang terpilih dalam klaster cukup banyak sehingga kurang efisien karena memakan waktu yang banyak dan membutuhkan biaya yang lebih banyak. Kemudian metode ini dikembangkan dengan pengambilan klaster dua tahap. Dalam metode pengambilan sampling klaster dua tahap ini memiliki dua tahap pengambilan. Tahap pertama memilih sebuah sampel dari unit-unit primer(utama) dan tahap kedua memilih sebuah sampel dari subunit dari setiap
29
30
unit primer yang terpilih. Keuntungan dari pengambilan sampling klaster dua tahap ini adalah bahwa cara ini lebih fleksibel daripada pengambilan sampel satu tahap. Dalam pengambilan sampel dua tahap ini, peneliti dihadapkan pada pemilihan klaster yang tepat. Sebagai pedoman, banyaknya klaster dalam sampel usahakan cukup banyak. Hal ini mengingat bahwa biaya pengukuran karakteristik elemen sangat mahal. Elemen dalam suatu kelompok secara fisik sebenarnya mirip dengan antar satu dengan yang lainnya. Oleh karena itu sebisa mungkin dalam pembentukan klaster harus memperhatikan kehomogenan elemen-elemen yang akan diteliti dalam klaster tersebut. Suatu populasi yang homogen akan menghasilkan sampel dengan tingkat kesalahan sampling yang lebih kecil dibandingkan dengan suatu populasi yang heterogen. Dalam hal ini, ukuran sampel harus ditentukan terlebih dahulu jika jumlah klaster ditingkatkan maka jumlah elemen dalam suatu klaster harus dikurangi begitu pula sebaliknya. Pengambilan sampel klaster dua tahap dan sampel acak berlapis hampir sama. Dalam sampel acak berlapis, klaster diperlakukan sebagai strata, sedangkan perbedaannya klaster harus dipilih dari populasi klaster sebagai sampel klaster. Tidak semua klaster diteliti, tetapi semua klaster dalam sampel acak berlapis diteliti melalui sampel yang dipilih dari strata. Sehingga sampel yang diambil tidak terlalu besar dengan tingkat keakuaratan tinggi. Secara umum pengambilan sampel klaster dua tahap dapat dijelaskan pada gambar sebagai berikut dengan perbandingan pengambilan sampel klaster satu tahap.
31
(a) Cluster sampling N=5
(b) Two-Stage sampling N=5 n=3
Gambar 3.1 Ilustrasi Cluster Sampling dan Two-Stage Cluster Sampling
Didalam pemilihan sampel klaster maupun elemen yang tepat dilakukan secara acak menggunakan tabel bilangan random. Pembagian populasi dalam klaster juga didasarkan pada kehomogenan antar klaster. Karakteristik antar klaster adalah homogen dan didalam klaster adalah heterogen
3.2 Estimasi Pengambilan Sampel Klaster Dua Tahap 3.2.1 Estimator rata-rata populasi dan variansi populasi Pada penarikan sampel klaster dua tahap, rencana penarikan sampelnya pertama memberikan sebuah metode pemilihan n unit. Kemudian untuk setiap unit terpilih, diberikan metode untuk memilih sejumlah tertentu subunitsubunit. Dalam mencari rata-rata dan variansi estimasi, rata-ratanya harus meliputi seluruh sampel yang dapat diturunkan dengan proses dua tahap. Menurut teorema 2.1 dalam sampel random sederhana, rata-rata ̅ adalah estimasi tak bias dari ̅ sehingga estimator rata-rata dalam populasi dinotasikan dengan ̂
̅ bila n unit dan
subunit dari masing-masing
unit yang telah diambil dan dipilih dengan pengambilan sampel acak sederhana, maka ̅ adalah estimator tak bias untuk ̅ Untuk memperkirakan rata-rat dan populasi dalam sampel klaster, kebanyakan statistik survei menggunakan bobot sampling dari estimator
32
diatas, bobot sampling untuk unit sekunder (subunit) / dan unit primer (utama) i adalah
nilai bobot ini bisa kita peroleh dengan menghitung
probabilitas inklusi untuk sampel klaster. = P (unit sekunder j terpilih di unit primer i) = P(unit sekunder i terpilih )
P (unit sekunder j terpilih| unit primer i)
= sehingga (3.1)
Jadi estimator untuk ̂ dan ̅ dapat dihitung dengan
∑
∑
∑
∑
Sehingga ̅ diestimasi dengan ∑
̅
̅
∑
(3.2)
̅
Dan ̿ diestimasi dengan ∑
̅
̿
∑
̅
∑
∑
(3.3)
Untuk variansi dari rata-rata populasi pada pengambilan sampel klaster dua tahap dapat dijabarkan sebagai berikut (Cochran, 1991) ( ̿)
[
Karena
( ̿)]
( ̿)
[ ( ̿)] ̅
∑
, suku pertama pada ruas kanan adalah variansi
dari rata-rata per subunit untuk sebuah sampel acak sederhana berukuran n unit. Oleh karena itu, dengan teorema 2.2 [
( ̿)]
̅
33
Selanjutnya, dengan
̅
∑
̿
dan pengambilan sampel acak
sederhana digunakan pada tahap kedua, ( ̿)
∑(
)
Seluruh sampel pada tahap pertama juga dirata-ratakan sehingga diperoleh [ ( ̿)]
∑(
̅
)
Kemudian variansi dari rata-rata populasi dinyatakan dalam ( ̿)
(
)
̅
̅
∑(
)
Oleh karena variansi populasi tidak diketahui dan variansi dari populasi adalah merupakan estimator tak bias untuk variansi populasi [ ( )
karena
]. Estimator variansi dari rata-rata populasi dapat dinyatakan
dalam bentuk berikut ( ̿)
(
)
̅
̅
∑(
)
3.2.2 Estimator Total Populasi Memperkirakan total populasi diperlukan dalam pengambilan klaster dua tahap ini karena kita tidak mengamati setiap unit sekunder dalam sampel unit primer. Dengan mengguakan bobot sampling pada (3.1) total populasi dalam klaster i dapat diestimasi dengan
̂
∑
̅ ∑
∑ ∑
∑
Sedangkan variansi dari total populasi adalah
(3.5)
34
( )
( ̿) ∑ ∑
(
( ̂)
Dimana
(
) )
(3.6)
( ̿) (
)
(
)
∑ ∑
(
(
)
)
adalah variansi populasi di klaster unit primer dan
adalah
variansi populasi antar elemen di dalam klaster i. Oleh karena variansi dari total populasi tidak dapat dihitung maka perlu di estimasi menggunakan data sampel. Sehingga variansi dari total populasi dapat dinyatakan dalam ̂ ( ̂)
(
)
∑(
(3.7)
)
Dengan standar deviasi dari total populasi sebesar
̂
√ ( )
3.3 Pendekatan Hansen Hurwitz Hansen-Hurwitz (HH) memperkenalkan notasi ukuran klaster sampling yang tak seimbang/tak sama dengan estimasi probabilitas proporsi (pps) untuk mengestimasi nilai , jumlahan dari Y-variate yang melewati/melampaui populasi tak hingga dari elemen
. Akan dijelaskan prosedur atau metode untuk penarikan
klaster sampling dengan menggunakan pps dan dengan pengembalian. Pertama, klaster menandai interval yang berurutan dengan panjang yang sama dengan ukuran klaster (jumlah elemen populasi dalam sebuah klaster). Kedua, sasaran sampel dari elemen populasi yang telah diberi nomor berurutan diambil menggunakan pengambilan sampel acak sederhana dengan pengembalian. Ketiga,
35
klaster tersebut yang memberikan jarak (range) yang besar, dipilih lagi dengan pengembalian. Dalam bahasan ini penulis akan membatasi pada pembahasan metode pengambilan sampling dengan menggunakan penggembalian serta menghitung estimator Hansen-Hurwitz dan Hurvitz-Thompson dari . 3.3.1 Metode Pemilihan Hansen-Hurwitz (HH) Metode pemilihan Hansen-Hurwitz (HH) untuk sampling klaster berukuran tak sama dengan pps dan dengan pengembalian pada dasarnya memiliki 3 langkah, yaitu : Langkah pertama : Unit sekunder (elemen) M populasi (j=1,2,...,M) ditandai dengan bilangan bulat secara berurutan dengan jarak yang sama dengan ukuran klaster Langkah Kedua : Ukuran tetap target sampel dari elemen m populasi digambarkan dengan sebuah populasi seragam/sama yang memutar dari bilangan bulat 1 sampai M melalui pengambilan sampel acak sederhana dengan pengembalian Langkah Ketiga : Klaster yang didalamnya memberikan range (jarak) jumlah acak dari target sampel yang hilang/gugur ditarik atau diambilkan dengan pengembalian. 3.3.2 Estimator Hansen-Hurwitz Berdasarkan pada sampel berukuran n klaster dari unit populasi yang dipilih dengan pps dan pengembalian dari elemen populasi dan klaster yang dikelan luas dengan unbiased HH estimator dari Y, begitu juga dikenal dengan pps estimator yaitu (3.8)
36
∑
∑
(
)
∑
∑̅
Keterangan n = ukuran klaster sampel m = ukuran sampel elemen populasi = pengukuran untuk unit ke i = probabilitas bahwa nilai ke i ada dalam sampel
Untuk nilai ∑ Jika sebuah sampel berukuran n unit primer dan diambil dengan probabilitas proporsional terhadap
unit sekunder dengan metode
pengambilan klaster dua tahap. Modifikasi estimator Hansen-Hurwitz untuk total populasi adalah:
∑
∑ (3.9)
Untuk
={
Mean variansi dari estimator Hansen-Hurwitz adalah sebagai berikut :
[
]
* ∑
+
*∑
[∑ ̅ ]
[ (̅ )
(̅ )
( ̅ )]
+
37
(̅
̅
̅
̅
̅)
̅
̅
Oleh karena itu dapat dibuktikan bahwa ̂
adalah estimator tak
bias untuk Y pada pengambilan sampel klaster dua tahap. Variansi dari Y untuk estimator Hansen-Hurwitz adalah
[
]
∑ ̅]
[
(∑ ̅ )
∑[ ( ̅ )]
(̅ )
∑
Dimana ̅
(̅
̅) (
)
∑( ̅
̅)
38
3.4 Pendekatan Estimator Horvitz-Thompson Estimator Horvitz-Thompson adalah estimator yang umumnya digunakan untuk menghitung total populasi yang dapat digunakan untuk banyak jenis metode pengambilan sampel. Estimator ini dapat digunakan untuk pengambilan sampel dengan pengembalian maupun tanpa pengembalian. Estimator Horvitz-Thompson untuk total populasi (Cochran, 1991) ̂
Dimana
∑
adalah pengukuran untuk unit ke-
= Probabilitas bahwa unit ke- ada dalam sampel
Untuk nilai ∑
Sebuah sampel penduga berukuran n unit primer dan
unit sekunder diilih
tanpa pengembalian dengan metode pengambilan klaster dua tahap. Modifikasi estimator Horvitz-Thompson untuk total populasi adalah ̂
∑
̂
∑
̂
{
Untuk
Berikut (
)
( )
( Jika Untuk
, maka , nilai
(
)
(
( )
( )
) ) (
[ (
)]
(
)
( ) (
)
)
39
(̂ )
[∑
̂
]
̂
{ [∑
[∑
̂
[∑
]
|
]
]}
∑
Oleh karena itu, dapat dibuktikan bahwa ̂ untuk
adalah estimator tak bias
pada pengambilan sampel klaster dua tahap. Sedangkan variansi dari
estimator tak bias total populasi Horvitz-Thompson adalah (̂ )
(Unit primer) + ̂
[ (∑
[∑
]
|
)]
(̂ )
[∑
∑ ( )
∑
(Unit sekunder)
∑∑
(
)
∑
∑ ∑(
[ (∑
̂
|
)]
]
(
)
(̂ )
∑
)
∑∑
∑
∑
(̂ )
Dengan estimator variansinya dinyatakan seperti dibawah ini :
̂( ̂ )
∑(
)
̂
∑∑
̂ ̂
∑
̂( ̂ )
(̂ )
40
Untuk perhitungan estimator rata-rata populasi menggunakan estimator Horvitz-Thompson, maka estimator total populasi di atas cukup dibagi dengan jumlah populasi. Sehingga rata-rata populasi dapat diestimasi dengan ̂
̂ populasi ( ̂
. Sedangkan untuk perhitungan variansi, berarti variansi dari total dibagi
dengan
total
populasi
dikuadratkan
atau
(̂ )
)
Perhitungan ini hampir sama dengan perhitungan untuk estimator pada pengambilan klaster dua tahap dengan metode pengambilan sampel random sederhana. Jika unit primer terpilih dengan probabilitas sama, maka (
)
dan (
)
Kemudian kita dapat menerapkan rumus (diatas) dengan
( ̂)
∑
∑∑
∑(
)( )
(
) [∑
(
)
(
)
∑∑[
( ) ]( )
∑∑
(
) [(
(
)[ ∑
)∑
]
∑∑
]
∑
]
41
(
)
(
(
) [∑(
) ]
)
Menggunakan teori pengambilan sampel sederhana pada (3.6), diperoleh
(̂ )
∑(
)
Sehingga
( ̂)
∑
∑
(̂ )
(
Jadi, ( ̂ )
)
( ̂)
( ̂)
(
(
Jadi
)
)
∑
(
)
∑(
)
estimator tak bias untuk
total
populasi
menggunkan
pengambilan sampel sederhana merupakan kasus khusus dari estimator Horvitz-Thompson dengan probabilitas sama unit primer sekunder
dan unit
. Oleh karena itu kita akan memperoleh rumus (3.5) jika nilai
pada estimator Horvitz-Thompson diganti dengan probabilitas terpilihnya unit primer dan sekunder dalam populasi. Dengan cara yang sama, estimator dari variansi populasi untuk penggambilan sampel klaster
42
dua tahap juga dapat diperoleh meggunakan estimator Horvitz-Thompson. Metode Horvitz-Thompson ini dapat digunakan untuk pengambilan sampel klaster dalam banyak tahap bergantung pada probabilitas unit yang terpilih dalam sampel. Beberapa kasus khusus lainnya dengan menggunakan estimator Horvitz-Thompson seperti pada pengambilan sampel random sederhana dengan
̂
. Diperoleh
∑
∑
∑
̅
̂
Hasil serupa juga akan diperoleh untuk pengambilan berstrata dengan
̂
jika unit i ada dalam strata h.
∑
∑
∑
̅
̂
Begitu juga untuk semua jenis metode pengambilan sampel lainnya, nilai estimator Horvitz-Thompson untuk total populasi akan bergantung pada probabilitas terpilihnya sampel.
3.5 Fungsi Biaya Dalam menerapkan rancangan pengambilan sampel klaster dua tahap, selain mempertimbangkan faktor-faktor teknis statistik yang meliputi presisi dan tingkat kepercayaan, juga harus mempertimbangkan faktor biaya. Dalam hal ini anggaran terbatas, kita perlu mempertimbangkan biaya dari penelitian yang diusulkan. Menggunakan metode pengambilan sampel tanpa pengembalian, fungsi biaya menurut Cochran (1991) adalah
∑
43
Dengan = fungsi biaya, tidak termasuk overhead cost Biaya pendaftaran (listing) per sub unit dalam sebuah unit yang dipilih Biaya per sub unit dan pengawasannya. Fungsi biaya diatas mengabaikan biaya perjalanan antara unit. Istilah dimasukkan karena pengambilan sampel biasanya harus mendaftar elemen-elemen dalam setiap unit terpilih dan memeriksa jumlahnya agar diambil sebuah subsampel.
BAB IV STUDI KASUS
Penulis memberikan sebuah studi kasus pengambilan sampel klaster dua tahap dengan perbandingan metode estimasi Hansen-Hurwitz dan HorvitzThompson dengan populasi pengguna alat kontrasepsi (IUD, MOP, MOW, Kondom, Susuk, Suntik, dan Pil) yang digunakan dalam upaya program Keluarga Berencana di Provinsi Daerah Istimewa Yogyakarta.
Metode pertama yang
dilakukan adalah menentukan populasi, kemudian tahapan selanjutnya adalah pengambilan sampel dengan menggelompokkannya berdasarkan klaster yang terbagi berdasarkan wilayah administratif supaya terjaga kehomogenitasannya antar klaster. Dengan studi kasus tersebut, ingin diketahui jumlah pengguna alat kontrasepsi yang mengikuti KB dalam sebuah daerah. Berkaitan dengan tema besar penulisan, penulis ingin mengestimasikan jumlah peserta KB di DIY. Manfaat dari studi kasus ini adalah memperdalam metode pengambilan sampel dengan metode Hansen-Hurwitz dan Hurvitz-Thompson. 4.1 Pengumpulan Data Untuk studi kasus pada skripsi ini, penulis menggunakan data Pengguna Alat Kontrasepsi pada peserta KB tahun 2013 pada kecamatan dan desa terpilih yang bersumber pada “Kecamatan dalam Angka tahun 2014” di tiap Kabupaten. Data yang dipergunakan terdiri dari kecamatan, desa (data terlampir). Tabel 4.1 Kecamatan di tiap Kabupaten No
Kabupaten
1
Yogyakarta
44
No Kecamatan 1 Danurejan 2 Gedong Tengen 3 Gondokusuman 4 Gondomanan 5 Jetis
45
2
Bantul
3
Gunungkidul
6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1 2 3 4 5 6 7 8 9 10 11 12 13
Kotagede Kraton Mantrijeron Mergangsan Ngampilan Pakualaman Tegalrejo Umbulharjo Wirobrajan Dlingo Imogiri Srandakan Bantul Pajangan Jetis Banguntapan Piyungan Pundong Pleret Sedayu Kasihan Pandak Bambanglipuro Sanden Sewon Kretek Wonosari Nglipar Playen Patuk Paliyan Panggang Tepus Semanu Karangmojo Ponjong Rongkop Semin Ngawen
46
4
Sleman
5
Kulon Progo
14 15 16 17 18 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1 2 3 4 5 6 7 8 9 10 11 12
Gedangsari Saptosari Girisubo Tanjungsari Purwosari Gamping Godean Moyudan Minggir Seyegan Mlati Depok Berbah Prambanan Kalasan Ngemplak Ngaglik Sleman Tempel Turi Pakem Cangkringan Wates Temon Sentolo Samigaluh Pengasih Panjatan Nanggulan Lendah Kokap Kalibawang Girimulyo Galur
47
4.2 Pengambilan Sampel 4.2.1 Sampel Unit primer Dalam penelitian survei ini, populasi terbagi ke dalam 78 kecamatan yang ada di Daerah Istimewa Yogyakarta. Pada tiap kecamatan memiliki sejumlah kelurahan atau desa. Dari 78 kecamatan tersebut, kemudan dibentuk menjadi 5 klaster unit primer (N) yang berdasarkan pada daerah administratifnya yaitu kabupaten. Faktor tersebut digunakan untuk menjaga kehomogenan variabel variabel yang terdapat pada antar klaster serta keheterogenan di dalam klaster. Tabel 4.2 Populasi Terkluster Klaster 1 2 3 4 5
Kabupaten Yogyakarta Bantul Gunungkidul Sleman Kulonprogo
Total Kecamatan 14 17 18 17 12
Setelah pembentukan klaster, maka langkah selanjutnya untuk pengambilan klaster dua tahap adalah dengan melakukan pengambilan klaster secara acak atau secara random dengan menggunakan software R versi 3.2.2 . Selanjutnya 5 unit klaster (N) yang telah terbentuk diambil sampel 3 klaster unit primer untuk diteliti. Kemudian dipilih 3 (n) klaster unit primer secara random dengan kesalahan standar sebesar 95%. 4.2.2 Sampel Unit Sekunder Untuk pengambilan sampel unit sekunder, juga dilakukan dengan pengambilan sampel menggunakan data jumlah kecamatan yang ada pada setiap klaster unit primer yang terpilih kemudian dilakukan pengambilan acak kecamatan tersebut dan meneliti jumlah kelurahan/desa dari kecamatan yang terpilih pada tiap klaster yang terbentuk.
48
Tabel 4.3 Sampel Unit Sekunder No
1
2
4
Kabupaten
No 1 2 3 4 5 6 7 Yogyakarta 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 Bantul 12 13 14 15 16 17 1 2 3 Sleman 4 5 6 7
Kecamatan Danurejan Gedong Tengen Gondokusuman Gondomanan Jetis Kotagede Kraton Mantrijeron Mergangsan Ngampilan Pakualaman Tegalrejo Umbulharjo Wirobrajan Dlingo Imogiri Srandakan Bantul Pajangan Jetis Banguntapan Piyungan Pundong Pleret Sedayu Kasihan Pandak Bambanglipuro Sanden Sewon Kretek Gamping Godean Moyudan Minggir Seyegan Mlati Depok
49
8 9 10 11 12 13 14 15 16 17
Berbah Prambanan Kalasan Ngemplak Ngaglik Sleman Tempel Turi Pakem Cangkringan
Hasil pengacakan pada cluster 1, 2 dan 3 pada observasi pertama adalah sebagai berikut : Cluster 1 : Kota Yogyakarta
Cluster 2 : Kabupaten Bantul
Cluster 3 : Kabupaten Sleman
Dengan menggunakan R 3.2.2 untuk pengacakan sampel, pada observasi pertama dan klaster pertama yaitu kota Yogyakarta ini didapatkan sampel dengan nomor 8,7,6,3,4,13,11,10,14. Kemudian pada klaster dua Kabupaten Bantul didapatkan sampel dengan nomor 4,8,14,9,16,11,15,3,5,1. Dan pada klaster tiga Kabupaten Sleman diperoleh nomor sampel 14,7,15,6,2,11,17,3,4.12.
50
Tabel 4.4 Sampel Unit yang Terpilih Klaster
Total Sampel Kecamatan Kecamatan
1 (Yogyakarta)
14
9
2 (Bantul)
17
10
3 (Sleman)
17
10
Sampel Unit yang terpilih Observasi sampel ke1 3,4,6,7,8,10,11,13,14 2 14,6,2,8,5,11,4,13, 3 9,13,8,1,12,10,11,14,7 4 11,7,5,2,14,3,12,6,9 5 1,5,10,9,6,13,11,4,12 6 12,5,4,13,2,7,8,19,3 . . . . . . 50 9,7,11,2,5,12,6,3,4 1 1,3,4,5,8,9,11,14,15,16 2 5,6,14,8,15,4,12,10,17,2 3 8,11,15,7,4,3,1,5,10,12 4 2,1,15,7,13,12,14,4,8,16 5 12,7,15,4,2,16,6,14,5,17 6 9,17,6,7,15,11,2,4,10,12 . . . . . . 50 4,17,2,8,10,9,14,7,16,3 1 2,3,4,6,7,11,12,14,15,17 2 7,1,10,13,4,11,15,2,16,3 3 5,2,7,12,10,15,3,8,14,9 4 3,1,4,13,5,8,15,6,10,11 5 2,4,8,13,3,16,15,1,12,5 6 6,1,14,8,12,2,5,3,13,15 . . . . . . 50 1,13,4,8,10,15,14,12,5,9
Pada tahap ini dilakukan observasi pengacakan sampel sebanyak 50 kali yang bertujuan supaya sampel yang diambil benar-benar dapat mewakili tiap sub unit. Kemudian dari masing-masing sampel kecamatan yang terpilih, akan diteliti rata-rata dan jumlah pengguna alat kontrasepsi peserta KB di Provinsi Daerah Istimewa Yogyakarta.
51
4.3 Analisis dan Pembahasan 4.3.1 Estimasi rata-rata populasi Untuk mendapatkan nilai dari estimasi rata-rata dan jumlah pengguna alat kontrasepsi peserta KB yang tersedia di tiap klaster kabupaten terpilih pada setiap provinsi di Indonesia, maka dapat dihitung menggunakan rumus 3.2 yaitu : ̅
∑
Keterangan : : observasi ke j pada sampel dari klaster ke i (banyak peserta KB terpilih didalam klaster i) : jumlah unit sekunder dalam sampel dari unit primer i (jumlah kecamatan terpilih dari masing-masing klaster) Dan hasil perhitungan seperti tabel dibawah ini Tabel 4.5 Estimasi Rata-rata populasi Klaster Sampel 1 2 3
Kabupaten Yogyakarta Bantul Sleman
Rata-rata Jumlah pengguna KB 2550,0 6012,2 6983,4
Berdasarkan tabel diatas, dapat dijelaskan bahwa kita ambil sebagai contoh pada sampel klaster nomor 1. Terdapat rata-rata pengguna alat kontrasepsi sebanyak 2550 peserta. Melihat pada tabel 4.5 tersebut klaster 1 merupakan klaster wilayah Kota Yogyakarta yang beranggotakan 9 kecamatan terpilih. Berdasarkan informasi data diatas bisa menjadi pedoman
52
pemerintah yang ingin menekan jumlah ledakan penduduk di provinsi DIY. Jumlah kelurahan dan rata-rata jumlah peserta KB di setiap klaster diatas dapat dimanfaatkan untuk memperkirakan jumlah peserta KB yang akan dibutuhkan pemerintah dalam kependudukan. Sedangkan rata-rata total peserta KB yang tersedia di provinsi DIY dapat diestimasi menggunakan persamaan (3.3) ∑
∑
̿ Dengan mengunakan perhitungan pada R diperoleh estimasi rata-rata populasi sebesar 4579,17241
4580 pengguna alat kontrasepsi. Artinya
terdapat rata-rata 4580 peserta KB pada masing-masing kecamatan di DIY. Estimasi rata-rata total peserta KB ini tersedia untuk semua wilayah kecamatan di DIY. Berdasarkan nilai estimator rata-rata total peserta KB diprovinsi DIY diatas, dapat pula dihitung persebaran rata-rata total peserta KB. Nilai estimator variansi dari total peserta KB di DIY menggunakan rumus
( ̿)
(
)
̅
̅
∑(
)
Diperoleh hasil sebesar 515056,7159 dengan tingkat kesalahan baku sebesar 717,6745. Dengan nilai variansi yang tidak terlalu besar ini menunjukkan bahwa data masih menyebar disekitar rata-rata. Sehingga peneliti dapat mengambil kesimpulan bahwa pengambilam sampel ini sudah cukup baik dengan tingkat kesalahan standar kecil.
53
4.3.2 Estimasi Total Populasi Horvitz-Thompson Nilai estimasi dari total pengguna alat kontrasepsi peserta KB yang terdapat di tiap sampel klaster kebupaten di DIY dapat dihitung dengan menggunakan rumus
∑
Dengan
: jumlah kecamatan dalam klaster ke-i
Hasil perhitungannya dapat dilihat pada tabel ini Tabel 4.6 Estimasi Total Populasi Horvitz-Thompson
Observasi
Estimasi Pengguna Alat Kontrasepsi Cluster1 : Yogyakarta
Cluster2 : Bantul
Cluster3 : Sleman
1
35700
102207,4
118717,8
2
33682,44
112789,9
94334,7
3
34631,33
124159,5
94326,2
4
31434,67
143731,6
89709
5
34402,67
137343
97013,9
6
37196,44
124863,3
113012,6
.
.
.
.
.
.
.
.
50
29818,44
119402,9
94407,8
Berdasarkan tabel diatas, dapat dijelaskan bahwa pada klaster 2 terdapat jumlah pengguna alat kontrasepsi sebanyak 102207,4
102207
peserta. Dari tabel 4.6 klaster 2 adalah klaster kabupaten Bantul yang memiliki anggota 17 kecamatan. Berdasarkan data diatas pemerintah daerah yang ingin melihat kependudukan kelurga berencana, jumlah kecamatan dan estimasi total jumlah pengguna alat kontrasepsi peserta KB yang tersedia dapat dimanfaatkan.
54
Untuk mengestimasi total jumlah peserta KB di provinsi DIY secara keseluruhan, dapat menggunakan persamaan (3.5)
∑
∑
Dari hasil perhitungan persamaan diatas, kemudian diperoleh nilai estimasi total populasi sebesar 28147,56
28148 yang artinya terdapat 28148
jumlah keseluruhan pengguna alat kontrasepsi peserta KB di Provinsi DIY. Berdasarkan nilai estimator total pengguna alat kontrasepsi di atas, selanjutnya ingin melihat seberapa besar persebaran data. Diperoleh nilai estimasi variansi dari total populasi secara keseluruhan pengguna alat kontrasepsi menggunakan persamaan (3.6)
( )
(
)
∑(
)
Tabel 4.7 Variansi dan Kesalahan Baku Estimasi Horvitz-Thompson Observasi
Variansi HT
Kesalahan baku HT
1
403310698
20082,6
2
506514490
22505,88
3
429242717
20718,17
4
502003443
22405,43
5
536113019
23154,11
6
527884343
22975,73
.
.
.
.
.
.
50
528039931
22979,12
Pada Observasi pertama diperoleh variansi sebesar 403310698 dengan kesalahan baku 20082,6.
55
4.4 Estimasi Total Populasi Hansen-Hurwitz Untuk menghitung nilai dari estimator Hansen-Hurwitz pada masingmasing klaster, dapat menggunakan rumus (3.8)
∑ Tabel 4.8 Estimasi Total Populasi Hansen-Hurwitz Observasi
Estimasi Pengguna Alat Kontrasepsi Cluster1 : Yogyakarta
Cluster2 : Bantul
Cluster3 : Sleman
1
40800
96195,2
111734,4
2
38494,22
106155,2
88785,6
3
39578,67
116856
88777,6
4
35925,33
135276,8
84432
5
39317,33
129264
91307,2
6
42510,22
117518,4
106364,8
.
.
.
.
.
.
.
.
50
34078,22
112379,2
88854,4
Berdasarkan tabel diatas, dapat dijelaskan bahwa dengan menggunakan estimator Hansen-Hurwitz untuk klaster 3 dengan wilayah Kota Yogyakarta, terdapat jumlah peserta pengguna Alat kontrasepsi sebanyak 111734,4
111734
peserta yang tersebar di 17 kecamatan. Untuk mengestimasi total jumlah peserta pengguna alat kontrasepsi program KB di Provinsi DIY secara keseluruhan menggunakan estimator HansenHurwitz, dapat dihitung menggunakan persamaan (3.9)
∑
∑
56
Dari hasil perhitungan persamaan diatas, kemudian diperoleh nilai dari estimator total populasi Hansen-Hurwitz sebesar 391048,9
391049. Artinya
bahwa dengan menggunakan estimator Hansen-Hurwitz diperoleh estimasi untuk total pengguna alat kontrasepsi di Provinsi DIY sebesar 391049 peserta. Untuk menghitung nilai variansi dari estimator HH dapat menggunakan rumus.
(
)
(
)
∑( ̅
̅)
Tabel 4.9 Variansi dan Kesalahan Baku Estimasi Hansen-Hurwitz Observasi
Variansi
Kesalahan Baku
1
294509585
17161,28
2
330725444
18185,86
3
310006319
17607
4
322564355
17960,08
5
293127690
17120,97
6
259803876
16118,43
.
.
.
.
.
.
50
342339079
18502,41
Pada Observasi pertama diperoleh variansi sebesar 294509585 dengan kesalahan baku 17161,28.
57
4.5 Perbandingan antara Estimator Hansen-Hurwitz dan Horvitz-Thompson Untuk Total Populasi dapat dilihat sebagai berikut :
Tabel 4.10 Perbandingan Estimasi Total Populasi Estimasi Pengguna Alat Kontrasepsi Obs
Cluster1
Cluster1
Cluster2
Cluster2
Cluster3
Cluster3
HT
HH
HT
HH
HT
HH
1
35700
40800
102207,4
96195,2
2
33682,44
38494,22
112789,9 106155,2
3
34631,33
39578,67
124159,5
4
31434,67
35925,33
143731,6 135276,8
5
34402,67
39317,33
6
37196,44
42510,22
.
.
.
.
.
.
.
.
.
.
.
.
.
.
50
29818,44
34078,22
94407,8
88854,4
137343
116856
129264
118717,8 111734,4 94334,7
88785,6
94326,2
88777,6
89709
84432
97013,9
91307,2
124863,3 117518,4 113012,6 106364,8
119402,9 112379,2
Dari tabel perbandingan Total Populasi dengan Estimator Horvitz-Thompson dan Hansen-Hurwitz diatas dapat dilihat bahwa estimasi dari Hansen-Hurwitz memiliki nilai estimasi yang lebih kecil tetapi estimasi dengan Hansen-Hurwitz memiliki estimasi yang lebih stabil. Sehingga pada estimasi untuk total populasi Hansen-Hurwitz lebih tepat dan efisien untuk digunakan.
58
Perbandingan Variansi : Tabel 4.11 Perbandingan Variansi HH dan HT Kesalahan
Kesalahan
baku HT
baku HH
294509585
20082,6
17161,28
506514490
330725444
22505,88
18185,86
3
429242717
310006319
20718,17
17607
4
502003443
322564355
22405,43
17960,08
5
536113019
293127690
23154,11
17120,97
6
527884343
259803876
22975,73
16118,43
.
.
.
.
.
.
.
.
.
.
50
528039931
342339079
22979,12
18502,41
Observasi
Variansi HT
Variansi HH
1
403310698
2
Dari tabel perbandingan Variansi dan Kesalahan Baku dengan Estimator Horvitz-Thompson dan Hansen-Hurwitz diatas dapat dilihat bahwa estimasi variansi dari Hansen-Hurwitz memiliki nilai variansi yang kecil dibandingkan dengan estimasi variansi Horvitz-Thompson. Kemudian dengan melihat kesalahan baku sebagai dasar dalam penyimpangan data terhadap rata-rata maka estimator Hansen-Hurwitz lebih efisen dibandingan dengan estimator Horvitz-Thompson.
59
4.6 FUNGSI BIAYA Dengan menggunakan fungsi biaya yang disampaikan Cochran (1991) untuk pengambilan sampel klaster dua tahap dibawah ini, maka dapat dihitung fungsi biaya dalam penggambilan sampel. ∑ Dari rumus tersebut, dimisalkan biaya yang digunakan untuk listing per sub unit dalam unit utama sebesar Rp 500.000,- dan biaya per sub unit serta pengawasaannya untuk tiap tiap desa di Provinsi DIY sebesar Rp 100.000,- . Maka diperoleh fungsi biaya sebagai berikut : C = (500.000 x 3) + (100.000 x 29) = 1.500.000 + 2.900.000 = 4.400.000 Jadi biaya pengambilan sampel sebesar Rp 4.400.000. Biaya ini masih mengabaikan besarnya biaya perjalanan dalam pengambilan sampel.