Jurnal Ilmu Pertanian dan Perikanan Desember 2012 Vol. 1 No.1 Hal : 37-42 ISSN 2302-6308
PEDUGAAN STANDAR DEVIASI UNTUK SAMPEL KECIL DALAM PENELITIAN PERTANIAN Weksi Budiaji1*, Suherna1, Yudi L. A. Salampessy1 1Jurusan
Agribisnis Fakultas Pertanian Universitas Sultan Ageng Tirtayasa Jalan Raya Jakarta Km 4 Pakupatan Serang Banten *Korespondensi :
[email protected] Diterima: 16 Oktober 2012 / Disetujui: 20 November 2012
ABSTRACT There is a rule of thumb formula to estimate a standard deviation for a small sample (2 to 15 samples). This formula is based on a ratio between the range data (maximum minus minimum) and the square root of the number of the samples. Although this formula has a small bias, Mantel (1951) used some constants instead of the square root of the number of the samples that produced even a smaller bias to a normal and a uniform distributed data. In this manuscript, we modify three constants that Mantel (1951) proposed when the number of objects is equal to 2 and 3. We also add a rule that the data must be assumed to be a standard normal (N (0,1)) or a standard uniform (U (0,1)) distribution. Keywords : standard deviation, small sample, normal distribution, uniform distribution
PENDAHULUAN Data yang sering digunakan dalam penelitian pertanian adalah data kontinyu yang diasumsikan menyebar normal misalkan pada data tinggi tanaman, hasil panen, pendapatan rumah tangga, dan lain sebagainya. Jika populasi yang menjadi perhatian dalam penelitian tersebut besar maka pengambilan sampel sangat diperlukan. Banyaknya sampel yang diambil untuk berbagai macam penelitian baik dengan data kontinyu atau kategorik (proporsi) dapat menggunakan formula yang diusulkan oleh Donner (1984) dan Jones et al (2003). Hal yang perlu diperhatikan adalah penentuan jumlah sampel dapat langsung menggunakan data asli. Penggunaan data transformasi misalnya logaritma sebelum analisis akan berpengaruh terhadap jumlah sampel yang dibutuhkan (Chow et al, 2002), sehingga penyesuaian diperlukan. Salah satu parameter yang sangat penting dalam penentuan jumlah sampel adalah ragam populasi (Lenth, 2001)
atau presisi (Naing et al., 2006). Pendugaan ragam populasi menjadi sangat penting karena dengan pendugaan yang tepat (tidak bias) akan menghasilkan jumlah sampel yang efektif untuk menguji hipotesis dan efisien dalam penghematan sumber daya (waktu dan biaya). Ada beberapa cara untuk mendapatkan pendugaan ragam populasi misalkan dengan melihat data historis, bertanya kepada ahlinya atau pun dengan melakukan prapenelitian. Pada pra-penelitian, pendugaan ragam populasi diperoleh dengan menghitung ragam dari subjek prapenelitian yang biasanya berjumlah kecil (2 sampai 15 subyek). Ragam sampel kecil yang diperoleh dari pra-penelitian dapat digunakan untuk menduga ragam populasi yang bermanfaat dalam penentuan jumlah sampel penelitian. Perhitungan ragam (kuadrat dari standar deviasi) sampel kecil ini dapat menggunakan cara cepat (Rule of Thumb) yaitu kuadrat dari range/ jangkuan (data terbesar dikurangi data terkecil) dibagi 4 (Bluman, 2012). Mantel
38
BUDIAJI ET AL.
(1951) dan Gehan (1980) juga memberikan alternatif perhitungan standar deviasi untuk sampel kecil untuk data yang menyebar normal dan uniform dimana standar deviasi dihitung dari range dibagi dengan akar dari jumlah obyek. Penelitian ini bertujuan mengevaluasi perhitungan cara cepat (Rule of Thumb) untuk standar deviasi yang diajukan oleh Mantel (1951) dengan membandingkan cara biasa pada sampel kecil bagi data yang meyebar normal dan uniform. Data yang menyebar normal atau uniform penting menjadi perhatian karena data tersebut sering dijumpai (diasumsikan) dalam penelitian pertanian (Bell et al, 2012; Sahoo et al, 2008; Zhao et al, 2000). METODE PENELITIAN Penelitian pendugaan standar deviasi untuk sampel kecil menggunakan simulasi data. Data simulasi dibangkitkan dari sebaran populasi yang menjadi topik penelitian yaitu data yang menyebar normal dan uniform. Sampel kecil dibatasi pada jumlah sample 2 sampai dengan 15. Parameter data simulasi untuk tiap sebaran bervariasi dengan menggunakan beberapa alternatif pilihan parameter. Data hasil simulasi dihitung standar deviasinya dengan cara biasa dan cara cepat (Rule of Thumb) kemudian diselisihkan. Sebaran normal yang disimulasikan pertama adalah sebaran data normal dengan rataan 0 dan ragam. Kemudian kedua parameter ini divariasi. Jumlah sampel yang dibangkitkan 2 sampai dengan 15 subyek. Tiap n jumlah subyek, standar deviasi cara biasa dan cara cepat diambil berdasarkan rataan dari 1000 kali pembangkitan data. Standar deviasi cara biasa dihitung dengan menggunakan rumus: -
……………………………(1)
dimana n adalah jumlah subyek, xi adalah nilai subyek ke-i, dan adalah nilai
JIPP rataan dari seluruh subyek. Disisi lain, standar deviasi cara cepat menggunakan rumus: -
……………………...(2)
dimana max adalah nilai terbesar dan min adalah nilai terkecil dari data. Jika cara biasa dan cara cepat menghasilkan nilai 0, cara cepat adalah penduga tak berbias. Perhitungan standar deviasi dengan menggunakan rumus (2) akan dibandingkan juga dengan nilai standar deviasi yang diperoleh dengan menggunakan penyebut yang diusulkan oleh Mantel (1951) dimana pembilangnya sama tetapi penyebutnya tidak menggunakan . Penyebut yang digunakan dalam cara Mantel adalah penyebut yang ada pada tabel Mantel (1951). Tahap-tahap simulasi dari awal sampai dengan akhir dikerjakan menggunakan software R. Kode (syntax) software R yang digunakan dalam penelitian ini dapat diperoleh melalui permintaan kepada penulis. HASIL DAN PEMBAHASAN Tiap jumlah n dibangkitkan sebanyak 1000 data kemudian dihitung standar deviasinya menggunakan cara biasa (1) dan cara cepat (2). Dari perhitungan tersebut diambil rataannya kemudian diselisihkan antara cara (1) dan (2) untuk mendapatkan nilai bias. Tabel 1 menunjukkan nilai bias dari data yang menyebar normal dengan parameter nilai tengah (mean) dan ragam (variance) yang berbeda-beda. Pada jumlah n = 2, nilai bias untuk semua variasi parameter adalah 0. Ini berarti cara (1) dan cara (2) menghasilkan nilai standar deviasi yang sama. Hal lain yang dapat dilihat pada Tabel 1 adalah pada saat ragam data sama tanpa memperhitungkan nilai tengahnya, bias yang diperoleh juga sama. Dilain pihak, jika nilai tengah data sama tetapi ragamnya lebih besar, 2 kali lebih besar misalnya, bias cara (1) dan cara (2) menjadi 2 kali lebih besar pula.
Volume 1 (1), 2012
Pendugaan Standar Deviasi Sampel Kecil
Ini dikarenakan cara (1) dan cara (2) adalah pendugaan untuk standar deviasi yang merupakan akar dari ragam, sehingga dengan berubahnya nilai ragam maka bias pendugaan cara (2) merespon perubahan nilai ragam bukan perubahan nilai tengah. Mantel (1951) memberikan tabel nilai penyebut pada cara (2) agar diperoleh penduga tak bias bagi sebaran normal sehingga penyebut pada cara (2) tidak lagi digunakan. Dalam hal ini, tidak disebutkan apakah Mantel (1951) menstandarisasi/ mengasumsi data menyebar N(0,1), padahal terlihat pada hasil simulasi Tabel 1, ragam data akan sangat berpengaruh terhadap bias pendugaan. Berdasarkan alasan ini, penulis menyarankan (mengasumsi) penggunaan sebaran normal standar (N (0,1)) jika menggunakan nilai penyebut yang diusulkan Mantel (1951). Penggunaan sebaran normal standar N (0,1) untuk cara cepat (2) dapat dibandingkan dengan cara Mantel (penyebut tidak menggunakan , tetapi menggunakan tabel Mantel). Perbandingan bias cara (2) dan cara Mantel dapat dilihat pada Tabel 2. Bias cara Mantel lebih besar saat n = 2 dan n = 3,
39
sehingga untuk jumlah n ini penyebut lebih disarankan. Sebaran data kedua yang disimulasikan adalah data yang menyebar uniform. Standar deviasi cara biasa (1) dan cara cepat (2) dihitung dari tiap jumlah n yang dibangkitkan dari 1000 data seperti sebelumnya, kemudian nilai bias juga dihitung. Tabel 3 adalah nilai bias dari data yang menyebar uniform dengan parameter minimum dan maksimum yang beragam. Saat n = 2, nilai bias 0 diperoleh untuk semua variasi parameter yang berarti cara (1) dan cara (2) menghasilkan nilai standar deviasi yang sama. Tabel 3 juga menunjukkan bahwa range (max–min) parameter data uniform yang sama diperoleh nilai bias yang sama, tanpa mempedulikan nilai minimum ataupun maksimum yang ada. Disisi lain, jika range parameter data uniform dua kali lebih besar, 2 kali lebih besar misalnya, bias cara (1) dan cara (2) menjadi 2 kali lebih besar pula. Alasan dari hasil ini adalah perhitungan nilai ragam pada sebaran uniform berdasarkan pada nilai kuadrat dari range data, sehingga perbedaan range akan berpengaruh terhadap bias pendugaan cara (2).
Tabel 1 Bias antara perhitungan cara biasa dan cara cepat untuk data normal n \ data
N (0, 1)
N (0, 2)
N (0, 3)
N (1, 1)
N (1, 2)
N (1, 3)
2
0.00
0.00
0.00
0.00
0.00
0.00
3
0.09
0.19
0.28
0.09
0.19
0.28
4
0.12
0.23
0.35
0.12
0.23
0.35
5
0.11
0.22
0.33
0.11
0.22
0.33
6
0.10
0.20
0.31
0.10
0.20
0.31
7
0.10
0.19
0.29
0.10
0.19
0.29
8
0.08
0.16
0.25
0.08
0.16
0.25
9
0.08
0.16
0.24
0.08
0.16
0.24
10
0.08
0.16
0.23
0.08
0.16
0.23
11
0.08
0.15
0.23
0.08
0.15
0.23
12
0.08
0.16
0.24
0.08
0.16
0.24
13
0.09
0.18
0.27
0.09
0.18
0.27
14
0.10
0.20
0.30
0.10
0.20
0.30
15
0.11
0.21
0.32
0.11
0.21
0.32
40
BUDIAJI ET AL.
JIPP
Tabel 2 Hasil perbandingan bias antara cara cepat (N (0,1)) dan cara Mantel n
sd (1)*
sd (2)*
sd (m)*
bias (2)*
bias (m)*
2
0.84
0.84
0.93
0.00
0.10
3
0.90
0.99
1.01
0.09
0.11
4
0.93
1.04
1.02
0.12
0.10
5
0.94
1.04
1.02
0.11
0.09
6
0.96
1.04
1.03
0.10
0.09
7
0.97
1.04
1.03
0.10
0.09
8
0.97
1.01
1.00
0.08
0.08
9
0.98
1.00
1.00
0.08
0.08
10
0.98
0.97
0.99
0.08
0.08
11
0.97
0.95
0.97
0.08
0.08
12
0.97
0.94
0.97
0.08
0.08
13
0.98
0.92
0.96
0.09
0.08
14
0.97
0.90
0.94
0.10
0.08
15
0.98 0.90 0.95 0.11 *(1), (2), dan (m) berturut-turut adalah cara (1), (2), dan Mantel
0.09
Tabel 3 Bias antara perhitungan cara biasa dan cara cepat untuk data uniform n \ data
U (0, 1)
U (0, 2)
U (0, 3)
U (1, 2)
U (1, 3)
U (1, 4)
2
0.00
0.00
0.00
0.00
0.00
0.00
3
0.03
0.05
0.08
0.03
0.05
0.08
4
0.03
0.06
0.09
0.03
0.06
0.09
5
0.03
0.05
0.08
0.03
0.05
0.08
6
0.02
0.05
0.07
0.02
0.05
0.07
7
0.02
0.04
0.07
0.02
0.04
0.07
8
0.02
0.05
0.07
0.02
0.05
0.07
9
0.03
0.05
0.08
0.03
0.05
0.08
10
0.03
0.06
0.09
0.03
0.06
0.09
11
0.04
0.07
0.11
0.04
0.07
0.11
12
0.04
0.09
0.13
0.04
0.09
0.13
13
0.05
0.10
0.15
0.05
0.10
0.15
14
0.06
0.11
0.17
0.06
0.11
0.17
15
0.06
0.12
0.18
0.06
0.12
0.18
Mantel (1951) juga menuliskan tabel nilai penyebut pada cara (2) bagi pendugaan standar deviasi sebaran uniform. Seperi pada sebaran normal, Mantel (1951) tidak menyebutkan apakah data dari sebaran uniform tersebut
distandarisai menjadi U (0,1), padahal hasil simulasi Tabel 3 terlibat bahwa range data berpengaruh terhadap bias pendugaan. Atas dasar ini, penulis menyarankan penggunaan sebaran uniform standar (U (0,1)) jika menggunakan nilai penyebut Mantel (1951).
Volume 1 (1), 2012
Pendugaan Standar Deviasi Sampel Kecil
Penggunaan sebaran uniform standar U (0,1) cara (2) dapat dibandingkan dengan cara Mantel. Perbandingan bias cara (2) dan cara Mantel dapat dilihat pada Tabel 4. Bias cara Mantel lebih besar saat n = 2 sehingga penyebut disarankan pada n = 2.
41
Ringkasan hasil simulasi data yang menyebar Normal (Tabel 2) dan uniform (Tabel 4) diatas dapat dapat dilihat pada Tabel 5. Tabel 5 menunjukkan bahwa cara Mantel untuk n = 2 dan n = 3 bagi data yang menyebar normal dimodifikasi nilai penyebutnya. Disisi lain, modifikasi diperlukan hanya untuk n = 2 pada data yang menyebar uniform.
Tabel 4 Hasil perbandingan bias antara cara cepat (U (0,1)) dan cara Mantel n sd (1)* sd (2)* sd (m)* bias (2)* 2 0.24 0.24 0.27 0.00 3 0.26 0.28 0.28 0.03 4 0.28 0.30 0.30 0.03 5 0.28 0.30 0.29 0.03 6 0.28 0.29 0.29 0.02 7 0.28 0.28 0.28 0.02 8 0.28 0.28 0.28 0.02 9 0.29 0.27 0.28 0.03 10 0.28 0.26 0.27 0.03 11 0.28 0.25 0.27 0.04 12 0.29 0.24 0.27 0.04 13 0.29 0.24 0.26 0.05 14 0.29 0.23 0.26 0.06 15 0.29 0.23 0.26 0.06 *(1), (2), dan (m) berturut-turut adalah cara (1), (2), dan Mantel
Tabel 5 Penyebut cara dimodifikasi
Mantel
yang
Uniform n Normal 2 2,0* 2,0* 3 3.0* 3,0 4 4,1 4,2 5 5,2 5,2 6 6,2 6,1 7 7,2 6,9 8 8,1 7,6 9 8,9 8,3 10 9,7 9,0 11 10,5 9,6 12 11,3 10,2 13 12,0 10,7 14 12,7 11,2 15 13,4 11,7 * Nilai penyebut yang dimodifikasi (berdasarkan hasil simulasi)
bias (m)* 0.03 0.03 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.03 0.03 0.03 0.03 0.03
KESIMPULAN Pendugaan standar deviasi cara cepat (Rule of Thumb) untuk sampel kecil adalah pendugaan yang berbias. Namun demikian, penggunaan tabel nilai penyebut yang diusulkan oleh Mantel (1951) memperkecil bias tersebut. Cara pendugaan ini dapat digunakan dengan syarat mentransformasi (mengasumsi) sebaran populasi data adalah data yang menyebar N (0,1) atau U (0,1). Pada saat n = 2 baik untuk sebaran data normal atau uniform, penggunaan konstanta 2 disarankan dibandingkan konstanta yang diajukan Mantel (1951) karena biasnya lebih kecil.Hal ini berlaku pula untuk n = 3 yang menggunakan konstanta 3 dimana bias yang dihasilkan juga lebih kecil.
42
BUDIAJI ET AL. DAFTAR PUSTAKA
Bell, M. J., B. R. Cullen, I. R. Johnson, and R. J. Eckard. 2012. Modelling Nitrogen Losses from Sheep Grazing Systems with Different Spatial Distribution of Excreta. Agriculture, Vol. 2, pp. 282-294. Chow, Shein-Chung, J. Shao, and H. Wang. 2002. A Note on Sample Size Calculation for Mean Comparisons Based on Noncentral t-Statistics. Journal of Biopharmaceutical Statistics, vol. 12, pp. 441-456. Bluman, A. 2012. Elementary Statistics: A Step-By-Step Approach. Mcgraw-Hill: New York Donner, A. 1984. Approaches to Sample Size Estimation in The Design of Clinical Trials-A review. Statistics in Medicine, vol. 3, pp. 199-214. Gehan, E. A., 1980. The Training of Statistics for Cooperative Clinical Trials: A Working Statistician’s Viewpoint. Biometrics, vol. 36, No. 4 (Dec, 1980), pp. 699-706. Jones, S.R., S. Carley, and M. Harrison. 2003. An Introduction to Power and Sample Size Estimation. Emergency Medicine Journal, vol, 23, pp. 453458.
JIPP Lenth, R. V. 2001. Some Practical Guidelines for Effective Sample Size Determination. The American Statistical Association, vol. 55, No.3, pp.187-193. Mantel, N. 1951. Rapid Estimation of Standard Errors of Means for Small Samples. The American Statistician, vol. 5, No. 4 (Oct, 1951), pp. 26-27. Naing, L., T. Winn, and B. N. Rusli. 2006. Practical Issues in Calculating the Sample Size for Prevalence Studies. Archives of Orofacial Sciences 2006, vol.1, pp. 9-14. Sahoo, N., P.L. Pradhan, N.K. Anumala, and M.K. Ghosal. 2008. Uniform Water Distribution From Low Pressure Rotating Sprinklers. Agricultural Engineering International: the CIGR Ejournal. Manuscript LW 08 014. vol. X Zhao, X., W. E. Griffiths, G. R. Griffiths, and J. D. Mullen. 2000. Probability Distributions for Economic Surplus Changes: The Case of Technical Change in The Australian Wool Industry. The Australian Journal of Agricultural and Resource Economics, vol. 44:1, pp. 83-106.