BAB I PENDAHULUAN
1.1.
Latar Belakang Sebagian besar penelitian-penelitian bidang statistika berhubungan dengan
pengujian asumsi distribusi, baik secara teori maupun praktik di lapangan. Salah satu uji yang sering digunakan dalam pengujian asumsi distribusi, yaitu uji goodness-of-fit. Uji goodness-of-fit merupakan uji yang digunakan untuk mengetahui distribusi dari suatu data empiris. Dengan kata lain, uji ini digunakan untuk menguji hipotesis bahwa suatu sampel yang diperoleh dari populasi memiliki fungsi distribusi tertentu. Ada berbagai macam metode yang dapat dilakukan dalam pengujian goodness-of-fit. Salah satu metode yang digunakan untuk melakukan uji goodness-of-fit adalah uji fungsi distribusi empiris. Metode pengujian ini berdasarkan pada perbedaan atau selisih antara fungsi distribusi empiris Fn dan distribusi nol F0 . Uji fungsi distribusi empiris yang populer, yaitu uji Kolmogorov-Smirnov, uji Cramer-von Mises, dan uji Anderson-Darling. Selanjutnya uji Shapiro-Wilk, uji Cramer-von Mises, dan uji Anderson-Darling disebut sebagai metode klasik. Pengujian goodness-of-fit dengan metode klasik umumnya menggunakan fungsi distribusi kumulatif empiris dalam perhitungan statistik uji. Berbeda dengan metode klasik, penelitian ini mempelajari beberapa uji goodness-of-fit berdasarkan pada perbedaan atau ketidaksesuaian antara sampel pengamatan dengan sampel prediksi yang berasal dari distribusi posterior prediktif (metode Bayesian). Metode Bayesian mampu menaksir suatu model, khususnya menyelesaikan permasalahan apabila informasi statistik tidak dapat diperoleh dengan mudah. Selanjutnya, penelitian ini berfokus pada uji normalitas yang merupakan asumsi penting dalam sebagian besar metode statistika.
1
2
1.2.
Rumusan Masalah Permasalahan dalam penelitian ini adalah:
1.
Bagaimana memperoleh uji goodness-of-fit untuk uji normalitas berdasarkan pada perbedaan sampel pengamatan dan sampel prediksi yang didapatkan dari distribusi posterior prediktif?
2.
Bagaimana perbandingan uji goodness-of-fit berdasarkan metode Bayesian terhadap uji-uji metode klasik, khususnya dalam pengujian normalitas?
1.3.
Tujuan Penelitian Tujuan penelitian ini adalah untuk:
1. Memperoleh beberapa uji goodness-of-fit untuk uji normalitas berdasarkan pada perbedaan sampel pengamatan dan sampel prediksi yang didapatkan dari distribusi posterior prediktif. 2. Mengetahui power dari uji goodness-of-fit berdasarkan metode Bayesian tersebut.
1.4.
Manfaat Penelitian Manfaat dalam penelitian ini adalah sebagai berikut:
1. Secara umum dengan adanya penelitian ini diharapkan dapat memperluas wawasan pengetahuan, memberikan sumbangan terhadap perkembangan ilmu, dan memperkaya literatur dalam bidang matematika terutama bidang statistika mengenai uji goodness-of-fit untuk uji normalitas. 2. Secara khusus dapat memberikan gambaran tentang uji goodness-of-fit untuk uji normalitas melalui pendekatan Bayesian, serta kekuatan uji dari uji tersebut.
1.5.
Tinjauan Pustaka Diketahui X1 , X 2 ,..., X n merupakan sampel yang saling bebas dan identik
dari suatu fungsi distribusi kumulatif kontinu, F X P X1 x . Hipotesis pengujian pada uji goodness-of-fit adalah sebagai berikut:
3
H 0 : F X F0 X untuk semua x ,
dengan hipotesis tandingan H1 : F X F0 X untuk semua x ,
dimana F0 x merupakan suatu fungsi distribusi kumulatif yang diujikan. Ada dua kasus pada pengujian hipotesis tersebut. Kasus pertama, fungsi distribusi dari F0 x diketahui. Sedangkan kasus kedua, fungsi distribusi dari F0 x memiliki
beberapa parameter yang tidak diketahui (He dan Xu, 2012). Uji goodness-of-fit untuk normalitas telah diusulkan dengan berbagai macam cara. Salah satu cara yang telah diusulkan adalah pengujian fungsi distribusi empiris. Untuk mengetahui tentang pengujian fungsi distribusi empiris secara lengkap dapat dilihat pada DasGupta (2008). Referensi lain mengenai uji goodness-of-fit dengan pengujian fungsi distribusi empiris dapat dilihat pada Massey (1951) yang membahas tentang uji Kolmogorov-Smirnov, Anderson dan Darling (1954) yang membahas tentang uji Anderson-Darling untuk goodness-offit, serta Stephen (1974) yang membahas perbandingan statistik fungsi distribusi empiris untuk uji goodness-of-fit. Selanjutnya, Susanti (2000) membahas tentang beberapa metode uji normalitas serta penyelesaian asimtotik yang memberikan kesan bahwa metode estimasi likelihood lokal dapat memberikan suatu estimasi model yang mendekati model sebenarnya. Hukunala (2010) menunjukkan bahwa masalah pada uji normalitas dari model regresi linear dapat diturunkan dengan uji rasio likelihood empiris. Penggunaan uji goodness-of-fit berdasarkan fungsi distribusi kumulatif empiris sering dilakukan, baik secara teori maupun praktik. Guttman (1967) mengusulkan pendekatan baru untuk uji goodness-of-fit dengan menggabungkan metode Bayesian dan sampling. Metode Bayesian digunakan dalam penentuan distribusi posterior prediktif. Sebagai contoh dapat dilihat pada Gelman, et al (2004). Distribusi ini juga digunakan oleh Meng (1994) dan Gelman, et al (1996) untuk permasalahan yang sama.
4
Diketahui F
memiliki fungsi peluang
f y | , dengan
merupakan ruang parameter. Misalkan x x1 , x2 ,..., xn merupakan sampel pengamatan. Distribusi prior dan posterior masing-masing dinotasikan dengan
dan | x . Meng (1994) mendefinisikan distribusi posterior prediktif sebagai berikut: h y | x f y | | x d .
Untuk pengujian goodness-of-fit, Guttman (1967) mengusulkan statistik uji “chi-square like” yakni k
fi ei
i 1
ei
X 2
2
,
yang digunakan untuk mengukur perbedaan antara frekuensi pengamatan dan prediksinya yang diperoleh melalui distribusi posterior prediktif. Hal yang berbeda dari usul Guttman akan dibahas pada penelitian ini, yaitu uji goodness-offit berdasarkan perbedaan antara sampel pengamatan dan sampel prediksi yang diambil dari distribusi posterior prediktif.
1.6.
Metode Penelitian Metode yang digunakan dalam penelitian ini adalah studi literatur. Dalam
mempelajari uji goodness-of-fit untuk normalitas berdasarkan pada distribusi posterior prediktif digunakan referensi dari jurnal A Goodness-of-Fit Testing Approach for Normality Based on the Posterior Predictive Distribution (He dan Xu, 2013). Langkah awal dalam penelitian ini adalah memilih distribusi prior sebagai distribusi dari sampel pengamatan dan memperoleh distribusi posterior yang bersesuaian. Selanjutnya, dengan melakukan beberapa perhitungan akan diperoleh distribusi posterior prediktif. Kemudian sampel-sampel prediksi yang saling bebas dan identik diperoleh berdasarkan distribusi posterior prediktif tersebut. Lalu, menentukan perbedaan antara sampel pengamatan dan sampel
5
prediksi tersebut. Selanjutnya dengan menggunakan pendekatan ekspektasi bersyarat diperoleh suatu statistik uji. Langkah terakhir adalah melakukan perbandingan statistik uji yang telah diperoleh dengan statistik-statistik uji lain khususnya untuk uji normalitas.
1.7.
Sistematika Penulisan Tesis ini disusun dengan sistematika penulisan sebagai berikut :
BAB I PENDAHULUAN Bab ini berisi Latar Belakang dan Permasalahan, Tujuan dan Manfaat Penelitian, Tinjauan Pustaka, Metodologi penelitian dan Sistematika Penulisan. BAB II LANDASAN TEORI Bab ini membahas tentang teori dasar yang menunjang pembahasan tentang uji goodness-of-fit untuk uji normalitas dengan pendekatan Bayesian. BAB III PEMBAHASAN Bab ini membahas penjelasan mengenai uji goodness-of-fit untuk uji normalitas berdasarkan pada perbedaan sampel pengamatan dan sampel prediksi yang didapatkan dari distribusi posterior prediktif. BAB IV SIMULASI DATA Bab ini membahas perbandingan antara statistik uji yang telah diperoleh dari metode Bayesian dengan statistik uji metode klasik, khususnya untuk uji normalitas. BAB V
PENUTUP
Bab ini berisi tentang kesimpulan yang diperoleh dari hasil pembahasan serta saran sebagai akibat dari kekurangan atau kelebihan dari hasil penelitian yang dilakukan.