IndoMS Journal on Statistics Vol. 1, No. 2 (2013), Page 35-47
PERBANDINGAN HASIL PENGUJIAN INTERCEPT PADA UJI SATU ARAH MAKSIMUM DAN MINIMUM PADA UJI-UJI TERKAIT NON-SAMPLE PRIOR INFORMATION PADA MODEL REGRESI SEDERHANA KETIKA VARIANSI TIDAK DIKETAHUI Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana Prodi Matematika, Jurusan MIPA, FST Unsoed Purwokerto E-mail:
[email protected],
[email protected],
[email protected],
[email protected]
Abstract This research studied comparison results in testing the intercept for one-side hypothesis (maximum and minimum) for tests that related to non-sample prior information (NSPI) on a simple linear regression with unknown variance. Here, we used several tests, namely unrestricted test (UT), restricted test (RT), and preliminarytest test (PTT). The test that has maximum power and minimum size is considered as the best choice among the tests. A simulation study is presented for showing a graphically comparison of the three tests. The result shows that the powers of the tests for both hypotheses (maximum and minimum) are different. It means that type of hypothesis will affect the power and size of the tests, and it gives impact to role of NSPI to the conclusion. For both hypotheses, PTT lies between UT and RT, so PTT is a relevan choice for the test. Keywords: Linear model, power and size. Abstrak Penelitian ini membahas perbandingan hasil pengujian intercept untuk uji hipotesis satu sisi (maksimum dan minimum) pada uji-uji yang terkait non-sample prior information (NSPI) pada model regresi sederhana untuk variansi tidak diketahui. Ujiuji yang digunakan adalah unrestricted test (UT), restricted test (RT), dan preliminarytest test (PTT). Test yang mempunyai nilai kuasa maksimum dan ukuran minimum dipilih sebagai uji terbaik. Simulasi diberikan untuk menggambarkan dan membandingkan grafik kuasa dan ukuran. Hasil pengujian menunjukan bahwa nilai kuasa untuk kedua hipotesis tersebut adalah berbeda. Hal ini berarti bahwa jenis hipotesis mempengaruhi hasil pengujian dengan NSPI. Namun demikian, pada dua kasus hipotesis tersebut PTT masih relevan menjadi pilihan test. Kata kunci: Model linier, kuasa dan ukuran .
2010 Mathematics Subject Classification: 62F03, 62J05. 35
36
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
1. Pendahuluan Umumnya inferensi statistics dilakukan menggunakan data sampel. Kualitas inferensi ini untuk sembarang populasi dapat ditingkatkan menggunakan non-sample prior information (NSPI). NSPI adalah informasi tentang parameter populasi yang tidak berhubungan dengan data sampel. NSPI diperoleh dari sumber yang dapat dipercaya, misalnya studi sebelumnya atau pengetahuan ahli atau pengalaman dari para peneliti. Bancroft [1] adalah peneliti pertama yang menggunakan NSPI untuk estimasi parameter. Kemudian dilanjutkan oleh [2], [4], dan lain-lain. Selanjutnya, [5], [6], [7], serta [8], menggunakan NSPI untuk testing (pengujian) hipotesis pada kasus non parametrik. Setelah itu [3] menggunakan NSPI untuk testing hipotesis pada kasus parametrik. Penelitian ini adalah pengembangan penelitian [3] pada unrestricted test (UT), restricted test (RT), dan pre-test test (PTT) untuk pengujian dua uji hipotesis satu sisi (maksmimu dan minimum). Pada kasus ini, penelitian difokuskan untuk testing intercept pada model regresi linier sederhana, Y 0 1 X e , dimana Y adalah response, 0 adalah parameter intercept, 1 adalah parameter slope, X adalah predictor, dan e adalah error term yang berdistribusi normal. Model regresi yang terkait pengujian ini adalah model regresi untuk kasus variansi tidak diketahui (unknown variance) sedemikian hingga distribusi terkait adalah t dan bivariate t distribution.. Power (kuasa) uji adalah peluang menolak hipotesis nol ( H 0 ) ketika nilai parameter yang sebenarnya under alternative hypotesis (H1), sedangkan size (ukuran) uji adalah nilai power ketika nilai parameter yang sebenarnya under H 0 . Tests (UT, RT, PTT) yang memiliki nilai power maksimum dan size minimum digunakan sebagai metode uji pemilihan uji terbaik. Software R digunakan untuk menggambarkan grafik UT, RT dan PTT yang kemudian digunakan sebagai graphically analisis. Pada bagian 2, dipresentasikan proposed tests dan modifikasi tests beserta distribusi sampling yang menyertainya. Power dan size dipaparkan pada bagian 3. Bagian 4, menggambarkan simulasi studi dan plot UT, RT, dan PTT. Kemudian, kesimpulan dan saran untuk kedua kasus pengujian (one-side hypothesis) diberikan di bagian 5.
2. Metode Analisis Penelitian ini diawali dengan melakukan review penelitian [3]. Selanjutnya dilakukan pemilihan jenis hipotesis yang berbeda dari penelitian sebelumnya. Langkah berikutnya adalah sebagai berikut: (1) melakukan proposed tests untuk dua tipe hipotesis (maksimum dan minimum) dan modifikasi statistic tests beserta distribusi sampling yang menyertainya, (2) menurunkan power dan size, (3) melakukan simulation study dengan data pembangkitan dari R package, dan menggambarkan plot UT, RT, dan PTT, (4) melakukan analisis grafik pada ketiga grafik tersebut untuk dua kasus uji hipotesis satu sisi (maksimum dan minimum), dan (5) menarik kesimpulan dari hasil perbandingan analisis grafik pada langkah (4).
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
37
3. Hasil dan Pembahasan 3.1 Proposed Tests Proposed tests untuk pengujian hipotesis satu sisi maksimum dan minimum adalah sama sebagai berikut. 3.1.1 Unrestricted Test Mengacu pada [3], test statistic (statistik uji) UT ketika NSPI tidak terdapat dalam slope ( 1 ), pada pengujian hipotesis satu arah (maksimum dan minimum), H 0 : 0 0 versus
H1 : 0 0 (atau > 0), adalah ˆ 0 ˆ0 n T UT 0 , (1) 1/2 2 sˆ X 0 se 1 S XX 2 1 n dengan se2 Yi Yˆ (mean square error (MSE)) adalah estimator dari variansi eror n 2 i 1
model regresi linear sederhana. Pada kasus ini, slope diestimasi dari data sampel. Test statistic persamaan (1) mengikuti distribusi Student-t dengan derajat bebas (n-2), dan komponen
ˆ0 n 1/ 2
dihitung dari data sampel. Selanjutnya, mengacu [3], dengan mendefiniskan
X2 se 1 S XX K n sebagai hipotesis alternatif (series), yaitu
Kn : 0 , 1 b1 1 , 2 n1/ 2 λ, n n dimana elemen b1 adalah komponen pre-test (PT) pada H 0 : 1 b1 versus H1 : 1 b1 . Dalam hal ini, λ 1 , 2
0
n , 1 b1 n . Pada Kn , nilai 0 0 dan 1 b1 0.
Sementara itu, pada H 0 , nilai 0 0 dan
1 b1 0. Selanjutnya, didefinisikan sampling
statistik uji UT pada K n , yaitu UT 1
T
dengan k se 1
X2 . S xx
T
UT
X2 n 0 se 1 S XX
1
T UT 1 , k
(2)
38
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
3.1.2 Restricted Test Jika NSPI terdapat pada slope (fixed), yaitu 1 b1 , maka test statistic terkait NSPI yang digunakan adalah RT. Statistik uji untuk RT adalah
T RT
0 s
n0 , sy
0
(3)
yang berdistribusi Student-t derajat bebas (n-1), dimana Selanjutnya, pada Kn berlaku kondisi
T2RT T RT
sy
0 0 dan 1 b1 0, dan statistik uji dari RT adalah
0 1 b1 X sy
n X 1 2 . sy
T RT
2 1 n Yi Y . n 1 i 1
(4)
3.1.3 Pre-test Test Jika NSPI terdapat pada slope
1
tetapi uncertain (diduga sebesar b1 ), maka uji
terkait NSPI yang digunakan adalah PTT. Pada PTT didahului dengan pre-test (PT), yaitu uji
H 0* : 1 = b1 vs H1* : 1 b1 , sedemikian hingga statistik uji PT adalah T PT
ˆ1 b1 sˆ
1
n
ˆ1 b1 se / S XX
dengan S XX X i X i 1
2
,
dan se
(5)
2 1 n Yi Yˆ . n 2 i 1
Jika H 0* pada PT ditolak,
maka UT digunakan untuk menguji H 0 , karena UT berkorelasi dengan PT, jika tidak demikian maka RT yang digunakan. Secara sama, persamaan (5) berdistribusi Student-t dengan derajat bebas (n-2). Secara jelas, bahwa PT dan UT berkorelasi, sedangkan PT dan RT tidak berkorelasi, sehingga kemudian power dan size dari PTT pada tingkat signifikansi 3 diberikan sebagai kombinasi dari kondisi tersebut ([3]). 3.2
Power and Size of the Tests 3.2.1 Unrestricted Test Mengacu [3] dan persamaan (2), power UT pada tingkat signifikansi 1 , adalah
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
39
tUT 1 P T UT t ,n 2 K n 1
1 P T1UT t1 ,n 2 1 k
(6)
dan size UT diberikan sebagai
tUT P T UT t ,n 2 H 0 : 0 0 1
1 P T
UT 1
(7)
t1 ,n 2 .
3.2.2 Restricted Test Selanjutnya, dengan [3] dan persamaan (4), untuk tingkat signifikansi 2 , maka diperoleh power and size RT sebagai berikut.
tRT λ P T RT t
2 , n 1
Kn
n 0 1 b1 X P T2RT t 2 ,n 1 sy X 1 P T2 RT t 2 ,n 1 1 2 sy
tRT P T RT t
2 , n 1
H 0 : 0 0
X 1 P T2RT t 2 ,n 1 2 sy
(8)
.
.
(9)
3.2.3 Pre-test Test Mengacu [3] dan kondisi UT dan PT (berkorelasi) dan RT dan PT (tidak berkorelasi) sebagaimana dinyatakan pada subbagian 3.1.2, maka power dan size dari PTT pada tingkat signifikansi 3 diberikan sebagai
tPTT λ P T PT t ,n 2 , T UT t ,n 2 P T PT t ,n 2 , T RT t 3
1
3
S XX m2 t3 ,n 2 2 , t1 ,n 2 1 ; 0 k se n
S XX 1 2 X ; 0 . m10 t3 ,n 2 2 , t 2 ,n 1 sy se n
2 , n 1
(10)
40
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
S XX dan m2 t3 ,n2 2 , t1 ,n2 1 ; 0 k s n e S XX 1 2 X ; 0 , adalah probabiltas bivariat Student-t yang m10 t3 ,n2 2 , t2 ,n1 sy se n
Pada
persamaan
(10),
didefinisikan dengan
m2 a1 , a2 ; 0
f t
PT
, t UT dt PT dt UT dan
(11)
PT
, t RT dt PT dt RT .
(12)
a2 a1 a1
m10 a1 , a3 ; 0
f t
a3
Nilai koefisien korelasi antara T
UT
dan T PT , adalah 1 1 , dan size dari PTT adalah
tPTT P T PT a1 , T UT a2 H 0 P T PT a1 , T RT a3 H 0
X m2 t3 ,n 2 , t1 ,n 2 ; m10 t3 ,n 2 , t 2 ,n 1 2 ; 0 , sy dengan a1 , a2 ,dan a3 adalah bilangan riil.
3.3
(13)
A Simulation Study Data simulasi dibangkitkan dengan R package 15.0.1, dengan 0 10, 1 5,
untuk one-side hypothesis (maximum) dan 0 10, 1 5, one-side hypothesis (minimum). Nilai X i di generate dari distribusi normal dengan mean 2 dan standar deviasi 3 (tidak harus berdistribusi) dan ei dibangkitkan dari distribusi normal dengan 0 dan variansi 2 1, pada kedua kasus tersebut. Power dan size dari tests (UT, RT, PTT) untuk pengujian one-side
hypothesis maximum dan one-side hypothesis minimum, H 0 : 0 0 versus H1 : 0 0 (atau > 0), dipaparkan sebagai berikut. 3.3.1
Power of the Tests Grafik untuk kuasa uji dari UT, RT, dan PTT pada pengujian H 0 : 0 0 versus
H1 : 0 0 , didasarkan pada persamaan tersebut di atas pada koefisien korelasi 0,7 dan nilai
2 yang berbeda adalah sebagai berikut.
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
41
Gambar 1. Kuasa dari UT, RT, dan PTT versus 1 dengan nilai 2 berbeda 0,7. Grafik di atas (Gambar 1) menunjukan bahwa semakin besar nilai 1 , maka nilai kuasa dari UT semakin besar, dan UT tidak bergantung pada 2 . RT semakin besar sebagaimana nilai
1 , membesar, dan semakin kecil ketika nilai 2 semakin kecil. Hal ini berarti bahwa kuasa dari RT tidak maksimum dan cenderung tidak optimal (baik). Sementara itu, PTT semakin besar sebagaimana nilai 1 semakin besar. Artinya PTT semakin baik. Secara jelas, terlihat bahwa ketika 1 0 dan 2 0 kuasa dari UT dan PTT selalu lebih besar daripada kuasa dari RT.
Secara jelas, jika 0 menunjukan bahwa grafik PTT berubah sebagaimana nilai berubah, yaitu PTT semakin besar jika nilai semakin besar. Simulasi grafik menunjukan bahwa grafik kuasa dari UT, RT, dan PTT ketika 0 adalah similar. 3.3.2
Size of the Tests Size of the tests (UT, RT, dan PTT) pada kasus ini disajikan pada Gambar 3 dibawah ini.
42
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
Gambar 2. Plot ukuran versus 2 . Berdasarkan Gambar 2, ukuran UT bernilai konstan karena tidak bergantung tehadap nilai 1 , 2 dan , sedangkan ukuran RT bergantung terhadap nilai 2 , RT bertambah besar ketika nilai 2 bertambah besar. PTT bergantung terhadap nilai 2 dan , dan tidak bergantung terhadap 1. Ukuran PTT bertambah besar ketika nilai 2 bertambah besar, demikian juga ketika nilai 0 . Gambar 3. adalah plot ukuran versus 1 untuk UT, RT dan PTT .
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
Gambar 3.
43
Ukuran dari UT, RT, dan PTT versus 1 dengan
2 0,1; 0, 4; 0,7; dan 1. Berdasarkan Gambar 3, nilai ukuran dari RT dan PTT bertambah kecil ketika nilai 2 semakin kecil, sedangkan ukuran uji dari UT selalu konstan. Ketika nilai 2 0, ukuran uji dari UT selalu lebih besar dari ukuran RT dan PTT. 3.3.3
H 0 : 0
Power and Size of the Tests
Grafik untuk kuasa dan ukuran uji dari UT, RT, dan PTT pada pengujian 0 versus H1 : 0 0 , dipaparkan pada Gambar 4-6 sebagai berikut.
44
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
Gambar 4. Kuasa dari UT, RT, dan PTT versus 1 dengan
2 0,0001; 0,0003; 0,0005; pada =0,4. Gambar 4. menunjukan bahwa pada kondisi 2 0 kurva UT tetap, sedangkan RT dan PTT naik sebagaimana 2 naik, dan PTT naik juga sebagaimna naik (lihat Gambar 5). Gap kurva PTT secara jelas terlihat bahwa PTT terletak antara RT dan UT.
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
45
Gambar 5. Kuasa dari PTT versus 1
Gambar 6. Ukuran dari UT, RT, dan PTT versus 2 dengan
0,1 dan 0,4
Berdasarkan Gambar 6 terlihat bahwa kurva size UT konstan, sedangkan RT dan PTT bergantung 2 . Gambar tersebut memperlihatkan secara jelas bahwa size RT maksimum dan lebih besar dari PTT, dimana size PTT terleta antara UT dan RT.
46
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana
Gambar 7. Ukuran dari UT, RT, dan PTT versus 1 dengan
2 0,0001; 0,0003; 0,0005; dan 0,0007. Gambar 7, pada 2 0, secara jelas menunjukan bahwa size RT maksimum dan size UT minimum, sedangkan size PTT terletak antara size RT dan UT.
4.
Kesimpulan
Pada pengujian one-side hypothesis minimum, H 0 : 0 0 versus H1 : 0 0 , dimana pada kondisi ini 2 0, secara jelas menunjukan bahwa power dan size RT maksimum, sedangkan power dan size UT minimum, sehingga PTT memproteksi kondisi maksimum power dan minimum size. Karena itu, PTT menjadi pilihan test yang relevan. Pada pengujian one-side hypothesis maksimum, H 0 : 0 0 versus H1 : 0 0 , dimana pada kondisi ini 2 0, secara jelas terlihat semua nilai power relatif kecil dan power dan size UT maksimum, sedangkan power dan size RT cenderung minimum, dan di sisi lain power dan size RT cenderung antara UT dan RT, sehingga PTT bisa memproteksi kondisi maksimum power dan minimum size. Karena itu, PTT bisa menjadi pilihan test. Karena kecilnya
Perbandingan Hasil Pengujian Intercept pada Uji Satu Arah …
47
nilai power, maka NSPI mempengaruhi nilai power dan sehingga berdampak pada proses pengambilan kesimpulan ini. Daftar Pustaka [1] Bancroft, T.A., 1944, “On Biases in Estimation Due to the Use of the Preliminary Tests of Significance”, Annals of Mathematical Statistics. 15, 190-204. [2] Han, C.P. dan Bancroft, T.A., 1968, “On Pooling Means When Variance Is Un-Known”, Journal of American Statistical Association, 63, 1333-1342. [3] Pratikno, B., 2012, Tests of Hypothesis for Linear Regression Models with Non Sample Prior Information, Dissertation, University of Southern Queensland. [4] Saleh, A. K. Md. E., 2006, Theory of Preliminary Test and Stein-Type Estimation with Applications, Wiley, New Jersey. [5] Saleh, A.K. Md. E. and Sen, P.K., 1978, “Nonparametric Estimation of Location Parameter after a Preliminary Tests on Regression”, Annals of Statistical, 6, 154-168.00 [6] Saleh, A. K. Md. E. and Sen, P.K., 1982, “Nonparametric Tests for Location after Parameter a Preliminary Tests on Regression”, Communication in Statistics-Theory and Methods, 12(16), 1855-1872. [7] Tamura, R., 1965, “Nonparametric Inferences with a Preliminary Test”, Bull. Math. Stat. 11, 38-61. [8] Yunus, R.M. and Khan, S., 2011, “Increasing Power of the Test Through Pre-Test – A Robust Method”, Communications in Statistics – Theory and Method, 40, 581-597.
48
Budi Pratikno, Suroto, Agus Suganda dan Arlinda Widiana