28
BAB III METODE THEIL
Analisis regresi merupakan suatu metode yang digunakan untuk menganalisis hubungan antara variabel bebas dan variabel terikat yang dinyatakan dalam sebuah persamaan regresi. Dalam analisis tersebut diberlakukan asumsiasumsi terhadap galat, salah satunya yaitu bahwa galat menyebar memenuhi distribusi normal dengan rata-rata nol dan varians tertentu. Apabila asumsi tersebut dipenuhi, maka penaksiran parameter dari persamaan regresi diselesaikan dengan menggunakan metode kuadrat terkecil (Ordinary Least Square). Tetapi dalam kenyataannya, data yang diperoleh dari hasil penelitian tidak selalu mengikuti distribusi normal. Sehingga diperlukan suatu metode statistika yang dapat digunakan dengan mengabaikan segala asumsi yang melandasi metode statistika parametrik, dan metode yang tepat adalah metode statistika nonparametrik. Salah satu metode statistika nonparametrik yang digunakan untuk menyelesaikan analisis regresi linear dengan kenormalan galat tidak dipenuhi adalah metode Theil. Metode Theil adalah salah satu metode statistika nonparametrik yang menaksir koefisien kemiringan (slope) garis regresi dengan cara mencari median kemiringan seluruh pasangan garis dari titik-titik variabel dan , dengan nilai yang berbeda. Pengujian koefisien slope (kemiringan) disusun berdasarkan
28
29
statistik Tau Kendall yang digunakan untuk mengetahui bentuk hubungan variabel-variabel dalam persamaan regresi. Analisis regresi dengan metode Theil dilandasi pada asumsi-asumsi sebagai berikut: (Daniel, 1989:448) a.
Persamaan regresinya adalah : = + + , = 1, 2, 3, … ,
dengan adalah variabel bebas, dan adalah parameter-parameter
yang tidak diketahui. b. c. d.
Untuk masing-masing nilai terdapat nilai . adalah nilai yang teramati dari Y.
Semua nilai berbeda (tidak ada angka yang sama) sehingga dapat ditetapkan < < < ⋯ < .
e.
Nilai-nilai saling bebas dan berdistribusi secara acak dengan median nol dan mempunyai hubungan saling bebas dengan .
3.1. Penaksiran Parameter Dengan Metode Theil Penaksiran Koefisien Slope ( )
3.1.1.
Theil telah mengusulkan sebuah metode untuk mendapatkan penaksir koefisien , jika asumsi kenormalan galat tidak terpenuhi. Dalam hal ini diasumsikan bahwa data sesuai dengan model regresi linear sederhana sebagai berikut: = + + , = 1, 2, 3, … ,
30
Semua nilai di sini berbeda (tidak ada angka sama) sehingga dapat ditetapkan < < < ⋯ < .
Data yang tersedia untuk dianalisis terdiri dari
pasangan nilai pengamatan yaitu , , , , , , … , , .
Untuk mendapatkan penaksir 1, pertama-tama hitung semua nilai .
Dengan adalah nilai slope (kemiringan) pasangan , dan , , yang dituliskan sebagai berikut
=
!" #
$! "$#
(3.1)
dengan < % dan ≠ .
Asumsikan nilai seluruhnya berbeda, lalu nilai tersebut diurutkan
dari urutan terkecil sampai terbesar. Sehingga dengan jelas = untuk seluruh dan %. Akan dibuktikan bahwa = =
− −− + − + − = = = = − − −− + − +
terbukti. Maka untuk pengamatan ada ( = = Akan dibuktikan bahwa = =
"
"
dari nilai yang berbeda.
.
! − 1 − 2 − 3 … 3 2 1 − 1 (=) *= = = 2 2! − 2! 1×2 2! − 2 − 3, … 3 2 1 =
− 1 2
Untuk lebih jelasnya nilai-nilai yang akan dihitung dari pengamatan dapat ditulis dalam bentuk matriks segitiga atas sebagai berikut :
31
/ . = . . -
0 0 0
⋯⋯ ⋯⋯ ⋯⋯ ⋯⋯ ⋯⋯
4 3 3 ⋮ 3 " 2
Penaksir 1 yang baik untuk akan menjadi nilai galat yang sesuai dengan
masing-masing nilai pengamatan dan dinotasikan dengan = – – ,
dan nilai galat akan mempunyai median nol serta mempunyai hubungan yang
saling bebas dengan . Sehingga untuk mendapatkan penaksir 1 dengan metode
Theil pada dasarnya adalah dengan membuat jumlah konkordan (6 sama
dengan jumlah diskordan (7 pada data pasangan , . Statistik yang digunakan adalah 89 ( 1) = ∑ ;<=< ± [= ], = 1, 2, … , − 1 =< % >
(3.2)
dengan = = − − − − − = − − −
= − − − Dimana
+ 1, % D< = > 0 ;<=< B= C = 0, % D< = = 0 − 1, % D< = < 0 Keterangan: = 89 ( 1)
= Selisih nilai galat dengan = Jumlah tanda dari konkordan (6 dikurangi diskordan (7 pada data berpasangan , .
32
Untuk mendapatkan penaksir 1 dilakukan dengan cara membuat 89 ( 1) = 0, karena jumlah tanda konkordan sama dengan jumlah tanda diskordan. Sehingga dapat disimpulkan nilai galat dan saling bebas . Jika disusun dari yang
terkecil sampai terbesar, maka dapat mengganti = dengan – . dengan – =
=
!" #
$! "$#
–
! " # " G 1 $! "$# $! "$#
(3.3)
Sehingga 89 ( 1) = ∑ ;<=< ± [ – ], = 1, 2, … , − 1 =< % >
(3.4)
Dimana + 1, % D< – > 0 ;<=< B – C = 0, % D< – = 0 − 1, % D< – < 0 Pembilang pada persamaan (3.3) di atas mempunyai nilai yang sama dengan = . Sehingga dengan mengganti = dengan − .tidak akan
mempengaruhi tanda = , karena penyebut − selalu bernilai positif
yaitu jika nilai disusun dari yang terkecil sampai terbesar dengan < % =< ≠ .
Untuk mendapatkan 89 ( 1) = 0 maka dipilih = HI= < ,
sehingga memungkinkan setengah pasangan konkordan dan setengahnya lagi diskordan. Jika jumlah tanda positif (konkordan) dan negatif (diskordan) sama
33
(6 = (7 , maka akan menyebabkan nilai koefisien korelasi Tau Kendall antara
dan sama dengan nol, artinya dan saling bebas.
Penaksir untuk ditulis dengan lambang , yang dihitung berdasarkan
median dari dengan mengurutkan nilai dari terkecil sampai terbesar yang
berjumlah (. Jika ( genap maka dapat ditulis ( = 2J dan ( = 2J + 1 jika ( ganjil. Sehingga penaksir dari koefisien slope ( 1) dapat dinyatakan sebagai
berikut : LM , ( = 2J + 1 N = K + , ( = 2J L LM dengan: J =
(3.5)
O
atau 1 dapat ditulis seperti berikut :
= HI= <
(3.6)
Contoh 3.1 Seseorang mengamati kecepatan air mengalir dalam meter kubik per detik () di titik tertentu di sebuah pegunungan yang dicatat dalam interval waktu () yang dimulai dengan P = 0, sehingga didapatkan data sebagai berikut : X Y
0 2,5
1 3,1
2 3,4
3 4,0
4 4,6
5 5,1
6 11,1
Sumber : P. Sprent dan N.C. Smeeton, Applied Nonparametric Statistikal Methods, edisi ketiga, Florida: CRC Press, 2001. Gunakan metode Theil untuk menaksir koefisien slope pada data tersebut!
34
Penyelesaian : Pertama-tama diurutkan nilai dari kecil ke besar kemudian menghitung banyak nilai yang harus dihitung dari data yaitu:
− 1 77 − 1 42 ( = ) * = = = = 21 2 2 2 2
Jadi banyak nilai yang harus dihitung ada 21, selanjutnya akan dihitung nilai-
nilai sebagai berikut: = = 0 =
− 3,1 − 2,5 = = 0,6 − 1 − 0
− 3,4 − 2,5 = = 0,45 2 − 0 − 0 − 4,0 − 2,5 = = 0,5 0 − 3 − 0
dan apabila dilanjutkan terus dengan cara ini, hasilnya dapat ditulis dalam bentuk matrik sebagai berikut: / . . = . . . -
/ . = . . . -
0,6 0,45 0,3
0 0 0
U U U 0U
V V V 0V UV
W 4 W 3 W 3 0W 3 3 UW 3 VW 2
0,5 0,525 0,52 0,45 0,5 0,5 0,6 0,6 0,567 0,55 0,6 0,5
1,43 1,6 4 3 1,9253 2,3673 3,25 3 6 2
35
Tabel 3.1. Nilai Setelah Diurutkan M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
b(M) 0,3 0,45 0,45 0,5 0,5 0,5 0,5 0,52 0,525 0,55 0,567 0,6 0,6 0,6 0,6 1,433 1,6 1,925 2,367 3,25 6
karena ( = 2J + 1 = 21
J = 10
Maka = J + 1 = 11 = 0,567 3.1.2. Penaksiran Intercept (Y )
Setelah penaksir telah diperoleh maka persamaan regresinya berbentuk
sebagai berikut: = + , = 1, 2, … ,
(3.7)
36
Penaksir
dari
intercept
dinotasikan
dengan
,
dengan
mensubstitusikan dengan Z maka persamaan yang diperoleh sebagai berikut: = Z + , = 1, 2, … ,
(3.8)
Z = −
(3.9)
Penaksir dihitung berdasarkan nilai median dari seluruh nilai Z ,
dengan mengurutkan nilai Z dari terkecil sampai terbesar yang berjumlah , dengan = 1, 2, … , . Jika genap dapat ditulis = 2[ dan = 2[ + 1 jika ganjil, maka penaksir dari intercept () diberikan sebagai berikut : Z\M , = 2[ + 1 N = K Z + Z , = 2[ \ \M
(3.10)
atau dapat ditulis seperti berikut = HI= < Z
(3.11)
Berdasarkan persamaan (3.6) dan (3.11), maka diperoleh persamaan model regresinya berbentuk ] = + . Contoh 3.2 Dengan menggunakan data Contoh 3.1 tentukan penaksir dari Intercept ()! Penyelesaian: Menghitung nilai Z = − , dan didapatkan hasil seperti pada tabel di bawah ini :
37
Tabel 3.2 Nilai Z X
Y
Z = −
0
2,5
2,5
1
3,1
2,533
2
3,4
2,266
3
4
2,299
4
4,6
2,332
5
5,1
2,265
6
11,1
7,698
Selanjutnya nilai-nilai Z dari tabel diatas diurutkan dari kecil ke besar dan hasilnya dapat dilihat pada tabel dibawah ini: Tabel 3.3 Nilai Z Setelah Diurutkan No 1 2 3 4 5 6 7
Karena jumlah Z ganjil maka : = 2[ + 1 7 = 2[ + 1 [=
7−1 =3 2
sehingga = Z\M = Z4 = 2,332
Z
2,265 2,266 2,299 2,332 2,5 2,533 7,698
38
3.2.
^ ) Pengujian Koefisien Slope ( Pengujian koefisien slope (kemiringan) dengan menggunakan metode
Theil disusun berdasarkan statistik Tau Kendall untuk mengetahui bentuk hubungan variabel-variabel dalam persamaan regresi. Langkah-langkahnya adalah: 1.
Perumusan Hipotesis _ : = 0
(Koefisien regresi 1 tidak signifikan)
_ ∶ ≠ 0 (Koefisien regresi 1 signifikan) 2.
Besaran-besaran yang Diperlukan a. Mengatur pasangan-pasangan hasil pengamatan , − dalam sebuah kolom dengan urutan dari nilai terkecil sampai terbesar menurut nilai .
b. Membandingkan masing-masing − dengan setiap − yang ada di bawahnya. c. Menetapkan (6 sebagai banyak perbandingan − , − yang berurutan wajar (dari terkecil sampai terbesar), dan menetapkan (7 sebagai banyak perbandingan seperti di atas yang berurutan terbalik (dari terbesar sampai terkecil). d. Misalkan 89 = (6 – (7 . 3.
Statistik Uji a.
Jika tidak ada nilai dan yang sama, maka statistik ujinya:
b̂ =
Od " Oe
" /
=
gh
" /
(3.12)
39
Dengan b̂ : Statistik uji τ Kendall.
(6 : Banyak pasangan berurutan wajar.
(7 : Banyak pasangan berurutan terbalik.
: Banyak pasangan yang diamati. 89 : Selisih antara (6 dan (7 .
b.
Jika ada nilai atau yang sama, maka statistik ujinya: i.
Untuk nilai dan ada yang sama
b̂ =
gh
j k
j k
i " "gl i " "gm
(3.14)
(3.15)
dengan: 8n = ∑o p ;n (;n − 1) 8q = ∑o p ;q (;q − 1) ;n
(3.13)
: Banyak nilai yang sama untuk suatu peringkat.
;q : Banyak nilai yang sama untuk suatu peringkat. ii.
Untuk nilai ada yang sama Seperti telah diuraikan di atas bahwa semua nilai berbeda sehingga 8n = 0, maka persamaan (3.13) dapat menjadi :
b̂ =
j k
gh j k
i (" )i (" )"gm
(3.16)
40
4.
Kriteria Pengujian Dengan mengambil taraf nyata r, dari Tabel Tau Kedall dengan dan
r ⁄2 diperoleh b ∗ . _ ditolak, jika b̂ (untuk b̂ positif) > b ∗ atau b̂ (untuk b̂ negatif) < b ∗ .