ANALISIS REGRESI LINEAR PADA STATISTIKA NON PARAMETRIK
Desi Rahmatina Fakultas Ekonomi Universitas Maritim Raja Ali Haji Tanjungpinang
ABSTRAK Penelitian ini mengkaji analisis regresi linear pada statistika non parametrik. Metode Theil digunakan untuk mengestimasi parameter pada regresi linear sederhana. Data yang digunakan dalam penelitian ini adalah data volume dan harga saham pada PT Bank Rakyat Indonesia dari bulan januari sampai agustus 2010. Hasil penelitian menunjukkan bahwa nilai P= 0,0238 < 0,025, artinya model ini bisa digunakan untuk menyatakan hubungan antara variabel volume saham (x) dan harga saham(y) dan terdapat pengaruh signifikan variabel volume terhadap harga saham. Kata Kunci: Analisis regresi, statistika non parametric, metode theil.
ABSTRACT The research to study regression analysis on non parametric statistics. Theil Method used to estimates parameter on simple regression linear. The data used in the research is volumn and stock value at PT.Bank Rakyat Indonesia from January to August ,2010. The result the research show that p-value is 0,0238 < 0,025, it’s mean that the model can use to state correlation between volumn variable with stock value and the are effect significant volumn to stock value.
Key
Words:
Regression
analisis,non
parametric
statistics,
Theil
methohs. ____________________________________________________________________
1
I.PENDAHULUAN Analisa regresi adalah Analisis statistik yang mempelajari bagaimana membangun sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu fenomena alami atas dasar fenomena yang lain. Analisa regresi merupakan salah satu teknik statistik yang digunakan secara
luas
dalam
ilmu
pengetahuan
terapan.
Regresi
di
samping
digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan untuk peramalan. Dengan
menggunakan
n
pengamatan
untuk
suatu
model
linier
sederhana: Y =a+bX +ei dengan Y X
adalah peubah tidak bebas
adalah peubah bebas (variabel) bebas
A dan
b adalah parameter-parameter yang tidak diketahui
ei adalah Disturbance error (kesalahan penganggu)
Y
Y
X
Y X X
Diberlakukan asumsi-asumsi model ideal tertentu terhadap galat e yaitu
bahwa
galat
menyebar
NID
(0,𝜎2
).
Dengan
pemenuhan
terhadap
asumsi kenormalan dapat digunakan regresi parametrik untuk mengetahui bentuk hubungan antar peubah regresi pada data contoh yang diamati. Dalam praktek, penyimpangan terhadap asumsi-asumsi itu sering terjadi dan terkadang peubah acak yang diamati tidak dapat dianggap menyebar normal.
Dari
segi
statistika
persoalan
tersebut
harus
dapat
diselesaikan dengan menggunakan teknik statistika. Dalam statistika parametrik, teknik-teknik yang digunakan berhubungan dengan pendugaan parameter serta pengujian hipotesis yang berhubungan dengan parameter-
2
parameternya.
Asumsi-asumsi
yang
digunakan
pada
umumnya
menspesifikasikan bentuk sebarannya. Salah satu analisis alternatif lain yang dapat digunakan adalah dengan regresi nonparametrik karena dalam regresi nonparametrik tidak diperlukan
pemenuhan
asumsi
kenormalan.
Dalam
kenyataanya,
penyimpangan terhadap asumsi-asumsi itu sering terjadi dan terkadang peubah acak yang diamati tidak dapat dianggap menyebar normal. Dari segi
statistika
persoalan
tersebut
harus
dapat
diselesaikan
dengan
menggunakan teknik statistika. Dalam statistika parametrik, teknikteknik
yang
pengujian
digunakan
hipotesis
berhubungan
yang
dengan
berhubungan
pendugaan
dengan
Jadi identifikasi masalah pada penelitian
parameter
serta
parameter-parameternya.
ini adalah untuk mengetahui
penyelesaian model regresi dengan statistika non-parametrik. II. RUMUSAN MASALAH Berdasarkan latar belakang permasalahan di atas, maka rumusan masalah dalam penelitian ini adalah: 1. Bagaimanakah
cara
memperoleh
model
analisis
regresi
pada
statistika non parametrik, 2. Bagaimanakah cara pengujian model regresi pada statistika non parametrik,
III. TUJUAN PENELITIAN Adapun tujuan penelitian adalah : 1. Untuk memperoleh model analisis regresi linear pada statistika non parametric. 2.
Membuat pengujian model regresi linear
IV. LANDASAN TEORI Regresi
Linear
digunakan
untuk
membentuk
model
hubungan
antara
variabel bebas X dengan variabel terikat Y, dimana hubungan antar variabel tersebut linear. 3
Secara matematis, model regresi linear dapat ditulis sebagai berikut: 𝑚
𝑌 = 𝑎 + ∑ 𝑏𝑗 𝑋𝑗 + 𝑒 𝑗=1
dimana; 𝑎 = konstanta 𝑋𝑗 = Variabel bebas ke j 𝑏𝑗 = Koefisien variabel bebas 𝑋𝑗 terhadap variabel terikat Y. 𝑒 = nilai galat Jika model regresi hanya dibentuk oleh satu variabel bebas X, maka persamaan regresi menjadi: 𝑌 = 𝑎 + 𝑏𝑋 + 𝑒 Persamaan regresi di atas dinamakan persamaan regresi linear sederhan (simple regression linear). Sedangkan jika banyak variabel bebas lebih dari
satu
dinamakan
persamaan
regresi
linear
berganda
(multiple
linear regression), sehingga bentuk persamaannya menjadi 𝑌 = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2 + 𝑏3 𝑋3 + ⋯ + 𝑏𝑗 𝑋𝑗 + 𝑒 Metode statistik nonparametrik merupakan metode statistik yang dapat
digunakan
dengan
mengabaikan
asumsi-asumsi
yang
melandasi
penggunaan metode statistik parametrik, terutama yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistik nonparametrik adalah statistik bebas distribusi. Perbandingan Kekurangan apakah
itu
statistik
dan
kelebihan
menggunakan
nonparametrik setiap
dan
pemilihan
nonparametrik
statistik prosedur
atau
parametrik.
pengujian
parametrik
data,
memiliki
kelebihan dan kekurangan masing-masing. Berikut adalah kelebihan dan kekurangan masing-masing prosedur :
4
Kelebihan
statistik
nonparametrik
dibandingkan
dengan
statistik
parametrik ialah : 1. Asumsi yang digunakan minimum sehingga mengurangi kesalahan penggunaan. 2. Perhitungan dapat dilakukan dengan cepat dan mudah. 3. Konsep dan metode nonparametrik mudah dipahami bahkan oleh seseorang dengan kemampuan matematik yang minim. 4. Dapat diterapkan pada skala peubah kualitatif (nominal dan ordinal). Kekurangan
statistik
nonparametrik
dibandingkan
dengan
statistik
parametrik ialah : 1.
Bila
digunakan
statistika
pada
data
parametrik
yang
maka
dapat
hasil
diuji
menggunakan
pengujian
menggunakan
statistik nonparametrik menyebabkan pemborosan informasi. 2.
Pekerjaan
hitung-menghitung
(aritmetik)
karena
memerlukan
ketelitian terkadang menjemukan. Prosedur nonparametrik digunakan sebaiknya : 1. Bila
hipotesis
yang
diuji
tidak
melibatkan
suatu
parameter
populasi. 2. Bila data telah diukur menggunakan skala nominal atau ordinal. 3. Bila asumsi-asumsi yang diperlukan pada suatu prosedur pengujian parametrik tidak terpenuhi. 4. Bila penghitungan harus dilakukan secara manual Misalkan
ada
n
pasangan
pengamatan,
(X2,Y2),…..,(Xn,Yn), dengan X1 < X2 < X3 < ….<Xn.
katakan
(X1,Y1
),
Theil (1950) dalam
Sprent (1991) mengusulkan koefisien kemiringan (slope) garis regresi sebagai median kemiringan dari seluruh pasangan garis dari titik-titik dengan nilai X yang berbeda, selanjutnya disebut dengan metode Theil. Untuk
satu
pasangan
(Xi,Yi
)
dan(Xj,Yj
adalah : 𝑏𝑖𝑗=
𝑦𝑗− 𝑦𝑖 𝑥𝑗− 𝑥𝑖
untuk i < j dan xi ≠xj .
5
)
koefisien
kemiringannya
Penduga bagi dari nilai-nilai
b
dinotasikan dengan B dinyatakan sebagai median
bij sehingga
diperoleh:
B = median (b ij ) sedangkan penduga pada a adalah A dengan A = med (Yi) – B med(Xi) med(Xi)
adalah median dari seluruh pengamatan dan med(Yi) adalah
pasangan nilai pengamatan untuk med(Xi) (Sprent,1991). Untuk menguji koefisien regresi digunakan statistic uji: 𝜏 − 𝜇𝑇 𝑧= 𝜎𝑇 dimana; 𝜇𝑇 = 0 2(2𝑛 + 5) 𝜎𝑇 = √ 9𝑛(𝑛 − 1) 𝜏 = 𝐾𝑜𝑒𝑓𝑖𝑠𝑖𝑒𝑛 𝐾𝑒𝑛𝑑𝑎𝑙𝑙 𝑇𝑎𝑢 Hipotesis yang digunakan untuk menguji signifikansi koefisien regresi adalah sebagai berikut: atau tidak terdapat pengaruh variabel x dan y
𝐻0 : 𝐵 = 0
𝐻1 : 𝐵 ≠ 0 atau terdapat pengaruh signifikan variabel x dan y Keputusan pengujian: Tolak Ho jika p < 0,05, terima dalam hal lain. V. METODOLOGI PENELITIAN Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu berupa data laporan keuangan PT Bank Rakyat Indonesia dalam Bursa Efek Indonesia. Sprent
dan
Dalam
penelitian
Smeeton(
2001)
seefisien
metode
kuadrat
terpenuhi.
Metode
Theil
untuk
mengestimasi
regresi
linier
ini
peneliti
berpendapat terkecil
adalah
data
metode
sampel
bahwa
jika
parameter-parameter
dengan
menggunakan metode
asumsi
yang
Theil.
Theil
hampir
kenormalan
nonparametrik dan
metode
yang
menganalisis
teramati
error
digunakan
garis-garis
dikarenakan
error
tidak menyebar normal. Data diperoleh dengan cara mengakses alamat website perusahaan untuk melihat volume dan harga saham PT Bank Rakyat Indonesia selama periode januari sampai desember 2010 dalam website
6
Indonesian
Stock
Exchange
(IDX)
pada
pelaporan
entitas
untuk
memperoleh data berupa laporan tahunan perusahaan. Variabel yang digunakan dalam penelitian adalah volume saham sebagai variabel
independen
dan
harga
saham
sebagai
variabel
independen.
Volume saham dinyatakan dalam Thous.Sh, sedangkan pada variabel harga saham
dinyatakan
jumlah
data
dalam
sampel
Milyar
kecil,
Rp.
maka
Pada
dalam
berupa laporan bulanan selama 10 bulan di
Statistika
penelian
ini
non
parametrik
diambil
sampel
tahun 2010.
VI. HASIL PENELITIAN Data di bawah ini menunjukkan volume dan harga saham pada PT Bank Rakyat Indonesia. Tabel 1. Trading Activities PT BRI
pada tahun
2010 Bulan
Volume(Thous.Sh) Harga (Milyar Rp)
Januari
340,767
2,662,527
Februari
348,268
2,560,878
Maret
615,677
4,736,692
April
530,633
4,529,233
Mei
469,303
3,908,927
Juni
321,511
2,873,248
Juli
337,411
3,259,346
Agustus
447,646
4,199,651
Sumber : Bursa Efek Indonesia Data pada varibel x diurutkan dari terkecil sampai terbesar kemudian diikuti oleh variabel y, seperti berikut;
7
Tabel 2. Data variabel x setelah diurutkan. x
y
321.511 2.873.248 337.411 3.259.346 340.767 2.662.527 348.268 2.560.878 447.646 4.199.651 469.303 3.908.927 530.633 4.529.233 615.677 4.736.692 Banyaknya bij yang harus dihitung dari 8 data adalah 𝐶28 =
8.7 = 28 2
Nilai nilai bij adalah sebagai berikut: 𝑌 −𝑌
386.098
𝑏12 = 𝑋2 −𝑋1 = 15.900 = 24,28 2
1
𝑏13 =
𝑌3 −𝑌1 𝑋3 −𝑋1
=
−210,721 =-10,94 19.256
𝑏14 =
𝑌4 −𝑌1 𝑋4 −𝑋1
=
−312,370 =-11,67 26.757
Dan apabila dilanjutkan terus dengan cara ini, hasilnya dapat ditulis sebagai berikut:
8
Tabel 3. Nilai bij. no 1 2 3 4 5 6 7 8 9 10 11 12 13 14
bij 24,28 -10,94 -11,67 10,52 7,01 7,92 6,33 -177,84 -64,33 8,53 4,93 6,57 5,31 -13,55
no 15 16 17 18 19 20 21 22 23 24 25 26 27 28
bij 14,38 9,70 9,83 7,54 16,49 11,14 10,79 8,14 -13,42 3,97 3,20 10,11 5,66 2,44
Nilai bij setelah diurutkan adalah sebagai berikut: Tabel 4. Nilai bij setelah diurutkan dari terkecil sampai terbesar. M
b(M)
M
b(M)
1
-177,84
15
7,01
2
-64,33
16
7,54
3
-13,55
17
7,92
4
-13,42
18
8,14
5
-11,67
19
8,53
6
-10,94
20
9,7
7
2,44
21
9,83
8
3,2
22
10,11
9
3,97
23
10,52
10
4,93
24
10,79
11
5,31
25
11,14
12
5,66
26
14,38
13
6,33
27
16,49
14
6,57
28
24,28
9
𝐵 = 𝑏28+1 = 𝑏14,5 = 2
𝑏14 + 𝑏15 6,57 + 7,01 = = 6,79. 2 2
Setelah penaksir B telah diperoleh maka persamaan regresinya berbentuk 𝑌𝑖 = 𝐴 + 𝐵𝑥 Penaksir dari intersept A dengan cara mensubstitusikan A dengan Di sehingga persamaan yang diperoleh sebagai berikut: 𝑌𝑖 = 𝐷𝑖 + 𝐵𝑥𝑖 ,
𝑖 = 1,2, … 𝑛
𝐷𝑖 = 𝑌𝑖 − 𝐵𝑥𝑖 , Penaksir A dihitung berdasarkan nilai median dari seluruh nilai Di, dengan
mengurutkan
nilai
Di
dari
terkecil
berjumlah n, dengan i=1,2,3,,,,n. JAdi
sampai
terbesar
yang
A = median (Di). Berdasarkan
hasil perhitungan sebelumnya diperoleh nilai Di seperti pada tabel dii bawah ini, Tabel 5. Hasil perhitungan Di x 321.511 337.411 340.767 348.268 447.646 469.303 530.633 615.677
y 2.873.248 3.259.346 2.662.527 2.560.878 4.199.651 3.908.927 4.529.233 4.736.692
Selanjutnya nilai nilai
𝐷𝑖 = 𝑌𝑖 − 𝐵𝑥𝑖 , 690.188 968.325 348.719 196.138 1.160.135 722.360 926.235 556.245 Di dari tabel di atas diurutkan dari terkecil
sampai terbesar dan hasilnya dapat dilihat pada tabel di bawah ini:
10
Tabel 6. Nilai Di setelah diurutkan No 1 2 3 4 5 6 7 8
𝐷𝑖 196.138 348.719 556.245 690.188 722.360 926.235 968.325 1.160.135
Sehingga nilai A adalh nilai median dari Di, sehingga diperoleh nilai A sebagai berikut: 𝐴 = 𝐷8+1 = 𝐷4,5 = 2
690.188 + 722.360 1.412.548 = = 706,27 2 2
Sehingga didapat model persamaan regresinya adlah sebagai berikut; ̂ = 706,27 + 6,79𝑋𝑖 𝑌𝑖 Artinya: 1. Variable Y dalam hal ini adalah harga saham rata rata sebesar Rp.706,27 Milyar dengan anggapan variabel lainnya konstan. 2. Setiap
penambahan
1
satuan
avriabel
X
maka
Y
akan
bertambah
sebesar 6,79 satuan. Akan tetapi model regresi di atas belum dapa dikatakan sebagai model regresi
terbaik.
Untuk
itu
perlu
diuji
apakah
model
berarti/signifikan atau tidak dengan cara uji signiikan. Untuk menguji koefisien regresi digunakan statistic uji: 𝜏 − 𝜇𝑇 𝑧= 𝜎𝑇 dimana; 𝜇𝑇 = 0
11
koefisiennya
Nilai 𝜏 dapat dilihat dari output SPSS di bawah ini, Tabel 7. Nilai korelasi kendall tau Correlations
Kendall's
volume Correlation
tau_b
volume
harga
1.000
.571*
Coefficient
harga
Sig. (2-tailed) .
.048
N
8
8
Correlation
.571*
1.000
Coefficient Sig. (2-tailed) .048
.
N
8
8
*. Correlation is significant at the 0.05 level (2-tailed).
Berdasarkan output di atas, diperoleh
nilai
𝜏= 0,571.
dan nilai 2(2𝑛+5) 9𝑛(𝑛−1)
𝜎𝑇 = √
2(2.8+5) 9.8(8−1)
=√
2(21) 72(7)
=√
42 504
=√
= √0,0833 = 0,289.
Sehingga diperoleh nilai z di bawah ini; 𝑧=
𝜏 − 𝜇𝑇 0.571 − 0 = = 1,976. 𝜎𝑇 0,289
𝛼⁄ = 0,025. 2 Hipotesis yang digunakan untuk menguji signifikansi koefisien regresi P(Z=1,976) = 0,0238.
adalah sebagai berikut: 𝐻0 : 𝐵 = 0
atau tidak terdapat pengaruh variabel volume
terhadap harga
saham 𝐻1 : 𝐵 ≠ 0
atau
terdapat
pengaruh
signifikan
variabel
volume
terhadap
harga saham, karena nilai P= 0,0238 < 0,025, maka Ho ditolak artinya model ini bisa digunakan untuk menyatakan hubungan antara variabel volume saham (x) dan harga saham(y) atau terdapat pengaruh signifikan 12
variabel volume terhadap harga saham. Cara lain untuk melihat uji signifikansi adalah berdasarkan output SPSS di atas, dari nilai sig = 0,048 < 0,05, sehingga Ho ditolah dan H1 diterima. VII. KESIMPULAN DAN SARAN Berdasarkan pembahasan sebelumnya mengenai penggunaan regresi non parametric di atas, maka disimpulkan bahwa: 1. Koefisien
kemiringan
(slope)
garis
regresi
adalah
median
kemiringan dari seluruh pasangan garis dan titik-titik dengan nilai X yang berbeda. B = median(bij), dimana satu untuk pasangan (Xi,Yi) dan (Xj,Yj) maka koefisien kemiringannya adalah: 𝑦𝑗− 𝑦𝑖
𝑏𝑖𝑗= 𝑥
𝑗− 𝑥𝑖
,
untuk i < j dan xi ≠xj .
Penduga B dihitung dengan mencari median dari seluruh Di dengan rumus Di adlah sebagai berikut: 𝐷𝑖 = 𝑌𝑖 − 𝐵𝑥𝑖 , A = median (Di) 2. Penguujian koefisien slope (B) dengan menggunakan metode Theil dibuat berdasarkan korelasi kendall Tau. 3. Model regresi linear sederhana nonparametric dengan menggunakan metode Theil yang diperoleh dari volume dan harga saham adalah sebagai berikut: ̂ = 706,27 + 6,79𝑋𝑖 𝑌𝑖
13
Artinya: 1. Variable Y dalam hal ini adalah harga saham rata rata sebesar Rp.706,27 Milyar dengan anggapan variabel lainnya konstan. 2. Setiap
penambahan
1
satuan
avriabel
X
maka
Y
akan
bertambah
sebesar 6,79 satuan. Berdasarkan hsil kesimpulan yang telah dijelaskan di atas, maka peneliti memberikan saran sebagai berikut: 1.
Dalam
melakukan
analisis
regresi
linear
non
parametrik
disarankan menggunakan data dengan variabel x (bebasnya) tidak kembar untuk mendapatkan semua nilai slope bij dari n buah data. 2.
Disarankan metode regresi
untuk
statistika linear
dapat
mengkaji
nonparametric
dengan
data
yang
lebih untuk
lanjut
beberapa
mencocokkan
diamati
seperti
garis metode
iterative Brown-Mood dan metode Weight Medians. DAFTAR PUSTAKA Daniel,W.W. 1989. Statistika Nonparametrik Terapan, Gramedia, Jakarta. David J. Sheskin,2004. Parametric and nonparametric Statistical procedures, third Edition. Chapman & HalVCRC. United States of America. Ngadiman,Titty dkk.2005.Statistika Tak Parametrik. Bandung A Non Parametric Linear Regression With TheiL’s Methods. Internet
14