BAB 1
PENDAHULUAN
1.1 Latar Belakang
Metode analisis yang telah dibicarakan hingga saat ini adalah analisis terhadap data mengenai sebuah karakteristik atau atribut dan mengenai sebuah variabel diskrit atau kontiniu. Tetapi, sebagaimana disadari, banyak persoalan atau fenomena yang meliputi lebih dari sebuah variabel. Misalnya, berat orang dewasa laki laki sampai taraf tertentu bergantung pada tingginya, tekanan semacam gas bergantung pada temperatur, hasil produksi padi tergantung pada jumlah pupuk yang digunakan, banyak curah hujan, cuaca dan sebagainya. Akibatnya terasa perlu untuk mempelajari analisis data yang terdiri atas banyak variabel. Jika peneliti mempunyai data yang terdiri atas dua variabel atau lebih, sewajarnya untuk mempelajari cara bagaimana variabel variabel itu berhubungan. Hubungan yang didapat pada umumnya dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsional antara variabel variabel. Studi yang menyangkut masalah ini dikenal dengan istilah analisis regresi.
Universitas Sumatera Utara
Analisis regresi di bedakan atas dua jenis variabel yaitu variabel bebas dan variabel terikat. Penentuan variabel bebas dan terikat dalam beberapa hal tidak mudah dilaksanakan.
Studi
yang
cermat,
diskusi
yang
seksama,
berbagai
pertimbangan,kewajaran masalah yang dihadapi dan pengalaman akan memudahkan penentuan. Sedangkan variabel yang mudah didapat atau tersedia sering digolongkan kedalam variabel bebas, sedangkan variabel yang terjadi karena variabel bebas itu merupakan variabel terikat. Untuk keperluan analisis, variabel bebas akan dinyatakan dengan X 1, X 2 , ... , X k ( k≥1), sedangkan variabel terikat akan dinyatakan dengan Y.
Statistika bermaksud menyimpulkan populasi yang pada umumnya dengan menggunakan hasil analisis data sampel. Khusus mengenai regresi dalam menentukan hubungan fungsional yang diharapkan berlaku untuk populasi berdasarkan data sample yang diambil dari populasi yang bersangkutan. Seperti dikatakan diatas hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematika yang disebut persamaan regresi dan bergantung pada parameter- parameter.
Regresi linier merupakan suatu metode analisis statistika yang mempelajari pola hubungan antara dua atau lebih variabel. Pada kenyataan sehari hari sering dijumpai sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karena itu dikembangkan analisis multiple regresi. Multiple regresi adalah perluasaan dari simple regresi yang mempunyai lebih dari satu variabel bebas X. Multiple regresi digunakan untuk memodelkan hubungan antara variabel terikat dan variabel bebas. Untuk mendapatkan estimasi β 0, β 1 , ... , β k digunakan metode maksimum likelihood, dimana metode ini secara prinsip dapat meminimumkan jamlah kuadrat kesalahaan.
Suatu cara yang penting untuk mendapat penaksir yang baik adalah metode maksimum likelihood, yang diperkenalkan oleh seorang ahli genetika dan statistik ir R.a Fishier antara tahun 1912 sampai 1922 dan memiliki aplikasi yang luas di berbagai bidang. Cara memaksimumkan likelihood berkaitan dengan metode estimasi dalam statistik. Estimasi maksimum likelihood berguna untuk menentukan parameter
Universitas Sumatera Utara
yang memaksimalkan kemungkinan dari data sample. Dari sudut pandang statistik, metode maksimum likelihood ini dianggap lebih kuat pada hasil estimator dengan sifat statistik. Selain itu, metode ini juga lebih efisien untuk ketidakpastian pengukuran melalui batas keyakinan. Meskipun metodologi untuk estimasi maksimum likelihood sangat sederhana namun pelaksanaan matematiknya sangat kuat. Parameter yang diperoleh dari fungsi estimasi maksimum likelihood merupakan nilai yang sebenarnya. Jelas bahwa ukuran sample menentukan ketelitian dari estimator, jika ukuran sample sama dengan populasi, maka estimator memiliki sifat tidak bias, kosisten dan efisien.
1.2 Perumusan Masalah
Dalam penelitian ini penulis menggunakan buku buku berikut sebagai sumber utama, diantaranya: 1. Sopranto, Apabila variabel mempunyai hubungan linier dengan n buah variabel X, maka model matematika multiple regresinya adalah:
Y= β 0 + β 1 X 1 + β 2 X 2 + ^ + β k X k + ε Dimana: Y
= variabel terikat
X 1 , ... , X k
= variabel bebas pada variabel ke 1 sampai variabel ke k
β 0, β 1 , ..., β K = parameter regresi ε
= nilai kesalahaan
2. wannacott, T.H dan wannacott, R.J : Jika X dikurangi dengan rata-ratanya, maka akan, diperoleh variabel baru x (x i = X i -
). Dan persamaan multiple
regresinya menjadi:
Universitas Sumatera Utara
Yi = β 0 + β 1 X 1i + β 2 X 2i + ^ + β k X ki + ε
Dimana: Y
= variabel terikat
X 1i , ... , X ki
= variabel bebas pada variabel ke 1 sampai variabel ke k
β 0, β 1 , ..., β K = parameter regresi ε
= nilai kesalahaan
Secara umum, andaikan peneliti mempunyai sampel berukuran n buah peneliti ingin mengetahui kemungkinan
sampel yang diamati. Diperlihatkan fungsi nilai
kemungkinan untuk β 0, β 1 , ..., β K : p(Y 1, Y 2 , ..., Y n / β 0, β 1 , ..., β K). Untuk nilai Y bebas dengan mengalikan semua kemungkinan bersama, dimana: p(Y 1, Y 2 , ..., Y n / β 0, β 1 , ..., β K ) Y − ( β 0 + β1 x1i ++ β k xki ) 1 −1 1 2 σ e = σ 2π
2
Y − ( β 0 + β1 x1i ++ β k xki ) 1 −1 2 2 σ e σ 2π
Y − ( β 0 + β 1 x1i ++ β k x ki ) −1 i 1 2 σ e = ∏ i =1 σ 2π n
2
2
...
n
Dengan
∏
Mengatakan hasil kali n kemungkinan bersama untuk nilai Y i yang
i =1
penggunaannya dikenal untuk eksponensial. Hasil diatas dapat diperlihatkan dengan penjumlahaan eksponen: Yi − ( β 0 + β 1 x1i ++ β k x ki ) σ
1 i∑=1(− 12 ) p(Y1 , Y2 ,..., Yn β 0 , β1 ,..., β k ) = e σ 2π n
n
2
Mengingat Y i amatan yang diberikan dipertimbangkan untuk berbagai nilai β 0, β 1, ..., β k . Sehingga persamaan di atas di namakan fungsi likelihood:
Universitas Sumatera Utara
L(β 0 , β1 ,..., β k ) =
(σ
1 2π
−1
)
n
e
Yi − β 0 − β 1 x1i −− β k x ki σ i =1 n
2 ∑
2
Dimana: L(β 0, β 1, ..., β k )
= Fungsi maksimum likelihood pada parameter
σ
= Parameter yang merupakan simpangan baku untuk distribusi.
π
= nilai konstan ( 3.14)
n
= Banyak data sampel
e
= Biangan konstan ( 2.7183)
Yi
= Variabel terkat ke i
βi
= Parameter regresi ke i
1.3 Tujuan Penelitian
Tujuan penelitian ini adalah untuk menguraikan cara mengestimasi parameter multiple regresi dengan meminimumkan eror menggunakan maksimum likelihood.
1.4 Kontribusi Penelitian
a. Menambah wawasan dan memperkaya literatur dalam bidang statistika yang berhubungan dengan multipleregresi dan maksimum likelihood.
Universitas Sumatera Utara
b. Dengan diketahuinya bagaimana cara mengestimasi parameter multiple regrsi menggunakan maksimum likelihood diharapkan dapat meminimumkan jarak antara titik data dan garis regresi. c. Untuk mengetahui besarnya pengaruh dari setiap variabel bebas ( yang tercakup dalam persamaan) terhadap variabel tak bebas.
1.5 Metode Penelitian
Uraian metode yang digunakan dalam penelitian secara rinci sebagai berikut: a. Membentuk persamaan dari jumlah deviasi kuadrat. b. Menganalisis persamaan dengan menggunakan maksimum likelihood. c. Mengambil kesimpulan dari analisa yang diperoleh.
Universitas Sumatera Utara